{"id":4824,"date":"2022-11-17T18:34:48","date_gmt":"2022-11-17T21:34:48","guid":{"rendered":"https:\/\/eic.cefet-rj.br\/ppcic\/?p=4824"},"modified":"2025-09-03T18:45:56","modified_gmt":"2025-09-03T21:45:56","slug":"defesa-de-dissertacao-22-11-2022-felipe-oliveira-feder","status":"publish","type":"post","link":"https:\/\/eic.cefet-rj.br\/ppcic\/defesa-de-dissertacao-22-11-2022-felipe-oliveira-feder\/","title":{"rendered":"Defesa de disserta\u00e7\u00e3o (22\/11\/2022): Felipe Oliveira Feder"},"content":{"rendered":"<p><strong>Discente:<\/strong> Felipe Oliveira Feder<\/p>\n<p><strong>T\u00edtulo:\u00a0<\/strong>Estudo comparativo entre abordagens de representa\u00e7\u00e3o textual e algoritmos de classifica\u00e7\u00e3o<\/p>\n<p><strong>Orientador:<\/strong>\u00a0Gustavo Paiva Guedes e Silva<\/p>\n<p><strong>Banca:<\/strong>\u00a0Gustavo Paiva Guedes e Silva (CEFET\/RJ), Eduardo Bezerra (CEFET\/RJ), Geraldo Xex\u00e9o (Coppe\/UFRJ)<\/p>\n<p><strong>Dia\/hora:<\/strong> 22\/11\/2022\u00a0 \u00e0s 9 horas.<\/p>\n<p><b>Link da sala:\u00a0<\/b><a id=\"m_-6315243902930688938LPlnkOWALinkPreview\" href=\"https:\/\/teams.microsoft.com\/l\/meetup-join\/19%3af69a8d54c8be438ea6c2b412c3abf30c%40thread.tacv2\/1667924812259?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d455e339-d958-4321-a959-bda8d1ea2337%22%7d\" target=\"_blank\" rel=\"noopener\" data-saferedirecturl=\"https:\/\/www.google.com\/url?q=https:\/\/teams.microsoft.com\/l\/meetup-join\/19%253af69a8d54c8be438ea6c2b412c3abf30c%2540thread.tacv2\/1667924812259?context%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%2522d455e339-d958-4321-a959-bda8d1ea2337%2522%257d&amp;source=gmail&amp;ust=1668806162926000&amp;usg=AOvVaw30_19ec_xPv1CvoL4J160o\">https:\/\/teams.microsoft.<wbr \/>com\/l\/meetup-join\/19%<wbr \/>3af69a8d54c8be438ea6c2b412c3ab<wbr \/>f30c%40thread.tacv2\/<wbr \/>1667924812259?context=%7b%<wbr \/>22Tid%22%3a%228eeca404-a47d-<wbr \/>4555-a2d4-0f3619041c9c%22%2c%<wbr \/>22Oid%22%3a%22d455e339-d958-<wbr \/>4321-a959-bda8d1ea2337%22%7d<\/a><\/p>\n<p><strong>Resumo:\u00a0<\/strong>Estamos vivendo uma revolu\u00e7\u00e3o tecnol\u00f3gica sem precedentes nos \u00faltimos anos. A forma como n\u00f3s nos relacionamos tem sido &#8211; e continuar\u00e1 sendo &#8211; impactada de diferentes maneiras. Acompanhando as evolu\u00e7\u00f5es em hardware e das tecnologias que nos possibilitam produzir e armazenar dados em volumes impens\u00e1veis, s\u00e3o observadas, tamb\u00e9m, evolu\u00e7\u00f5es algor\u00edtmicas e metodol\u00f3gicas que nos permitem avan\u00e7ar em busca de um mundo inteiramente novo, mesmo lidando com velhas quest\u00f5es tipicamente humanas. A fronteira do entendimento homem-m\u00e1quina tem sido empurrada adiante constantemente. O processamento de linguagem natural \u00e9 a ponte que liga a fala humana a possibilidades, antes inimagin\u00e1veis, de uma m\u00e1quina interpret\u00e1-la e process\u00e1-la devidamente. Os meios de representa\u00e7\u00e3o textual v\u00eam evoluindo consistentemente nas \u00faltimas d\u00e9cadas. O <em>Bag-of-Words<\/em> (BOW), atrelado ao uso de representa\u00e7\u00f5es num\u00e9ricas para palavras, vem sendo utilizado com sucesso na representa\u00e7\u00e3o textual. No entanto, superando as defici\u00eancias do BOW, observamos o surgimento de representa\u00e7\u00f5es num\u00e9ricas complexas, geradas por redes neurais profundas, que s\u00e3o capazes de conservar as rela\u00e7\u00f5es sem\u00e2nticas e sint\u00e1ticas entre as palavras; os <em>Word Embeddings<\/em> (WE). A fronteira foi empurrada \u00e0 frente; novas evolu\u00e7\u00f5es, novas aplica\u00e7\u00f5es, novos usos. O uso de Modelos de Linguagem Neural (MLN), com os WE, atingiu o estado da arte em diferentes tarefas no processamento de texto. Essa pesquisa compara esses dois m\u00e9todos de representa\u00e7\u00e3o de palavras, BOW e WE, e seus usos numa tarefa de classifica\u00e7\u00e3o bin\u00e1ria de polaridade. Foram montados dois grupos de classificadores e foram utilizados quatro conjuntos de dados. O primeiro grupo, formado por modelos n-gram, aqui chamados de Modelos de Aprendizagem de M\u00e1quina Tradicionais (MAMT), lidou com representa\u00e7\u00f5es textuais que se serviram do BOW com TF-IDF e do BOW com LSA. O segundo grupo, formado por MLNs, que s\u00e3o modelos provenientes de redes neurais profundas que lidam com tarefas relacionadas ao processamento de texto, usou os WE e os WE Contextuais para representar os textos que seriam processados. Nos experimentos realizados foi observada a superioridade dos modelos de classifica\u00e7\u00e3o sem\u00e2ntica de texto diante dos modelos n-gram. Apesar disso, a escolha sobre qual t\u00e9cnica de representa\u00e7\u00e3o textual (BOW ou WE) e tipo de modelo de linguagem usar (n-gram ou MLN) depende do contexto, j\u00e1 que os modelos n-gram, mesmo quando comparados as abordagens mais recentes, apresentam desempenho preditivo satisfat\u00f3rio e podem ser \u00fateis em muitos contextos de uso.<\/p>\n<div><a href=\"https:\/\/sucupira-legado.capes.gov.br\/sucupira\/public\/consultas\/coleta\/trabalhoConclusao\/viewTrabalhoConclusao.jsf?popup=true&amp;id_trabalho=12220376\"><img decoding=\"async\" class=\"alignnone wp-image-3271\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/logo-sucupira.png\" alt=\"\" width=\"81\" height=\"29\" \/><\/a><\/div>\n<div><strong>Disserta\u00e7\u00e3o\u00a0<\/strong><img decoding=\"async\" class=\"alignnone wp-image-3273\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png\" sizes=\"(max-width: 15px) 100vw, 15px\" srcset=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png 222w, https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2-150x150.png 150w\" alt=\"\" width=\"15\" height=\"14\" \/><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Discente: Felipe Oliveira Feder T\u00edtulo:\u00a0Estudo comparativo entre abordagens de representa\u00e7\u00e3o textual e algoritmos de classifica\u00e7\u00e3o Orientador:\u00a0Gustavo Paiva Guedes e Silva Banca:\u00a0Gustavo Paiva Guedes e Silva (CEFET\/RJ), Eduardo Bezerra (CEFET\/RJ), Geraldo Xex\u00e9o (Coppe\/UFRJ) Dia\/hora: 22\/11\/2022\u00a0 \u00e0s 9 horas. Link da sala:\u00a0https:\/\/teams.microsoft.com\/l\/meetup-join\/19%3af69a8d54c8be438ea6c2b412c3abf30c%40thread.tacv2\/1667924812259?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d455e339-d958-4321-a959-bda8d1ea2337%22%7d Resumo:\u00a0Estamos vivendo uma revolu\u00e7\u00e3o tecnol\u00f3gica sem precedentes nos \u00faltimos anos. A forma como n\u00f3s nos [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[14,33],"tags":[],"class_list":["post-4824","post","type-post","status-publish","format-standard","hentry","category-defesas","category-noticias-pt"],"_links":{"self":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/4824","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/comments?post=4824"}],"version-history":[{"count":8,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/4824\/revisions"}],"predecessor-version":[{"id":5786,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/4824\/revisions\/5786"}],"wp:attachment":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/media?parent=4824"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/categories?post=4824"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/tags?post=4824"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}