{"id":2593,"date":"2019-06-03T18:36:14","date_gmt":"2019-06-03T21:36:14","guid":{"rendered":"https:\/\/eic.cefet-rj.br\/ppcic\/?p=2593"},"modified":"2025-09-03T18:54:47","modified_gmt":"2025-09-03T21:54:47","slug":"defesa-de-dissertacao-12-07-2019-gabriel-nascimento-dos-santos","status":"publish","type":"post","link":"https:\/\/eic.cefet-rj.br\/ppcic\/defesa-de-dissertacao-12-07-2019-gabriel-nascimento-dos-santos\/","title":{"rendered":"Defesa de disserta\u00e7\u00e3o (12\/07\/2019):  Gabriel Nascimento dos Santos"},"content":{"rendered":"<p><strong>Discente:<\/strong> Gabriel Nascimento dos Santos<\/p>\n<p><strong>T\u00edtulo<\/strong>: Tratamento de palavras fora do vocabul\u00e1rio em tarefas de an\u00e1lise de sentimentos com l\u00e9xicos<\/p>\n<p><strong>Orientador<\/strong>: Gustavo Paiva Guedes e Silva (orientador)<\/p>\n<p><strong>Banca<\/strong>: Gustavo Paiva Guedes e Silva (presidente), Eduardo Bezerra da Silva (CEFET\/RJ)\u00a0 Fellipe Ribeiro Duarte (UFRRJ\/RJ), Ronaldo Ribeiro Goldschmidt (IME-RJ)<\/p>\n<p><strong>Dia\/Hora<\/strong>: 12 de julho de \/2019\u00a0\/ 13h<\/p>\n<p><strong>Sala<\/strong>: Audit\u00f3rio 5<\/p>\n<p><strong>Resumo<\/strong>:<\/p>\n<p>O n\u00famero de usu\u00e1rios da internet que utilizam n\u00famero de redes sociais, microblogs e sites de avalia\u00e7\u00e3o vem aumentando significantemente nos \u00faltimos anos. Com isso, usu\u00e1rios tendem a expor suas opini\u00f5es e transmitir o que sentem sobre determinado servi\u00e7o, produto, e os mais diversos assuntos. Isto tem despertado o interesse de pesquisadores de processamento de linguagem natural, especialmente os de An\u00e1lise de Sentimentos, que se interessam em explorar t\u00e9cnicas de extrair e entender as opini\u00f5es fornecidas pelos usu\u00e1rios que utilizam servi\u00e7os orientados a opini\u00f5es. A An\u00e1lise de Sentimentos possui tr\u00eas abordagens: a abordagem baseada em aprendizado de m\u00e1quina, a abordagem baseada em l\u00e9xicos e a abordagem h\u00edbrida. A abordagem baseada em l\u00e9xicos e a abordagem h\u00edbrida sofrem com o problema de palavras fora do vocabul\u00e1rio ao lidar com a natureza dos textos de redes sociais. Lidar com textos provenientes de redes sociais \u00e9 um grande desafio, pois eles variam de textos bem escritos a senten\u00e7as completamente sem sentido. Isso ocorre por diversos motivos, como a limita\u00e7\u00e3o do n\u00famero de caracteres (como no Twitter) e at\u00e9 mesmo por erros ortogr\u00e1ficos intencionais. Este trabalho prop\u00f5e um algoritmo que utiliza word embeddings para tratar palavras fora do vocabul\u00e1rio em tarefas de An\u00e1lise de Sentimentos com abordagens baseadas em l\u00e9xico ou abordagens h\u00edbridas. A estrat\u00e9gia do algoritmo proposto \u00e9 baseada na hip\u00f3tese que palavras que tenham contextos parecidos, possuem significados semelhantes. O algoritmo consiste em eleger as palavras mais similares semanticamente e utilizar as categorias da mais pr\u00f3xima que esteja contida no l\u00e9xico utilizado. Os experimentos foram conduzidos em tr\u00eas conjuntos de dados em Portugu\u00eas do Brasil. Foram utilizados tr\u00eas classificadores e foram observadas melhorias de at\u00e9 3,3% no F1 score ap\u00f3s o uso do algoritmo proposto.<\/p>\n<div><a href=\"https:\/\/sucupira.capes.gov.br\/sucupira\/public\/consultas\/coleta\/trabalhoConclusao\/viewTrabalhoConclusao.jsf?popup=true&amp;id_trabalho=7692356#\"><img decoding=\"async\" class=\"alignnone wp-image-3271\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/logo-sucupira.png\" alt=\"\" width=\"81\" height=\"29\" \/><\/a><\/div>\n<div><strong>Disserta\u00e7\u00e3o <\/strong><a href=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2019\/06\/10-Gabriel-Nascimento-dos-Santos.pdf\"><img decoding=\"async\" class=\"alignnone wp-image-3273\" style=\"-webkit-text-stroke: 0.15px;\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png\" alt=\"\" width=\"15\" height=\"14\" srcset=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png 222w, https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2-150x150.png 150w\" sizes=\"(max-width: 15px) 100vw, 15px\" \/><\/a><\/div>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Discente: Gabriel Nascimento dos Santos T\u00edtulo: Tratamento de palavras fora do vocabul\u00e1rio em tarefas de an\u00e1lise de sentimentos com l\u00e9xicos Orientador: Gustavo Paiva Guedes e Silva (orientador) Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Bezerra da Silva (CEFET\/RJ)\u00a0 Fellipe Ribeiro Duarte (UFRRJ\/RJ), Ronaldo Ribeiro Goldschmidt (IME-RJ) Dia\/Hora: 12 de julho de \/2019\u00a0\/ 13h Sala: [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[14,33],"tags":[],"class_list":["post-2593","post","type-post","status-publish","format-standard","hentry","category-defesas","category-noticias-pt"],"_links":{"self":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/2593","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/comments?post=2593"}],"version-history":[{"count":7,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/2593\/revisions"}],"predecessor-version":[{"id":3033,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/2593\/revisions\/3033"}],"wp:attachment":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/media?parent=2593"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/categories?post=2593"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/tags?post=2593"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}