Defesa de Proposta de Dissertação (23/12/2025): Gustavo Melo
Discente: Gustavo Melo
Título: Reconhecimento de Entidades Nomeadas em Relatos Criminais Informais com Apoio de Metadados Estruturados
Orientadores: Eduardo Bezerra da Silva (Cefet/RJ) e Karla Figueiredo (UERJ)
Banca: Eduardo Bezerra da Silva (Cefet/RJ), Karla Figueiredo (UERJ), Gustavo Paiva Guedes (Cefet/RJ) e Kele Teixeira Belloze (Cefet/RJ)
Dia/Hora: 23/12/2025 às 08:30h
Resumo: O presente trabalho investiga o problema do reconhecimento de entidades nomeadas em relatos criminais informais registrados no serviço Disque Denúncia. Esses relatos, frequentemente marcados por linguagem coloquial, erros ortográficos e estrutura textual livre, impõem desafios significativos ao uso de modelos tradicionais de Processamento de Linguagem Natural. Além do texto livre, os relatos são acompanhados de metadados estruturados, como tipo de ocorrência, localização e data que podem fornecer contexto adicional relevante para a tarefa. Neste estudo, propõe-se uma abordagem baseada em fine-tuning de modelos de linguagem de grande porte, utilizando um corpus manualmente anotado com entidades do tipo Pessoa, Local e Organização. Para contornar a escassez de dados rotulados, a metodologia inclui a aplicação de pseudo-rotulagem em um segundo corpus, significativamente maior, expandindo assim a base de treinamento de forma semissupervisionada. Adicionalmente, os metadados dos relatos são incorporados como fonte de contexto tanto no pré-processamento quanto no processo de avaliação e refinamento dos modelos. Os experimentos foram conduzidos com o modelo GliNER e avalia que a utilização de metadados e pseudo-rotulação pode contribuir para melhorar a performance dos modelos em corpora informais, com impactos positivos para a extração automatizada de informações em contextos de segurança pública. Os resultados reforçam o potencial de abordagens híbridas e sensíveis ao domínio para aplicações reais de Processamento de Linguagem Natural em ambientes com escassez de rótulos anotados.