Defesa de dissertação (06/05/2026): Jorge Nelson de Souza Pavão

Discente: Jorge Nelson de Souza Pavão

Título: Modelos de linguagem de grande porte para a identificação de conluio em licitações

Orientadores: Kele Teixeira Belloze (orientadora) e Diego Nunes Brandão (coorientador)

Banca: Kele Teixeira Belloze (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Raissa dos Santos Barcellos (UERJ), Eduardo Bezerra da Silva (CEFET/RJ)

Data/Hora: 06 de maio de 2026, às 16h30

Local: Sala E-520 (Bloco E, 5º andar, Cefet/Maracanã)

Resumo: A prática de conluio em licitações públicas, caracterizada por acordos ilícitos entre empresas concorrentes, gera prejuízos econômicos relevantes, reduz a eficiência das contratações e compromete a confiança nas instituições. Diversos trabalhos têm empregado algoritmos de aprendizado de máquina e variáveis estatísticas para identificar indícios desse tipo de fraude, porém ainda persistem desafios como escassez de dados rotulados, dificuldade de generalização e desempenho inconsistente entre diferentes bases de dados. Neste contexto, esta dissertação investiga o potencial de Modelos de Linguagem de Grande Porte (Large Language Models – LLMs) na detecção de indícios de conluio a partir de dados numéricos de processos licitatórios. Foram avaliados modelos de diferentes fornecedores por meio de duas estratégias: engenharia de prompt e fine-tuning supervisionado. Os experimentos foram conduzidos com três conjuntos de dados reais — Brasil, Estados Unidos e Suíça — e os resultados foram comparados com os de algoritmos tradicionais reportados na literatura. Os resultados mostram que a engenharia de prompt não produziu desempenho satisfatório. Com fine-tuning, por sua vez, os LLMs superaram os algoritmos tradicionais em apenas um dos três cenários avaliados. Considerando conjuntamente desempenho, custo e complexidade de implementação, conclui-se que, no momento atual, os algoritmos tradicionais apresentam melhor relação custo-benefício na tarefa avaliada, sendo que os LLMs podem atuar como alternativa complementar em cenários específicos nos quais os métodos clássicos não alcancem resultados satisfatórios ou situações que envolvam dados textuais.