Defesa de dissertação (13/05/2026): Ana Gabriela Viana de Araújo
Discente: Ana Gabriela Viana de Araújo
Título: Aplicação de métodos baseados em concept drift para previsão de gols no futebol profissional
Orientador: Jorge de Abreu Soares
Banca: Jorge de Abreu Soares (Cefet/RJ), Glauco Fiorott Amorim (Cefet/RJ), Pedro Henrique González Silva (UFRJ), Carlos Eduardo Ribeiro de Mello (Unirio)
Dia/Hora: 13/05/2026 às 9h
Sala: https://teams.microsoft.com/
Resumo: Este trabalho investiga a aplicação de técnicas de detecção de concept drift para a identificação antecipada de gols em partidas de futebol, com base em dados de eventos intra-partida. A abordagem trata o problema como monitoramento de mudanças na
distribuição de passes intra-partida, utilizando drift virtual operacionalmente, isto é, detecção baseada exclusivamente em P(X) sem rótulos em tempo real, com a premissa de que essas mudanças precedem alterações na probabilidade de gol. A robustez dos resultados é verificada por divisão temporal com 190 partidas de treino e 190 de teste. Foram utilizados dados da temporada 2015/2016 da La Liga: 380 partidas, agregadas em intervalos de um minuto, com análise tanto do comportamento ofensivo quanto defensivo. Três detectores de drift foram avaliados (Page-Hinkley, KSWIN e ADWIN) em comparação com baselines determinístico e estocástico, utilizando como sinal de entrada médias móveis da frequência de passes. A avaliação adota uma variante assimétrica do SoftED evaluation, que penaliza alarmes tardios por meio de uma função de pontuação linear decrescente na janela [t-K,t], com K=10 minutos. Os resultados indicam que o Page-Hinkley obteve o maior MCC entre os detectores avaliados, superando ambos os baselines; Page-Hinkley e KSWIN apresentaram F1 equivalentes, com vantagem marginal do KSWIN. A comparação com abordagem supervisionada da literatura evidencia que o método proposto, embora mais simples e sem necessidade de dados rotulados, atinge desempenho competitivo a partir da primeira partida. Discutem-se limitações da abordagem, incluindo o uso de passes como único sinal proxy e a restrição a uma única temporada, além de perspectivas para trabalhos futuros com variáveis multivariadas e análise longitudinal.