Defesa de Proposta de Dissertação (10/12/2025): Felipe de Ávila Tavares
Discente: Felipe de Ávila Tavares
Título: Avaliação Comparativa de Métodos de Imputação em Variáveis Categóricas
Orientador: Jorge de Abreu Soares
Banca: Jorge de Abreu Soares (Cefet/RJ), Eduardo Soares Ogasawara (Cefet/RJ) e Ronaldo Ribeiro Goldschmidt (IME)
Dia/Hora: 10/12/2025 às 10h
Sala: Defesa de exame de qualificação – Felipe Tavares | Ingresso na Reunião | Microsoft Teams
Resumo: Este trabalho investiga o desempenho de diferentes métodos de imputação aplicados a variáveis categóricas, considerando cenários com distintas estruturas de dados. O estudo contempla três classes de conjuntos: bases contendo apenas uma variável categórica, bases mistas com variáveis numéricas e categóricas e bases totalmente categóricas. A metodologia proposta envolve a geração artificial de valores ausentes segundo o mecanismo Missing Completely at Random (MCAR), em diferentes taxas (10%, 20% e 30%) e com múltiplas sementes aleatórias, de modo a avaliar a estabilidade e a sensibilidade dos métodos. Três abordagens de imputação são analisadas: KNN (incluindo variações com normalização, ponderação por Eta² e distância de Gower), Random Forest e XGBoost, aplicados em regime supervisionado. Os resultados preliminares, obtidos com a taxa de 20% de ausência na base Glass Identification, indicam diferenças marcantes entre as famílias de métodos, evidenciando que modelos baseados em árvores apresentam desempenho superior e maior estabilidade em relação às variantes do KNN. A continuidade da pesquisa incluirá a aplicação do protocolo completo às demais categorias de bases e às demais taxas de ausência, permitindo uma análise abrangente dos efeitos estruturais dos dados no desempenho das técnicas de imputação.