Defesa de dissertação (05/05/2020): Gustavo Alexandre Sousa Santos
Discente: Gustavo Alexandre Sousa Santos
Título: EvolveDTree: Um Sistema de Mineração de Dados Educacionais Baseado em Árvore de Decisão e Algoritmo Genético para Classificar Evasão no Ensino Superior
Orientadores: Diego Nunes Brandão (orientador), Luis Domingues Tomé Jardim Tarrataca (CEFET/RJ) (co-orientador)
Banca: Diego Nunes Brandão (presidente), Luis Domingues Tomé Jardim Tarrataca (CEFET/RJ), Diego Barreto Haddad (CEFET/RJ), Eduardo Bezerra (CEFET/RJ), Alexandre Plastino de Carvalho (UFF)
Dia/Hora: 5 de maio de 2020 / 14h
Sala remota: https://meet.google.com/rpi-zimz-oeo
Resumo:
A educação é um dos alicerces para o desenvolvimento econômico e social de um país. Garantir que os investimentos em educação sejam feitos de forma eficiente é um grande desafio para toda a sociedade. Neste aspecto, um dos grandes problemas da educação pública de nível superior ocorre quando os estudantes se desassociam da instituição sem completar o curso no qual estavam matriculados, caracterizando o fenômeno de evasão. Assim, os recursos investidos na formação desses estudantes acabam sendo perdidos, representando um desperdício financeiro significativo. Neste contexto, o desenvolvimento de ferramentas que auxiliem no processo de minimização dos casos de evasão torna-se imprescindível. O presente trabalho propõe o desenvolvimento de um sistema que permite avaliar diferentes técnicas de mineração de dados para classificar a tendência de um aluno abandonar ou graduar no curso em que está matriculado. Por meio desse sistema, busca-se a identificação de características que indiquem a evasão antes que ela ocorra, permitindo que alguma ação possa ser tomada de maneira a minimizá-la.
Para este objetivo, foi desenvolvido um Data Warehouse Educacional (EDW) que permite a integração dos dados educacionais de uma instituição de ensino superior. Os resultados obtidos demonstram que o EDW desenvolvido é robusto o suficiente para permitir que diversas análises sejam realizadas pela gestão acadêmica. Os modelos de classificação avaliados foram comparados por meio de diferentes métricas, destacando-se a estratégia baseada em árvores de decisão. Uma técnica de redução de dimensionalidade baseada em algoritmo genético também foi avaliada, permitindo uma diminuição do tempo de processamento da fase de treinamento em todos os modelos de classificação avaliados. Contudo, foi identificado um aumento no tempo total da abordagem proposta, quando avaliadas as fases de pré-processamento e treinamento, simultaneamente.