Defesa de dissertação (17/05/2022): Danielle Fontes de Albuquerque

Discente: Danielle Fontes de Albuquerque

Título: Seleção de atributos em Dados do Ensino Superior Brasileiro

Orientador(es): Rafaelli Coutinho (orientadora) e Diego Brandão (CEFET/RJ) (coorientador)

Banca: Rafaelli Coutinho (presidente),  Diego Brandão (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ), Alessandro Vivas Andrade (UFVJM), Cristiano Maciel (UFMT)

Dia/Hora: 17/05/2022 às 14:30

Sala remota: https://us06web.zoom.us/j/83229649478?pwd=cm90SXRXM1pDN2duWFlLdXlnRjBkUT09 

Resumo: Cada vez mais o setor da educação tem utilizado de seus extensos repositórios de dados para auxiliar na tomada de decisão dentro das Instituções de Ensino Superior (IES). Um dos principais problemas enfrentados por essas instituições é a evasão. Ela consiste em um fenômeno preocupante pois gera prejuízos sociais e econômicos tanto para o estudante quanto para a sociedade. Uma maneira de reduzir os impactos da evasão consiste em identificar quais são as possíveis causas do problema por meio das bases de dados disponíveis nas IES, podendo ser utilizado para isso técnicas da área de Mineração de Dados Educacionais (MDE). A MDE é uma área interdisciplinar que usa técnicas computacionais e estatísticas para compreender o cenário educacional a partir das bases de dados das instituições de ensino. Dentro desta área, a Seleção de Atributos (SA) é um conjunto de técnicas capaz de identificar quais são os atributos mais relevantes em uma base de dados extensa e simplificá-la de forma que seja possível expressar a informação com um volume menor de dados. Com isso, é possível realizar análises de bases de dados menores e mais limpas, o que facilita o entendimento do problema e melhora o desempenho computacional tanto em relação ao tempo de processamento quanto à qualidade do modelo gerado. Ademais, identificar os fatores mais importantes é uma forma de compreender quais são as possíveis causas e consequências do problema. Esse trabalho realiza uma análise comparativa das técnicas de SA em dados educacionais do Censo de Ensino Superior (CES), fornecido pelo governo brasileiro, que reúne informações sobre todos os estudantes de ensino superior do país. O objetivo é identificar quais são as principais fatores envolvidos na evasão no ensino superior e encontrar combinações de técnicas de SA e classificadores que potencializem a qualidade da classificação. Uma nova abordagem para SA também foi proposta com Algoritmo Genético (AG) para permitir maior flexibilidade e especificidade no cenário educacional, chamada FlexAG. Os resultados mostram que os atributos ano de ingresso, atividade extracurricular e financiamento estudantil são os mais importantes para o cenário geral da base do CES. Além disso, as técnicas de SA se mostraram capazes de melhorar as medidas de desempenho de classificação, a redução na quantidade de atributos e o tempo de classificação.

Dissertação