Defesa de dissertação (14/08/2020): Thiago da Silva Pereira

Discente: Thiago da Silva Pereira

Título: Imputação de dados: uma comparação entre comitês de regressão

Orientadores:  Jorge de Abreu Soares (orientador) e Eduardo Bezerra da Silva (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ) e Ronaldo Ribeiro Goldschmidt (IME)

Dia/hora: 14 de agosto de 2020, às 15h.

Sala remota: meet.google.com/mtr-vmkq-wrw

Resumo:

O problema da ausência de dados em conjuntos de dados é relevante e dentre as maneiras de se lidar com este problema, a substituição do valor ausente por outro (também chamada de imputação de dados) produz um ganho substancial no aprendizado de máquina subsequente. Diversos algoritmos de aprendizado de máquina são estudados para a imputação de dados, porém poucos estudos utilizam métodos ensemble para a geração do dado a ser imputado. Este trabalho pretende realizar uma comparação entre diversos métodos ensemble (baggingadaboostgradientboost e stacked generalization) para imputação de dados, executando as simulações em três conjuntos de dados diferentes (AIDS Deaths – National Health and Family Planning Commission of ChinaBreast Cancer e Photometric redshift estimation) com 10%, 20% e 30% de dados ausentes, combinando a execução das tarefas de agrupamento e redução de dimensionalidade com percentuais de redução de 10%, 20% e 30% antes da imputação.

Comments are closed.