Mineração de Dados e Pré-Processamento de Dados
A extração de conhecimento a partir dos dados é uma atividade extremamente importante e demandada por diversas organizações existentes no eixo empresarial, governamental e científico. As tarefas de predição, agrupamento, identificação de padrões, anomalias e imputação estão no conjunto de atividades de pesquisa deste projeto.
Grande parte dos avanços nas tarefas de mineração de dados são obtidos por meio de pesquisa nas técnicas de pré-processamento de dados. O pré-processamento de dados é um passo importante no processo de extração de conhecimento a partir de dados. Ele inclui a limpeza, remoção de outliers, seleção de atributos, definição de amostras e transformações de dados. A preparação de dados pode levar uma quantidade considerável de tempo de processamento computacional e do experimento como um todo. Essa etapa pode significar a diferença entre obter ou não conhecimento e produzir valor agregado.
Na mineração de dados, diversos métodos são concebidos assumindo-se a estacionariedade, i.e., a média e variância permanecem constantes, independentemente da amostra selecionada. Entretanto, uma considerável parcela das coleções de dados apresenta propriedades não-estacionárias, na prática. Por conta disso, inúmeras vezes os métodos de mineração de dados ficam comprometidos neste contexto. Nota-se que apesar da importância, há muito espaço para o estudo de técnicas de mineração de dados e de pré-processamento resilientes a não-estacionariedade.
Docentes Envolvidos:
- Eduardo Bezerra
- Eduardo Ogasawara (Responsável)
- Jorge Soares
Parcerias internacionais:
- Esther Pacitti (INRIA)
- Florent Masseglia (INRIA)
- Reza Akbarinia (INRIA)
Fomento:
- Edital FAPERJ APQ1, projeto “Técnicas de Transformação de Dados para Previsões de Séries Temporais por Meio de Redes Neurais”, no período 2013-2014, com coordenação do docente Eduardo Ogasawara Valor financiado: R$13.000,00;
- Edital de Grupo de Pesquisa do CEFET/RJ, projeto “Grupo de Pesquisa em Mineração de Dados”, no período 2016-atual, com coordenação do docente Eduardo Ogasawara e Joel Santos. Valores financiados: R$6.992,00 e R$142.337,40;
- Edital FAPERJ APQ1, projeto “Identificação de Motifs em Séries Espaço-Temporais: Aplicações & Métodos”, no período 2016-atual, com coordenação do docente Eduardo Ogasawara. Valor financiado: R$10.000,00;
- Edital de Bolsa de Produtividade de Pesquisa CNPq, projeto “Ciência de Dados em Series Espaço-Temporais: Gerência de Dados Applications”, no período 2016-2018, do docente Eduardo Ogasawara. Valor financiado: R$39.600,00
- Edital Jovem Cientista do Nosso Estado (JNCE) FAPERJ, projeto “Gerencia e Análise de Series Espaço-Temporais: Métodos e Aplicações”, no período de 2017-atual, do docente Eduardo Ogasawara. Valor financiado: R$ 75.600,00.
- Edital de Bolsa de Produtividade de Pesquisa CNPq, projeto “Métodos resilientes a não-estacionariedade no contexto de Ciência de Dados”, no período 2019-2021, do docente Eduardo Ogasawara. Valor financiado: R$39.600,00;
- Apoio Emergencial a Programas de Pós-graduação do Rio de Janeiro, no período 2019-atual, com coordenação do docente Eduardo Ogasawara. Valor financiado: R$39.879,98.
- Bolsas PIBIC.
Esses projetos estão em desenvolvimento pelos membros do grupo e totalizam um valor de financiamento de aproximadamente R$ 367.009,38.