O minicurso Mineração de Dados, integrante da Jornada de Ciência de Dados, apresenta técnicas voltadas à extração de conhecimento a partir de grandes volumes de dados. O conteúdo abrange uma visão geral da área, análise exploratória de dados, etapas de pré-processamento e métodos de regressão.

Trata-se de um curso de curta duração, oferecido regularmente uma vez por ano no LNCC desde 2015.

Slides:

  1. Introdução (vídeo)
  2. Analise Exploratória (códigos de exemplos) (vídeo)
  3. Pre-processamento (códigos de exemplos) (vídeo)
  4. Regressão (códigos de exemplos) (vídeo)

 

daltoolbox:

  1. Documentação: https://cefet-rj-dal.github.io/daltoolbox/
  2. Introdução ao daltoolbox (códigos de exemplo) (vídeo)
  3. Pré-processamento com o daltoolbox (códigos de exemplo) (vídeo)

 

Bibliografia Básica

  1. HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques. 4. ed. Cambridge, MA: Morgan Kaufmann, 2022.
  2. JAMES, Gareth; WITTEN, Daniela; HASTIE, Trevor; TIBSHIRANI, Robert. An introduction to statistical learning: with applications in R. 2. ed. New York: Springer, 2021.
  3. Escovedo, T.; Koshiyama, A. Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise. Casa do Código, 2020.

Bibliografia Complementar

  1. BISHOP, C. M.; Bishop, H. Deep Learning: Foundations and Concepts. Springer Nature, 2023.
  2. BRAMER, M. Principles of Data Mining. Springer London, 2020.
  3. GARCIA, S.; LUENGO, J.; HERRERA, F. Data Preprocessing in Data Mining. Springer, 2014.
  4. GOLDSCHMIDT, R.; PASSOS, E.; BEZERRA, E. Data Mining. Elsevier Brasil, 2015.