Ementa

Mineração de Dados. Processo de Descoberta de Conhecimento em Bases de Dados (KDD). Análise exploratória de dados. Pré-processamento e qualidade de dados. Mineração de padrões frequentes e sequenciais. Técnicas de agrupamento. Modelagem preditiva por classificação e regressão. Arquiteturas analíticas para suporte à mineração de dados, incluindo data warehouses, data lakes e OLAP. Aspectos éticos, de privacidade e responsabilidade no uso de técnicas de mineração de dados..

Objetivos

Fundamentar os conhecimentos indispensáveis à extração sistemática de conhecimento a partir de grandes volumes de dados, com foco no processo de Descoberta de Conhecimento em Bases de Dados. Para isso, é realizado um estudo detalhado das etapas do KDD, desde a compreensão do domínio e o pré-processamento dos dados até a aplicação, avaliação e interpretação de modelos de mineração. O curso visa proporcionar um sólido embasamento teórico aliado à prática com ferramentas computacionais modernas, capacitando o aluno a selecionar, aplicar e analisar técnicas de mineração de dados em diferentes contextos, bem como a compreender limitações, impactos e implicações éticas associadas ao uso dessas técnicas em cenários reais e multidisciplinares.

 


 

Slides

MD – 1 – Introdução à Mineração de Dados

MD – 2 – Básico de R
Código: https://github.com/eogasawara/datamining/blob/main/examples/2-R-Basics.md

MD – 3 – Visualização em R
Código: https://github.com/eogasawara/datamining/blob/main/examples/3-DataVisualization.md

MD – 4 – Análise Exploratória
Código: https://github.com/eogasawara/datamining/blob/main/examples/4-ExploratoryAnalysis.md

MD – 5 – Preprocessamento de dados
Código: https://github.com/eogasawara/datamining/blob/main/examples/5-DataPreprocessing.md

MD – 6 – Padrões frequentes
Código: https://github.com/eogasawara/datamining/blob/main/examples/6-PatternMining.md

MD – 7 – Classificação e MD – 7 – Classificação – Avançada
Código: https://github.com/eogasawara/datamining/blob/main/examples/7-Prediction.md

MD – 8 – Regressão

MD – 9 – Agrupamento
Código: https://github.com/eogasawara/datamining/blob/main/examples/8-Clustering.md

MD – 10 – Outliers

MD – 11 – Gerência de Dados

 


 

Playlist

 

 


 

Ferramentas

DAL Toolbox: https://cefet-rj-dal.github.io/daltoolbox/

Harbinger: https://cefet-rj-dal.github.io/harbinger/

TSPredIT: https://cefet-rj-dal.github.io/tspredit/

 


 

Bibliografia Básica

  1. HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques. 4. ed. Cambridge, MA: Morgan Kaufmann, 2022.
  2. JAMES, Gareth; WITTEN, Daniela; HASTIE, Trevor; TIBSHIRANI, Robert. An introduction to statistical learning: with applications in R. 2. ed. New York: Springer, 2021.
  3. Escovedo, T.; Koshiyama, A. Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise. Casa do Código, 2020.

Bibliografia Complementar

  1. BISHOP, C. M.; Bishop, H. Deep Learning: Foundations and Concepts. Springer Nature, 2023.
  2. BRAMER, M. Principles of Data Mining. Springer London, 2020.
  3. GARCIA, S.; LUENGO, J.; HERRERA, F. Data Preprocessing in Data Mining. Springer, 2014.
  4. OGASAWARA, E.; SALLES, R.; PORTO, F.; PACITTI, E. Event Detection in Time Series. 1. ed. Cham: Springer Nature Switzerland, 2025.
  5. GOLDSCHMIDT, R.; PASSOS, E.; BEZERRA, E. Data Mining. Elsevier Brasil, 2015.