Este curso oferece um estudo abrangente das técnicas de mineração de dados, com foco no processo de descoberta de conhecimento a partir de dados (KDD). Ele abrange etapas fundamentais, incluindo análise exploratória de dados, pré-processamento de dados (limpeza, transformação, seleção de atributos e redução de dimensionalidade), detecção de anomalias, mineração de padrões (conjuntos frequentes, regras de associação e padrões sequenciais), modelagem preditiva (classificação, regressão e aprendizado de conjunto), técnicas de agrupamento e mineração de séries temporais para análise de dados sequenciais. O curso também explora data warehousing e OLAP, além de tópicos emergentes, como aprendizado profundo aplicado à mineração de dados e considerações éticas relacionadas a viés, justiça e privacidade. A ênfase está tanto nos fundamentos teóricos quanto na prática aplicada com conjuntos de dados reais em diversos domínios.

Os vídeos de Mineração de Dados se encontram em https://www.youtube.com/@eduardo.ogasawara

Os slides se encontram em:

MD – 1 – Introdução à Mineração de Dados

MD – 2 – Básico de R
Código: https://github.com/eogasawara/datamining/blob/main/examples/2-R-Basics.md

MD – 3 – Visualização em R
Código: https://github.com/eogasawara/datamining/blob/main/examples/3-DataVisualization.md

MD – 4 – Análise Exploratória
Código: https://github.com/eogasawara/datamining/blob/main/examples/4-ExploratoryAnalysis.md

MD – 5 – Preprocessamento de dados
Código: https://github.com/eogasawara/datamining/blob/main/examples/5-DataPreprocessing.md

MD – 6 – Padrões frequentes
Código: https://github.com/eogasawara/datamining/blob/main/examples/6-PatternMining.md

MD – 7 – Classificação
Código: https://github.com/eogasawara/datamining/blob/main/examples/7-Prediction.md

MD – 9 – Agrupamento
Código: https://github.com/eogasawara/datamining/blob/main/examples/8-Clustering.md

 


 

Ferramentas

DAL Toolbox: https://cefet-rj-dal.github.io/daltoolbox/

Harbinger: https://cefet-rj-dal.github.io/harbinger/

TSPredIT: https://cefet-rj-dal.github.io/tspredit/

 


 

Referências

[1] G. M. James, D. Witten, T. Hastie, and R. Tibshirani, An Introduction to Statistical Learning: With Applications in R. Springer Nature, 2021.

[2] J. Han, J. Pei, and H. Tong, Data Mining: Concepts and Techniques, 4th edition. Cambridge, MA: Morgan Kaufmann, 2022.

[3] I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2016.

[4] C. C. Aggarwal, Data Mining: The Textbook. Springer, 2015.

[5] S. Garcia, J. Luengo, and F. Herrera, Data Preprocessing in Data Mining. Springer, 2014.

[6] C. M. Bishop and H. Bishop, Deep Learning: Foundations and Concepts. Springer Nature, 2023.

[7] E. Ogasawara, R. Salles, F. Porto, and E. Pacitti, Event Detection in Time Series, 2025th ed. in Synthesis Lectures on Data Management. Cham: Springer Nature Switzerland, 2025. doi: 10.1007/978-3-031-75941-3.

[8] C. C. Aggarwal, Outlier Analysis. Springer International Publishing, 2016.

[9] M. Bramer, Principles of Data Mining. Springer London, 2020.