Ementa
Mineração de Dados. Processo de Descoberta de Conhecimento em Bases de Dados (KDD). Análise exploratória de dados. Pré-processamento e qualidade de dados. Mineração de padrões frequentes e sequenciais. Técnicas de agrupamento. Modelagem preditiva por classificação e regressão. Arquiteturas analíticas para suporte à mineração de dados, incluindo data warehouses, data lakes e OLAP. Aspectos éticos, de privacidade e responsabilidade no uso de técnicas de mineração de dados..
Objetivos
Fundamentar os conhecimentos indispensáveis à extração sistemática de conhecimento a partir de grandes volumes de dados, com foco no processo de Descoberta de Conhecimento em Bases de Dados. Para isso, é realizado um estudo detalhado das etapas do KDD, desde a compreensão do domínio e o pré-processamento dos dados até a aplicação, avaliação e interpretação de modelos de mineração. O curso visa proporcionar um sólido embasamento teórico aliado à prática com ferramentas computacionais modernas, capacitando o aluno a selecionar, aplicar e analisar técnicas de mineração de dados em diferentes contextos, bem como a compreender limitações, impactos e implicações éticas associadas ao uso dessas técnicas em cenários reais e multidisciplinares.
Slides
MD – 1 – Introdução à Mineração de Dados
MD – 2 – Básico de R
Código: https://github.com/eogasawara/datamining/blob/main/examples/2-R-Basics.md
MD – 3 – Visualização em R
Código: https://github.com/eogasawara/datamining/blob/main/examples/3-DataVisualization.md
MD – 4 – Análise Exploratória
Código: https://github.com/eogasawara/datamining/blob/main/examples/4-ExploratoryAnalysis.md
MD – 5 – Preprocessamento de dados
Código: https://github.com/eogasawara/datamining/blob/main/examples/5-DataPreprocessing.md
MD – 6 – Padrões frequentes
Código: https://github.com/eogasawara/datamining/blob/main/examples/6-PatternMining.md
MD – 7 – Classificação e MD – 7 – Classificação – Avançada
Código: https://github.com/eogasawara/datamining/blob/main/examples/7-Prediction.md
MD – 9 – Agrupamento
Código: https://github.com/eogasawara/datamining/blob/main/examples/8-Clustering.md
Playlist
Ferramentas
DAL Toolbox: https://cefet-rj-dal.github.io/daltoolbox/
Harbinger: https://cefet-rj-dal.github.io/harbinger/
TSPredIT: https://cefet-rj-dal.github.io/tspredit/
Bibliografia Básica
- HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques. 4. ed. Cambridge, MA: Morgan Kaufmann, 2022.
- JAMES, Gareth; WITTEN, Daniela; HASTIE, Trevor; TIBSHIRANI, Robert. An introduction to statistical learning: with applications in R. 2. ed. New York: Springer, 2021.
- Escovedo, T.; Koshiyama, A. Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise. Casa do Código, 2020.
Bibliografia Complementar
- BISHOP, C. M.; Bishop, H. Deep Learning: Foundations and Concepts. Springer Nature, 2023.
- BRAMER, M. Principles of Data Mining. Springer London, 2020.
- GARCIA, S.; LUENGO, J.; HERRERA, F. Data Preprocessing in Data Mining. Springer, 2014.
- OGASAWARA, E.; SALLES, R.; PORTO, F.; PACITTI, E. Event Detection in Time Series. 1. ed. Cham: Springer Nature Switzerland, 2025.
- GOLDSCHMIDT, R.; PASSOS, E.; BEZERRA, E. Data Mining. Elsevier Brasil, 2015.