O curso aborda o estudo de técnicas de mineração de dados, ou seja, extração de conhecimento de grandes volumes de dados. O curso aborda uma visão geral de Mineração de Dados, noções gerais de R, análise exploratória de dados e preprocessamento.

Este curso de curta duração é oferecido regularmente uma vez por ano no LNCC (desde 2015), sob a colaboração entre o CEFET / RJ e o LNCC.

Neste ano, o curso é oferecido na modalidade online, podendo ser acompanhado pelo Youtube.

O material será atualizado ao longo da semana.

Slides:

MD – 1 – Introdução à Mineração de Dados
http://dx.doi.org/10.13140/RG.2.2.12306.02246

MD – 2 – Básico de R
http://dx.doi.org/10.13140/RG.2.2.25727.79520
https://nbviewer.org/github/eogasawara/mylibrary/blob/master/tutorial/tut_r_course.ipynb

MD – 3 – Visualização em R
http://dx.doi.org/10.13140/RG.2.2.32438.68165

MD – 4 – Análise Exploratória
http://dx.doi.org/10.13140/RG.2.2.15661.46566
https://nbviewer.org/github/eogasawara/mylibrary/blob/master/tutorial/tut_exploratory_analysis.ipynb

Ferramentas:

DAL Toolbox: https://cefet-rj-dal.github.io/daltoolbox/

Harbinger: https://cefet-rj-dal.github.io/harbinger/

TSPredIT: https://cefet-rj-dal.github.io/tspredit/

Referências:

[1] M. Kubat, 2017, An Introduction to Machine Learning. Springer.
[2] R.J. Larsen and M.L. Marx, 2017, An Introduction to Mathematical Statistics and Its Applications. Pearson Education.
[3] G. James, D. Witten, T. Hastie, and R. Tibshirani, 2013, An Introduction to Statistical Learning: with Applications in R. Springer Science & Business Media.
[4] J. Han, J. Pei, and M. Kamber, 2011, Data Mining: Concepts and Techniques. Elsevier.
[5] I.H. Witten, E. Frank, M.A. Hall, and C.J. Pal, 2016, Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
[6] C.C. Aggarwal, 2015, Data Mining: The Textbook. Springer.
[7] S. García, J. Luengo, and F. Herrera, 2014, Data Preprocessing in Data Mining. Springer.
[8] C.C. Aggarwal and J. Han, 2014, Frequent Pattern Mining. Springer.
[9] C.C. Aggarwal, 2013, Outlier Analysis. Springer Science & Business Media.
[10] M. Bramer, 2016, Principles of Data Mining. 3 ed. London, Springer-Verlag.
[11] T. Hastie, R. Tibshirani, and J.H. Friedman, 2009, The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
[12] R.H. Shumway and D.S. Stoffer, 2017, Time Series Analysis and Its Applications: With R Examples. Springer.