Cursos

Introdução ao Machine Learning
Local: FAFICH-UFMG
Professor: Maurício Izumi
mauricioizumi@hotmail.com
08/07/2024 a 12/07/2024
18h-21h
Total de Horas: 15 horas
Salal: Remoto
Ementa: Este curso visa fornecer uma introdução prática ao uso de técnicas de aprendizado de máquina (machine learning) aplicadas às Ciências Sociais. Os participantes aprenderão a utilizar modelos supervisionados e não-supervisionados para análise de dados, permitindo a extração de insights e a realização de previsões e classificações em diferentes contextos sociais. Ao longo do curso desenvolveremos habilidades práticas por meio de exercícios e projetos práticos utilizando conjuntos de dados reais. Ao final do curso, espera-se que os participantes tenham adquirido conhecimentos fundamentais em machine learning e serão capazes de aplicar essas técnicas para analisar dados em suas próprias pesquisas.
Pré-requisitos: Conhecimentos básicos de estatística e da linguagem R de programação.
Método de Ensino: O curso será baseado em aulas expositivas e exercícios práticos.
Avaliação: A avaliação será feita por meio da aplicação de um modelo de machine learning em um problema das Ciências Sociais.
Software: Neste curso, utilizaremos a linguagem R de programação. Além de ser gratuita, a linguagem R é flexível e conta com uma ampla comunidade de usuários.
Expectativas: Ao final do curso, espera-se que os participantes tenham adquirido conhecimentos fundamentais em machine learning e que sejam capazes de aplicar essas técnicas para analisar dados em suas próprias pesquisas.

Aula 1: Fundamentos do machine learning

– Introdução ao conceito de aprendizado de máquina e sua aplicação;

– Diferença entre abordagens supervisionadas e não-supervisionadas;

– Principais etapas do processo de modelagem de machine learning: preparação de dados, treinamento do modelo, avaliação e interpretação dos resultados.

  • Bibliografia básica: James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017) – Capítulos 1 e 2.

 

Aula 2: Modelos supervisionados (regressão/previsão)

– Aplicação de modelos supervisionados em problemas de previsão;

– Introdução ao modelo de regressão linear;

– Seleção de variáveis.

  • Bibliografia básica: James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017) – Capítulo 3.

 

Aula 3: Modelos supervisionados (classificação)

– Aplicação de modelos supervisionados em problemas de classificação;

– Introdução à regressão logística para classificação binária;

– Introdução ao Näive Bayes;

– Validação do modelo.

  • Bibliografia básica: James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017) – Capítulo 4.

 

Aula 4: Modelos não-supervisionados

– Aplicação de modelos não-supervisionados em Ciências Sociais;

– Introdução a problemas de redução de dimensionalidade: análise de componentes principais;

– Introdução a técnicas de agrupamento para identificar padrões e segmentos em conjuntos de dados: análise de cluster.

  • Bibliografia básica: James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017) – Capítulo 10.

 

Aula 5: Avaliação

Bibliografia para aprofundamento:
  • Gelman, A., & Hill, J. (2006). Data analysis using regression and multilevel/hierarchical models. Cambridge university press.
  • Grimmer, J., Roberts, M. E., & Stewart, B. M. (2022). Text as data: A new framework for machine learning and the social sciences. Princeton University Press.
  • Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction. New York: springer.
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017). An introduction to statistical learning: with applications in R. New York: springer.
  • Morettin, P. A., & Bussab, W. O. (2017). Estatística básica. Saraiva Educação SA.
  • Stock, J. H., & Watson, M. W. (2020). Introduction to econometrics. Pearson.