Cursos
Machine Learning
Local: Remoto
Professor: Maria do Carmos Soares de Lima (UFPE)
maria@de.ufpe.br
13/07/2026 a 17/07/2026
18:30 às 21:30
Total de Horas: 15 horas
Valor: R$ 590,00
Ementa: Este curso aborda os fundamentos e aplicações do aprendizado de máquina, apresentando conceitos, métodos e ferramentas essenciais para análise de dados e construção de modelos preditivos. Serão explorados os principais paradigmas de aprendizado, incluindo abordagens supervisionadas, não supervisionadas e por reforço, além de técnicas de pré-processamento de dados, validação e avaliação de modelos. O curso também introduz tópicos contemporâneos, como aprendizado profundo, processamento de linguagem natural e visão computacional, bem como questões relacionadas à interpretabilidade e ética em inteligência artificial. Com uma abordagem teórico-aplicada, o curso combina fundamentos conceituais com atividades práticas utilizando bibliotecas amplamente empregadas, permitindo aos participantes compreender e implementar soluções em diferentes contextos.
Pré-requisitos: Para acompanhar adequadamente o curso, recomenda-se que os participantes possuam: (i) Conhecimentos estatísticos: noções básicas de estatística descritiva (média, mediana, variância) e probabilidade; familiaridade com conceitos como correlação e regressão é desejável, mas não obrigatória. (ii) Experiência com software: conhecimento básico em programação, preferencialmente em R ou Python, incluindo manipulação simples de dados e execução de scripts. Não é necessário conhecimento prévio em aprendizado de máquina, pois os conceitos serão introduzidos ao longo do curso.
Método de Ensino: O curso será conduzido por meio de uma abordagem teórico-aplicada, combinando diferentes estratégias de ensino para favorecer a compreensão conceitual e o desenvolvimento de habilidades práticas. As aulas expositivas serão utilizadas para introduzir os principais conceitos e técnicas de
aprendizado de máquina, sempre articuladas com exemplos concretos. Paralelamente, serão realizados exercícios práticos com uso de software (R ou Python), permitindo aos participantes aplicar os métodos em bases de dados reais ou simuladas. Além disso, o curso incluirá atividades de análise de dados, nas quais os estudantes irão explorar, modelar e interpretar resultados, bem como momentos de discussão orientada sobre aplicações,
limitações e implicações dos modelos. Quando pertinente, poderão ser propostas atividades de replicação simplificada de estudos ou exemplos da literatura, com o objetivo de consolidar o aprendizado e aproximar os participantes de práticas de pesquisa na área.
Avaliação: A avaliação do curso será baseada em atividades práticas voltadas à aplicação dos conteúdos apresentados. Os estudantes serão considerados aprovados se obtiverem frequência mínima de 75% e nota final superior a 60 pontos (em uma escala de 0 a 100). A nota final poderá ser composta pelos seguintes elementos:
(i) Exercícios práticos (40%): listas de exercícios ou atividades aplicadas ao longo do curso.
(ii) Projeto ou trabalho final (40%): análise de um conjunto de dados utilizando as ferramentas aprendidas no curso, incluindo manipulação de dados, análise descritiva e visualização.
(iii) Participação e atividades em aula (20%): envolvimento nas atividades práticas e discussões durante as aulas.
Software: O curso fará uso de softwares e bibliotecas amplamente utilizados em ciência de dados e aprendizado de máquina, com foco em linguagens como R e/ou Python. Serão empregadas ferramentas como scikit-learn, TensorFlow, PyTorch e Keras para construção e avaliação de modelos, além de bibliotecas de manipulação e visualização de dados, como pandas, matplotlib e seaborn (ou seus equivalentes em R, como tidyverse e ggplot2).
Os participantes utilizarão ambientes de desenvolvimento como Google Colab ou RStudio, que permitem a integração entre código, resultados e documentação. O uso de software será central ao curso, com atividades práticas orientadas que visam capacitar os estudantes a implementar, testar e
analisar modelos de aprendizado de máquina em diferentes contextos.
Expectativas: Ao final do curso, espera-se que os estudantes sejam capazes de:
(i) Compreender os fundamentos do aprendizado de máquina, distinguindo seus principais paradigmas (supervisionado, não supervisionado e por reforço) e suas aplicações.
(ii) Realizar o pré-processamento de dados, incluindo limpeza, tratamento de valores ausentes, normalização e transformação de variáveis.
(iii) Construir, treinar e interpretar modelos de aprendizado supervisionado para tarefas de regressão e classificação.
(iv) Aplicar técnicas de aprendizado não supervisionado, como clustering e redução de dimensionalidade, para exploração de dados.
(v) Avaliar e validar modelos utilizando métricas apropriadas e estratégias como validação cruzada e ajuste de hiperparâmetros.
(vi) Utilizar bibliotecas e ferramentas computacionais (como scikit-learn, TensorFlow ou PyTorch) para implementação de modelos.
(vii) Reconhecer fundamentos de aprendizado profundo, processamento de linguagem natural e visão computacional, compreendendo suas principais aplicações.
(viii) Analisar criticamente modelos de machine learning, considerando aspectos de interpretabilidade, limitações e implicações éticas.
(ix) Desenvolver e comunicar soluções baseadas em aprendizado de máquina aplicadas a problemas reais.
Aula 1: Fundamentos e Introdução ao ML
- Definição de aprendizado de máquina
- Tipos de aprendizado:
- Supervisionado
- Não supervisionado
- Por reforço
- Aplicações e casos de uso (exemplos reais)
- Introdução às ferramentas:
- scikit-learn, TensorFlow, PyTorch
- visão geral do ecossistema
Bibliografia básica:
- An Introduction to Statistical Learning — Trevor Hastie et al. (Cap. 1 e 2 (introdução e visão geral))
- Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow — Aurélien Géron (Cap. 1 (panorama geral))
- Pattern Recognition and Machine Learning — Christopher M. Bishop
Aula 2: Pré-processamento e Preparação de Dados
- Limpeza de dados
- Tratamento de valores ausentes
- Normalização e padronização
- Transformação de variáveis categóricas
- Introdução à divisão de dados: treino, validação e teste
Bibliografia básica:
- An Introduction to Statistical Learning (Cap. 3 (conceitos básicos de modelagem))
- Applied Predictive Modeling — Max Kuhn; Kjell Johnson (Capítulos sobre pré-processamento e preparação de dados)
- Python Data Science Handbook — Jake VanderPlas (Seções sobre manipulação de dados (pandas))
- R for Data Science — Hadley Wickham
Aula 3: Aprendizado Supervisionado
- Regressão:
- modelos lineares
- árvores de decisão
- Classificação:
- árvores
- SVM
- redes neurais (introdução)
- Avaliação de modelos:
- precisão, recall, F1-score
- matriz de confusão
- curva ROC
Bibliografia básica:
- An Introduction to Statistical Learning (Cap. 4 (classificação) e Cap. 5 (avaliação))
- Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (Capítulos sobre modelos supervisionados )
- The Elements of Statistical Learning — Trevor Hastie et al.
Aula 4: Aprendizado não-supervisionado + Validação
- Clustering:
- k-means
- DBSCAN
- hierárquico
- Redução de dimensionalidade:
- PCA
- Seleção de características
- Validação e seleção de modelos:
- validação cruzada
- ajuste de hiperparâmetros
Bibliografia básica:
- An Introduction to Statistical Learning (Cap. 10 (métodos não supervisionados))
- Pattern Recognition and Machine Learning — Christopher M. Bishop (Seções sobre clustering e PCA)
- Applied Predictive Modeling (Validação cruzada e tuning)
- The Elements of Statistical Learning
Aula 5: Tópicos Avançados e Aplicação
- Deep Learning:
- redes neurais profundas
- CNNs, RNNs, GANs (visão geral)
- NLP e Visão Computacional:
- tokenização, embeddings
- detecção de objetos e CNNs
- Tópicos especiais:
- aprendizado por reforço (Q-learning, DQN)
- aprendizado semi supervisionado
- aprendizado federado e privacidade
- ética e interpretabilidade
- Projetos práticos e estudos de caso:
- discussão de aplicações reais
- desafios e boas práticas
Bibliografia básica:
- Deep Learning — Ian Goodfellow et al. (Fundamentos de redes neurais profundas)
- Speech and Language Processing — Daniel Jurafsky; James H. Martin (Introdução a NLP)
- Interpretable Machine Learning — Christoph Molnar (Interpretabilidade e ética)
Bibliografia para aprofundamento:
- Pattern Recognition and Machine Learning — Christopher M. Bishop( Li vro clássico com abordagem matemática sólida.)
- The Elements of Statistical Learning — Trevor Hastie; Robert Tibshirani; Jerome Friedman (Referência avançada)
- An Introduction to Statistical Learning — mesmos autores (Versão mais acessível)
- Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow — Aurélien Géron (Um dos melhores livros práticos atualmente.)
- Machine Learning with Python Cookbook — Chris Albon (Focado em soluções rápidas e exemplos práticos.)
- Applied Predictive Modeling — Max Kuhn; Kjell Johnson (Muito útil para entender pipeline completo.)
- Deep Learning — Ian Goodfellow; Yoshua Bengio; Aaron Courville (Principal referência teórica em deep learning.)
- Neural Networks and Deep Learning — Michael Nielsen (Excelente introdução conceitual (gratuito online).)
- Speech and Language Processing — Daniel Jurafsky; James H. Martin (Principal referência em NLP.)
- Computer Vision: Algorithms and Applications — Richard Szeliski (Base sólida em visão computacional.)
- Python Data Science Handbook — Jake VanderPlas (Ótimo para base em Python científico.)
- R for Data Science — Hadley Wickham; Garrett Grolemund (Essencial se for usar R.)
- Interpretable Machine Learning — Christoph Molnar (Explica como interpretar modelos.)
- Weapons of Math Destruction — Cathy O’Neil (Impactos sociais e riscos dos algoritmos. )
- Stock, J. H., & Watson, M. W. (2020). Introduction to econometrics. Pearson.