Cursos

Introdução ao R
Local: Remoto
Professor: Breno Marisguia (UFMG)
brenoandrehm@gmail.com
06/07/2026 a 10/07/2026
18:30 às 21:30
Total de Horas: 15
Valor: R$ 590,00
Ementa: Curso introdutório sobre o uso do R como ferramenta de apoio à pesquisa empírica em Ciências Sociais. A disciplina aborda o ambiente de trabalho no RStudio, a lógica básica de scripts, a importação e inspeção de bases de dados, a identificação e o tratamento de classes de variáveis, a manipulação e recodificação de dados, a produção de estatísticas descritivas e visualizações gráficas introdutórias, bem como a leitura de funções, argumentos e mensagens de erro. O curso adota uma abordagem aplicada e metodológica, com ênfase na instrumentalização dos estudantes para o trabalho com dados.
Pré-requisitos: Alfabetização digital básica: familiaridade com o uso de computador; organização de pastas e arquivos; uso de mecanismos de pesquisa como Google. Conhecimentos estatísticos introdutórios (variáveis, medidas de centralidade) podem facilitar o acompanhamento de algumas atividades, mas não são obrigatórios.
Método de Ensino: O curso será conduzido por meio de aulas expositivas e práticas, com demonstração de comandos e resolução guiada de exercícios com bases de dados. A condução das aulas privilegiará a aprendizagem por solução de erros típicos, articulando explicações conceituais breves com aplicações imediatas em situações problemáticas da pesquisa empírica. As atividades envolverão importação, inspeção, manipulação, recodificação, descrição e visualização de dados, com ênfase na compreensão da estrutura das bases, das classes de variáveis e da lógica das funções utilizadas. Ao longo do curso, também serão trabalhadas estratégias de leitura de documentação, interpretação de erros e busca autônoma de soluções online.
Avaliação: A avaliação será realizada por meio de uma prova final individual, a ser entregue em algum momento (a ser decidido) após o encerramento do curso. A atividade consistirá no trabalho aplicado sobre uma base de dados propositalmente desorganizada, contendo problemas de estrutura, codificação e harmonização compatíveis com situações reais de pesquisa empírica. Espera-se que os estudantes sejam capazes de importar a base, inspecionar sua estrutura, identificar e explicar problemas relevantes, corrigir ou harmonizar variáveis, realizar recodificações e executar procedimentos introdutórios de análise compatíveis com o tipo de dado trabalhado. A entrega deverá incluir: (i) script comentado e executável; (ii) breve relatório explicando as decisões tomadas, as dificuldades encontradas e os procedimentos utilizados; (iii) declaração de transparência sobre o uso de ferramentas de apoio, incluindo documentação, fóruns e ferramentas de inteligência artificial, quando utilizadas. A correção considerará a capacidade de diagnosticar problemas na base, a adequação das operações de manipulação e recodificação, a coerência entre tipo de variável e procedimento empregado, a clareza na explicação das escolhas realizadas, a organização e inteligibilidade do script final e a interação com ferramentas externas de apoio.
Software: No curso utilizaremos os softwares R e Rstudio.
Expectativas: Ao final do curso, espera-se que os estudantes sejam capazes de: (i) compreender a lógica básica de funcionamento do R através do RStudio; (ii) utilizar scripts para organizar rotinas simples de trabalho; (iii) importar bases de dados em formatos usuais de pesquisa; (iv) inspecionar a estrutura de uma base de dados e identificar suas principais características; (v) reconhecer classes de variáveis e compreender sua relevância para manipulação e análise; (vi) selecionar, filtrar, ordenar, renomear e transformar variáveis e observações; (vii) recodificar variáveis e lidar com valores ausentes em nível introdutório; (viii) produzir estatísticas descritivas, tabelas simples e gráficos básicos; (ix) compreender o que funções e pacotes solicitam em seus argumentos; (x) interpretar mensagens de erro e buscar soluções de maneira autônoma; (xi) executar rotinas introdutórias de análise de dados no R.

Aula 1: Introdução ao Ambiente de Trabalho no R

  • apresentação do R e do RStudio;
  • script, console, ambiente e diretório de trabalho;
  • objetos, funções, argumentos e pacotes;
  • importação de bases de dados;
  • estrutura básica de data frames;
  • inspeção inicial de bases.

Leitura recomendada:
Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd Edition. Capítulo 1. Disponível em: https://rc2e.com/
– Cap. 1, subseções 1.1 a 1.4; 1.8; 1.10 a 1.12.
– Cap. 3, subseções 3.1, 3.2, 3.10 e 3.13.
– Cap. 4, subseções 4.8 e 4.11.

Aula 2: Classes de Variáveis e Inspeção Substantiva da Base

  • classes básicas no R: numeric, integer, character, factor, logical e Date;
  • distinção entre natureza substantiva da variável e sua codificação no software;
  • variáveis contínuas, categóricas, binárias e ordinais;
  • identificação de classes e problemas frequentes de codificação;
  • conversões básicas de classes;
  • implicações das classes de variáveis para manipulação e análise.

Leitura recomendada:
Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd Edition. Capítulo 1. Disponível em: https://rc2e.com/
– Cap. 2, subseção 2.5.
– Cap. 5, subseções 5.4, 5.18, 5.21, 5.22, 5.28 e 5.29.
– Cap. 7, subseções 7.8 a 7.10 e 7.12.
– Cap. 9, subseções 9.1 e 9.3.

Aula 3: Manipulação e Recodificação de Dados

  • seleção, filtragem, ordenação e renomeação de variáveis;
  • uso do pipe;
  • criação e transformação de variáveis;
  • recodificação com condicionais;- tratamento introdutório de valores ausentes;
  • organização de rotinas básicas de preparação de dados.

Leitura recomendada:
Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd Edition. Capítulo 1. Disponível em: https://rc2e.com/
– Cap. 2, subseções 2.12 a 2.14.
– Cap. 5, subseções 5.21 a 5.25 e 5.28.
– Cap. 6, subseções 6.6 e 6.7.

Aula 4: Estatísticas Descritivas e Visualização de Dados

  • frequências e tabelas simples;
  • summaries;
  • resumos por grupo;
  • princípios introdutórios de visualização de dados;
  • gráficos de barras, histogramas, boxplots e gráficos de dispersão;
  • adequação entre tipo de variável, estatística descritiva e visualização.

Leitura recomendada:
Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd Edition. Capítulo 1. Disponível em: https://rc2e.com/
– Cap. 2, subseção 2.6.
– Cap. 9, subseções 9.1 a 9.5.
– Cap. 10, subseções 10.1, 10.10 e 10.17 a 10.20.

Aula 5: Fluxo Completo de Trabalho, Análises Introdutórias e Autonomia no Uso do R

  • aplicação integrada de um fluxo de trabalho com dados;
  • leitura de documentação e de argumentos de funções;
  • interpretação de mensagens de erro;
  • estratégias de busca autônoma de soluções;
  • execução de análises introdutórias compatíveis com o perfil das variáveis;
  • consolidação do uso do R como ferramenta de pesquisa.

Leitura recomendada:
Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd Edition. Capítulo 1. Disponível em: https://rc2e.com/
– Cap. 1, subseções 1.8 a 1.12 e 1.14.
– Cap. 2, subseção 2.14.
– Cap. 9, subseções 9.4, 9.8, 9.15 e 9.17.
– Cap. 11, subseções 11.1, 11.3 e 11.4.

Bibliografia para aprofundamento:
  • Healy, Kieran. Data Visualization: A Practical Introduction. (2019). Princeton: Princeton University Press.
  • Imai, Kosuke. Quantitative Social Science: An Introduction. (2017). Princeton: Princeton University Press.
  • Kabacoff, Robert. R In Action. (2025). 3. ed. Shelter Island: Manning.
  • Long, J. D.; Teetor, P. (2019). R Cookbook, 2nd ed.: https://Rc2e.Com/
  • Wickham, Hadley. Ggplot2: Elegant Graphics For Data Analysis. (2016). 3. ed. Cham: Springer.
  • Wickham, Hadley; Çetinkaya-Rundel, Mine; Grolemund, Garrett. R For Data Science. (2023). 2. Ed. Sebastopol: O’reilly.

Websites:
Dataviz Project: https://datavizproject.com/
Posit Cheatsheets: https://posit.co/resources/cheatsheets/
The R Graph Gallery: https://r-graph-gallery.com/