Introducción al lenguaje R para su aplicación en proyectos de ciencias sociales


Contenidos

UNIDAD 1:  Introducción a R cómo herramienta de análisis de datos para cientistas sociales.

Introducción al análisis de datos. Tipos de datos (estructurados, semi estructurados no estructurados).  Rol del análisis de datos en las ciencias sociales. Introducción a las herramientas informáticas de análisis de datos: comparación entre distintas herramientas, ventajas y desventajas (Excel, SPSS, Stata, R, Python).

Introducción a R. ¿Qué es R?, ¿para qué sirve?, ¿cómo se compara a otras herramientas informáticas de análisis de datos? Ventajas de R: Software libre, comunidad amplia, actualizaciones constantes, transparencia, facilidad para trabajar en grupo y comunicar resultados. Ejemplos de proyectos hechos en R.

Primeros pasos en R. Instalación de R. Primeros comandos. Concepto y características de la programación orientada a objetos.

Instalación de R Studio como entorno de desarrollo de R. Introducción a la pantalla de RStudio: ¿Qué son los scripts, la consola, el entorno? Librerías y funciones básicas: ¿qué son y cómo instalarlas?


UNIDAD 2: Manipulación de bases de datos con R

R base. Tipos de objetos en R: vectores, matrices, funciones, dataframes. ¿Cómo descargar y exportar bases de datos? Tipos de datos: Numéricos, lógicos, caracteres. Documentación. Operaciones básicas.  Exploración básica de una base de datos.

El paquete Tidyverse. Introducción al paquete: ¿por qué facilita la manipulación de datos?, ¿cuál es su lógica? Utilización de pipes (%>%) como conectores. Principales funciones para limpiar, ordenar, filtrar, agrupar bases de datos: select, filter, mutate, group by, pivot, rename y summarise. Cálculo de medidas resumen y cálculos dentro de la base de datos.

Procesamiento y análisis de bases de datos públicas. Identificación de bases de datos y análisis de su organización interna en función tanto de sus unidades de registro y análisis como de las variables disponibles.


UNIDAD 3: Visualización de datos

Tablas y gráficos básicos. Confección de tablas de frecuencia, cruces y cálculo de estadísticas de tendencia central y dispersión. Elaboración de gráficos. Tipos de gráficos y criterios para la selección del tipo de gráfico. Ggplot básico. Gráficos con el paquete ggplot2 y extensiones. Gráficos elaborados. Gráficos automáticos

Lectura de resultados. Lectura y análisis de tablas de frecuencias. Análisis basado en distribuciones relativas. Lectura y análisis de las tablas cruzadas. Variables dependientes e independientes. Concepto de independencia estadística. Lectura y análisis de gráficos.

Mapeo de datos. Procesamiento de bases de datos con datos georreferenciados: fusión y agrupación de bases de datos. Confección de mapas a partir de datos georrefenciados. Mapas simples en ggplot y tmap. Mapas interactivos en leaflet.


UNIDAD 4: Confección de reportes automatizados.

Introducción a Rmarkdown. Gramática de Rmarkdown. Tipos de reporte: página web, borrador, presentación.

 Automatización de procesos en R. Funciones. Publicaciones en Rpubs.

Criterios para la confección de reportes.

Bibliografía