Introducción al lenguaje R para su aplicación en proyectos de ciencias sociales
Inscripción abierta
Contenidos
UNIDAD 1: Introducción a R para el análisis de datos sociales.
Contenidos teóricos
— Matrices de datos. Características de la matriz de datos (partes y funciones) y la relevancia de su comprensión para el procesamiento y análisis de datos.
Contenidos prácticos
— Introducción a R. ¿Qué es R?, ¿para qué sirve?, ¿cómo se compara a otras herramientas informáticas de análisis de datos? Ventajas de R: Software libre, comunidad amplia, actualizaciones constantes, transparencia, facilidad para trabajar en grupo y comunicar resultados.
— Primeros pasos en R. Instalación de R. Primeros comandos. Concepto y características de la programación orientada a objetos.
— Instalación de R Studio como entorno de desarrollo de R. Introducción a la pantalla de RStudio: ¿Qué son los scripts, la consola, el entorno? Librerías y funciones básicas: ¿qué son y cómo instalarlas?
— R base. Tipos de objetos en R: vectores, matrices, funciones, dataframes. ¿Cómo descargar y exportar bases de datos? Tipos de datos: Numéricos, lógicos, caracteres. Documentación. Operaciones básicas. Exploración básica de una base de datos.
UNIDAD 2: Análisis descriptivo con R
Contenidos teóricos
— Cálculo e interpretación de estadísticas. Diseño de tablas de frecuencias y cruces para variables nominales y ordinales. Definición / Identificación de variables dependientes, independientes y control. Cálculo de medidas de tendencia central y dispersión. Comparación de medias y dispersión. Estimaciones con ponderación. Elaboración de gráficos. Tipos de gráficos y criterios para la selección del tipo de gráfico.
Contenidos prácticos
— Creación y operaciones con dataframes. Nombres de columnas, modificación del nombre de columnas, modificación del tipo de columna, asignación de etiquetas, eliminación de columnas. Formas de referenciación de los distintos elementos de un dataframe. Indexación (Fila, columna, celda) $, nombre de columna.
— Confección de tablas de frecuencias y cruces. Utilización de la función table() y funciones alternativas para la presentación de resultados.
UNIDAD 3: Creación de nuevas variables a través del procesamiento de datos con R.
Contenidos teóricos
— Transformaciones en matrices bidimensionales. Creación de nuevas variables. Alternativas para la creación de nuevas variables. Formulación de condiciones lógicas (lógica proposicional) para la creación de nuevas variables. Asignaciones no condicionadas y condicionadas. Su aplicación en la creación de tipologías e índices.
Contenidos prácticos
— Procesamiento de bases datos en dataframes. Procesamiento de dataframes para la creación de nuevas variables a partir de datos existentes. Funciones habituales para la edición, procesamiento y puesta a punto de matrices de datos para su análisis.
UNIDAD 4: Creación de nuevas variables a través de transformaciones de la matriz de datos.
Contenidos teóricos
— Selección y ordenamiento de casos. Alternativas y criterios para la selección de subuniversos específicos y muestras aleatorias. Ordenamiento de bases. Efectos y funciones del ordenamiento de matrices de datos.
Contenidos prácticos
— Selección de datos y variables. Creación de nuevos dataframes a partir de la selección de casos y variables
UNIDAD 5: Creación de nuevas variables a través de generación de nuevas matrices de datos.
Contenidos teóricos
— Agregación de casos. Requerimientos y funciones disponibles para el pasaje a unidades de registro de mayor nivel de agregación. Cálculo de medidas resumen para la modificación de la unidad de registro.
— Fusión de matrices. Casos de fusión de matrices de datos por incorporación de casos y por incorporación de variable. Características, rquisitos y alternativas de fusión.
Contenidos prácticos
— Generación de dataframes agregados. Estrategias, alternativas y funciones de agregación de datos. Procedimientos para la identificación de casos específicos dentro de los casos agregados en un grupo.
— Fusión de bases de datos. Fusión de dataframes con coincidencia total y/o parcial de variables y/o casos. Fusión de variables de pocos a muchos. Fusión de dataframes con coincidencia total y/o parcial de variables y/o casos. Fusión de variables de pocos a muchos.