Introducción al uso del Paquete Estadístico Stata
Contenidos
El curso está estructurado alrededor de tres módulos y en cada uno se desarrollan cuatro clases. El Módulo 1 está centrado en los llamados Reportes básicos, es decir, se verán los comandos que revelan información acerca de los datos sin cambiarlos. En el Módulo 2 se verá la Manipulación de datos (comandos que modifican los datos) y la confección de programas do-file que se usan para llevar a cabo análisis secuenciales. El Módulo 3 agrupa cuatro temas diferentes entre las que se destaca el importante tema de la organización del trabajo con Stata.
MÓDULO I
En la clase 1 se hará una breve introducción a la interfaz de usuario para luego explorar como está organizado el sistema de carpetas y archivos del software, con el fin de empezar a conocerlo en profundidad. Se abordará también el tema de la actualización de Stata para una versión dada y su relevancia. Finalmente se aprenderá a buscar recursos disponibles en diversas fuentes y a cómo guardar un registro del trabajo realizado.
En la clase 2 se cargará una base en memoria y se comenzará a trabajar interactivamente. Se dará un ejemplo de profile.do, programa que Stata busca al ser invocado y que ejecuta automáticamente, personalizando la sesión de trabajo. Se estudiará una primera versión de la sintaxis de los comandos cuyo conocimiento es de fundamental importancia en lo que sigue del curso. Se comenzará con los llamados Reportes básicos. Intercalados entre esos reportes, se enseñarán los distintos tipos de datos y como se almacenan y se aprenderá el sentido de usar el prefijo [by varlist:] en una instrucción. Finalmente se abordará el uso de la nueva GUI (Graphical User Interface), que permite manejarse con las llamadas Cajas de diálogo.
En la clase 3 se continuará con los Reportes básicos y se intercalarán algunos comandos de Manipulación de datos que nos permitirán abordar el problema de la Precisión, inherente a todas las computadoras al almacenar internamente los números en forma binaria. Se darán ejemplos de este mismo problema en otros paquetes estadísticos y particularidades del uso de la planilla de cálculo Excel. Finalmente se abordará el tema de los formatos en que pueden mostrarse las variables.
En la clase 4 se finalizará con los Reportes básicos, estudiando los principales comandos que tabulan. Aún corriendo el riesgo de un solapamiento en sus funciones, se dará un abanico de posibilidades donde cada alumna/o encontrará la que mejor se adapte a sus necesidades.
MÓDULO 2
Hasta ahora se trabajó con bases de datos que vienen incluidas en el software. En la clase 5 se enseñará cómo pasar al formato propietario de Stata (.dta) bases externas de distintos orígenes y estructuras. Se analizará con más profundidad el caso de información proveniente de planillas de cálculo. Luego se darán los lineamientos generales a tener en cuenta para el pasaje de tablas a otros programas (básicamente Word y Excel). Estudiaremos comandos de Manipulación de datos y en orden de seguir adquiriendo los conocimientos metodológicos necesarios para la correcta aplicación del programa, veremos el manejo de variables con subíndice, el prefijo [by varlist:] y las variables de sistema _n y _N. Finalmente se abordará la construcción de rutinas (programas do-file), que es la principal forma de trabajo que se usará hasta el fin del curso.
En la clase 6 se analizará en detalle la forma que tiene Stata de trabajar con la lógica verdadero/falso. Se estudiarán las dos reglas que rigen el comportamiento de Stata cuando se restringe la aplicación de un comando a las observaciones que cumplen una expresión lógica. Se abordará el uso de los valores missing extendidos y veremos diferentes formas de realizar sumas. Se resolverá un ejemplo real tomado de la Statalist (lista de consulta de usuarios de Stata) que integra el uso del prefijo [by varlist:], las variables de sistema _n y _N y las reglas verdadero-falso. Finalmente se abordarán los comandos y operadores para trabajar con datos de panel.
En la clase 7 se analizará la conversión de variables continuas y categóricas (y dentro de éstas el caso especial de las variables indicador) de unas en otras. Se estudiarán varias funciones para el manejo de variables que contengan cadenas de caracteres conocidas como variables string. Finalmente se resolverán media docena de ejercicios que integran el manejo de las funciones vistas con las reglas verdadero-falso y sobre las distintas conversiones de datos analizadas en esta clase.
En la clase 8 se finalizará con los comandos de Manipulación de datos, pero en su versión extrema ya que se estudiarán aquellos que permiten transformar matrices de datos enteras destruyendo los datos originales (en memoria), y reemplazándolos con una nueva base. Hay que notar que esto se hará siempre actuando sobre una sola base a la vez.
MÓDULO 3
En la clase 9 se planteará un problema que integra los contenidos más importantes vistos en el curso hasta el momento y cuya resolución se verá en la clase 10. Hasta acá trabajamos con una única base en memoria, de aquí en adelante se enseñará como relacionar dos bases de datos, la cargada en memoria con otra que está en el disco. Se verán las dos formas de hacerlo, esto es, combinando las bases verticalmente, agregando observaciones o combinándolas horizontalmente, agregando variables.
En la clase 10 se resolverá el problema planteado en la clase anterior que integra algunos contenidos importantes vistos hasta este momento. Luego se enseñarán a aplicar los principios de organización que permiten trabajar eficientemente cuando se analizan datos. Estos principios son fundamentales para lograr resultados consistentes en el tiempo, esto es, reproducibles. La mayoría de las reglas a seguir ya se fueron dando a través del curso pero aquí las veremos juntas y se fundamentará el porqué de su adopción. Esta es la clase más importante porque sin una metodología consistente un proyecto puede fracasar a pesar de que el software para llevarlo adelante sea excelente. Finalmente se abordará el tema de pesos (ponderadores) y cómo se completa la sintaxis de los comandos cuando se utilizan.
En la clase 11 se hará una recorrida por un conjunto de comandos gráficos, que no pretenden agotar el tema. Se abordará la estructura de los comandos gráficos y las dos posibilidades de sintaxis que ofrece Stata (estándar y alternativa). Finalmente se ejercitará el uso de Cajas de diálogo contenidas en el menú Graphics.
En la clase 12 se desarrollará a modo de ejemplo un problema completo. Aplicaremos los principios de organización desarrollados en la clase 10 y se aprovechará para introducir el manejo de variables de fecha. Se mostrarán ciertas técnicas y se dará un punto de partida a los conceptos elementales de programación que permitan avanzar sobre procesamientos y análisis más complejos. Se dará una idea sobre macros locales y cómo realizar tareas repetitivas.