Métodos de Big Data para Ciencias Sociales y Políticas Públicas
Presentación
El Centro de Estadística e Informática Aplicada (CEIA) de la FLACSO Argentina ofrece cursos de iniciación y de actualización, entre ellos el curso Métodos de Big Data para Ciencias Sociales y Políticas Públicas.
Dirección y cuerpo docente
Coordinador: Joon Hee Bang.
Comité Ejecutivo CEIA: Luis Acosta, Natalia Apel, Joon Hee Bang, María Ferraro, Mirta Judengloben.
Docente: Luciano Casiraghi.
La Ciencia de Datos va expandiendo su contribución a las ciencias sociales y a las políticas públicas. Si bien hay muchas preguntas prácticas, técnicas y éticas asociadas con esta tendencia, este curso se centra en la aplicación práctica de los métodos, herramientas, técnicas y habilidades de la Ciencia de Datos, aplicados al campo de las ciencias sociales y las políticas públicas.
Los participantes del curso podrán incorporar conocimientos sobre: cómo obtener, trabajar, desarrollar y transformar nuevas fuentes de datos (como sensores móviles; datos de ubicación y comportamiento; redes sociales; mapas satelitales; minería de textos, entre otros); cómo construir nuevos modelos de análisis incluyendo y estructurando no sólo nuevas fuentes de datos, sino también algoritmos; cómo integrar los métodos y técnicas tradicionales y aplicarlos al desarrollo de modelos de aprendizaje automático.
El público objetivo de este curso será diverso, lo que permitirá el surgimiento de preguntas interesantes y estrategias compartidas como ser los desafíos de la recopilación y análisis que involucran conjuntos de datos grandes y “nuevos”; almacenamiento, acceso y publicación de grandes conjuntos de datos; generación de nuevas hipótesis y nuevas formas de datos; nuevas habilidades que se requieren de los investigadores para crear nuevos conocimientos y aplicaciones con ciencia de datos y participación con los responsables políticos.
Las preguntas de investigación que se pueden abordar a partir de la aplicación de métodos, técnicas, herramientas y habilidades de Ciencia de Datos, demuestran la gran variedad de desafíos que se pueden plantear tanto en investigación como en políticas públicas: ¿La policía en la calle hace una diferencia? ¿Se pueden usar los datos de envío para detectar la piratería y las importaciones de drogas ilegales? ¿Se puede identificar el robo de energía en los países en desarrollo? ¿Podemos inferir cambios en el estado de ánimo a partir de la forma en que las personas se mueven? ¿La tecnología en el lugar de trabajo significará el fin del trabajo? ¿Cuáles son los niveles de corrupción en la contratación pública? ¿Se pueden pronosticar usos y costumbres socioculturales? ¿Cuánto será el nivel de gasto de una política pública determinando posibles escenarios de sensibilidad? ¿Es posible encontrar un punto georreferenciado óptimo para un servicio público?
Los datos a menudo están fragmentados, por lo que los investigadores pasan tiempo tratando de localizar y acceder a diversos conjuntos de datos. Los grandes volúmenes de datos a menudo son datos ricos, que ofrecen puntos refinados y observaciones de alta calidad que abarcan diferentes niveles de análisis, por ejemplo, pasando de lo individual a lo colectivo. Los datos requieren traducción – entre idiomas, y también entre disciplinas. Es posible que falten datos que causen preocupación para los investigadores, o “puntos ciegos” en los datos donde se ignoran fuentes significativas en la investigación porque no están representados en los conjuntos de datos. Y los investigadores de las ciencias sociales que se conectan con la política pública y la toma de decisiones son conscientes del problema de que medir no es un acto pasivo. En este sentido, la Ciencia de Datos permite encarar todos estos desafíos para los investigadores de ciencias sociales y los funcionarios públicos, no solo por el tamaño de los conjuntos de datos que se generan, sino también en la naturaleza cambiante de los datos y su capacidad de respuesta que ofrece poder contar con resultados en tiempo real. Todo esto sin restar importancia a que la aplicación de la Ciencia de Datos, también puede representar desafíos éticos y prácticos significativos, entre los que destaca el creciente predominio de la política basada en datos y el efecto de la medición sobre el comportamiento en la esfera pública.
Objetivos
Partiendo del concepto general de Ciencia de Datos, su evolución y alternativas, se buscará:
- Conocer el estado del arte de la Ciencia de Datos en las Ciencias Sociales y en las Políticas Públicas.
- Entender los diferentes abordajes, ejes temáticos y capacidad para la generación y/o captación de información en Ciencias Sociales y Políticas Públicas
- Dar a conocer las herramientas existentes y aplicarlas en casos prácticos.
- Desarrollar habilidades para aplicar tecnologías como Python aplicadas al análisis de casos prácticos.
Contenidos
Contenidos por unidad
Unidad 1: El concepto de Ciencia de Datos: antecedentes y actualidad.
- Evolución histórica del concepto.
- Diferencias entre los diferentes conceptos de Data Mining, Business Intelligence, Data Lake, Big Data.
- Debates actuales.
- Introducción de la utilización de la Ciencia de Datos en las Ciencias Sociales
Unidad 2: Ejes Temáticos
- Gente y lugar – Ubicación y datos geoespaciales
- Las redes sociales en las ciencias sociales y políticas
- Datos Abiertos, Datos Públicos. Enlace, búsqueda y análisis
Unidad 3: Nuevas herramientas y métodos a partir de Ciencia de Datos. La importancia del modelado de datos
- Introducción al modelado de datos y programación
- Cómo y dónde encontrar DATA
- Herramientas básicas para explotar DATA
- Software y Herramientas Analíticas
- Introduciendo R, Python, Power BI y otras herramientas.
Unidad 4: Aplicación a Casos de Estudio
- Salud
- Cambio Climático
- Género
- Otros
Bibliografía
Autor | Título | Editorial | Año |
Becerra, Gastón | Big data como objeto de estudio y método para la investigación empírica en sociología y psicología social | STS, Simposio Argentino sobre Tecnología y Sociedad | 2018 |
Birkin, Mark | Big Data for Social Science Research | Ubiquity Symposium | 2018 |
Del Tell Escolar, Luis | Límite(s) de los estudios Big Data | Universidad Complutense de Madrid | 2016 |
Downey, Allen | Think Python – How to Think Like a Computer Scientist | Green Tea Press Needham, Massachusetts | 2012 |
Fazekas, Mihaly | The Use of ‘Big Data’ for Social Sciences Research: An Application to Corruption Research | University of Cambridge and Corruption Research Center Budapest | 2014 |
Gutierrez-Puebla, Javier | Big (Geo)Data en Ciencias Sociales: Retos y Oportunidades | Revista de Estudios Andaluces | 2016 |
Hernández-Leal, Duque-Méndez, Moreno-Cadavid | Big Data: una exploración de investigaciones, tecnologías y casos de aplicación | TecnoLógicas, vol. 20, no. 39, mayo – agosto, 2017 | 2017 |
Leek, Jeff | TheElementsofData AnalyticStyle | Leanpub | 2015 |
Liou, Tao, Lin | THE DATA ANALYTICS – handbook | DATA ANALYSTS + DATA SCIENTISTS | 2018 |
Paliotta , Achille Pierre | NUEVAS PROFESIONES Y TÉCNICAS DE WEB DATA MINING EN ARGENTINA: EL CASO DEL DATA SCIENTIST | Revista del Centro de Estudios de Sociología del Trabajo, Nº 1O, pp 97-113 | 2018 |
Patil & Mason | Data Driven – Creating a Data Culture | O`Reilly Media | 2015 |
Patil, Dj | Building Data Science Teams | O`Reilly Media | 2011 |
Peng, Roger | R Programming for Data Science | Leanpub | 2018 |
Shashua, Amnon | Introduction to Machine Learning | School of Computer Science and Engineering The Hebrew University of Jerusalem Jerusalem, Israel | 2008 |
Stanton, Jeffrey | Introduction to Data Science | Syracuse University | 2013 |
Steele, Julie | Understanding the Chief Data Officer | O`Reilly Media | 2015 |
Stuetzer, Welker, Egger | Computational Social Science in the Age of Big Data | neue schriften zur online-forschung | 2018 |
CASOS
Autor | Título | Editorial | Año |
Faghmous & Kumar | A BIG DATA GUIDE TO UNDERSTANDING CLIMATE CHANGE | Department of Computer Science and Engineering, The University of Minnesota–Twin Cities | 2014 |
Natsumi S. Shokida | La desigualdad de género se puede medir | FLACSO | 2018 |
Racine, Valerie | Big Data Case Study: Big Data & Conservation Biology | Onlineethics.org | 2017 |
Racine, Valerie | Big Data & Neuroscience | Onlineethics.org | 2017 |
Racine, Valerie | Big Data & Public Health | Onlineethics.org | 2017 |
Racine, Valerie | Big Data & Genetic Privacy: Re-identification of Anonymized Data | Onlineethics.org | 2017 |
Cursada
Modalidad virtual sincrónica.
Fecha de inicio: a confirmar
Cantidad de clases: 10 (29 hs).
Modalidad de cursada y carga horaria
El curso se encuentra organizado en base a una modalidad teórico-práctica.
Para la consideración de temas conceptuales/teóricos, se adoptará la modalidad de organizar discusiones conceptuales sobre la base de la lectura previa de textos seleccionados.
En el abordaje de los temas prácticos se desarrollarán las herramientas metodológicas y de producción de información específica.
Modalidad de evaluación
La evaluación final consistirá en un trabajo final integrador individual a ser realizado en el hogar. En esta instancia se evaluará tanto la lectura y comprensión de la bibliografía obligatoria como así también las capacidades de aplicación de los contenidos, herramientas y metodologías del curso.
Certificación otorgada
Se otorgará un certificado de asistencia y aprobación del curso una vez aprobada la evaluación del trabajo final. Se prevé un certificado de asistencia para aquellos que cumplan el requisito del 75% de asistencia y que aprueben la evaluación.
Inscripción
Los alumnos se considerarán inscriptos en el curso sólo cuando hayan cumplido los siguientes requisitos antes de la fecha de cierre de inscripción:
- Completar en línea el formulario de preinscripción.
- Entregar fotocopia del DNI (1º y 2º hoja)
- Abonar cuota
Aranceles
Residentes en Argentina:
- Curso completo: $ 22.770
- Pago único, 10 % desc: $ 20.493
- Pago en cuotas:
– Matrícula + 1 cuota de $ 9.108.
– Cuota 2: $ 6.831.
– Cuota 3: $ 6.831.
Residentes en el exterior:
- Curso completo: U$S 435.
- Pago único, 10 % desc: U$S 391.10.
- Pago en cuotas:
– Matrícula + 1 cuota de U$S 174
– Cuota 2: U$S 130.50.
– Cuota 3: U$S 130.5
Ver modalidades de pago https://www.flacso.org.ar/pagos
Informes
FLACSO Argentina
Tucumán 1966, CABA, Argentina.
Centro de Estadística e Informática Aplicada
Asistente técnica: Marcela López.
Teléfono: (54-11) 5238-9300 interno 475.
Horario de atención: lunes, miércoles y viernes de 15:30 a 19:30 hs.
E-mail: ceia@flacso.org.ar
Atención por Whatsapp: +54 9 11-3258-2856.