Ciencia de Datos para Ciencias Sociales y Políticas Públicas. Casos y Aplicaciones en Python


Presentación

El Centro de Estadística e Informática Aplicada (CEIA) ofrece cursos de iniciación y de actualización en técnicas específicas de estadística e informática, entre ellos el curso: Ciencia de Datos para Ciencias Sociales y Políticas Públicas. Casos y Aplicaciones en Python.

Dirección y cuerpo docente:

Coordinador: Joon Hee Bang.
Comité Ejecutivo CEIA: Luis Acosta, Natalia Apel, Joon Hee Bang, María Ferraro, Mirta Judengloben.
Docente: Luciano Casiraghi.

La Ciencia de Datos va expandiendo su contribución a las ciencias sociales y a las políticas públicas. Si bien hay muchas preguntas prácticas, técnicas y éticas asociadas con esta tendencia, este curso se centra en la aplicación práctica de los métodos, herramientas, técnicas y habilidades de la Ciencia de Datos, aplicados al campo de las ciencias sociales y las políticas públicas.

La Ciencia de Datos permite encarar todos estos desafíos para investigadores de ciencias sociales y funcionarios públicos, no solo por el tamaño de los conjuntos de datos que se generan, sino también en la naturaleza cambiante de los datos y su capacidad de respuesta que ofrece poder contar con resultados en tiempo real. Todo esto sin restar importancia a que la aplicación de la Ciencia de Datos, también puede representar desafíos éticos y prácticos significativos, entre los que destaca el creciente predominio de la política basada en datos y el efecto de la medición sobre el comportamiento en la esfera pública.


Objetivos

Este curso brinda las herramientas metodológicas y técnicas necesarias para poder abordar el análisis de grandes volúmenes de datos enfocados en las Ciencias Sociales y las Políticas Públicas, buscando la complementariedad con las herramientas y técnicas más tradicionales.

Objetivos Específicos

  • Conocer el estado del arte de la Ciencia de Datos en relación con las Ciencias Sociales y las Políticas Públicas.
  • Entender los diferentes abordajes, ejes temáticos y capacidad para la generación y/o captación de información en Ciencias Sociales y Políticas Públicas
  • Dar a conocer las herramientas existentes y aplicarlas en casos prácticos.
  • Desarrollar habilidades para aplicar tecnologías como Python aplicadas al análisis de casos prácticos.
  • Conocer los debates actuales alrededor de los grandes volúmenes de datos y su impacto en las Ciencias Sociales y las Políticas Públicas.

Público objetivo

El público objetivo de este curso será diverso, lo que permitirá el surgimiento de preguntas interesantes y estrategias compartidas como ser los desafíos de la recopilación y análisis que involucran conjuntos de datos grandes y “nuevos”; almacenamiento, acceso y publicación de grandes conjuntos de datos; generación de nuevas hipótesis y nuevas formas de datos; nuevas habilidades que se requieren de los investigadores para crear nuevos conocimientos y aplicaciones con ciencia de datos y participación con los responsables políticos.

El curso está destinado a investigadores y a alumnos de posgrado de ciencias sociales interesados o involucrados con estudios de corte cuantitativo, así como a consultores y funcionarios de áreas de gobierno que manejan grandes volúmenes de datos.

El diseño del curso ha considerado la heterogeneidad de los participantes basada en las diferentes formaciones de base y la dispersión en relación a la experiencia con estudios cuantitativos. A partir de esto, se han organizado los contenidos bajo el supuesto de un nivel básico para todos los participantes, incrementando la complejidad de los mismos de forma gradual para poder finalmente considerar todos los contenidos previstos de forma conjunta.


Contenidos

Unidad 1: El concepto de CIENCIA DE DATOS: antecedentes y actualidad.

  • Evolución histórica del concepto.
  • Diferencias entre los diferentes conceptos de Data Mining, Business Intelligence, Data Lake, Big Data.
  • Debates actuales.
  • Introducción de la utilización de la CIENCIA DE DATOS en las Ciencias Sociales


Unidad 2: Ejes Temáticos

  • Gente y lugar – Ubicación y datos geoespaciales
  • Las redes sociales en las ciencias sociales y políticas
  • Datos Abiertos, Datos Públicos. Enlace, búsqueda y análisis


Unidad 3: Nuevas herramientas y métodos a partir de CIENCIA DE DATOS. La importancia del modelado de datos

  • Introducción al modelado de datos y programación
  • Cómo y dónde encontrar DATA
  • Herramientas básicas para explotar DATA
  • Software y Herramientas Analíticas
  • Introduciendo R, Python, Power BI y otras herramientas.


Unidad 4: Aplicación a Casos de Estudio

  • Salud
  • Cambio Climático
  • Género
  • Otros

Bibliografía

Autor Título Editorial Año
Becerra, Gastón Big data como objeto de estudio y método para la investigación empírica en sociología y psicología social STS,  Simposio Argentino sobre Tecnología y Sociedad 2018
Birkin, Mark Big Data for Social ScienceResearch UbiquitySymposium 2018
Del Tell Escolar, Luis Límite(s) de los estudios Big Data Universidad Complutense de Madrid 2016
Downey, Allen Think Python – How to ThinkLike a ComputerScientist Green Tea PressNeedham, Massachusetts 2012
Fazekas, Mihaly The Use of ‘Big Data’ for Social SciencesResearch: AnApplication to CorruptionResearch University of Cambridge and CorruptionResearch Center Budapest 2014
Gutierrez-Puebla, Javier Big (Geo)Data en Ciencias Sociales: Retos y Oportunidades Revista de Estudios Andaluces 2016
Hernández-Leal,  Duque-Méndez, Moreno-Cadavid Big Data: una exploración de  investigaciones, tecnologías y casos de aplicación TecnoLógicas, vol. 20, no. 39, mayo – agosto, 2017 2017
Leek, Jeff TheElementsofDataAnalyticStyle Leanpub 2015
Liou, Tao, Lin THE DATA ANALYTICS – handbook DATA ANALYSTS + DATA SCIENTISTS 2018
Paliotta , Achille Pierre NUEVAS PROFESIONES Y TÉCNICAS DE WEB DATA MINING EN ARGENTINA: EL CASO DEL DATA SCIENTIST Revista del Centro de Estudios de Sociología del Trabajo, Nº 1O, pp 97-113 2018
Patil& Mason Data Driven – Creating a Data Culture O`Reilly Media 2015
Patil, Dj Building Data ScienceTeams O`Reilly Media 2011
Peng, Roger R Programmingfor Data Science Leanpub 2018
Shashua, Amnon Introduction to Machine Learning School of ComputerScience and EngineeringTheHebrewUniversity of JerusalemJerusalem, Israel 2008
Stanton, Jeffrey Introduction to Data Science Syracuse University 2013
Steele, Julie UnderstandingtheChief Data Officer O`Reilly Media 2015
Stuetzer, Welker, Egger Computational  Social Science in theAge of Big Data neueschriftenzur online-forschung 2018

 

CASOS

Autor Título Editorial Año
Faghmous&Kumar A BIG DATA GUIDE TO UNDERSTANDING CLIMATE CHANGE Department of ComputerScience and Engineering, TheUniversity of Minnesota–Twin Cities 2014
Natsumi S. Shokida La desigualdad de género se puede medir FLACSO 2018
Racine, Valerie Big Data Case Study: Big Data &ConservationBiology Onlineethics.org 2017
Racine, Valerie Big Data &Neuroscience Onlineethics.org 2017
Racine, Valerie Big Data &PublicHealth Onlineethics.org 2017
Racine, Valerie Big Data &GeneticPrivacy: Re-identification of Anonymized Data Onlineethics.org 2017

Cursada y carga horaria

Modalidad a distancia (sincrónico)
Fecha de inicio: 25 de marzo de 2024.
Fecha de fin: 10 de junio de 2024.
Día/horario de cursada: lunes de 17 a 20hs.
Cantidad de clases: 12 (36 hs).

Modalidad de evaluación

La evaluación final consistirá en un trabajo final integrador individual a ser realizado en el hogar. En esta instancia se evaluará tanto la lectura y comprensión de la bibliografía obligatoria como así también las capacidades de aplicación de los contenidos, herramientas y metodologías del curso.

Certificación otorgada

Se otorgará un certificado de asistencia y aprobación del curso una vez aprobado el trabajo final integrador individual. Se prevé un certificado de asistencia para aquellos que cumplan el requisito del 75% de asistencia y que aprueben la evaluación.


Inscripción

-INSCRIPCIÓN CERRADA-

Requisitos para el ingreso

Si bien no se requieren conocimientos previos de programación, ya que el curso está diagramado para que el participante pueda iniciarse en conocer la temática de Big Data aplicada a las Ciencias Sociales y a las Políticas Públicas, es importante tener conocimiento básico de estadística, así como también un manejo básico de excel.

Asimismo, es necesario que el participante pueda contar con PC o Notebook con acceso a internet para poder instalar algunas de las herramientas que se utilizarán durante el curso.

  1. Poseer un título universitario o terciario de 4 años de duración
  2. Leer / comprender inglés


Pasos para realizar la inscripción

Los alumnos se considerarán inscriptos en el curso sólo cuando hayan cumplido los siguientes requisitos antes de la fecha de cierre de inscripción:

  1. Completar el formulario de pre-inscripción.
  2. Entregar fotocopia del DNI (1º y 2º hoja).
  3. Entregar fotocopia del título universitario o terciario de 4 años de duración.


ARANCEL

Residentes en Argentina:

  1. Curso completo: $ 72.000.
  2. Pago único, 10 % desc: $ 64.800.
  3. Pago en cuotas:
    – Matrícula + 1 cuota de $ 28.800.
    – Cuota 2: $ 21.600.
    – Cuota 3: $ 21.600.


Residentes en el exterior:

  1. Curso completo: U$S 550.
  2. Pago único, 10 % desc: U$S 495.
  3. Pago en cuotas:
    – Matrícula + 1 cuota de U$S 220.
    – Cuota 2: U$S 165.
    – Cuota 3: U$S 165.


Ver modalidades de pago https://www.flacso.org.ar/pagos


Informes

Centro de Estadística e Informática Aplicada
Responsable administrativa: Marcela López.
E-mail: ceia@flacso.org.ar
  Atención por Whatsapp: +54 9 11-3258-2856.