IELE756 Preparación y Análisis de Datos [en español]
Spring 2025

[ NOTA: Decidí cambiar esta página al español completamente. ]

Políticas

  • Habrá un conjunto de problemas semanal, hasta un total de 5, más una "Tarea 0", que consiste en instalar y ejecutar las herramientas de software.
  • Política de entregas atrasadas. Puedes solicitar una extensión de hasta dos días en cualquier conjunto de problemas enviando un correo al email del equipo en Canvas antes de la fecha de entrega, explicando tu situación (carga de trabajo, viaje, enfermedad, resaca, etc.); tales solicitudes razonables serán aprobadas.
  • Política de colaboración. La ciencia no se hace en aislamiento; se trabajará en equipos de 2 o 3 personas, como en laboratorios de investigación reales. Haré que la lista de regiones esté disponible cuando todos se hayan registrado. Se les asignarán regiones mediante el código disponible aquí (con una seed diferente). En conjunto construirán un modelo desde cero usando datos reales para predecir cuándo y dónde podrían surgir nuevos brotes de ciertas enfermedades en Chile. Puedes usar tanto ChatGPT como quieras, pero todos los integrantes del equipo deben comprender y ser capaces de reproducir cada parte del entregable. Las herramientas de IA pueden ayudar, pero en última instancia ustedes son responsables de todo el trabajo entregado y de su corrección.
  • Evaluación. Las entregas deben hacerse a través de la página de Canvas y consistir en un documento PDF compilado. Las notas y comentarios se publicarán en Canvas.
  • Los problemas serán calificados en una escala de 0 a 9
  • Las fechas de entrega son generalmente a las 11:59am (mediodía) en el día especificado (típicamente los lunes y 7 días después de la publicación, pero hay excepciones, dependiendo de cómo sea la tarea).

Conjuntos de problemas tentativos con objetivos

Tema central: Predicción de enfermedades no transmisibles: cómo la temporada de floración afecta las alergias en Chile.

Formato: trabajo grupal, con división por regiones de Chile.

Intro: Esta sección presenta un conjunto tentativo de Problem Sets (PSETs) diseñados para guiar el proyecto grupal del curso. Cada tarea incluye un objetivo general y objetivos específicos que avanzan de manera progresiva desde la manipulación de datos espaciales básicos hasta la construcción de modelos espacio-temporales bayesianos para predecir la incidencia de alergias en la Región Metropolitana de Chile. El propósito es que las y los estudiantes integren datos demográficos, ambientales, agrícolas y epidemiológicos utilizando Python, desarrollando competencias tanto técnicas como analíticas en el proceso.

  • Tarea 1: Población, Territorio y Datos Satelitales
    • Objetivo General: Aprender a trabajar con datos espaciales y demográficos en Python.
    • Objetivos específicos:
      1. Construir mapas coropléticos de población por comuna.
      2. Integrar fuentes oficiales (Censo/INE) con proxies satelitales (luces nocturnas VIIRS).
      3. Calcular correlaciones básicas entre población y proxies.
      4. Familiarizarse con `geopandas`, `pandas`, `matplotlib`, `rasterio`, `rasterstats`.
  • Tarea 2: Variables Ambientales y Clima Local
    • Objetivo General: Introducir el monitoreo ambiental y su relación con la salud.
    • Objetivos específicos:
      1. Descargar y procesar variables climáticas (temperatura, humedad, precipitación) desde ERA5.
      2. Incorporar contaminantes atmosféricos (NO₂, O₃, SO₂) de Sentinel-5P.
      3. Asociar estas capas a las comunas asignadas mediante zonal statistics.
      4. Generar un reporte gráfico que muestre la variación espacial de clima y contaminación en la RM.
  • Tarea 3: Floración y Producción Agrícola
    • Objetivo General: Analizar la relación entre agricultura, vegetación y exposición a pólenes.
    • Objetivos específicos:
      1. Incorporar datos de cosechas agrícolas (INE) y asignarlos a comunas.
      2. Calcular índices de vegetación (NDVI, SAVI, NDWI) con imágenes satelitales.
      3. Identificar períodos de mayor floración y su localización espacial.
      4. Comparar patrones agrícolas con variables ambientales de la Tarea 2.
  • Tarea 4: Datos Epidemiológicos y Modelos de Regresión
    • Objetivo General: Conectar la información ambiental y agrícola con resultados en salud.
    • Objetivos específicos:
      1. Integrar hospitalizaciones por enfermedades respiratorias/alérgicas (MINSAL).
      2. Combinar con datos socioeconómicos (CASEN, Censo).
      3. Construir regresiones de conteo (Poisson/NegBin) con offsets poblacionales.
      4. Evaluar interacciones (ej. contaminación × vegetación).
  • Tarea 5: Modelos Espacio-Temporales Bayesianos
    • Objetivo General: Implementar modelos jerárquicos para predecir la carga de alergias.
    • Objetivos específicos:
      1. Especificar modelos CAR o BYM2 que consideren dependencia espacial entre comunas.
      2. Incluir efectos temporales (caminatas aleatorias, distributed lag).
      3. Usar `bambi` o `pymc` para ajustar los modelos.
      4. Integrar todas las capas (población, clima, contaminación, agricultura, salud).
      5. Generar mapas de riesgo con intervalos de credibilidad.

Problem sets

# Release Due date PSET Solution Title
1 2025-09-15 2025-10-03 MD TBA Población, Territorio y Datos Satelitales
2 2025-09-29 TBA MD TBA Variables Ambientales y Clima Local
3     MD TBA Floración y Producción Agrícola
4     MD TBA Datos Epidemiológicos y Modelos de Regresión
5     MD TBA Modelos Espacio-Temporales Bayesianos

Esta tabla organiza las tareas del curso. Cada fila corresponde a una tarea, con su calendario, enlaces y título. Úsala para saber cuándo se publican, cuándo vencen y dónde encontrar los archivos.

  • #: Número secuencial de la tarea, comenzando en 0.
  • Release: Fecha en que la tarea se publica y queda disponible.
  • Due date: Fecha límite para entregar la tarea.
  • PSET: Enlaces al enunciado de la tarea en Markdown (.md) y PDF (.pdf).
  • Solution: Enlaces a los archivos con la solución (actualmente marcados como TBA).
  • Title: Título de la tarea (en español para los estudiantes).

Go to the course's home or to my website.