Analítica espacial a gran escala con Python y Spark

Capacitador

Hugo Porras, MSc.

Ingeniero en ciencias económicas y financieras de la Escuela Politécnica Nacional y máster en inteligencia artificial de la Universidad Internacional de la Rioja. Tiene 4 años de experiencia como científico de datos y 6 en el área de investigación.

Actualmente se desempeña como Científico de Datos Senior en Banco Pichincha. Trabaja además como consultor e investigador independiente en temas relacionados a finanzas de bienes raíces, economía del bienestar, economía geográfica e IA aplicada a las ciencias sociales.

Categorías: ,

En algunos casos, el procesamiento de grandes cantidades de datos que se relacionan al análisis espacial puede ser complicado debido al requerimiento de recursos computacionales. Es por ello que hoy en día el uso combinado de frameworks como Apache Spark y Python es una alternativa útil y rápida para el cómputo distribuido.

En este curso aprenderás el uso de GeoPandas para la lectura de datos espaciales y su conexión a PySpark con el objetivo de realizar análisis geográfico. Además, aprenderás a usar Apache Sedona (a través de su API en Python) para manejar datos espaciales directamente en PySpark.

Contenido:

  • Introducción a los shapefiles
    • Archivos SHP en Python
    • Paquetes necesarios para la visualización geográfica en python
    • Lectura de geometrías
    • Lectura de registros
  • GeoPandas y Spark
    • Introducción a GeoPandas
    • Introducción a pyspark
    • Formatos: Well Known Text (WKT) y Well Known Binary (WKB)
    • Uso de GeoPandas y pyspark 
  • Caso práctico