Analítica espacial a gran escala con Python y Spark

En algunos casos, el procesamiento de grandes cantidades de datos que se relacionan al análisis espacial puede ser complicado debido al requerimiento de recursos computacionales. Es por ello que hoy en día el uso combinado de frameworks como Apache Spark y Python es una alternativa útil y rápida para el cómputo distribuido. En este curso aprenderás el uso de GeoPandas para la lectura de datos espaciales y su conexión a PySpark con el objetivo de realizar análisis geográfico. Además, aprenderás a usar Apache Sedona (a través de su API en Python) para manejar datos espaciales directamente en PySpark.

Contenido

  • Introducción a los shapefiles
    • Archivos SHP en Python
    • Paquetes necesarios para la visualización geográfica en python
    • Lectura de geometrías
    • Lectura de registros
  • GeoPandas y Spark
    • Introducción a GeoPandas
    • Introducción a pyspark
    • Formatos: Well Known Text (WKT) y Well Known Binary (WKB)
    • Uso de GeoPandas y pyspark
  • Caso práctico