Orador: Fernando Gonzalez Prada
Apache Spark es la plataforma líder para procesar big data, y es el componente clave de Azure Databricks, Azure Synapse Analytics y SQL Server 2019 Big Data Clusters. En este webinar te contaremos cómo usar tus conocimientos de SQL para iniciarte en Spark y big data. Usaremos SQL para procesar datos tanto en modo batch como en streaming!
Requerimiento: conocimientos de lenguaje SQL.
Temario
- Dataframes y Spark SQL
- Manipulación de registros corruptos
- Análisis exploratorio de datos
- Spark Structured Streaming