El curso Building Batch Data Analytics Solutions on AWS lo ayudará a aprender cómo crear soluciones de análisis de datos por lotes con Amazon EMR para optimizar los costos y el rendimiento.

lo que aprenderás
Compare las características y los beneficios de los almacenes de datos, los lagos de datos y las arquitecturas de datos modernas
Diseñar e implementar una solución de análisis de datos por lotes
Identificar y aplicar técnicas adecuadas, incluida la compresión, para optimizar el almacenamiento de datos.
Seleccione e implemente las opciones apropiadas para ingerir, transformar y almacenar datos

Quién debería tomar este curso
Ingenieros de plataformas de datos
Arquitectos y operadores que construyen y administran canalizaciones de análisis de datos

Que experiencia necesitarás
Los estudiantes con una experiencia mínima de un año en la gestión de marcos de datos de código abierto como Apache Spark o Apache Hadoop se beneficiarán de este curso.
Sugerimos el curso de Fundamentos de AWS Hadoop para aquellos que necesitan un repaso en Apache Hadoop
Recomendamos que los asistentes a este curso tengan:
Haber completado AWS Technical Essentials o Architecting on AWS
y  Creación de lagos de datos en AWS o Primeros pasos con AWS Glue

Descripción del curso
En este curso, aprenderá a crear soluciones de análisis de datos por lotes con Amazon EMR, una solución de nivel empresarial.
Servicio gestionado Apache Spark y Apache Hadoop. Aprenderá cómo Amazon EMR se integra con
proyectos de código abierto como Apache Hive, Hue y HBase, y con servicios de AWS como AWS Glue y
Formación del lago AWS. El curso aborda la recopilación, ingesta, catalogación, almacenamiento y procesamiento de datos.
componentes en el contexto de Spark y Hadoop. Aprenderá a usar EMR Notebooks para admitir ambos
Cargas de trabajo de análisis y aprendizaje automático. También aprenderá a aplicar la seguridad, el rendimiento y el costo.
mejores prácticas de gestión para el funcionamiento de Amazon EMR.
• Nivel del curso: Intermedio

Duración:
8 horas

Objetivos del Curso

• Comparar las características y los beneficios de los almacenes de datos, los lagos de datos y las arquitecturas de datos modernas
• Diseñar e implementar una solución de análisis de datos por lotes
• Identificar y aplicar técnicas adecuadas, incluida la compresión, para optimizar el almacenamiento de datos
• Seleccionar e implementar opciones apropiadas para ingerir, transformar y almacenar datos
• Elija la instancia y los tipos de nodos, los clústeres, el escalado automático y la topología de red adecuados para una
caso de uso comercial particular
• Comprender cómo el almacenamiento y procesamiento de datos afectan los mecanismos de análisis y visualización.
necesario para obtener información empresarial procesable
• Datos seguros en reposo y en tránsito
• Supervise las cargas de trabajo de análisis para identificar y solucionar problemas
• Aplicar las mejores prácticas de gestión de costos