Building Batch Data Analytics Solutions on AWS

      El curso Building Batch Data Analytics Solutions on AWS lo ayudará a aprender cómo crear soluciones de análisis de datos por lotes con Amazon EMR para optimizar los costos y el rendimiento.

      lo que aprenderás

      Compare las características y los beneficios de los almacenes de datos, los lagos de datos y las arquitecturas de datos modernas
      Diseñar e implementar una solución de análisis de datos por lotes
      Identificar y aplicar técnicas adecuadas, incluida la compresión, para optimizar el almacenamiento de datos.
      Seleccione e implemente las opciones apropiadas para ingerir, transformar y almacenar datos

      Quién debería tomar este curso

      Ingenieros de plataformas de datos
      Arquitectos y operadores que construyen y administran canalizaciones de análisis de datos

      Que experiencia necesitarás

      Los estudiantes con una experiencia mínima de un año en la gestión de marcos de datos de código abierto como Apache Spark o Apache Hadoop se beneficiarán de este curso.
      Sugerimos el curso de Fundamentos de AWS Hadoop para aquellos que necesitan un repaso en Apache Hadoop
      Recomendamos que los asistentes a este curso tengan:
      Haber completado AWS Technical Essentials o Architecting on AWS
      y  Creación de lagos de datos en AWS o Primeros pasos con AWS Glue

      Descripción del curso

      En este curso, aprenderá a crear soluciones de análisis de datos por lotes con Amazon EMR, una solución de nivel empresarial.
      Servicio gestionado Apache Spark y Apache Hadoop. Aprenderá cómo Amazon EMR se integra con
      proyectos de código abierto como Apache Hive, Hue y HBase, y con servicios de AWS como AWS Glue y
      Formación del lago AWS. El curso aborda la recopilación, ingesta, catalogación, almacenamiento y procesamiento de datos.
      componentes en el contexto de Spark y Hadoop. Aprenderá a usar EMR Notebooks para admitir ambos
      Cargas de trabajo de análisis y aprendizaje automático. También aprenderá a aplicar la seguridad, el rendimiento y el costo.
      mejores prácticas de gestión para el funcionamiento de Amazon EMR.
      • Nivel del curso: Intermedio

      Duración:

      8 horas

      Objetivos del Curso

      • Comparar las características y los beneficios de los almacenes de datos, los lagos de datos y las arquitecturas de datos modernas
      • Diseñar e implementar una solución de análisis de datos por lotes
      • Identificar y aplicar técnicas adecuadas, incluida la compresión, para optimizar el almacenamiento de datos
      • Seleccionar e implementar opciones apropiadas para ingerir, transformar y almacenar datos
      • Elija la instancia y los tipos de nodos, los clústeres, el escalado automático y la topología de red adecuados para una
      caso de uso comercial particular
      • Comprender cómo el almacenamiento y procesamiento de datos afectan los mecanismos de análisis y visualización.
      necesario para obtener información empresarial procesable
      • Datos seguros en reposo y en tránsito
      • Supervise las cargas de trabajo de análisis para identificar y solucionar problemas
      • Aplicar las mejores prácticas de gestión de costos

       

      27 mayo, 2022

      Empower

      La misión de Ulearn es brindar soluciones de capacitación para profesionales de TI, que se traduzca en optimización de sus habilidades para una mayor eficiencia.

      CUTI

      mail [email protected]
      tel
      +598 99 550100

      Redes Sociales

      linkedin linkedin
      top