Big Data on AWS

      Big Data on AWS, le presenta soluciones de big data basadas en la nube como Amazon Elastic MapReduce (EMR), Amazon Redshift, Amazon Kinesis y el resto de la plataforma de big data de AWS. En este curso, le mostramos cómo utilizar Amazon EMR para procesar datos mediante el amplio ecosistema de herramientas de Hadoop, como Hive y Hue. También le enseñamos cómo crear entornos de big data, trabajar con Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena y Amazon Kinesis, y aprovechar las mejores prácticas para diseñar entornos de big data para seguridad y rentabilidad.

      Duración

      24 horas

       

      Público objetivo

      Este curso está destinado a:

      Personas responsables de diseñar e implementar soluciones de big data, a saber, arquitectos de soluciones y administradores de SysOps. Arquitectos de seguridad
      Científicos de datos y analistas de datos interesados ​​en aprender sobre soluciones de big data en AWS.

       

      Objetivos del curso

      Este curso te enseña cómo:

      Ajuste las soluciones de AWS dentro de un ecosistema de big data
      Aproveche Apache Hadoop en el contexto de Amazon EMR
      Identificar los componentes de un clúster de Amazon EMR
      Lanzar y configurar un clúster de Amazon EMR
      Aproveche los marcos de programación comunes disponibles para Amazon EMR, incluidos Hive, Pig y Streaming.
      Hue para mejorar la facilidad de uso de Amazon EMR
      Use análisis en memoria con Spark en Amazon EMR
      Elija las opciones de almacenamiento de datos de AWS adecuadas
      Identificar los beneficios de usar Amazon Kinesis para el procesamiento de big data casi en tiempo real
      Amazon Redshift para almacenar y analizar datos de manera eficiente
      Comprenda y administre los costos y la seguridad para una solución de big data
      Identificar opciones para ingerir, transferir y comprimir datos
      Amazon Athena para el análisis de consultas ad-hoc
      AWS Glue para automatizar las cargas de trabajo de ETL.
      Use software de visualización para representar datos y consultas con Amazon QuickSight
      Organice flujos de trabajo de big data con AWS Data Pipeline

       

       

      requisitos previos

      Recomendamos que los asistentes a este curso cuenten con los siguientes requisitos previos:

      Familiaridad básica con las tecnologías de big data, incluidas las consultas Apache Hadoop, HDFS y SQL/NoSQL.
      Los estudiantes deben completar la capacitación basada en la web Fundamentos de la tecnología de Big Data o tener una experiencia equivalente.
      Conocimiento práctico de los servicios básicos de AWS y la implementación de la nube pública.
      Los estudiantes deben completar el curso de AWS Essentials o tener una experiencia equivalente.
      Comprensión básica de almacenamiento de datos, sistemas de bases de datos relacionales y diseño de bases de datos.

       

      Método de entrega

      Este curso se imparte a través de [una combinación de]:

      Formación en el aula
      laboratorios prácticos
      Actividad práctica

      Este curso le permite probar nuevas habilidades y aplicar el conocimiento a su entorno de trabajo a través de una variedad de ejercicios prácticos.

       

      Esquema del curso

      Este curso cubre los siguientes conceptos en cada día:

      Primer día

      Descripción general de los grandes datos
      Ingestión
      Transmisión de Big Data y Amazon Kinesis
      Uso de Kinesis para transmitir y analizar registros del servidor Apache
      Soluciones de almacenamiento
      Consulta de Big Data con Amazon Athena
      Amazon Athena para analizar datos de registro
      Introducción a Apache Hadoop y Amazon EMR

      Segundo día

      Uso de Amazon Elastic MapReduce
      Almacenamiento y consulta de datos en DynamoDB
      Marcos de programación de Hadoop
      Procesamiento de registros del servidor con Hive en Amazon EMR
      Optimización de su experiencia de Amazon EMR con Hue
      Ejecución de secuencias de comandos Pig en Hue en Amazon EMR
      Amazon EMR
      Procesamiento del conjunto de datos de taxis de Nueva York con Spark en Amazon EMR

      Tercer día

      Uso de AWS Glue para automatizar cargas de trabajo de ETL
      Amazon Redshift y Big Data
      Visualización y orquestación de Big Data
      Administración de costos de Amazon EMR
      Asegurar las soluciones de Big Data
      Patrones de diseño de Big Data

      Ver calendario

      18 mayo, 2020

      Empower

      La misión de Ulearn es brindar soluciones de capacitación para profesionales de TI, que se traduzca en optimización de sus habilidades para una mayor eficiencia.

      CUTI

      mail [email protected]
      tel
      +598 99 550100

      Redes Sociales

      linkedin linkedin
      top