DURACIÓN – 16 horas

Introduce una serie de prácticas para mejorar la confiabilidad del servicio mediante una

mezcla de automatización, métodos de trabajo y reestructuración de la empresa.

Adaptado a quienes se centran en la disponibilidad de servicios a gran escala.

.

DESCRIPCION

El curso SRE (ingenieria de confiablidad del sitio) Foundation es una introducción a los

principios y prácticas que permiten a una empresa escalar servicios críticos de manera

confiable y económica. La introducción de una dimensión de confiabilidad del sitio

requiere reestructuración organizacional, un nuevo enfoque en ingeniería y

automatización, y la adopción de una variedad de nuevos paradigmas de trabajo.

El curso destaca la evolución de la SRE y su dirección futura, y prepara a los participantes

con las prácticas, métodos y herramientas para involucrar a las personas de toda la

empresa que participan en la confiabilidad y la estabilidad, lo que se evidencia mediante

el uso de escenarios y casos reales. Una vez finalizado el curso, los participantes

dispondrán de elementos tangibles que podrán aplicar en su puesto de trabajo, como la

comprensión, el establecimiento y el seguimiento de los objetivos de nivel de servicio

(SLOs).

El curso fue desarrollado utilizando fuentes claves de la SRE, interactuando con líderes de

opinión en el espacio de la SRE y trabajando con empresas que adoptan la SRE para

extraer las mejores prácticas de la vida real. El curso ha sido diseñado para enseñar los

principios y prácticas claves necesarios para iniciar la adopción de la SRE.

Este curso capacita a los estudiantes para completar con éxito el examen de certificación

SRE Foundation.

OBJETIVOS DEL CURSO

Los objetivos de aprendizaje para el curso SRE Foundation incluyen una comprensión

práctica de:

La historia de la SRE y su aparición en Google

La interrelación de la SRE con DevOps y otros frameworks conocidos

Los principios detrás de la SRE

Objetivos de nivel de servicio (SLOs) y su enfoque en el usuario Indicadores de nivel de servicio (SLIs) y el panorama de monitoreo actual

Presupuestos de error y las políticas asociadas

Trabajo desgastante (Toil) y su efecto en la productividad de una empresa

Pasos prácticos para eliminar el Toil

Observabilidad como algo que indica la salud de un servicio

Herramientas de la SRE, técnicas de automatización y la importancia de la

seguridad

Antifragilidad, nuestro enfoque de las pruebas de fallos y de los errores

El impacto organizacional que implica implementar la SRE

AUDIENCIA

El público objetivo para el curso SRE Foundation son profesionales que incluyen:

Personas que inicien o lideren un movimiento hacia una mayor confiabilidad

Personas interesadas en el liderazgo actual de las TI y en los enfoques del cambio

organizacional

Gerentes de negocios

Stakeholders de negocios

Agentes de cambio

Consultores

Profesionales de DevOps

Directores TI

Gerentes de TI

Líderes de equipo de TI

Propietarios de productos

Scrum Masters

Ingenieros de software

Ingenieros de confiabilidad del sitio

Integradores de sistemas

Proveedores de herramientas

MATERIALES DE APRENDIZAJE

Dieciséis (16) horas de capacitación dirigida por instructores y facilitación de

ejercicios

Manual del estudiante (excelente referencia para después de la clase)

Participación en ejercicios únicos diseñados para aplicar los conceptos

Ejemplos de documentos, plantillas, herramientas y técnicas

Acceso a recursos adicionales de valor añadido y comunidadesPREREQUISITOS

Se espera que los participantes entiendan y conozcan la terminología y los

conceptos comunes de DevOps y que tengan una experiencia laboral

relacionada.

EXAMEN DE CERTIFICACIÓN

Aprobar con éxito (65%) el examen de 60 minutos, que consta de 40 preguntas de

opción múltiple, permite recibir el certificado SRE (Site Reliability Engineering)

Foundation. La certificación está regulada y gestionada por el DevOps Institute.

CONTENIDO

Introducción al curso

Objetivos del curso

Agenda del curso

Módulo 1: principios y prácticas de la SRE

¿Qué es la Site Reliability Engineering?

SRE y DevOps: ¿Cuál es la diferencia?

Principios y prácticas de la SRE

Módulo 2: objetivos de nivel de servicio y presupuestos de error

Objetivos de nivel de servicio (SLOs)

Presupuestos de error

Políticas sobre los presupuestos de error

Módulo 3: reducir el trabajo desgastante (Toil)

¿Qué es el Toil?

¿Por qué es malo el Toil?

Hacer algo para evitar el Toil

Módulo 4: monitoreo e indicadores de nivel de servicio

Indicadores de nivel de servicio (SLIs)

Monitoreo

Observabilidad

Módulo 5: herramientas de la SRE y automatización

Definición de automatización

Enfoque de la automatización

Estructura de los tipos de automatización

Garantía de la automatización

Herramientas de automatización

Módulo 6: antifragilidad y aprender del error

Por qué aprender del error Beneficios de la antifragilidad

Cambiar el equilibrio organizacional

Módulo 7: impacto organizacional de la SRE

Por qué las organizaciones implementan la SRE

Patrones para implementar la SRE

Necesidades de turno (on-call)

Post mortem sin culpa

Escalamiento y SRE

Módulo 8: SRE, otros frameworks, el futuro

SRE y otros frameworks

El futuro

Fuentes adicionales de información

Preparación del examen

Requisitos del examen, ponderación de las preguntas y lista de

terminología

Ejemplo de examen

ver calendario