DURACIÓN – 16 horas
Introduce una serie de prácticas para mejorar la confiabilidad del servicio mediante una
mezcla de automatización, métodos de trabajo y reestructuración de la empresa.
Adaptado a quienes se centran en la disponibilidad de servicios a gran escala.
.
DESCRIPCION
El curso SRE (ingenieria de confiablidad del sitio) Foundation ℠ es una introducción a los
principios y prácticas que permiten a una empresa escalar servicios críticos de manera
confiable y económica. La introducción de una dimensión de confiabilidad del sitio
requiere reestructuración organizacional, un nuevo enfoque en ingeniería y
automatización, y la adopción de una variedad de nuevos paradigmas de trabajo.
El curso destaca la evolución de la SRE y su dirección futura, y prepara a los participantes
con las prácticas, métodos y herramientas para involucrar a las personas de toda la
empresa que participan en la confiabilidad y la estabilidad, lo que se evidencia mediante
el uso de escenarios y casos reales. Una vez finalizado el curso, los participantes
dispondrán de elementos tangibles que podrán aplicar en su puesto de trabajo, como la
comprensión, el establecimiento y el seguimiento de los objetivos de nivel de servicio
(SLOs).
El curso fue desarrollado utilizando fuentes claves de la SRE, interactuando con líderes de
opinión en el espacio de la SRE y trabajando con empresas que adoptan la SRE para
extraer las mejores prácticas de la vida real. El curso ha sido diseñado para enseñar los
principios y prácticas claves necesarios para iniciar la adopción de la SRE.
Este curso capacita a los estudiantes para completar con éxito el examen de certificación
SRE Foundation.
OBJETIVOS DEL CURSO
Los objetivos de aprendizaje para el curso SRE Foundation incluyen una comprensión
práctica de:
● La historia de la SRE y su aparición en Google
● La interrelación de la SRE con DevOps y otros frameworks conocidos
● Los principios detrás de la SRE
● Objetivos de nivel de servicio (SLOs) y su enfoque en el usuario● Indicadores de nivel de servicio (SLIs) y el panorama de monitoreo actual
● Presupuestos de error y las políticas asociadas
● Trabajo desgastante (Toil) y su efecto en la productividad de una empresa
● Pasos prácticos para eliminar el Toil
● Observabilidad como algo que indica la salud de un servicio
● Herramientas de la SRE, técnicas de automatización y la importancia de la
seguridad
● Antifragilidad, nuestro enfoque de las pruebas de fallos y de los errores
● El impacto organizacional que implica implementar la SRE
AUDIENCIA
El público objetivo para el curso SRE Foundation son profesionales que incluyen:
● Personas que inicien o lideren un movimiento hacia una mayor confiabilidad
● Personas interesadas en el liderazgo actual de las TI y en los enfoques del cambio
organizacional
● Gerentes de negocios
● Stakeholders de negocios
● Agentes de cambio
● Consultores
● Profesionales de DevOps
● Directores TI
● Gerentes de TI
● Líderes de equipo de TI
● Propietarios de productos
● Scrum Masters
● Ingenieros de software
● Ingenieros de confiabilidad del sitio
● Integradores de sistemas
● Proveedores de herramientas
MATERIALES DE APRENDIZAJE
Dieciséis (16) horas de capacitación dirigida por instructores y facilitación de
ejercicios
Manual del estudiante (excelente referencia para después de la clase)
Participación en ejercicios únicos diseñados para aplicar los conceptos
Ejemplos de documentos, plantillas, herramientas y técnicas
Acceso a recursos adicionales de valor añadido y comunidadesPREREQUISITOS
Se espera que los participantes entiendan y conozcan la terminología y los
conceptos comunes de DevOps y que tengan una experiencia laboral
relacionada.
EXAMEN DE CERTIFICACIÓN
Aprobar con éxito (65%) el examen de 60 minutos, que consta de 40 preguntas de
opción múltiple, permite recibir el certificado SRE (Site Reliability Engineering)
Foundation. La certificación está regulada y gestionada por el DevOps Institute.
CONTENIDO
● Introducción al curso
○ Objetivos del curso
○ Agenda del curso
● Módulo 1: principios y prácticas de la SRE
○ ¿Qué es la Site Reliability Engineering?
○ SRE y DevOps: ¿Cuál es la diferencia?
○ Principios y prácticas de la SRE
● Módulo 2: objetivos de nivel de servicio y presupuestos de error
○ Objetivos de nivel de servicio (SLOs)
○ Presupuestos de error
○ Políticas sobre los presupuestos de error
● Módulo 3: reducir el trabajo desgastante (Toil)
○ ¿Qué es el Toil?
○ ¿Por qué es malo el Toil?
○ Hacer algo para evitar el Toil
● Módulo 4: monitoreo e indicadores de nivel de servicio
○ Indicadores de nivel de servicio (SLIs)
○ Monitoreo
○ Observabilidad
● Módulo 5: herramientas de la SRE y automatización
○ Definición de automatización
○ Enfoque de la automatización
○ Estructura de los tipos de automatización
○ Garantía de la automatización
○ Herramientas de automatización
● Módulo 6: antifragilidad y aprender del error
○ Por qué aprender del error○ Beneficios de la antifragilidad
○ Cambiar el equilibrio organizacional
● Módulo 7: impacto organizacional de la SRE
○ Por qué las organizaciones implementan la SRE
○ Patrones para implementar la SRE
○ Necesidades de turno (on-call)
○ Post mortem sin culpa
○ Escalamiento y SRE
● Módulo 8: SRE, otros frameworks, el futuro
○ SRE y otros frameworks
○ El futuro
● Fuentes adicionales de información
● Preparación del examen
○ Requisitos del examen, ponderación de las preguntas y lista de
terminología
○ Ejemplo de examen