[{"data":1,"prerenderedAt":28},["ShallowReactive",2],{"article-data-curso-gcp-ai-ops-09":3},{"content":4,"date":5,"image":6,"sideArticles":7},"\u003C!DOCTYPE html>\n\u003Chtml lang=\"es\">\n\n\u003Chead>\n    \u003Cmeta charset=\"UTF-8\">\n    \u003Cmeta name=\"viewport\" content=\"width=device-width, initial-scale=1.0\">\n    \u003Cmeta name=\"description\"\n        content=\"Módulo 9: AIOps en DevOps y SRE. Aprende a definir SLOs predictivos, implementar ChatOps con Slack/Teams y mejorar el MTTR mediante auditoría de incidentes.\">\n    \u003Cmeta name=\"keywords\"\n        content=\"SRE, DevOps, SLI, SLO, Error Budget, ChatOps, MTTR, Google Cloud, AIOps, Incident Audit\">\n    \u003Cmeta name=\"author\" content=\"Eduardo Martínez Agrelo\">\n    \u003Ctitle>AIOps en el mundo DevOps y SRE | Curso AIOps\u003C/title>\n    \u003Cstyle>\n        body {\n            font-family: sans-serif;\n            line-height: 1.6;\n        }\n\n        h1,\n        h2,\n        h3 {\n            color: #333;\n        }\n\n        ul {\n            list-style-type: disc;\n            margin-left: 20px;\n        }\n\n        code {\n            background-color: #f4f4f4;\n            padding: 2px 5px;\n            border-radius: 3px;\n            font-family: monospace;\n        }\n    \u003C/style>\n\u003C/head>\n\n\u003Cbody>\n    \u003Ch1>Módulo 9: AIOps en el mundo DevOps y SRE (Fiabilidad y ChatOps)\u003C/h1>\n\n    \u003Cp>\u003Cstrong>Autor:\u003C/strong> \u003Ca href=\"https://www.youtube.com/@EduardoMartinezAgrelo\" target=\"_blank\">Eduardo Martínez\n            Agrelo\u003C/a>\u003C/p>\n\n    \u003Cp>Bienvenidos al Módulo 9. En esta etapa del curso, la inteligencia artificial deja de ser un componente aislado\n        para integrarse en la cultura de \u003Cstrong>SRE (Site Reliability Engineering)\u003C/strong>. Aprenderemos que el éxito\n        de un modelo no se mide en precisión estadística, sino en fiabilidad del servicio y en la mejora de la\n        experiencia del equipo de operaciones. Transformaremos la IA en un \"compañero de equipo\" que informa, audita y\n        protege nuestros acuerdos de nivel de servicio.\u003C/p>\n\n    \u003Ch2>SLIs, SLOs y el Error Budget Predictivo\u003C/h2>\n\n    \u003Cp>En el mundo SRE, la fiabilidad se gestiona mediante datos, no mediante deseos. Integraremos el AIOps en el marco\n        de trabajo de fiabilidad:\u003C/p>\n    \u003Cul>\n        \u003Cli>\u003Cstrong>SLO Predictivo:\u003C/strong> A diferencia de los SLOs tradicionales que solo miran el pasado, usaremos\n            la IA para alertar cuando la tendencia indica que agotaremos nuestro \"Error Budget\" en las próximas horas.\n        \u003C/li>\n        \u003Cli>\u003Cstrong>Enfoque en el Negocio:\u003C/strong> Aprenderemos a priorizar las alertas de la IA según el impacto real\n            que tienen sobre los indicadores clave de nivel de servicio (SLIs).\u003C/li>\n    \u003C/ul>\n\n    \u003Ch2>ChatOps: La IA integrada en el flujo de trabajo\u003C/h2>\n\n    \u003Cp>Una alerta críptica en una consola es ineficiente. Implementaremos \u003Cstrong>ChatOps\u003C/strong> para democratizar la\n        información de la IA en herramientas como Slack o Microsoft Teams:\u003C/p>\n    \u003Cp>\u003Ccode>\"text\": \"🚨 AIOps Alert: Riesgo de incidente detectado en srv-prod-05\"\u003C/code>\u003C/p>\n    \u003Cp>Crearemos notificaciones enriquecidas que no solo informan de un fallo, sino que adjuntan la probabilidad de\n        riesgo y el contexto técnico necesario para que el equipo humano tome decisiones informadas de forma inmediata,\n        reduciendo el tiempo de reconocimiento (MTTA).\u003C/p>\n\n    \u003Ch2>Auditoría de Incidentes y Mejora del MTTR\u003C/h2>\n\n    \u003Cp>Para que una organización confíe en la IA, esta debe ser auditable y sus resultados medibles. Implementaremos un\n        \"Diario de Incidentes\" inteligente:\u003C/p>\n    \u003Cul>\n        \u003Cli>\u003Cstrong>Registro de Decisiones:\u003C/strong> Almacenaremos cada predicción y acción de remediación en BigQuery\n            para realizar análisis post-mortem de alta calidad.\u003C/li>\n        \u003Cli>\u003Cstrong>Métricas de Eficiencia:\u003C/strong> Utilizaremos estos datos para calcular la reducción real en el\n            \u003Cstrong>MTTR (Mean Time To Recovery)\u003C/strong>, demostrando cómo la IA acorta el tiempo entre la detección\n            del problema y su resolución definitiva.\u003C/li>\n    \u003C/ul>\n\n    \u003Ch2>Implementación práctica\u003C/h2>\n\n    \u003Cp>En este laboratorio, utilizarás Terraform para crear una tabla de auditoría de incidentes en BigQuery diseñada\n        específicamente para ingenieros SRE. Desarrollarás una Cloud Function en Python que actuará como el puente de\n        \u003Cstrong>ChatOps\u003C/strong>, recibiendo alertas de riesgo desde el bus de eventos y enviando notificaciones\n        formateadas hacia un webhook. Ejecutarás un script de prueba para simular una alerta crítica y observarás cómo\n        el sistema notifica al equipo en tiempo real mientras registra el evento para su futura auditoría, consolidando\n        una cultura operativa basada en datos y fiabilidad.\n    \u003C/p>\n\n    \u003Ch2>Conclusión: IA al servicio del equipo humano\u003C/h2>\n    \u003Cp>Has aprendido que el AIOps es una herramienta de empoderamiento para los equipos de DevOps y SRE. Has\n        transformado alertas frías en conversaciones inteligentes y registros auditables. Con esta integración cultural\n        y técnica establecida, el siguiente reto es aprender a aplicar esta misma inteligencia para optimizar el gasto y\n        la eficiencia económica de nuestra infraestructura en la nube.\u003C/p>\n\u003C/body>\n\n\u003C/html>","May 28, 2026","https://storage.googleapis.com/mp-blog/images/curso-gcp-ai-ops-09.jpg",[8,13,18,23],{"id":9,"title":10,"description":11,"image":12,"date":5},"curso-gcp-ai-ops-01","Fundamentos de AIOps en Google Cloud | Curso AIOps con Vertex AI","Módulo 1: Fundamentos de AIOps en Google Cloud. Aprende la transición de ITOps a operaciones inteligentes y cómo preparar tu infraestructura base con Terraform.","https://storage.googleapis.com/mp-blog/images/curso-gcp-ai-ops-01.jpg",{"id":14,"title":15,"description":16,"image":17,"date":5},"curso-gcp-ai-ops-02","Vertex AI para AIOps: AutoML y Despliegue | Curso AIOps","Módulo 2: Gestión de modelos con Vertex AI para AIOps. Aprende a utilizar AutoML, gestionar datasets tabulares y desplegar endpoints de predicción.","https://storage.googleapis.com/mp-blog/images/curso-gcp-ai-ops-02.jpg",{"id":19,"title":20,"description":21,"image":22,"date":5},"curso-gcp-ai-ops-03","Observabilidad Inteligente en GCP | Curso AIOps","Módulo 3: Observabilidad Inteligente en GCP. Configuración de Cloud Monitoring, Cloud Logging y creación de dashboards predictivos correlacionados con BigQuery.","https://storage.googleapis.com/mp-blog/images/curso-gcp-ai-ops-03.jpg",{"id":24,"title":25,"description":26,"image":27,"date":5},"curso-gcp-ai-ops-04","Automatización Operativa y Remediación | Curso AIOps","Módulo 4: Automatización Operativa en AIOps. Aprende a crear arquitecturas dirigidas por eventos con Cloud Functions y Pub/Sub para la remediación automática.","https://storage.googleapis.com/mp-blog/images/curso-gcp-ai-ops-04.jpg",1779944585129]