Empaquetado y Deploy Customizado | Curso Agentes IA

Empaquetado y Deploy Customizado (La Infraestructura como Código)

Autor: Eduardo Martínez Agrelo

Hasta ahora hemos ejecutado nuestros agentes en un entorno de pruebas local. Sin embargo, para dar el salto definitivo a producción, debemos definir los recursos de sistema que nuestro agente necesitará en la nube. En este laboratorio utilizaremos el manifiesto de agents-cli para aplicar el patrón de Infraestructura como Código (IaC) y configurar nuestro despliegue en Google Cloud Run de forma profesional.

El Manifiesto agent.yaml

El archivo agent.yaml es el contrato oficial que especifica cómo se comportará nuestro contenedor una vez esté corriendo en los servidores de Google:

  • Límites de Recursos: Especificamos cuánta memoria (RAM) y procesadores (CPU) asignamos a nuestro agente (ej. 1GB de RAM para procesar el SDK de BigQuery cómodamente).
  • Políticas de Escalado: Definimos la concurrencia máxima de peticiones que cada contenedor puede manejar simultáneamente antes de que Google Cloud deba clonarlo.

Automatización sin Dockerfiles: Buildpacks

Uno de los mayores atractivos de agents-cli es que elimina la necesidad de escribir y mantener archivos Docker manuales para el empaquetado:

agents-cli deploy --project MI_PROYECTO

  • Cloud Build: El comando compila tu código usando Buildpacks de Google Cloud, detectando que es un proyecto de Python y ADK de forma transparente.
  • Artifact Registry: La CLI compila la imagen del contenedor directamente en el registro seguro de Google Cloud, lista para ser servida.

Optimización de Presupuesto (Cold Starts)

Configurar el escalado de forma inteligente nos protege contra sorpresas financieras desagradables en nuestra facturación:

  • Escalado a Cero (min_instances: 0): Si no hay peticiones, Google apaga nuestro servidor por completo para no generar gastos. El "precio" a pagar es un ligero retraso de unos segundos en la primera consulta (Cold Start).
  • Techo de Escalado (max_instances: 5): Establecemos un límite de seguridad estricto para evitar picos de facturación inesperados si nuestro agente recibe tráfico masivo de forma repentina.

Implementación práctica

En este laboratorio, abriremos el manifiesto de configuración agent.yaml en nuestro proyecto. Definiremos los recursos del runtime, inyectaremos de forma segura las variables de entorno de nuestro proyecto de BigQuery y ejecutaremos el comando agents-cli deploy. Observarás todo el proceso de empaquetado y subida en tiempo real y probaremos la API pública recién generada a través de la documentación interactiva en Swagger. Tu agente de datos ya es un microservicio global operando en los centros de datos de Google.

Conclusión: Tu IA escalable ya está en el mundo real

Has aprendido que construir software de IA implica entender la infraestructura que lo sustenta. Ya tienes un agente analista operando de forma global en la nube. Con el servicio publicado, el último paso de este viaje profesional es aprender a monitorizar su rendimiento y limpiar de forma segura nuestros recursos mediante el proceso de Teardown.

Newsletter GCP
¿Quieres estar al día con las últimas novedades de Google Cloud Platform? ¡Suscríbete y no te pierdas nada!