Testing Automatizado (La Red de Seguridad)
Autor: Eduardo Martínez Agrelo
En la ingeniería de software tradicional, los tests aseguran que el código es predecible. En el desarrollo de agentes de IA, donde las respuestas son probabilísticas, los tests son nuestra única defensa contra la regresión y el caos. En este laboratorio aprenderemos a utilizar la suite de pruebas automatizada que agents-cli genera por defecto, integrando el rigor del testing en nuestro ciclo de vida de IA.
La carpeta tests/: El estándar de Google
Cuando generamos un proyecto con el scaffolding profesional, se nos entrega una estructura de pruebas
preconfigurada lista para ser ejecutada con pytest:
- Tests Unitarios: Validamos de forma aislada que nuestras herramientas (como la consulta a BigQuery del lab anterior) devuelven datos válidos antes de que el agente los procese.
- Tests de Integración: Ponemos a prueba el razonamiento del agente, simulando preguntas reales y verificando que la IA sea capaz de invocar la herramienta correcta y entregar una respuesta coherente.
Ejecución en entornos aislados
Una de las mayores ventajas de este flujo industrial es que las pruebas no se ejecutan en el Python global de vuestro sistema, sino en el entorno virtual gestionado por el proyecto:
uv run pytest tests/
Este comando garantiza que los tests se ejecuten con las versiones exactas de las librerías definidas en el
archivo uv.lock, asegurando que si una prueba pasa en local, pasará también en los servidores de
integración de la nube.
Hacia la Integración Continua (CI/CD)
Entender este flujo es el primer paso para automatizar la calidad en un equipo de ingeniería moderno:
- Validación Preventiva: Los ingenieros senior nunca despliegan sin que el sistema de CI corra esta suite de pruebas. Si un cambio en el prompt rompe la lógica, el test fallará y el despliegue se detendrá.
- Confianza en la Iteración: Podéis modificar las instrucciones de vuestro agente con la tranquilidad de que, si cometéis un error que afecte a la precisión, vuestros tests os avisarán al instante.
Implementación práctica
En este laboratorio, abriremos la carpeta tests/ que generó nuestra CLI. Programaremos una prueba
unitaria para validar que nuestra conexión con BigQuery es sólida y un test de integración que verifique si el
agente es capaz de extraer datos numéricos reales. Al ejecutar el comando de pytest, observarás los
indicadores de éxito en tu terminal, transformando tu repositorio en una pieza de ingeniería blindada y lista
para procesos de integración continua.
Conclusión: Software de IA en el que puedes confiar
Has aprendido que un ingeniero de IA no solo escribe prompts, sino que escribe salvaguardas. Ya tienes una suite de pruebas profesional. Con la garantía de calidad establecida, el siguiente paso es configurar la infraestructura de producción para realizar el despliegue definitivo a Google Cloud.