Intercambiando el "Cerebro" (Modelos LLM)
Autor: Eduardo Martínez Agrelo
En el mundo real de la producción, un solo modelo no sirve para todas las tareas. Un buen Ingeniero de IA debe saber cuándo priorizar la velocidad y el coste, y cuándo necesita un razonamiento profundo. En este laboratorio exploraremos la capacidad Model Agnostic de ADK, permitiéndonos cambiar el motor de nuestro agente con una sola línea de código.
Gemini Flash vs. Gemini Pro
La familia de modelos Gemini ofrece diferentes capacidades según la necesidad del workflow. En ADK, entender estas diferencias es clave para la optimización:
- Gemini Flash: Diseñado para la velocidad y la eficiencia. Es ideal para tareas de extracción, resúmenes rápidos o respuestas de baja latencia.
- Gemini Pro: El modelo de alto rendimiento. Posee un razonamiento superior y una ventana de contexto masiva, perfecto para lógica compleja o análisis detallados.
Abstracción del Modelo en ADK
Una de las potencias de ADK es que separa la definición del agente de la implementación del modelo. Esto nos permite configurar el "cerebro" de forma dinámica:
model="gemini-1.5-pro" o model=OpenAiModel(model_name="gpt-4o")
Esta abstracción facilita la portabilidad de nuestra aplicación, permitiendo que el mismo agente funcione con diferentes proveedores o versiones de modelos sin reescribir la lógica de negocio.
Configuración y Parámetros (Temperature)
No solo podemos cambiar el modelo, sino también cómo se comporta. A través de model_kwargs, tomamos
el control sobre la creatividad y precisión del agente:
- Temperatura: Controla la aleatoriedad. Un valor bajo (0.1) nos da respuestas deterministas y técnicas; un valor alto (0.8) fomenta la creatividad.
- Flexibilidad: Podemos definir estas configuraciones mediante variables de entorno, permitiendo que el sistema elija el modelo según el entorno de despliegue.
Implementación práctica
En este laboratorio, crearemos un agente "Flexible". Configuraremos el código para que lea el modelo desde
nuestro archivo .env. Realizaremos pruebas de estrés comparando cómo responde Gemini Flash frente a
Gemini Pro ante una misma pregunta técnica compleja. Observarás cómo la latencia disminuye con Flash, pero la
profundidad del razonamiento aumenta significativamente con Pro, dándote el criterio necesario para decidir en
producción.
Conclusión: Optimización de recursos
Has aprendido que el poder de un agente no reside en usar siempre el modelo más caro, sino en usar el adecuado para cada tarea. Ya sabes cómo intercambiar cerebros y ajustar su creatividad. Con el motor ya configurado, el siguiente paso es romper los límites de la IA dándole "manos" a través de las Custom Tools.