Dotando al Agente de Herramientas | Curso Agentes IA

Dotando al Agente de Herramientas (Custom Tools)

Autor: Eduardo Martínez Agrelo

Hasta ahora, nuestros agentes han sido mentes brillantes atrapadas en una habitación vacía: podían razonar, pero no podían actuar. En este laboratorio, romperemos esa limitación mediante el Tool Calling. Aprenderemos a darle "manos" a nuestro agente para que pueda ejecutar funciones de Python, consultar bases de datos y realizar operaciones que un modelo de lenguaje no puede hacer por sí solo.

¿Qué es el Tool Calling?

El Tool Calling es el proceso mediante el cual un agente detecta que no tiene la información o la capacidad necesaria para responder a un usuario y decide invocar una función externa:

  • Autonomía: El agente decide por sí mismo qué herramienta usar y con qué parámetros, basándose en la intención del usuario.
  • Precisión: Permite delegar cálculos matemáticos o consultas de datos exactos a código tradicional, eliminando las alucinaciones del modelo.

El poder de los Docstrings

En ADK, la forma en que "enseñamos" a un agente a usar una herramienta es a través de la documentación interna del código. El modelo de lenguaje lee nuestras descripciones para entender cuándo es útil la función:

def mi_herramienta(): """Descripción detallada para el LLM"""

Un docstring claro y con anotaciones de tipo (type hints) es la diferencia entre un agente que sabe actuar y uno que se confunde. ADK toma estas funciones de Python y las traduce automáticamente al esquema JSON que el modelo Gemini necesita.

El ciclo Razonamiento-Acción

Es fundamental comprender que el agente sigue un flujo lógico antes de entregar la respuesta final:

  • Observación: El agente analiza la pregunta ("¿Cuánto cuesta el monitor?").
  • Decisión: Identifica que tiene una herramienta llamada consultar_precio.
  • Ejecución: ADK ejecuta la función de Python y le devuelve el resultado al agente para que este lo procese y responda de forma natural.

Implementación práctica

En este laboratorio, transformaremos a nuestro asistente en un "Agente de Ventas". Programaremos funciones reales para consultar un inventario simulado y calcular descuentos financieros. Al probarlo en la Dev UI, observarás el rastro de la ejecución (Trace), viendo exactamente cómo el agente genera los argumentos para la función y cómo utiliza el retorno de la misma para cerrar una venta con datos 100% precisos.

Conclusión: De Chatbots a Agentes Reales

Has dado el paso más importante hacia la utilidad real de la IA. Has aprendido que un agente es capaz de interactuar con el mundo exterior a través de código. Ya tienes un agente con herramientas individuales; el siguiente paso es aprender a orquestar múltiples agentes para realizar tareas complejas en cadena.

Newsletter GCP
¿Quieres estar al día con las últimas novedades de Google Cloud Platform? ¡Suscríbete y no te pierdas nada!