¿Qué es el uso de herramientas en los LLM? | Glosario GEO

El uso de herramientas es la capacidad que permite a un LLM llamar a funciones, API, bases de datos o servicios externos a mitad de una respuesta, para obtener datos actualizados, ejecutar cálculos o realizar acciones en el mundo. En lugar de quedar limitado a sus datos de entrenamiento, un modelo que usa herramientas puede alcanzar el exterior cuando la tarea lo requiere.

Por qué importa

Un LLM por sí solo tiene tres límites estrictos: un límite de conocimiento congelado, ningún acceso a datos privados y ninguna capacidad de actuar. El uso de herramientas elimina los tres. Con herramientas, el mismo modelo puede responder "¿cuál es el MRR actual?", enviar un correo electrónico, reservar un vuelo, consultar una base de datos o ejecutar código. El uso de herramientas es la base de todo agente de IA moderno, de todo "copiloto" y de casi todas las aplicaciones de LLM en producción que van más allá de la capa del chatbot.

Cómo funciona

1. Definiciones de herramientas: quien llama proporciona al modelo una lista de herramientas disponibles, cada una con un nombre, una descripción y un esquema de parámetros.

2. El modelo decide llamar: cuando la solicitud del usuario necesita una herramienta, el modelo genera una llamada a herramienta estructurada (en JSON que coincide con el esquema) en lugar de texto normal.

3. El entorno de ejecución ejecuta la herramienta: tu código recibe la llamada a la herramienta, ejecuta la función real y devuelve el resultado.

4. El resultado vuelve al modelo: el modelo ve el resultado como parte de su contexto y continúa la respuesta, ya sea respondiendo al usuario o llamando a otra herramienta.

5. Bucle hasta terminar: las tareas con múltiples herramientas encadenan llamadas hasta que el modelo produce una respuesta de texto final.

Uso de herramientas frente a llamada a funciones

Los dos términos son en su mayoría intercambiables, con un matiz sutil:

Llamada a funciones: el enfoque original; el modelo genera argumentos JSON para una única función con nombre.
Uso de herramientas: el enfoque más amplio; las herramientas pueden ser funciones, API, acciones de computadora o servidores MCP, y el modelo orquesta muchas en secuencia.

Anthropic usa "uso de herramientas", OpenAI usaba históricamente "llamada a funciones" y ahora dice "herramientas". Ambos describen la misma capacidad subyacente.

Tipos de herramientas

Recuperación: obtener documentos, buscar en la web, consultar una base de datos, localizar un registro.

Cálculo: ejecutar Python, hacer cálculos, convertir unidades, analizar un archivo.

Acción: enviar un correo electrónico, crear un evento de calendario, publicar en Slack, actualizar un CRM.

Ejecución de código: un intérprete en entorno aislado en el que el modelo puede escribir y ejecutar código.

Uso de computadora: hacer clic, escribir y leer la pantalla, la herramienta más general.

De modelo a modelo: delegar a otro modelo especializado (por ejemplo, generación de imágenes).

Cómo diseñar buenos esquemas de herramientas

Descripciones claras y breves: la descripción es la forma en que el modelo decide cuándo llamar. Hazla inequívoca.

Tipos de parámetros restringidos: prefiere enumeraciones y cadenas restringidas en lugar de texto libre, esto reduce los argumentos alucinados.

Idempotentes siempre que sea posible: si el modelo pudiera reintentar, una segunda llamada no debería enviar el correo electrónico dos veces.

Devuelve resultados estructurados: entrégale al modelo JSON de vuelta, no texto libre, razona mejor sobre la estructura.

Las respuestas de error le dicen al modelo qué hacer: "Error: ciudad no encontrada, prueba con otra ortografía" es más útil que "500".

Errores comunes

Demasiadas herramientas: a partir de unas 20 a 30 herramientas, los modelos empiezan a elegir la incorrecta. Agrupa herramientas relacionadas o enrútalas a través de una selección más pequeña.

Descripciones vagas: "utilidad" no le dice al modelo cuándo llamarla. Sé específico.

Sin manejo de errores: los fallos de las herramientas rompen el bucle. Devuelve siempre un error estructurado al que el modelo pueda reaccionar.

Ignorar la latencia: cada llamada a herramienta añade una ida y vuelta. Paraleliza las llamadas independientes; agrupa cuando sea posible.

Omitir las salvaguardas: las herramientas que ejecutan acciones (enviar correo, transferir dinero) necesitan supervisión humana o un alcance estricto.

Sources: