Was ist Tool Use in LLMs? | GEO-Glossar

Tool Use ist die Fähigkeit, mit der ein LLM mitten in einer Antwort externe Funktionen, APIs, Datenbanken oder Dienste aufrufen kann, um aktuelle Daten abzurufen, Berechnungen durchzuführen oder Aktionen in der Welt auszuführen. Statt auf seine Trainingsdaten festgelegt zu sein, kann ein Modell mit Tool Use über sich selbst hinausreichen, wenn die Aufgabe es erfordert.

Warum es wichtig ist

Ein reines LLM hat drei harte Grenzen: einen eingefrorenen Knowledge Cutoff, keinen Zugriff auf private Daten und keine Möglichkeit zu handeln. Tool Use beseitigt alle drei. Mit Tools kann dasselbe Modell die Frage "Wie hoch ist der aktuelle MRR?" beantworten, eine E-Mail senden, einen Flug buchen, eine Datenbank abfragen oder Code ausführen. Tool Use ist die Grundlage jedes modernen AI-Agenten, jedes "Copiloten" und nahezu jeder produktiven LLM-Anwendung oberhalb der reinen Chatbot-Ebene.

Wie es funktioniert

1. Tool-Definitionen: Der Aufrufer stellt dem Modell eine Liste verfügbarer Tools bereit, jeweils mit einem Namen, einer Beschreibung und einem Parameter-Schema.

2. Das Modell entscheidet sich zum Aufruf: Wenn die Anfrage des Nutzers ein Tool benötigt, gibt das Modell statt regulärem Text einen strukturierten Tool-Aufruf aus (JSON, das dem Schema entspricht).

3. Die Laufzeitumgebung führt das Tool aus: Ihr Code empfängt den Tool-Aufruf, führt die eigentliche Funktion aus und gibt das Ergebnis zurück.

4. Das Ergebnis geht zurück an das Modell: Das Modell sieht das Ergebnis als Teil seines Kontexts und setzt die Antwort fort, indem es entweder dem Nutzer antwortet oder ein weiteres Tool aufruft.

5. Schleife bis zum Abschluss: Bei Aufgaben mit mehreren Tools werden Tool-Aufrufe verkettet, bis das Modell eine finale Textantwort erzeugt.

Tool Use vs. Function Calling

Die beiden Begriffe sind weitgehend austauschbar, mit einer subtilen Verschiebung:

Function Calling: Die ursprüngliche Formulierung, bei der das Modell JSON-Argumente für eine einzelne benannte Funktion ausgibt.
Tool Use: Die umfassendere Formulierung, bei der Tools Funktionen, APIs, Computeraktionen oder MCP-Server sein können und das Modell viele davon in Folge orchestriert.

Anthropic verwendet "Tool Use", OpenAI verwendete historisch "Function Calling" und spricht heute von "Tools". Beide beschreiben dieselbe zugrunde liegende Fähigkeit.

Arten von Tools

Abruf: Dokumente abrufen, im Web suchen, eine Datenbank abfragen, einen Datensatz nachschlagen.

Berechnung: Python ausführen, rechnen, Einheiten umrechnen, eine Datei parsen.

Aktion: Eine E-Mail senden, einen Kalendereintrag erstellen, in Slack posten, ein CRM aktualisieren.

Codeausführung: Ein abgeschotteter Interpreter, in dem das Modell Code schreiben und ausführen kann.

Computer Use: Klicken, tippen und den Bildschirm lesen, das allgemeinste Tool.

Modell-zu-Modell: Die Übergabe an ein anderes spezialisiertes Modell (z. B. zur Bildgenerierung).

Gute Tool-Schemata entwerfen

Klare, kurze Beschreibungen: Anhand der Beschreibung entscheidet das Modell, wann es aufruft. Gestalten Sie sie eindeutig.

Eng gefasste Parametertypen: Bevorzugen Sie Enums und eingeschränkte Strings gegenüber freiem Text, das reduziert halluzinierte Argumente.

Wenn möglich idempotent: Falls das Modell einen erneuten Versuch unternimmt, sollte ein zweiter Aufruf die E-Mail nicht doppelt versenden.

Strukturierte Ergebnisse zurückgeben: Geben Sie dem Modell JSON zurück, keinen freien Text, denn es kann über Struktur besser schlussfolgern.

Fehlerantworten sagen dem Modell, was zu tun ist: "Fehler: Stadt nicht gefunden, versuchen Sie eine andere Schreibweise" ist nützlicher als "500".

Häufige Fehler

Zu viele Tools: Ab etwa 20 bis 30 Tools beginnen Modelle, das falsche auszuwählen. Gruppieren Sie verwandte Tools oder leiten Sie über eine kleinere Auswahl.

Vage Beschreibungen: "Hilfsmittel" sagt dem Modell nicht, wann es aufrufen soll. Seien Sie konkret.

Keine Fehlerbehandlung: Tool-Fehler unterbrechen die Schleife. Geben Sie stets einen strukturierten Fehler zurück, auf den das Modell reagieren kann.

Latenz ignorieren: Jeder Tool-Aufruf fügt eine Hin- und Rückreise hinzu. Parallelisieren Sie unabhängige Aufrufe und bündeln Sie, wo möglich.

Guardrails überspringen: Tools, die Aktionen ausführen (E-Mail senden, Geld überweisen), benötigen einen Menschen im Prozess oder eine strenge Eingrenzung.

Sources: