Best Practices - Tipps für optimale Agenten
Dieser Leitfaden zeigt Ihnen bewährte Methoden, um Ihre Agenten optimal zu konfigurieren, Kosten zu sparen und beste Ergebnisse zu erzielen.
🎯 Instructions schreiben
1. Sei spezifisch, nicht vage
❌ Schlecht:
Sei hilfreich und beantworte Fragen.
✅ Gut:
Du bist ein Produktberater.
Stelle 2-3 gezielte Fragen (Budget, Größe, Farbe).
Präsentiere maximal 4 Produkte mit Begründung.
Antworte in 3-5 Sätzen.
2. Nutze Struktur & Listen
❌ Schlecht:
Du sollst Kunden helfen und Produkte empfehlen und bei Problemen den Support kontaktieren und höflich sein.
✅ Gut:
AUFGABE:
- Kunden bei Produktauswahl helfen
- Passende Empfehlungen geben
VERHALTEN:
- Höflich und freundlich
- Maximal 3 Fragen pro Antwort
BEI PROBLEMEN:
- An Support verweisen: support@shop.de
3. Gib konkrete Beispiele
✅ Sehr gut:
BEISPIEL-DIALOG:
Kunde: "Ich suche eine Jacke"
Du: "Gerne! Für welchen Anlass? [BUTTON:Alltag] [BUTTON:Sport] [BUTTON:Business]
Und in welchem Preisbereich? [BUTTON:Bis 50€] [BUTTON:Bis 100€]"
Beispiele helfen der KI enorm, das gewünschte Verhalten zu verstehen!
4. Erwähne Tools explizit
✅ Empfohlen:
TOOL-NUTZUNG:
- Zu Beginn: Rufe get_product_properties() EINMAL auf
- Für Suchen: Nutze product_search(query, filters)
- Für Details: Nutze get_product_details(productId)
- NIEMALS Tools raten - nutze nur aktivierte Tools
5. Definiere Do's & Don'ts klar
✅ Sehr hilfreich:
MUSS:
- Immer nach Budget fragen
- Maximal 4 Produkte gleichzeitig zeigen
- Bei Unsicherheit nachfragen
DARF NICHT:
- Rabatte versprechen
- Preise erfinden
- Persönliche Daten speichern
🛠️ Tool-Auswahl
1. Weniger ist mehr
Faustregel: Aktivieren Sie nur Tools, die Sie wirklich brauchen!
Warum?
- Jedes Tool erhöht Komplexität
- Längere Antwortzeiten
- Höhere Token-Kosten
- Mehr Fehlerquellen
Beispiel: Produktberater
✅ Nötig:
- get_product_properties (Filter laden)
- product_search (Suchen)
- get_product_details (Details)
- get_chatbot_name (Name)
❌ Unnötig:
- get_order_status (macht Produktberater nicht)
- fetch_url (nicht gebraucht)
- get_unresolved_logs (nur für Backend)
2. Redundanz vermeiden
Beispiel:
Wenn Sie get_product_properties aktiv haben, brauchen Sie NICHT:
get_categories(schon in product_properties enthalten)get_manufacturer(schon in product_properties enthalten)
3. Tool-Nutzung dokumentieren
In Instructions festhalten:
Du hast Zugriff auf:
1. get_product_properties - Einmal zu Beginn aufrufen
2. product_search - Für jede Produktsuche
3. get_product_details - Für Details zu 1 Produkt
💰 Kosten optimieren
1. Richtiges Modell wählen
Kosten-Vergleich (pro 1M Input Tokens):
gpt-4o-mini: $0.15 (GÜNSTIG) ✅
o4-mini: $1.00
gpt-4o: $2.50 (TEUER)
gpt-5: $5.00 (SEHR TEUER)
Empfehlung: Starten Sie mit gpt-4o-mini. Nur upgraden, wenn nötig!
2. Token-Caching nutzen
Das System cached automatisch! Aber Sie können es optimieren:
✅ Cache-freundlich:
- Stabile Instructions (nicht ständig ändern)
- Gleiche System-Prompts wiederverwenden
- get_product_properties() nur 1x pro Session
Einsparung: 50-90% der Kosten bei wiederholten Anfragen!
3. Max Output Tokens begrenzen
Ohne Limit: Agent kann 2000+ Tokens antworten
Mit Limit (500): Max 500 Tokens
→ Kosten-Ersparnis: Bis zu 75%!
Setzen in Agent-Config:
Max Output Tokens: 500 (für FAQ/Service)
Max Output Tokens: 800 (für Produktberater)
Max Output Tokens: 1500 (für Content)
4. Instructions kürzen (aber nicht zu sehr!)
Balance finden:
❌ Zu kurz (100 Zeichen):
"Sei hilfreich"
→ Schlechte Ergebnisse
✅ Optimal (800-1500 Zeichen):
Klar, strukturiert, mit Beispielen
→ Gute Ergebnisse, akzeptable Kosten
❌ Zu lang (5000+ Zeichen):
Romane mit vielen Details
→ Hohe Kosten, KI verliert Fokus
5. Reasoning Effort anpassen
low: Schnell + günstig, aber einfacher
medium: Ausgewogen ✅ (EMPFOHLEN)
high: Langsam + teuer, aber beste Qualität
Wann high nutzen?
- Nur für komplexe Analysen
- Content-Erstellung
- Kritische Entscheidungen
Wann low nutzen?
- Simple FAQ
- Bestellstatus-Checks
- Einfache Produktsuchen
⚡ Performance optimieren
1. Temperature niedrig für Konsistenz
FAQ-Bot: 0.3 (sehr konsistent)
Kundenservice: 0.5 (etwas Variation)
Produktberater: 0.7 (natürlich)
Content: 1.0 (kreativ)
Weniger Variation = Schnellere Entscheidung = Schnellere Antwort
2. Tools in Reihenfolge nutzen
In Instructions definieren:
ABLAUF:
1. ZUERST: get_product_properties() (nur 1x!)
2. DANN: product_search() mit Filtern
3. OPTIONAL: get_product_details() für 1-2 Produkte
3. Vermeide zu viele Tool-Calls
❌ Ineffizient:
Agent ruft auf:
1. get_product_properties()
2. product_search(query="Jacke")
3. get_product_details(id=1)
4. get_product_details(id=2)
5. get_product_details(id=3)
→ 5 Tool-Calls!
✅ Besser:
Agent ruft auf:
1. get_product_properties()
2. product_search(query="Jacke", limit=3)
→ 2 Tool-Calls!
In Instructions:
Nutze get_product_details() nur für EINZELNE Produkte wenn explizit gefragt.
Nutze product_search() für Listen - es liefert bereits Basis-Infos!
🎨 User Experience
1. Antworten kurz halten
✅ Gut (3-5 Sätze):
Ich habe 3 Winterjacken gefunden, die zu deinem Budget passen.
Die "Arctic Pro" ist wasserdicht und sehr warm.
Die "City Parka" ist stylish und alltagstauglich.
Welche interessiert dich?
❌ Zu lang (>10 Sätze):
Ich habe eine umfangreiche Suche in unserem Sortiment durchgeführt...
[5 weitere Sätze]
Die erste Jacke, die ich dir empfehlen möchte, ist die Arctic Pro...
[10 weitere Sätze mit allen Details]
Lösung:
In Instructions:
"Halte Antworten kurz (max. 5 Sätze)"
In Config:
Max Output Tokens: 500
2. Buttons nutzen (wenn möglich)
In Instructions:
Nutze Buttons für häufige Optionen:
[BUTTON:Ja] [BUTTON:Nein]
[BUTTON:Mehr anzeigen] [BUTTON:Andere Kategorie]
3. Struktur in Antworten
✅ Strukturiert:
Ich empfehle dir 3 Jacken:
1. Arctic Pro (89€)
- Wasserdicht
- Sehr warm
- Sportlicher Stil
2. City Parka (79€)
- Wasserabweisend
- Alltagstauglich
- Eleganter Look
Welche spricht dich an?
❌ Unstrukturiert:
Die Arctic Pro kostet 89€ und ist wasserdicht, sehr warm und hat einen sportlichen Stil, die City Parka kostet 79€...
🧠 Wissens-Management
1. Nutze search_logs VOR Antworten
In Instructions:
WICHTIG: Bevor du antwortest, rufe IMMER search_logs() auf!
PROZESS:
1. Kunde stellt Frage
2. Du rufst search_logs(query="Frage") auf
3. Wenn Match gefunden: Nutze diese Antwort
4. Wenn kein Match: Beantworte selbst und speichere mit log()
Vorteil:
- Konsistente Antworten
- Keine Halluzinationen
- Wissens-DB wächst automatisch
2. Tags sinnvoll nutzen
Gute Tags:
versand
rückgabe
zahlung
produkt_details
technisch
allgemein
Schlechte Tags:
tag1
diverses
sonstiges
3. Nur öffentliche Logs für Kunden
Öffentlich (isPublic=true):
- FAQ-Antworten
- Allgemeine Shop-Infos
- Produktinformationen
Privat (isPublic=false):
- Interne Notizen
- Probleme/Bugs
- Verbesserungsvorschläge
🔒 Sicherheit & Datenschutz
1. Keine sensiblen Daten in Instructions
❌ NIEMALS:
Bei Problemen: Datenbank-Passwort ist "abc123"
Support-Zugangsdaten: admin/password
✅ Stattdessen:
Bei Problemen: Verweise an support@shop.de
2. Verbiete Daten-Weitergabe
In Instructions:
VERBOTEN:
- NIEMALS Kundendaten weitergeben (E-Mail, Adresse, Telefon)
- NIEMALS komplette Bestelldetails nennen
- NIEMALS Zahlungsinformationen preisgeben
BEI Bestellstatus:
- Nur Status und Tracking-Code
- KEINE Adresse, KEIN Name, KEINE Produkte
3. Verifizierung bei sensiblen Aktionen
Für get_order_status:
IMMER nach Bestellnummer UND PLZ fragen!
Beispiel:
Kunde: "Wo ist meine Bestellung?"
Du: "Gerne! Bitte nenne mir deine Bestellnummer und deine Postleitzahl zur Verifizierung."
📊 Testing & Iteration
1. Standard-Test-Szenarien definieren
Beispiel: Produktberater
Test 1: "Hallo"
→ Erwartung: Freundliche Begrüßung
Test 2: "Ich suche eine Jacke"
→ Erwartung: 2-3 Nachfragen (Budget, Größe, Anlass)
Test 3: "Schwarze Winterjacke, Größe L, bis 100€"
→ Erwartung: Produktsuche, 2-4 Ergebnisse
Test 4: "Was kostet Versand?"
→ Erwartung: Richtige Info (aus get_meta_information)
Test 5: "Gibst du mir 20% Rabatt?"
→ Erwartung: Höfliche Ablehnung
Nach jeder Änderung: Alle Tests durchlaufen!
2. A/B Testing
Erstellen Sie 2 Versionen:
Agent A: Temperature 0.5, gpt-4o-mini
Agent B: Temperature 0.8, gpt-4o-mini
→ Testen Sie beide
→ Vergleichen Sie Qualität
→ Wählen Sie den Besseren
3. Logs analysieren
Regelmäßig prüfen:
- Welche Fragen kommen häufig?
- Welche Tools werden oft genutzt?
- Wo macht der Agent Fehler?
- Wie viele Tokens werden verbraucht?
Basis für Optimierung!
🚀 Skalierung
1. Mehrere spezialisierte Agenten
❌ Ein Agent für alles:
"Universal-Agent"
- 20 Tools aktiv
- 3000 Zeichen Instructions
- Langsam, komplex, teuer
✅ Mehrere spezialisierte Agenten:
"Produktberater"
- 5 Tools
- 1000 Zeichen Instructions
- Schnell, fokussiert
"Kundenservice"
- 6 Tools
- 1200 Zeichen Instructions
- Spezifisch für Support
"Bestellstatus"
- 2 Tools
- 500 Zeichen Instructions
- Sehr schnell, günstig
2. Verkaufskanal-spezifische Agenten
Agent "Produktberater DE"
- Deutsch
- Verkaufskanal: Deutschland
- Euro-Preise
Agent "Product Advisor EN"
- English
- Sales Channel: United Kingdom
- Pound prices
3. Template-Agent erstellen
1. Erstellen Sie einen "Template-Agent" mit guter Basis-Config
2. Bei neuen Agenten: Kopieren Sie Instructions manuell
3. Passen Sie für spezifischen Zweck an
4. Spart Zeit und sichert Qualität
📝 Dokumentation
1. Description-Feld nutzen
In jedem Agent:
Produktberater für Winterkleidung
ERSTELLT: 2025-01-15
VERANTWORTLICH: Team Marketing
LETZTES UPDATE: 2025-01-20
VERSION 1.0:
- Basis-Setup
VERSION 1.1:
- Temperature von 0.7 auf 0.5 (konsistenter)
- Tool "get_delivery_times" hinzugefügt
VERSION 1.2:
- Instructions erweitert: Button-Nutzung
2. Änderungen versionieren
Instructions v1.2 (2025-01-20)
ÄNDERUNGEN gegenüber v1.1:
- Hinzugefügt: Explicit tool-Erwähnungen
- Entfernt: Emoji-Nutzung
- Optimiert: Kürzere Antworten (max 5 Sätze)
3. Erfolge messen
KPIs tracken:
- Durchschnittliche Antwortzeit
- Tokens pro Konversation
- Kosten pro Konversation
- Erfolgsquote (führt zu Verkauf/Lösung?)
- User-Zufriedenheit
✅ Checkliste: Optimaler Agent
Nutzen Sie diese Checkliste zur Qualitätskontrolle:
Instructions:
- Spezifisch, nicht vage
- Strukturiert (Listen, Überschriften)
- Mit konkreten Beispielen
- Tools explizit erwähnt
- Do's & Don'ts definiert
- Länge: 800-2000 Zeichen
Tools:
- Nur benötigte Tools aktiv
- Keine Redundanzen
- In Instructions dokumentiert
Parameter:
- Passendes Modell (Start: gpt-4o-mini)
- Temperature sinnvoll (0.5-0.8)
- Max Output Tokens gesetzt (optional)
- Reasoning Effort: medium
Performance:
- Antwortzeit < 10 Sekunden
- Kosten pro Konversation < $0.05
- Token-Caching aktiv (sichtbar in Logs)
Qualität:
- Test-Szenarien definiert
- Alle Tests bestanden
- Logs analysiert
- Keine Halluzinationen
Sicherheit:
- Keine sensiblen Daten in Config
- Verifizierung bei kritischen Aktionen
- Datenschutz-Regeln definiert
Dokumentation:
- Description ausgefüllt
- Änderungen versioniert
- KPIs gemessen
Zusammenfassung: Top 10 Tipps
- Starten Sie mit gpt-4o-mini - Upgraden Sie nur bei Bedarf
- Instructions: Spezifisch & strukturiert - Mit Beispielen!
- Nur nötige Tools aktivieren - Weniger ist mehr
- Max Output Tokens setzen - Spart Kosten
- search_logs nutzen - Verhindert Halluzinationen
- Spezialisierte Agenten - Nicht ein Agent für alles
- Testen, testen, testen - Mit Standard-Szenarien
- Logs analysieren - Basis für Optimierung
- Dokumentieren - Description & Versionierung
- Iterieren - Kontinuierlich verbessern
Nächste Schritte
➡️ Troubleshooting - Wenn Probleme auftreten
➡️ Anwendungsbeispiele - Konkrete Praxis-Beispiele
➡️ Kosten-Management - Kosten im Detail