Zum Hauptinhalt springen

Best Practices - Tipps für optimale Agenten

Dieser Leitfaden zeigt Ihnen bewährte Methoden, um Ihre Agenten optimal zu konfigurieren, Kosten zu sparen und beste Ergebnisse zu erzielen.


🎯 Instructions schreiben

1. Sei spezifisch, nicht vage

❌ Schlecht:

Sei hilfreich und beantworte Fragen.

✅ Gut:

Du bist ein Produktberater.
Stelle 2-3 gezielte Fragen (Budget, Größe, Farbe).
Präsentiere maximal 4 Produkte mit Begründung.
Antworte in 3-5 Sätzen.

2. Nutze Struktur & Listen

❌ Schlecht:

Du sollst Kunden helfen und Produkte empfehlen und bei Problemen den Support kontaktieren und höflich sein.

✅ Gut:

AUFGABE:
- Kunden bei Produktauswahl helfen
- Passende Empfehlungen geben

VERHALTEN:
- Höflich und freundlich
- Maximal 3 Fragen pro Antwort

BEI PROBLEMEN:
- An Support verweisen: support@shop.de

3. Gib konkrete Beispiele

✅ Sehr gut:

BEISPIEL-DIALOG:
Kunde: "Ich suche eine Jacke"
Du: "Gerne! Für welchen Anlass? [BUTTON:Alltag] [BUTTON:Sport] [BUTTON:Business]
Und in welchem Preisbereich? [BUTTON:Bis 50€] [BUTTON:Bis 100€]"

Beispiele helfen der KI enorm, das gewünschte Verhalten zu verstehen!

4. Erwähne Tools explizit

✅ Empfohlen:

TOOL-NUTZUNG:
- Zu Beginn: Rufe get_product_properties() EINMAL auf
- Für Suchen: Nutze product_search(query, filters)
- Für Details: Nutze get_product_details(productId)
- NIEMALS Tools raten - nutze nur aktivierte Tools

5. Definiere Do's & Don'ts klar

✅ Sehr hilfreich:

MUSS:
- Immer nach Budget fragen
- Maximal 4 Produkte gleichzeitig zeigen
- Bei Unsicherheit nachfragen

DARF NICHT:
- Rabatte versprechen
- Preise erfinden
- Persönliche Daten speichern

🛠️ Tool-Auswahl

1. Weniger ist mehr

Faustregel: Aktivieren Sie nur Tools, die Sie wirklich brauchen!

Warum?

  • Jedes Tool erhöht Komplexität
  • Längere Antwortzeiten
  • Höhere Token-Kosten
  • Mehr Fehlerquellen

Beispiel: Produktberater

✅ Nötig:
- get_product_properties (Filter laden)
- product_search (Suchen)
- get_product_details (Details)
- get_chatbot_name (Name)

❌ Unnötig:
- get_order_status (macht Produktberater nicht)
- fetch_url (nicht gebraucht)
- get_unresolved_logs (nur für Backend)

2. Redundanz vermeiden

Beispiel: Wenn Sie get_product_properties aktiv haben, brauchen Sie NICHT:

  • get_categories (schon in product_properties enthalten)
  • get_manufacturer (schon in product_properties enthalten)

3. Tool-Nutzung dokumentieren

In Instructions festhalten:

Du hast Zugriff auf:
1. get_product_properties - Einmal zu Beginn aufrufen
2. product_search - Für jede Produktsuche
3. get_product_details - Für Details zu 1 Produkt

💰 Kosten optimieren

1. Richtiges Modell wählen

Kosten-Vergleich (pro 1M Input Tokens):

gpt-4o-mini:  $0.15  (GÜNSTIG) ✅
o4-mini: $1.00
gpt-4o: $2.50 (TEUER)
gpt-5: $5.00 (SEHR TEUER)

Empfehlung: Starten Sie mit gpt-4o-mini. Nur upgraden, wenn nötig!

2. Token-Caching nutzen

Das System cached automatisch! Aber Sie können es optimieren:

✅ Cache-freundlich:

- Stabile Instructions (nicht ständig ändern)
- Gleiche System-Prompts wiederverwenden
- get_product_properties() nur 1x pro Session

Einsparung: 50-90% der Kosten bei wiederholten Anfragen!

3. Max Output Tokens begrenzen

Ohne Limit: Agent kann 2000+ Tokens antworten
Mit Limit (500): Max 500 Tokens
→ Kosten-Ersparnis: Bis zu 75%!

Setzen in Agent-Config:

Max Output Tokens: 500 (für FAQ/Service)
Max Output Tokens: 800 (für Produktberater)
Max Output Tokens: 1500 (für Content)

4. Instructions kürzen (aber nicht zu sehr!)

Balance finden:

❌ Zu kurz (100 Zeichen):
"Sei hilfreich"
→ Schlechte Ergebnisse

✅ Optimal (800-1500 Zeichen):
Klar, strukturiert, mit Beispielen
→ Gute Ergebnisse, akzeptable Kosten

❌ Zu lang (5000+ Zeichen):
Romane mit vielen Details
→ Hohe Kosten, KI verliert Fokus

5. Reasoning Effort anpassen

low:    Schnell + günstig, aber einfacher
medium: Ausgewogen ✅ (EMPFOHLEN)
high: Langsam + teuer, aber beste Qualität

Wann high nutzen?

  • Nur für komplexe Analysen
  • Content-Erstellung
  • Kritische Entscheidungen

Wann low nutzen?

  • Simple FAQ
  • Bestellstatus-Checks
  • Einfache Produktsuchen

⚡ Performance optimieren

1. Temperature niedrig für Konsistenz

FAQ-Bot:          0.3 (sehr konsistent)
Kundenservice: 0.5 (etwas Variation)
Produktberater: 0.7 (natürlich)
Content: 1.0 (kreativ)

Weniger Variation = Schnellere Entscheidung = Schnellere Antwort

2. Tools in Reihenfolge nutzen

In Instructions definieren:

ABLAUF:
1. ZUERST: get_product_properties() (nur 1x!)
2. DANN: product_search() mit Filtern
3. OPTIONAL: get_product_details() für 1-2 Produkte

3. Vermeide zu viele Tool-Calls

❌ Ineffizient:

Agent ruft auf:
1. get_product_properties()
2. product_search(query="Jacke")
3. get_product_details(id=1)
4. get_product_details(id=2)
5. get_product_details(id=3)
→ 5 Tool-Calls!

✅ Besser:

Agent ruft auf:
1. get_product_properties()
2. product_search(query="Jacke", limit=3)
→ 2 Tool-Calls!

In Instructions:

Nutze get_product_details() nur für EINZELNE Produkte wenn explizit gefragt.
Nutze product_search() für Listen - es liefert bereits Basis-Infos!

🎨 User Experience

1. Antworten kurz halten

✅ Gut (3-5 Sätze):

Ich habe 3 Winterjacken gefunden, die zu deinem Budget passen.
Die "Arctic Pro" ist wasserdicht und sehr warm.
Die "City Parka" ist stylish und alltagstauglich.
Welche interessiert dich?

❌ Zu lang (>10 Sätze):

Ich habe eine umfangreiche Suche in unserem Sortiment durchgeführt...
[5 weitere Sätze]
Die erste Jacke, die ich dir empfehlen möchte, ist die Arctic Pro...
[10 weitere Sätze mit allen Details]

Lösung:

In Instructions:
"Halte Antworten kurz (max. 5 Sätze)"

In Config:
Max Output Tokens: 500

2. Buttons nutzen (wenn möglich)

In Instructions:

Nutze Buttons für häufige Optionen:
[BUTTON:Ja] [BUTTON:Nein]
[BUTTON:Mehr anzeigen] [BUTTON:Andere Kategorie]

3. Struktur in Antworten

✅ Strukturiert:

Ich empfehle dir 3 Jacken:

1. Arctic Pro (89€)
- Wasserdicht
- Sehr warm
- Sportlicher Stil

2. City Parka (79€)
- Wasserabweisend
- Alltagstauglich
- Eleganter Look

Welche spricht dich an?

❌ Unstrukturiert:

Die Arctic Pro kostet 89€ und ist wasserdicht, sehr warm und hat einen sportlichen Stil, die City Parka kostet 79€...

🧠 Wissens-Management

1. Nutze search_logs VOR Antworten

In Instructions:

WICHTIG: Bevor du antwortest, rufe IMMER search_logs() auf!

PROZESS:
1. Kunde stellt Frage
2. Du rufst search_logs(query="Frage") auf
3. Wenn Match gefunden: Nutze diese Antwort
4. Wenn kein Match: Beantworte selbst und speichere mit log()

Vorteil:

  • Konsistente Antworten
  • Keine Halluzinationen
  • Wissens-DB wächst automatisch

2. Tags sinnvoll nutzen

Gute Tags:

versand
rückgabe
zahlung
produkt_details
technisch
allgemein

Schlechte Tags:

tag1
diverses
sonstiges

3. Nur öffentliche Logs für Kunden

Öffentlich (isPublic=true):
- FAQ-Antworten
- Allgemeine Shop-Infos
- Produktinformationen

Privat (isPublic=false):
- Interne Notizen
- Probleme/Bugs
- Verbesserungsvorschläge

🔒 Sicherheit & Datenschutz

1. Keine sensiblen Daten in Instructions

❌ NIEMALS:

Bei Problemen: Datenbank-Passwort ist "abc123"
Support-Zugangsdaten: admin/password

✅ Stattdessen:

Bei Problemen: Verweise an support@shop.de

2. Verbiete Daten-Weitergabe

In Instructions:

VERBOTEN:
- NIEMALS Kundendaten weitergeben (E-Mail, Adresse, Telefon)
- NIEMALS komplette Bestelldetails nennen
- NIEMALS Zahlungsinformationen preisgeben

BEI Bestellstatus:
- Nur Status und Tracking-Code
- KEINE Adresse, KEIN Name, KEINE Produkte

3. Verifizierung bei sensiblen Aktionen

Für get_order_status:

IMMER nach Bestellnummer UND PLZ fragen!

Beispiel:
Kunde: "Wo ist meine Bestellung?"
Du: "Gerne! Bitte nenne mir deine Bestellnummer und deine Postleitzahl zur Verifizierung."

📊 Testing & Iteration

1. Standard-Test-Szenarien definieren

Beispiel: Produktberater

Test 1: "Hallo"
→ Erwartung: Freundliche Begrüßung

Test 2: "Ich suche eine Jacke"
→ Erwartung: 2-3 Nachfragen (Budget, Größe, Anlass)

Test 3: "Schwarze Winterjacke, Größe L, bis 100€"
→ Erwartung: Produktsuche, 2-4 Ergebnisse

Test 4: "Was kostet Versand?"
→ Erwartung: Richtige Info (aus get_meta_information)

Test 5: "Gibst du mir 20% Rabatt?"
→ Erwartung: Höfliche Ablehnung

Nach jeder Änderung: Alle Tests durchlaufen!

2. A/B Testing

Erstellen Sie 2 Versionen:

Agent A: Temperature 0.5, gpt-4o-mini
Agent B: Temperature 0.8, gpt-4o-mini

→ Testen Sie beide
→ Vergleichen Sie Qualität
→ Wählen Sie den Besseren

3. Logs analysieren

Regelmäßig prüfen:

- Welche Fragen kommen häufig?
- Welche Tools werden oft genutzt?
- Wo macht der Agent Fehler?
- Wie viele Tokens werden verbraucht?

Basis für Optimierung!


🚀 Skalierung

1. Mehrere spezialisierte Agenten

❌ Ein Agent für alles:

"Universal-Agent"
- 20 Tools aktiv
- 3000 Zeichen Instructions
- Langsam, komplex, teuer

✅ Mehrere spezialisierte Agenten:

"Produktberater"
- 5 Tools
- 1000 Zeichen Instructions
- Schnell, fokussiert

"Kundenservice"
- 6 Tools
- 1200 Zeichen Instructions
- Spezifisch für Support

"Bestellstatus"
- 2 Tools
- 500 Zeichen Instructions
- Sehr schnell, günstig

2. Verkaufskanal-spezifische Agenten

Agent "Produktberater DE"
- Deutsch
- Verkaufskanal: Deutschland
- Euro-Preise

Agent "Product Advisor EN"
- English
- Sales Channel: United Kingdom
- Pound prices

3. Template-Agent erstellen

1. Erstellen Sie einen "Template-Agent" mit guter Basis-Config
2. Bei neuen Agenten: Kopieren Sie Instructions manuell
3. Passen Sie für spezifischen Zweck an
4. Spart Zeit und sichert Qualität

📝 Dokumentation

1. Description-Feld nutzen

In jedem Agent:

Produktberater für Winterkleidung

ERSTELLT: 2025-01-15
VERANTWORTLICH: Team Marketing
LETZTES UPDATE: 2025-01-20

VERSION 1.0:
- Basis-Setup

VERSION 1.1:
- Temperature von 0.7 auf 0.5 (konsistenter)
- Tool "get_delivery_times" hinzugefügt

VERSION 1.2:
- Instructions erweitert: Button-Nutzung

2. Änderungen versionieren

Instructions v1.2 (2025-01-20)

ÄNDERUNGEN gegenüber v1.1:
- Hinzugefügt: Explicit tool-Erwähnungen
- Entfernt: Emoji-Nutzung
- Optimiert: Kürzere Antworten (max 5 Sätze)

3. Erfolge messen

KPIs tracken:
- Durchschnittliche Antwortzeit
- Tokens pro Konversation
- Kosten pro Konversation
- Erfolgsquote (führt zu Verkauf/Lösung?)
- User-Zufriedenheit

✅ Checkliste: Optimaler Agent

Nutzen Sie diese Checkliste zur Qualitätskontrolle:

Instructions:

  • Spezifisch, nicht vage
  • Strukturiert (Listen, Überschriften)
  • Mit konkreten Beispielen
  • Tools explizit erwähnt
  • Do's & Don'ts definiert
  • Länge: 800-2000 Zeichen

Tools:

  • Nur benötigte Tools aktiv
  • Keine Redundanzen
  • In Instructions dokumentiert

Parameter:

  • Passendes Modell (Start: gpt-4o-mini)
  • Temperature sinnvoll (0.5-0.8)
  • Max Output Tokens gesetzt (optional)
  • Reasoning Effort: medium

Performance:

  • Antwortzeit < 10 Sekunden
  • Kosten pro Konversation < $0.05
  • Token-Caching aktiv (sichtbar in Logs)

Qualität:

  • Test-Szenarien definiert
  • Alle Tests bestanden
  • Logs analysiert
  • Keine Halluzinationen

Sicherheit:

  • Keine sensiblen Daten in Config
  • Verifizierung bei kritischen Aktionen
  • Datenschutz-Regeln definiert

Dokumentation:

  • Description ausgefüllt
  • Änderungen versioniert
  • KPIs gemessen

Zusammenfassung: Top 10 Tipps

  1. Starten Sie mit gpt-4o-mini - Upgraden Sie nur bei Bedarf
  2. Instructions: Spezifisch & strukturiert - Mit Beispielen!
  3. Nur nötige Tools aktivieren - Weniger ist mehr
  4. Max Output Tokens setzen - Spart Kosten
  5. search_logs nutzen - Verhindert Halluzinationen
  6. Spezialisierte Agenten - Nicht ein Agent für alles
  7. Testen, testen, testen - Mit Standard-Szenarien
  8. Logs analysieren - Basis für Optimierung
  9. Dokumentieren - Description & Versionierung
  10. Iterieren - Kontinuierlich verbessern

Nächste Schritte

➡️ Troubleshooting - Wenn Probleme auftreten

➡️ Anwendungsbeispiele - Konkrete Praxis-Beispiele

➡️ Kosten-Management - Kosten im Detail