Best Practices - Tipps für optimale Agenten

Dieser Leitfaden zeigt Ihnen bewährte Methoden, um Ihre Agenten optimal zu konfigurieren, Kosten zu sparen und beste Ergebnisse zu erzielen.

🎯 Instructions schreiben

1. Sei spezifisch, nicht vage

❌ Schlecht:

Sei hilfreich und beantworte Fragen.

✅ Gut:

Du bist ein Produktberater.
Stelle 2-3 gezielte Fragen (Budget, Größe, Farbe).
Präsentiere maximal 4 Produkte mit Begründung.
Antworte in 3-5 Sätzen.

2. Nutze Struktur & Listen

❌ Schlecht:

Du sollst Kunden helfen und Produkte empfehlen und bei Problemen den Support kontaktieren und höflich sein.

✅ Gut:

AUFGABE:
- Kunden bei Produktauswahl helfen
- Passende Empfehlungen geben

VERHALTEN:
- Höflich und freundlich
- Maximal 3 Fragen pro Antwort

BEI PROBLEMEN:
- An Support verweisen: support@shop.de

3. Gib konkrete Beispiele

✅ Sehr gut:

BEISPIEL-DIALOG:
Kunde: "Ich suche eine Jacke"
Du: "Gerne! Für welchen Anlass? [BUTTON:Alltag] [BUTTON:Sport] [BUTTON:Business]
Und in welchem Preisbereich? [BUTTON:Bis 50€] [BUTTON:Bis 100€]"

Beispiele helfen der KI enorm, das gewünschte Verhalten zu verstehen!

4. Erwähne Tools explizit

✅ Empfohlen:

TOOL-NUTZUNG:
- Zu Beginn: Rufe get_product_properties() EINMAL auf
- Für Suchen: Nutze product_search(query, filters)
- Für Details: Nutze get_product_details(productId)
- NIEMALS Tools raten - nutze nur aktivierte Tools

5. Definiere Do's & Don'ts klar

✅ Sehr hilfreich:

MUSS:
- Immer nach Budget fragen
- Maximal 4 Produkte gleichzeitig zeigen
- Bei Unsicherheit nachfragen

DARF NICHT:
- Rabatte versprechen
- Preise erfinden
- Persönliche Daten speichern

🛠️ Tool-Auswahl

1. Weniger ist mehr

Faustregel: Aktivieren Sie nur Tools, die Sie wirklich brauchen!

Warum?

Jedes Tool erhöht Komplexität
Längere Antwortzeiten
Höhere Token-Kosten
Mehr Fehlerquellen

Beispiel: Produktberater

✅ Nötig:
- get_product_properties (Filter laden)
- product_search (Suchen)
- get_product_details (Details)
- get_chatbot_name (Name)

❌ Unnötig:
- get_order_status (macht Produktberater nicht)
- fetch_url (nicht gebraucht)
- get_unresolved_logs (nur für Backend)

2. Redundanz vermeiden

Beispiel: Wenn Sie get_product_properties aktiv haben, brauchen Sie NICHT:

get_categories (schon in product_properties enthalten)
get_manufacturer (schon in product_properties enthalten)

3. Tool-Nutzung dokumentieren

In Instructions festhalten:

Du hast Zugriff auf:
get_product_properties - Einmal zu Beginn aufrufen
product_search - Für jede Produktsuche
get_product_details - Für Details zu 1 Produkt

💰 Kosten optimieren

1. Richtiges Modell wählen

Kosten-Vergleich (pro 1M Input Tokens):

gpt-4o-mini:  $0.15  (GÜNSTIG) ✅
o4-mini:      $1.00
gpt-4o:       $2.50  (TEUER)
gpt-5:        $5.00  (SEHR TEUER)

Empfehlung: Starten Sie mit gpt-4o-mini. Nur upgraden, wenn nötig!

2. Token-Caching nutzen

Das System cached automatisch! Aber Sie können es optimieren:

✅ Cache-freundlich:

- Stabile Instructions (nicht ständig ändern)
- Gleiche System-Prompts wiederverwenden
- get_product_properties() nur 1x pro Session

Einsparung: 50-90% der Kosten bei wiederholten Anfragen!

3. Max Output Tokens begrenzen

Ohne Limit: Agent kann 2000+ Tokens antworten
Mit Limit (500): Max 500 Tokens
→ Kosten-Ersparnis: Bis zu 75%!

Setzen in Agent-Config:

Max Output Tokens: 500 (für FAQ/Service)
Max Output Tokens: 800 (für Produktberater)
Max Output Tokens: 1500 (für Content)

4. Instructions kürzen (aber nicht zu sehr!)

Balance finden:

❌ Zu kurz (100 Zeichen):
"Sei hilfreich"
→ Schlechte Ergebnisse

✅ Optimal (800-1500 Zeichen):
Klar, strukturiert, mit Beispielen
→ Gute Ergebnisse, akzeptable Kosten

❌ Zu lang (5000+ Zeichen):
Romane mit vielen Details
→ Hohe Kosten, KI verliert Fokus

5. Reasoning Effort anpassen

low:    Schnell + günstig, aber einfacher
medium: Ausgewogen ✅ (EMPFOHLEN)
high:   Langsam + teuer, aber beste Qualität

Wann high nutzen?

Nur für komplexe Analysen
Content-Erstellung
Kritische Entscheidungen

Wann low nutzen?

Simple FAQ
Bestellstatus-Checks
Einfache Produktsuchen

⚡ Performance optimieren

1. Temperature niedrig für Konsistenz

FAQ-Bot:          0.3 (sehr konsistent)
Kundenservice:    0.5 (etwas Variation)
Produktberater:   0.7 (natürlich)
Content:          1.0 (kreativ)

Weniger Variation = Schnellere Entscheidung = Schnellere Antwort

2. Tools in Reihenfolge nutzen

In Instructions definieren:

ABLAUF:
ZUERST: get_product_properties() (nur 1x!)
DANN: product_search() mit Filtern
OPTIONAL: get_product_details() für 1-2 Produkte

3. Vermeide zu viele Tool-Calls

❌ Ineffizient:

Agent ruft auf:
get_product_properties()
product_search(query="Jacke")
get_product_details(id=1)
get_product_details(id=2)
get_product_details(id=3)
→ 5 Tool-Calls!

✅ Besser:

Agent ruft auf:
1. get_product_properties()
2. product_search(query="Jacke", limit=3)
→ 2 Tool-Calls!

In Instructions:

Nutze get_product_details() nur für EINZELNE Produkte wenn explizit gefragt.
Nutze product_search() für Listen - es liefert bereits Basis-Infos!

🎨 User Experience

1. Antworten kurz halten

✅ Gut (3-5 Sätze):

Ich habe 3 Winterjacken gefunden, die zu deinem Budget passen.
Die "Arctic Pro" ist wasserdicht und sehr warm.
Die "City Parka" ist stylish und alltagstauglich.
Welche interessiert dich?

❌ Zu lang (>10 Sätze):

Ich habe eine umfangreiche Suche in unserem Sortiment durchgeführt...
[5 weitere Sätze]
Die erste Jacke, die ich dir empfehlen möchte, ist die Arctic Pro...
[10 weitere Sätze mit allen Details]

Lösung:

In Instructions:
"Halte Antworten kurz (max. 5 Sätze)"

In Config:
Max Output Tokens: 500

2. Buttons nutzen (wenn möglich)

In Instructions:

Nutze Buttons für häufige Optionen:
[BUTTON:Ja] [BUTTON:Nein]
[BUTTON:Mehr anzeigen] [BUTTON:Andere Kategorie]

3. Struktur in Antworten

✅ Strukturiert:

Ich empfehle dir 3 Jacken:

1. Arctic Pro (89€)
   - Wasserdicht
   - Sehr warm
   - Sportlicher Stil

2. City Parka (79€)
   - Wasserabweisend
   - Alltagstauglich
   - Eleganter Look

Welche spricht dich an?

❌ Unstrukturiert:

Die Arctic Pro kostet 89€ und ist wasserdicht, sehr warm und hat einen sportlichen Stil, die City Parka kostet 79€...

🧠 Wissens-Management

1. Nutze search_logs VOR Antworten

In Instructions:

WICHTIG: Bevor du antwortest, rufe IMMER search_logs() auf!

PROZESS:
1. Kunde stellt Frage
2. Du rufst search_logs(query="Frage") auf
3. Wenn Match gefunden: Nutze diese Antwort
4. Wenn kein Match: Beantworte selbst und speichere mit log()

Vorteil:

Konsistente Antworten
Keine Halluzinationen
Wissens-DB wächst automatisch

2. Tags sinnvoll nutzen

Gute Tags:

versand
rückgabe
zahlung
produkt_details
technisch
allgemein

Schlechte Tags:

tag1
diverses
sonstiges

3. Nur öffentliche Logs für Kunden

Öffentlich (isPublic=true):
- FAQ-Antworten
- Allgemeine Shop-Infos
- Produktinformationen

Privat (isPublic=false):
- Interne Notizen
- Probleme/Bugs
- Verbesserungsvorschläge

🔒 Sicherheit & Datenschutz

1. Keine sensiblen Daten in Instructions

❌ NIEMALS:

Bei Problemen: Datenbank-Passwort ist "abc123"
Support-Zugangsdaten: admin/password

✅ Stattdessen:

Bei Problemen: Verweise an support@shop.de

2. Verbiete Daten-Weitergabe

In Instructions:

VERBOTEN:
- NIEMALS Kundendaten weitergeben (E-Mail, Adresse, Telefon)
- NIEMALS komplette Bestelldetails nennen
- NIEMALS Zahlungsinformationen preisgeben

BEI Bestellstatus:
- Nur Status und Tracking-Code
- KEINE Adresse, KEIN Name, KEINE Produkte

3. Verifizierung bei sensiblen Aktionen

Für get_order_status:

IMMER nach Bestellnummer UND PLZ fragen!

Beispiel:
Kunde: "Wo ist meine Bestellung?"
Du: "Gerne! Bitte nenne mir deine Bestellnummer und deine Postleitzahl zur Verifizierung."

📊 Testing & Iteration

1. Standard-Test-Szenarien definieren

Beispiel: Produktberater

Test 1: "Hallo"
→ Erwartung: Freundliche Begrüßung

Test 2: "Ich suche eine Jacke"
→ Erwartung: 2-3 Nachfragen (Budget, Größe, Anlass)

Test 3: "Schwarze Winterjacke, Größe L, bis 100€"
→ Erwartung: Produktsuche, 2-4 Ergebnisse

Test 4: "Was kostet Versand?"
→ Erwartung: Richtige Info (aus get_meta_information)

Test 5: "Gibst du mir 20% Rabatt?"
→ Erwartung: Höfliche Ablehnung

Nach jeder Änderung: Alle Tests durchlaufen!

2. A/B Testing

Erstellen Sie 2 Versionen:

Agent A: Temperature 0.5, gpt-4o-mini
Agent B: Temperature 0.8, gpt-4o-mini

→ Testen Sie beide
→ Vergleichen Sie Qualität
→ Wählen Sie den Besseren

3. Logs analysieren

Regelmäßig prüfen:

- Welche Fragen kommen häufig?
- Welche Tools werden oft genutzt?
- Wo macht der Agent Fehler?
- Wie viele Tokens werden verbraucht?

Basis für Optimierung!

🚀 Skalierung

1. Mehrere spezialisierte Agenten

❌ Ein Agent für alles:

"Universal-Agent"
- 20 Tools aktiv
- 3000 Zeichen Instructions
- Langsam, komplex, teuer

✅ Mehrere spezialisierte Agenten:

"Produktberater"
- 5 Tools
- 1000 Zeichen Instructions
- Schnell, fokussiert

"Kundenservice"
- 6 Tools
- 1200 Zeichen Instructions
- Spezifisch für Support

"Bestellstatus"
- 2 Tools
- 500 Zeichen Instructions
- Sehr schnell, günstig

2. Verkaufskanal-spezifische Agenten

Agent "Produktberater DE"
- Deutsch
- Verkaufskanal: Deutschland
- Euro-Preise

Agent "Product Advisor EN"
- English
- Sales Channel: United Kingdom
- Pound prices

3. Template-Agent erstellen

Erstellen Sie einen "Template-Agent" mit guter Basis-Config
Bei neuen Agenten: Kopieren Sie Instructions manuell
Passen Sie für spezifischen Zweck an
Spart Zeit und sichert Qualität

📝 Dokumentation

1. Description-Feld nutzen

In jedem Agent:

Produktberater für Winterkleidung

ERSTELLT: 2025-01-15
VERANTWORTLICH: Team Marketing
LETZTES UPDATE: 2025-01-20

VERSION 1.0:
- Basis-Setup

VERSION 1.1:
- Temperature von 0.7 auf 0.5 (konsistenter)
- Tool "get_delivery_times" hinzugefügt

VERSION 1.2:
- Instructions erweitert: Button-Nutzung

2. Änderungen versionieren

Instructions v1.2 (2025-01-20)

ÄNDERUNGEN gegenüber v1.1:
- Hinzugefügt: Explicit tool-Erwähnungen
- Entfernt: Emoji-Nutzung
- Optimiert: Kürzere Antworten (max 5 Sätze)

3. Erfolge messen

KPIs tracken:
- Durchschnittliche Antwortzeit
- Tokens pro Konversation
- Kosten pro Konversation
- Erfolgsquote (führt zu Verkauf/Lösung?)
- User-Zufriedenheit

✅ Checkliste: Optimaler Agent

Nutzen Sie diese Checkliste zur Qualitätskontrolle:

Instructions:

Tools:

Nur benötigte Tools aktiv
Keine Redundanzen
In Instructions dokumentiert

Parameter:

Passendes Modell (Start: gpt-4o-mini)
Temperature sinnvoll (0.5-0.8)
Max Output Tokens gesetzt (optional)
Reasoning Effort: medium

Performance:

Antwortzeit < 10 Sekunden
Kosten pro Konversation < $0.05
Token-Caching aktiv (sichtbar in Logs)

Qualität:

Test-Szenarien definiert
Alle Tests bestanden
Logs analysiert
Keine Halluzinationen

Sicherheit:

Keine sensiblen Daten in Config
Verifizierung bei kritischen Aktionen
Datenschutz-Regeln definiert

Dokumentation:

Description ausgefüllt
Änderungen versioniert
KPIs gemessen

Zusammenfassung: Top 10 Tipps

Starten Sie mit gpt-4o-mini - Upgraden Sie nur bei Bedarf
Instructions: Spezifisch & strukturiert - Mit Beispielen!
Nur nötige Tools aktivieren - Weniger ist mehr
Max Output Tokens setzen - Spart Kosten
search_logs nutzen - Verhindert Halluzinationen
Spezialisierte Agenten - Nicht ein Agent für alles
Testen, testen, testen - Mit Standard-Szenarien
Logs analysieren - Basis für Optimierung
Dokumentieren - Description & Versionierung
Iterieren - Kontinuierlich verbessern

Nächste Schritte

➡️ Troubleshooting - Wenn Probleme auftreten

➡️ Anwendungsbeispiele - Konkrete Praxis-Beispiele

➡️ Kosten-Management - Kosten im Detail

Best Practices - Tipps für optimale Agenten

🎯 Instructions schreiben​

1. Sei spezifisch, nicht vage​

2. Nutze Struktur & Listen​

3. Gib konkrete Beispiele​

4. Erwähne Tools explizit​

5. Definiere Do's & Don'ts klar​

🛠️ Tool-Auswahl​

1. Weniger ist mehr​

2. Redundanz vermeiden​

3. Tool-Nutzung dokumentieren​

💰 Kosten optimieren​

1. Richtiges Modell wählen​

2. Token-Caching nutzen​

3. Max Output Tokens begrenzen​

4. Instructions kürzen (aber nicht zu sehr!)​

5. Reasoning Effort anpassen​

⚡ Performance optimieren​

1. Temperature niedrig für Konsistenz​

2. Tools in Reihenfolge nutzen​

3. Vermeide zu viele Tool-Calls​

🎨 User Experience​

1. Antworten kurz halten​

2. Buttons nutzen (wenn möglich)​

3. Struktur in Antworten​

🧠 Wissens-Management​

1. Nutze search_logs VOR Antworten​

2. Tags sinnvoll nutzen​

3. Nur öffentliche Logs für Kunden​

🔒 Sicherheit & Datenschutz​

1. Keine sensiblen Daten in Instructions​

2. Verbiete Daten-Weitergabe​

3. Verifizierung bei sensiblen Aktionen​

📊 Testing & Iteration​

1. Standard-Test-Szenarien definieren​

2. A/B Testing​

3. Logs analysieren​

🚀 Skalierung​

1. Mehrere spezialisierte Agenten​

2. Verkaufskanal-spezifische Agenten​

3. Template-Agent erstellen​

📝 Dokumentation​

1. Description-Feld nutzen​

2. Änderungen versionieren​

3. Erfolge messen​

✅ Checkliste: Optimaler Agent​

Zusammenfassung: Top 10 Tipps​

Nächste Schritte​

🎯 Instructions schreiben

1. Sei spezifisch, nicht vage

2. Nutze Struktur & Listen

3. Gib konkrete Beispiele

4. Erwähne Tools explizit

5. Definiere Do's & Don'ts klar

🛠️ Tool-Auswahl

1. Weniger ist mehr

2. Redundanz vermeiden

3. Tool-Nutzung dokumentieren

💰 Kosten optimieren

1. Richtiges Modell wählen

2. Token-Caching nutzen

3. Max Output Tokens begrenzen

4. Instructions kürzen (aber nicht zu sehr!)

5. Reasoning Effort anpassen

⚡ Performance optimieren

1. Temperature niedrig für Konsistenz

2. Tools in Reihenfolge nutzen

3. Vermeide zu viele Tool-Calls

🎨 User Experience

1. Antworten kurz halten

2. Buttons nutzen (wenn möglich)

3. Struktur in Antworten

🧠 Wissens-Management

1. Nutze search_logs VOR Antworten

2. Tags sinnvoll nutzen

3. Nur öffentliche Logs für Kunden

🔒 Sicherheit & Datenschutz

1. Keine sensiblen Daten in Instructions

2. Verbiete Daten-Weitergabe

3. Verifizierung bei sensiblen Aktionen

📊 Testing & Iteration

1. Standard-Test-Szenarien definieren

2. A/B Testing

3. Logs analysieren

🚀 Skalierung

1. Mehrere spezialisierte Agenten

2. Verkaufskanal-spezifische Agenten

3. Template-Agent erstellen

📝 Dokumentation

1. Description-Feld nutzen

2. Änderungen versionieren

3. Erfolge messen

✅ Checkliste: Optimaler Agent

Zusammenfassung: Top 10 Tipps

Nächste Schritte