Vector Stores - Eigene Dokumente als Wissensquelle
Vector Stores ermöglichen es Ihrem Agenten, eigene Dokumente als Wissensquelle zu nutzen – PDFs, Textdateien, FAQs und mehr.
Was ist ein Vector Store?
Ein Vector Store ist eine Wissens-Datenbank, die:
- Dokumente speichert und durchsuchbar macht
- Text in mathematische "Vektoren" umwandelt
- Semantische Suche ermöglicht (nach Bedeutung, nicht nur Keywords)
- Von OpenAI verwaltet wird
Einfach erklärt: Stellen Sie sich vor, Sie laden Ihre Produktkataloge, FAQs oder Handbücher hoch. Der Agent kann dann in diesen Dokumenten "nachschlagen" wenn er Informationen braucht.
Anwendungsfälle
📚 Produkt-Dokumentation
Hochladen: Produkthandbücher, Spezifikationen, Kataloge
Agent kann: Technische Details nachschlagen, Features erklären
❓ FAQ-Datenbank
Hochladen: FAQ-Dokument mit Fragen & Antworten
Agent kann: Konsistente Antworten auf häufige Fragen geben
📋 Richtlinien & Policies
Hochladen: Rückgabebedingungen, Versandrichtlinien, AGB
Agent kann: Korrekte Informationen zu Policies geben
🏢 Unternehmens-Wissen
Hochladen: Schulungsmaterialien, interne Docs
Agent kann: Mitarbeiter-Wissen abrufen
Vector Store erstellen
Schritt 1: OpenAI Dashboard öffnen
- Gehen Sie zu platform.openai.com
- Melden Sie sich an
- Navigieren Sie zu Storage → Vector Stores
- Oder direkt: platform.openai.com/storage/vector_stores
Schritt 2: Neuen Vector Store erstellen
- Klicken Sie auf "+ Create vector store"
- Ein Dialog öffnet sich
Schritt 3: Name vergeben
Name: Geben Sie einen beschreibenden Namen ein
Beispiele:
- "Produktkatalog Winterkollektion 2025"
- "FAQ Kundenservice"
- "Technische Dokumentation"
- "Rückgabe- und Versandrichtlinien"
Tipp: Wählen Sie Namen, die später leicht zuzuordnen sind.
Schritt 4: Dateien hochladen
Unterstützte Dateiformate:
- PDF (.pdf) - Ideal für Dokumente, Kataloge
- Text (.txt) - Einfache Textdateien
- Markdown (.md) - Formatierte Texte
- Word (.docx) - Microsoft Word Dokumente
- HTML (.html) - Webseiten-Inhalte
Datei-Limits:
- Max. Dateigröße: 512 MB pro Datei
- Max. Anzahl: 10.000 Dateien pro Vector Store
- Max. Gesamtgröße: Abhängig von Ihrem OpenAI-Plan
Upload-Prozess:
- Klicken Sie auf "Upload files" oder ziehen Sie Dateien per Drag & Drop
- Wählen Sie eine oder mehrere Dateien aus
- Warten Sie, bis der Upload abgeschlossen ist
- Status: "Uploading" → "Processing" → "Completed"
Sie können mehrere Dateien gleichzeitig hochladen! Ideal, wenn Sie z.B. einen kompletten Produktkatalog mit 50 PDFs haben.
Schritt 5: Verarbeitung abwarten
OpenAI verarbeitet die Dateien automatisch:
- Chunking: Dokument wird in kleine Abschnitte unterteilt
- Embedding: Jeder Abschnitt wird in einen Vektor umgewandelt
- Indexing: Vektoren werden durchsuchbar gemacht
Dauer:
- Kleine Datei (10 Seiten): ~30 Sekunden
- Große Datei (500 Seiten): ~5-10 Minuten
- Viele Dateien: Entsprechend länger
Status prüfen:
- Completed ✅ - Fertig, einsatzbereit
- Processing ⏳ - Wird verarbeitet, warten
- Failed ❌ - Fehler aufgetreten
Schritt 6: Vector Store ID kopieren
Nach erfolgreicher Verarbeitung:
- Öffnen Sie den Vector Store
- Finden Sie die Vector Store ID
- Format:
vs_abc123... - Klicken Sie auf "Copy ID"
Vector Store mit Agent verknüpfen
Im Shopware-Backend:
- Gehen Sie zu 5E OAI Agent Manager
- Öffnen Sie Ihren Agenten (oder erstellen Sie einen neuen)
- Finden Sie das Feld "Vector Store ID"
- Fügen Sie die kopierte ID ein:
vs_abc123... - Speichern Sie
Ihr Agent kann jetzt auf die Dokumente im Vector Store zugreifen!
Vector Store in Instructions erwähnen
Wichtig: Sagen Sie Ihrem Agenten, dass er die Dokumente nutzen soll!
Beispiel: System Instructions
Du hast Zugriff auf unseren Produktkatalog über einen Vector Store.
WICHTIG:
- Nutze die Informationen aus dem Vector Store für Produktdetails
- Wenn nach spezifischen Produkteigenschaften gefragt wird, suche ZUERST im Vector Store
- Gib niemals Informationen, die NICHT im Vector Store stehen
- Wenn etwas nicht in den Dokumenten steht, sage ehrlich: "Diese Information habe ich nicht"
BEISPIEL:
Kunde: "Hat die Jacke X eine Kapuze?"
Du: [Suche im Vector Store nach "Jacke X" und "Kapuze"]
Du: "Ja, die Jacke X hat eine abnehmbare Kapuze mit Fellbesatz"
Beispiel: FAQ-Agent
Du hast Zugriff auf unsere FAQ-Datenbank im Vector Store.
PROZESS:
1. Bei jeder Frage: Suche ZUERST im Vector Store
2. Nutze die exakte Antwort aus dem FAQ
3. Wenn keine passende FAQ gefunden: Nutze andere Tools oder verweise an Support
Antworte NIEMALS basierend auf deinem allgemeinen Wissen, wenn es um Shop-spezifische Fragen geht!
Best Practices für Dokumente
1. Struktur & Formatierung
Gut strukturiert:
# Produktname: Winterjacke Premium
## Beschreibung
Eine hochwertige Winterjacke für extreme Kälte.
## Eigenschaften
- Material: 100% Polyester
- Fütterung: 90% Daunen, 10% Federn
- Wassersäule: 10.000 mm
- Atmungsaktivität: 8.000 g/m²/24h
- Kapuze: Ja, abnehmbar
- Taschen: 4 (2 außen, 2 innen)
## Größen
S, M, L, XL, XXL
## Pflege
- Maschinenwäsche bei 30°C
- Nicht bleichen
- Nicht im Trockner
Schlecht strukturiert:
Winterjacke Premium, Polyester, Daunen, wasserdicht, Kapuze,
4 Taschen, 30 Grad waschen, Größen S-XXL
2. Klare Überschriften
✅ Nutzen Sie Überschriften (H1, H2, H3) ✅ Strukturieren Sie logisch ✅ Verwenden Sie Listen ✅ Trennen Sie Themen klar
3. Redundanz vermeiden
❌ Nicht: Gleiche Information in 10 Dokumenten ✅ Besser: Ein zentrales Dokument pro Thema
4. Aktualität sicherstellen
- Aktualisieren Sie Dokumente regelmäßig
- Löschen Sie veraltete Informationen
- Versionieren Sie Dokumente (z.B. "FAQ_v2_2025.pdf")
5. Dateigröße optimieren
Für PDFs:
- Komprimieren Sie Bilder
- Entfernen Sie unnötige Seiten
- Nutzen Sie Text-PDFs (kein eingescannter Text!)
Optimal:
- 1-50 Seiten pro Dokument
- 1-5 MB pro Datei
- Text durchsuchbar
Mehrere Vector Stores nutzen
Achtung: Aktuell kann ein Agent nur EINEN Vector Store haben.
Workaround für mehrere Wissensquellen:
Alles in einem Vector Store:
- Laden Sie alle Dokumente in EINEN Vector Store
- Nutzen Sie klare Dateinamen zur Organisation
Mehrere Agenten:
- Agent A: Vector Store "Produkte"
- Agent B: Vector Store "Support"
- Agent C: Vector Store "Policies"
Vector Store verwalten
Dateien hinzufügen
- Öffnen Sie den Vector Store in OpenAI
- Klicken Sie auf "Add files"
- Laden Sie neue Dateien hoch
- Warten Sie auf Verarbeitung
Dateien löschen
- Öffnen Sie den Vector Store
- Wählen Sie die Datei aus
- Klicken Sie auf "Delete"
- Bestätigen Sie
Gelöschte Dateien können nicht wiederhergestellt werden!
Vector Store löschen
- Gehen Sie zur Vector Stores Übersicht
- Wählen Sie den Vector Store
- Klicken Sie auf "Delete vector store"
- Bestätigen Sie
Wichtig: Entfernen Sie die ID zuerst aus Ihrem Agenten in Shopware!
Kosten
Vector Store Kosten
OpenAI berechnet für Vector Stores:
Speicherung: ~$0.10 per GB pro Tag
Beispiel-Rechnung:
10 PDF-Dateien à 5 MB = 50 MB = 0.05 GB
Kosten pro Tag: 0.05 GB × $0.10 = $0.005 (halber Cent)
Kosten pro Monat: $0.005 × 30 = $0.15
Fazit: Vector Stores sind sehr günstig!
Nutzungs-Kosten
Wenn der Agent im Vector Store sucht, entstehen zusätzliche Kosten:
- Embedding-Kosten: ~$0.00002 pro Suche
- Token-Kosten: Gefundene Texte zählen als Input-Tokens
Aber: Durch gute Antworten sparen Sie oft mehr, als die Suche kostet!
Troubleshooting
Problem: "Vector store not found"
Lösung:
- Prüfen Sie die ID (Format:
vs_abc123...) - Prüfen Sie, ob der Vector Store noch in OpenAI existiert
- Kopieren Sie die ID erneut
Problem: Dateien werden nicht verarbeitet
Ursachen:
- Dateiformat nicht unterstützt
- Datei ist beschädigt
- Datei zu groß (> 512 MB)
- PDF ist geschützt/verschlüsselt
Lösung:
- Konvertieren Sie in unterstütztes Format
- Reparieren Sie die Datei
- Teilen Sie große Dateien
- Entfernen Sie Passwort-Schutz
Problem: Agent findet Informationen nicht
Lösungen:
Suche ist zu spezifisch:
- Vector Store sucht semantisch, nicht keyword-basiert
- Formulieren Sie Fragen breiter
Information nicht vorhanden:
- Prüfen Sie, ob die Info wirklich im Dokument steht
- Nutzen Sie Strg+F im Original-Dokument
Dokument schlecht strukturiert:
- Verbessern Sie die Struktur
- Nutzen Sie Überschriften
- Laden Sie neu hoch
In Instructions erwähnen:
Nutze den Vector Store für Produktinformationen.
Suche IMMER zuerst im Vector Store bevor du antwortest.
Fortgeschrittene Techniken
Chunk-Strategie
Vector Stores unterteilen Dokumente in "Chunks" (Abschnitte).
Optimale Chunk-Größe:
- Ein Chunk = 1 logischer Abschnitt
- Nutzen Sie Überschriften zur Trennung
- Vermeiden Sie zu lange Absätze (> 500 Wörter)
Beispiel: Gut strukturiert
## Produktname
Beschreibung (100-200 Wörter)
## Features
- Feature 1
- Feature 2
## Spezifikationen
| Eigenschaft | Wert |
|-------------|------|
| Material | Polyester |
Metadaten nutzen
In Dateinamen können Sie Metadaten codieren:
Produkt_Winterjacke_Premium_Kategorie_Outdoor.pdf
FAQ_Versand_Deutschland_2025.pdf
Richtlinie_Rückgabe_EU.pdf
Das hilft bei der Organisation großer Vector Stores.
Alternativen zu Vector Stores
Falls Vector Stores für Ihren Anwendungsfall nicht passen:
1. get_meta_information Tool
Für: Kurze Shop-Infos (Kontakt, Öffnungszeiten)
Vorteil: Schneller, einfacher
Nachteil: Begrenzt auf Plugin-Config-Feld
2. fetch_url Tool
Für: Dynamische Inhalte von Ihrer Webseite
Vorteil: Immer aktuell
Nachteil: Langsamere Antworten, externe Abhängigkeit
3. search_logs Tool
Für: Selbstlernende FAQ-Datenbank
Vorteil: Wächst automatisch
Nachteil: Braucht Zeit zum Aufbau
4. Hardcodiert in Instructions
Für: Wenige, statische Informationen
Vorteil: Sehr schnell, keine extra Kosten
Nachteil: Instructions werden lang, schwer zu pflegen
Zusammenfassung: Vector Stores Checkliste
- OpenAI Vector Store erstellt
- Dokumente hochgeladen (PDF, TXT, etc.)
- Verarbeitung abgeschlossen (Status: Completed)
- Vector Store ID kopiert
- ID in Agent-Konfiguration eingetragen
- In Instructions erwähnt ("Nutze Vector Store für...")
- Im Backend-Chat getestet
- Antwort-Qualität geprüft
- Dokumente bei Bedarf optimiert
Nächste Schritte
➡️ Logs & Monitoring - Nutzung nachverfolgen
➡️ Wissens-Management - Selbstlernende Agents
➡️ Best Practices - Optimierungs-Tipps