Zum Hauptinhalt springen

Vector Stores - Eigene Dokumente als Wissensquelle

Vector Stores ermöglichen es Ihrem Agenten, eigene Dokumente als Wissensquelle zu nutzen – PDFs, Textdateien, FAQs und mehr.


Was ist ein Vector Store?

Ein Vector Store ist eine Wissens-Datenbank, die:

  • Dokumente speichert und durchsuchbar macht
  • Text in mathematische "Vektoren" umwandelt
  • Semantische Suche ermöglicht (nach Bedeutung, nicht nur Keywords)
  • Von OpenAI verwaltet wird

Einfach erklärt: Stellen Sie sich vor, Sie laden Ihre Produktkataloge, FAQs oder Handbücher hoch. Der Agent kann dann in diesen Dokumenten "nachschlagen" wenn er Informationen braucht.


Anwendungsfälle

📚 Produkt-Dokumentation

Hochladen: Produkthandbücher, Spezifikationen, Kataloge
Agent kann: Technische Details nachschlagen, Features erklären

❓ FAQ-Datenbank

Hochladen: FAQ-Dokument mit Fragen & Antworten
Agent kann: Konsistente Antworten auf häufige Fragen geben

📋 Richtlinien & Policies

Hochladen: Rückgabebedingungen, Versandrichtlinien, AGB
Agent kann: Korrekte Informationen zu Policies geben

🏢 Unternehmens-Wissen

Hochladen: Schulungsmaterialien, interne Docs
Agent kann: Mitarbeiter-Wissen abrufen

Vector Store erstellen

Schritt 1: OpenAI Dashboard öffnen

  1. Gehen Sie zu platform.openai.com
  2. Melden Sie sich an
  3. Navigieren Sie zu StorageVector Stores
  4. Oder direkt: platform.openai.com/storage/vector_stores

Schritt 2: Neuen Vector Store erstellen

  1. Klicken Sie auf "+ Create vector store"
  2. Ein Dialog öffnet sich

Schritt 3: Name vergeben

Name: Geben Sie einen beschreibenden Namen ein

Beispiele:
- "Produktkatalog Winterkollektion 2025"
- "FAQ Kundenservice"
- "Technische Dokumentation"
- "Rückgabe- und Versandrichtlinien"

Tipp: Wählen Sie Namen, die später leicht zuzuordnen sind.

Schritt 4: Dateien hochladen

Unterstützte Dateiformate:

  • PDF (.pdf) - Ideal für Dokumente, Kataloge
  • Text (.txt) - Einfache Textdateien
  • Markdown (.md) - Formatierte Texte
  • Word (.docx) - Microsoft Word Dokumente
  • HTML (.html) - Webseiten-Inhalte

Datei-Limits:

  • Max. Dateigröße: 512 MB pro Datei
  • Max. Anzahl: 10.000 Dateien pro Vector Store
  • Max. Gesamtgröße: Abhängig von Ihrem OpenAI-Plan

Upload-Prozess:

  1. Klicken Sie auf "Upload files" oder ziehen Sie Dateien per Drag & Drop
  2. Wählen Sie eine oder mehrere Dateien aus
  3. Warten Sie, bis der Upload abgeschlossen ist
  4. Status: "Uploading" → "Processing" → "Completed"
Mehrere Dateien

Sie können mehrere Dateien gleichzeitig hochladen! Ideal, wenn Sie z.B. einen kompletten Produktkatalog mit 50 PDFs haben.

Schritt 5: Verarbeitung abwarten

OpenAI verarbeitet die Dateien automatisch:

  1. Chunking: Dokument wird in kleine Abschnitte unterteilt
  2. Embedding: Jeder Abschnitt wird in einen Vektor umgewandelt
  3. Indexing: Vektoren werden durchsuchbar gemacht

Dauer:

  • Kleine Datei (10 Seiten): ~30 Sekunden
  • Große Datei (500 Seiten): ~5-10 Minuten
  • Viele Dateien: Entsprechend länger

Status prüfen:

  • Completed ✅ - Fertig, einsatzbereit
  • Processing ⏳ - Wird verarbeitet, warten
  • Failed ❌ - Fehler aufgetreten

Schritt 6: Vector Store ID kopieren

Nach erfolgreicher Verarbeitung:

  1. Öffnen Sie den Vector Store
  2. Finden Sie die Vector Store ID
  3. Format: vs_abc123...
  4. Klicken Sie auf "Copy ID"

Vector Store mit Agent verknüpfen

Im Shopware-Backend:

  1. Gehen Sie zu 5E OAI Agent Manager
  2. Öffnen Sie Ihren Agenten (oder erstellen Sie einen neuen)
  3. Finden Sie das Feld "Vector Store ID"
  4. Fügen Sie die kopierte ID ein: vs_abc123...
  5. Speichern Sie
Verknüpft!

Ihr Agent kann jetzt auf die Dokumente im Vector Store zugreifen!


Vector Store in Instructions erwähnen

Wichtig: Sagen Sie Ihrem Agenten, dass er die Dokumente nutzen soll!

Beispiel: System Instructions

Du hast Zugriff auf unseren Produktkatalog über einen Vector Store.

WICHTIG:
- Nutze die Informationen aus dem Vector Store für Produktdetails
- Wenn nach spezifischen Produkteigenschaften gefragt wird, suche ZUERST im Vector Store
- Gib niemals Informationen, die NICHT im Vector Store stehen
- Wenn etwas nicht in den Dokumenten steht, sage ehrlich: "Diese Information habe ich nicht"

BEISPIEL:
Kunde: "Hat die Jacke X eine Kapuze?"
Du: [Suche im Vector Store nach "Jacke X" und "Kapuze"]
Du: "Ja, die Jacke X hat eine abnehmbare Kapuze mit Fellbesatz"

Beispiel: FAQ-Agent

Du hast Zugriff auf unsere FAQ-Datenbank im Vector Store.

PROZESS:
1. Bei jeder Frage: Suche ZUERST im Vector Store
2. Nutze die exakte Antwort aus dem FAQ
3. Wenn keine passende FAQ gefunden: Nutze andere Tools oder verweise an Support

Antworte NIEMALS basierend auf deinem allgemeinen Wissen, wenn es um Shop-spezifische Fragen geht!

Best Practices für Dokumente

1. Struktur & Formatierung

Gut strukturiert:

# Produktname: Winterjacke Premium

## Beschreibung
Eine hochwertige Winterjacke für extreme Kälte.

## Eigenschaften
- Material: 100% Polyester
- Fütterung: 90% Daunen, 10% Federn
- Wassersäule: 10.000 mm
- Atmungsaktivität: 8.000 g/m²/24h
- Kapuze: Ja, abnehmbar
- Taschen: 4 (2 außen, 2 innen)

## Größen
S, M, L, XL, XXL

## Pflege
- Maschinenwäsche bei 30°C
- Nicht bleichen
- Nicht im Trockner

Schlecht strukturiert:

Winterjacke Premium, Polyester, Daunen, wasserdicht, Kapuze,
4 Taschen, 30 Grad waschen, Größen S-XXL

2. Klare Überschriften

✅ Nutzen Sie Überschriften (H1, H2, H3) ✅ Strukturieren Sie logisch ✅ Verwenden Sie Listen ✅ Trennen Sie Themen klar

3. Redundanz vermeiden

Nicht: Gleiche Information in 10 Dokumenten ✅ Besser: Ein zentrales Dokument pro Thema

4. Aktualität sicherstellen

  • Aktualisieren Sie Dokumente regelmäßig
  • Löschen Sie veraltete Informationen
  • Versionieren Sie Dokumente (z.B. "FAQ_v2_2025.pdf")

5. Dateigröße optimieren

Für PDFs:

  • Komprimieren Sie Bilder
  • Entfernen Sie unnötige Seiten
  • Nutzen Sie Text-PDFs (kein eingescannter Text!)

Optimal:

  • 1-50 Seiten pro Dokument
  • 1-5 MB pro Datei
  • Text durchsuchbar

Mehrere Vector Stores nutzen

Achtung: Aktuell kann ein Agent nur EINEN Vector Store haben.

Workaround für mehrere Wissensquellen:

  1. Alles in einem Vector Store:

    • Laden Sie alle Dokumente in EINEN Vector Store
    • Nutzen Sie klare Dateinamen zur Organisation
  2. Mehrere Agenten:

    • Agent A: Vector Store "Produkte"
    • Agent B: Vector Store "Support"
    • Agent C: Vector Store "Policies"

Vector Store verwalten

Dateien hinzufügen

  1. Öffnen Sie den Vector Store in OpenAI
  2. Klicken Sie auf "Add files"
  3. Laden Sie neue Dateien hoch
  4. Warten Sie auf Verarbeitung

Dateien löschen

  1. Öffnen Sie den Vector Store
  2. Wählen Sie die Datei aus
  3. Klicken Sie auf "Delete"
  4. Bestätigen Sie
Vorsicht!

Gelöschte Dateien können nicht wiederhergestellt werden!

Vector Store löschen

  1. Gehen Sie zur Vector Stores Übersicht
  2. Wählen Sie den Vector Store
  3. Klicken Sie auf "Delete vector store"
  4. Bestätigen Sie

Wichtig: Entfernen Sie die ID zuerst aus Ihrem Agenten in Shopware!


Kosten

Vector Store Kosten

OpenAI berechnet für Vector Stores:

Speicherung: ~$0.10 per GB pro Tag

Beispiel-Rechnung:

10 PDF-Dateien à 5 MB = 50 MB = 0.05 GB
Kosten pro Tag: 0.05 GB × $0.10 = $0.005 (halber Cent)
Kosten pro Monat: $0.005 × 30 = $0.15

Fazit: Vector Stores sind sehr günstig!

Nutzungs-Kosten

Wenn der Agent im Vector Store sucht, entstehen zusätzliche Kosten:

  • Embedding-Kosten: ~$0.00002 pro Suche
  • Token-Kosten: Gefundene Texte zählen als Input-Tokens

Aber: Durch gute Antworten sparen Sie oft mehr, als die Suche kostet!


Troubleshooting

Problem: "Vector store not found"

Lösung:

  1. Prüfen Sie die ID (Format: vs_abc123...)
  2. Prüfen Sie, ob der Vector Store noch in OpenAI existiert
  3. Kopieren Sie die ID erneut

Problem: Dateien werden nicht verarbeitet

Ursachen:

  • Dateiformat nicht unterstützt
  • Datei ist beschädigt
  • Datei zu groß (> 512 MB)
  • PDF ist geschützt/verschlüsselt

Lösung:

  • Konvertieren Sie in unterstütztes Format
  • Reparieren Sie die Datei
  • Teilen Sie große Dateien
  • Entfernen Sie Passwort-Schutz

Problem: Agent findet Informationen nicht

Lösungen:

  1. Suche ist zu spezifisch:

    • Vector Store sucht semantisch, nicht keyword-basiert
    • Formulieren Sie Fragen breiter
  2. Information nicht vorhanden:

    • Prüfen Sie, ob die Info wirklich im Dokument steht
    • Nutzen Sie Strg+F im Original-Dokument
  3. Dokument schlecht strukturiert:

    • Verbessern Sie die Struktur
    • Nutzen Sie Überschriften
    • Laden Sie neu hoch
  4. In Instructions erwähnen:

    Nutze den Vector Store für Produktinformationen.
    Suche IMMER zuerst im Vector Store bevor du antwortest.

Fortgeschrittene Techniken

Chunk-Strategie

Vector Stores unterteilen Dokumente in "Chunks" (Abschnitte).

Optimale Chunk-Größe:

  • Ein Chunk = 1 logischer Abschnitt
  • Nutzen Sie Überschriften zur Trennung
  • Vermeiden Sie zu lange Absätze (> 500 Wörter)

Beispiel: Gut strukturiert

## Produktname

Beschreibung (100-200 Wörter)

## Features

- Feature 1
- Feature 2

## Spezifikationen

| Eigenschaft | Wert |
|-------------|------|
| Material | Polyester |

Metadaten nutzen

In Dateinamen können Sie Metadaten codieren:

Produkt_Winterjacke_Premium_Kategorie_Outdoor.pdf
FAQ_Versand_Deutschland_2025.pdf
Richtlinie_Rückgabe_EU.pdf

Das hilft bei der Organisation großer Vector Stores.


Alternativen zu Vector Stores

Falls Vector Stores für Ihren Anwendungsfall nicht passen:

1. get_meta_information Tool

Für: Kurze Shop-Infos (Kontakt, Öffnungszeiten)
Vorteil: Schneller, einfacher
Nachteil: Begrenzt auf Plugin-Config-Feld

2. fetch_url Tool

Für: Dynamische Inhalte von Ihrer Webseite
Vorteil: Immer aktuell
Nachteil: Langsamere Antworten, externe Abhängigkeit

3. search_logs Tool

Für: Selbstlernende FAQ-Datenbank
Vorteil: Wächst automatisch
Nachteil: Braucht Zeit zum Aufbau

4. Hardcodiert in Instructions

Für: Wenige, statische Informationen
Vorteil: Sehr schnell, keine extra Kosten
Nachteil: Instructions werden lang, schwer zu pflegen

Zusammenfassung: Vector Stores Checkliste

  • OpenAI Vector Store erstellt
  • Dokumente hochgeladen (PDF, TXT, etc.)
  • Verarbeitung abgeschlossen (Status: Completed)
  • Vector Store ID kopiert
  • ID in Agent-Konfiguration eingetragen
  • In Instructions erwähnt ("Nutze Vector Store für...")
  • Im Backend-Chat getestet
  • Antwort-Qualität geprüft
  • Dokumente bei Bedarf optimiert

Nächste Schritte

➡️ Logs & Monitoring - Nutzung nachverfolgen

➡️ Wissens-Management - Selbstlernende Agents

➡️ Best Practices - Optimierungs-Tipps