II. Grundlagen: Was RAG leistet – und was nicht
RAG kombiniert zwei Welten: (1) Retrieval findet relevante Textstellen, (2) das LLM formuliert daraus eine Antwort. Entscheidend ist dabei die Trennung von Wissen (Dokumente) und Sprache (Formulierung).
Was RAG typischerweise verbessert
- Aktualität: neue Dokumente können ohne Modell‑Training genutzt werden.
- Domain‑Wissen: interne Begriffe, Produktnamen, Prozessschritte.
- Nachvollziehbarkeit: Antwort kann auf Quellen/Passagen verweisen.
Was RAG nicht automatisch löst
- Schlechte Dokumentqualität (Widersprüche, veraltete PDFs).
- Unklare Fragen (brauchen oft Query Rewriting oder Rückfragen).
- Falsches Chunking/Ranking (führt zu „falschem Kontext“).
to be continued…