II. Grundlagen: Was RAG leistet – und was nicht

RAG kombiniert zwei Welten: (1) Retrieval findet relevante Textstellen, (2) das LLM formuliert daraus eine Antwort. Entscheidend ist dabei die Trennung von Wissen (Dokumente) und Sprache (Formulierung).

Was RAG typischerweise verbessert

  • Aktualität: neue Dokumente können ohne Modell‑Training genutzt werden.
  • Domain‑Wissen: interne Begriffe, Produktnamen, Prozessschritte.
  • Nachvollziehbarkeit: Antwort kann auf Quellen/Passagen verweisen.

Was RAG nicht automatisch löst

  • Schlechte Dokumentqualität (Widersprüche, veraltete PDFs).
  • Unklare Fragen (brauchen oft Query Rewriting oder Rückfragen).
  • Falsches Chunking/Ranking (führt zu „falschem Kontext“).

to be continued…