IV. Pipeline‑Bausteine: Chunking, Embeddings, Top‑K, Rewriting, Router, Grader

Ein RAG‑System ist eine Pipeline. Jeder Schritt kann Qualität erhöhen – oder Fehler einschleusen. Deshalb lohnt sich ein klarer, testbarer Aufbau.

Bausteine (kurz)

  • Chunking: Dokumente in sinnvolle Einheiten teilen (Größe + Overlap).
  • Embeddings: Text → Vektor (Qualität ist domänenabhängig!).
  • Top‑K: wie viele Treffer in den Kontext? (Recall vs. Rauschen).
  • Query Rewriting: Follow‑ups in klare Suchanfragen umformulieren.
  • Router: entscheidet, ob Retrieval nötig ist (oder welcher Pfad).
  • Grader/Reranker: bewertet Trefferqualität, sortiert neu.

Praxis‑Tipp: Beginne simpel (Vanilla RAG), messe, und erst dann erweitern.

to be continued…