IV. Pipeline‑Bausteine: Chunking, Embeddings, Top‑K, Rewriting, Router, Grader
Ein RAG‑System ist eine Pipeline. Jeder Schritt kann Qualität erhöhen – oder Fehler einschleusen. Deshalb lohnt sich ein klarer, testbarer Aufbau.
Bausteine (kurz)
- Chunking: Dokumente in sinnvolle Einheiten teilen (Größe + Overlap).
- Embeddings: Text → Vektor (Qualität ist domänenabhängig!).
- Top‑K: wie viele Treffer in den Kontext? (Recall vs. Rauschen).
- Query Rewriting: Follow‑ups in klare Suchanfragen umformulieren.
- Router: entscheidet, ob Retrieval nötig ist (oder welcher Pfad).
- Grader/Reranker: bewertet Trefferqualität, sortiert neu.
Praxis‑Tipp: Beginne simpel (Vanilla RAG), messe, und erst dann erweitern.
to be continued…