III. Retrieval & Suche: Dense, Sparse, BM25, Hybrid und Vektor‑DBs
Retrieval ist die Suchschicht in RAG. Sie entscheidet, welche Textstellen überhaupt in den Kontext kommen – und damit indirekt, wie gut die Antwort werden kann.
Die wichtigsten Sucharten
- Sparse / BM25: stark bei exakten Begriffen, IDs, Produktcodes.
- Dense Retrieval: Embeddings finden semantisch ähnliche Inhalte (Paraphrasen).
- Hybrid Search: kombiniert beides (oft der beste Default).
Warum eine Vektor‑DB?
Eine Vector DB speichert Embeddings + Metadaten und bietet schnelle ANN‑Suche, Filter (z. B. Version/Datum) und Skalierung. Für kleine Datenmengen kann auch ein einfacher Index reichen – wichtig ist saubere Metadaten‑Strategie.
to be continued…