III. Retrieval & Suche: Dense, Sparse, BM25, Hybrid und Vektor‑DBs

Retrieval ist die Suchschicht in RAG. Sie entscheidet, welche Textstellen überhaupt in den Kontext kommen – und damit indirekt, wie gut die Antwort werden kann.

Die wichtigsten Sucharten

  • Sparse / BM25: stark bei exakten Begriffen, IDs, Produktcodes.
  • Dense Retrieval: Embeddings finden semantisch ähnliche Inhalte (Paraphrasen).
  • Hybrid Search: kombiniert beides (oft der beste Default).

Warum eine Vektor‑DB?

Eine Vector DB speichert Embeddings + Metadaten und bietet schnelle ANN‑Suche, Filter (z. B. Version/Datum) und Skalierung. Für kleine Datenmengen kann auch ein einfacher Index reichen – wichtig ist saubere Metadaten‑Strategie.

to be continued…