RAG Architekturen

Es gibt nicht „die eine“ RAG‑Architektur. Je nach Frage‑Typ, Datenlage und Qualitätsanspruch wählt man unterschiedliche Muster – von „Vanilla“ bis zu agentischen Workflows.

Überblick (mit Detailseiten)

to be continued…

Überblick

Einordnung, Gemeinsamkeiten, typische Trade-offs und wann welche Architektur sinnvoll ist.

Standard RAG

Chunking → Embeddings → Top-K Retrieval → Kontext → Antwort.

Conversational RAG

Dialog-Kontext, Memory und Query Rewriting für Follow-ups.

Corrective RAG (CRAG)

Grader prüfen Retrieval-Qualität; bei Bedarf Nachrecherche oder alternative Quellen.

Adaptive RAG

Routing/Classifier entscheidet pro Anfrage den passenden Pfad.

Self-RAG

Das Modell reflektiert während der Antwort und triggert bei Unsicherheit neues Retrieval.

Fusion RAG / RAGFusion

Mehrere Query-Varianten, paralleles Retrieval, Rank-Fusion für höheren Recall.

HyDE

Hypothetical Document Embeddings: hypothetische Antwort erzeugen und damit suchen.

Agentic RAG

Iteratives Planen, Tool-Calls, Evidenz sammeln – erst dann antworten.

GraphRAG

Wissensgraph (Entitäten/Relationen) statt nur Textähnlichkeit – stark für Mehrhopf.