RAG Architekturen
Es gibt nicht „die eine“ RAG‑Architektur. Je nach Frage‑Typ, Datenlage und Qualitätsanspruch wählt man unterschiedliche Muster – von „Vanilla“ bis zu agentischen Workflows.
Überblick (mit Detailseiten)
- Grundlagen & Auswahlhilfe
- Standard RAG (Vanilla)
- Conversational RAG
- Corrective RAG (CRAG)
- Adaptive RAG (Routing)
- Self‑RAG (Reflexion)
- Fusion RAG / RAGFusion
- HyDE (Hypothetical Document Embeddings)
- Agentic RAG
- GraphRAG
to be continued…
Überblick
Einordnung, Gemeinsamkeiten, typische Trade-offs und wann welche Architektur sinnvoll ist.
Standard RAG
Chunking → Embeddings → Top-K Retrieval → Kontext → Antwort.
Conversational RAG
Dialog-Kontext, Memory und Query Rewriting für Follow-ups.
Corrective RAG (CRAG)
Grader prüfen Retrieval-Qualität; bei Bedarf Nachrecherche oder alternative Quellen.
Adaptive RAG
Routing/Classifier entscheidet pro Anfrage den passenden Pfad.
Self-RAG
Das Modell reflektiert während der Antwort und triggert bei Unsicherheit neues Retrieval.
Fusion RAG / RAGFusion
Mehrere Query-Varianten, paralleles Retrieval, Rank-Fusion für höheren Recall.
HyDE
Hypothetical Document Embeddings: hypothetische Antwort erzeugen und damit suchen.
Agentic RAG
Iteratives Planen, Tool-Calls, Evidenz sammeln – erst dann antworten.
GraphRAG
Wissensgraph (Entitäten/Relationen) statt nur Textähnlichkeit – stark für Mehrhopf.