Was kostet RAG typischerweise?
Kosten kommen aus mehreren Schritten: Embeddings (Ingestion), Retrieval (Search), optional Reranking und dem LLM‑Aufruf (Kontext + Antwort). Die größten Hebel sind Kontext‑Länge, Top‑K und Router‑Logik.
to be continued…