Evals & Observability
Evals verhindern schleichende Qualitätsverluste. Observability macht sichtbar, warum eine Antwort so entstanden ist (Retrieval, Quellen, Prompt).
Was du tracken solltest
- Recall@K / Precision@K
- Faithfulness/Quellenabdeckung
- Latenz p50/p95
- Token‑Kosten pro Anfrage
to be continued…