Evals & Observability

Evals verhindern schleichende Qualitätsverluste. Observability macht sichtbar, warum eine Antwort so entstanden ist (Retrieval, Quellen, Prompt).

Was du tracken solltest

  • Recall@K / Precision@K
  • Faithfulness/Quellenabdeckung
  • Latenz p50/p95
  • Token‑Kosten pro Anfrage

to be continued…