Zurück zum Glossar/Evaluierung & Qualität

Definierter Begriff

Confidence-Score

Ein Skalar, der schätzt, wie zuverlässig der Output eines Modells für einen gegebenen Input ist.

Confidence-Scores kommen aus Logprobs, kalibrierten Klassifikatoren, Ensemble-Agreement oder Grounding-Stärke. Sie treiben Routing-Entscheidungen: Hohe Confidence fließt durch, niedrige Confidence wird zur Reviewer-Queue geroutet. Die Kalibrierung von Confidence-Scores gegen reale Outcomes ist Teil des Evaluation-Harness-Lifecycles.

Verwandte Begriffe

Wir nutzen das jede Woche

30-Minuten-Gespräch buchen

Buchen Sie ein 30-Minuten-Gespräch und wir zeigen Ihnen, wie Confidence-Score in einem laufenden Engagement aussieht.

30-Minuten-Gespräch buchen