Das Ziel der Konfusionsmatrix ist es, Ihnen Anhaltspunkte für die Verbesserung Ihres Klassifikators und Ihrer Datenqualität zu liefern. In der Konfusionsmatrix werden die Kategorien auf einer noch tieferen Detailebene analysiert. Sie gibt zudem noch mehr Transparenz in Bezug auf die Ergebnisse von Precision, Recall und F1-Mass.
Die Konfusionsmatrix ist aus den zwei Achsen «Tatsächliche Kategorie» und «Vorausgesagte Kategorie» aufgebaut. Aus den vorausgesagten Kategorien lässt sich der Precision Wert berechnen (= Diagonalelement/Summe der Spalte), aus den tatsächlichen Kategorien der Recall Wert (= Diagonalelement/Summe der Zeile).
Die blaue Diagonale zeigt die Anzahl der korrekt klassifizierten Beispiele pro Kategorie an. In allen anderen Feldern wurden die Beispiele fehlerhaft klassifiziert. Die farblich anders gekennzeichneten Felder weisen auf eine besonders hohe Anzahl an Beispielen hin, die nicht richtig klassifiziert werden konnten.
Die Konfusionsmatrix bietet zwei Interaktionsmöglichkeiten:
- Durch Mouse-over erhalten Sie einen Überblick darüber, welcher Kategorie die Beispiele in einem Feld angehören und wie die Kategorie-Vorhersage für diese Beispiele lautet.
- Das inverse Feld wird hervorgehoben. Dabei handelt es sich um die gleichen Kategorien in umgekehrter Reihenfolge. Mit einem Klick auf ein Feld öffnen sich die in diesem Feld enthaltenen Beispiele unterhalb der Konfusionsmatrix.