Die Grundlage für diesen Bericht bildet der vierte Schritt der Trainingsschritte – die Modell-Validierung. Die Methode zur Berechnung der Zahlen auf diesem Dashboard ist die 10-fache Kreuzvalidierung. Sie wird verwendet, um die Kompetenzen eines Systems an neuen oder bestehenden Daten zu testen.
Dabei wird eine Vorhersage für eine Textprobe erstellt, als ob diese Textprobe neu wäre. Das heisst, diese Textprobe wurde nicht im Training verwendet.
Zuoberst werden Ihnen auch allgemeine Kennzahlen zu all Ihren Beispielen angezeigt:
Die «Genauigkeit» gibt an, wie viele Prozent all Ihrer hochgeladenen Beispiele richtig klassifiziert werden konnten. Daneben sehen Sie noch die Anzahl korrekter und fehlerhafter Klassifikationen, sowie die Gesamtzahl aller Beispiele, mit denen der Klassifikator trainiert wurde.