Auf dem Konfigurations-Tab haben Sie die Möglichkeit, eigene Grenzwerte (Thresholds) für die Klassifikation festzulegen. Grenzwerte erlauben es, eine minimale Wahrscheinlichkeit für die Klassifikation von Texten zu definieren. Wird diese nicht erreicht, so wird keine Klassifikation vorgenommen.
Hier erklären wir Ihnen Schritt für Schritt, wie die Konfigurations-Funktion aufgebaut ist und wie Sie selbst die Grenzwerte anpassen können.
1️⃣ Grundeinstellungen
Wurden noch keine eigenen Grenzwerte definiert, sieht die Übersicht wie folgt aus.
2️⃣ Grenzwerte aktivieren
Mit einem Klick auf den Schalter können die Grenzwerte aktiviert und die Informationen und Einstellungen dazu geöffnet werden. Werden Grenzwerte aktiviert, so ändern sich gleichzeitig auch die Zahlen in der oberen Leiste. Die Zahlen in dieser Leiste beziehen sich immer auf die Beispiele, die mit dem festgelegten Grenzwert klassifiziert werden konnten. Das bedeutet: Kann ein Text mit der Mindestwahrscheinlichkeit des festgelegten Grenzwerts klassifiziert werden, fliesst dieser in diese Statistik ein.
Die Statistik setzt sich aus folgenden Komponenten zusammen: Die Genauigkeit gibt an, wie viel Prozent aller hochgeladenen Beispiele richtig klassifiziert werden konnten. Rechts davon wird die Anzahl korrekter und fehlerhafter Klassifikationen angezeigt. Zudem sind Anzahl Beispiele, die durch den festgelegten Grenzwert nicht klassifiziert werden konnten, ersichtlich, sowie die Gesamtzahl aller Textbeispiele, die vorhanden sind.
3️⃣ Grenzwerte auswählen
Nach Aktivierung des Grenzwerts öffnet sich unterhalb ein Histogramm, das den vorhandenen Daten entsprechend aussieht. Datengrundlage für die in der Visualisierung gezeigten Wahrscheinlichkeiten bilden die Ergebnisse aus der Kreuzvalidierung, die ebenso bereits im Bericht verwendet werden.
Die Breite der Balken entspricht fünf Prozentpunkten. Mittels dem Schieberegler kann ein beliebiger Grenzwert festgelegt werden. Standardmässig ist hier ein Grenzwert von 75 % für alle Kategorien eingestellt.
Die X-Achse des Histogramms entspricht somit den Prozentpunkten, die für den Grenzwert festgelegt werden können. Die Anzahl der Datenbeispiele wird auf der Y-Achse angezeigt. Dabei sind die Beispiele, die korrekt klassifiziert werden können, dunkelblau dargestellt, und die fehlerhaften hellblau. Mit Mouse-over über den Balken wird die absolute Anzahl angezeigt.
«Klassifiziert» beschreibt den prozentualen Anteil der Beispiele, die eine höhere Wahrscheinlichkeit zugewiesen bekommen als der gewählte Grenzwert, und damit weiterhin klassifiziert werden. «Precision» beschreibt den prozentualen Anteil dieser klassifizierten Beispiele, die auch der korrekten Kategorie zugewiesen werden.
4️⃣ Grenzwerte anwenden
Die Grenzwerte können einerseits übergreifend für alle Kategorien definiert werden. Andererseits können auch für verschiedene Kategorien unterschiedliche Grenzwerte festgelegt werden. Dazu muss lediglich oben links im Drop-down die jeweilige Kategorie ausgewählt werden. Mit einem Klick auf den blauen Button unten links werden die Grenzwerte festgelegt.
Sobald die Grenzwerte angewendet werden, ändert sich entsprechend die oben angezeigte Gesamtstatistik. Die Änderungen werden zudem auch direkt im verwendeten Chatbot AI Intent Widget gültig.