Klassifikator verbessern

Willst du deinen Klassifikator verbessern, so nimmst du am besten die Konfusionsmatrix zur Hand. Die in orangetönen gekennzeichneten Felder zeigen dir auf, bei welchen Kategorien eine hohe Anzahl deiner Beispiele nicht korrekt klassifiziert werden konnte. Dort kannst du ansetzen, um die Datenqualität zu steigern.

Mit einem Klick auf ein solches Feld öffnen sich unterhalb der Konfusionsmatrix die darin enthaltenen Beispiele. Diese können dort direkt bearbeitet werden.

Insgesamt gibt es 4 Fälle bei der Verbesserung des Klassifikators:

  1. Der Klassifikator ist falsch: Sollte der Klassifikator falsch liegen und das Label mit dem Textbeispiel korrekt zusammen gehen, musst du nichts an deinen Beispielen ändern,
  2. Das Label ist falsch: Es kann sein, dass sich in deinen Beispielen ein Fehler beim Label eingeschlichen hat. Lies die Textbeispiele nochmals durch und korrigiere allenfalls das Label.
  3. Das Label ist korrekt, der Klassifikator ist auch korrekt: Teile dein Textbeispiel in zwei Beispiele auf und teile diese den entsprechenden Kategorien zu. 
  4. Das Label ist falsch, der Klassifikator ist auch falsch: Korrigiere das Label, damit dein Klassifikator beim nächsten Training die richtige Zuweisung lernt.

Sollte es bei thematisch ähnlichen Kategorien zu sehr vielen Verwechslungen kommen, ist es zu empfehlen, die beiden Kategorien zusammenzufügen. Nachdem du die Anpassungen vorgenommen hast, startest du im Anschluss ein neues Training.

War dieser Beitrag hilfreich?
0 von 0 fanden dies hilfreich