Was ist Ground Truth?
Als „Ground Truth“ werden reale Daten zum Trainieren und Testen von KI-Modellausgaben bezeichnet. Viele KI-Anwendungen benötigen Ground-Truth-Daten, beispielsweise Anwendungen für autonomes Fahren sowie zur Audio- oder Spracherkennung.
Ground-Truth-Daten sind in zwei Stadien der Entwicklung eines KI-Algorithmus unerlässlich:
- Modelltraining: Ground-Truth-Daten dienen als Trainingsdaten. Der Algorithmus lernt also, welche Merkmale und Lösungen sich für die konkrete Anwendung eignen.
- Modelltests: Ground-Truth-Daten fungieren als Testdaten, um den trainierten Algorithmus hinsichtlich seiner Modellgenauigkeit zu testen.
Ground-Truth-Daten gibt es in vielen Formen: Bild-, Signal- oder Testdaten (Abb. 1). Ground-Truth-Daten manuell zu gewinnen, kann zeitaufwändig sein. Daher kann MATLAB® den Vorgang mit Labeler-Apps für Bild-, Signal-, Audio- und LiDAR-Anwendungen beschleunigen.
Gewinnung von Ground-Truth-Daten
Um Ground-Truth-Daten zu generieren, ist eine Ground-Truth-Kennzeichnung erforderlich. Bei der Kennzeichnung werden Rohdaten entsprechend ihrer Bedeutung charakterisiert. Die gekennzeichnete Ausgabe wird zum Trainieren eines überwachten Lernmodells benötigt. Je genauer die Kennzeichnung, desto genauer das Modell. Die manuelle Kennzeichnung von Ground-Truth-Daten kann zeitaufwändig sein, da viele KI-Modelle Tausende oder Millionen gekennzeichneter Datenausgaben benötigen, um genaue Ergebnisse zu erzielen.
Die folgenden Labeler-Apps von MATLAB ermöglichen eine voll- oder halbautomatische Kennzeichnung und benötigen daher weniger Zeit als das manuelle Kennzeichnen.
Bildkennzeichnung
Mithilfe von Image Labeler werden Regionen von Interesse auf Bildern gekennzeichnet, beispielsweise Pixel zur semantischen Segmentierung oder Rahmen für Objekterfassungssabläufe.
Signalkennzeichnung
Mithilfe von Signal Labeler können Sie Daten untersuchen sowie Attribute, Regionen von Interesse und Punkte durch Visualisierung und individuell erstellte Funktionen kennzeichnen.
LiDAR-Kennzeichnung
LiDAR Labeler erstellt Rahmen um 3D-Objekte und verfügt über Automatisierungstechniken zum Clustern, Entfernen der Grundfläche und Nachverfolgen von Punktwolkendaten.
Beispiele und Erläuterungen
Software-Referenz
Siehe auch: deep learning, convolutional neural network