Erkennung, Objekterkennung und semantische Segmentierung
Computer Vision Toolbox™ unterstützt mehrere Ansätze für die Bildklassifizierung, Objekterkennung, semantische Segmentierung, Instance Segmentation und Erkennung, darunter:
Deep Learning und Convolutional Neural Networks (CNNs)
Bag-of-Features
Vorlagenabgleich
Blob-Analyse
Viola-Jones-Algorithmus
CNN ist eine beliebte Deep-Learning-Architektur, die direkt aus Bilddaten nützliche Merkmalsdarstellungen automatisch lernen kann. Bag-of-Features codiert Bildmerkmale in eine kompakte Darstellung, die sich für Bildklassifizierung und Bildabruf eignet. Beim Vorlagenabgleich wird ein kleineres Bild, die Vorlage, verwendet, um übereinstimmende Regionen in einem größeren Bild zu finden. Die Blob-Analyse verwendet Segmentierung und Blobeigenschaften, um relevante Objekte zu erkennen. Der Viola-Jones-Algorithmus nutzt Haar-ähnliche Funktionen und eine Kaskade an Klassifikatoren, um Objekte wie Gesichter, Nasen und Augen zu erkennen. Sie können diesen Klassifikator darauf trainieren, andere Objekte zu erkennen.
Kategorien
- Objekterkennung
Klassifizierung, Objekterkennung, Transfer Learning mithilfe von Convolutional Neural Networks (CNNs oder ConvNets) durchführen, benutzerdefinierte Detektoren erstellen
- Semantische Segmentierung
Semantische Bildsegmentierung
- Instanzensegmentierung
Durchführen von Instance Segmentation mithilfe vortrainierter Deep-Learning-Netzwerke und Trainieren von Netzwerken mithilfe von Transfer Learning an benutzerdefinierten Daten
- Bildkategorie-Klassifizierung
Erstellen eines Vision-Transformators oder Bag-of-Visual-Words-Bildklassifikators
- Automatisierte Sichtprüfung
Automatisieren von Qualitätskontroll-Aufgaben mithilfe Anomalieerkennungs- und Lokalisierungsmethoden
- Texterkennung und -erfassung
Detektieren und Erkennen von Text mithilfe der Bildmerkmal-Erkennung und Beschreibung, Deep Learning und OCR
- Keypoint-Erkennung
Erkennen von Keypoints in Objekten mithilfe von Convolutional Neural Networks (CNNs)
- Videoklassifizierung
Durchführen einer Video-Klassifizierung und Aktivitätserkennung mithilfe von Deep Learning