Computer Vision Toolbox
Computer Vision Toolbox™ stellt Algorithmen und Apps für das Entwickeln und Testen von Computer-Vision-Systemen bereit. Sie können die visuelle Inspektion, die Erkennung und das Tracking von Objekten sowie die Erkennung, die Extraktion und den Abgleich von Merkmalen durchführen. Sie können Workflows für die Kalibrierung von Einzel-, Stereo- und Fischaugenkameras automatisieren. Im Bereich 3D Vision unterstützt die Toolbox Stereo-Vision, Punktwolken-Verarbeitung, Strukturen aus Bewegungen (Structure from Motion) sowie visuelle Echtzeit -und Punktwolken-SLAM. Computer-Vision-Apps ermöglichen eine Automatisierung teambasierter Workflows für Ground Truth-Kennzeichnung und Kamerakalibrierung.
Sie können vortrainierte Objektdetektoren verwenden oder benutzerdefinierte Detektoren mit Deep-Learning- und Machine-Learning-Algorithmen, wie zum Beispiel YOLO, SSD und ACF, trainieren. Für semantische Segmentierung und Instanzsegmentierung können Sie Deep-Learning-Algorithmen wie zum Beispiel U-Net, SOLO und Mask R-CNN verwenden. Mithilfe von Vision-Transformern wie ViT können Sie eine Bildklassifizierung vornehmen. Mit vortrainierten Modellen können Sie Gesichter und Fußgänger erkennen, optische Zeichenerkennung (OCR) durchführen und weitere gängige Objekte erkennen.
Sie können Ihre Algorithmen beschleunigen, indem Sie sie auf Mehrkernprozessoren und GPUs ausführen. Die Algorithmen der Toolbox unterstützen die Generierung von C/C++ Code für die Integration von vorhandenem Code, Desktop-Prototyperstellung und Bereitstellung auf Embedded-Vision-Systemen.
Erste Schritte mit Computer Vision Toolbox
Lernen Sie die Grundlagen von Computer Vision Toolbox
Merkmaldetektion und -Extraktion
Bildregistrierung, Interessenfokus-Detektion, Merkmaldeskriptor-Extraktion, Punkt-Merkmal-Abgleich und Bildabruf
Ground-Truth-Kennzeichnung bei Bildern und Videos
Interaktives Kennzeichnen von Bildern und Videos, Erstellen von Trainingsdaten für Deep Learning mit Objekterkennung, semantische Segmentierung, Instance Segmentation und Bildklassifizierung
Erkennung, Objekterkennung und semantische Segmentierung
Erkennung, Klassifizierung, semantische Bildsegmentierung, Instance Segmentation, Objekterkennung anhand von Merkmalen und Deep-Learning-Objekterkennung mithilfe von CNNs, YOLO und SSD
Kamerakalibrierung
Kalibrieren Sie Einzel- oder Stereo-Kameras und schätzen Sie intrinsische und extrinsische Eigenschaften sowie Verzerrungsparameter von Kameras mithilfe von Lochkamera- und Fisheye-Kamera-Modellen
Structure from Motion und Visual SLAM
Stereo-Vision, Triangulierung, 3D-Rekonstruktion und vSLAM (Visual SLAM, visuelle simultane Lokalisierung und Kartierung)
Punktwolkenverarbeitung
Vorverarbeitung, Visualisierung, Registrierung, Anpassung geometrischer Formen, Kartenerstellung, Implementierung von SLAM-Algorithmen und Nutzung von Deep Learning für 3D-Punktwolken
Tracking und Bewegungsschätzung
Optischer Fluss, Aktivitätserkennung, Bewegungsschätzung, Objekt-Reidentifizierung und Tracking
Codegenerierung, GPU und Drittanbieter-Unterstützung
C/C++ und GPU-Codegenerierung und Beschleunigung, HDL-Codegenerierung und OpenCV-Schnittstelle für MATLAB und Simulink
Computer Vision mit Simulink
Simulink®-Unterstützung für Computer-Vision-Anwendungen