Deep Learning für Computer Vision

Semantische Segmentierung, Objekterfassung und Bilderkennung: Computer-Vision-Anwendungen, die in Deep Learning integriert sind, bieten fortschrittliche Algorithmen mit hoher Lerngenauigkeit. MATLAB® bietet eine Umgebung zum Entwerfen, Erstellen und Integrieren von Deep-Learning-Modellen mit Computer-Vision-Anwendungen.

Nutzen Sie für den leichten Einstieg spezielle Funktionen für Computer Vision, wie z. B. die folgenden:

  • Apps für die Bild- und Videokennzeichnung (Labeling)
  • Datastore für Bilder zur Verarbeitung großer Datenmengen für Training, Test und Validierung
  • Bild- und Computer-Vision-spezifische Vorverarbeitungstechniken
  • Möglichkeit, Deep-Learning-Modelle von TensorFlow™-Keras und PyTorch zur Bilderkennung zu importieren

Workflow

MATLAB umfasst Tools, mit denen Sie Ihren individuellen Workflow für Computer Vision mit Deep Learning erstellen können.

Datenvorbereitung

Zugang

Mit ImageDatastore können Sie schnell und leicht auf große Datenmengen zugreifen und diese verwalten.

Synthese

Für Deep Learning ist es sehr wichtig, über umfassende Daten zu verfügen, um ein genaues Modell zu erstellen. Die Data Augmentation Technik ermöglicht es Ingenieuren, die Anzahl der Beispiele und Beispielvariationen für einen Trainingsalgorithmus zu erhöhen. Erstellen Sie im Interesse einer robusten Klassifikation mehr Trainingsbilder, indem Sie vorhandenen Bildern mithilfe von Bilddatenerweiterungstechniken Drehungs- und Skalierungsvarianzen hinzufügen.

Kennzeichnung und Vorverarbeitung

Die Bild- und Videokennzeichnung (Labeling), zu der die Kennzeichnung auf Pixelebene und der Objektbereich von Interesse gehören, kann unzählige Stunden manueller Kennzeichnung einsparen. Verwenden Sie Bildverarbeitungstools, um Bilder zu beschneiden, zu schärfen, aufzuhellen und zu verbessern, bevor Sie ein Netz trainieren.

Weitere Informationen

Design, Training und Bewertung von Netzen

Entwickeln Sie interaktiv Netze, beschleunigen Sie das Training mithilfe von NVIDIA®-GPUs und erzielen Sie auf diese Weise schneller gute Ergebnisse.

Design

Importieren Sie vortrainierte Modelle mit ONNX™, und verwenden Sie dann die Deep Network Designer-App, um Ebenen hinzuzufügen, zu entfernen oder neu anzuordnen.

Schulungen

Unabhängig davon, ob Sie eine GPU, mehrere GPUs, die Cloud oder NVIDIA DGX verwenden, unterstützt MATLAB das Training auch auf mehreren GPUs mit einer einzigen Codezeile.

Bewertung

Verstehen Sie die Leistung Ihres Netzes zu jedem Zeitpunkt.

  • Vor dem Training: Verwenden Sie Network Analyzer, um Schichten des Netzes zu analysieren und die Kompatibilität ihrer Ein- und Ausgaben sicherzustellen.
  • Während des Trainings: Visualisieren Sie eine Darstellung der Validierungsgenauigkeit, während das Netz trainiert wird, und stoppen Sie das Training jederzeit.

Weitere Informationen

Bereitstellung

Stellen Sie Deep-Learning-Modelle überall bereit – generieren Sie automatisch Code zur nativen Ausführung auf ARM® und Intel® MKL-DNN. Importieren Sie Ihre Deep-Learning-Modelle und generieren Sie CUDA®-Code für TensorRT- und CuDNN-Bibliotheken.

Weitere Informationen

Deep Learning für Computer Vision: Beispiele

MATLAB bietet Tools für spezifische Deep-Learning-Anwendungen wie:

Semantische Segmentierung

Bei der semantischen Segmentierung wird jedes Pixel als einer Kategorie zugehörig gekennzeichnet. Dies ist eine Schlüsseltechnologie für das automatisierte Fahren und die Verarbeitung medizinischer Bilder.

Objekterfassung

Die Objekterfassung verwendet Klassifikationstechniken wie YOLO v2 und Faster-RCNN, um Objekte in einer Szene zu identifizieren.

Bild- und Videoklassifikation

Identifizieren Sie Objekte in Bildern und Videos mithilfe der aktuellen Forschungsmodelle und Transfer-Learning-Techniken.

3D-Daten

MATLAB ermöglicht die Verarbeitung von 3D-Daten mit sparse und dense 3D-Techniken. Zu den Anwendungen gehören die LiDAR-Klassifikation und 3D-Stapel von medizinischen Bildern.

Mehr über Deep Learning für Computer Vision