GPU Coder

Erzeugung von CUDA-Code für NVIDIA-Grafikkarten

GPU Coder generiert optimierten CUDA^®-Code aus MATLAB Programmcode und Simulink-Modellen. Der generierte Code enthält CUDA-Kernel zur Parallelisierung von Teilen Ihrer Deep-Learning-, Embedded-Vision- sowie Radar- und Signalverarbeitungsalgorithmen. Sie können ein Profil des generierten CUDA-Codes erstellen, um Engpässe und Möglichkeiten zur Leistungsoptimierung zu ermitteln. Zur Optimierung der Leistung kann der generierte Code NVIDIA^® TensorRT^® aufrufen. Zudem können Sie den generierten CUDA-Code als Quellcode oder in Form von statischen oder dynamischen Bibliotheken in Ihr Projekt integrieren und für moderne NVIDIA-Grafikkarten kompilieren, einschließlich der Embedded Grafikkarten auf Plattformen mit NVIDIA Jetson™, NVIDIA DRIVE™ und NVIDIA Clara™. Sie können auf Peripheriegeräte auf den Jetson- und DRIVE-Plattformen zugreifen und manuell geschriebenen CUDA-Code in den generierten Code integrieren.

GPU Coder ermöglicht bidirektionale Verknüpfungen, mit denen Sie MATLAB-Code und generierten CUDA-Code (mit Embedded Coder^®) zurückverfolgen können.

Codegenerierungsbericht mit Anzeige des generierten CUDA-Codes.

CUDA-Codegenerierung aus MATLAB

Kompilieren Sie CUDA-Code, der aus Ihren MATLAB-Algorithmen generiert wurde, und führen Sie ihn auf gängigen NVIDIA-Grafikkarten aus, von RTX-Desktop-Karten über Rechenzentren bis hin zu eingebetteten Jetson- und DRIVE-Plattformen. Stellen Sie den generierten Code ohne Lizenz- und sonstige Gebühren für Ihre Kunden bereit.

Generieren von CUDA-Code für einen Algorithmus zum Ausblenden von Nebel (2:22)

Dokumentation | Beispiele

Simulink-Modell einer Spur- und Fahrzeugerkennung.

CUDA-Codegenerierung aus Simulink

Nutzen Sie Simulink Coder zusammen mit GPU Coder, um CUDA-Code aus Ihren Simulink-Modellen zu generieren und auf NVIDIA-Grafikkarten bereitzustellen. Beschleunigen Sie rechenintensive Abschnitte von Simulink-Simulationen auf NVIDIA-Grafikkarten.

Deep Learning in Simulink für NVDIA-Grafikkarten: Generieren von CUDA-Code mithilfe von GPU Coder (3:29)

Dokumentation | Beispiele

Bereitstellung auf NVIDIA Jetson und DRIVE

GPU Coder automatisiert die Bereitstellung des generierten Codes auf NVIDIA Jetson- und DRIVE-Plattformen. Greifen Sie auf Peripheriegeräte zu, erfassen Sie Sensordaten und stellen Sie Ihren Algorithmus zusammen mit Code für die Peripherieschnittstelle zur Standalone-Ausführung auf dem Board bereit.

Einsatz von GPU Coder für Prototyping und Bereitstellung auf NVIDIA Drive, Jetson (2:54)

Dokumentation | Beispiele

Zwei Kameraansichten des Straßenverkehrs als Bestandteil einer Fahrzeug- und Spurerkennungsanwendung in Simulink.

Codegenerierung für Deep Learning

Stellen Sie diverse vorab definierte oder angepasste Deep-Learning-Netze auf NVIDIA-Grafikkarten bereit. Code für die Vor- und Nachverarbeitung kann mit den trainierten Netzen generiert werden, um vollständige Algorithmen zu erhalten.

Deep Learning in Simulink für NVDIA-Grafikkarten: Klassifizierung von EKG-Signalen (7:35)

Dokumentation | Beispiele

Balkendiagramm mit dem Titel „Inference with ResNet-50“ (Inferenz mit ResNet-50) zur Abbildung des Anstiegs der Bilder/Sekunde mit der Verwendung von FP32- und INT8-Datentypen.

Optimierung von generiertem Code

GPU Coder wendet automatisch Optimierungen wie Speichermanagement, Kernel-Fusion und automatische Abstimmung an. Reduzieren Sie den Speicherbedarf, indem Sie INT8- oder bfloat16-Code generieren. Durch die Integration mit TensorRT lässt sich die Leistung anschließend noch weiter steigern.

Fußgängererkennung auf einer NVIDIA-Grafikkarte mit TensorRT (1:34)

Dokumentation | Beispiele

Ein Bericht aus dem Performance Analyzer-Tool von GPU Coder zeigt Profiling-Informationen zum generierten Code.

Profilerstellung und Analyse des generierten Codes

Nutzen Sie den GPU Coder Performance Analyzer für das Profiling des generierten CUDA-Codes und zur Ermittlung von Möglichkeiten zur weiteren Verbesserung der Ausführungsgeschwindigkeit und des Speicherbedarfs.

Dokumentation | Beispiele

Diagramm der Funktionsweise der Entwurfsmuster für Stencil-Verarbeitung auf Konzeptebene.

Leistungssteigerung durch Entwurfsmuster

Entwurfsmuster, darunter Stencil-Verarbeitung und Verringerungen, werden automatisch angewendet (sofern verfügbar), um die Leistung des generierten Codes zu steigern. Mit bestimmten Compiler-Anweisungen (pragmas) lassen sie sich auch manuell aufrufen.

Dokumentation | Beispiele

Codegenerierungsbericht zur Illustration der interaktiven bidirektionalen Nachverfolgbarkeit zwischen MATLAB Programmcode und generiertem CUDA-Code.

Signalprotokollierung, Parameterabstimmung und Verifikation des Codeverhaltens

Nutzen Sie GPU Coder in Kombination mit Simulink Coder, um Signale zu protokollieren und Parameter in Echtzeit abzustimmen. Fügen Sie Embedded Coder für eine interaktive Nachverfolgung zwischen MATLAB Programmcode und generiertem CUDA-Code hinzu, um das Verhalten des generierten CUDA-Codes durch SIL-Tests numerisch zu verifizieren.

Nachverfolgung zwischen generiertem CUDA-Code und MATLAB-Quellcode

Dokumentation | Beispiele

Simulink-Modell eines EKG-Vorhersagealgorithmus mit GPU Coder und NVIDIA-Grafikkarten zur Beschleunigung.

Beschleunigen von MATLAB- und Simulink-Simulationen

Rufen Sie generierten CUDA-Code als MEX-Funktion über Ihren MATLAB Programmcode auf, um die Ausführung zu beschleunigen. Nutzen Sie Simulink Coder in Kombination mit GPU Coder, um rechenintensive Abschnitte von MATLAB-Funktionsblöcken in Ihren Simulink-Modellen auf NVIDIA-Grafikkarten zu beschleunigen.

Beschleunigen von Radarsimulationen auf NVIDIA-GPUs mit GPU Coder (3:24)

Dokumentation | Beispiele

Produktressourcen:

Dokumentation Beispiele Videos Technische Artikel Funktionen Hardware-Support Benötigte Produkte Anforderungen Versionshinweise

Drass entwickelt ein Deep-Learning-System zur Echtzeit-Objekterkennung in maritimer Umgebung

„Von der Datenannotierung über das Auswählen, Trainieren und Testen bis hin zur Feinabstimmung unseres Deep-Learning-Modells besaß MATLAB alle benötigten Werkzeuge. GPU Coder ermöglichte die schnelle Bereitstellung auf unseren NVIDIA-Grafikprozessoren, obwohl wir nicht viel Erfahrung in dem Bereich hatten.“

Weitere Anwenderberichte ansehen