GPU Coder

Erzeugung von CUDA-Code für NVIDIA-Grafikkarten

GPU Coder generiert optimierten CUDA^®-Code aus MATLAB Programmcode und Simulink-Modellen. Der generierte Code enthält CUDA-Kernel zur Parallelisierung von Teilen Ihrer Deep-Learning-, Embedded-Vision- sowie Radar- und Signalverarbeitungsalgorithmen. Zur Optimierung der Leistung kann der generierte Code NVIDIA^® TensorRT^® aufrufen. Sie können den generierten CUDA-Code als Quellcode oder in Form von statischen/dynamischen Bibliotheken in Ihr Projekt integrieren und für moderne NVIDIA-Grafikkarten kompilieren, einschließlich der eingebetteten Grafikkarten auf NVIDIA Jetson™- und NVIDIA DRIVE™-Plattformen. Sie können auf Peripheriegeräte auf den Jetson- und DRIVE-Plattformen zugreifen und manuell geschriebenen CUDA-Code in den generierten Code integrieren.

Mit GPU Coder können Sie den generierten CUDA-Code profilieren, um Engpässe und Möglichkeiten zur Leistungsoptimierung zu identifizieren (mit Embedded Coder). Bidirektionale Verknüpfungen ermöglichen die Rückverfolgung von MATLAB Programmcode und generiertem CUDA-Code. Sie können das numerische Verhalten des generierten Codes mithilfe von SIL- und PIL-Tests (Software-in-the-Loop und Processor-in-the-Loop) verifizieren.

Codegenerierungsbericht mit Anzeige des generierten CUDA-Codes.

CUDA-Codegenerierung aus MATLAB

Kompilieren Sie CUDA-Code, der aus Ihren MATLAB-Algorithmen generiert wurde, und führen Sie ihn auf gängigen NVIDIA-Grafikkarten aus, von RTX-Desktop-Karten über Rechenzentren bis hin zu eingebetteten Jetson- und DRIVE-Plattformen. Stellen Sie den generierten Code ohne Lizenz- und sonstige Gebühren für Ihre Kunden bereit.

Generieren von CUDA-Code für einen Algorithmus zum Ausblenden von Nebel (2:22)

Dokumentation | Beispiele

Simulink-Modell einer Spur- und Fahrzeugerkennung.

CUDA-Codegenerierung aus Simulink

Nutzen Sie Simulink Coder zusammen mit GPU Coder, um CUDA-Code aus Ihren Simulink-Modellen zu generieren und auf NVIDIA-Grafikkarten bereitzustellen. Beschleunigen Sie rechenintensive Abschnitte von Simulink-Simulationen auf NVIDIA-Grafikkarten.

Deep Learning in Simulink für NVDIA-Grafikkarten: Generieren von CUDA-Code mithilfe von GPU Coder (3:29)

Dokumentation | Beispiele

Bereitstellung auf NVIDIA Jetson und DRIVE

GPU Coder automatisiert die Bereitstellung des generierten Codes auf NVIDIA Jetson- und DRIVE-Plattformen. Greifen Sie auf Peripheriegeräte zu, erfassen Sie Sensordaten und stellen Sie Ihren Algorithmus zusammen mit Code für die Peripherieschnittstelle zur Standalone-Ausführung auf dem Board bereit.

Einsatz von GPU Coder für Prototyping und Bereitstellung auf NVIDIA Drive, Jetson (2:54)

Dokumentation | Beispiele

Zwei Kameraansichten des Straßenverkehrs als Bestandteil einer Fahrzeug- und Spurerkennungsanwendung in Simulink.

Codegenerierung für Deep Learning

Stellen Sie diverse vorab definierte oder angepasste Deep-Learning-Netze auf NVIDIA-Grafikkarten bereit. Code für die Vor- und Nachverarbeitung kann mit den trainierten Netzen generiert werden, um vollständige Algorithmen zu erhalten.

Deep Learning in Simulink für NVDIA-Grafikkarten: Klassifizierung von EKG-Signalen (7:35)

Dokumentation | Beispiele

Balkendiagramm mit dem Titel „Inference with ResNet-50“ (Inferenz mit ResNet-50) zur Abbildung des Anstiegs der Bilder/Sekunde mit der Verwendung von FP32- und INT8-Datentypen.

Optimierung von generiertem Code

GPU Coder wendet automatisch Optimierungen wie Speichermanagement, Kernel-Fusion und automatische Abstimmung an. Reduzieren Sie den Speicherbedarf, indem Sie INT8- oder bfloat16-Code generieren. Durch die Integration mit TensorRT lässt sich die Leistung anschließend noch weiter steigern.

Fußgängererkennung auf einer NVIDIA-Grafikkarte mit TensorRT (1:34)

Dokumentation | Beispiele

Ein Bericht aus dem Performance Analyzer-Tool von GPU Coder zeigt Profiling-Informationen zum generierten Code.

Profilerstellung und Analyse des generierten Codes

Nutzen Sie den GPU Coder Performance Analyzer für das Profiling des generierten CUDA-Codes und zur Ermittlung von Möglichkeiten zur weiteren Verbesserung der Ausführungsgeschwindigkeit und des Speicherbedarfs.

Dokumentation | Beispiele

Diagramm der Funktionsweise der Entwurfsmuster für Stencil-Verarbeitung auf Konzeptebene.

Leistungssteigerung durch Entwurfsmuster

Entwurfsmuster, darunter Stencil-Verarbeitung und Verringerungen, werden automatisch angewendet (sofern verfügbar), um die Leistung des generierten Codes zu steigern. Mit bestimmten Compiler-Anweisungen (pragmas) lassen sie sich auch manuell aufrufen.

Dokumentation | Beispiele

Codegenerierungsbericht zur Illustration der interaktiven bidirektionalen Nachverfolgbarkeit zwischen MATLAB Programmcode und generiertem CUDA-Code.

Signalprotokollierung, Parameterabstimmung und Verifikation des Codeverhaltens

Nutzen Sie GPU Coder in Kombination mit Simulink Coder, um Signale zu protokollieren und Parameter in Echtzeit abzustimmen. Fügen Sie Embedded Coder für eine interaktive Nachverfolgung zwischen MATLAB Programmcode und generiertem CUDA-Code hinzu, um das Verhalten des generierten CUDA-Codes durch SIL-Tests numerisch zu verifizieren.

Nachverfolgung zwischen generiertem CUDA-Code und MATLAB-Quellcode

Dokumentation | Beispiele

Simulink-Modell eines EKG-Vorhersagealgorithmus mit GPU Coder und NVIDIA-Grafikkarten zur Beschleunigung.

Beschleunigen von MATLAB- und Simulink-Simulationen

Rufen Sie generierten CUDA-Code als MEX-Funktion über Ihren MATLAB Programmcode auf, um die Ausführung zu beschleunigen. Nutzen Sie Simulink Coder in Kombination mit GPU Coder, um rechenintensive Abschnitte von MATLAB-Funktionsblöcken in Ihren Simulink-Modellen auf NVIDIA-Grafikkarten zu beschleunigen.

Beschleunigen von Radarsimulationen auf NVIDIA-GPUs mit GPU Coder (3:24)

Dokumentation | Beispiele

Produktressourcen:

Dokumentation Beispiele Videos Technische Artikel Funktionen Hardware-Support Benötigte Produkte Anforderungen Versionshinweise

Drass entwickelt ein Deep-Learning-System zur Echtzeit-Objekterkennung in maritimer Umgebung

„Von der Datenannotierung über das Auswählen, Trainieren und Testen bis hin zur Feinabstimmung unseres Deep-Learning-Modells besaß MATLAB alle benötigten Werkzeuge. GPU Coder ermöglichte die schnelle Bereitstellung auf unseren NVIDIA-Grafikprozessoren, obwohl wir nicht viel Erfahrung in dem Bereich hatten.“

Weitere Anwenderberichte ansehen