Pruning, Projektion und Quantisierung
Komprimieren tiefer neuronaler Netze, Reduzieren des Netzspeichers und Vorbereiten des Netzes auf die Codegenerierung
Verwenden Sie die Deep Learning Toolbox™ zusammen mit dem Supportpaket Deep Learning Toolbox Model Compression Library, um den Speicherbedarf und die Rechenanforderungen eines tiefen neuronalen Netzes zu reduzieren:
Führen Sie ein Pruning der Filter aus Faltungsschichten durch eine Taylor-Approximation erster Ordnung durch.
Projizieren Sie Schichten durch Durchführung einer Hauptkomponentenanalyse (PCA) auf die Schichtaktivierungen.
Quantisieren Sie die Gewichte, Verzerrungen und Aktivierungen von Schichten auf skalierte Ganzzahl-Datentypen mit reduzierter Genauigkeit.
Daraufhin können Sie aus dem komprimierten Netz Code generieren und auf der gewünschten Hardware bereitstellen.
Wichtige Links
Kategorien
- Leitfaden zum Einstieg in die Netzkomprimierung
Erlernen Sie die Grundlagen der Deep Learning Toolbox Model Compression Library
- Pruning
Reduzieren der Anzahl lernbarer Parameter in einem neuronalen Netz durch Pruning der am wenigsten wichtigen Filter in Faltungsschichten
- Projektion
Projizieren von Netzschichten mithilfe von Hauptkomponentenanalyse (PCA); Reduzieren der Anzahl lernbarer Parameter
- Quantisierung
Quantisieren von Netzparametern zu Datentypen mit reduzierter Präzision; Vorbereiten von Deep-Learning-Netzen für Festkomma-Codegenerierung
- Netz-Komprimierungsanwendungen
Erkunden Sie die Deep-Learning-Modellkomprimierung in End-to-End-Workflows



