Hauptinhalt

Pruning, Projektion und Quantisierung

Komprimieren tiefer neuronaler Netze, Reduzieren des Netzspeichers und Vorbereiten des Netzes auf die Codegenerierung

Verwenden Sie die Deep Learning Toolbox™ zusammen mit dem Supportpaket Deep Learning Toolbox Model Compression Library, um den Speicherbedarf und die Rechenanforderungen eines tiefen neuronalen Netzes zu reduzieren:

  • Führen Sie ein Pruning der Filter aus Faltungsschichten durch eine Taylor-Approximation erster Ordnung durch.

  • Projizieren Sie Schichten durch Durchführung einer Hauptkomponentenanalyse (PCA) auf die Schichtaktivierungen.

  • Quantisieren Sie die Gewichte, Verzerrungen und Aktivierungen von Schichten auf skalierte Ganzzahl-Datentypen mit reduzierter Genauigkeit.

Daraufhin können Sie aus dem komprimierten Netz Code generieren und auf der gewünschten Hardware bereitstellen.

Simplified illustration of compression. On the left is a sketch of a large neural network with a label indicating the network is 20 MB. An arrow points to a second sketch on the right, which shows a smaller model inside a box. A label indicates the smaller network is 5 MB.

Kategorien

  • Leitfaden zum Einstieg in die Netzkomprimierung
    Erlernen Sie die Grundlagen der Deep Learning Toolbox Model Compression Library
  • Pruning
    Reduzieren der Anzahl lernbarer Parameter in einem neuronalen Netz durch Pruning der am wenigsten wichtigen Filter in Faltungsschichten
  • Projektion
    Projizieren von Netzschichten mithilfe von Hauptkomponentenanalyse (PCA); Reduzieren der Anzahl lernbarer Parameter
  • Quantisierung
    Quantisieren von Netzparametern zu Datentypen mit reduzierter Präzision; Vorbereiten von Deep-Learning-Netzen für Festkomma-Codegenerierung
  • Netz-Komprimierungsanwendungen
    Erkunden Sie die Deep-Learning-Modellkomprimierung in End-to-End-Workflows

Enthaltene Beispiele