Pruning, Projektion und Quantisierung

Komprimieren tiefer neuronaler Netze, Reduzieren des Netzspeichers und Vorbereiten des Netzes auf die Codegenerierung

Verwenden Sie die Deep Learning Toolbox™ zusammen mit dem Supportpaket Deep Learning Toolbox Model Compression Library, um den Speicherbedarf und die Rechenanforderungen eines tiefen neuronalen Netzes zu reduzieren:

Führen Sie ein Pruning der Filter aus Faltungsschichten durch eine Taylor-Approximation erster Ordnung durch.
Projizieren Sie Schichten durch Durchführung einer Hauptkomponentenanalyse (PCA) auf die Schichtaktivierungen.
Quantisieren Sie die Gewichte, Verzerrungen und Aktivierungen von Schichten auf skalierte Ganzzahl-Datentypen mit reduzierter Genauigkeit.

Daraufhin können Sie aus dem komprimierten Netz Code generieren und auf der gewünschten Hardware bereitstellen.

Wichtige Links

Reduce Memory Footprint of Deep Neural Networks

Simplified illustration of compression. On the left is a sketch of a large neural network with a label indicating the network is 20 MB. An arrow points to a second sketch on the right, which shows a smaller model inside a box. A label indicates the smaller network is 5 MB.

Enthaltene Beispiele

Analyze and Compress 1-D Convolutional Neural Network

Analyze 1-D convolutional network for compression and compress it using Taylor pruning and projection.

Seit R2024b
Live Script öffnen

Compress Sequence Classification Network for Road Damage Detection

Compress network to meet memory requirement using pruning, projection, and quantization.

Seit R2025a
Live Script öffnen

Compress Deep Learning Network for Battery State of Charge Estimation

Compress a neural network for predicting the state of charge of a battery using projection.

Seit R2024b
Live Script öffnen