Hauptinhalt

Quantisierung

Quantisieren von Netzparametern zu Datentypen mit reduzierter Präzision; Vorbereiten von Deep-Learning-Netzen für Festkomma-Codegenerierung

Quantisieren Sie die Gewichte, Verzerrungen und Aktivierungen von Schichten auf skalierte Ganzzahl-Datentypen mit reduzierter Genauigkeit. Aus diesem quantisierten Netz können Sie daraufhin C/C++, CUDA®- oder HDL-Code zur Bereitstellung auf GPU, FPGA oder CPU generieren.

Einen detaillierten Überblick über die in der Deep Learning Toolbox™ Model Compression Library verfügbaren Komprimierungstechniken finden Sie unter Reduce Memory Footprint of Deep Neural Networks.

Simplified illustration of quantization. On the left is a sketch of a neural network consisting of three layers with two, three, and one neuron, respectively. Each neuron in every layer is connected to all neurons in neighboring layers. An arrow points to a second sketch on the right, which shows the same network with the weights indicated by dotted lines instead of full lines, which indicates that the weights are stored with smaller precision.

Funktionen

dlquantizerQuantize a deep neural network to 8-bit scaled integer data types
dlquantizationOptionsOptions for quantizing a trained deep neural network
prepareNetworkPrepare deep neural network for quantization (Seit R2024b)
calibrateSimulate and collect ranges of a deep neural network
quantizeQuantize deep neural network (Seit R2022a)
validateQuantize and validate a deep neural network
quantizationDetailsDisplay quantization details for a neural network (Seit R2022a)
estimateNetworkMetricsEstimate network metrics for specific layers of a neural network (Seit R2022a)
equalizeLayersEqualize layer parameters of deep neural network (Seit R2022b)
exportNetworkToSimulinkGenerate Simulink model that contains deep learning layer blocks and subsystems that correspond to deep learning layer objects (Seit R2024b)

Apps

Deep Network QuantizerQuantize deep neural network to 8-bit scaled integer data types

Themen

Quantisierung verstehen

Workflows vor der Bereitstellung

Bereitstellung

Erwägungen

Enthaltene Beispiele