Main Content

Audioverarbeitung

Erweitern von Deep-Learning-Workflows mit Audio- und Sprachverarbeitungsanwendungen

Wenden Sie Deep Learning bei Audio- und Sprachverarbeitungsanwendungen an, indem Sie die Deep Learning Toolbox™ zusammen mit der Audio Toolbox™ verwenden. Für Anwendungen der Signalverarbeitung siehe Signalverarbeitung. Für Anwendungen der drahtlosen Kommunikation siehe Drahtlose Kommunikation.

Apps

Signal LabelerLabel signal attributes, regions, and points of interest, and extract features

Funktionen

alle erweitern

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data (Seit R2019b)
audioFeatureExtractorStreamline audio feature extraction (Seit R2019b)
openl3EmbeddingsExtract OpenL3 feature embeddings (Seit R2022a)
pitchnnEstimate pitch with deep learning neural network (Seit R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (Seit R2022a)
audioPretrainedNetworkPretrained audio neural networks (Seit R2024a)
classifySoundClassify sounds in audio signal (Seit R2020b)
pitchnnEstimate pitch with deep learning neural network (Seit R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (Seit R2022a)
openl3EmbeddingsExtract OpenL3 feature embeddings (Seit R2022a)
detectspeechnnDetect boundaries of speech in audio signal using AI (Seit R2023a)
separateSpeakersSeparate signal by speakers (Seit R2023b)

Blöcke

alle erweitern

VGGishVGGish embeddings extraction network (Seit R2022a)
VGGish EmbeddingsExtract VGGish embeddings (Seit R2022a)
YAMNetYAMNet sound classification network (Seit R2021b)
Sound ClassifierClassify sounds in audio signal (Seit R2021b)
OpenL3OpenL3 embeddings extraction network (Seit R2022b)
OpenL3 EmbeddingsExtract OpenL3 embeddings (Seit R2022b)
CREPECREPE deep pitch estimation neural network (Seit R2023a)
Deep Pitch EstimatorEstimate pitch with CREPE deep learning neural network (Seit R2023a)

Themen