Main Content

Texterkennung und -erfassung

Detektieren und Erkennen von Text mithilfe der Bildmerkmal-Erkennung und Beschreibung, Deep Learning und OCR

Das Detektieren und Erkennen von Text in Bildern ist eine übliche Aufgabe für Computer-Vision-Anwendungen. Beispielsweise können Sie aus einem fahrenden Fahrzeug ein Video einer Straßenszene aufnehmen, die Straßenschilder in der erfassten Szene erkennen und den Fahrer über die Schilder informieren.

Detektion und Erkennung können Sie in einem zweistufigen Prozess kombinieren, bei dem der erste Schritt Regionen mit Text findet und der zweite Schritt den Text in den Regionen erkennt.

Input image showing an accessible parking sign, connected to a detector, which outputs an image with predicted bounding boxes overlaid on the sign text, connected to a recognizer that outputs a list of the words recognized on the sign.

Texterkennungs-Algorithmen verwenden lokale Bildmerkmale, Machine Learning oder Deep Learning, um Text in einem Bild zu finden oder zu segmentieren. Die Beispiele in der Computer Vision Toolbox™ zeigen, wie Sie Blob-Analyse, den MSER-Merkmaldetektor (Maximally Stable Extremal Regions) und das CRAFT-Deep-Learning-Modell (Character Region Awareness For Text Detection) zur Texterkennung verwenden können.

Wurde der Text erkannt, verarbeiten Texterkennungsmodelle auf Basis von Machine Learning oder Deep Learning die Textregionen und geben den prognostizierten Text aus. Die ocr-Funktion verwendet vortrainierte Sprachmodelle, um Text in mehreren Sprachen zu erkennen. Zudem können Sie mithilfe der trainOCR-Funktion ein benutzerdefiniertes Sprachmodell trainieren. Weitere Informationen finden Sie unter Getting Started with OCR.

Apps

Image LabelerLabel images for computer vision applications

Funktionen

alle erweitern

ocrRecognize text using optical character recognition
ocrTextStore OCR results
visionSupportPackagesStart Installer to download, install, or uninstall Computer Vision Toolbox data
trainOCRTrain OCR model to recognize text in image (Seit R2023a)
evaluateOCREvaluate OCR results against ground truth (Seit R2023a)
ocrMetricsStore OCR quality metrics (Seit R2023a)
ocrTrainingOptionsOptions for training OCR model (Seit R2023a)
ocrTrainingDataCreate training data for OCR from ground truth (Seit R2023a)
quantizeOCRQuantize OCR model (Seit R2023a)
detectTextCRAFTDetect texts in images by using CRAFT deep learning model (Seit R2022a)
detectMSERFeaturesDetect MSER features
vision.BlobAnalysisProperties of connected regions
extractHOGFeaturesExtract histogram of oriented gradients (HOG) features

Themen

Erste Schritte