Texterkennung und -erfassung
Das Detektieren und Erkennen von Text in Bildern ist eine übliche Aufgabe für Computer-Vision-Anwendungen. Beispielsweise können Sie aus einem fahrenden Fahrzeug ein Video einer Straßenszene aufnehmen, die Straßenschilder in der erfassten Szene erkennen und den Fahrer über die Schilder informieren.
Detektion und Erkennung können Sie in einem zweistufigen Prozess kombinieren, bei dem der erste Schritt Regionen mit Text findet und der zweite Schritt den Text in den Regionen erkennt.
Texterkennungs-Algorithmen verwenden lokale Bildmerkmale, Machine Learning oder Deep Learning, um Text in einem Bild zu finden oder zu segmentieren. Die Beispiele in der Computer Vision Toolbox™ zeigen, wie Sie Blob-Analyse, den MSER-Merkmaldetektor (Maximally Stable Extremal Regions) und das CRAFT-Deep-Learning-Modell (Character Region Awareness For Text Detection) zur Texterkennung verwenden können.
Wurde der Text erkannt, verarbeiten Texterkennungsmodelle auf Basis von Machine Learning oder Deep Learning die Textregionen und geben den prognostizierten Text aus. Die ocr
-Funktion verwendet vortrainierte Sprachmodelle, um Text in mehreren Sprachen zu erkennen. Zudem können Sie mithilfe der trainOCR
-Funktion ein benutzerdefiniertes Sprachmodell trainieren. Weitere Informationen finden Sie unter Getting Started with OCR.
Apps
Image Labeler | Label images for computer vision applications |
Funktionen
Themen
Erste Schritte
- Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text. - Train Custom OCR Model
Train an optical character recognition (OCR) model to recognize custom text. - Install OCR Language Data Files
Support files for optical character recognition (OCR) languages. - Local Feature Detection and Extraction
Learn the benefits and applications of local feature detection and extraction. - Point Feature Types
Choose functions that return and accept points objects for several types of features.