Deep Learning Hikvision erkennt maschinell Texte auf unscharfen Hintergründen

Redakteur: Franz Graser

Der chinesische Bilderkennungs-Spezialist Hikvision hat mit einer auf Deep Learning basierenden Texterkennungs-Technik einen bedeutenden Preis für maschinelles Lesen gewonnen. Unter anderem gelang es, Zeichen auf verschmutzten Hintergründen zu erkennen oder unscharfe Texte zu lesen.

Firmen zum Thema

Von der Videoüberwachung zur Texterkenung: Hikvision, chinesischer Hersteller von Videokameras, hat jetzt mit seiner auf Deep Learning basierenden Zeichenerkennung die Robust Reading Competition der ICDAR-Konferenz gewonnen.
Von der Videoüberwachung zur Texterkenung: Hikvision, chinesischer Hersteller von Videokameras, hat jetzt mit seiner auf Deep Learning basierenden Zeichenerkennung die Robust Reading Competition der ICDAR-Konferenz gewonnen.
(Bild: gemeinfrei / CC0 )

Die Robust Reading Competition der ICDAR (International Conference on Document Analysis and Recognition) gilt als der weltweit renommierteste Wettbewerb im Bereich der OCR-Technologie und fand seit 2003 zum fünften Mal statt. Seit der letzten Ausgabe 2015 haben 2.367 Teams aus 82 Ländern am Wettbewerb teilgenommen, darunter Google, Microsoft, Baidu, Samsung, und Megvii. Das Team von Hikvision setzte sich in drei Worterkennungskategorien (Born-Digital-Bilder, Focused-Scene-Text und Incidental-Scene-Text) gegen starke internationale Konkurrenz durch.

Die Worterkennung findet auf komplizierten Bildhintergründen statt. Es gilt verschiedene Störfaktoren zu überwinden wie beispielsweise Rauschen, Unschärfe, Transparenz und Bildschieflage. Zudem werden unterschiedliche Schriftarten verwendet. Die OCR-Technik von Hikvision hat viele dieser Herausforderungen überwunden und in drei Worterkennungskategorien weltweit den ersten Platz belegt. Im Einzelnen schlug sie den Zweitplatzierten in der Kategorie „Web and Email Born Digital Images“ um 5,6 Prozent und in der Kategorie „Focused Scene Text“ bzw. „Incidental Scene Text“ um 3,4 beziehungsweise 3,1 Prozent.

Auf Basis fortschrittlicher OCR-Technik ist das System von Hikvision in der Lage, kompliziertere Worterkennungssituationen zu meistern, beispielsweise Flecken und Unschärfen, Hintergrundrauschen und Verformungen oder auch extreme Wetterverhältnisse. Das Zeichenerkennungssystem von Hikvision, das auf dieser OCR-Technik beruht, kommt an mehr als 60 Standorten weltweit zum Einsatz. Dazu zählen elektronische Systeme, die von der Polizei oder bei der Ein-/Ausfahrtkontrolle und Parkanlagen verwendet werden.

Die Ergebnisse dieses Wettbewerbs haben außerdem für verschiedene andere Sektoren Bedeutung. Zu diesen Anwendungen gehören beispielsweise die Schilderkennung beim maschinellen Sehen, die Ausweis- und Zulassungserkennung im Verkehrs- und gewerblichen Bereich, die Schadbilderkennung über das Internet sowie die Banner- und Straßensichterkennung im Bereich des Stadtmanagements.

(ID:44637075)