Objektklassifizierung Maschinelles Lernwerkzeug zur zuverlässigen Objekterkennung

Redakteur: Gerd Kucera

Firmen zum Thema

(Bild: STEMMER IMAGING)

CVB Polimago gehört zum Bildverarbeitungs-Toolkit Common Vision Blox (CVB) von STEMMER IMAGING und liefert laut Hersteller eine ähnliche Genauigkeit wie Ansätze mit neuronale Netzwerken. Dabei wird die Ridge-Regression eingesetzt, eine „Supervised Learning“-Methode zur Suche und Klassifizierung in industriellen Bildverarbeitungsanwendungen. Überwachtes Lernen heißt in diesem Zusammenhang, dass der Anwender in den Trainingsbildern typische Klassifizierungsmerkmale mittels einer ROI markiert hat. Dadurch ist der Polimago-Algorithmus in der Lage, eine Funktion zu erzeugen, die das gewünschte Ergebnis liefert. Ein entscheidender Faktor ist laut Hersteller, dass CVB Polimago in der Regel nur 20 bis 100 Trainingsbilder benötige, während neuronale Netzwerke 500 Bilder pro Klasse zum Antrainieren erfordern sowie 500 zulässige Referenzbilder. Beispielsweise würde ein CNN für eine OCR-Anwendung mit alphanumerischen Zeichen (A-Z und 0-9) 36 x 500 = 18.000 Trainingsbilder benötigen, heißt es. Kleinere Trainingssets bieten eine Reihe von Vorteilen. Erstens ist bei Polimago schnelleres Anlernen möglich als bei Werkzeugen, die auf neuronalen Netzwerken basieren. Polimago verlange beispielsweise in der Regel 5 bis 20 Minuten Zeit zum Antrainieren, während es bei CNN Stunden seien. Zweitens dauere es bei neuronale Netzwerke wesentlich länger, die erforderlichen Klassifizierungsmerkmale in ihren großen Traningssets zu kennzeichnen. Muss ein Trainingsprozess wiederholt werden, um verschiedene Parameter auszuwerten, arbeiten neuronale Netzwerke noch umständlicher, sagt STEMMER IMAGING.

(ID:46106021)