Google hat mit der
Tensor Flow Object Detection API ein System entwickelt, mittels welchem sich auf Bildern automatisch Objekte erkennen lassen. Das Unternehmen nutzt diese Technologie bereits in verschiedenen Anwendungen, wie etwa der Bildersuche, Street View oder auch in der Android-Photo-App. Nun hat
Google das System als Open-Source-Projekt
veröffentlicht, wodurch dieses frei zugänglich ist.
Das Framework baut dabei auf das von Google entwickelte Machine-Learning Framework Tensor Flow auf. Zur Objekterkennung sind bereits einige Erkennungsmodelle enthalten, darunter ein Single Shot Multibox Detector (SSD), Region-based Convolutional Neural Neworks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie auch darauf aufbauende Erweiterungen. Ebenfalls inbegriffen ist ein
Jupyter Notebook. Mit einer Version des Faster R-CNN hatte Google 2016 die
Microsoft COCO (Common Objects in Context) Detection Challenge gewonnen.
Google hat bereits im September 2016 mit "Show and Tell" ein Framework veröffentlicht, mit welchem automatisch Bildunterschriften erstellt werden können, während Konkurrent Facebook im Sommer 2016 mit Deepmask und Sharpmask ebenfalls Open-Source-Bibliotheken veröffentlichte, welche Objekte innerhalb von Bildern erkennen können. Auch Microsoft und
IBM bieten mit den Cognitive Services, respektive der Watson API Bilderkennungsfunktionen an.
(swe)