Unter der Bezeichnung Cloud Vision API hat Internetriese
Google eine Cloud-basierte Programmierschnittstelle für die Bilderkennung vorgestellt. Entwickler haben damit die Möglichkeit, die Bilderkennungstechnologie in ihre Apps zu integrieren und die ermittelten Daten weiter zu nutzen. Die Bilderkennung wird aktuell in einer begrenzten Preview in Form eines REST-APIs bereitgestellt und umfasst sechs kombinierbare Erkennungsmöglichkeiten, wie im
Cloud-Platform-Blog berichtet wird.
• Eine Label/Entity Detection ermittelt das grundlegende Objekt, also ob es sich dabei etwa um ein Auto oder eine Katze handelt.
• Eine Texterkennung erkennt, wie herkömmliche OCR-Anwendungen Texte auf einem Bild, wobei auch die Sprache festgestellt wird.
• Mit einer Safe Search Detection werden unangemessene Inhalte aufgespürt, wobei sich Google darüber ausschweigt, was konkret unter diese Kategorie fällt.
• Mit Facial Detection lässt sich herausfinden, ob auf dem Bild ein Gesicht vorhanden ist und wo sich etwa die Augen oder der Mund befinden. Dazu kann damit die Stimmung der betreffenden Person ermittelt werden, wobei acht Gemütszustände unterstützt werden. Google betont, dass damit eine eigentliche Gesichtserkennung zu Identifikationszwecken nicht ermöglicht werde und dass keine Daten auf Google-Servern gespeichert würden.
• Eine Landmark Detection ist weiter in der Lage, bekannte Monumente zu erkennen und die betreffenden geografischen Koordinaten zu liefern, und eine Logo Detection erkennt Logos, um die jeweiligen Unternehmens- und Produktbezeichnungen zu liefern.
Wer sich für das Cloud Vision API interessiert, kann sich für die Preview online
registrieren. Später sollen die Bilderkennungsfunktionen mit Google Cloud Storage integriert werden.
(rd)