Amazon Web Services (AWS) hat im Rahmen der Entwicklerkonferenz AWS Re:Invent vergangene Woche nebst einer
Unternehmensversion von Alexa sowie
neuen Services und Programmen auch eine Reihe neuer Machine Learning Services präsentiert. So unter anderem
Amazon Transcribe, ein Dienst, der in Amazon S3 gesicherte Audiodateien in korrekten Text inklusive Interpunktion umwandeln soll. Aktuell werden Englisch und Spanisch unterstützt, weitere Sprachen sollen folgen. Ebenfalls präsentiert wurde Amazon Translate, ein Service, der modernste Techniken für die neuronale maschinelle Übersetzung verwenden soll, um so Texte hochpräzise von einer Sprache in eine andere umzuwandeln. Stand heute unterstützt Amazon Translate die Übersetzung vom Englischen in sechs weitere Sprachen (Arabisch, Deutsch, Französisch, Portugiesisch, Spanisch sowie vereinfachtes Chinesisch). Die Implementierung zahlreicher weiterer Sprachen ist für 2018 geplant.
Dann hat AWS Amazon Comprehend vorgestellt, ein Dienst, der Texte aus den unterschiedlichsten Quellen – Dokumenten, Social Media Posts oder Artikel – analysiert und dabei 100 verschiedene Sprachen erkennt. Ausserdem soll Comprehend unterschiedliche Instanzen (Personen, Orte, Marken, Produkte o.ä.), Schlüsselwörter oder Stimmungen (etwa positiv, negativ, gemischt oder neutral) erkennen und Schlüsselwörter extrahieren können.
Bei
Amazon Sagemaker soll es sich derweil um einen Managed Service handeln, mit dem Entwickler und Data Scientists laut Amazon unkompliziert eigene Machine-Learning-Modelle erstellen, trainieren, implementieren und verwalten können.
Schliesslich präsentierte Amazon noch die beiden Dienste Rekognition Video und Deeplens. Der Service Amazon Rekognition Video für Videos, die auf Amazon S3 gespeichert sind, kann laut AWS Personen verfolgen, Aktivitäten erkennen und Objekte, Gesichter oder Inhalte identifizieren. Darüber hinaus ermögliche der Dienst Gesichtserkennung in Echtzeit für Live-Stream-Videos. Die Verfolgung mehrerer Personen auf Video soll dabei sogar funktionieren, wenn ihre Gesichter teilweise verdeckt sind. Und bei Deeplens soll es sich um die weltweit erste Deep-Learning-fähige und vollständig programmierbare Videokamera handeln. Sie könne Computer-Vision-Modelle in Echtzeit ausführen und ermögliche jedem Entwickler den Einsatz von Machine-Learning-Fähigkeiten in Kombination mit Video. Die eingesetzte Hardware soll mehr als 100 Milliarden Deep-Learning-Operationen pro Sekunde ermöglichen.
(mw)