Die norwegische Browser-Schmiede
Opera baut die KI-Funktionen in der Entwicklerversion Opera Developer weiter aus. Wie das Unternehmen in einem Blog Post
ankündigt, ist die im Browser integrierte KI namens Aria neu in der Lage, Sprachanweisungen zu verstehen, ja ganze Unterhaltungen mit dem User zu führen. Dabei wird im Hintergrund ein textbasiertes Protokoll der Unterhaltung erstellt, auf das man zugreifen kann. Die Konversationsfähigkeiten von Aria basieren auf dem Whisper-Spracherkennungsmodell von OpenAI, während für die Sprach-Output Googles Wavenet-Modell zum Einsatz kommt.
Um die Sprachfunktion zu nutzen, muss vorab die jüngste Version von Opera Developer installiert werden. Nach dem Öffnen von Aria über das betreffende Symbol lässt sich die Spracherkennung mit einem Mausklick auf das Mikrofon aktivieren. Mit Statusmeldungen wird jeweils signalisiert, ob Aria zuhört oder am Bearbeiten einer Anfrage ist. Wenn der User aufhört zu sprechen, schaltet sich die Spracherkennung automatisch wieder ab.
(rd)