Googles KI-Agent Gemini erhält die beiden neuen Funktionen Audio Overview und Canvas. Canvas ist ein interaktiver, kollaborativer Arbeitsbereich, der das Erstellen, Verfeinern und Teilen von Text und Code erleichtern soll. So lassen hier Texte erstellen und mithilfe von Gemini Schritt für Schritt verfeinern. Zudem zielt Canvas auf Programmierer ab. Die Funktion unterstützt die Arbeit unter anderem an Prototypen für Webanwendungen, Python-Skripte, Spiele oder Simulationen. Ausserdem kann HTML-/React-Code und andere Prototypen für Webanwendungen generiert werden.
Google führt als Beispiel die Erstellung eines E-Mail-Anmeldeformulars für eine Website an. Gemini kann den entsprechenden HTML-Code generieren und zeigt in einer Vorschau an, wie das Formular anschliessend in der Webanwendung aussehen würde.
Audio Overview soll wiederum Dateien wie Dokumente, Präsentationen und Forschungsberichte in Audiodiskussionen im Podcast-Stil verwandeln. Auf Basis einer hochgeladenen Datei fasst Gemini die Inhalte zusammen, verknüpft die Themen und erstellt die entsprechende Audiodiskussion. Die KI übernimmt dabei die Rolle der beiden Sprecher.
Sowohl Canvas als auch Audio Overview sind ab sofort weltweit für Abonennten von Gemini und Gemini Advanced verfügbar, Canvas bereits in allen Sprachen der Gemini-App, Audio Overview vorerst nur in Englisch. Weitere Sprachen sollen aber bald folgen.
(sta)