Google springt mit Gemini auf den Video-Generierungs-Zug auf: Das Modell Veo 2 ermöglicht neu die Erstellung von Videoclips basierend auf Textprompts. Damit tritt
Google in direkte Konkurrenz zum Modell Sora von OpenAI ("Swiss IT Magazine"
berichtete). Veo 2 generiert acht Sekunden lange Szenen. Die Clips verfügen über eine Auflösung von 720p und werden ausschliesslich im 16:9 Format produziert. User können die fertige Datei als .mp4-File herunterladen oder auch direkt per Shortcut in sozialen Netzwerken teilen. Google verspricht bei der Videoerstellung reale Physik, echt wirkende menschliche Bewegungen und feine visuelle Details.
Eine zweite Neuerung ist die Animation von Bildern über die Funktion Whisk. Basierend auf einem Bild erstellt Gemini eine passende Animation. Die KI kann dabei diverse Stile bedienen, je nach Wunsch des Users. Um ein den Erwartungen entsprechendes Video zu kreieren, nimmt Gemini nebst dem Bild auch Textprompts entgegen.
Google führt die Video-Generierung in den nächsten Wochen in der Schweiz und weltweit für Abonnenten von Gemini Advanced im Web und auf Mobilgeräten ein. Die Funktion wird in allen von Gemini unterstützten Sprachen, also auch Deutsch, angeboten.
(dok)