Google will sich im KI-Bereich offensichtlich nicht von OpenAI und Microsoft abhängen lassen: Mit Gemini hat der Internetkonzern jetzt sein bisher leistungsfähigstes KI-Modell vorgestellt. Gemini wurde laut Demis Hassabis, CEO and Co-Founder von
Google Deepmind, "von Grund auf multimodal konzipiert, es kann daher verschiedene Arten von Informationen, darunter Text, Code, Audio, Bild und Video, verstehen und nahtlos miteinander kombinieren".
Gemini wird in drei Versionen verfügbar sein. Gemini Pro ist die mittlere und am breitesten ausgerichtete der drei Optionen. Gemini Ultra stellt hingegen das performanteste Modell für hochkomplexe Aufgaben dar, währenden Gemini Nano für den On-Device-Einsatz beispielsweise auf Smartphones angedacht ist. Gemini Pro kommt bereits ab sofort im Rahmen von Bard zum Einsatz, während Gemini Nano erstmals auf dem Pixel 8 Pro verfügbar sein wird. Gemini Ultra soll Anfang des kommenden Jahres folgen. Entwickler und Unternehmenskunden haben zudem ab dem 13. Dezember über die Gemini-API in Google AI Studio oder Google Cloud Vertex AI Zugriff auf das Modell, um eigene, darauf aufbauende Apps zu entwickeln.
Google zeigt sich selbstbewusst in Hinblick auf die Leistungsfähigkeit von Gemini. So hätten interne Tests gezeigt, dass Gemini Ultra anderen Modellen in 30 von 32 akademischen Benchmarks überlegen sei. Beim Massive Multitask Language Understanding-Test (MMLU), der 57 Aufgaben etwa aus Mathematik, Informatik, Geschichte, und Recht umfasst, erziele Gemini Ultra ein Ergebnis von 90 Prozent und übertreffe so menschliche Experten – GPT-4 erreicht laut dem Unternehmen 86,4 Prozent.
"Jetzt machen wir den nächsten Schritt auf unserer Reise mit Gemini, unserem bisher leistungsfähigsten und allgemeinsten Modell, das bei vielen führenden Benchmarks die beste Leistung zeigt", unterstreicht Google- und Alphabet-CEO Sundar Pichai. "Unsere erste Version, Gemini 1.0, ist für verschiedene Grössen optimiert: Ultra, Pro und Nano. Dies sind die ersten Modelle der Gemini-Ära und die erste Umsetzung unserer Vision, die wir hatten, als wir Anfang des Jahres
Google Deepmind gegründet haben." Diese neue Ära von Modellen stelle eine der grössten wissenschaftlichen und technischen Anstrengungen dar, die Google als Unternehmen unternommen habe.
(sta)