Mitte Mai hat
Google anlässlich der diesjährigen I/O-Hauskonferenz Vorschauversionen des stark verbesserten KI-Modells Gemini 1.5 Pro wie auch des neuen Modells Gemini 1.5 Flash vorgestellt ("Swiss IT Magazine"
berichtete). Bei Letzterem handelt es sich um eine kleinere, dafür schnellere Variante.
Wie Google jetzt via
Blog Post bekannt gibt, sind Gemini 1.5 Pro wie auch 1.5 Flash per sofort via die browserbasierte KI-Entwicklungsumgebung AI Studio allgemein verfügbar. Weiter heisst es, bei Gemini 1.5 Flash handle es sich um das bis anhin schnellste und kosteneffizienteste Modell für Aufgaben mit hohen Volumen. Man habe hier deshalb auch die Limite auf 1000 Anfragen pro Minute angehoben und die Limite pro Tag aufgehoben.
Dazu hat Google die Gemini-API-Verrechnung vorgestellt. Entwicklern, denen die kostenlos bereitgestellte Rate nicht genügt, können neu gegen Bezahlung höhere Nutzungsraten aktivieren.
Kostenlos sind bei Gemini 1.5 Flash derzeit 15 Anfragen pro Minute bei einer Million Tokens pro Minute, pro Tag sind 1500 Anfragen möglich. Wird die Rechnungs-Option gewählt, steigt die Rate pro Minute auf 360, die Anzahl Tokens pro Minute auf 10 Millionen und die Anfragen pro Tag auf 10'000. Verrechnet wird bei der Eingabe 35 oder 70 Cents pro Million Tokens, je nachdem ob die Prompts kürzer oder länger als 128'000 Tokens sind. Die Ausgabe kostet entsprechend 1,05 oder 2,1 Dollar für eine Million Tokens.
Bei Gemini 1.5 Pro sind kostenlos 2 Abfragen pro Minute bei maximal 32'000 Tokens pro Minute sowie 50 Abfragen pro Tag möglich. In der verrechneten Variante werden die Limiten auf 360 Anfragen pro Minute bei 2 Millionen Tokens in der Minute sowie auf 10'000 Anfragen pro Tag angehoben. Die Eingabe kostet hier 3,5 respektive 7 Dollar für eine Million Tokens und bei der Ausgabe 10,5 beziehungsweise 21 Dollar für eine Million Tokens, ebenfalls abhängig von der Promt-Länge.
(rd)