Das dürfte kein Zufall sein: Das französische KI-Start-up
Mistral AI präsentiert sein neues Modell namens Large 2 nur einen nach dem Release von Metas Llama 3.1. Es ist eine Kampfansage an Mark Zuckerbergs Konzern, aber auch an Konkurrenten OpenAI. Large 2 kommt mit 123 Milliarden Parametern und soll laut dem Anbieter somit auf Augenhöhe mit GPT-4o und Llama 3.1 sein. Zudem liege es in Hinblick auf seine Performance deutlich vor dem Vorgänger Large.
Mistral hat zudem "erhebliche Anstrengungen unternommen", um die logischen Fähigkeiten des Modells zu verbessern. Einer der Hauptschwerpunkte des Trainings lag dabei auf der Minimierung von Halluzinationen sowie von "plausibel klingenden, aber sachlich falschen oder irrelevanten Informationen". Darüber hinaus wurde Large 2 so trainiert, dass das Modell erkennt, wenn es keine Lösungen finden kann oder nicht über genügend Informationen verfügt, um eine sichere Antwort zu geben.
Darüber hinaus hat
Mistral Large 2 mit mehrsprachigen Daten trainiert: Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Niederländisch, Russisch, Chinesisch, Japanisch, Koreanisch, Arabisch und Hindi. Das soll für besonders gute Ergebnisse beispielsweise bei mehrsprachigen Dokumenten sorgen.
Large 2 arbeitet mit einem Kontextfenster von 128'000 Tokens, was umgerechnet einem Dokument mit rund 300 Seiten entspricht. Damit ist das neue Mistral-Modell ebenfalls auf einem Niveau mit GPT-4 und Llama 3.1. Mistral erweitert zudem die Zusammenarbeit mit den grossen Cloud-Service-Providern. So wird Large 2 neben Azure AI Studio, Amazon Bedrock und IBM WatsonX via Managed API erstmals auch über Googles Vertex AI zur Verfügung stehen.
(sta)