Teuken-7B steht zur Nutzung bereit. Dabei handelt es sich um ein in Europa entwickeltes grosses KI-Sprachmodell, das aus dem Forschungsprojekt OpenGPT-X unter Leitung des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme IAIS und für Integrierte Schaltungen IIS hervorgegangen ist. Akteure aus Forschung und Unternehmen können das kommerziell einsetzbare Open-Source-Modell ab sofort für ihre eigenen Anwendungen nutzen. Sensible Daten sollen dabei komplett im Unternehmen verbleiben.
Teuken-7B ist laut OpenGPT-X aktuell eines der wenigen KI-Sprachmodelle, die von Grund auf multilingual entwickelt wurden. Es enthält rund 50 Prozent nicht-englische Pretraining-Daten und wurde in allen 24 europäischen Amtssprachen trainiert. Das soll vor allem internationalen Unternehmen mit mehrsprachigen Teams und Angeboten Mehrwerte bieten.
"Wir freuen uns, dass wir jetzt unser Modell Teuken-7B weltweit frei zur Verfügung stellen und damit eine aus der öffentlichen Forschung stammende Alternative für Wissenschaft und Unternehmen bieten können", sagt Professor Stefan Wrobel, Institutsleiter am Fraunhofer IAIS. "Unser Modell hat seine Leistungsfähigkeit über eine grosse Bandbreite an Sprachen gezeigt, und wir hoffen, dass möglichst viele das Modell für eigene Arbeiten und Anwendungen adaptieren oder weiterentwickeln werden."
Interessierte Entwicklerinnen und Entwickler können Teuken-7B bei Hugging Face
kostenfrei herunterladen und damit in der eigenen Entwicklungsumgebung arbeiten. Das Modell wurde durch ein Instruction Tuning bereits für den Chat optimiert. Teuken-7B steht dabei in zwei Varianten zur Verfügung: einer Version, die für Forschungszwecke genutzt werden kann, und einer Version unter der Lizenz Apache 2.0, die Unternehmen neben Forschung auch für kommerzielle Zwecke einsetzen und in eigene KI-Anwendungen integrieren können.
(sta)