Facebook-Mutterkonzern
Meta arbeitet an einer universellen Sprachübersetzung, die auf künstlicher Intelligenz basiert. Wie der Konzern in einem Blog-Beitrag
erklärt, würden die aktuellen Übersetzungstechnologien gängige Sprachen wie Englisch, Mandarin oder Spanisch bereits zur Genüge unterstützen. Doch wären Milliarden von Menschen nicht in der Lage, auf Informationen im Netz in ihrer Muttersprache zuzugreifen. Aktuelle Übersetzungssysteme seien beim Lernen auf grosse Mengen an Textdaten angewiesen und würden bei Sprachen mit wenig Trainingsdaten oder nicht vorhandenem standardisiertem Schreibsystem versagen.
Meta will dem mit zwei neuen Projekten entgegenwirken. Beim Programm "No Language left behind" soll ein KI-Modell entstehen, das sich mit deutlich weniger Beispielen trainieren lässt und das Übersetzungen "in Experten-Qualität" in hunderten von Sprachen von Asturian über Luganda bis Urdu ermöglichen soll. Das zweite Programm trägt die Bezeichnung Universal Speech Translator, das Echtzeit-Übersetzungen von Sprachen ohne standardisiertes Schreibsystem ermöglichen soll
Um Übersetzungen von Sprachen mit geringen Daten-Ressourcen voranzutreiben hat Metas KI-Abteilung des Open-Source-Toolkit LASER erweitert, das über 125 Sprachen mit 28 Schriften abdeckt. LASER konvertiert Sätze aus verschiedenen Sprachen in eine multilinguale Repräsentation und wurde nun um eine neue Lehrer-Schüler-Trainingsmethode erweitert, womit sich das Modell auf Sprachuntergruppen fokussieren kann und so bereits mit viel kleineren Datasets Lernergebnisse erzielen kann. Dabei setzt Meta auf FLORES-101, einen multilingualen Datensatz, der 101 Sprachen abdeckt und bereits vergangenen Sommer
vorgestellt wurde.
(rd)