Der Zuckerberg-Konzern
Meta engagiert sich seit einiger Zeit rege für KI. Als neuestes Erzeugnis hat Meta das multimodale KI-Modell SeamlessM4T vorgestellt. Damit sollen sich Texte sowie Sprache als Audio zwischen fast 100 Sprachen übersetzen lassen. In der Ankündigung führt Meta fünf Anwendungsfelder führt SeamlessM4T auf: Speech-to-Speech, Speech-to-Text, Text-to-Speech, Text-to-Text und automatische Spracherkennung. Das Modell steht unter der Creative-Commons-Lizenz CC BY-NC 4.0 frei zur Verfügung. Dazu kommen die ebenfalls frei verfügbaren Metadaten von Seamless Align mit über 270'000 Stunden Speech-Text-Entsprechungen.
Im
Blogbeitrag zu SeamlessM4T schreibt
Meta: "Unser einziges Modell bietet On-Demand-Übersetzungen, die es Menschen, die unterschiedliche Sprachen sprechen, ermöglichen, effektiver zu kommunizieren. Wir verbessern die Leistung der von uns unterstützten Sprachen mit geringen und mittleren Ressourcen erheblich. Dabei handelt es sich um Sprachen, die einen kleineren digitalen linguistischen Footprint aufweisen. Auch für ressourcenintensive Sprachen wie Englisch, Spanisch und Deutsch halten wir eine starke Leistung aufrecht. SeamlessM4T erkennt implizit die Quellsprachen, ohne dass ein separates Sprachidentifikationsmodell erforderlich ist."
(ubi)