Mozilla verfolgt den Open-Source-Gedanken weiter und möchte Sprachtechnologie-Projekte unterstützen. So hat das Machine-Learning-Team des Unternehmens jetzt eine umfangreiche Sprachdatenbank im Rahmen des Projekts Common Voice öffentlich zugänglich gemacht. Die 500 Stunden Material umfassende Sammlung enthält 400'000 Aufnahmen von 200'000 Personen – und sie wird konstant durch Menschen aus aller Welt überprüft und weiter gefüttert.
Mit dieser Datensammlung möchte
Mozilla Entwicklern, Forschern und Start-ups, die mit sprachbasierten Technologien arbeiten, einen offenen Zugang zu Forschungsmaterial bieten. Vergleichbare, qualitativ ähnlich hochwertige Sprachdaten können zehntausende Euro kosten und reichen oftmals im Umfang doch nicht aus, um eine Statistikgrundlage für eine Spracherkennung zu schaffen, die Nutzererwartungen trifft.
Die Machine-Learning Experten von Mozilla arbeiten ausserdem an einer Open-Source-Speech-To-Text-Engine, mittels derer Diktier-Software weiter ausgefeilt werden kann. Das Team ist sehr erfolgreich: Bei Mozilla Librispeech liegt die Erkennungsfehlerrate mittlerweile bei 6,5 Prozent. Bisher liegen alle Daten in englischer Sprache vor, aber bald sollen weitere Idiome dazukommen.
Die Daten stehen bei
Mozilla Common Voice zum kostenlosen Download bereit.
(rpg)