Mozilla gibt 500 Stunden Sprachdaten frei

Quelle: Mozilla

Mozilla gibt 500 Stunden Sprachdaten frei

Mozilla hat hunderttausende Sprachaufnahmen gesammelt und diese jetzt zum kostenlosen Download freigegeben. Mit der offenen Datenbank können Forscher und Entwickler ihre Spracherkennungsprojekte weiter vorantreiben – denn Sprach-Interfaces werden im Umgang mit Geräten eine immer wichtigere Rolle spielen.

30. November 2017

Mozilla verfolgt den Open-Source-Gedanken weiter und möchte Sprachtechnologie-Projekte unterstützen. So hat das Machine-Learning-Team des Unternehmens jetzt eine umfangreiche Sprachdatenbank im Rahmen des Projekts Common Voice öffentlich zugänglich gemacht. Die 500 Stunden Material umfassende Sammlung enthält 400'000 Aufnahmen von 200'000 Personen – und sie wird konstant durch Menschen aus aller Welt überprüft und weiter gefüttert.

Mit dieser Datensammlung möchte Mozilla Entwicklern, Forschern und Start-ups, die mit sprachbasierten Technologien arbeiten, einen offenen Zugang zu Forschungsmaterial bieten. Vergleichbare, qualitativ ähnlich hochwertige Sprachdaten können zehntausende Euro kosten und reichen oftmals im Umfang doch nicht aus, um eine Statistikgrundlage für eine Spracherkennung zu schaffen, die Nutzererwartungen trifft.

Die Machine-Learning Experten von Mozilla arbeiten ausserdem an einer Open-Source-Speech-To-Text-Engine, mittels derer Diktier-Software weiter ausgefeilt werden kann. Das Team ist sehr erfolgreich: Bei Mozilla Librispeech liegt die Erkennungsfehlerrate mittlerweile bei 6,5 Prozent. Bisher liegen alle Daten in englischer Sprache vor, aber bald sollen weitere Idiome dazukommen.

Die Daten stehen bei Mozilla Common Voice zum kostenlosen Download bereit. (rpg)

Weitere Artikel zum Thema

Microsofts Spracherkennung ist so gut wie die menschliche

21. August 2017 - Ein Forschungsteam von Microsoft hat einen Meilenstein in der Spracherkennung erreicht. Die vom Team entwickelten Algorithmen erkennen Sprache so effizient wie Menschen.

Statistik Stadt Zürich stellt Open-Source-Software zur Verfügung

15. Juni 2017 - Die Statistik-Abteilung der Stadt Zürich macht per Ende Jahr eine Open-Source-Software öffentlich, mit der interaktive Grafiken erstellt werden können, um unterschiedliche Daten zu veranschaulichen.

Spracherkennung versteht Schweizerdeutsch

20. Februar 2017 - Das Walliser Start-up Recapp bietet eine Spracherkennungslösung, die auf Branchen fokussiert ist und ausserdem Mundart versteht.

Artikel kommentieren

Phishing-Alarm in Microsoft 365 und Google Workspace

Phishing-Alarm in Microsoft 365 und Google Workspace

Wie Unternehmen sich vor Homoglyphen- und Spoofing-Angriffe schützen können

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

KI-Agenten revolutionieren das Kundenerlebnis: Sie analysieren Daten, erstellen Pläne und handeln überwiegend autonom. KI-Agenten eröffnen Unternehmen neue Möglichkeiten von automatisierten Serviceanfragen bis hin zu komplexen Abläufen, die ohne menschliches Zutun durchgeführt werden.

Die effizienteste IT-Strategie? Ist hybrid.

Die effizienteste IT-Strategie? Ist hybrid.

CIOs verstehen die digitale Transformation oft als unabdingbaren Wechsel ihrer gesamten IT in die Cloud. Doch die Online-Dienste entfalten ihren grössten Vorteil in Kombination mit lokalen Installationen. Hybrid Computing macht deshalb nicht umsonst ‚die Runde‘: Schliesslich gewährleistet es Sicherheit und Kontrolle durch eigene IT-Ressourcen – und volle Agilität in der Cloud. Björn Orth, Geschäftsführer des Microsoft Solutions Partners VENDOSOFT bricht eine Lanze für diese Form der hybriden Lizenzierung.

Wirkung im Ziel!

Wirkung im Ziel!

Was wäre, wenn Aus- und Weiterbildungen unmittelbar sichtbare Wirkung zeigten? Nein, dies ist keine Fiktion. Drei einfache Schritte führen zum Ziel.

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Der Cyber Resilience Act verändert die Sicherheitsanforderungen für Embedded Devices grundlegend. Welche neuen Herausforderungen kommen auf Unternehmen zu? Wie lassen sich Compliance-Vorgaben effizient umsetzen? Gemeinsam mit unserem Partner ONEKEY zeigen wir, wie Sie Sicherheitsrisiken minimieren und Embedded Devices optimal schützen.

Zögern Sie noch bei der Automatisierung?

Zögern Sie noch bei der Automatisierung?

Der moderne Arbeitsplatz entwickelt sich ständig weiter. Technologische Fortschritte, die Bedürfnisse einer Mehrgenerationenbelegschaft und hybride Arbeitsmodelle machen die Optimierung der Mitarbeitererfahrung zunehmend komplex.

GOLD SPONSOREN

SPONSOREN & PARTNER