Das gesprochene Wort in ein Schriftstück und gleichzeitig Mundart in Hochdeutsch übertragen, das ist das Metier des Start-ups
Recapp aus Martigny. Das Unternehmen positioniert sich damit im dynamischen Spracherkennungsumfeld neben Grössen wie Apple, Google oder Amazon. Für Gründer David Imseng sind diese schillernden Namen mit ihren Horden von Entwicklern und Milliardenbudgets aber nur bedingt Konkurrenten. "Wir konzentrieren uns klar auf bestimmte Marktsegmente. Das gibt uns ein Alleinstellungsmerkmal", meint Imseng.
Im Parlament im Einsatz
So fokussiert
Recapp zurzeit auf Parlamente und ist damit schon in den Kantonen Wallis und Schaffhausen im Einsatz. Das Walliser Beispiel zeigt die Qualitäten des Start-ups: "Siri hat heute noch Probleme bei der Kontaktsuche, wenn Vor- und Nachname aus zwei verschiedenen Sprachregionen kommen. Und das ist noch einfach, verglichen mit dem Umschalten zwischen Deutsch und Französisch von Redner zu Redner, wie das im Walliser Parlament normal ist", so Imseng. Für Recapp ist das kein Problem. Die Software transkribiert die kompletten Sitzungen. Dabei liegt die Qualität der Spracherkennung bei 90 bis 95 Prozent. Das heisst: Jedes zehnte bis zwanzigste Wort muss anschliessend von einer der Parlamentssekretärinnen korrigiert werden. "Die Damen waren begeistert, denn es ist eine enorme Arbeitserleichterung", so Imseng. Aber das wäre nur ein bedingter Erfolg, wenn die Software nicht auch in der Lage wäre, das Transkript mit Satzzeichen zu versehen. Erst so wird der Text für den Menschen angenehm lesbar. Anschliessend erstellt die Software einen auf Schlüsselwörtern basierenden Index, der die Parlamentssessionen online für jeden durchsuchbar macht, und zwar nach Redner, Schlüsselwörtern oder chronologisch sortiert.
Gegenüber Google & Co. punktet Recapp also mit zwei Stärken: dem Fokus auf den branchenüblichen Jargon sowie die deutsche Sprache in Mundart und Hochdeutsch. «Englisch kann heute jeder. Zudem versuchen die Grossen jeder Situation und Branche gerecht zu werden. So liegen ihre Trefferquoten klar tiefer als bei einem Spezialisten», findet Imseng. Ausserdem ist das Transkribieren im englischen Sprachraum nicht unbedingt ein Feld nur für die IT. Hier lohnt sich nach wie vor das Auslagern in Billiglohnländer wie Indien. Bedingt gilt das auch für Französisch mit Angeboten aus Madagaskar.
Swisscom TV auf Mundart steuern
Recapp kann aber noch mehr, zum Beispiel als Element des neuen Swisscom TV. Kunden können hier mittlerweile per Stimme nach den gewünschten Programmen suchen. Die Software versteht dabei auch Mundart. Auf die Frage nach "Drii Hasilniss ver zAschenbrödel" liefert sie prompt "Drei Haselnüsse für Aschenbrödel".
Kombiniert man beide Projekte, kann
Recapp auch multimediale Archive bequem durchsuchbar machen. So können Reden oder Fernsehsendungen nach Themen durchsucht oder auch Zitate in Filmen gefunden werden.
Die Technologie für Recapp entstand im Rahmen vom Imsengs Forschungsarbeiten an der Univerity of California in Berkeley sowie dem Forschungsinstitut Idiap in Martigny. Seit 2014 ist das Unternehmen am Markt. In Zukunft will Imseng noch viele weitere Bereiche mit dieser Technologie erschliessen, zum Beispiel die Medizin. Dabei kann der Standort Schweiz durchaus von Vorteil sein. "Nicht jeder will oder darf seine Daten ins Ausland geben", so Imseng. Recapp kann deshalb schon heute in drei Varianten installiert werden. In der Cloud bei Anbietern wie Amazon, bei Hostern exklusiv in der Schweiz sowie in der eigenen Cloud-Infrastruktur, wie das Swisscom macht.