Gesprochene Sprache durchsuchen

Gesprochene Sprache durchsuchen

audioclipping betaTextdateien lassen sich problemlos durchsuchen und indizieren, während Multimedia-Inhalte wie Videos und Soundfiles bloss anhand des Dateinamens und allfälliger Metadaten auffindbar sind. Daran hat sich seit der Web-Steinzeit allen neuen Technologie zum Trotz nicht viel geändert. Doch bevor sich alle User endgültig an die Textwüste gewöhnt haben, präsentiert eine kleine deutsche Firma die Technologie für den großen Lauschangriff.

Spracherkennung stellt Algorithmen vor große Herausforderungen. Der umgekehrte Weg, die Sprachsynthese, kommt bereits seit Jahren zum Einsatz, etwa in automatisierten Telefon-Auskunftssystemen. Will man jedoch gesprochenen Text erkennen, so muss die Software mit einem breiten Spektrum von verschiedenen Tonlagen, Sprechgeschwindigkeiten, verschiedenen Hintergrundgeräusch und anderen Paramentern umgehen können – ganz zu schweigen von verschiedenen Sprachen.

Die Texterkennung von Songs gestaltet sich äußerst schwierig – muss der Computer doch erst einmal Musik- und Stimmanteile unterscheiden. Podcasts und Nachrichten jedoch bestehen meistens vorwiegend aus gesprochenem Content, und genau hier tritt die Audioclipping-Technologie der Firma Com Vision aus Mecklenburg-Vorpommern auf den Plan. Bis zu 85% Erkennungsrate erreicht das System nach Auskunft des Herstellers:

Zwar könne der Computer auch heutzutage kein druckreifes Protokoll schreiben wie ein Stenograf, räumt Mainka ein. Selbst die moderne Software verstehe nur 85 Prozent der gesprochenen Sprache korrekt. Ein Kunstgriff führe aber zum richtigen Ergebnis: „Wir suchen auch nach ähnlichen Wörtern“, erklärt der Cheftechniker. „Damit sind wir in der Lage, jede Textstelle wiederzufinden. [Spiegel online]

Die Analyse von 60 Minuten Sprache dauert dabei derzeit rund 8 Minuten. Auf Audioclipping.de indiziert Com Vision monatlich rund 15.000 Radiostunden und bietet eine Stichwortsuche mit kostenloser Trefferliste. Anwendungsmöglichkeiten gibt es viele: neben PR-Heinis professionellen Medienbeobachtern und Suchmaschinenbetreibern interessieren sich auch bereits Archivare und natürlich stets von der Flut der mitgeschnittenen Telefonate schier erschlagene Geheimdienste. [via Ohr kauft mit]

0 Kommentare

Hinterlasse einen Kommentar

Schreibe einen Kommentar