Durch den Einsatz intelligenter Multimedia-Mustererkennungs-Algorithmen generiert Audio Mining automatisch ein breites Spektrum an Metadaten für Mediendateien und wandelt dabei gesprochenes Wort in durchsuchbaren Text um.

IAIS Audio Mining
Mit dem Audio Mining System des Fraunhofer IAIS lassen sich Ton- und Videospuren gezielt nach O-Tönen durchsuchen, die Sprechererkennung erlaubt es, Personen zu finden und in der Datei gezielt anzusteuern.

© Foto Fraunhofer IAIS

Automatische Aufbereitung von Audio-Medienbeständen

Mit der automatischen Sprach-Erkennung („speech-to-text“) können Audiodaten für die Suche aufbereitet und automatisch verschlagwortet werden. Dabei werden auch verschiedene Sprecher erkannt und Sprache von anderen Audion-Daten (Musik, Geräusche) unterschieden. Die Metadaten der Audio-Dateien können entsprechend angereichert werden, um vorhandene Suchfunktionen zu unterstützen.

Nutzen & Mehrwert

Die Spracherkennung trägt nicht nur zur Verbesserung der Suchfunktion bei, sie kann auch für weitere Optimierungen genutzt werden: Auf Basis der gesprochenen Wörter werden die Inhalte mit automatisch erzeugten Schlagworten angereichert und zu ähnlichen Inhalten in Beziehung gesetzt. So können dem Nutzer Empfehlungen gegeben werden, die ihn auf weitere für ihn interessante Inhalte hinweisen. Die Verweildauer des Nutzers wird so verlängert und auch ältere, nicht mehr populäre Inhalte werden noch abgerufen.

Kategorie:
Entwickelt von

Fraunhofer IAIS

Ihre Ansprechpartnerin

Gerne gebe ich Ihnen Auskunft zu unseren Softwareprodukten.

Ying Ge-Wolf
Ying Ge-WolfProduktvertrieb

Flexibilität und Usability

Durch die serviceorientierte Architektur und nachrichtenbasierte Kommunikation bietet das Audio Mining System ein hohes Maß an Flexibilität und die Möglichkeit, den Funktionsumfang auf Ihre individuellen Bedürfnisse zuzuschneiden. Dadurch kann das System in ein bereits vorhandenes Medienarchiv integriert und z. B. als Metadaten-Anreicherungsdienst verwendet werden oder aber auch als eigenständiges Medienarchiv fungieren.

Ganz nach Ihren Anforderungen

Für Ihre Version des Audio Mining Systems können wir sowohl auf bestehende Workflows z. B. zum Text-Mining oder zur Audio-Transkription zurückgreifen oder wir entwickeln neue individuelle Workflows für Sie. In enger Kooperation mit Ihrem Team können kundenspezifische KI-Modelle trainiert, neue Analyse-Services entwickelt oder zusätzlich bereits bestehende Services angebunden werden.

Einsatzbereiche

  • Rundfunk- und Fernsehsender

  • Anbieter von Mediatheken

  • Unternehmen, die Metadaten aus großen Mengen von Text-, Audio- und/oder Videoinformationen erschließen möchten