Audio Mining - Transkription von Audio- und Videodaten | scapos AG

Durch den Einsatz intelligenter Multimedia-Mustererkennungs-Algorithmen generiert Audio Mining automatisch ein breites Spektrum an Metadaten für Mediendateien und wandelt dabei gesprochenes Wort in durchsuchbaren Text um.

Mit dem Audio Mining System des Fraunhofer IAIS lassen sich Ton- und Videospuren gezielt nach O-Tönen durchsuchen, die Sprechererkennung erlaubt es, Personen zu finden und in der Datei gezielt anzusteuern.

Automatische Aufbereitung von Audio-Medienbeständen

Mit der automatischen Sprach-Erkennung („speech-to-text“) können Audiodaten für die Suche aufbereitet und automatisch verschlagwortet werden. Dabei werden auch verschiedene Sprecher erkannt und Sprache von anderen Audion-Daten (Musik, Geräusche) unterschieden. Die Metadaten der Audio-Dateien können entsprechend angereichert werden, um vorhandene Suchfunktionen zu unterstützen.

Nutzen & Mehrwert

Die Spracherkennung trägt nicht nur zur Verbesserung der Suchfunktion bei, sie kann auch für weitere Optimierungen genutzt werden: Auf Basis der gesprochenen Wörter werden die Inhalte mit automatisch erzeugten Schlagworten angereichert und zu ähnlichen Inhalten in Beziehung gesetzt. So können dem Nutzer Empfehlungen gegeben werden, die ihn auf weitere für ihn interessante Inhalte hinweisen. Die Verweildauer des Nutzers wird so verlängert und auch ältere, nicht mehr populäre Inhalte werden noch abgerufen.

Kategorie:

KI-Technologien

Entwickelt von

Fraunhofer IAIS

Ihre Ansprechpartnerin

Gerne gebe ich Ihnen Auskunft zu unseren Softwareprodukten.

Ying Ge-WolfProduktvertrieb

+49-2241-14-4408
Kontakt

Info anfragen

Flexibilität und Usability

Durch die serviceorientierte Architektur und nachrichtenbasierte Kommunikation bietet das Audio Mining System ein hohes Maß an Flexibilität und die Möglichkeit, den Funktionsumfang auf Ihre individuellen Bedürfnisse zuzuschneiden. Dadurch kann das System in ein bereits vorhandenes Medienarchiv integriert und z. B. als Metadaten-Anreicherungsdienst verwendet werden oder aber auch als eigenständiges Medienarchiv fungieren.

Ganz nach Ihren Anforderungen

Für Ihre Version des Audio Mining Systems können wir sowohl auf bestehende Workflows z. B. zum Text-Mining oder zur Audio-Transkription zurückgreifen oder wir entwickeln neue individuelle Workflows für Sie. In enger Kooperation mit Ihrem Team können kundenspezifische KI-Modelle trainiert, neue Analyse-Services entwickelt oder zusätzlich bereits bestehende Services angebunden werden.

Einsatzbereiche

Rundfunk- und Fernsehsender
Anbieter von Mediatheken
Unternehmen, die Metadaten aus großen Mengen von Text-, Audio- und/oder Videoinformationen erschließen möchten

Audio Mining – Transkription von Audio- und Videodaten

Durch den Einsatz intelligenter Multimedia-Mustererkennungs-Algorithmen generiert Audio Mining automatisch ein breites Spektrum an Metadaten für Mediendateien und wandelt dabei gesprochenes Wort in durchsuchbaren Text um.

Mit dem Audio Mining System des Fraunhofer IAIS lassen sich Ton- und Videospuren gezielt nach O-Tönen durchsuchen, die Sprechererkennung erlaubt es, Personen zu finden und in der Datei gezielt anzusteuern.

Automatische Aufbereitung von Audio-Medienbeständen

Nutzen & Mehrwert

Kategorie:

Entwickelt von

Ihre Ansprechpartnerin

Flexibilität und Usability

Ganz nach Ihren Anforderungen

Einsatzbereiche

Weitere Softwareprodukte

scapos AG

scapos Software-Portfolio Übersicht

AutoNester-T – Automatische Schnittbildgenerierung

AutoNester-L – Schnittoptimierung für Leder

PackAssistant – Behälterplanung mit baugleichen, komplexen Teilen

PUZZLE – Optimierung von Kartonagen und Palettenladungen

AutoBarSizer – Zuschnittoptimierung für Stahlprofile und andere Stangen

AutoPanelSizer – Optimierte Schnittpläne für Plattenaufteilsägen

CutPlanner – Automatische Produktionsplanung in der Textilindustrie

CuboNester-P – dynamisch optimierte Packungsanordnungen

CuboNester-C – dynamisch optimierte Schnittpläne

MpCCI – Lösung multidisziplinärer Probleme durch Kopplung von Simulationen

SAMG – große lineare Gleichungssysteme effizient lösen

ModelCompare – FEM-Modelle schnell und einfach vergleichen

SimCompare – automatische Ereigniserkennung für Crash-Simulationen

SimExplore – Vergleich und Analyse von CAE-Simulationen

MESHFREE – Beschleunigung komplexer strömungsmechanischer Simulationen

MYNTS – Simulation, Analyse und Optimierung von Energienetzen

FemZip – Komprimierung für Simulationsergebnisse

DIFF-CRASH – Stabilitätsanalyse für Simulationsergebnisse

OptoInspect3D Inline – schnelle Inline-Auswertung von Punktwolken

Audio Mining – Transkription von Audio- und Videodaten

FoundationEHR | KI-Modell für strukturierte elektronische Patientenakten

MultiGML | maschinelles Lernen für die Priorisierung von Arzneimittelzielen