Dialogue Detection c Steinberg Media Technologies GmbH »Dialog Detection« unterstützt Tonschaffende durch eine zuverlässige Identifikation von Sprache im Audiosignal

Neue Algorithmen des Fraunhofer IDMT bilden die Basis für die »Dialog Detection« in Steinbergs neuster Version der Audio-Postproduktion-Software Nuendo. Die Funktion erkennt zuverlässig Sprachanteile in der Tonspur und ermöglicht dadurch Audioexpertinnen und -experten auf einfache Art und Weise Passagen mit und ohne Sprache auf unterschiedliche Spuren aufzuteilen. Für die vorherige Nuendo-Version lieferte das Fraunhofer IDMT bereits Algorithmen für die Messung, Bewertung und Anzeige von Sprachverständlichkeit.
Bild: © Steinberg Media Technologies GmbH

Passagen mit und ohne Gesprächsanteile nur anhand des Audio-Levels zu identifizieren, kann für professionelle Tonschaffende eine mühsame Aufgabe sein. Um zu erkennen, ob es sich jeweils um gesprochenes Wort oder lediglich um Hintergrundgeräusche handelt, muss die Audio-Passage beim Editieren angehört werden. In Zusammenarbeit mit dem Fraunhofer-Institut für Digitale Medientechnologie IDMT will die Steinberg Media Technologies GmbH die Arbeit von Profis in den Bereichen Sound-Design, Dialog-Editing sowie Sprachsynchronisation erleichtern. Dazu hat Steinberg im neuesten Update seiner digitalen Audioworkstation Nuendo das Feature »Dialog Detection« integriert.

Dialog-Bearbeitung im Fokus

Bei den neuen Features in Nuendo 12 liegt der Schwerpunkt auf der Aufnahme und dem Editieren von Dialogen. »Damit rücken speziell die Bedürfnisse von Nuendo-Nutzenden in den Fokus, die sich beispielsweise beim Synchronisieren und bei der Erstellung von Voice-Overs verstärkt auf Sprache konzentrieren müssen. Besonders relevant ist dies bei der Erstellung von Inhalten für Streaming-Dienste«, sagt Timo Wildenhain, Head of ProAudio bei Steinberg. »Dialog Detection« setzt dabei auf Technologien des Fraunhofer IDMT in Oldenburg. Algorithmen basierend auf maschinellen Lernverfahren (neuronalen Netzen) erkennen unabhängig von Hintergrundgeräuschen Sprachaktivität im Audiosignal. Tonschaffende können die erkannten Passagen anhören und auf Wunsch Anteile ohne Sprache automatisch in unterschiedliche Spuren aufteilen lassen. Das eigentliche Editieren beginnen sie komfortabel und übersichtlich mit einer separierten Dialogspur.

Sprachaktivitätserkennung vielseitig einsetzbar

Die im Feature eingesetzte Sprachaktivitätserkennung (»Speech Activity Detection«, SAD) des Fraunhofer IDMT in Oldenburg wurde mit einer Vielzahl an unterschiedlichen Daten trainiert, um zuverlässig Sprachaktivität bei vorhandenen Hintergrundgeräuschen zu identifizieren. »Unsere SAD-Algorithmen sind in unterschiedlichen Anwendungen im Einsatz. Als eigenständiges Feature können sie den Workflow von Audio-Profis merklich verbessern. Darüber hinaus dienen sie in weiteren Lösungen des Fraunhofer IDMT als Vorverarbeitung für die hauseigene Sprach- und Sprechererkennung, als Störgeräuschbefreiungsalgorithmen oder Privacy Filter«, erklärt Christian Rollwage, Gruppenleiter Audiosignalverbesserung am Institutsteil Hör-, Sprach- und Audiotechnologie HSA. Sei es im Smart Speaker im heimischen Wohnzimmer, bei sprachbasierter Maschinensteuerung in der Produktionshalle oder bei der Sprachdokumentation in der Qualitätssicherung: Die SAD kann eingesetzt werden, damit für die folgenden Verarbeitungsschritte bereits nichtsprachliche Anteile herausgefiltert sind oder umgekehrt, damit Sprache gar nicht erst aufgezeichnet wird und so die Privatsphäre von Nutzerinnen und Nutzern, zum Beispiel im öffentlichen Raum, geschützt ist.

Erfolgreiche Zusammenarbeit von Steinberg und Fraunhofer IDMT

Bereits in der vorherigen Version Nuendo 11 setzte Steinberg Technologien des Fraunhofer IDMT zur Messung, Bewertung und Darstellung von Sprachverständlichkeit ein. Audio-Expertinnen und -Experten wurde mit dem »Intelligibility Meter« ein Tool an die Hand gegeben, um Sprache im finalen Mix optimal verständlich zu halten und zusätzlich den demografischen Wandel sowie damit verbundene Hörverluste berücksichtigen zu können.

Hör-, Sprach- und Audiotechnologie HSA am Fraunhofer IDMT in Oldenburg

Der im Jahre 2008 unter der Leitung von Prof. Dr. Dr. Birger Kollmeier und Dr. Jens-E. Appell gegründete Institutsteil Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer-Instituts für Digitale Medientechnologie IDMT steht für marktnahe Forschung und Entwicklung mit Schwerpunkten auf

- Sprach- und Ereigniserkennung
- Klangqualität und Sprachverständlichkeit sowie
- Mobile Neurotechnologie und Systeme für eine vernetzte Gesundheitsversorgung.

Mit eigener Kompetenz in der Entwicklung von Hard- und Softwaresystemen für Audiosystemtechnologie und Signalverbesserung setzen über 100 Mitarbeitende am Standort Oldenburg wissenschaftliche Erkenntnisse in kundengerechte, praxisnahe Lösungen um.

Über wissenschaftliche Kooperationen ist der Institutsteil eng mit der Carl von Ossietzky Universität, der Jade Hochschule und der Hochschule Emden/Leer verbunden. Das Fraunhofer IDMT ist Partner im Exzellenzcluster »Hearing4all«.

Quelle: Fraunhofer-Institut für Digitale Medientechnologie IDMT 

Bild: © Steinberg Media Technologies GmbH
Die »Dialog Detection« in Steinbergs Nuendo 12: Algorithmen des Fraunhofer IDMT in Oldenburg erkennen unabhängig von Hintergrundgeräuschen zuverlässig Sprachaktivität im Audiosignal.

CIV NRW e.V

CIV NRW Logo

Cochlea Implantat Verband Nordrhein-Westfalen e.V. (CIV NRW)
(Regionalverband für NRW der DCIG e.V.)
Geschäftsstelle: Alleestr. 73, 58097 Hagen
Telefon: 02331 1884601
Beratungstermine nach Vereinbarung unter: info@civ-nrw.de -

CIV NRW News online
ist die  Onlineversion der Zeitschrift des
Cochlea Implantat Verbandes NRW e.V.,
CIV NRW News - Chefredaktion:
Marion und Peter Hölterhoff
Redaktion:
Karina Manassah, Veronika Albers und freie Autoren
Korrektorat: Christel Kreinbihl
Medizinische Beratung:
Prof. Dr. med. Jonas Park, Dr. Elmar Spyra, Peter Dieler
Anzeigen/ Akquise:
Michaela Hoffmann michaela-hoffmann@civ-nrw.de
CIV NRW News online- ViSdP:

Peter G.A. Hölterhoff, Rosenstr 4 58642 Iserlohn
© Cochlea Implantat Verband NRW e.V.
Alle Rechte vorbehalten - Alle Angaben ohne Gewähr

Mit Aufruf der folgenden Links werden Daten an die Netzwerke übertragen und dort verarbeitet.
Facebook: https://www.facebook.com/CIV.NRWNews - Twitter:    https://twitter.com/CIV_NRW - Instagram:  https://www.instagram.com/civnrw/
WEB-Layout: Peter G.A. Hölterhoff
Sie können uns unterstützen über Gooding oder eine
direkte Spende hier online
Bankverbindung: Volksbank Hohenlimburg
IBAN:DE30 4506 1524 4001 2313 00,
BIC: GENODEM1HLH

Veranstaltungskalender

Mo Di Mi Do Fr Sa So
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Wir benutzen Cookies
Bitte beachten Sie, dass einzelne Funktionen unserer Website möglicherweise nicht funktionieren, wenn Sie die Verwendung von Cookies deaktiviert haben.