Alle Veranstaltungen (Sessions) sind nach Thema (Topic), Format oder individuell gruppiert und gekennzeichnet. Jede einzelne Veranstaltung kann einen oder mehrere Beiträge enthalten.
Klicken Sie auf das Etikett, um die Veranstaltungsliste (unten) nach Gruppierung zu filtern.
SI-1 | Sprachverständlichkeit in Rundfunk und Film | R2 | 2018-11-15 | 09:30 - 11:00
Sprachverständlichkeit in Rundfunk und Film
SI-1-1 | Beginn 09:30 | Dauer 30 min. | Wolfgang Hoeg | Vortrag (Deutsch)
Dialoge in Medium Film & Fernsehen - wie anstrengend darf Verstehen sein? Sprachverständlichkeit ist höchst subjektiv, nichtsdestotrotz wird an objektiven Messinstrumenten zur Messung der Sprachverständlichkeit geforscht, und um so wichtiger sind diese objektiven Messinstrumente. Dieser Übersichtsbeitrag wird aktuelle Forschungsprojekte und Ergebnisse beleuchten und das doch recht komplexe Thema zu Beginn der Session näher fassen.
Sprachverständlichkeit um jeden Preis? Originalton bei Spiel- und Dokumentarfilm
SI-1-2 | Beginn 10:00 | Dauer 30 min. | Felix Andriessens | Vortrag (Deutsch)
Sprachverständlichkeit bei Film- und Fernsehproduktionen ist ein Parameter, mit dem neben Sprecher*innen und Darsteller*innen unmittelbar auch alle Filmton-Gewerke zu tun haben - vom Set bis zur Mischung, von O-Tonmeister*innen bis zu Komponist*innen. Er betrifft technische Parameter genauso wie gestalterische. Auch die Planungen des Produktions- und aller Bild-Departments haben weitreichenden Einfluss darauf. Das ist nicht immer allen Beteiligten bewusst. Dieser Vortrag zeigt die Stellen auf, an denen besonders auf die Erhaltung von Sprachverständlichkeit geachtet werden muss, und zeigt unter Abwägung von Kosten und Nutzen Wege dorthin auf.
MPEG-H Audio: Neue Möglichkeiten im Bereich Barrierefreiheit
SI-1-3 | Beginn 10:30 | Dauer 30 min. | Harald Fuchs | Vortrag (Deutsch)
MPEG-H Audio ist ein “Next Generation Audio” Codec (NGA), und bietet neben Immersivem Sound (3D Sound), insbesondere neue Möglichkeiten zur Benutzer-Interaktivität und Personalisierung. Mit MPEG-H Audio ist es möglich einzelne Komponenten als separate Objekte innerhalb eines Datenstroms zu übertragen. Metadaten regeln wie diese Komponenten im Empfangsgerät gemischt werden und welche Auswahlmöglichkeiten dem Zuschauer präsentiert werden können.
Im Bereich Barrierefreiheit können den Zuschauern so ganz neue Möglichkeiten geboten werden:
Durch die Übertragung des Dialogs als separates Objekt kann das Mischungsverhältnis des Dialogs zum Hintergrundsignal individuell eingestellt werden, im durch Metadaten erlaubtem Umfang. Dadurch kann die Sprachverständlichkeit erhöht werden, angepasst an die Hörsituation des einzelnen Zuschauers, ohne das unterschiedliche Mischungen erstellt und übertragen werden müssen.
Auch bei der Audiodeskription ergeben sich neue Optionen. Neben der Anpassung der Mischung ist es beispielsweise auch möglich, dass das Audiodeskriptions-Signal aus dem Mittenkanal z.B. nach links oder rechts geschoben wird, um so durch die räumliche Trennung besser von den Dialogen unterscheidbar zu werden.
SI-2 | Sprachverständlichkeit in Rundfunk und Film | R2 | 2018-11-15 | 11:30 - 13:00
SI4B – Messung der Sprachverständlichkeit und Individualisierung der Mischung mit Ziel-Listening Effort
SI-2-1 | Beginn 11:30 | Dauer 30 min. | Mike Kahsnitz | Vortrag (Deutsch)
Der Vortrag erläutert die Ergebnisse des Gemeinschaftsprojektes von Fraunhofer IDMT und RTW unter der Kurzbezeichnung „SI4B“ und gibt einen Ausblick auf die laufenden Arbeiten im Projekt „SITA“. Dazu werden Ergebnisse eines Treffens mit Partnern aus dem professionellen Umfeld vorgestellt. Präsentiert wird auch ein PlugIn zur Erfassung von „Speech Intelligibility“ und „Listening Effort“ , sowie ein Feldversuch und Hinweise zur Nutzung.
Verständlichkeit von Fernsehton im Tonkanalformat 3.0 – Einfluss verschiedener Abhörpegel auf das eingestellte Sprache-Hintergrund-Verhältnis
SI-2-2 | Beginn 12:00 | Dauer 30 min. | Sebastian Goossens |
Theresa Liebl | Vortrag (Deutsch)
Um die Sprachverständlichkeit im Fernsehen zu verbessern, wird auch die Einführung eines Tonkanalformats 3.0 diskutiert. Bei einer ordentlichen 3.0 Mischung sollte der Center-Kanal ausschließlich Sprache enthalten. Nach ersten Einschätzungen könnte dadurch eine verbesserte Sprachverständlichkeit (bzw. eine verminderte Höranstrengung) gewährleistet werden.
Um Auswirkungen dieses Formats auf die Sprachverständlichkeit bei den Zuschauern zu evaluieren, wurden am IRT Vergleichstests durchgeführt. Dabei zeigte sich, dass bei einer 3.0-Audiomischung eine manuelle Steuerung des Center-Kanal-Pegels genutzt wird, um die Sprachverständlichkeit von TV-Inhalten zu verbessern. Ebenso hat die Abhörlautstärke einen Einfluss auf den gewählten Center-Kanal-Pegel.
Es wurden drei unterschiedliche Abhörpegel (50, 60 und 70 dB(A)) angeboten. Auf einer Soundbar und einem 3.0-Wiedergabesystem sollte der Center-Pegel einer 3.0-Mischung so eingestellt werden, dass eine optimale Sprachverständlichkeit erreicht wird. Die Ergebnisse zeigen deutlich, dass bei einem geringeren Abhörpegel der Pegel des Center-Kanals im Vergleich zur Originalmischung deutlich angehoben wurde.
Dies zeigt die Wichtigkeit eines separaten Sprachkanals in TV-Produktionen. Eine praktische Umsetzung ist aktuell im Rundfunk allerdings schwierig, da ein reiner Sprachkanal meist nicht vorliegt und auch nicht übertragen werden kann. Zudem erlauben die meisten Endgeräte keine einfache Pegelanhebung des Centerkanals. Gelöst werden könnte dieses Problem langfristig durch eine objektbasierte Audioproduktion und Übertragung.
Automatische Überwachung der Sprachverständlichkeit im Rundfunkmaterial
SI-2-3 | Beginn 12:30 | Dauer 30 min. | Rainer Huber |
Stefan Goetze, Niko Moritz | Vortrag (Deutsch)
Dieser Beitrag stellt einen referenzsignalfreien Ansatz zur Vorhersage von Höranstrengung von einkanaligen Mischungen von Sprache und Atmo vor - Höranstrengung ist eine der Sprachverständlichkeit verwandte Größe. Der verwendete "single-ended" Ansatz basiert auf der Auswertung von Posteriogrammen, die durch ein System zur automatischen Spracherkennung erzeugt werden. Hintergrundgeräusche führen auch bei der automatischen Spracherkennung zu einer erhöhten Erkennungsunsicherheit - ähnlich wie bei menschlichem Verstehen. Diese Unsicherheit ist mit einem geeigneten Maß quantifizierbar und kann als Grundlage zur Bewertung der Sprachverständlichkeit dienen.
In zwei Studien wurden Fernsehsignale von 20 Probanden hinsichtlich ihrer subjektiven Höranstrengung bewertet und mit den Ergebnissen der Posteriorgramm-Auswertung verglichen. Die Korrelationen zwischen menschlichen Bewertungen und Modellbewertungen für die beiden Datensätze liegen bei 86 bis 90 Prozent. Die Methode ermöglicht somit eine automatische, objektive Überwachung der Höranstrengung von komplexen Sprachsignalmischungen.