Unverständlich und düster

Fernsehsender wollen Ton und Bild verbessern

Die ARD-Sender testen derzeit Möglichkeiten, die Sprachverständlichkeit bei Fernsehfilmen zu verbessern. In einem Test des WDR hat sich gezeigt, dass zwei Drittel der Zuschauer die Dialoge in Filmen schlecht verstehen können. Wie der Sender im Dezember mitteilte, hat die im Test angebotene Möglichkeit, "einen zusätzlichen Audiokanal mit einer leichteren Sprachverständlichkeit auswählen zu können, sogar mehr als 80 Prozent der Testteilnehmer gefallen". Unser Autor Tilmann Gangloff ist der Frage nachgegangen, was die Sender tun können, um die Qualität von Ton und Bild zu verbessern.

Wenn es bei ARD und ZDF nicht gerade Ärger wegen einer - je nach Einschätzung - verunglückten Satire gibt, gelten die Beschwerden der Zuschauer traditionell zwei Aspekten: Die einen beklagen sich über unverständliche Dialoge, die anderen bemängeln die viel zu dunklen Bilder. Beide Phänomene sind nicht neu, beide lassen sich erklären, und vermutlich haben beide auch mit dem Alter der Zuschauer zu tun.

Zumindest das Problem der schwer verständlichen Dialoge will die ARD nun lösen. Eine von WDR-Ingenieur Max Kiefer geleitete Arbeitsgruppe sucht nach technischen Lösungen, um die Hintergrundtöne (Geräusche, Musik, Atmosphäre) von Fernsehinhalten zu verringern und die Sprachanteile hervorzuheben. In unterschiedlichen Projekten bieten die beteiligten Sender eine zusätzliche Tonspur an.

Die Sprache wird freigestellt

Beim NDR hat Diplom-Tonmeister Askan Siegfried ein Verfahren entwickelt, das mit Hilfe eines Bündels "aus Frequenz-, Pegel- und Phasenanalyse alle Tonsignale separiert, die nicht zur menschlichen Stimme gehören. Diese Anteile werden in einem zweiten Schritt in der Lautstärke abgesenkt." Siegfried, der zu der Arbeitsgruppe gehört, arbeitet mit einer Künstlichen Intelligenz, die die Tonspur einer aktuellen Sendung innerhalb von Millisekunden analysiert. Wie stark dieser Prozess greife, sei "in hundert feinen Schritten justierbar". Zusätzlich würden Frequenzen vorsichtig verstärkt, "die bei einer altersbedingten Hörminderung naturgemäß schwach vertreten sind und das Erfassen von Konsonanten erschweren. Insgesamt wird also die Sprache freigestellt und ist dadurch besser zu verstehen." Die Methode sei preiswert und könne auch im Live-Betrieb eingesetzt werden.

Dass sich die Sender überhaupt mit der Thematik befassen, hat aber nicht nur mit dem nachlassenden Gehör der älteren Zuschauer zu tun: Sprachverständlichkeit ist offenbar eine ähnlich individuelle und entsprechend subjektive Angelegenheit wie Geschmack. Der eine kann damit leben, dass Dialoge mit Geräuschen unterlegt sind, andere - wie Autor Holger Karsten Schmidt - finden das äußerst lästig. Der dreifache Grimme-Preisträger und Autor von ARD-Erfolgsreihen wie "Nord bei Nordwest" und "Harter Brocken" hat mitunter sogar Schwierigkeiten, die von ihm selbst geschriebenen Dialoge zu verstehen: "Neben einer undeutlichen Aussprache oder einer weniger optimalen Aufnahme stört mich am meisten der Musikteppich, der Dialoge unhörbar macht."

Für Sprachverständlichkeit, sagt Kiefer, der beim WDR gemeinsam mit einer Kollegin die Abteilung Postproduktion leitet, "gibt es nun mal kein Messgerät." Trotzdem haben Redaktionen natürlich Einfluss darauf, welches Signal beim Empfänger ankommt. Gute oder schlechte Sprachverständlichkeit resultiert laut Kiefer letztlich immer aus technischen Rahmenbedingungen sowie den dramaturgischen und programmlichen Vorgaben der Redaktion oder der Regie.

Die Ursachen für Verständnisprobleme bei Filmen und Serien entstehen allerdings oft schon während der Dreharbeiten, weil Schauspieler nuscheln oder weil die Dialoge mit verdeckt angebrachten Körpermikrofonen aufgezeichnet werden. In solchen Fällen, räumt Kiefer ein, "ist die beste Technik machtlos. Allerdings macht heute auch keiner mehr Filme, in denen die Dialoge so überdeutlich gesprochen werden wie einst bei ‚Derrick’; die Seh- und Hörgewohnheiten haben sich geändert."

Auch auf die Fernsehgeräte haben die Sender keinen Einfluss: Moderne Flachbildmonitore haben ein tolles Bild, aber oft miserable Lautsprecher. Kiefer empfiehlt daher immer, den Ton über eine separate Stereoanlage auszuspielen. Allerdings gebe es im Gegensatz zum Kino beim Fernsehen kein definiertes Umfeld: "Von der Heimkino-Anlage bis zum Smartphone ist alles denkbar, dementsprechend unterschiedlich klingt der Ton."

Bereits 2014 haben ARD und ZDF gemeinsam den Leitfaden "Sprachverständlichkeit im Fernsehen" herausgegeben. Leider halten sich offenbar nicht alle Künstler und Redaktionen an diese Empfehlungen für Programm und Technik. Im Grunde wartet die gesamte Branche auf "Next Generation Audio" (NGA). Dieser vielversprechende Ansatz bietet laut Kiefer die Möglichkeit einer personalisierbaren Dialogverbesserung. Solche sogenannten metadatenbasierte Lösungen machten jedoch "einen gewaltigen Umbau der technischen Infrastruktur in unseren Häusern erforderlich."

Um zu einer schnelleren Lösung zu gelangen, die außerdem wenig kostet, beschäftigt sich die ARD-Arbeitsgruppe mit Alternativen. Die verwendeten Algorithmen basieren laut Kiefer zum Teil auf "Deep Learning" (was Siegfried als "Künstliche Intelligenz" bezeichnet), zum Teil auf bewährten Werkzeugen der Tonbearbeitung. Die Arbeitsgruppe soll ihren Abschlussbericht bis Mitte des Jahres vorlegen.

In Ton wird wenig investiert

Auch für die Kreativen ist das ein großes Thema - aus einem ganz einfachen Grund, wie Autor Benedikt Röskau erklärt: "Der Ton ist viel archaischer als das Bild. Man kann sich einen Film auch auf einem minderwertigen Bildschirm ansehen, aber wenn der Ton schlecht oder kaum verständlich ist, brechen die meisten Menschen sofort ab. Trotzdem wurde und wird in den Ton viel weniger investiert als ins Bild."

Röskau weiß, wovon er spricht. Bevor er mit Drehbüchern zu Fernsehfilmen wie "Das Wunder von Lengede" oder "Contergan" zu einem der renommiertesten deutschen Autoren wurde, hat er zehn Jahre lang als Tonmann gearbeitet. Eine Erkenntnis klingt trivial, ist aber laut Röskau ein handwerkliches Problem des Schauspiels: "Leider werden die Dialoge nicht immer so gesprochen, dass man den Sinn der Sätze auch sofort versteht. Man hat dann den Eindruck, es liege an der Tonqualität oder der Lautstärke, aber das ist falsch. Auf der Bühne heißt es: 'Du denkst den Text nicht!' Wer das kann, der ist auch viel besser zu verstehen."

Außerdem, sagt Röskau, sei das deutsche Kino- und Fernsehpublikum "von den technisch und sprachlich brillant synchronisierten fremdsprachigen Serien und Filmen extrem verwöhnt". Die Synchronsprecher seien im Unterschied zu vielen Schauspielern bestens ausgebildet, ihre Dialoge würden unter idealen Bedingungen aufgenommen; eine derartige Tonqualität sei am Set beim besten Willen nicht zu erreichen.

Ein größeres Problem ist aus Röskaus Sicht jedoch der Hang vieler männlicher Schauspieler zum Nuscheln. Eigentlich gehe es ja um "Natürlichkeit, also beiläufiges, nicht herausgestelltes Sprechen; allerdings muss man auch richtig gut sprechen können, wenn man technische, fachliche, wissenschaftliche oder milieuspezifische Dialoge natürlich klingen lassen will." Die Fähigkeit der Schauspieler zum klaren Sprechen habe jedoch massiv nachgelassen, was Röskau auch mit dem "Komfort der Ansteckmikros" erklärt. Noch bis in die 60er Jahre hätten Schauspieler laut und deutlich sprechen müssen, "denn die damals verwendeten dynamischen Mikros, an riesigen Tonangeln ausgefahren, waren einfach nicht empfindlich genug." Dank der Verwendung von Kondensatormikrofonen habe sich ab den 70ern bei der Tonarbeit eine gewisse Bequemlichkeit eingeschlichen. Bei der Mischung werde zudem in einer perfekten Tonstudioumgebung gearbeitet, deren Bedingungen sich mit der üblichen Rezeption einer TV-Produktion im heimischen Wohnzimmer nicht vergleichen lasse.

Röskau geht davon aus, dass der Ton noch eine ganze Weile "das Stiefkind bei Film und Fernsehen" bleiben werde, "weil die Physik ihre Grenzen hat". Beim Bild gebe es dank der Digitalisierung enorme Möglichkeiten. So könne man beispielsweise mit langer Brennweite aus weiter Entfernung in die Nahaufnahme gehen, das sei beim Ton nicht möglich. Aber selbst wenn der Ton nicht so stiefmütterlich behandelt würde: "Am Ende scheitert der Aufwand an der Ausstattung der Flatscreens, denn deren oft minderwertige Lautsprecher sind gar nicht in der Lage, die ganzen Feinheiten des modernen Sounddesigns wiederzugeben."

Klangerlebnis

Kein Wunder, dass nicht nur Toningenieure, sondern auch Regisseure die Anschaffung einer Surround-Anlage oder einer Soundbar empfehlen, weil sie, wie Niki Stein es formuliert, das "Erzeugen eines Klangerlebnisses auch durch Geräusche" selbstverständlich als großen Fortschritt empfinden. Seinen ersten Fernsehfilm, "Sievers wartet!", erzählt Stein, habe er 1988 "mit vielleicht zwölf Zuspielbändern gemischt. Der Ton bestand aus Dialog, Musik, Atmosphären und einzelnen Geräuschen, die wichtig waren: anfahrende Autos, ein singender Vogel, ein schreiendes Baby. Durch die Digitalisierung von Mischung und Schnitt waren plötzlich unzählige Spuren möglich; das hatte es bis dahin nur bei aufwendigen Kinoproduktionen gegeben."

Stein hat aber auch die Erfahrung gemacht, "dass sich konservative Ohren mit dieser Erweiterung der akustischen Gestaltungsmöglichkeiten schwertun". Selbst gute Lautsprecher würden das Problem nicht automatisch lösen, "weil sie so viele Möglichkeiten bieten, dass der normale Konsument mit einer optimalen Einstellung meist überfordert ist."

Der mehrfache Grimme-Preisträger Stephan Wagner findet "das Delta zwischen optischer Kraft und scheppernder Kleinkalotte" sogar "mehr als verstörend". Wie Röskau sieht der Regisseur die Wurzel des Übels bereits bei den Dreharbeiten: Der zunehmende Zeitdruck am Set sei eine schlechte Voraussetzung für einen guten Filmton. Die Verwendung von versteckten Mikrofonen schaffe zudem eine trügerische Sicherheit, "denn viele Tonquellen erfordern auch sehr genaue Präparation, um ein akustisch sauberes und raschelfreies Ergebnis zu liefern. Mittlerweile umfasst allein die technische Aufbereitung des Originaltons in der Postproduktion mehr als die Hälfte des gesamten Tonbearbeitungsprozesses, da viele notwendige Reparaturen technisch zwar möglich, aber extrem aufwendig sind."

Wagner weist aber auch auf ein ganz anderes Problem hin: Er habe oft genug erleben müssen, dass trotz monatelanger Arbeit beim Zuschauer ein schlechter Ton angekommen sei, seltsamerweise aber nicht überall. Eine Ursachenforschung habe schließlich ergeben, dass die Kunden der einen Kabelgesellschaft "einen ungestörten Hörgenuss hatten, während sich bei einem anderen Anbieter die Beschwerden häuften." Beim Herstellungsprozess werde penibel auf die Einhaltung akustischer Normen geachtet, "aber der Bereich vom Sendeband zum Zuschauerohr ist keinen Zertifizierungen unterworfen." Er plädiert daher für eine Durchsetzung verpflichtender Standards.

Wie in der vollen Kneipe

Und dann gibt es noch eine Variable, die technisch nicht zu beeinflussen ist: "Es ist nicht das Gehör, das hört", sagt Röskau, "es ist das Gehirn. Wenn wir nicht permanent alle Nebengeräusche im Kopf rausfiltern würden, könnten wir in einer vollen Kneipe kein Gespräch führen. Die Tonaufzeichnung selektiert jedoch nicht. Wird der Ton dann via TV wiedergegeben, fehlt dem Gehirn die akustische Information des Raums, denn der ist im Bild nur zum Teil zu sehen, weshalb man ihn akustisch auch nicht wahrnimmt. Das Gehirn kann die Nebengeräusche daher nicht sinnvoll ausblenden und versteht den Ton einfach nicht." Unter diesem Problem litten auch viele Menschen mit Hörgerät.

Für diese Zuschauer wären die ARD-Projekte ein echter Fortschritt. Dann bliebe allerdings immer noch das Manko der als allzu düster wahrgenommenen Bilder. Die entsprechenden Klagen lassen sich sogar mit einem konkreten Datum in Verbindung bringen: Massive Vorwürfe dieser Art gab es erstmals 1980 anlässlich der WDR-Serie "Berlin Alexanderplatz" von Rainer Werner Fassbinder. Der Kameramann Martin Langer, damals Anfang 20, erinnert sich noch gut daran, "wie revolutionär damals alle die Serie fanden, weil sie so wahnsinnig dunkel war. Wenn man sich das noch mal anschaut, wird man verblüfft feststellen, wie sehr sich die Sehgewohnheiten seither verändert haben."

Langer gehört heute zu den gefragtesten deutschen Bildgestaltern und hat ähnlich wie viele Zuschauer die Beobachtung gemacht, dass die Fernsehbilder immer dunkler werden. Dazu habe neben der Digitalisierung auch die hohe Auflösung der heutigen Bildschirme beigetragen, "allen voran die Displays von Laptops und Tablets, denn die These gilt vor allem für Produktionen von Streamingangeboten, und junge Menschen schauen ja, etwas übertrieben formuliert, gar nichts anderes mehr. Ihre Sehgewohnheiten haben letztlich auch Auswirkungen auf den Look des klassischen Fernsehens, weil viele Regisseure von den Streamingserien beeinflusst werden."

Lichtgestaltung am Set

Tatsächlich sind die deutschen Produktionen für Netflix und Amazon - "Dark", "Beat", "Dogs of Berlin", zuletzt "Barbaren" - von bemerkenswerter Düsternis. Auch der Bezahlsender Sky hat bei seiner Serie "Das Boot" und zuletzt der Mystery-Produktion "Hausen" am Licht gespart. Früher, sagt Langer, haben man wegen der Belichtung mit hartem Licht arbeiten müssen, "heute kann man viel mehr natürliches und weiches Licht einsetzen." Die technische Entwicklung der letzten Jahrzehnte habe das Berufsbild des "Director of Photography" grundlegend gewandelt. "Den größten Einfluss hatte dabei die Digitalisierung: Viele Kolleginnen und Kollegen vernachlässigen heute die Lichtgestaltung am Set, weil sie sich auf die Postproduktion verlassen."

Gute Kameraleute, ergänzt Niki Stein, suchten "nach dem 'echten' knackigen Schwarz statt mattem Grau." Weil die digitale Bildaufzeichnung einen sehr viel weiteren Kontrastumfang biete, seien heute "Hell-Dunkel-Kontraste im Bild möglich, die früher undenkbar gewesen wären." Ein derart kunstvoller Umgang mit dem Licht erfordere jedoch sehr gut eingestellte Endgeräte. "Wenn ich heute auf Motivsuche in deutsche Wohnzimmer komme, wo ja sehr gerne den ganzen Tag der Fernseher läuft, bin ich manchmal erstaunt, wie schlecht und unnatürlich die meisten Geräte eingestellt sind: immer zu viel Farbe, immer zu viel Kontrast, der dann schnell aus den Bildern ein ‚Dunkel’ macht, wo der Kameramann es gar nicht dunkel wollte."

Ähnlich wie Langer sieht auch der Regisseur Miguel Alexandre die Serien der Streamingangebote als Verstärker der Entwicklung zu dunkleren Bildern, da viele Regisseure "Kino fürs Fernsehen" schaffen wollten. Die optische Düsternis bringt Alexandre vor allem mit dem Genre des Thrillers in Verbindung, weil sich diese Filme visuell gern an der Tradition des "film noir" orientierten. Dank einer solchen "low key"-Lichtgestaltung habe man als Filmemacher "nicht nur die Chance, eine viel dichtere, spannungsgeladenere und interessantere Atmosphäre zu kreieren, man kann darüber hinaus auch das Auge des Publikums lenken." Ein hoher Kontrastumfang verleihe den Bildern zudem mehr Plastizität und Tiefe.

Der Grimme-Preisträger Alexandre verantwortet die Bildgestaltung seiner Filme seit einigen Jahren selbst. 2014 hat er die ZDF-Krimireihe "Der Kommissar und das Meer" übernommen und dafür gesorgt, dass die Bilder deutlich "skandinavischer" wirkten. Seine erste Amtshandlung bestand darin, die Dreharbeiten auf Gotland vom Sommer in den Winter zu verlegen, weshalb der neue optische Stil auch zur Jahreszeit passte.

Natürlich ist die Bildsprache eng ans jeweilige Genre gekoppelt. Auf Sendeplätzen wie dem "Freitag im Ersten" oder dem "Herzkino" am Sonntag im ZDF sieht Stein "einen Hang zu farbenfrohen, lichtdurchfluteten Bildern, die ich als unnatürlich empfinde. Wenn Zuschauer dann von 'Rosamunde Pilcher' oder 'Inga Lindström' zum realitätsnäheren, gestaltungsintensiveren 'Tatort' umschalten, sind sie selbstverständlich geschockt."

Zeichnung und Struktur

In den Krimireihen des Zweiten geht es mitunter allerdings ebenfalls recht düster zu. Trotzdem widerspricht Frank Zervos, Leiter der Hauptredaktion Fernsehfilm/Serie I, der Behauptung, dass viele TV-Produktionen immer düsterer würden: "Wir wollen grundsätzlich, dass die Zuschauer das Bild erkennen, wenn sie unsere Filme sehen, und achten in den technischen Abnahmen deshalb darauf, dass dunkle Bildanteile immer noch Zeichnung und Struktur haben." Die Tonalität eines Programms sollte seiner Ansicht nach grundsätzlich vom Genre und der konkreten Geschichte abhängen. Bei den Streamingportalen würden die Genres Thriller, Mystery und Horror überproportional bedient, deshalb gebe es dort auch "mehr dunkle, nicht richtig durchschaubare Bilder."

Das ZDF gehe jedoch einen anderen Weg, sagt Zervos: "Bei Geschichten, die von sich aus thematisch düster sind, ermuntern wir die Regisseure, in den Filmen ein bisschen dagegen zu arbeiten und kontrastierend auch die anderen, helleren Seiten des Lebens zu zeigen." Trotzdem habe er nichts gegen einen "Kino-Look": "Gleichmäßig ausgeleuchtete Szenen, wie sie früher vorherrschten, sind spannungslos und wirken billig und wie eine schnell produzierte Soap. Die technischen Entwicklungen bieten heutzutage für Fernsehproduktionen die Möglichkeit, viel differenzierter zu gestalten."

Diese vielfältigen Möglichkeiten haben dazu geführt, dass Regisseure, die lieber nur Kinofilme drehen würden, ihren Frieden mit dem Fernsehen gemacht haben: weil die Kluft kleiner geworden oder sogar ganz verschwunden sei, wie es Hannu Salonen formuliert. Seine in jeder Hinsicht finstere ARD-Serie "Oktoberfest 1900" sorgte im vergangenen Fernsehjahr für Aufsehen. Auch Salonen verweist auf den technischen Fortschritt: Die Auflösung und der Kontrastumfang einer Super 16mm-Kamera (Fernsehen) sei früher mit denen einer 35mm-Kamera (Kino) nicht vergleichbar gewesen, weshalb jede Nachtszene wegen der Ausleuchtung eine gewisse Künstlichkeit gehabt habe. "Diesen Unterschied gibt es heute nicht mehr, weil für Film und Fernsehen dieselben Kameras zum Einsatz kommen und je nach angestrebter Ästhetik weitestgehend ähnliche Beleuchtungsstile angewandt werden."

Fernsehfilmregisseure trauten sich mittlerweile in visueller Hinsicht viel mehr zu, sagt Salonen. Die Bilder seien "wesentlich saftiger" geworden: "Es gibt deutlich mehr dunkle Anteile, weil die Bilder im Schattenbereich auf guten Endgeräten trotzdem noch Zeichnung aufweisen." Trotzdem sieht Salonen die deutschen Sender noch vor einem "langen Weg zum echten Sinneswandel, denn auf einen modernen Look wird da nur wenig Wert gelegt." Höchste Auflösungsmöglichkeiten wie 4K oder HDR (High Dynamic Range), bei Streamingangeboten wie Netflix Standard für Eigenproduktionen, würden von den Sendern äußerst selten finanziert. Diese Mentalität zu ändern sei nicht einfach, "weil oft das Bewusstsein für den Unterschied fehlt".

Der Zuschauer ist der Dumme

Stephan Wagner sagt, TV-Produktionen scheuten vermeintlich unnötige Kosten, weshalb jede zusätzliche Lampe als Kostenfaktor betrachtet werde. Dabei liege die Qualität einer Bildgestaltung nicht in der technischen Darstellbarkeit, sondern in der Gestaltung eines Fernsehbildes, und diese Gestaltung funktioniere letztlich über den bewussten Gegensatz von Dunkel und Hell: "Um diesen Kontrast auch in lichtempfindlichen Extremsituationen zu gestalten, bedarf es des Einsatzes von differenzierten und entsprechend teuren Lichtquellen." Stattdessen würden dunkle Bilder "zum 'modernen Look' erklärt und womöglich auch noch mit Filmpreisen begütesiegelt. Erfolgreich gespart und mit Auszeichnung geadelt, was will man mehr!"

Der Dumme, sagt Wagner, sei dabei der Zuschauer, der raten dürfe, "welche der Filmfiguren sich gerade im finsteren Bild der Nachtszene befindet und was die Person dabei tut".

Aus epd medien 3/21 vom 22. Januar 2021

Tilmann Gangloff