Dolby Atmos Podcast Immersive Audio
NewsOverviewStorytelling

Dolby Atmos Podcast ist schlecht für immersive Hörbücher

Inhalt

    Der kürzlich erschienene Leitfaden der New York Times über das Abmischen von 3D Audio für Podcasts hat in der Tonmeister Szene einige Bedenken und Kommentare hervorgerufen. 

    Ich habe einige positive Reaktionen erhalten, weil ich Dolby Atmos erwähnt habe in meinem LinkedIn Post.

    Während der Leitfaden einen detaillierten Überblick über Spatial Audio und seine Vorteile für Podcasts bietet, stützt er sich stark auf Dolby.io als das Go-to-Tool für die Produktion von Spatial Audio.

    Vor der New York Times habe ich bereits eine ausführliche Einführung darüber geschrieben, wie Spatial Audio für immersive Podcasts sinnvoll sein kann. Derzeit wird es eher als Marketing-Begriff verwendet, um nach „Immersion“ zu klingen. Aber lies hier über das wahre Potenzial.

    In diesem Blog gehen wir der Frage nach, warum Dolby Atmos möglicherweise nicht die beste Wahl für räumlichen Klang in Podcasts ist. Dabei biete ich einige alternative Lösungen an, die sich möglicherweise besser für das Erzählen von Podcasts eignen. Und da die jüngsten Entwicklungen von Audible Dolby Atmos als Podcast-Format unterstützen, wollen wir einen Blick darauf werfen.

    Das Voice-Over-Dilemma

    Dolby Atmos ist ein leistungsstarkes Werkzeug für die räumliche Audioproduktion in Filmen und Videospielen. Seine Eignung für Podcast-Folgen ist jedoch fraglich. 

    Ein Hauptproblem ist die fehlende Unterscheidung zwischen diegetischem und nicht-diegetischem Ton in Podcasts in Kombination mit Head-Tracking. Eine Funktion, die heutzutage jeder Apple-Kopfhörer bietet.

    Warum sind nicht-diegetische Elemente so wichtig?

    Diegetischer Ton bezieht sich auf Geräusche, die in der Szene des Podcasts vorkommen, z.B. Soundeffekte und Dialoge. Nicht-diegetisches Audio hingegen bezieht sich auf Sounds, die außerhalb der Welt der Story liegen, z.B. Sprecherstimmen und Musik.

    Bei Podcasts ist es wichtig, zwischen diesen beiden Arten von Audio zu unterscheiden, da sie unterschiedlichen erzählerischen Zwecken dienen. Dolby Atmos-Podcasts können jedoch nicht effektiv zwischen diegetischem und nicht-diegetischem Ton unterscheiden, was zu einem verwirrenden und unzusammenhängenden Hörerlebnis führen kann.

    Dolby Atmos-Mischungen sind fehlerhaft

    Der Fehler ist bereits in den Stories des berühmten deutschen Hörbuchs „Die Drei ???“ zu hören. Der Erzähler ist plötzlich Teil der Szene mit den Schauspielern. Das macht keinen Sinn. Aber: Die Produktionssuite von Dolby ist einfach nicht in der Lage, es besser zu machen.

    Der Grund dafür ist, dass Dolby Atmos vorzugsweise alles in 3D-Audio umwandelt – sogar ein Voice-over, welcher klassisch im Center sitzt. Das bedeutet, dass der Erzähler Teil der Audio-Szene wird, was beim Podcasting nicht erwünscht ist. Das ist für den Hörer verwirrend.

    Ich konnte dies bereits in einer Studie beweisen, die ich zu diesem Thema im Zusammenhang mit 360 Video Heatmaps durchgeführt habe.

    Dolby Atmos VR hat besser abgeschnitten

    Dolby Atmos bietet die Möglichkeit der In-Head-Lokalisierung, indem der binaurale Rendermodus auf „aus“ gestellt wird. Allerdings ist die Dolby-Engine derzeit nicht mit Head-Tracking kompatibel. Ziemlich merkwürdig für eine räumliche Audio-Rendering-Plattform.

    Über Apple Music gibt es die Möglichkeit, Dolby Atmos-Musik (und damit auch Podcasts) mit oder ohne Head-Tracking abzuspielen. In diesem Fall verwendet Apple Spatial Audio die Mehrkanal-Dolby-Atmos Podcast-Signale und wendet binaurale Audiofilter an, um die Frequenzen, die jedes Ohr hört, anzupassen. Das ermöglicht erst das Head-Tracking für ein Format, das dafür nicht in erster Linie gedacht ist.

    Dies führt jedoch dazu, dass alles externalisiert wird und eine Lokalisierung im Kopf nicht mehr möglich ist. Das liegt daran, dass Apples Spatial Audio nicht die binauralen Metadaten von Dolby verwendet. Bleibt abzuwarten, wie sich das für Audible entwickeln wird.

    Ein Kollege von mir hat die richtigen Worte dafür gefunden:

    „Ich stimme voll und ganz zu, dass Dolby die Fähigkeit zum Headlocking von Quellen aus den VR-Tagen zurückbringen sollte. Auf diese Weise könnten die Ersteller von Inhalten entscheiden, was sie für am sinnvollsten halten (und wenn du schon dabei bist, Dolby, bring doch bitte auch automatisierbare binaurale Rendermodi zurück).“

    Es gibt langfristig Hoffnung

    Als offizieller Vertreter unterrichte ich immersives Audio für das neue Berufsfeld „Gestalter für immersive Medien“, organisiert vom Bundesinstitut für Berufsbildung (BIBB). Die nächste Generation von Audio- und Sound-Design-Begeisterten wird also schon über diese Themen Bescheid wissen. 😉

    3D Audio, das nicht 3D ist

    Wie ihr wisst, soll 3D-Audio und Sound-Design von allen Seiten kommen, richtig? Es gibt also links und rechts (wie bei Stereo), hinten und vorne (wie bei Surround-Sound) und jetzt auch oben und unten (was 3D-Audio zu einem immersiven Erlebnis macht).

    Aber siehe da, Dolby ist nicht in der Lage, Geräusche von „unten“ wiederzugeben. Alles, was es auf der Ebene der Höhe kann, ist “oben”. Daher ist diese immersive Audio-Softwarearchitektur im Grunde eine Halbkugel. 

    Um ehrlich zu sein, bin ich nicht allzu enttäuscht über diesen Dolby-Atmos-Fehler im Zusammenhang mit der Musik.

    Es steht sogar in der FAQ, aber lies vorsichtig

    Wenn du den folgenden Text liest, klingt er großartig:

    „Dolby Atmos bietet ein echtes räumliches Klangerlebnis, wie es der Schöpfer beabsichtigt hat – wo Klänge individuell platziert und im dreidimensionalen Raum bewegt werden, sodass Sie das Gefühl haben, dass der Klang von überall um Sie herum kommt, sogar über und hinter Ihnen“.

    Aber wenn du genau liest, gibt es einen Fehler – es ist „sogar über“, aber nicht unter ihnen. 😉

    Immersiver Ton von unten wird zum Problem

    Bei Filmen verstehe ich, dass die Lautsprecher meist nicht unter dem Zuhörer platziert werden können. Zumindest können sie von der Decke hängen. So erhält man einen umhüllenden Klang. Aber es als die beste 3D-Raumklanglösung zu bezeichnen, ist seltsam.

    Was ist mit Schritten? Würdest du die nicht auch unter dir hören wollen? Oder stell dir vor, du sitzt auf einem Motorrad. Der Tontechniker spielt den Ton auf Ohrhöhe ab – mehr kann er nicht tun. Ziemlich merkwürdig, oder?

    Raumklang und interaktives Audio

    Zu den Einschränkungen der Dolby Atmos-Podcast-Abmischung kommt noch die Frage der Interaktivität hinzu. 

    Objektbasiertes Audio, das von Dolby Atmos nur im Sinne von räumlichem Audio unterstützt wird, bietet viel mehr Flexibilität in Bezug auf interaktive Möglichkeiten. Dies wird durch Metadaten erreicht, d.h. eine separate Spur, die Informationen über die Lautstärkeverhältnisse und die Positionen von räumlichen und interaktiven Audio-Objekten und deren Parameter enthält. 

    Die Produzenten haben die Möglichkeit, Parameter für die Interaktion während der Wiedergabe festzulegen, wie z.B. die Anpassung des Lautstärkeverhältnisses oder die Auswahl verschiedener Voreinstellungen für verschiedene Sprachen oder für Hörgeschädigte.

    Mit objektbasiertem Audio können Produzenten jedoch potenziell alle Arten von Parametern für die Interaktion bei der Wiedergabe erforschen, was interessante Fragen über die Zukunft des immersiven Storytellings und der Hörbücher aufwirft. 

    Spoiler-Alarm: Ein Format namens MPEG-H kann genau das tun. Es wurde bereits von Rundfunkdiensten in Brasilien und Korea übernommen. Ich frage mich, wer mit dieser sich schnell entwickelnden Technologie als Nächstes dran ist? Hier mehr zum Thema mehr erfahren.

    Es ist bedauerlich, dass Dolby dieses Maß an Flexibilität nicht anbietet und stattdessen einen Einheitsansatz fördert. Man hat mehr und mehr das Gefühl, dass die Bemühungen für einen Dolby Atmos Podcast umsonst sind. Aber keine Sorge, ich werde eine Lösung für dich haben.

    Podcasts in Dolby Atmos: Immersives Audio ist keine Technologie

    Außerdem ist der Begriff „immersives Audio“ in der Branche zu einer Art Modewort geworden. Er klingt zwar beeindruckend, beschreibt aber nicht unbedingt eine bestimmte Technologie oder Technik.

    Vorsicht vor “immersiver Audio-Podcast”-Marketing

    Nur weil ein Podcast auf Spotify oder ein Hörspiel als „3D-Audio“ oder „Dolby Atmos“ beworben wird, bedeutet das nicht unbedingt, dass das Hörerlebnis besser ist. Manche sind sogar der Meinung, dass ein zu starker Einsatz dieser Technologien von der Qualität der Inhalte selbst ablenken kann.

    Letztendlich liegt der wahre Wert einer Audioproduktion in der Kreativität und dem Können der Produzenten und Techniker und nicht im neuesten Modewort oder Technologietrend. 

    Es ist kein Problem von immersiven Audio-Podcasts, das durch Dolby Atmos verursacht wird. Aber du kennst deren Marketing in Bezug auf Dolby Atmos Musik, das manchmal schlimmer klingt, als man hoffen würde.

    Falsche Versprechungen bei räumlichen Audiolösungen

    Mit dem Dolby Atmos-Podcast ist alles so einfach. Man nimmt einfach die Produktionssuite, platziert seinen Sound und BOOM: immersives Audio. Nun, wie du dir denken kannst, funktioniert das so nicht.

    Ein Problem bei vielen Podcasts, die immersive Audio-Technologien wie 3D Audio oder Dolby Atmos verwenden, ist, dass sie oft nicht gut klingen. Das liegt in der Regel an den Arbeitsabläufen bei der Aufnahme im Studio.

    Auch wenn die Schauspieler großartige Leistungen erbringen, passt der resultierende Ton nicht ganz zur Szene. Man hat den Eindruck, dass der Ton im Studio aufgenommen wurde und dann später 3D-Audioeffekte und virtuelle Spatializer hinzugefügt wurden, zusammen mit etwas Hall, um die Illusion von Raum in einer Episode zu erzeugen.

    Dieser Ansatz kann künstlich wirken, als ob die Technologie nur hinzugefügt wurde, um zu behaupten, es handele sich um eine immersive Audioproduktion. Selbst die besten Darbietungen können den Mangel an Authentizität nicht vollständig kompensieren. 

    Als professioneller Produzent bin ich sehr sensibilisiert für dieses Thema und würde gerne die Meinung anderer dazu hören. Du kannst sie gerne mit der Arbeit in meinem Portfolio vergleichen.

    Keine Technologie ist zukunftssicher

    So einfach ist das – und doch gibt Dolby Atmos dieses Versprechen gerne ab. 

    Der immersive Audio-Podcast ist eine sich schnell entwickelnde Branche. Dolby ist dabei, sich einen guten Namen zu machen. Wie gesagt, für Filme ist es legitim, für Musiktechnologie bin ich noch nicht überzeugt. Ein Dolby-Atmos-Podcast? Bitte nicht!

    Es gibt so viele immersive räumliche Audio-Technologien, die bereits in der Entwicklung sind. Es ist einfach unmöglich, dass ein Format, das aus der traditionellen Tontechnik für Filme stammt, in den nächsten Jahren so relevant sein kann, wenn es nicht aktualisiert wird.

    Ich würde gerne von Audible hören, warum sie sich für ein minderwertiges Format entschieden haben. Wenn sie nur 5 Minuten recherchiert hätten, wäre das produzierte Audio- und Sound-Design nicht umsonst gewesen. 

    Nun, wer bin ich schon, um zu urteilen. Hier sind einige bessere Optionen, mit denen ich bereits zahllose Mischungen gemacht habe:

    Alternative Lösungen für räumliches Audio in Podcasts

    Es gibt mehrere alternative Lösungen, die für die räumliche Audioproduktion in Podcasts besser geeignet sein könnten. Dazu gehören:

    • Ambisonics – Ambisonics ist ein beliebtes Format für räumliche Audioproduktion, das native Unterstützung für Head-Locked Mono bietet. Das bedeutet, dass der Ton unabhängig von den Kopfbewegungen des Zuhörers an der gleichen Stelle im Raum bleibt.
    • Gaudio Lab Works – Gaudio Lab Works ist ein fortschrittliches Spatial Audio Toolkit, das Ambisonics, Head-Locked und objektbasierte Audioverarbeitung bietet. Dies macht es zu einem vielseitigen Werkzeug für die Erstellung immersiver und interaktiver Audio-Erlebnisse.
    • Fraunhofer IIS MPEG-H – Fraunhofer IIS MPEG-H ist ein Tool, das 3D-Audio vollständig unterstützt und personalisierte Metadaten ermöglicht. Dies ermöglicht eine präzise Klangwiedergabe und ein noch intensiveres Hörerlebnis.
    • atmoky WebSDK – atmoky WebSDK ist eine objektbasierte und Head-Locked-Audio-Bed-Lösung, die eine skalierbare und flexible Lösung für die räumliche Audioproduktion in Podcasts bietet.

    Vorteile der Verwendung alternativer Lösungen

    Durch den Einsatz alternativer Lösungen wie Ambisonics, Gaudio Lab Works, Fraunhofer IIS MPEG-H und atmoky WebSDK können Podcast-Produzenten von einer Reihe von Vorteilen profitieren. 

    Dazu gehören eine genauere Unterscheidung zwischen diegetischem und nicht-diegetischem Audio, eine bessere Eignung für das Erzählen von Stories in Podcasts sowie ein intensiveres und interaktives Audio-Erlebnis in einer Folge.

    Schlussfolgerung

    Abschließend lässt sich sagen, dass Dolby Atmos zwar ein leistungsstarkes Werkzeug für die räumliche Audioproduktion in Filmen, Shows und Videospielen ist, seine Eignung für die Podcast-Produktion jedoch fraglich ist. 

    Die Unterscheidung zwischen diegetischem und nicht-diegetischem Audio ist für das Erzählen von Podcasts von entscheidender Bedeutung, und Dolby Atmos kann nicht effektiv zwischen den beiden unterscheiden.

    Wenn du wissen möchten, wie du mit immersiver Audiosoftware interaktive Klanglandschaften schaffen kannst, die mehr als nur Marketing sind, kontaktiere mich!

    Jetzt Kontakt aufnehmen

    Diese Webseite verwendet Cookies. Wenn Sie diese Webseite weiterhin besuchen, stimmen Sie der Nutzung von Cookies zu. Mehr dazu finden Sie in meiner Datenschutzerklärung.
    Notwendige Cookies
    Tracking
    Alles akzeptieren
    oder Auswahl speichern