OverviewTools

Apples 3D Kopfhörer mit Kopferfassung überhören diese Problem

Inhalt

    Diese spannende 3D Audio Technologie baut Apple in alle seine Kopfhörer ein, also Airpods Pro, Airpods Max und den Standard Airpod! Mit der Implementierung bin ich auch echt zufrieden. Es ist recht übersichtlich, was man denn jetzt hört (Stereo oder 3D) und in welcher Art. Trotzdem macht Apple hier einen entscheidenden Fehler.

    In diesem Artikel schauen wir uns an, welche 5 Möglichkeiten es gibt, den Ton mit Apples 3D Kopfhörern anders wahrzunehmen. Hier die Kurzübersicht:

    • Input Stereo: 3D aus, Kopfhörer Kopferfassung aus
    • Input Stereo: 3D an, headtracking aus
    • Input Stereo: 3D an, headtracking an
    • Input Mehrkanal: headtracking aus
    • Input Mehrkanal: headtracking an

    Input ist Stereo, 3D aus

    Der Grundzustand der Apple AirPods ist, dass die 3D-Funktionen deaktiviert sind. Hier erlebt der Nutzer herkömmlichen Stereo- oder Mono-Klang ohne jegliche räumliche Erweiterung.

    Man könnte dem widersprechen und sagen, dass Stereo durchaus Räumlichkeit haben kann. Natürlich kann man mit Halleffekten eine gewisse Tiefe erzeugen, doch mit 3D Audio hat das nicht viel zu tun. Wir nehmen den Sound nicht um uns herum wahr, sondern eben nur auf dem Ohr.

    Diesem Format folgt jeder Kopfhörer – ob open, in-ear oder andere. Diese Einstellung repräsentiert die klassische Audio-Erfahrung, die die meisten von uns seit Jahren gewohnt sind. Hat also erstmal nichts mit Airpods Produkte zu tun – das kann jeder Ohrhörer.

    Dabei handelt es sich um ein den Begriff Im-Kopf-Lokalisation. Das ist ein Phänomen, das ich hier ausführlicher beleuchte.

    Dieses tritt eben nur bei Kopfhörern auf und wir als Menschen haben uns daran gewöhnt. Jetzt komme ich und sage: Es ist eigentlich ein Problem. Im Laufe des Artikels wird Dir klar sein, warum.

    Input Stereo, fixiert

    Wenn der Stereo-Input auf „Fixiert“ gesetzt wird, erfahren die Kopfhörer eine künstliche räumliche Erweiterung. Das bedeutet, dass der Sound, der normalerweise direkt im Kopf wahrgenommen wird, nun etwas weiter entfernt zu sein scheint. Damit soll die übliche In-Kopf-Lokalisation ausgeglichen werden und der Ton damit noch natürlicher klingen.

    Es wird als Quellen auf ganz normale Stereo- oder Mono-Files zugegriffen, wie wir sie im Alltag in Form von Musik oder Podcasts konsumieren. Der Output auf dem Gerät ist wieder ein Stereo, das an dieser Stelle angereichert wurde. Man spricht in diesem Fall auch von Upmixing, Apple nennt es „Stereo zu 3D-Audio“ oder „Spatialize Stereo“

    Genau genommen braucht man dafür keine speziellen 3D Kopfhörer, weil diese Umrechnung softwareseitig einfach über das Smartphone generiert werden kann. Hat also nichts mit 3D Audioformaten oder dem iPhone zu tun.

    Es gibt keine weiteren Einstellungen und das Spatial Audio anzupassen. Wohin man auch schaut, das Klangerlebnis bleibt gleich – im Unterschied zu den folgenden Modi.

    Input Stereo, mit Kopferfassung

    Hierbei geht es um die dynamische Kopferfassung (Headtracking). Durch die Erfassung der Kopfbewegungen wird der Ton dynamisch an die Position des Kopfes angepasst. Diese Funktion ermöglicht eine präzisere räumliche Wahrnehmung, da der Klang in Echtzeit mit der Kopfbewegung des Hörers interagiert. 

    Mehr zu head-tracking Audio.

    Nun klingt es so, als würden im Raum zwei virtuelle Lautsprecher vor dir stehen und du sitzt nun im Sweetspot. Das ist idealerweise ein gleichseitiges Dreieck von 60° mit dir als Zuhörer in der Mitte. Vorteile sind u.a., dass dein Gehirn vergisst dadurch, dass du Kopfhörer trägst. 

    Hierfür sind spezielle Kopfhörer nötig mit einem System, das den Sound an die Kopfbewegung anpassen können. Es wird aber weiterhin als Input nur Mono-/Stereo-Material auf den Geräten genutzt. Dieses wird in eine virtuelle 3D-Szene gesetzt und um dich bewegt, wenn du dich bewegst. So entsteht die Illusion, dass der Sound im Raum verankert ist.

    Ich finde es spannend, dass man verschiedene Möglichkeiten hat, den ganz normalen Stereo-Content, den wir aus unserem Alltag kennen, zu konsumieren. Es ist echt cool, dass man mit Apple-Kopfhörern beliebig zwischen den Modi hin und her wechseln kann.

    Hier befinden wir uns in einer Übergangsphase, in der Hörer einfach nach ihrem Geschmack den passenden Modus auswählen können.

    Input Mehrkanal, fixiert

    Der Wechsel zum Mehrkanal-Input bringt uns in die Welt von Dolby Atmos und ähnliche Audioformate. Hier werden mehrere Kanäle von Klängen in einem Raum simuliert. Wenn dieser Input auf „fixiert“ steht, bleibt die räumliche Anordnung konstant, unabhängig von den Kopfbewegungen.

    Dies ist ideal, wenn der Hörer sich nicht ständig bewegt und dennoch den immersiven Klang von Mehrkanal-Audio beim Musikhören genießen möchte.

    Du kannst es dir wie ein Setup aus virtuellen 5.1 Lautsprechern vorstellen, die vor und hinter dir platziert sind und einen Surround Sound ermöglichen. Meist ist die darunter liegende Technologie Dolby Atmos AC-4, doch während des Streamings wird es auf eine Art sechs-kanaliges Audio reduziert.

    Man kann hier also nicht mit normalem Stereo-Content arbeiten, sondern braucht eben mehrkanaliges Audio.

    Für mich liegt genau hier der eigentliche Mehrwert von 3D Audio (im Vergleich zu Stereo). Denn jetzt kommt der Ton eben nicht nur von vorne, sondern aus allen Richtungen – so wie wir das aus unserer natürlichen Umgebung kennen.

    Dafür brauchst du eigentlich keine speziellen Kopfhörer wie ein Surround Headset- auch wenn die Hersteller es einem gerne suggerieren. Die Erkennung von mehrkanaligem Input zu einem binauralen Stereo funktioniert softwareseitig. Natürlich ist es besser, wenn die Kopfhörer für diesen Klang optimiert sind, aber in der Theorie ist keine besondere Hardware nötig.

    Der Modus, bei dem der Kopf auf die 0-Achse fixiert ist, ist besonders beliebt, wenn man etwa unterwegs ist und dabei seinen Kopf bewegt. Dabei bleibt die Klangszene stabil und rotiert sich nicht immer entgegengesetzt unserer Blickrichtung. 

    Anders als beim nächsten Fall – der Königsdisziplin für die dynamische Kopferfassung.

    Input Mehrkanal, mit Kopferfassung

    Durch das Hinzufügen von Headtracking zu mehrkanaligem Audio entsteht eine besonders beeindruckendes surround sound Erlebnis. Jetzt können sich die Klänge im Raum bewegen und sich mit den Kopfbewegungen des Hörers synchronisieren.

    Diese Einstellung bietet eine zusätzliche Dimension des Realismus, da der Klang nicht nur vorne, sondern auch seitlich und von hinten wahrgenommen werden kann – was bei rein binauralem Audio ohen Bild Bezug schwierig ist.

    Das löst nun die sogenannte Front-Back-Confusion. Selbst mit mehrkanaligem 3D Audio kann unser Gehör nur schwer die Inhalte von vorne und hinten unterscheiden. Das hat physikalische Gründe und liegt meist daran, dass nur mit einer generischen HRTF gerendert wird. Doch selbst personalisiertes 3D Audio kann das Problem nur näherungsweise lösen.

    Sobald man aber eine leichte Kopfdrehung ausführt, versteht unser Gehör sofort, wo sich die Klänge im Raum befinden. Das alles fasziniert mich bis heute und ist auch der Grund, warum ich mich auf den Hype um 3D Audio Technologien spezialisiert habe. 

    Ich finde als Tipp, bei Filmen funktioniert das besonders gut, weil man eine visuelle Referenz hat. Du hast vor dir einen Screen, von dem die Stimmen im Center-Lautsprecher wiedergegeben werden.

    Links und Rechts davon befindet sich meist die Musik und um dich herum sind die Soundeffekte und Hintergrund-Atmosphären, die dich mit Klang einhüllen. So kann effektiv eine Verbindung zum virtuellen Heimkino hergestellt werden.

    Auf welches Problem stoßen wir beim Headtracking?

    Eine zentrale Frage bei der Nutzung von Headtracking-Kopfhörern ist die Ausrichtung des Audio-Inhalts. Man muss schauen, ob der Content überhaupt für Headtracking geeignet ist und darauf optimiert wurde. Falls nicht, ist es nicht sehr sinnvoll, solche Inhalte mit der Headtracking-Technologie zu konsumieren.

    Die Debatte darüber, ob und wann Headtracking angemessen ist, betont einerseits die Bedeutung der Anpassung an den jeweiligen Kontext und die individuellen Präferenzen. Andererseits geht es aber auch um die Intention, die der Mischtonmeister bei der Erstellung hatte

    Das Problem spiegelt sich oft bei Apple Music wider. Hier ist traditionell der/die SängerIn im Center platziert, wie die Snare- und Bass-Drum Beats und weitere wichtige Elemente. Bewegst du nun deinen Kopf, hörst du sehr genau, wie diese Stems aus einer Richtung kommen. Die Einhüllung scheint nicht mehr so gut zu funktionieren.

    Daher habe ich in meiner 3D-Audio-Matrix die Begriffe 0DoF, 3DoF, 6DoF, eingeführt. Musik und Filme würde ich als 0DoF bezeichnen. Das bedeutet: man soll seinen Kopf nicht bewegen, man schaut immer nach vorne etwa zum TV. Technisch gesehen kann man Headtracking aktivieren, aber es hat wenig Mehrwert.

    3DoF sind Medien, bei denen eine Veränderung der Hörposition ausdrücklich gewünscht ist. Spatial Videos, 180 Videos und vor allem 360° Videos basieren z.B. auf dem Prinzip. Dort ist es sinnvoll, den 3D Sound sogar mit Stereo-Sound zu kombinieren. Etwas, das Dolby mit Headtracking nicht kann.

    Komplexes Thema, daher habe ich es hier im Kontext von Dolby Atmos Podcast ausführlich erklärt.

    Fazit 3D Kopfhörer mit Kopferfassung

    Während die meisten Leute denken, dass es Stereo- und 3D-Inhalte gibt, die man mit Content hören kann, gibt es verschiedene Modi, die den Output bestimmen. Über den Lautstärkeregler hinaus spielt die Intention eine Rolle und wie der Inhalt gemischt wurde. Das wird aber leider aus der Übersicht von Apple nicht ersichtlich.

    Wenn du also wissen möchtest, wie du es richtig machst, kannst du mich als führenden Experten in der Richtung kostenlos anfragen.

    Mehr beim Blog

    Diese Webseite verwendet Cookies. Wenn Sie diese Webseite weiterhin besuchen, stimmen Sie der Nutzung von Cookies zu. Mehr dazu finden Sie in meiner Datenschutzerklärung.
    Notwendige Cookies
    Tracking
    Alles akzeptieren
    oder Auswahl speichern