Overview

Virtual Reality Audio Formate – Pro & Contra

Inhalt

Sämtliche Technologien für die Wiedergabe von Virtual Reality Audio auf Kopfhörern oder Lautsprechern, kann man grob in drei Kategorien einteilen: Kanal-basiert, Objekt-basiert und Schallfeld-basiert.

Hier ein paar Beispiele, bevor es später ins Detail geht:

Kanal-basiert: z.B. Stereo, 5.1 Surround etc.
Objekt-basiert: z.B. Dolby Atmos, G’Audio Lab
Schallfeld-basiert: z.B. Ambisonics

Neue Umgebung für die Ohren

Virtual Reality (VR) und Augmented Reality (AR) revolutionieren die Art und Weise, wie wir Inhalte konsumieren. Besonders im Bereich des Virtual Reality Audio spielt die akustische Ebene eine entscheidende Rolle, um eine immersive Hörerfahrung zu schaffen, die das Erleben von 3D-Räumen realistischer macht.

In der heutigen Zeit, in der 3D-Audio und Spatial Audio immer mehr ein Begriff werden, ist ein Blick auf die verschiedenen Audioformaten unerlässlich, die für VR und AR genutzt werden. Der Inhalt des Artikels soll sich aber v.a. auf virtual reality content für Profis in der Akustik beziehen.

Technologische Entwicklung und Zukunftsaussichten

Die Entwicklung von Virtual Reality Sound und Spatial Audio hat in den letzten Jahren enorme Fortschritte gemacht. Die Möglichkeit, Audio präzise im 3D-Raum zu positionieren, hat die Wahrnehmung von VR-Inhalten auf ein neues Niveau gehoben. Dies hat nicht nur Auswirkungen auf die Unterhaltungsmedien, sondern auch auf professionelle Anwendungen wie Audioproduktion und Sounddesign. In der Zukunft könnten Kopfhörer und VR-Brillen noch besser aufeinander abgestimmt werden, um die Hörerfahrung weiter zu optimieren.

Vergleich mit anderen immersiven Medien

Während herkömmliches Stereo Ton in den letzten Jahrzehnten der Standard in der Audioproduktion war, eröffnen Virtual Reality und Augmented Reality ganz neue Möglichkeiten. 3D-Audio bietet eine vielschichtige und dynamische Klangfeld-Darstellung, die weit über das hinausgeht, was man mit traditionellen Stereo- oder 5.1-Surround-Systemen erreichen kann. Der Einsatz von Ambisonics in der Postproduktion ermöglicht es, Klangfelder zu erschaffen, die sich perfekt in den virtuellen Raum einfügen und den Hörer mitten ins Geschehen versetzen.

Anwendungsszenarien und Beispiele

Die Einsatzmöglichkeiten von Virtual Reality Audio bzw Virtual Reality Sound sind vielfältig. Von Videospielen über Filme bis hin zu interaktiven Inhalten für Unternehmen gibt es zahlreiche Bereiche, in denen immersive 3D-Audio-Technologien angewendet werden. Besonders interessant ist der Einsatz von Ambisonics in Kombination mit binauralem Stereo, um eine möglichst realistische Hörerfahrung zu erzeugen. Diese Technologien bieten auch für Musiker und Sounddesigner spannende Möglichkeiten, da sie völlig neue kreative Freiheiten eröffnen.

Herausforderungen und Zukunftsperspektiven

Trotz der zahlreichen Vorteile von Virtual Reality Audio und Spatial Audio gibt es auch Herausforderungen deR Technologie. Die Kompatibilität zwischen verschiedenen Software-Lösungen und Formaten, die Notwendigkeit leistungsstarker Hardware wie eine VR-Brille und Kopfhörern, sowie die Komplexität der Aufnahmen und Postproduktion sind nur einige der Aspekte, die es zu berücksichtigen gilt. Dennoch ist das Potenzial dieser Technologien enorm, und es wird erwartet, dass sich die Virtual Reality-Technologien weiterentwickeln und verbessern werden.

Kanal-basiert

Hier wird jedem Kanal einer Audio-Datei ein fester Wiedergabe-Platz zugewiesen. Bei Stereo ist es „links“ und „rechts“ und hat damit zwei Kanäle. 5.1 Surround hat sechs Kanäle, es kommen also noch zwei Lautsprecher hinter dem Zuschauer, sowie ein Center aus der Bildmitte und ein LFE-Kanal für den Subwoofer hinzu. Für Virtual Reality Audio also eher unüblich, hat aber durchaus seine Daseinsberechtigung.

Binaurales Stereo

Hierbei handelt es sich um einen Surround-Eindruck, der über Kopfhörer wiedergegeben werden kann, und damit nur zwei Kanäle benötigt.

Dabei wird der menschliche Höreindruck simuliert, sei es durch die Aufnahme mit zwei Mikrofonen (-> Kunstkopf) oder eine Berechnung aus einem Surround-Format mittels HRTF (Head-Related Transfer Function).

Pro	Contra
Kann wie jedes herkömmliche Stereo-File auf allen Plattformen wiedergegeben werden	Keine Wiedergabe über Lautsprecher, prinzipiell möglich, aber klingt komisch
Schnelle Möglichkeit den gesamten Klangeindruck einer Spatial Audio Mischung als Downmix wiederzugeben	Kein Head-Tracking möglich, kann nur den Klang einer festen Blickrichtung wiedergeben

5.1 Surround

Pro	Contra
Auch für herkömmliche Surround-Anwendungen mit Lautsprecher nutzbar	Positionen zwischen den Lautsprechern nur als Phantomschallquelle möglich
Einfaches Setup, seit Jahren genutzt	nur zweidimensional, kann keine Höheninformation von oben oder unten wiedergeben

Objekt-Basiert

Hierbei werden Töne als sogenannte Audio-Objekte im 3D Raum platziert werden, ohne an Lautsprecher-Anordnung oder Kanälen gebunden zu sein. Bei der späteren Wiedergabe wird die Position des Objekts im Raum auf die zur Verfügung stehenden Lautsprecher berechnet, somit ist eine Beschallung mit einer quasi unbegrenzten Zahl an Lautsprechern möglich und stellt in der Anordnung in etwa eine Halbkugel da.

Dolby Atmos VR (Virtual Reality)

Ist eine Umwandlung der Dolby Atmos Tools für Virtual Reality. Aus dem Atmos-Masterfile wird ein ec3-File erzeugt, das später eine Wiedergabe über Head-Tracking ermöglicht.

Pro	Contra
Wiedergabe als Stereo ohne weiteres decodieren möglich, erkennt womit es abgespielt wird und wandelt sich bei der Wiedergabe selber um	Eingebackenes Format, wenig Möglichkeiten zur Distribution, selbst Preview der eigenen Videos kann kompliziert werden
Objektbasierter Ansatz für VR, Wiedergabe während der Mischung auch über Surround-Lautsprecher möglich	VR Transcoder ermöglicht den Output von Ambisonics, aber lediglich erster Ordnung und wird im direkten Vergleich zu ec3 schlechter klingen, als hätte man es künstlich verschlechtert

G’Audio Lab

Das Team dahinter hat 2005 bereits zur Entwicklung von MPEG-H beigetragen und war maßgeblich am binauralen Rendering beteiligt. Doch sie wussten, dass MPEG-H nicht einwandfrei für VR geeignet ist, da es nicht möglich ist, kanal-, objekt- und schallfeld-basiertes Audio gleichzeitig zu nutzen.

Pro	Contra
Nutzt die jeweiligen Vorteile von kanal-, objekt- und schallfeld-basiertem Audio	Auf Plattformen quasi nicht verbreitet, aber encodieren in Ambisonics erster Ordnung möglich
Kann auch für interaktives VR genutzt werden, also eine Bewegung von der Kamera-Position weg (6 statt 3 Freiheitsgraden)	aktuell Mac-Only

Schallfeld-Basiert

Ambisonics

Diesem Format habe ich bereits einen ausführlichen Artikel gewidmet.

Das Arbeiten mit einer Ambisonics-Mischung für Virtual Reality Audio ist vergleichbar mit einer Objekt-basierten, die Technologien sind aber denkbar unterschiedlich.

Ambix / FuMa (Furse-Malham)

Diese beiden Ambisonics-Formate sind sehr ähnlich und untereinander gut kompatibel, weswegen sie hier nicht weiter unterschieden werden.

Pro	Contra
Hohe Kompatibilität zu anderen kanalbasierten Formaten durch Decoder möglich	Keine Wiedergabe ohne entsprechenden Decoder möglich, welcher aber auf den meisten Plattformen integriert ist
Beliebig durch verschiedene Ordnung skalierbar. Für 360° Videos sind bereits vier Kanäle sehr effizienten	Musik (Stereo) kann nur über einen Work-Around als ein sich nicht-mitdrehendes Schallereignis eingebunden werden (head-locked)

Two Big Ears (TBE)

Ist ein eigenes Ambisonics-Format, dessen Firma von Facebook gekauft wurde und als dessen Standard eingeführt wurde. Es handelt sich um ein Hybrid Higher Order Ambisonics, das acht Kanäle besitzt und ein gut durchdachtes Konzept besitzt. Dazu bei Gelegenheit mehr auf meinem Blog.

Pro	Contra
Guter Kompromiss aus Kanalzahl und möglicher Auflösung; hat zusätzliche, statische Stereo-Spur löst das Problem von Ambisonics	Eingebackenes Format, schwierig in andere Formate zu bringen, wird aktuell verbessert
Pipeline von der DAW bis ins SDK, wird klanglich keine großen Überraschungen geben	Intransparente Verarbeitung (wofür stehen die Kanäle, mit welcher Kopfgröße wird gearbeitet etc.). Free to use, aber kein open source.

Quad-Binaural

Ist ein Format, das sich irgendwo zwischen Kanal-basiert und Schallfeld-basiert einordnen lassen kann. Hier werden vier Stereo-Files aus den Blickrichtungen 0°, 90°, 180° und 270° ausgespielt und später bei der Wiedergabe, je nach Blickrichtung, ineinander überblendet. Auch wenn es in Zukunft für Virtual Reality Audio wohl weniger genutzt wird, hat es durchaus noch seine Daseinsberechtigung:

Pro	Contra
Beim Programmieren einer App muss keine HRTF mit Decoder implementiert werden und spart Prozessorleistung	Wiedergabe ist lediglich eine Interpolation aus den verschiedenen Blickrichtungen, damit entsprechend ungenau
Stereospur bei 0° stellt einen Downmix da (siehe oben: binaurales Stereo), der als Preview ohne Headtracking nützlich sein kann	Keine Möglichkeiten, um von Quad-Binaural z.b. nach Ambisonics oder 5.1 zu kommen, was andersherum möglich ist

Soweit mein kleiner Überblick, bei Fragen, Ergänzungen oder Feedback kann man mir gerne eine Mail schreiben.

Fazit und Ausblick

Die verschiedenen Virtual Reality Audio-Formate bieten eine Vielzahl von Möglichkeiten für die Schaffung immersiver Hörerfahrungen. Von binauralem Stereo über Ambisonics bis hin zu objekt-basierten Audioformaten wie Dolby Atmos VR – jedes Format hat seine eigenen Stärken und Schwächen, die je nach Anwendungsfall abgewogen werden müssen. Die Zukunft von VR und AR im Audiobereich sieht vielversprechend aus, und es ist spannend zu sehen, wie sich die Technologien weiterentwickeln werden, um noch realistischere und beeindruckendere Hörerlebnisse zu ermöglichen.

Falls du mehr über diese Technologien erfahren möchtest, schau dir auch meinen Artikel über Ambisonics an, der tiefer in diese Thematik eintaucht. Für weiterführende Informationen und aktuelle Entwicklungen im Bereich des Virtual Reality Audio kannst du meinen Newsletter abonnieren oder mir eine E-Mail schreiben.

Kontakt aufnehmen

Verwandte Blogartikel

Ambisonics für Virtual Reality und 360° Schallfeld

360-Grad Videos für Virtual Reality VR-Player Apps

MPEG-H Audio vs. "Dolby Atmos" - Es gibt einen Gewinner

360 Reality Audio - Was ist das Sony 360RA Erlebnis im Detail?