Immersive Audio

Die Matrix für Audiophile

9. Juli 2021, 11:30 Uhr | Interview: Diana Künstler | Kommentar(e)
3D-Audio, Klangwelt
© Bild: fs Quelle: fotolia

3D-Sound-Produkte sollen vor allem Gamer oder Kinofans begeistern. Hersteller Harman will in diesem stark wachsenden Markt neue Standards setzen. Mitentwickler Alfredo Fernandez Franco erläutert im Gespräch mit funkschau, was immersiven Sound auszeichnet.

funkschau: Mono, Stereo und nun 3D-Audio? Könnte man so, salopp gesagt, die Weiterentwicklung im Audio-Umfeld beschreiben? Oder was genau ist unter Immersive Audio zu verstehen?

Alfredo Fernandez Franco: Das beschreibt die Entwicklung von Audiotechnologie schon ziemlich gut, wobei ich finde, dass der Begriff 3D-Audio zu weit gefasst ist. Eigentlich kann man über einen Mono-Lautsprecher bereits in 3D hören. Der Sound wird von den Wänden, dem Boden und der Decke reflektiert. Dadurch können wir als Zuhörer abschätzen, wo sich die Geräuschquelle befindet, wie weit der Lautsprecher entfernt ist und ob er sich über- oder unterhalb unserer Hör-ebene befindet. Trotzdem ergibt sich daraus nicht das Gefühl, komplett in das Hörerlebnis einzutauchen. Somit beschreibt „Immersive Audio“ besser, was wir erreichen wollen. Eine 7.1.-Surround-Anlage ermöglicht eben genau dieses Gefühl des Eintauchens in das Klang-erlebnis schon eher. Das lässt sich immer weiter rechnen: Bei einer 9.1.4.-Anlage, wo neben neun Surround-Lautsprechern und einem Subwoofer vier zusätzliche Höhenlautsprecher hinzugefügt werden, ist die Erfahrung umfassender und immersiver. Und durch die zusätzlichen Overhead-Lautsprecher kann man dann sogar die Schallquellen oberhalb der Hörebene wahrnehmen. Die Immersion wird dementsprechend immer stärker, je mehr Lautsprecher oder virtuelle Quellen involviert sind – jedoch nur bis zu einem gewissen Punkt, ab dem zusätzliche Lautsprecher nur noch einen zunehmend geringeren Nutzen in Bezug auf das Eintauchen in das Hörerlebnis haben.

Anbieterkompass Anbieter zum Thema

zum Anbieterkompass
Alfredo Fernandez, Harman
Alfredo Fernandez Franco ist Experte für Immersive Audio Engineering bei Harman und Mitentwickler der JBL Quantum-Serie. Harman entwickelt und produziert vernetzte Produkte und Lösungen für Autohersteller, Endkunden und Unternehmen weltweit. Dazu zählen unter anderem Connected-Car-Lösungen, Audio- und visuelle Produkte, Automatisierungslösungen sowie Connected Services. Zahlreiche Premiummarken laufen unter dem Dach des Herstellers zusammen: darunter AKG, Infinity, Mark Levinson oder JBL, welche dieses Jahr ihr 75-jähriges Jublliäum feiert.
© Harman

Neben Immersion spielt auch die Genauigkeit der Lokalisierung der Audioquelle eine wichtige Rolle, das heißt wie präzise die virtuelle Quelle eines Geräusches oder Tons im Raum wahrgenommen werden kann. Wenn eine Jazzaufnahme auf einer Stereoanlage abgespielt wird, kann man sich ungefähr vorstellen, wo sich die Instrumente zwischen den Lautsprechern befinden. Vergleicht man das jetzt mit einem vollständig objektbasierten Audiomix mit aktiver Bewegungsverfolgung des Zuhörers, könnte man hier sogar um die Musiker herumgehen und sich einem speziellen Instrument nähern, das dann im Vergleich zu den anderen intensiver wahrgenommen wird. Beim Gaming beispielsweise bedeutet diese Genauigkeit der räumlichen Abbildung der Geräusche, dass man die Gegner schon hören kann, bevor man sie sieht. Hier kann akkurater Sound den Unterschied ausmachen, ob man gewinnt oder sein „virtuelles Leben“ verliert.

funkschau: Woran liegt es Ihrer Meinung nach, dass Immersive Audio gerade jetzt als Trendtechnologie gehypt wird?

Franco: Immersives Audio benötigt Rechenleistung und Technologien, die bis vor Kurzem sehr teuer waren. Auch der Zugriff auf passende Inhalte war bisher in der Breite nicht gegeben. Das ändert sich gerade. Vor allem die Gaming-Industrie ist schon seit Langem Vorreiter, wenn es um immersive Audioinhalte geht. Die Audio Engine eines Videospiels ist ein sehr komplexes Mixing-System, das mit der Physik-Engine des Spiels gekoppelt ist. Die Positionen jeder Soundquelle und der Zuhörer, also der Spieler, sind innerhalb eines 3D-Raums eindeutig festgelegt und können beim Abmischen des Sounds mit einbezogen werden. Noch vor Kurzem wurde der Sound auf maximalem Surround Sound abgemischt, obwohl der Ton in 3D produziert wurde. Dabei gingen natürlich viele Informationen über die Positionen der Soundquellen verloren. Jetzt haben wir sowohl die Rechenleistung als auch die Hardware, damit wir alle uns zur Verfügung stehenden Informationen verarbeiten können, um fesselnde, immersive Audioerlebnisse zu schaffen.

Immersive Audio, Layer
Immersive Sound lässt sich am ehesten als „Surround Sound mit zusätzlicher Höhenebene“ beschreiben. Dabei fügt man die bisher fehlende und finale Dimension der Höhe in der Soundwiedergabe hinzu. Einige Hersteller setzen für den idealen 3D-Sound auf ein System aus drei Layern: der Surround-, Upper- und Overhead-Ebene, letztere auch gerne als „Voice of God“-Layer bezeichnet.
© Harman

funkschau: Was zeichnet für Sie den perfekten immersiven Sound aus?

Franco: Das perfekte immersive Audioerlebnis ist jenes, das der Zuhörer nicht von der Realität unterscheiden kann. Vergleichbar mit Neo, der die Matrix nicht sehen konnte, ist es auch unser Ziel, das Hörerlebnis so real zu gestalten, dass der Nutzer die Kopfhörer oder Lautsprecher vergisst. Dieses Erlebnis kann auch objektiv gemessen werden: Wir stellen beispielsweise fest, wie gut Spieler in der Lage sind, Soundquellen im Raum zu lokalisieren und vergleichen dies dann mit der Leistung unserer Rendering-Systeme.

funkschau: Wie sehen künftige Anwendungsfälle von Immersive Audio jenseits von Entertainment und Gaming aus?

Franco: Kommunikationsanwendungen unter Berücksichtigung des Standortes, Telekonferenzen und Hörgeräte könnten beispielsweise von immersiver Audiotechnologie profitieren. Die Nutzung für standortbezogene Kommunikation könnte man mit Videospielen vergleichen. Man kann sich beispielsweise mehrere Gruppen von Rettungskräften vorstellen, die in einem großen Gebiet zum Einsatz kommen: Setzt man hier GPS-Daten und Head Tracking ein, könnte man den Kommunikationssystemen binaurale Rendering-Cues hinzufügen (Anm.d.Red.: Cue – deutsch Hinweis, Stichwort oder Signal). Diese Cues können dann dazu genutzt werden, um die Position der anderen Teams relativ zum Standort des Nutzers zu bestimmen. Befindet sich beispielsweise Team B zur Linken, würden auch deren Stimmen über das Kommunikationssystem mithilfe der Cues als von links kommend wahrgenommen werden. Diese Hinweise würden sich zusätzlich in Echtzeit ändern, wenn sich das Team bewegt.


  1. Die Matrix für Audiophile
  2. Der Inhalt ist entscheidend

Verwandte Artikel

Harman/Becker Automotive Systems GmbH, Harman Becker Automotive Systems GmbH

Anbieterkompass