Räumlicher Klang über Kopfhörer: Wie die Wissenschaft 9 Lautsprecher und einen Subwoofer in Ihren Kopf stopft

April 8, 2024 Eskere Guru

Ein Apple iPhone 14, auf dem die Apple Music App mit einer Funktionsseite zu Spatial Audio-Inhalten angezeigt wird, daneben ein Satz Apple AirPods Max-Kopfhörer. — Simon Cohen / Digitale Trends

Spatial Audio hat einen Moment Zeit. Während das Ziel, ein immersiveres, 3D-ähnliches Hörerlebnis zu bieten, möglicherweise in Kinos entstanden ist, hat sich ein Großteil der Diskussion über räumliches Audio auf Musik verlagert – insbesondere auf die relativ neue Verfügbarkeit von Dolby Atmos- Musiktiteln über Musik-Streaming-Dienste.

Der Reiz von räumlichem Audio ist kein Geheimnis. Wenn man eine der ersten neuartigen Möglichkeiten des Musikhörens seit Stereo kombiniert – gepaart mit der enormen Marketingkraft von Apple –, werden viele Leute es ausprobieren wollen.

Etwas rätselhaft ist jedoch, ob es einen Unterschied zwischen räumlichem Audio von einem Streaming-Dienst zum anderen gibt. Sagen wir, bei Apple Music im Vergleich zu Amazon Music. Und was ist mit Ihren Kopfhörern – beeinflussen sie den räumlichen Klang?

Die Antworten sind ja und ja, aber vielleicht nicht aus den Gründen, die Sie denken. Um dies zu erklären, werfen wir einen genaueren Blick darauf, was sich hinter den Kulissen abspielt, wenn Sie räumliches Audio über Kopfhörer hören.

Bevor Sie fortfahren, finden Sie hier eine Einführung in räumliches Audio , in der erläutert wird, was es ist und auf welche verschiedenen Arten Sie es erleben können.

Ein Raum voller Lautsprecher in deinem Kopf

Mann hört mit geschlossenen Augen KEF LS50-Lautsprechern zu. — Bill Roberson / Digitale Trends

Räumliche Audioformate wie Dolby Atmos sind Erweiterungen des Mehrkanal-Surround-Sounds (denken Sie an Dolby Digital) und wurden für ein Kino-Hörerlebnis über im Raum verteilte Lautsprecher entwickelt. Dieser theoretische Raum hat eine Vorderseite, eine Rückseite, zwei Seiten und eine Decke.

Musik, die in Dolby Atmos erstellt wird, beginnt mit einem „Bett“ aus 9.1-Kanälen, normalerweise in einem 7.1.2-Layout konfiguriert, das den Lautsprechern vorne (links, Mitte, rechts), den Seiten (Surround links/rechts) und hinten entspricht (links/rechts), der Decke (Höhe links/rechts) sowie einem Kanal für Niederfrequenzeffekte (LFE), der an einen Subwoofer gesendet wird. Zusätzlich zu diesen neun Kanälen, die unterschiedliche Tonmengen erzeugen können, fügt Dolby Atmos bis zu 118 Klangobjekte hinzu, die sich überall auf der von diesen neun Lautsprechern abgedeckten Hemisphäre frei bewegen können.

Wenn Sie räumliches Audio über Kopfhörer hören, hören Sie denselben 9.1-Kanal- und 118-Objekte-Soundtrack, was paradox erscheint. Wie können zwei kleine Lautsprecher, die Sie an Ihrem Kopf befestigen, das Gleiche tun wie neun Lautsprecher, die rund um Sie herum angeordnet sind?

Dein Gehirn austricksen

THX Spatial Audio-Bild eines Mannes, der überrascht aussieht, während er Kopfhörer trägt. — Danke

Die Antwort findet sich in der Psychoakustik, dem Wissenschaftsbereich, der untersucht, wie das Gehirn Klanginformationen interpretiert und darauf reagiert. Dazu gehört ein Prozess, der als Schalllokalisierung bekannt ist – wie das Gehirn anhand hörbarer Hinweise herausfindet, aus welcher Richtung ein Schall kommt und wie nah oder weit die Schallquelle entfernt sein könnte.

Wir lokalisieren Schall, indem wir Tonhöhe und Lautstärke synthetisieren. Aber der größte Hinweis ist die Art und Weise, wie der Schall jedes unserer Ohren erreicht. Wir reagieren äußerst empfindlich auf kleinste zeitliche Unterschiede. Wenn ein Geräusch nur eine Millisekunde vor unserem rechten Ohr unser linkes Ohr erreichen würde, würde unser Gehirn es wissen und entsprechend reagieren.

Mit psychoakustischen Modellen (und einem Satz Stereokopfhörer) können wir die Richtung und Entfernung realer Geräusche simulieren, indem wir sorgfältig steuern, wie diese Geräusche jedes Ohr erreichen.

Binaurale Wiedergabe

Apples Head-Tracking-Raumklang für Apple TV 4K. — Apfel

Der Prozess, bei dem ein räumliches Audioformat wie Dolby Atmos mithilfe der Prinzipien der Psychoakustik in eine Reihe von Klängen umgewandelt wird, die über Kopfhörer übertragen werden können, wird als binaurales Rendering bezeichnet.

Wenn Sie jemals Dolby Atmos, DTS:X oder Sony 360 Reality Audio (360RA) über Kopfhörer gehört haben, wurde irgendwann in der Wiedergabekette ein binauraler Rendering-Softwarealgorithmus verwendet, um dieses Erlebnis zu schaffen. Das Gleiche gilt für Videospiele mit 5.1- oder 7.1-Soundtracks – diese können durch Technologien wie THX Spatial Audio oder Immerse Gaming Hive binaural gerendert werden.

Das Spannende an der binauralen Wiedergabe ist, dass sie mit jedem Stereokopfhörer oder Ohrhörer funktioniert. Ob kabelgebunden oder drahtlos und ob Sie 10 oder 1.000 US-Dollar ausgegeben haben, alle Stereo-Headsets sind mit binaural gerendertem räumlichem Audio kompatibel. Ein Kopfhörer wirbt vielleicht ausdrücklich damit, dass er „mit räumlichem Audio funktioniert“, aber das ist so, als würde man sagen, dass ein Satz vier Autoreifen „mit befestigten Straßen funktioniert“ – das tun sie alle.

Räumliches Audio: Alles außerhalb Ihres Kopfes?

Ein binaurales Neumann KU 100 Kunstkopfmikrofon. — Die Form des menschlichen Kopfes ist für die räumliche Wahrnehmung so wichtig, dass Toningenieure häufig kopfförmige Mikrofone wie dieses Neumann KU 100 verwenden, um räumlichen Klang einzufangen. In jedem Ohr befindet sich ein Mikrofon. Neumann

Nachdem ich Ihnen gerade erklärt habe, dass die binaurale Wiedergabe Ihr Gehirn dazu verleiten kann, zu glauben, es höre ein komplettes 7.1.2-Kanal-Soundsystem mit einem beliebigen alten Kopfhörer – mit anderen Worten, es spielt sich alles in Ihrem Kopf ab –, dann bin ich dabei mir selbst widersprechen. Teilweise.

Die Art und Weise, wie jeder von uns Geräuschlokalisierungshinweise interpretiert, hat viel mit der Form unseres Kopfes zu tun. Insbesondere die Form und Platzierung unserer Ohren. Die Physiologie unseres Kopfes erzeugt einen einzigartigen Fingerabdruck (Hörabdruck?) auf den Geräuschen, die unser Trommelfell erreichen – keine zwei sind gleich. Schon in der frühen Kindheit, wenn unser Gehirn die Fähigkeit entwickelt, Geräusche zu lokalisieren, nutzt es diesen Audioabdruck als Vorlage.

Wenn dieser Audioprint mathematisch beschrieben und zum Filtern eingehender Geräusche für jedes Ohr verwendet wird, wird er als „ Head-Related Transfer Function “ (HRTF) bezeichnet.

HRTFs sind der Schlüssel

Eine Illustration von räumlichem Audio. — Verkörpern

Damit die binaurale Wiedergabe möglichst naturgetreu klingt, wird räumliches Audio mithilfe eines HRTF-Profils verarbeitet.

Wie Sie wahrscheinlich erraten haben, haben wir alle einzigartige HRTF-Profile. In einer idealen Welt würden wir unsere Köpfe und Oberkörper in 3D scannen lassen und das resultierende HRTF-Profil in Apple Music oder Amazon Music (oder jede andere App, die räumliches Audio unterstützt) hochladen. Der binaurale Rendering-Algorithmus jeder App würde dann dieses HRTF-Profil verwenden, um eine Reihe von Geräuschen zu erstellen, die unser Gehirn mit einem hohen Maß an Realismus interpretiert.

Wir sind noch nicht ganz da. Da es keine hochladbaren, personalisierten HRTFs gibt, verwendet jede Spatial-Audio-App eine generische HRTF. Wie der Name schon sagt, werden diese generischen HRTFs aus Hunderten einzelner HRTFs zusammengestellt, um eine Annäherung daran zu erstellen, wie Geräusche in unsere Ohren gelangen. Je näher Ihre persönliche HRTF dieser durchschnittlichen HRTF entspricht, desto realistischer wird der räumliche Klang klingen.

Generische HRTFs werden auch verwendet, um Stereoinhalte zu verräumlichen oder den räumlichen Klang mit Head-Tracking zu verbessern. Wenn Ihre Musik-App, Ihre kabellosen Kopfhörer oder Ihre kabellosen Ohrhörer über einen räumlichen Klangmodus verfügen, kann dieser verwendet werden, um dem Stereoklang zusätzliche Tiefe zu verleihen. Und wenn Ihre Kopfhörer über integrierte Sensoren zur Verfolgung Ihrer Kopfbewegungen verfügen, können sie kopfgeführtes räumliches Audio erzeugen und so ein noch realistischeres, raumähnliches Hörerlebnis ermöglichen.

Wer hat die beste HRTF?

Obwohl jeder binaurale Renderer eine generische HRTF verwendet, verwenden seltsamerweise nicht alle dieselbe generische HRTF. Einige, wie Amazon Music und Tidal, verwenden ein von Dolby bereitgestelltes generisches HRTF – es ist in die in diesen Apps enthaltene binaurale Rendering-Engine Dolby Atmos eingebettet –, während Apple Music ein von Apple entwickeltes proprietäres generisches HRTF verwendet.

Per Definition wird jeder generische HRTF für manche Menschen besser geeignet sein als für andere, genauso wie ein Satz kabelloser Ohrhörer manchen Menschen besser passt als anderen. Ob Apples HRTF für Sie besser klingt als Dolbys, hängt davon ab, wie gut Sie mit ihnen übereinstimmen. Der einzige Weg, dies herauszufinden, besteht darin, beides auszuprobieren.

Der Realität einen Schritt näher: personalisierte HRTFs

Ein 3D-Diagramm, das ein personalisiertes HRTF-Profil von Embody darstellt. — Verkörpern

Während vollständige anatomische 3D-Scans der heilige Gral individueller HRTFs sind, haben einige Unternehmen einen Zwischenschritt gefunden, der uns eine einfache Möglichkeit bietet, über generische HRTFs hinauszukommen. Apple nennt seine Version „personalisiertes räumliches Audio“. „Wenn Sie ein iPhone Es handelt sich um dieselbe Technologie, die Apple zum Scannen Ihres Gesichts verwendet, wenn Sie FaceID zum Entsperren Ihres Telefons verwenden.

Leider kann das dadurch erstellte personalisierte HRTF nur in Verbindung mit ausgewählten kabellosen Apple AirPods oder Beats-Kopfhörern und -Ohrhörern verwendet werden – es hat keinen Einfluss darauf, wie Sie räumlichen Klang hören, wenn Sie andere Geräte verwenden.

Sony macht etwas Ähnliches in der Sony Headphones-App. Wenn Sie einen Satz 360RA-kompatibler Kopfhörer oder Ohrhörer von Sony kaufen, können Sie von jedem Ohr Fotos machen und diese in die App hochladen.

Die Fotos werden ausgewertet und zur Erstellung einer personalisierten HRTF verwendet, die an Musik-Apps auf Ihrem Telefon übertragen wird, die Sony 360RA-Titel streamen. Ab März 2024 gehören dazu Amazon Music, Tidal, Nugs.net und PeerTracks.

Erstellen eines virtuellen räumlichen Audiostudios

Screenshot der Immerse Virtual Studio-Software von Embody. — Simon Cohen / Digitale Trends/Embody

So cool es auch ist, binaurales Rendering als Möglichkeit zum Hören von räumlichem Audio über Kopfhörer zu nutzen, für viele Musiker und andere Kreative ist es zu einem wesentlichen Bestandteil bei der Erstellung von räumlichem Audio geworden.

Wie im Abschnitt „Ein Raum voller Lautsprecher in Ihrem Kopf“ erwähnt, werden räumliche Audioformate wie Dolby Atmos für das Hören über Lautsprecher entwickelt. Aber die Einrichtung eines Studios der Version 7.1.2 oder besser, komplett mit geeigneten akustischen Behandlungen zur Beseitigung von Echos und anderen unerwünschten Effekten, kann Tausende kosten.

Wenn Sie ein aufstrebender Künstler sind oder als Hobby mit Raumklang experimentieren möchten, kann dies eine unerschwingliche Investition sein. Dank der binauralen Wiedergabe benötigen Sie jedoch nur einen guten Kopfhörer und die richtige Software, und schon haben Sie ein virtuelles Studio direkt auf Ihrem Computer.

Ein Beispiel für virtuelle Studiosoftware ist Embodys Immerse Virtual Studio Signature Edition . Es funktioniert mit jeder digitalen Audio-Workstation (DAW) – wie ProTools – oder als eigenständige Möglichkeit, binaural gerendertes räumliches Audio aus einer Vielzahl anderer Quellen zu erleben.

Mit Immerse können Sie simulieren, wie es ist, räumliches Audio in einigen der prestigeträchtigsten professionellen Dolby Atmos-Studios zu mischen, darunter Alan Myersons 7.1.6-Studio – wo Hans Zimmer viele seiner legendären Filmmusiken gemastert hat – und Lurssen Mastering, ein Grammy und Oscar -Gewinner 7.1.4 Studio.

Eine Illustration eines telefonbasierten Ohrscans mit der Embody-Software. — Wie Apple und Sony nutzt Embody eine Smartphone-Kamera, um personalisierte HRTFs zu generieren. Verkörpern

Der Schlüssel dazu, diese Aufnahmeräume so zu hören, als würden Sie physisch darin arbeiten, ist die Kombination von Immerses personalisiertem HRTF – das Sie mit fast jedem Smartphone erstellen können – mit speziellen Kopfhörerprofilen für Dutzende beliebter kabelgebundener und kabelloser Kopfhörer für Verbraucher und Profis und Ohrhörer.

Diese Elemente bieten Künstlern eine optimierte Umgebung für die Entwicklung räumlicher Audioinhalte. Allerdings verfügen die meisten Menschen, wie bereits erwähnt, nicht über optimierte Umgebungen zum Hören von räumlichem Audio. Mit der Software von Embody können Sie zu verschiedenen binauralen Renderern wechseln – mit und ohne personalisierte HRTFs –, sodass Sie Ihre Aufnahmen so hören können, wie es durchschnittliche Zuhörer tun würden. Die Software umfasst den proprietären binauralen Renderer von Apple Music und kann auch zur Überwachung von Dolby-Binaural mit demselben generischen HRTF verwendet werden, der in Tidal und Amazon Music verwendet wird.

Ich strebe nach dem Gold

Wenn ein Musiklabel einem Streaming-Dienst wie Apple Music oder Tidal einen Titel in Dolby Atmos zur Verfügung stellt, handelt es sich im Allgemeinen nur um eine einzelne Version. Dies stellt Künstler vor ein Dilemma.

Diese Version wurde wahrscheinlich in einem physischen Studio mit einer Atmos-Lautsprecherkonfiguration oder mit Software gemastert, die einen ähnlichen Raum virtualisiert. Doch wie wir oben besprochen haben, können Variablen wie HRTFs und die spezifischen verwendeten binauralen Renderer tiefgreifende Auswirkungen darauf haben, wie diese Titel klingen, wenn Sie sie auf verschiedenen Plattformen anhören.

Ein Künstler könnte versucht sein, seinen Mix so zu optimieren, dass er am besten klingt, wenn er über Amazon Music gestreamt und mit einem generischen HRTF binaural gerendert wird – insbesondere, wenn er glaubt, dass der Großteil seines Publikums am Ende so zuhören wird.

Dies würde jedoch den Klang auf einem vollständigen 7.1.4-Dolby-Atmos-Soundsystem oder sogar auf Apple Music mit personalisiertem HRTF beeinträchtigen.

Da die meisten Künstler weder die Zeit noch das Geld haben, noch einmal ins Studio zu gehen, um ihre Titel nach der Veröffentlichung zu remastern, müssen sie eine Entscheidung treffen: eine Version erstellen, die für das bestmögliche 7.1.4-Hörerlebnis optimiert ist und vertrauen Sie darauf, dass das Kopfhörererlebnis mit der Zeit, wenn Unternehmen wie Apple und Amazon ihre binauralen Renderings und die Unterstützung personalisierter HRTFs verbessern, einfach immer besser wird oder eine Version entsteht, die hinter dem zurückbleibt, was es klingen könnte ein optimierter Kopfhörermix für die Hörer von heute.

Natürlich liegt diese Entscheidung ganz beim Künstler und/oder seinem Label. Allerdings befürchte ich, dass Programme wieApples Spatial-Audio-Bounty einen Anreiz für alle in der Musikbranche schaffen werden, ihre Spatial-Mixe zu beschleunigen, nur um die versprochene finanzielle Belohnung zu erhalten.

Dennoch stehen wir ganz am Anfang einer aufregenden Ära im Audiobereich. Es wird neu definieren, wie Musik gemacht wird und wie sie klingt, wenn wir sie hören – mit oder ohne Kopfhörer.