Ambisonics 101

1. Was ist 3D-Audio?

3D-Audio ist der Oberbegriff für Klang, der nicht nur links und rechts, sondern auch vorne, hinten, oben, unten und in der Tiefe wahrgenommen wird. Statt eines flachen Stereobilds entsteht der Eindruck eines umgebenden akustischen Raums.

Ambisonics ist eine spezielle Methode, um 3D-Audio zu erzeugen und zu speichern. Andere Ansätze sind binaurales Audio für Kopfhörer oder objektbasierte Formate wie Dolby Atmos. 3D-Audio ist also die übergeordnete Kategorie, Ambisonics eine konkrete Methode innerhalb davon.

Zwei kurze Hörbeispiele:

2. Was ist Ambisonics?

Ambisonics ist eine formatagnostische Methode, um ein räumliches 3D-Klangfeld zu beschreiben. Statt direkt für ein festes Lautsprecher-Layout zu mischen, arbeitet man mit einer räumlichen Repräsentation, die später für unterschiedliche Wiedergabesysteme gerendert werden kann.

3. Ambisonics vs. Stereo

Stereo ist vertraut: zwei Kanäle, links und rechts. Es erzeugt die Illusion von Klängen, die entlang einer horizontalen Linie zwischen zwei Lautsprechern positioniert sind. Fügt man einen Centerkanal und Surroundlautsprecher hinzu, entsteht 5.1 oder 7.1 — doch jedes Mal, wenn sich das Lautsprecher-Layout ändert, muss von Grund auf neu gemischt werden.

Ambisonics verfolgt einen anderen Ansatz. Statt direkt für ein Lautsprecher-Layout zu mischen, kodiert man zuerst das räumliche Klangfeld als B-Format (siehe Abschnitt 3). Diese Repräsentation erfasst, woher Klang aus der gesamten 3D-Sphäre kommt — links, rechts, vorne, hinten, oben, unten. Die Dekodierung auf konkrete Lautsprecher erfolgt erst später, und dieselbe Datei kann für völlig unterschiedliche Setups dekodiert werden, ohne den Mix anzufassen.

StereoAmbisonics
Kanäle2 (L / R)4 – 64+ (B-Format)
Räumliche ReichweiteLinks–rechts-LinieVolle Sphäre (360° × 180°)
LautsprecherabhängigkeitFest zum Layout beim MischenSpäter auf jedes Layout dekodierbar
WiederverwendungNeuer Mix pro SetupEine B-Format-Datei → viele Setups
Typischer EinsatzMusik, Rundfunk, AlltagshörenKunst, Forschung, Installation, Live, Film

Wann ist Stereo die bessere Wahl? Für die meisten Musikveröffentlichungen, Podcasts und Rundfunkanwendungen bleibt Stereo der Standard — es ist mit jedem Wiedergabesystem kompatibel und erfordert keine speziellen Werkzeuge. Ambisonics lohnt sich, wenn die räumliche Dimension des Klangs künstlerisch oder technisch entscheidend ist, oder wenn man eine einzige Master-Datei benötigt, die verschiedene Wiedergabekontexte bedienen soll.

4. Was ist B-Format?

Das B-Format ist das zentrale Signalformat von Ambisonics und enthält die räumlichen Informationen. Klangquellen werden ins B-Format encodiert und anschließend für ein Ziel-Setup dekodiert, etwa für Kopfhörer, Stereo oder verschiedene Lautsprecher-Arrays.

Es beschreibt einen Raumzustand um einen Hörpunkt herum, der aus Druck- und Richtungsanteilen besteht. In der ersten Ordnung bedeutet das:

  • W ist die omnidirektionale Komponente, also der Druck bzw. die Präsenz im Raum.
  • X, Y und Z sind gerichtete Anteile in drei Achsen (vorne-hinten, links-rechts, oben-unten), die angeben, aus welcher Richtung das Signal kommt.

Im engeren, klassischen Sinn bezeichnet “B-Format” dieses vierkanalige Ambisonics-Format erster Ordnung (W, X, Y, Z). Im erweiterten Sinn kann man B-Format auch für höhere Ordnungen verwenden. Dann umfasst es alle Ambisonics-Koeffizienten bis zu einer bestimmten Ordnung, jeweils als eigener Audiokanal.

Dieses Format kann anschließend auf verschiedene Ziel-Setups dekodiert werden, etwa auf Kopfhörer, Stereo oder Lautsprecher-Arrays. 1 2

5. Signalfluss auf einen Blick

Von der Quelle zum Lautsprecher — so funktioniert Ambisonics in REAPER mit den ICST Plugins:

Audio-Quelle
Mono-Spur
in REAPER
Plugin-Insert
ICST
AmbiEncoder
Az · El
Distanz
B-Format (ambiX)
B-Format
Bus
64 Kanäle
7. Ordnung
Bus-Receive
ICST
AmbiDecoder
Lsp.-Layout
Ordnung · Filter
Ausgabe
Lautsprecher
oder
Binaural
Mehrere Quellen haben je einen eigenen AmbiEncoder — alle speisen in denselben B-Format-Bus. Das Decoding auf Lautsprecher oder Kopfhörer findet einmalig am Bus-Ausgang statt.

6. Typische Setups

Typische Setups reichen von kleinen Studio-Ringen über Höhenebenen bis hin zu individuellen Arrays im Kompositionsstudio. Dasselbe Ambisonics-Material kann durch Dekodierung an diese verschiedenen Setups angepasst werden.

7. Kopfhörer vs. Lautsprecher

Kopfhörer arbeiten mit binauralem Rendering und sind praktisch für Editing, Translation-Checks und die Zusammenarbeit auf Distanz. Lautsprecher erzeugen ein physisches Klangfeld im Raum und bleiben zentral für Komposition, Tiefenwahrnehmung und künstlerische Bewertung.

8. Wie unterscheidet sich Ambisonics von Immersive Audio, Dolby Atmos und Spatial Audio?

Immersive Audio ist ein Oberbegriff für alle 3D-Audioverfahren, die Klang um — und über — die hörende Person herum platzieren, statt nur links und rechts. Ambisonics, Dolby Atmos und Apple Spatial Audio verfolgen dieses Ziel, aber auf grundlegend unterschiedlichen Wegen.

Ambisonics ist feldbasiert. Das Klangfeld wird als mathematische Repräsentation (B-Format) gespeichert, die unabhängig von einem konkreten Lautsprecher-Layout ist. Dieselbe B-Format-Datei lässt sich später für einen Studio-Ring, eine Konzertkuppel, Kopfhörer oder Stereo dekodieren. Das Wiedergabesystem muss zum Produktionszeitpunkt noch nicht feststehen.

Dolby Atmos und Apple Spatial Audio sind objektbasiert. Einzelne Klangquellen werden als Audio-Objekte mit Positions-Metadaten gespeichert. Ein lizenzierter Renderer (Dolby Atmos Renderer, Apple-Music-Infrastruktur) platziert sie bei der Abgabe in das Zielwiedergabesystem — Kino, Heimkino oder Kopfhörer.

AmbisonicsDolby Atmos
Räumlicher AnsatzFeldbasiert (B-Format)Objektbasiert (Audio + Metadaten)
Lautsprecher-UnabhängigkeitJa — eine Datei, viele SetupsNein — Render je Zielsystem
Hardware-AbhängigkeitFrei, offen, beliebiges Lautsprecher-ArrayLizenzierter Dolby-Renderer erforderlich
KopfhörerwiedergabeBinaural-Decoder (freie Tools)Dolby Binaural Renderer
Typische ToolsICST Plugins, IEM, ATKPro Tools + Dolby Renderer, Logic, Nuendo
KostenKostenlos, Open SourceKommerzielle Lizenz für Distribution
Typischer EinsatzKunst, Forschung, Installation, Archivierung, LiveFilm, Streaming-Musik, Gaming, Consumer-Media
ArchivierbarkeitHoch — B-Format ist formatagnostischMittel — an das Dolby-Ökosystem gebunden

Wann welches Verfahren: Ambisonics ist die bessere Wahl, wenn Lautsprecher-Unabhängigkeit, offene Archivierung oder künstlerisch-wissenschaftlicher Einsatz im Vordergrund stehen. Dolby Atmos ist der Standard für kommerzielle Streaming-Abgabe (Tidal, Apple Music, Amazon Music) und Film — wer diese Kanäle bedienen muss, kommt an Atmos nicht vorbei.

Beide schliessen sich nicht aus: Manche Workflows produzieren Ambisonics für die Archivierung und den künstlerischen Einsatz und liefern daneben ein separates Dolby-Atmos-Render für das Streaming.

9. Einstieg am ICST

Ambisonics 101: Ten Essential Questions Answered


10. Ambisonische Mikrofone — Einstieg

Ein Ambisonics-Mikrofon nimmt das vollständige Klangfeld in einer einzigen Aufnahme auf. Anders als Standard-Stereo- oder Surroundmikrofone verwendet es eine tetraedrische Anordnung von vier (oder mehr) Kapseln und gibt ein Rohformat namens A-Format aus, das vor der Verwendung in der DAW in B-Format konvertiert werden muss.

A-Format und der Enkodierungsschritt

Die meisten tetraedrischen Mikrofone geben A-Format aus: vier rohe Kapselsignale in einer tetraedrischen Geometrie. Diese müssen in B-Format (W, X, Y, Z für erste Ordnung) enkodiert werden, bevor sie in Ambisonics verwendet werden können. Die Enkodierung übernimmt in der Regel die Hersteller-Software — zum Beispiel das SoundField-by-Rode-Plugin, Zylia Studio oder das Sennheiser A-B-Ambisonics-Plugin — oder Tools von Drittanbietern wie Harpex oder der IEM AllRADecoder.

Einige Mikrofone (z. B. der Zoom H3-VR) übernehmen dies intern und geben B-Format direkt aus.

Gängige Mikrofone

MikrofonOrdnungKapselnAusgabeHinweise
Zoom H3-VR1.4A- oder B-FormatEinsteigergerät, integrierter Encoder, gut für Feldaufnahmen
Sennheiser Ambeo VR Mic1.4A-FormatWeit verbreitet, Enkodierung via Sennheiser A-B-Ambisonics-Plugin
Rode NT-SF11.4A-FormatSoundField-by-Rode-Software inklusive
Core Sound TetraMic1.4A-FormatBewährtes Gerät, weit verbreitet in Feldaufnahme und Forschung
Zylia ZM-13.19A-FormatHigher-Order, inkl. Zylia Studio Software, gute Ortsauflösung
mh acoustics Eigenmike em324.32A-FormatProfessionell / Forschung, sehr hohe Ortsauflösung

Im ICST-Workflow

Jede B-Format-Aufnahme — ob von einem Mikrofon erster Ordnung oder HOA — kann direkt in eine REAPER-Session geladen und mit dem ICST AmbiDecoder dekodiert werden. Bei HOA-Aufnahmen muss die Ambisonics-Ordnung im Decoder mit der Aufnahmeordnung übereinstimmen.


11. Begriffssammlung Ambisonics (Kurzreferenz)

  • A-Format — Rohsignal eines tetraedrischen Ambisonics-Mikrofons: vier Kapselsignale in tetraedrischer Anordnung. Muss vor der Verwendung in B-Format enkodiert werden. → Wikipedia: Ambisonics

  • B-Format — Das Ambisonics-Trägersignal: kodiert das räumliche Klangfeld als Kugelflächenfunktionen. Erste Ordnung = 4 Kanäle (W, X, Y, Z); siebte Ordnung = 64 Kanäle. → Wikipedia: Ambisonics | ICST Wiki

  • ambiX — Standardisiertes Ambisonics-Dateiformat (ACN-Kanalreihenfolge, SN3D-Normierung); De-facto-Standard für HOA-Austausch und -Archivierung. → ambiX Spezifikation (IEM)

  • Ambisonics-Ordnung — Räumliche Auflösungsstufe: 1st order = 4 Kanäle, 3rd = 16, 7th = 64. Höhere Ordnung bedeutet präzisere Lokalisation und mehr Kanäle. → Wikipedia: Higher-order Ambisonics | ICST AmbiDecoder

  • Encoder — Wandelt eine Mono-/Stereo-Quelle mit Positionsdaten (Azimut, Elevation, Distanz) in B-Format um. → ICST AmbiEncoder

  • Decoder — Rendert B-Format auf ein Zielsystem: Lautsprecher-Array oder Binaural. → ICST AmbiDecoder

  • Channel Count — Anzahl der Kanäle im Ambisonics-Signalpfad; muss im gesamten Routing konsistent bleiben. → ICST Wiki

  • Speaker Layout — Physische Lautsprechergeometrie, auf die der Decoder das B-Format rendert. → Wikipedia: Ambisonic reproduction systems

  • Binaural / HRTF — Kopfhörer-Rendering via Head-Related Transfer Functions (HRTFs): simuliert räumliche Richtungswahrnehmung ohne Lautsprecher. Ermöglicht Ambisonics-Abhören auf jedem Kopfhörer. → Wikipedia: Binauraltechnik | Wikipedia: HRTF

  • Dolby Atmos — Objektbasiertes 3D-Audioformat: Klangquellen werden als Audio-Objekte mit Positions-Metadaten gespeichert; ein lizenzierter Renderer platziert sie im Zielsystem (Kino, Heimkino, Streaming-Dienste). → dolby.com | Wikipedia: Dolby Atmos

  • OSC (Open Sound Control) — Netzwerkprotokoll (UDP/IP) zur Echtzeitsteuerung räumlicher Parameter. → opensoundcontrol.stanford.edu | ICST AmbiEncoder

  • Yaw / Pitch / Roll — Rotationsachsen im 3D-Raum: Yaw = horizontal (links/rechts), Pitch = vertikal (oben/unten), Roll = Neigung. → Wikipedia: Eulersche Winkel

  • Azimut / Elevation — Polarkoordinaten zur Beschreibung von Quellrichtungen: Azimut = horizontaler Winkel (0°–360°), Elevation = vertikaler Winkel (−90° bis +90°). → Wikipedia: Horizontalkoordinatensystem


Passende nächste Artikel: