Ambisonics 101
- Was ist 3D-Audio?
- Was ist Ambisonics?
- Ambisonics vs. Stereo
- Was ist B-Format?
- Signalfluss auf einen Blick
- Typische Setups
- Kopfhörer vs. Lautsprecher
- Wie unterscheidet sich Ambisonics von Immersive Audio, Dolby Atmos und Spatial Audio?
- Einstieg am ICST
- Ambisonische Mikrofone — Einstieg
- Begriffssammlung Ambisonics (Kurzreferenz)
1. Was ist 3D-Audio?
3D-Audio ist der Oberbegriff für Klang, der nicht nur links und rechts, sondern auch vorne, hinten, oben, unten und in der Tiefe wahrgenommen wird. Statt eines flachen Stereobilds entsteht der Eindruck eines umgebenden akustischen Raums.
Ambisonics ist eine spezielle Methode, um 3D-Audio zu erzeugen und zu speichern. Andere Ansätze sind binaurales Audio für Kopfhörer oder objektbasierte Formate wie Dolby Atmos. 3D-Audio ist also die übergeordnete Kategorie, Ambisonics eine konkrete Methode innerhalb davon.
Zwei kurze Hörbeispiele:
2. Was ist Ambisonics?
Ambisonics ist eine formatagnostische Methode, um ein räumliches 3D-Klangfeld zu beschreiben. Statt direkt für ein festes Lautsprecher-Layout zu mischen, arbeitet man mit einer räumlichen Repräsentation, die später für unterschiedliche Wiedergabesysteme gerendert werden kann.
3. Ambisonics vs. Stereo
Stereo ist vertraut: zwei Kanäle, links und rechts. Es erzeugt die Illusion von Klängen, die entlang einer horizontalen Linie zwischen zwei Lautsprechern positioniert sind. Fügt man einen Centerkanal und Surroundlautsprecher hinzu, entsteht 5.1 oder 7.1 — doch jedes Mal, wenn sich das Lautsprecher-Layout ändert, muss von Grund auf neu gemischt werden.
Ambisonics verfolgt einen anderen Ansatz. Statt direkt für ein Lautsprecher-Layout zu mischen, kodiert man zuerst das räumliche Klangfeld als B-Format (siehe Abschnitt 3). Diese Repräsentation erfasst, woher Klang aus der gesamten 3D-Sphäre kommt — links, rechts, vorne, hinten, oben, unten. Die Dekodierung auf konkrete Lautsprecher erfolgt erst später, und dieselbe Datei kann für völlig unterschiedliche Setups dekodiert werden, ohne den Mix anzufassen.
| Stereo | Ambisonics | |
|---|---|---|
| Kanäle | 2 (L / R) | 4 – 64+ (B-Format) |
| Räumliche Reichweite | Links–rechts-Linie | Volle Sphäre (360° × 180°) |
| Lautsprecherabhängigkeit | Fest zum Layout beim Mischen | Später auf jedes Layout dekodierbar |
| Wiederverwendung | Neuer Mix pro Setup | Eine B-Format-Datei → viele Setups |
| Typischer Einsatz | Musik, Rundfunk, Alltagshören | Kunst, Forschung, Installation, Live, Film |
Wann ist Stereo die bessere Wahl? Für die meisten Musikveröffentlichungen, Podcasts und Rundfunkanwendungen bleibt Stereo der Standard — es ist mit jedem Wiedergabesystem kompatibel und erfordert keine speziellen Werkzeuge. Ambisonics lohnt sich, wenn die räumliche Dimension des Klangs künstlerisch oder technisch entscheidend ist, oder wenn man eine einzige Master-Datei benötigt, die verschiedene Wiedergabekontexte bedienen soll.
4. Was ist B-Format?
Das B-Format ist das zentrale Signalformat von Ambisonics und enthält die räumlichen Informationen. Klangquellen werden ins B-Format encodiert und anschließend für ein Ziel-Setup dekodiert, etwa für Kopfhörer, Stereo oder verschiedene Lautsprecher-Arrays.
Es beschreibt einen Raumzustand um einen Hörpunkt herum, der aus Druck- und Richtungsanteilen besteht. In der ersten Ordnung bedeutet das:
Wist die omnidirektionale Komponente, also der Druck bzw. die Präsenz im Raum.X,YundZsind gerichtete Anteile in drei Achsen (vorne-hinten, links-rechts, oben-unten), die angeben, aus welcher Richtung das Signal kommt.
Im engeren, klassischen Sinn bezeichnet “B-Format” dieses vierkanalige Ambisonics-Format erster Ordnung (W, X, Y, Z). Im erweiterten Sinn kann man B-Format auch für höhere Ordnungen verwenden. Dann umfasst es alle Ambisonics-Koeffizienten bis zu einer bestimmten Ordnung, jeweils als eigener Audiokanal.
Dieses Format kann anschließend auf verschiedene Ziel-Setups dekodiert werden, etwa auf Kopfhörer, Stereo oder Lautsprecher-Arrays. 1 2
5. Signalfluss auf einen Blick
Von der Quelle zum Lautsprecher — so funktioniert Ambisonics in REAPER mit den ICST Plugins:
in REAPER
AmbiEncoder
Distanz
Bus
7. Ordnung
AmbiDecoder
Ordnung · Filter
6. Typische Setups
Typische Setups reichen von kleinen Studio-Ringen über Höhenebenen bis hin zu individuellen Arrays im Kompositionsstudio. Dasselbe Ambisonics-Material kann durch Dekodierung an diese verschiedenen Setups angepasst werden.
7. Kopfhörer vs. Lautsprecher
Kopfhörer arbeiten mit binauralem Rendering und sind praktisch für Editing, Translation-Checks und die Zusammenarbeit auf Distanz. Lautsprecher erzeugen ein physisches Klangfeld im Raum und bleiben zentral für Komposition, Tiefenwahrnehmung und künstlerische Bewertung.
8. Wie unterscheidet sich Ambisonics von Immersive Audio, Dolby Atmos und Spatial Audio?
Immersive Audio ist ein Oberbegriff für alle 3D-Audioverfahren, die Klang um — und über — die hörende Person herum platzieren, statt nur links und rechts. Ambisonics, Dolby Atmos und Apple Spatial Audio verfolgen dieses Ziel, aber auf grundlegend unterschiedlichen Wegen.
Ambisonics ist feldbasiert. Das Klangfeld wird als mathematische Repräsentation (B-Format) gespeichert, die unabhängig von einem konkreten Lautsprecher-Layout ist. Dieselbe B-Format-Datei lässt sich später für einen Studio-Ring, eine Konzertkuppel, Kopfhörer oder Stereo dekodieren. Das Wiedergabesystem muss zum Produktionszeitpunkt noch nicht feststehen.
Dolby Atmos und Apple Spatial Audio sind objektbasiert. Einzelne Klangquellen werden als Audio-Objekte mit Positions-Metadaten gespeichert. Ein lizenzierter Renderer (Dolby Atmos Renderer, Apple-Music-Infrastruktur) platziert sie bei der Abgabe in das Zielwiedergabesystem — Kino, Heimkino oder Kopfhörer.
| Ambisonics | Dolby Atmos | |
|---|---|---|
| Räumlicher Ansatz | Feldbasiert (B-Format) | Objektbasiert (Audio + Metadaten) |
| Lautsprecher-Unabhängigkeit | Ja — eine Datei, viele Setups | Nein — Render je Zielsystem |
| Hardware-Abhängigkeit | Frei, offen, beliebiges Lautsprecher-Array | Lizenzierter Dolby-Renderer erforderlich |
| Kopfhörerwiedergabe | Binaural-Decoder (freie Tools) | Dolby Binaural Renderer |
| Typische Tools | ICST Plugins, IEM, ATK | Pro Tools + Dolby Renderer, Logic, Nuendo |
| Kosten | Kostenlos, Open Source | Kommerzielle Lizenz für Distribution |
| Typischer Einsatz | Kunst, Forschung, Installation, Archivierung, Live | Film, Streaming-Musik, Gaming, Consumer-Media |
| Archivierbarkeit | Hoch — B-Format ist formatagnostisch | Mittel — an das Dolby-Ökosystem gebunden |
Wann welches Verfahren: Ambisonics ist die bessere Wahl, wenn Lautsprecher-Unabhängigkeit, offene Archivierung oder künstlerisch-wissenschaftlicher Einsatz im Vordergrund stehen. Dolby Atmos ist der Standard für kommerzielle Streaming-Abgabe (Tidal, Apple Music, Amazon Music) und Film — wer diese Kanäle bedienen muss, kommt an Atmos nicht vorbei.
Beide schliessen sich nicht aus: Manche Workflows produzieren Ambisonics für die Archivierung und den künstlerischen Einsatz und liefern daneben ein separates Dolby-Atmos-Render für das Streaming.
9. Einstieg am ICST
- Für Einsteiger:innen: Quick Start
- Starte mit den ICST Ambisonics Plugins für DAW-Workflows.
- Nutze die ICST Ambisonics Tools für Max/MSP-Workflows.
- Höre in Ascolta und nutze die Hörbeispiele als Referenz.
- Gehe weiter mit den Anleitungen & Tutorials.
Ambisonics 101: Ten Essential Questions Answered
10. Ambisonische Mikrofone — Einstieg
Ein Ambisonics-Mikrofon nimmt das vollständige Klangfeld in einer einzigen Aufnahme auf. Anders als Standard-Stereo- oder Surroundmikrofone verwendet es eine tetraedrische Anordnung von vier (oder mehr) Kapseln und gibt ein Rohformat namens A-Format aus, das vor der Verwendung in der DAW in B-Format konvertiert werden muss.
A-Format und der Enkodierungsschritt
Die meisten tetraedrischen Mikrofone geben A-Format aus: vier rohe Kapselsignale in einer tetraedrischen Geometrie. Diese müssen in B-Format (W, X, Y, Z für erste Ordnung) enkodiert werden, bevor sie in Ambisonics verwendet werden können. Die Enkodierung übernimmt in der Regel die Hersteller-Software — zum Beispiel das SoundField-by-Rode-Plugin, Zylia Studio oder das Sennheiser A-B-Ambisonics-Plugin — oder Tools von Drittanbietern wie Harpex oder der IEM AllRADecoder.
Einige Mikrofone (z. B. der Zoom H3-VR) übernehmen dies intern und geben B-Format direkt aus.
Gängige Mikrofone
| Mikrofon | Ordnung | Kapseln | Ausgabe | Hinweise |
|---|---|---|---|---|
| Zoom H3-VR | 1. | 4 | A- oder B-Format | Einsteigergerät, integrierter Encoder, gut für Feldaufnahmen |
| Sennheiser Ambeo VR Mic | 1. | 4 | A-Format | Weit verbreitet, Enkodierung via Sennheiser A-B-Ambisonics-Plugin |
| Rode NT-SF1 | 1. | 4 | A-Format | SoundField-by-Rode-Software inklusive |
| Core Sound TetraMic | 1. | 4 | A-Format | Bewährtes Gerät, weit verbreitet in Feldaufnahme und Forschung |
| Zylia ZM-1 | 3. | 19 | A-Format | Higher-Order, inkl. Zylia Studio Software, gute Ortsauflösung |
| mh acoustics Eigenmike em32 | 4. | 32 | A-Format | Professionell / Forschung, sehr hohe Ortsauflösung |
Im ICST-Workflow
Jede B-Format-Aufnahme — ob von einem Mikrofon erster Ordnung oder HOA — kann direkt in eine REAPER-Session geladen und mit dem ICST AmbiDecoder dekodiert werden. Bei HOA-Aufnahmen muss die Ambisonics-Ordnung im Decoder mit der Aufnahmeordnung übereinstimmen.
11. Begriffssammlung Ambisonics (Kurzreferenz)
A-Format — Rohsignal eines tetraedrischen Ambisonics-Mikrofons: vier Kapselsignale in tetraedrischer Anordnung. Muss vor der Verwendung in B-Format enkodiert werden. → Wikipedia: Ambisonics
B-Format — Das Ambisonics-Trägersignal: kodiert das räumliche Klangfeld als Kugelflächenfunktionen. Erste Ordnung = 4 Kanäle (W, X, Y, Z); siebte Ordnung = 64 Kanäle. → Wikipedia: Ambisonics | ICST Wiki
ambiX — Standardisiertes Ambisonics-Dateiformat (ACN-Kanalreihenfolge, SN3D-Normierung); De-facto-Standard für HOA-Austausch und -Archivierung. → ambiX Spezifikation (IEM)
Ambisonics-Ordnung — Räumliche Auflösungsstufe: 1st order = 4 Kanäle, 3rd = 16, 7th = 64. Höhere Ordnung bedeutet präzisere Lokalisation und mehr Kanäle. → Wikipedia: Higher-order Ambisonics | ICST AmbiDecoder
Encoder — Wandelt eine Mono-/Stereo-Quelle mit Positionsdaten (Azimut, Elevation, Distanz) in B-Format um. → ICST AmbiEncoder
Decoder — Rendert B-Format auf ein Zielsystem: Lautsprecher-Array oder Binaural. → ICST AmbiDecoder
Channel Count — Anzahl der Kanäle im Ambisonics-Signalpfad; muss im gesamten Routing konsistent bleiben. → ICST Wiki
Speaker Layout — Physische Lautsprechergeometrie, auf die der Decoder das B-Format rendert. → Wikipedia: Ambisonic reproduction systems
Binaural / HRTF — Kopfhörer-Rendering via Head-Related Transfer Functions (HRTFs): simuliert räumliche Richtungswahrnehmung ohne Lautsprecher. Ermöglicht Ambisonics-Abhören auf jedem Kopfhörer. → Wikipedia: Binauraltechnik | Wikipedia: HRTF
Dolby Atmos — Objektbasiertes 3D-Audioformat: Klangquellen werden als Audio-Objekte mit Positions-Metadaten gespeichert; ein lizenzierter Renderer platziert sie im Zielsystem (Kino, Heimkino, Streaming-Dienste). → dolby.com | Wikipedia: Dolby Atmos
OSC (Open Sound Control) — Netzwerkprotokoll (UDP/IP) zur Echtzeitsteuerung räumlicher Parameter. → opensoundcontrol.stanford.edu | ICST AmbiEncoder
Yaw / Pitch / Roll — Rotationsachsen im 3D-Raum: Yaw = horizontal (links/rechts), Pitch = vertikal (oben/unten), Roll = Neigung. → Wikipedia: Eulersche Winkel
Azimut / Elevation — Polarkoordinaten zur Beschreibung von Quellrichtungen: Azimut = horizontaler Winkel (0°–360°), Elevation = vertikaler Winkel (−90° bis +90°). → Wikipedia: Horizontalkoordinatensystem
Passende nächste Artikel: