Raumparameter als kompositorisches Material
Das im vorangegangenen Abschnitt entwickelte Konzept des Spatial Counterpoint begreift Raum als relationales und formbildendes Prinzip musikalischer Organisation. Damit dieser Anspruch über die flüchtige Disposition einer Aufführungssituation hinaus realisierbar wird, ist ein Format erforderlich, das räumliche Beziehungen speicherbar, bearbeitbar und auf unterschiedliche Wiedergabesituationen übertragbar macht. Im Kontext von Ambisonics erfüllt das B-Format diese Funktion: Es ermöglicht, räumliche Konstellationen als abstrakte Struktur zu entwerfen und unabhängig von einem konkreten Wiedergabesystem zu fixieren. 3D-Audio wird damit nicht als nachträgliches Mittel der Klangverteilung verstanden, sondern als gestalterisches Element, das von Beginn an in den kompositorischen Prozess einbezogen ist. Bewegung, Tiefe, Höhe und Verteilung von Klängen erscheinen in dieser Auffassung als Parameter, die im Schreiben und Arrangieren ebenso bewusst behandelt werden wie Tonhöhe, Rhythmus oder Klangfarbe.
Das B-Format als kompositorisches Speichermedium
Das B-Format wurde im Rahmen der von Michael Gerzon entwickelten Ambisonics-Theorie formuliert und dient als zentrales Signalformat zur Codierung räumlicher Audiodaten (Thornton, 2009). Seine mathematische Grundlage liegt in der Beschreibung von Schallfeldern durch sphärische Harmonische, mit deren Hilfe ein Klangfeld um einen Bezugspunkt als gewichtete Summe räumlicher Komponenten dargestellt werden kann (Zotter & Frank, n.d.). Das Format fungiert dabei als Zwischenformat zwischen Aufnahme, Bearbeitung und Wiedergabe: Räumliche Information wird zunächst unabhängig von einem konkreten Wiedergabesystem gespeichert und erst danach für ein bestimmtes Ziel-Setup dekodiert, etwa für Kopfhörer, Stereo, Lautsprecher-Arrays, Virtual-Reality-Anwendungen oder 360-Grad-Videos (Ambisonics: File Formats, 2003). Gerade diese Trennung von Codierung und Wiedergabe ist kompositorisch bedeutsam, weil sie erlaubt, räumliche Strukturen zunächst als abstrakte Relationen zu entwerfen und erst in einem zweiten Schritt an ein konkretes Wiedergabesystem anzupassen.
Im engeren Sinn bezeichnet das B-Format das vierkanalige Ambisonics-Format erster Ordnung mit den Kanälen W, X, Y und Z. W repräsentiert den omnidirektionalen Druckanteil des Schallfelds; X, Y und Z codieren die Richtungsanteile entlang der drei Raumachsen. In ihrer Gewichtung und Relation zueinander bilden sie die Grundlage für die räumliche Verortung von Klangereignissen. Im erweiterten Sinn kann der Begriff auch auf Ambisonics-Formate höherer Ordnung bezogen werden, bei denen zusätzliche Koeffizienten des Schallfelds als separate Audiokanäle vorliegen und eine höhere räumliche Auflösung ermöglichen. Als räumlichen Referenzrahmen verwenden die ICST-Ambisonics-Plugins ein rechtshändiges kartesisches Koordinatensystem, in dem die X-Achse die Links-Rechts-Richtung, die Y-Achse die Vorne-Hinten-Richtung und die Z-Achse die vertikale Dimension beschreibt. Innerhalb dieses Rahmens lassen sich Positionen, Bewegungen und räumliche Relationen eindeutig beschreiben und reproduzierbar festlegen (IEEE 3D Body Processing, n.d.).
Neben dem eigentlichen Signalformat existieren verschiedene Konventionen der Normierung und Kanalanordnung, insbesondere FuMa, SN3D und N3D, die die Übertragbarkeit zwischen unterschiedlichen Systemen regeln. Für aktuelle Produktionszusammenhänge und den Datenaustausch hat sich SN3D/ACN als verbreiteter Standard etabliert; auch die ICST-Ambisonics-Plugins arbeiten seit Version 2 in diesem Format (Schweizerweb, 2023; Ambisonic Data Exchange Formats, n.d.; VRTONUNG, 2024).
Raumparameter als kompositorische Kategorien
Auf der Grundlage des B-Formats lassen sich räumliche Eigenschaften als eigenständige kompositorische Parameter begreifen. Richtungsbeziehungen, Präsenz, Bewegungsverläufe und räumliche Dichte erscheinen damit nicht als nachträgliche Qualitäten der Wiedergabe, sondern als konstitutive Elemente musikalischer Form. Die folgenden Abschnitte bestimmen die einzelnen Parameter und verweisen jeweils auf ihre psychoakustische Grundlage, da die kompositorische Wirksamkeit eines Parameters von seiner wahrnehmbaren Fundierung abhängt.
Azimut. Der Azimut beschreibt die horizontale Position einer Klangquelle im Raum. Kompositorisch ermöglicht er die Organisation von seitlicher Trennung, Annäherung, Kreuzung und Gegenbewegung. Klänge können dadurch nicht nur lokalisiert, sondern in ihrem Verhältnis zueinander strukturiert werden; der Azimut wird so zum Mittel räumlicher Stimmführung. Seine psychoakustische Grundlage liegt im Zusammenwirken von interauralen Zeitdifferenzen (Interaural Time Difference, ITD) und interauralen Pegeldifferenzen (Interaural Level Difference, ILD). ITD bezeichnet den Laufzeitunterschied zwischen beiden Ohren und stellt insbesondere bei tiefen Frequenzen den dominanten Lokalisationshinweis dar; ILD beschreibt den durch den Schallschatten des Kopfes entstehenden Pegelunterschied und ist vor allem bei höheren Frequenzen wirksam (Blauert, 1997). Beide Cues ergänzen sich und bilden die Grundlage der lateralen Lokalisation.
Elevation. Die Elevation bezeichnet die vertikale Position eines Klangereignisses und erweitert die horizontale Organisation des Raums um eine eigenständige Schicht. Kompositorisch kann Höhe dazu dienen, Klangschichten zu trennen, Hierarchien auszubilden oder spezifische räumliche Qualitäten zu erzeugen. Besonders in Ambisonics stellt die vertikale Dimension einen eigenständigen Formparameter dar. Psychoakustisch ist die Höhenwahrnehmung auf Informationen angewiesen, die interaurale Differenzen allein nicht bereitstellen können. Hier sind die individuell geprägten Head-Related Transfer Functions (HRTF) maßgeblich: Kopf, Torso und insbesondere die Ohrmuscheln filtern eintreffenden Schall richtungsabhängig und erzeugen charakteristische spektrale Signaturen, die für die Wahrnehmung von Elevation und für die Auflösung der Vorne-Hinten-Ambiguität entscheidend sind (Blauert, 1997; Begault, 1994). Kompositorisch relevant ist dabei, dass starke spektrale Eingriffe oder ungeeignete Wiedergabebedingungen diese Hinweise abschwächen und damit die vertikale Differenzierung beeinträchtigen können.
Distanz. Die Distanz bestimmt den Grad von Nähe und Ferne einer Klangquelle. Sie wirkt nicht nur als Frage des Pegels, sondern beeinflusst Präsenz, Tiefenstaffelung und perspektivische Wahrnehmung: Nahes kann als unmittelbar, detailliert und körperlich erfahren werden, Entferntes als zurückgenommen oder atmosphärisch. Distanz ist damit zugleich ein akustischer und dramaturgischer Parameter. Psychoakustisch beruht die Distanzwahrnehmung auf mehreren Faktoren: Der physikalische Intensitätsabfall nach dem Abstandsgesetz stellt zwar den naheliegendsten Hinweis dar, ist in musikalischen Zusammenhängen jedoch aufgrund expressiver Pegelvariationen oft nicht ausreichend. Wirkungsvoller ist das Verhältnis von Direktschall zu diffusem Raumanteil: Ein hoher Direktschallanteil wird als Nähe wahrgenommen, ein überwiegender Reflexions- und Nachhallanteil signalisiert Ferne (Rumsey, 2001). Ergänzend wirkt Luftabsorption, die mit wachsender Entfernung bevorzugt hohe Frequenzen dämpft, sowie die zunehmende Unschärfe lateraler Unterschiede bei großen Distanzen (Begault, 1994).
Diffusion. Mit Diffusion ist der Grad der räumlichen Ausdehnung oder Fokussierung eines Klanges gemeint. Ein Klang kann punktuell und präzise erscheinen, als diffuse Wolke im Raum schweben oder sich flächig entgrenzt ausbreiten. Kompositorisch betrifft Diffusion das Verhältnis von Fokus und Unschärfe, von klarer Lokalisierbarkeit und räumlicher Auflösung; sie eignet sich besonders dazu, Übergänge zwischen Objekt- und Feldcharakter zu gestalten. Psychoakustisch entspricht dieser Parameter dem Konzept der Listener Envelopment (LEV): Diffus eintreffender Nachhall erzeugt das Gefühl von Umhüllung und räumlicher Einbettung, während frühe Reflexionen die wahrgenommene Quellbreite (Apparent Source Width, ASW) beeinflussen (Morimoto & Maekawa, 1988; vgl. ergänzende Literatur zur Raumakustikwahrnehmung). Auch die Nachhallzeit und die spektrale Beschaffenheit eines Halls prägen die räumliche Identität und können als eigenständige kompositorische Merkmale behandelt werden.
Bewegung als Form. Raumparameter wirken selten isoliert, sondern meist in Kombination. Bewegungen entstehen durch die zeitliche Veränderung von Azimut, Elevation, Distanz und Diffusion. Dadurch wird Bewegung selbst zu einem formbildenden Prozess: Annäherung, Rotation, Aufstieg, Flucht oder Umkreisung können motivische, dramaturgische und strukturelle Funktionen übernehmen. Räumliche Form entsteht damit aus der zeitlichen Organisation mehrerer miteinander verschränkter Parameter. Psychoakustisch resultiert die Wahrnehmung von Bewegung aus der koordinierten Veränderung mehrerer Cues, insbesondere von ITD, ILD, HRTF-Mustern sowie Distanz- und Hallverhältnissen (Blauert, 1997). Bei schnellen Bewegungen kann zusätzlich der Doppler-Effekt als Bewegungsreiz wirksam werden. Bei binauraler Wiedergabe trägt die eigene Kopfbewegung der Hörenden zur Stabilisierung der Lokalisation bei; fehlt dieser Bezug, etwa bei statischer binauraler Wiedergabe ohne Head-Tracking, kann die externe Verortung instabil werden (Begault, 1994).
Synthese: Raum als System kompositorischer Relationen
Die vorangegangene Analyse zeigt, dass Azimut, Elevation, Distanz, Diffusion und Bewegung nicht als additive Einzelparameter zu verstehen sind, sondern als interdependente Dimensionen eines Systems. Ihre kompositorische Wirksamkeit entfaltet sich in der koordinierten Gestaltung und gegenseitigen Verschränkung: Ein überzeugend gestaltetes 3D-Klangbild setzt voraus, dass mehrere Wahrnehmungshinweise gleichzeitig und konsistent bearbeitet werden. Raum erscheint vor diesem Hintergrund nicht als neutraler Ort der Wiedergabe, sondern als strukturiertes Relationsfeld, dessen Parameter zur Formbildung des Werkes beitragen. Das B-Format schafft die technische Voraussetzung dafür, diese Relationen unabhängig von einem konkreten Wiedergabesystem zu fixieren, zu transformieren und zu übertragen und damit jenen kompositorischen Umgang mit Raum zu ermöglichen, der im Konzept des Spatial Counterpoint als Ausgangspunkt diente.