Audioglossar – maximilian-kock.de

Dieses Glossar ist ein Produkt meiner Lehre als Professor für Audioproduktion an der Ostbayerischen Technischen Hochschule Amberg-Weiden. Alle Einträge stammen ursprünglich von meinen Studierenden der Medienproduktion und Medientechnik. Einige Fachbegriffe sind mit entsprechenden Erklärvideos verlinkt. Diese Videos sind zum Teil im Rahmen von Bachelor- und Masterabschlussarbeiten entstanden.

Das Glossar wird laufend aktualisiert und erweitert.

A

Abstandsgesetz – Es sagt aus, dass Feldgrößen wie z.B. Schalldruck um den Faktor 1/r beim Abstand r, Energiegrößen wie z.B. Schallleistung um 1/r² beim Abstand r reduziert werden: Beim (doppelten) Abstand 2r ist nur noch 1/4 der ursprünglichen Energie auf der gleichen Kugeloberfläche, beim Abstand 3r nur noch 1/9 vorhanden.

Ampere – siehe I (Stromstärke)

Amplitude – Die maximale Auslenkung einer Schallschwingung stellt die Amplitude dar, die in den meisten Fällen als Messwert angegeben wird.

Achtercharakteristik – Ein Mikrofon mit Achtercharakteristik ist ein Druckgradientenempfänger und erfasst Schallwellen von vorne und (phasengedreht um 180⁰) von hinten. Seitlich nimmt es keinen Schall auf. Bei tiefen Frequenzen kommt es zu einem akustischen Kurzschluss, da tieffrequente Kugelwellen die Mikrofonmembran von allen Seiten umschließen und deshalb diese nicht oder kaum ausgelenkt wird.

ADR (Automated Dialog Replacement) – Ein professionelles Nachproduzieren der original am Filmset aufgenommenen Dialoge nachträglich in einem Tonstudio. So werden Störgeräusche vermieden und die Sprachqualität der Filmdialoge optimiert. Der Produktionsprozess ist dem der Dialog-Synchronisation (in einer Fremdsprache) identisch. Daher stellt die Herstellung einer synchronisierten Tonfassung eine spezielle Form des ADR dar. Die Entscheidung ADR einzusetzen, kann die generelle Klangatmosphäre und das Original-Sounddesign eines Films wesentlich verändern, deswegen wird sie von vielen Filmproduzenten und -regisseurinnen nicht immer eingesetzt.

Akustischer Kurzschluss – Ein akustischer Kurzschluss führt zu einer Dämpfung besonders von tiefen Frequenzen. Wenn eine Lautsprechermembran schwingt, erzeugt sie auf ihrer Vorder- und Rückseite Schallwellen, die sich aufgrund ihrer gegenphasigen Druckzustände auslöschen können: Bei tiefen Frequenzen kann die Luft zum Druckausgleich so hin und her strömen, dass sich die gegenläufigen Schallwellen auslöschen und damit hauptsächlich die tieffrequenten Töne nicht wiedergegeben werden. Dies kann durch ein rundherum geschlossenes Gehäuse oder eine großflächige Schallwand verhindert werden. Der akustische Kurzschluss tritt häufig bei Druckgradientenempfängern auf. Trifft ein tiefer Ton mit gleichem Schalldruck auf beiden Seiten der Membran auf, wird diese nicht oder nur gering ausgelenkt.

Ampere – siehe I (Stromstärke)

Audiodesign – Die generelle kreative Gestaltung einer Tonspur mit Audioelementen wie Musik, Soundeffekten und Sprache, im Prinzip gleichzusetzen mit dem Begriff Sounddesign, wobei letzteres eher als Geräuschdesign verstanden wird.

Audiologo – Ein kurzes klangliches Ton- oder auch Geräusch-Leitmotiv, das als akustischer Stellvertreter für eine Firma, ein Produkt und/ oder dessen kommunikative Markenkernwerte steht.

Audiopostproduktion – Der generelle Prozess der (Nach-) Bearbeitung von Audioaufnahmen oder Audiomaterial durch Schneiden, Anordnen, Filtern, Mischen sowie Hinzufügen von künstlichen Räumen (Hall) und von digitalen Effekten. Meistens erfolgt dies mit einer Audiopostproduktions-Software, wie zum Beispiel ProTools, Logic, FL Studio, Cubase, Studio One und andere.

Autotune – siehe Gesangsproduktion

B

Basilarmembran – Die Basilarmembran ist das eigentliche Hörorgan im menschlichen Innenohr. Die vom ovalen Fenster zu Schwingungen angeregte Lymphflüssigkeit bewegt kleine Härchen mit Nervenzellen auf der Basilarmembran. Die Nervenzellen wandeln die Bewegung in Nervenimpulse um und transferieren diese zum Gehirn.

Bearbeitung in der Zeit – Durch Hall oder eine zeitliche Verzögerung des Signals (Delay) entsteht Räumlichkeit, diese schafft den Eindruck von Tiefe im Klangbild. Effekte wie Hall und Delay helfen dabei, die örtliche Position von einem Audiosignal im Raum zu definieren. So lässt sich eine akustische Distanz erzeugen, um eine räumliche Atmosphäre zu schaffen.

Bearbeitung im Pegel – Eine Bearbeitung im Pegel beschreibt die Anpassung der Lautstärke eines Audiosignals zur Optimierung der Gesamtbalance einer Tonmischung. Ziel ist es, Pegelspitzen zu korrigieren und leise Passagen anzuheben, um Konsistenz im Ton zu gewährleisten. Dabei ist zu beachten, dass unser Hörapparat in einem Audiokanal gleichzeitig nur das jeweils lauteste Audiosignal wahrnehmen kann. Andere Audiosignale werden von einem lauteren verdeckt.

Bearbeitung im Spektrum – Eine Bearbeitung im Spektrum bezeichnet das gezielte Verändern und Optimieren des Frequenzspektrums eines Audiosignals. Das Frequenzspektrum beschreibt die Verteilung der verschiedenen Frequenzen (von tiefen Bässen bis zu hohen Höhen) innerhalb eines Signals. Die spektrale Bearbeitung erfolgt meist durch den Einsatz von Equalizern (EQs), Filtern und ähnlichen Werkzeugen, um bestimmte Frequenzbereiche zu betonen, abzuschwächen oder zu entfernen. Auf diese Weise erstellt man für jedes Instrument seinen spezifischen Frequenzbereich innerhalb einer Tonmischung.

Bearbeitung bei mehreren Kanälen (Panning in Stereo) – Das Panning ( d.h. das Arbeiten mit dem Panoramapotentiometer) verteilt ein Audiosignal in einem Stereo- oder einem Mehrkanalsystem. Durch ein gezieltes Panning wird eine breite und klare Klangbühne erzeugt, die die einzelnen Audiosignale der Mischung voneinander abhebt. So kann ein Audiosignal in einem Stereosystem zwischen extrem links und extrem rechts positioniert werden. Die akustische Tiefenstaffelung eines Audiosignals wird allerdings dabei mit der Bearbeitung in der Zeit umgesetzt.

Binaural (Binaurales Hören) – wortwörtlich für beid-ohrig: Die Fähigkeit unseres Hörapparats, Räumlichkeit wahrzunehmen und die Distanzen von Schallquellen zu bestimmen. Voraussetzung hierfür ist ein möglichst gleiches Hörvermögen auf beiden Ohren. Der akustische Raum sowie die Entfernung und Lokalisation einer Schallquelle werden durch die Kombination von Laufzeit-, Pegel- und Frequenzunterschieden zwischen beiden Ohren wahrgenommen bzw. ermittelt.

C

c (Schallgeschwindigkeit) – c ist das Formelzeichen für die Schallgeschwindigkeit. Sie beträgt in 20 Grad Celsius warmer trockener Luft gerundet 340 m/s.

Cocktailpartyeffekt – Dieser Effekt der binauralen Abgrenzung eines Nutzsignals vom lärmenden Umfeld (Störsignal) ist beispielsweise elementar für das Verstehen eines Gesprächs in einer lauten Umgebung, wie in einer Gaststätte oder in einer Diskothek. Diese Fähigkeit des Hörenden basiert einerseits auf den Prinzipien der Gestaltpsychologie (Klangfarbe, Gesetz der Kontinuität, Gesetz der Ähnlichkeit [Metzger, 1999]), andererseits auf psychoakustischen Erkenntnissen. Mit zunehmendem Alter des Hörenden lässt der Cocktailparty-Effekt bei den meisten Menschen nach.

Cone of Confusion – Ein Bereich des Hörens, der einen Kegel mit seiner Spitze in der Kopfmitte beginnend beschreibt, in dem aufgrund von geringen bzw. keinen Unterschieden in Laufzeit, Pegel und Frequenz eine Lokalisation einer Schallquelle nicht möglich ist, siehe auch „binaural“ und Bild 2.1. Erst durch ein leichtes Drehen und Neigen des Kopfes (Peilen) können wir den Ort einer Schallquelle exakt bestimmen. Dieses Peilen ist allerdings bei binauralen Audioproduktionen für Kopfhörerwiedergabe nicht möglich, weil der Kopfhörer beim Drehen und Neigen des Kopfes mitbewegt wird.

D

DAW – Eine DAW (Digital Audio Workstation) ist ein digitales System zur Aufnahme, Bearbeitung, Mischung und Produktion von Audiosignalen. Es verbindet spezielle Software mit hochwertiger Hardware wie Audiokarten und wird für Musikproduktionen, Tonaufnahmen und Mastering sowie für das Filmsounddesign verwendet. Hier als ein DAW-Beispiel der Link zu einem Erklärvideo zur Erstellung einer Sounddesign-Session in ProTools.

Deesser – sieheGesangsproduktion

deziBel (dB) – deziBel ist die Bezeichnung für das logarithmische Verhältnis zweier (Mess-)Größen. Ein deziBel entspricht einem Zehntel eines Bels (B). Beim Schalldruck wird das Verhältnis im 10er-Logarithmus dargestellt: Ein zehnfacher Schalldruck entspricht dabei einer Erhöhung um 20dB. Ein hundertfacher Schalldruck entspricht 40dB.

Diegetischer Ton (Diegese) – Diegetisch/ nicht-diegetisch/ extradiegetisch: die auditive Gestaltung einer Tonspur durch die Tonelemente Musik, Geräusche und Sprache, die sich aus der narrativen Handlung in der Filmszene erklärt: z. B. das diegetische Vertonen des Abstellens einer Tasse. Die nicht-diegetische Tongestaltung bedeutet die Integration von Tonelementen außerhalb der sichtbaren Filmhandlung, wie zum Beispiel das Öffnen einer Tür, die nicht im Bild zu sehen ist. Weitere nicht-diegetische Klangereignisse sind beispielsweise Hundegebell, Vogelgezwitscher oder ähnliches, das der Protagonist in der Filmszene häufig selbst nicht hören kann. Nicht-diegetische Tonelemente sollten sich aber aus der Filmhandlung logisch deuten lassen. Filmmusik ist mit wenigen Ausnahmen (z.B. in Musikfilmen) ein nicht-diegetisches, besser noch ein extra-diegetisches Tonelement.

Direktschall – Direktschall ist der Schall, welcher in einem geschlossenen Raum als erstes am Hör- oder Messort eintrifft, ohne zwischenzeitlich Schallreflexionen erfahren zu haben. Mithilfe des Direktschalls lokalisiert unser Gehör im Abgleich mit dem Diffusschall eine Schallquelle und ist somit für ihre Richtungs- und Abstamdsbestimmung maßgeblich.

Druckempfänger – Ein Druckempfänger ist ein Mikrofon, das Schallwellen in elektrische Signale umwandelt. Dazu bewegt der Schalldruck eine Membran, deren Schwingungen je nach Mikrofontyp in Spannung übersetzt werden. Diese Mikrofone reagieren primär auf Schalldruck und eignen sich für vielseitige Anwendungen in der Akustik. Die Rückseite der Membran ist dabei, von einem kleinen Röhrchen für den Druckausgleich, von dem Umfeld in einer Kapsel akustisch isoliert, so dass der Druckunterschied zwischen innen und außen gemessen werden kann. Druckempfänger weisen daher prinzipiell immer eineKugelcharakteristikauf.

Druckgradientenempfänger – Ein Druckgradientenempfänger ist ein Mikrofon, das auf den Unterschied desSchalldruckszwischen Vorder- und Rückseite der Membran, also den Druckgradienten, reagiert. Dadurch nimmt es Schallwellen bevorzugt aus einer bestimmten Richtung auf und blendet Schall aus anderen Richtungen aus. Dieser gerichtete Aufnahmecharakter ist ideal für Anwendungen wie Sprachproduktionen oder eine Nahmikrofonierung von Musikinstrumenten. Normalerweise haben Druckgradienten eine Achtercharakteristik. Fügt man akustische Dämpfungsglieder hinzu, erhält man eine Nierencharakteristik.

Dynamisches Mikrofon – Ein dynamisches Mikrofon wandelt den Luftschall mithilfe einer beweglichen Spule und eines Magneten durch magnetische Induktion in ein elektrisches Signal um. Mikrofone mit einem dynamischen Wandler sind robust, vielseitig und eignen sich gut für laute Schallquellen.

E

Elektretmikrofon – Ein Elektretmikrofon ist ein Kondensatormikrofon, bei dem eine dauerhaft elektrisch geladene Folie (das Elektret) als Spannungsquelle dient, sodass keine externe Versorgungsspannung (wie z.B. eine Phantomspeisung) nötig ist. Das Elektretmikrofon wandelt Schalldruck in elektrische Spannung um, meist mit einer Kugel-oder Nierencharakteristik.

Erste Reflexion – Der akustische Eindruck eines Raumes setzt sich aus dem empfangenen Direktschall, der einzeln wahrnehmbaren Erstreflexionen („Echo“) und dem aus vielen Einzelreflexionen bestehenden Raumhall zusammen. Die zeitliche Verzögerung, mit der die ersten Reflexionen am Ohr eintreffen, lässt uns darauf schließen, wie groß ein Raum ungefähr ist.

Equalizer – Ein Equalizer (EQ) besteht häufig aus mehreren Filtern (sogenannten Bändern), mit denen verschiedene Frequenzbereiche gezielt angehoben oder abgesenkt werden können. EQs dienen vor allem der Klanggestaltung, der Korrektur und der Anpassung eines Signals. Man benutzt ihn, um Bass-, Mitten- oder Höhenfrequenzen zu verändern oder auch um störende Resonanzen zu entfernen. Sieheauch Gesangsproduktion undFilterung.

Extra-diegetisch – Ein typisches, extra-diegetisches Soundtrack-Element ist die Filmmusik, siehe auch diegetischer Ton (Diegese).

F

Filterung – Filterung bezeichnet die gezielte Veränderung eines Audiosignals, indem bestimmte Frequenzbereiche abgeschwächt, verstärkt oder vollständig entfernt werden. Dies geschieht durch Filter wie Tiefpass-, Hochpass-, Bandpass- oder Bandsperr-Filter, die jeweils nur einen bestimmten Teil des Frequenzspektrums durchlassen oder beeinflussen. Siehe auch Equalizer undGesangsproduktion.

Formanten – Formanten sind spezifische Frequenzbereiche, in denen sich die Amplituden der Obertöne durch die Resonanz des Klangkörpers besonders stark verstärken. Diese Maxima im Spektrum werden maßgeblich durch die jeweilige Bauweise und Struktur des Instruments oder der Stimme bestimmt. Dadurch prägen Formanten den Klangcharakter und sorgen für die individuelle Klangfarbe.

Fouriertransformation – Die Fouriertransformation ist ein mathematisches Verfahren ein Tonsignal in seine einzelnen Frequenzkomponenten zu zerlegen, um seine periodischen oder harmonischen Schwingungsanteile zu ermitteln und zu analysieren. Das Verfahren ist eine Transformation des Signals von der Zeit- in die Frequenzebene.

Frequenz – Die Frequenz f gibt die Anzahl der Schwingungen pro Sekunde an und entspricht damit dem Kehrwert der Periodendauer T (f = 1 / T). Die Frequenz wird in der Einheit Hertz (1Hz = 1/s) angegeben. Sie entspricht außerdem dem Quotient aus der Schallgeschwindigkeit c und der Wellenlänge λ (f = c / λ). Bei Schallwellen bestimmt die Frequenz die Tonhöhe eine Tons, niedrigere Frequenzen bedeuten tiefere Töne, höhere Frequenzen höhere Töne. Der Kammerton A liegt zum Beispiel bei 440Hz.

Frequenzgruppe – Eine Schallwelle wird auf der Basilarmembran des Innenohrs in 24 einzelne Frequenzbereiche (Frequenzgruppen) zerlegt. Die Frequenzgruppen haben eine unterschiedliche Bandbreite: von 100 Hz im tieffrequenten Hörbereich bis zu 3,5 kHz im hochfrequenten Hörbereich. Pro Frequenzgruppe kann nur ein Hörereignis gleichzeitig von unserem Hörapparat verarbeitet werden. Dies ist für psychoakustische Anwendungen wie Audiodatenreduktionsverfahren (mp3-Codierung) relevant.

Frequenzspektrum – Die Darstellung aller in einem Audiosignal vorkommenden Frequenzen in ihren Amplituden, das heißt in ihren Lautstärkepegeln. Mit Hilfe ihres Spektrums können Klangquellen identifiziert werden. Allerdings reicht dafür das Spektrum alleine häufig nicht aus. Auch der zeitliche Verlauf (die Hüllkurve) eines Audiosignals ist für dessen Klangfarbe und damit dessen Wiedererkennung wichtig. Nach den Gesetzen der Gestaltpsychologie werden Klangquellen aufgrund ihrer einmal gelernten akustischen Gestalt wiedererkannt.

G

Geräusche – Geräusche bestehen aus nicht-periodischen Schwingungen. Ein Geräusch enthält ähnlich wie Rauschen daher keine Grund- oder Obertöne. Eine Tonhöhe ist bei Geräuschen daher nicht wahrnehmbar.

Gesangsproduktion für Popmusik – Die professionelle Nachbearbeitung einer Gesangsaufnahme in der Popmusik mit Tonhöhenkorrektur (Autotune), Kompression, Equalizer (Filter), Deesser und Reverb (Hall).

Gestalt – (Audiovisuelle) Wahrnehmung von Einzelereignissen oder Einzelteilen als eine subjektiv gruppierte Gesamtheit mit neuer Aussage und Bedeutung, wie zum Beispiel die (auditive) Gestaltwahrnehmung einer achtstufigen Dur-Tonleiter mit dem siebten Ton als Leitton und dessen Übergang zum oktavierten Grundton als Schlusston.

Grundton – Der Grundton ist der erste und somit tiefste Teilton eines Klangs (Tons). Er besitzt die niedrigste Frequenz (Grundfrequenz) aller Teiltöne (Grund- und Obertöne) und legt daher die Tonhöhe fest.

H

Hall – siehe Nachhall

Hallradius – Der Hallradius ist die Entfernung zu einer Schallquelle, bei welcher Direktschall und Raumschall gleich groß sind. Ein Sprecher außerhalb des Hallradius kann nicht mehr deutlich verstanden werden, da die Raumreflexionen vor dem Direktschall beim Hörer ankommen.

Harmonische Schwingung – Harmonische Schwingungen können in ihrem Verlauf durch eine Sinusschwingung beschrieben werden, also als ein Ton zu hören sind. Es sind ebenso Schwingungen, die in einem ganzzahligem Schwingungsverhältnis zu einer Grundschwingung stehen. Im musikalischen Kontext ist das zum Beispiel ein Grundton mit seinen (harmonischen) Obertönen. Harmonische Schwingungen sind periodisch, d.h. sie können in Frequenz (Wellenlänge) und Amplitude (Lautstärke) beschrieben werden.

Hörebene – Über die drei Hörebenen der Pegel-, Laufzeit- und Frequenzunterschiede nehmen wir unser akustisches Umfeld dreidimensional mit beiden Ohren binaural wahr, können den Ort und die Distanz von Schallquellen bestimmen sowie die Größe und die akustische Beschaffenheit von Räumen beurteilen. In der Audiopostproduktion kommt noch eine vierte Hörebene der Anzahl der technischen Audiokanäle hinzu, z.B. eine stereofone oder eine Mehrkanal-Übertragung.

Hörschwelle – Die Hörschwelle ist die untere Schalldruckgrenze des Menschen. Nur oberhalb derer ist eine akustische Wahrnehmung möglich. Diese Schalldruckgrenze ist nicht über den Hörfrequenzbereich von 20Hz bis 20kHz gleich. Sie ist bei 2kHz mit 0dB definiert. 0dB entsprechen einem Schalldruck von 20μP. Unterhalb und oberhalb von 2kHz steigt die Hörschwelle an.

Hüllkurve – Der Lautstärkeverlauf über die Klangzeitdauer eines musikalischen Tons. Die Hüllkurve lässt sich sinnvollerweise in die zeitlich aufeinander folgenden Abschnitte Anstieg (Attack), Abfall nach dem ersten Lautstärkemaximum (Decay), Halten (Sustain) und Freigeben, Loslassen z. B. der Klaviertaste (Release) unterteilen, siehe auch Bild 4.2. Für Synthesizer gibt es sogenannte ADSR-Module, die eine Hüllkurve elektronisch nachbauen.

I (Stromstärke) – siehe Stromstärke

Immersion – Das akustische Einhüllen der Zuhörenden, sie fühlen sich von Sound (am besten dreidimensional) umgeben, sie können so in das audiovisuelle Geschehen eintauchen.

Intensität – siehe Schallintensität

J

Joule – Joule ist die Einheit der Schallenergie.

K

Kammfiltereffekt – Der Kammfiltereffekt tritt auf, wenn Schall mit sich selbst innerhalb kurzer Zeitabstände überlagert wird. Das geschieht entweder durch Reflexion, beispielsweise an einer schallharten Wand, oder durch das Verwenden mehrerer Mikrofone, bei denen eine von einer Schallquelle ausgehende Schallwelle nach unterschiedlichen Schalllaufzeiten eintrifft und die dann im Mischpult zeitgleich addiert werden. Der Kammfiltereffekt kann zu einem seltsam „dünnen“ und „roboterartigem“ Klang führen, welcher allerdings auch – bewusst angewendet – als ein gestalterisches Stilmittel eingesetzt werden kann.

Klang – Ein Klang setzt sich aus einem (Grund-) Ton und seinen Obertönen, Transienten und Geräuschen zusammen. Ein Klang kann aber gleichzeitig auch aus mehreren Tönen bestehen.

Klangfarbe – Die Klangfarbe eines Tons wird vornehmlich aus den normalerweise mit der steigenden Frequenz im Pegel abnehmenden Obertönen gebildet und geformt. Der Grundton dagegen ermöglicht und dominiert die Wahrnehmung der Tonhöhe eines Klangs.

Kompression – Eine Audiokompression verringert die Lautstärkeunterschiede eines Signals (Dynamikkompression). Ein Audiokompressor macht laute Stellen leiser und hebt in einem zweiten Bearbeitungsschritt den Gesamtpegel anschließend wieder an (Gain), sodass der Klang in seiner Lautstärkegleichmäßiger, weniger dynamisch und somit besser im Mix hörbar wird. Durch eine Kompression des Audiosignals lassen sich Übersteuerungen vermeiden und Instrumente oder Vocals bekommen mehr akustische Präsenz in der Audiomischung. Siehe auch Gesangsproduktion.

Kondensator – Ein zentrales Bauelement im Kondensatormikrofon. Der Kondensator wird durch eine Phantomspeisung (48 Volt) elektrisch geladen, siehe elektrische Ladung Q. Eine Platte des Kondensators ist die Mikrofonmembran. Die durch Schallwellen veränderte Plattendistanz führt zu einer Kapazitätsänderung des Kondensators. Diese Änderung wird als Spannungsänderung zum Mischpultmikrofonverstärker übertragen.

Kondensatormikrofon – Ein Kondensatormikrofon verwandelt über die Abstandänderung zwischen Membran und Gegenelektrode (-> Kondensator) mittels Kapazitätsänderung den Luftschall in ein elektrisches Signal um. Das Kondensatormikrofon benötigt für die Umwandlung eine Phantomspeisung von 48V. Es wird vornehmlich bei Studioaufnahmen verwendet und eher selten in der Beschallungstechnik. Das Kondensatormikrofon weist über den Hörfrequenzbereich ein nahezu lineares Übertragungsverhalten auf.

Konsonanten – Konsonanten (=„Mitlaute“) sind beispielsweise die Buchstaben B, K, P, S, T oder N (im Deutschen gibt es insgesamt 21 Konsonanten und 8 Vokaleinklusiv der Umlaute). Der menschliche Stimmtrakt wird bei der Artikulation der Konsonantenlaute verengt. Deshalb sind Konsonanten nur in Kombination mit einem Vokalaussprechbar, z.B. „Ka“, „Pe“, „eS“. Konsonanten sind folglich nicht singbar und sind im Gegensatz zu den VokalenGeräusche.

Kugelcharakteristik – Die Kugel zählt zur ungerichteten Variante der Richtcharaktetistiken. Durch eine kugelförmige (omnidirektionale) Erfassung des Schalls erhält man eine originalgetreue akustische Abbildung eines Raumes. Mit einem Mikrofon mit Kugelcharakteristik (= Druckempfänger) werden (theoretisch) alle Frequenzen aus jeder Richtung mit gleicher Intensität aufgenommen. Allerdings kann die Kugelcharakteristik damit auch störende Umgebungsgeräusche einfangen.

Kunstkopf –

L

Ladung (elektrische Ladung Q) – siehe Q

Lautstärke (Schalldruckpegel L) – Die Lautstärke eines Schallereignisses wird hauptsächlich durch den Schalldruckpegel L bestimmt. Der Schalldruck wird in P (Pascal) gemessen, der Schalldruckpegel in dB.

Lautheit (in sone, empfundene Lautstärke) – Die Lautheit ist die psychoakustische Einheit der physikalisch definierten Lautstärke. Ein lautes Ereignis wird nämlich je nachdem, ob man vorher ein lauteres oder ein leiseres Tonereignis wahrnimmt, unterschiedlich laut empfunden. Auch die Dauer eines Tons beeinflusst unser Lautheitsempfinden. Ein Geräusch oder ein Ton mit der Lautstärke 40 phon wird als Lautheit 1 sone festgelegt. Eine Erhöhung um 10 phon bedeutet eine subjektive Verdopplung der Lautheit: 40 phon entspricht 1 sone; 50 phon entspricht 2 sone.

In der Praxis wird die Lautheit eines Schallereignisses aus den Teillautheiten von 24 Frequenzgruppen berechnet:

gehörbezogene Bandpassfilterung in 24 Frequenzgruppen (in Bark)
Bildung der 24 Teillautheiten
Berechnung der Gesamtlautheit durch Integration

Mathematisch ausgedrückt:

_24Bark

N = ∫ N’(z) dz

⁰

M

Mikrofonierung – Die für das gewünschte Klangerlebnis passende Positionierung und Auswahl der Mikrofone und deren Richtcharakteristiken.

Mischpult – Ein Mischpult ist ein elektronisches Gerät, das dazu verwendet wird, mehrere Audiosignale zu kombinieren, zu steuern und in Pegel, Frequenzund Timing anzupassen. Es ermöglicht das Mischen, Bearbeiten und Ausgeben von Tönen, um eine ausgewogene Klangqualität zu erzielen. Es wird in der Audiopostproduktion, im Sendebetrieb sowie in der Veranstaltungstechnik eingesetzt.

Musik – Musik besteht hauptsächlich aus harmonischen, periodischen Schwingungen, die unser Ohr als ein Klangereignis aus Grund- und Obertönen wahrnimmt. Neben den periodischen Schwingungen sind aber auch nicht-periodische Schwingungsanteile (Geräusche) in einem Musiksignal wahrnehmbar.

N

Nachhall – Nachhall beschreibt das Nachklingen des Schalls in einem Raum, nachdem die Schallquelle verstummt ist. Der Nachhall setzt sich aus den Reflexionen von Schallwellen an den Oberflächen von Wänden, Decken und Böden und anderen Objekten im Raum. Die Form und Dauer des Nachhalls hängt von der Raumgeometrie, der Raumgröße und den Absorptionseigenschaften der Oberflächen im Raum ab. Siehe auch Erste Reflexion.

Nachhallzeit – Die Nachhallzeit T₆₀ ist eine raumakustische Kenngröße. Unter der Nachhallzeit versteht man das Zeitintervall, innerhalb dessen der Schalldruck in einem Raum bei plötzlichem Verstummen der Schallquelle (zum Beispiel nach einem Pistolenschuss) auf den tausendsten Teil seines ursprünglichen Schalldruckwerts abfällt, was einer Pegelabnahme um 60 dB entspricht. Die Nachhallzeit hängt von der Raumgeometrie, der Raumgröße und dem Maß der Schallabsorption des Raumes ab. Ebenso beeinflusst das Frequenzspektrum der Schallquelle die gemessene Nachhallzeit T₆₀.

Nahbesprechungseffekt– Der Nahbesprechungseffekt bezeichnet die Verstärkung tiefer Frequenzen, wenn ein Richtmikrofon (Druckgradientenempfänger) sehr nah an der Schallquelle platziert wird. Der Effekt wird oft bei Sprecher- und Gesangsaufnahmen gezielt eingesetzt, um einen kraftvollen und voluminösen Klang zu erzielen. Der Nahbesprechungseffekt entsteht bei Druckgradientenempfängern durch die künstliche Nachverstärkung tiefer Frequenzen, weil diese sich bei Richtmikrofonen durch den akustischen Kurzschluss abschwächen.

Nicht-tonal – Ein Audiosignal, das keine periodischen Schwingungen enthält, eine Tonhöhe ist daher nicht zu bestimmen, weil weder ein Grundton noch Obertöne von unserem Gehör zu registrieren sind.

Nierencharakteristik – Die Nierencharakteristik ist eine Mischung aus einer Kugelcharakteristik und einer Achtercharakteristik. Sie entsteht entweder aus der elektrischen Addition einer Kugel und einer Acht oder durch den Einbau akustischer Dämpfungselemente. Das Nieren-Mikrofon nimmt vorrangig Schall von vorne auf und blendet Töne von hinten – also aus 180° – aus. Seitliche Schallwellen werden von vorne nach hinten zunehmend abgeschwächt aufgezeichnet. Ein Mikrofon mit Kugelcharakteristik weniger anfällig für Rückkoppelungen und Störgeräusche von hinten als die mit einer Kugelcharakteristik oder einerAchtercharakteristik.

O

Oberton – Obertöne sind die höheren Teiltöne eines Klangs (Tons). Sie bilden zusammen mit dem Grundton eine deutlich wahrnehmbare Tonhöhe. Die Amplituden aller Teiltöne werden stark von den Verstärkungen und Abschwächungen eines Resonanzkörpers (z.B. dem eines Musikinstruments) beeinflusst. Diese sehr unterschiedlichen Amplituden der Obertöne verleihen jedem Klang (Ton) eine spezifische Klangfarbe. Harmonische Obertöne schwingen immer in einem ganzzahligen Vielfachen des Grundtons.

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist download.php

Off-Sprache – Ein gesprochener Text, dessen Quelle in der (Film-) Szene nicht zusehen ist. Off-Sprache ist ein extra-diegetisches Audioelement, zum Beispiel ein Kommentar, eine Erzähler- oder eine Gedankenstimme.

On-Sprache – Ein gesprochener Text, dessen Quelle in der (Film-) Szene zu sehen ist. On-Sprache ist ein diegetisches Audioelement, zum Beispiel ein Dialog von im Bild sichtbaren Schauspielerinnen. On-Sprache empfinden die Betrachterinnen und Zuhörer meistens als ein Teil der (Film-) Handlung.

P

Pegel – siehe Schalldruckpegel.

Periodische Schwingung – siehe harmonische Schwingung

Phantomschallquelle –

Phantomspeisung – Eine Phantomspeisung ist eine Gleichspannung von meist +48 V, die über ein Mikrofonkabel (meistens ein dreiadriges XLR-Kabel) übertragen wird. Die Phantomspeisung versorgt Geräte, die auf eine Spannungsversorgung angewiesen sind, wie z.B. Kondensatormikrofone und aktive DI-Boxen, mit Strom. Die Phantomspeisung wird dabei symmetrisch über die Signalleitungen geführt, damit das Audiosignal unbeeinflusst bleibt. Dieses Verfahren ermöglicht den Betrieb ohne ein separates Stromkabel.

Phasenauslöschung– Eine Phasenauslöschung tritt auf, wenn zwei Wellen gleicher Frequenz und Amplitude in genau entgegengesetzter Phase aufeinandertreffen, wodurch sie sich in diesem Fall gegenseitig auslöschen oder zumindest die resultierende Welle in ihrer Amplitude kleiner oder null wird.

Pitchshifting – Die Modifizierung der Tonhöhe (Grundfrequenz) eines Tons oder einer Melodie mithilfe digitaler Algorithmen. Dabei wird die Tonhöhe des Audiofiles verschoben, ohne dass sich dessen Abspielzeit ändert.

R

R (elektrischer Widerstand) – siehe Widerstand R

Raumhall – siehe Nachhall.

Rauschen – Rauschen besteht aus nicht-periodischen chaotischen Schwingungen. Rauschen ist ein Artefakt im Audiosignal mit unspezifischem Frequenzspektrum (d.h. es enthält keine Frequenzen oder alle Frequenzen gleichzeitig).

Rosa Rauschen – Bei Rosa Rauschen nimmt die Leistungsdichte mit steigender Frequenz um 3dB pro Oktave ab. Das bedeutet, dass in einem Frequenzintervall (z.B. von 20 Hz bis 40 Hz) die gleiche Energie steckt wie im nächsthöheren Oktav-Frequenzintervall (z.B. von 40 Hz bis 80 Hz). Es klingt für das menschliche Ohr angenehmer und natürlicher als weißes Rauschen. Anwendung: Akustische Messungen (häufiger als Weißes Rauschen), Equalizer-Einstellungen, Simulation natürlicher Klänge oder Prozesse, die oft einem Verhalten folgen (z.B. Musikmelodien, biologische Systeme).

S

Schalldruck p – Unter Schalldruck versteht man Druckschwankungen (Schwingungen), die eine Schallwelle auf ein Übertragungsmedium (z.B. Luft) ausübt. Die maximale Auslenkung einer Schwingung stellt die Amplitudedar. Dieses Druckmaximum wird in Pascal (Pa) gemessen. Schalldruck entsteht durch die Verdichtung und Verdünnung von Luftmolekülen, die von einer Schallquelle erzeugt werden. Die Lautstärke eines Geräuschs hängt vom Schalldruckpegel Lab, der wiederum in Dezibel (dB) gemessen wird.

Schalldruckpegel L – Der Schalldruckpegel L wird in dB dargestellt. L= 20 • log (p₁/p₀), dabei ist p₁ der aktuell gemessene Schalldruck und p₀ der Bezugsschalldruck (in der Akustik in der Regel die Hörschwelle des menschlichen Ohres von 20 μPa).

Schallenergie W – Die Schallenenergie ist die (mechanische) Energie in einem Schallfeld bzw. in einem Raum, die sich in einem Übertragungsmedium (meistens Luft) ausbreitet und durch die Größen Frequenz (in Hz), Amplitude (meistens in dB) und zeitliche Länge (in s) beschrieben wird. Die Einheit der Schallenergie ist Joule. 1J entspricht 1Ws (Wattsekunde), 1kWh (Kilowattstunde) entsprechen 3600s • 1000W = 3,6MJ (Megajoule). Die Schallenergie wird als W = I • A • t = P_ak • t definiert.

I ist die Schallintensität in Watt/m²
tist die zeitliche Länge in s
A ist die von der Schallenergie durchströmte Fläche in m²
P_akist die akustische Schallleistung in Watt

Schallgeschwindigkeit c – Die Schallgeschwindigkeit c ist die Geschwindigkeit, mit der Schallenergie durch ein Medium, z.B. Luft, Wasser oder feste Stoffe übertragen wird. Bei 20⁰ Grad Celsius Lufttemperatur beträgt die Schallgeschwindigkeit c in etwa 343m/s.

Schallintensität I – Die Schallintensität ist eine Schallenergiegröße, die in Watt pro Quadratmeter gemessen wird, und somit die SchallleistungP pro durchschallte Fläche A beschreibt. Sie ist abhängig von der Schallleistung, dem Ausbreitungsmedium, sowie der Entfernung zur Schallquelle und hängt stark mit der wahrgenommenen Lautstärke zusammen.

Schallleistung P – Die Schallleistung beschreibt, wie viel Schallenergie eine Schallquelle pro Zeiteinheit in alle Richtungen abstrahlt. Sie wird inWatt (W) gemessen und gibt an, wie viel Energie von der Quelle in Form von Schallwellen abgestrahlt wird. Im Gegensatz zum Schalldruck, der von der Position des Empfängers und Hindernissen in der Umgebung abhängig ist, bleibt die Schallleistung unabhängig von der Entfernung oder Umgebungsbedingungen konstant.

Schallleistung: P_ak = I ⋅ A = p ⋅ v ⋅ A

Dabei ist:

P_akist die akustische Schallleistung in Watt
I ist die Schallintensität in Watt/m²
vist die Schallschnelle in m/s
A ist die durchströmte Fläche in m²

Schallleistungspegel L_W – Der Schallleistungspegel L_W ist die logarithmische Größe der Schallleistung und wird mit L_W = 10⋅log₁₀(P/P₀) berechnet und in dB dargestellt.

Dabei ist:

L_W ist der Schallleistungspegel in Dezibel (dB)
P die Schalleistung der Quelle in Watt
P₀die Bezugs-Schallleistung (P₀=10⁻¹²W)

Schallschnelle v – Die Schallschnelle v [in m/s] beschreibt die Geschwindigkeit, mit der die Moleküle eines Mediums um ihre Ruheposition schwingen, während sich eine Schallwelle ausbreitet. Anders als die Schallgeschwindigkeit c ist die Schallschnelle von der Frequenz abhängig, nicht nur vom Medium. Vergleicht man die Schallschnelle mit einem Pendel, so ist sie am ursprünglichen Ruhepunkt am größten und bei maximaler Auslenkung gleich Null. Schallschnelle v und Schalldruck p charakterisieren ein Schallfeld.

Schwebung – Eine Schwebung erkannt man am periodischen Lauter- und Leiserwerden eines Tons. Sie entsteht, wenn zwei Schallwellen mit fast gleicher Frequenz sich überlagern. Diese zwei Schallwellen addieren oder subtrahieren sich, je nachdem ob sie in Phase oder gegenphasig sind. Als Ergebnis entsteht eine periodische Verstärkung (Lauterwerden) oder Abschwächung (Leiserwerden) des Tons.

Schwingungsperiode T – Die Zeit, die ein periodisches Signal, z. B. eine Sinuswelle oder ein Audiosignal, für einen vollständigen Zyklus (360°) benötigt. Die Einheit der Schwingungsperiode ist die Sekunde [s]. Der Zusammenhang mit der Frequenz ist T = 1/f (die Schwingungsperiode T ist der Kehrwert der Frequenz f).

Sinuston – Ein Sinuston enthält nur eine einzige Frequenz (= Grundton) und keine Obertöne. Er stellt die einfachste Form eines periodischen Schallsignals dar und dient in der Audiotechnik oft als Referenz- oder Testsignal.

Sone – siehe Lautheit.

Sounddesign – Die kreative Gestaltung der Tonspuren; hier ist dabei vornehmlich die Produktion durch Geräuschemacher (engl. Foley Artist), sowie das Anlegen und das Mischen von Soundeffekten mit den anderen Tonelementen Musik und Sprache zu verstehen. Sounddesign ist eine Zeitkunst, basiert auf dem Fluss von Zeit. Sounddesign umfasst im engeren Sinn nicht die Komposition und Gestaltung der Filmmusik. In diesem Zusammenhang, d.h. Geräuschdesign und Filmmusikkomposition, spricht man eher von Audiodesign.

Soundeffekt, Soundeffects, FX – Nicht-tonale Audioelemente, Geräusche. Soundeffekte sind für uns Menschen das auditive Hilfsmittel, um sich in der dreidimensionalen Umwelt orientieren und Entfernungen abschätzen zu können. Soundeffekte können uns helfen, auditive Ereignisse als real zu empfinden.

Spannung U – sieheU (elektrische Spannung)

Spektrum – siehe Frequenzspektrum

Sprache – Sprache besteht aus periodischen (Vokale/ Musik) und nicht-periodischen (Konsonanten/ Geräusche) Anteilen. Konsonanten dienen der Sprachverständlichkeit, während Vokale als das „klingende“ Verbindungselement zwischen den Konsonanten fungieren. Der Frequenzbereich der menschlichen Sprache reicht von 300 Hz bis 3500 Hz. Sprache ist ein auditives Zwitterelement. Sprache besteht aus der Kombination von vokalen Lauten wie a und e (= tonal) und konsonantischen Lauten wie beispielsweise k und t (= geräuschhaft), die nur mit einem zusätzlichen Vokallaut klingen können. Konsonanten sorgen für die Silbentrennung und verbessern daher die auditive Verständlichkeit von gesprochenen oder gesungenen Wörtern. Ein Wort mit vielen Vokalen wie beispielsweise „Mauer“ lässt sich zwar gut singen, ist aber gleichzeitig durch die schlecht wahrnehmbare Silbentrennung schwerer zu verstehen.

Stereofon – Die Verwendung von mindestens zwei Tonkanälen ermöglicht die auditive räumliche Gestaltung und Wahrnehmung eines Tonereignisses. Durch die zwei Kanäle können wir bei einem Signal die Laufzeit-, Intensitäts- und Frequenzunterschiede zwischen dem linken und dem rechten Kanal mit unserem linken und rechten Ohr aufnehmen und damit uns räumlich orientieren. Die Begriffe stereofon und binaural werden häufig in ihrer Bedeutung gleichgesetzt, wobei sich der erste Begriff sich auf die zweikanalige elektroakustische Übertragung, der zweite Begriff sich auf die dreidimensionale Wahrnehmung von Schall mit beiden Ohren bezieht.

Störabstand – Der (messbare) Unterschied im Pegel zwischen einem Nutzsignal (Sprache, Musik) und den unerwünschten technischen Nebengeräuschen bei der Signalübertragung, zum Beispiel das Datenträger-, Kanal- und Verstärkerrauschen eines Audiowiedergabesystems.

Stromstärke I – Die elektrische Stromstärke [I] ist eine physikalische Größe, die den elektrischen Strom bemisst. Die Stromstärke wird in Ampere [1A = 1 Coulomb/Sekunde] gemessen und bezeichnet die in einer bestimmten Zeitspanne durch einen Querschnitt geflossene Ladung bzw. Ladungsmenge.

T

T60 (Nachhallzeit) – Die Nachhallzeit T₆₀ ist die Zeit (in Sekunden), die vergeht, bis der Schallpegel um 60 Dezibel (dB) abgefallen ist, nachdem die Schallquelle aufgehört hat Schall zu emittieren.

Formel: T₆₀ = 0,161⋅A/V
V = Raumvolumen (in m³)
A = äquivalente Schallabsorptionsfläche (in m²)

Raumtypen mit typischen T₆₀
Tonstudio: 0,2 – 0,4 s
Klassenzimmer: 0,5 – 1,0 s
Konzertsaal: 1,5 – 2,5 s
Kathedrale: 4 – 8 s

T (Schwingungsperiode) – siehe Schwingungsperiode.

Ton, tonal – Ein Ton unterscheidet sich vom Geräusch dadurch, dass er mindestens eine periodische Schwingung enthält, die von unserem Ohr als Tonhöhe (engl. pitch) wahrgenommen wird. Ein (nicht-tonales) Geräusch hat daher auch keine definierbare Tonhöhe. Ein Sinuston ist die einfachste Form eines Tons: Ein Hörereignis, das nur aus einer (Grund-) Schwingung ohne Obertöne besteht.

Tonhöhe – Die Tonhöhe eines Klangs wird in der Regel über die periodische Schwingung des Grundtons wahrgenommen. Die Obertöne eines Klangs formen die Klangfarbe.

Transienten – Transienten sind die ersten Millisekunden des (unharmonischen) Einschwingvorgangs eines Klangereignisses. Zum Beispiel werden bei einem Gitarrenton dessen typische auditive Parameter mithilfe der Transienten von unserem Hörapparat erkannt: Das Anreißen der Gitarrensaite mit den Fingernägeln, das zunächst extreme Auslenken der Saite etc. Nach einem Verändern dieser Transienten beispielsweise durch Wegschneiden des Tonbeginns oder Verfremden durch Filter kann dieser Ton nicht mehr einer Gitarre zugeordnet werden. Das heißt, seine akustische Gestalt hat sich verändert.

U

U (elektrische Spannung) – Die elektrische Spannung ist die Differenz des elektrischen Potenzials zwischen zwei Punkten eines Stromkreises. Sie gibt an, wie viel Energie pro Ladung (Q) übertragen wird, wenn sich elektrische Ladungen bewegen. Die elektrische Spannung ist also ein Maß für die treibende Kraft des elektrischen Stroms und wird in Volt (V) gemessen. Die elektrische Leistung P ist das Produkt aus Spannung und Stromstärke: P = U * I

Übersteuerung –

V

Vocoder – (Zusammenfügung aus Voice und Encoder): Heutzutage eine Audiosoftware, die ermöglicht, eine zuvor aufgenommene (menschliche) Stimme oder ein tonales Geräusch als Tonsample über eine musikalische Tastatur (Keyboard) zu spielen. Typische Klangergebnisse von Vocodern sind zum Beispiel die Roboterstimmen von automatisierten Maschinen in Science-Fiction-Filmen wie „2001: Odyssee im Weltraum“.

Vokale – Vokale sind Selbstlaute, bei deren Aussprache der Luftstrom im Mundraum im Vergleich zur Konsonanten-Aussprache nicht oder nur wenig gehemmt wird. Es gibt keine Hindernisse bei der Aussprache der Vokale. In der akustischen Phonetik sind Vokale – im Gegensatz zu den Konsonanten – Klänge. Zu den Vokalen gehören im Deutschen die Einzellaute a, e, i, o und u sowie die Umlaute ä, ö und ü.

Volt – siehe U (elektrische Spannung)

W

Walla – (engl.) sind atmosphärische Stimmengeräusche im Raumhintergrund. Meistens sind sie akustisch und damit inhaltlich nicht zu verstehende Gespräche oder Gesprächsteile. Sounddesigner nutzen Walla, um in Restaurants, Bars und Pausenräumen die unzähligen Stimmen atmosphärisch akustisch darzustellen. Walla ist ein semantisches Tonelement, um eine größere Menschenmenge akustisch abzubilden.

Weißes Rauschen – Ein Signal, dessen Leistungsdichte oder Energie über das gesamte Frequenzspektrum konstant (gleich verteilt) ist. Es enthält daher bei allen Frequenzen die gleiche Energie pro Bandbreite (Hz). In der Praxis klingt es oft wie ein scharfes und helles Rauschen. Mathematisch entspricht es einem Zufallsprozess, bei dem aufeinanderfolgende Abtastwerte statistisch unabhängig sind. Anwendung: Akustische Messungen, Kalibrierung von Audio-Geräten, Maskierung von störenden Geräuschen (z.B. Schlafhilfen).

Wellenlänge λ – Die Wellenlänge λ (sprich: „lambda“) wird mit der Formel λ = c/f berechnet. Dabei ist c die Schallgeschwindigkeit (ca. 340 m/s bei 20 Grad Celsius Lufttemperatur) und f die Frequenz. Die Wellenlänge beschreibt die räumliche Distanz zwischen zwei gleichen Schwingungszuständen, beispielsweise zweier Luftmoleküle. Um die Wellenlänge λ einer Schwingung bestimmen zu können, muss diese periodisch sein.

Widerstand R – Der elektrische Widerstand R (englisch „resistor“) ist ein Maß dafür, wie stark ein elektrisches Bauteil den Stromfluss hemmt. Anders ausgedrückt, wie schwer es für den elektrischen Strom gemacht wird, durch einen Leiter zu fließen: R = U/I. Dabei ist U die elektrische Spannung, I die Stromstärke. Die Einheit von [R] ist Ω (Ohm = V/A).

Q

Q (elektrische Ladung) – Q ist das Formelzeichen für die elektrische Ladung. Siehe auch Kondensator. Q ist definiert als Q = dI/dt, einfacher I/t (Stromstärke pro Sekunde)

Q ist die elektrische Ladung in Coulomb. 1C entspricht 1As (Amperesekunde)
tist die zeitliche Länge (Zeit) in s
dI bzw. dt ist das Differential der Stromstärke bzw. der Zeit

Y

y (Koordinate) – y ist die vertikale Koordinate in zweidimensionalen Koordinatensystemen. Sie wird auch als Ordinate bezeichnet.

X

x (Koordinate) – x ist die horizontale Koordinate in zweidimensionalen Koordinatensystemen. Sie wird auch als Abszisse bezeichnet.

Z

z (Koordinate) – z ist die dritte (räumliche) Koordinate in dreidimensionalen Koordinatensystemen.