Die akustische Analyse von Sprachlauten1. Schall, Zeitsignal, Periodizität, Spektrum
Jonathan Harrington,Uwe Reichel
Inhalt• Schall: Definition, Entstehung,
Übertragung, Wahrnehmung• Schwingung (informell)• Kenngrößen des Schalls: Schalldruck• Zeitsignal in der Phonetik• Periodizität, Frequenz• Spektrale Zerlegung komplexer Signale
Was ist Schall?
• Ausbreitung von lokalen Druckschwankungen in einem elastischen Medium (z.B. Luft) als Welle
• Welle: Fortpflanzung von Schwingungen
Wie entsteht Schall?
1. Eine Schallquelle verursacht in ihrer unmittelbaren Umgebung Luftdruckschwankungen (=Schalldruck).
Stimmgabel
Luftmoleküle
Erhöhung desLuftdrucks(Verdichtungder Luftmoleküle)
Absenkung des Luftdrucks (Auseinanderbe-wegung der Luftmoleküle)
Wie entsteht Schall?
2. Dadurch dass die schwingenden Luftmoleküle mit den benachbarten Molekülen interagieren und diese somit ebenfalls in Schwingung versetzen, pflanzen sich die
lokalen Luftdruckschwankungen (= der
Schalldruck) fort.
Im Medium Luft schwingen die Teilchen in Ausbreitungsrichtung des Schalls. Die Schwingung pflanzt sich damit in Form einer sog. Longitudinalwelle mit Schallgeschwindigkeit (ca. 340 m/s) fort.
Die Wahrnehmung des Schalls
3. Der sich fortpflanzende Schalldruck erreicht das Ohr und führt dort zu einer entsprechenden Auslenkung des Trommelfells.
4. Weiterverarbeitung: siehe Einführung in die Perzeptive Phonetik
Schwingung• 1. Ein Teilchen wird durch eine auf es
einwirkende Kraft (die Schallquelle) aus seiner Ruhelage herausbewegt.
• 2. Elastische Rückstellkräfte ziehen es wieder Richtung Ruhelage zurück.
• 3. Aufgrund seiner Trägheit bewegt sich das Teilchen aber über die Ruhelage hinaus solange weiter, bis die erneut einsetzenden Rückstellkräfte größer sind als die Trägheit des Teilchens. Goto 2.
• Masse-Feder-Modell: Masse – Trägheit, Feder – Rückstellkräfte
• Die zeitabhängige Abweichung des Teilchens von seiner Ruhelage heißt Amplitude.
• Nimmt die Amplitude im Laufe der Schwingung (aufgrund von Reibung) ab, so wird die Schwingung als gedämpft bezeichnet.
Schalldruck P
• lokale Schwankung des Luftdrucks.• Einheit: Pascal (Pa) = Kraft/Fläche
(N/m^2)• Schalldruck ist gegenüber dem
atmosphärischen Luftdruck (10^5 Pa) sehr gering:
Hörschwelle – Schmerzgrenze: 10^(-5) Pa – 10 Pa
• Die Spanne zwischen Hörschwelle und Schmerzgrenze ist sehr groß
• Daher wird zur Angabe des Schalldrucks i.d.R. statt der linearen Pascal-Skala die „gestauchte“ logarithmische Dezibel (dB)-Skala verwendet. Man spricht nun vom Schalldruckpegel L.
• Hierbei wird der Schalldruck P stets im Verhältnis zu einem festgelegten Referenzschalldruck P0 angegeben:
L [dB] = 20 log P/P0, wobei P0 = 2*10^-5 Pa
• Allgemeiner formuliert: die Berechnung des Verhältnisses zweier beliebiger Schalldrucke P1 und P2 erfolgt mittels folgenden Ausdrucks:
20 log P2/P1 [dB]• +20 dB entspricht einer Verzehnfachung des
Schalldrucks• +6 dB entspricht in etwa einer Verdopplung• Beispiel: P1=1000 Pa, P2=10000 Pa, d.h. P2 ist 10x höher als P1 Schallpegelverhältnis = 20 log 10000/1000
= 20 log 10 = 20
Ein Zeitsignal
Der sich mit der Zeit ändernde Schalldruck wird mit einem Mikrophon in einem Raumpunkt gemessen – wir erhalten ein Zeitsignal, das eine Schwingung darstellt.
Zeit
Mikrophon
Ein Zeitsignal
Atmosphärischer Luftdruck
Hoher Luftdruck
Niedrigerer Luftdruck
Die Schalldruck-Amplitude oder einfachDie Amplitude
Zeitsignale und Lautstärke
Lautstärke ist vom Schalldruck abhängig
Sch
alld
ruck
-Am
plitu
de
Zeit
Laut
Leise
Definition einer Sinoidalschwingung
Ein Punkt bewegt sich auf einer Kreisbahn – die Höhe über der horizontalen Linie wird gemessen, und als Funktion der Zeit abgebildet
Die Frequenz = 1 Hertz (1 Hz)(weil der Punkt 1 Mal/Sekunde den Kreis umläuft)
Sinoidal
• Messung der zeitabhängigen Amplitude f(t) einer Sinusschwingung:
f(t) = A*sin(2*Pi*f*t+phi) wobei A: Maximalamplitude, Pi: Kreiszahl 3.1416, f: Frequenz, t: Zeit, phi: Phase, horizontale Verschiebung der
Schwingung• 2*Pi*f wird auch als Winkelgeschwindigkeit
bezeichnet. Sie gibt an, wie oft pro Sekunde die Kreisbahn umlaufen wird.
• Periodische Schwingung: Schwingungsdurchgänge (Perioden) finden in konstanten Zeitintervallen statt. Hierbei handelt es sich um Sinoidalschwingungen oder komplexe Schwingungen, deren Sinoidalkomponenten im ganzzahligen (harmonischen) Verhältnis zur Komponente mit der tiefsten Frequenz stehen.
• Im Sprachsignal treten bei stimmhaften Lauten quasi-periodische Schwingungen auf, d.h. benachbarte Perioden sind in etwa gleich lang.
Schallschwingungsarten:• Reine Töne: einzelne Sinoidalschwingungen• Klänge (~Vokale): aus
Sinoidalschwingungen zusammengesetzte komplexe Schwingungen;
im engeren Sinn stehen die Schwingungen im harmonischen Verhältnis zueinander (ganzzahlige Vielfache der Grundfrequenz f0)
• Geräusche (~Plosive, Frikative): komplexe Schwingung, deren Sinoidalkomponenten unendlich nah beieinander liegen
• Mischung aus Klang und Geräusch bei stimmhaften Konsonanten
Stimmhafte und stimmlose Laute
Stimmhafte Laute werden durch periodische Schwingungen der Stimmlippen erzeugt, die eine sich wiederholende Regelmäßigkeit, oder Periodizität im Sprachsignal verursachen.
Anmerkung: die Schwingung der Stimmlippen ist nicht unmittelbar für die akustische Schwingung verantwortlich (vs. Stimmgabel), sondern die durch den glottalen Verschluss bewirkte impulsartige Störung des Luftdrucks.
s t m pPeriodizität
Am
plitude
Dauer (ms)
stimmlos stimmhaft stimmlosDie Periodizität, die in stimmhaften Lauten vorkommt, verursacht eine regelmäßige Wiederholung im Zeitsignal.
Periodizität und Stimmhaftigkeit
Die Periodendauer T
Die Periodendauer ist die Dauer einer Vibration (also einer Schließung + Öffnung) der Stimmlippen
Führungsamplitude, Stimmlippen schließen sich
Tonhöhe, Periodendauer, Grundfrequenz
Je schneller die Stimmlippen vibrieren, desto mehr Schwingungen pro Sekunde und desto:• kleiner die Periodendauer• höher die Grundfrequenz (f0) und damit die Tonhöhe
Die Grundfrequenz ist die Anzahl der Stimmlippen-Schwingungen pro Sekunde und wird in Hertz (Hz) gemessen.
Die Grundfrequenz (f0) = 1 / T [Hz] oder auch [1/s]
Periodendauer = 9.79 ms = 0.00979 Sekundenf0 = 1/0.00979 = 102.2 Hz
Denkt man sich diesen Signalabschnitt periodisch fortgesetzt, so vibrieren (schließen und öffnen sich) die Stimmlippen 102.2 Mal pro Sekunde
Zeitsignal, Spektrum, Spektrogramm
Zeitsignal = zeitabhängige Amplitudenwerte
Spektrum = frequenzabhängige Amplitudenwerte
Spektrogramm = frequenz- und zeitabhängige Amplitudenwerte
Fourier-Analyse:= Die Zerlegung eines Zeitsignals in Sinoidalschwingungen (Pendelschwingung, sin, cos)
2
0
-20 1 0 1
Dauer (Sekunden)
Am
plitu
de
Amplitude =1Frequenz = 1 Hz
Amplitude =2Frequenz = 1 Hz
Doppelte Amplitude, selbe Frequenz
Selbe Amplitude, doppelte Frequenz
0
-2
2
0 1 0 1
Dauer (Sekunden)
Am
plitu
de
Amplitude =1Frequenz = 1 Hz
Amplitude = 1Frequenz = 2 Hz
• Sinus und Cosinus-Schwingung sind gegeneinander um Pi/2 phasenverschoben.
• Eine Cosinusschwingung weist zum Zeitpunkt 0 einen Schwingungsbauch auf
(maximaler Amplitudenwert).• Bei einer Sinusschwingung befindet sich
beim Zeitpunkt 0 ein Schwingungsknoten (Nulldurchgang).
Ein Spektrum
Ein Spektrum ist eine Abbildung der Frequenz (x-Achse) und Amplitude (y-Achse) von Sinusoidalschwingungen
0 1
0 2
0
1
2
1
0 1
0 2
0
1
2
1
Sinusoidale (Zeitbereich)
0
-2
2
0 1
Am
plitu
de
Dauer (s)
0 2
0
1
2
1
Am
plitu
de
Frequenz (Hz)
deren Spektra (Frequenzbereich)
Zeitsignal
2.5 Hz Sinusoid
5 Hz Sinusoid
7.5 Hz Sinusoid
Fourier-Analyse
1. Fourier-Analyse/Zerlegung
Die Zerlegung oder Fourier-Analyse bedeutet: das Signal wird auf eine solche Weise in Sinusoiden aufgeteilt, sodass das ursprüngliche Signal bei der Summierung der Sinusoiden genau rekonstruiert wird.
Summierung:
z.B. a = b + c + d
2.5 5 7.5Frequenz (Hz)
Am
plitu
de
Abbildung der Amplituden der aus der Fourier-Analyse entstehenden Sinusoiden als Funktion der Frequenz.
Zeitsignal
2.5 Hz Sinusoid
5 Hz Sinusoid
7.5 Hz Sinusoid
Fourier-Analyse
Spektrum
2. Spektrum