close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

3. Psychoakustische Wahrnehmung Schallphysik – wie entstehen

EinbettenHerunterladen
3. Psychoakustische Wahrnehmung
3.1 Physikalische Grundlagen der Schallausbreitung
3.2 Physiologisches Gehörmodell
3.3 Psychoakustisches Wahrnehmungsmodell
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
1
Schallphysik – wie entstehen Töne ?
S [W/m²]
Smax
t [sec]
T
Schwingung: Änderung des Schalldrucks S über die Zeit t
Smax: Maximaler Schalldruck, T: Periodendauer, f: Frequenz 1/T
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
2
Schallphysik – wie entstehen Töne ?
S [W/m²]
Smax
t [sec]
T
Lautstärke: Änderung des maximalen Schalldrucks Smax
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
3
Schallphysik – wie entstehen Töne ?
S [W/m²]
Smax
t [sec]
T
Änderung der Periodendauer T
Frequenz f = 1/T : Anzahl der Schwingungen pro Zeit [Hz]
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
4
Töne sichtbar machen – Darstellung von Wellen
Töne (Schwingungen) werden beschrieben durch:
•
Tonhöhe (Frequenz f [Hz]) und Lautstärke (Smax [W/m²])
•
Jeder Klang (z.B. ein Dreiklang) kann in einzelne
Schwingungen mit unterschiedlicher Tonhöhe und
Lautstärke zerlegt werden
Smax
[W/m²])
laut
leise
f [Hz]
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
5
Töne sichtbar machen – Darstellung von Wellen
Töne (Schwingungen) werden beschrieben durch:
•
Tonhöhe (Frequenz f [Hz]) und Lautstärke (Smax [W/m²])
•
Jeder Klang (z.B. ein Dreiklang) kann in
einzelneSchwingungen mit unterschiedlicher Tonhöhe und
Lautstärke zerlegt werden
Smax
[W/m²])
laut
leise
400
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
f [Hz]
6
Töne sichtbar machen – Darstellung von Wellen
Töne (Schwingungen) werden beschrieben durch:
•
Tonhöhe (Frequenz f [Hz]) und Lautstärke (Smax [W/m²])
•
Jeder Klang (z.B. ein Dreiklang) kann in
einzelneSchwingungen mit unterschiedlicher Tonhöhe und
Lautstärke zerlegt werden
Smax
[W/m²])
laut
leise
f [Hz]
900
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
7
Töne sichtbar machen – Darstellung von Wellen
Töne (Schwingungen) werden beschrieben durch:
•
Tonhöhe (Frequenz f [Hz]) und Lautstärke (Smax [W/m²])
•
Jeder Klang (z.B. ein Dreiklang) kann in
einzelneSchwingungen mit unterschiedlicher Tonhöhe und
Lautstärke zerlegt werden
Smax
[W/m²])
laut
leise
2000
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
f [Hz]
8
Töne sichtbar machen – Darstellung von Wellen
Töne (Schwingungen) werden beschrieben durch:
•
Tonhöhe (Frequenz f [Hz]) und Lautstärke (Smax [W/m²])
•
Jeder Klang (z.B. ein Dreiklang) kann in
einzelneSchwingungen mit unterschiedlicher Tonhöhe und
Lautstärke zerlegt werden
Dreiklang: 400 Hz + 900 Hz + 2 kHz
Smax
[W/m²])
laut
leise
400
900
2000
f [Hz]
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
9
Schnitt des peripheren Gehörs (schematisch)
Die Bogengänge sind Teil des Gleichgewichtsorgans,
das zusammen mit der Schnecke (Cochlea) das Innenohr bildet
(nicht maßstabsgerecht).
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
10
Schnitt des Mittel- und Innenohres (schematisch)
Schnitt des Mittelohres und der entrollten Cochlea (schematisch)
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
11
Schnitt des Mittelohres und der entrollten Cochlea
Bei einer sinusförmigen Trommelfellschwingung prägt sich an einem
Ort der cochleären Trennwand eine Resonanz aus. Vor allem an
diesem Ort findet der Druckausgleich zwischen der Ober- und
Unterseite der Trennwand statt.
Die Auslenkung der Mittelohrknöchelchen und Fenstermembranen der
Cochlea ist zur Veranschaulichung gestrichelt und stark vergrößert
dargestellt.
Die örtliche Verteilung der Resonanzen bewirkt eine Frequenz-OrtsTransformation der Cochlea, wodurch eine direkte Zuordnung
einzelner Frequenzanteile zu Orten auf der Cochlea möglich wird.
Diese Frequenzverteilung wird in Bark gemessen.
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
12
Frequenzanalysator in der Schnecke
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
13
Frequenz-Orts-Transformation der Cochlea
Δz = 0.1 Bark, Nsek = 251
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
14
Schnitt durch die Cochlea
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
15
Querschnitt der entrollten Cochlea
Der um die Schneckenachse gewundene Kanal wird durch die
Reissnersche Membran und die Basilarmembran in drei Kammern
geteilt. Die Basilarmembran mit dem aufsitzenden Cortischen
Organ, das die Sensoren beinhaltet, bildet zusammen mit der
darüberliegenden Tektorialmembran die cochleäre Trennwand.
Die Reissnersche Membran isoliert die unterschiedlichen
Lymphflüssigkeiten von Scala vestibuli und Scala media und hat
praktisch keine hydromechanische Bedeutung.
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
16
Querschnitt des Cortischen Organs
• 3400 innere Haarzellen (IHZs) in einer Reihe entlang der Cochlea
• 3 bis 4 weitere Reihen von etwa 13000 äußeren Haarzellen (ÄHZs)
• IHZs wirken als Sensoren (mit 30000– 40000 Nervenfasern verbunden)
• jede Faser mit genau mit 1 IHZ und jede IHZ an bis zu 20 Fasern
• ÄHZs wirken als Motoren (von ca. 1000 Nervenfasern gesteuert)
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
17
Querschnitt des Corti’schen Organs
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
18
Motorik der äußeren Haarzelle (rockende Haarzelle)
Produzent:
Ear Lab, UCL
Aufnahme:
BBC 1987
Mikroskopaufnahme einer ÄHZ, mit Einspeisung eines Liedes
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
19
Querschnitt des Cortischen Organs
Eine transversale Schwingung (in Pfeilrichtung) der cochleären Trennwand
hat eine Scherbewegung zwischen der Basilarmembran und der
Tektorialmembran im Bereich des Cortischen Organs zur Folge. Die
Tektorialmembran und die der Schneckenachse zugewandte Seite der
Basilarmembran rotieren dabei jeweils um eine Achse längs ihrer
Aufhängung. Eine entsprechende Rotation der relativ steifen Pfeilerzellen
bewirkt die Scherung der Haarbündel der äußeren Haarzellen zwischen
Retikular- und Tektorialmembran.
Die Flüssigkeitsgeschwindigkeit am Haarbündel der inneren Haarzellen
ist das mechanische Reizsignal der Sensoren. Durch Kontraktion der
äußeren Haarzellen wird die gestrichelt dargestellte, von einer Schwingung
des ovalen Fensters hervorgerufene Auslenkung der Basilarmembran
verstärkt. Diese Kontraktion bewirkt auch eine Verschiebung der inneren
Haarzelle, so daß sich die Relativgeschwindigkeit des Haarbündels
gegenüber der umgebenden Flüssigkeit erhöht.
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
20
Schemazeichnung des Cortischen Organs
•Basilarmembran mit inneren und Äußeren Haarzellen
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
21
Das Corti’sche Organ
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
22
Schemaszeichnung von inneren Haarzellen
• Haarzelle im Corti’schen Organ
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
23
Innere Haarzelle
• Elektronen-Mikroskopie-Aufnahme von inneren Haarzellen
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
24
Weiterleitung der IHZ-Impulse an das Gehirn
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
25
Vereinfachte Darstellung der aufsteigenden Hörbahn
Die aufsteigende Hörbahn des Hörnervs, die von den IHZs einer
Cochlea ausgeht. Die nicht gezeigte Verknüpfung der neuronalen
Signale der rechten und linken Cochlea erfolgt bereits in den ersten
Verarbeitungsstufen des Olivenkomplexes, die auf die Spiralganglienzellen folgen. Am Ausgang des Olivenkomplexes sind
unterschiedliche Signaltypen identifizierbar, in denen bestimmte
Merkmale des Reizsignals von den Spiralganglien codiert sind und
parallel zu höher gelegenen Nerven weitergeführt werden.
Die Höhrbahn endet im auditorischen Cortex, der eine tonotope
(nach Tonfrequenzen geordnete) Organisation aufweist und
spezialisierte rezeptive Felder beispielsweise für amplituden- oder
frequenzmodulierte Schallsignale besitzt.
Es gibt auch noch eine absteigende Hörbahn, die zu den ÄHZ führt
und diese steuert (noch kaum erforscht).
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
26
Hören und Wahrnehmung – was hören wir ?
Lautstärke [W/m²]
sehr laut
1
0.01
laut
0.0001
0.000001
.
leise
.
.
sehr leise
10-12
20
200
2.000
f [Hz]
20.000
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
27
Hören und Wahrnehmung – was hören wir ?
Lautstärke [W/m²]
1
0.01
sehr laut
Ruhe-Hörschwelle
laut
0.0001
0.000001
.
leise
.
.
sehr leise
10-12
20
200
2.000
20.000
f [Hz]
Unsere Wahrnehmung ist begrenzt und frequenzabhängig!
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
28
Subjektive Hörschwelle (Fletcher-Munson)
1
1
Standard sound pressure level at 1 kHz: I0 = 10-12 Watt/m2 (0 Phon)
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
29
Hören und Wahrnehmung – was hören wir ?
Lautstärke [W/m²]
sehr laut
1
0.01
laut
0.0001
0.000001
.
leise
.
.
sehr leise
10-12
1000 1200
20
200
2.000
20.000
f [Hz]
Gleichzeitige Töne: Zweiklang ist hörbar
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
30
Hören und Wahrnehmung – was hören wir ?
Lautstärke [W/m²]
sehr laut
1
0.01
laut
0.0001
0.000001
.
leise
.
.
sehr leise
10-12
1000 1200
20
200
2.000
f [Hz]
20.000
Gleichzeitige Töne: Laute und leise Töne !
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
31
Hören und Wahrnehmung – was hören wir ?
Lautstärke [W/m²]
sehr laut
1
0.01
Maskier-Hörschwelle
laut
0.0001
0.000001
.
leise
.
.
sehr leise
10-12
1000 1200
20
200
2.000
20.000
f [Hz]
Gleichzeitige Töne: Laute Töne unterdrücken leise Töne !
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
32
Maskierung mit Schmalbandrauschen
• narrowband random noise
• mean frequencies250 Hz, 1 kHz, and 4 kHz
• related bandwidth100Hz, 160 Hz and 700 Hz respectively
i. e., width depends on frequency
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
33
Amplitudenabhängiges Maskierungsverhalten
• narrowband random noise
i. e., width depends on amplitude
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
34
Maskierung mit Sinuston
Comparison: Sine waves vs. random noise (used before)
• depends on frequency
• i. e., similar to narrowband random noise
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
35
Maskierung im Zeitbereich
• after and before the event
• depends on (to some extent) amplitude
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
36
Kompression: MPEG Audio (MP3)
MP3: Abkürzung für MPEG 1 Layer 3
MPEG: Normungsgremium für Video und Audio
(Moving Pictures Expert Group)
MP3 nutzt die Hörwahrnehmung (Maskierung) aus,
speichert nur notwendige Information:
1. zerlege Musik in einzelne Tonbereiche (Frequenzbänder)
2. in jedem Frequenzband, betrachte Maskierschwellen
3. entferne die unhörbaren Bereiche (Quantisierung)
⇒ Daten werden „zusammengedrückt“ (komprimiert)
⇒ Bitrate für MP3: 128 kBit/sek. (Kompressionsfaktor 10)
⇒ Statt 16 Bit im Mittel nur noch 1.6 Bit pro Abtastwert!
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
37
Kompression: Frequenzzerlegung
Zerlegung der Tonhöhen in Frequenzbänder
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
38
Kompression: Quantisierung
Rote Bereiche sind unter der Schwelle. Wegwerfen! (Quantisieren)
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
39
Kompression: Quantisierung
Rote Stufen stellen Quantisierstufen dar (Störsignal).
Daten werden mit diesen Stufen komprimiert.
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
40
Kompressionseffekte
Audio Coding with masking
• Coding by using the masking effects (irrelevance reduction)
• temporal and frequency masking with advanced audio coder
AAC (Uni Hannover)
• Original stereo signal at 1.41 Mbit/s (2 x 16Bit x 44199 Hz)
• near CD-Quality at 64 kBit/s with AAC
• masked difference signal (irrelevance) at 64 kBit/s
Multimediale Informationsverarbeitung: Psychoakustische Wahrnehmung
41
Document
Kategorie
Gesundheitswesen
Seitenansichten
7
Dateigröße
496 KB
Tags
1/--Seiten
melden