close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

27. Statistische Tests für Parameter Was ist ein statistischer Test

EinbettenHerunterladen
27. Statistische Tests fu
¨r Parameter
Wenn du eine weise Antwort verlangst,
musst du vernu
¨nftig fragen
Was ist ein statistischer Test?
Ein statistischen Test ist ein Verfahren, welches
• ausgehend von Stichproben
• bestimmte Hypothesen u
¨berpru
¨ft,
• und diese - mit gewissen Fehlerwahrscheinlichatigt oder verwirft.
keiten - best¨
Steht die Form der Verteilung außerfrage und man
macht nur Hypothesen u
¨ber Parameter der Verteilung
(wie µ, σ 2, Anteilswert, Korrelationskoeffizient etc), so
liegt ein parametrischer Test vor ⇒ Dieses Kapitel.
Hypothesen u
¨ber die komplette Verteilung als solche
(Stichprobe ist konsistent mit bestimmter Verteilung,
zwei Stichproben gehorchen der selben Verteilung, zwei
Stichproben sind konsistent mit Unabh¨angigkeit etc)
werden in nichtparametrischen Tests untersucht ⇒
Kap. 28. ff
27.1 Prinzip des Signifikanztests
Fast immer werden statistische Tests in Form von Signifikanztests durchgefu
¨hrt:
Man formuliert eine Nullhypothese H0 und die
¯0
komplement¨are Alternativhypothese H1 = H
und u
¨berpru
¨ft, ob die Zufalls-Stichprobe wesentlich
(“signifikant”) von H0 abweicht.
Wichtig:
Durch Stichproben kann man mit den Mitteln der
Statistik i.A. keine Fragen der Art
“zeige, dass ...!” beantworten, sondern nur Fragen
der Art “zeige, dass nicht widerlegt werden
kann, dass ...!”
das Wortes “signifikant” wird dabei durch das Signifikanzniveau quantifiziert:
Das Signifikanzniveau α ist die Wahrscheinlichkeit
dafu
¨r, bei einem Signifikanztest die Nullhypothese
H0 abzulehnen, obwohl sie wahr ist.
¨
• Ublich:
α =0.10, 0.05, 0.01 ⇒ Tabellen!
• α wird auch als ”α-Fehler”, ”Fehlerwahrscheinlichkeit” oder “Fehler erster Art” bezeichnet
27.1 (b): Hintergrund: Entscheidungsmatrix
unschuldig
schuldig
Freispruch
richtige
Entscheidung
Irrtum “zugunsten des Angeklagten”
Schuldspruch
Irrtum “zuungunsten des Angeklagten”
richtige
Entscheidung
In der Entscheidungsmatrix gibt es drei Mengen von Objekten:
• Eine Menge von Zust¨
anden (H0 ist wahr oder falsch)
• Eine Menge von m¨
oglichen Entscheidungen (H0 annehmen
oder nicht)
• Eine Menge m¨
oglicher Konsequenzen (Entscheidung richtig
oder falsch)
Aufgabe:
1. Ordnen Sie in obigen Beispiel die drei Mengen zu
2. Als Nullhypothese k¨onnten Sie “der Angeklagte ist unschuldig”
oder “der Angeklagte ist schuldig” annehmen. Warum ist hier
die Nullhypothese “der Angeklagte ist unschuldig” besser?
27.1 (c): Entscheidungsmatrix beim Ru
¨hrei
Scherzhafte Beispiele haben manchmal
gr¨oßere Bedeutung als ernste
Michael Stifel (1487 - 19.4.1567)
Man hat fu
¨nf (gute) Eier in einen Topf geschlagen
und hat noch ein Ei. Soll man es gleich dazugeben,
sicherheitshalber zun¨achst in eine Tasse aufschlagen oder
gleich fortwerfen?
6.Ei ist gut
6.Ei ist faul
Ei 6 dazugeben
Ei 6 fortwerfen
Ei 6 zun¨achst in
Tasse
Aufgabe: Tragen Sie die Konsequenzen in die fehlenden
K¨astchen ein. Diskutieren Sie die Entscheidungen der
linken Spalte unter dem Gesichtspunkt: “Nullhypothese
annehmen oder verwerfen”.
27.1 (c) II: L¨
osung
6.Ei ist gut
6.Ei ist faul
Ei 6 dazugeben
6-Ei Ru
¨hrei
alles verdorben
Ei 6 fortwerfen
Verlust: 6.Ei
5-Ei Ru
¨hrei
6. Ei zun¨achst in
Tasse
6-Ei Ru
¨hrei +
zus¨atzlicher Abwasch
5-Ei Ru
¨hrei +
zus¨atzlicher Abwasch
Hier ist die Konsequenz des Zustands “6. Ei ist faul”
schwerwiegender als die des Zustandes “6. Ei ist gut”,
deshalb muss man die Wahrscheinlichkeit einer mo¨glichen Fehleinsch¨atzung “Ei als gut erkl¨art, obwohl es faul
ist” durch den Fehler erster Art kontrollieren k¨onnen.
Als Nullhypothese ist deshalb
H0: “Das 6. Ei ist faul”
dem Sachverhalt angemessen.
27.1 (d): Entscheidungsmatrix beim Signifikanztest
H0 ist richtig
H0 ist falsch
H0 annehmen
richtig
falsch
Fehler 2. Art
H0 verwerfen
falsch
Fehler 1. Art
richtig
• Die Wahrscheinlichkeit fu
¨r einen
Fehler erster Art: Ablehnung einer zutreffenden Nullhypothese
kann man durch die Irrtumswahrscheinlichkeit α genau angeben und beeinflussen:
P (H0 verworfen|H0) = α
• Wesentlich weniger Kontrolle hat man u
¨ber den “Fehler zweiter
Art” oder “β -Fehler”, bei einem Signifikanztest eine falsche
Nullhypothese nicht abzulehnen:
P (H0 angenommen| H0 ) = β
Nur mit dem fortgeschrittenem Konzept der Operationscharakteristik (hier nicht behandelt) ist ihm manchmal beizukommen.
• Richtlinie fu
¨r die Auswahl der Nullhypothese
”Im Zweifel fu
¨r den Angeklagten!”
27.1(e) Beispiele und Aufgaben
1. Welche Nullhypothese ist sinnvoll (i) beim Gericht (Schuldig
oder unschuldig?), (ii) in der Qualit¨atssicherung (Ware ist gut
oder schlecht?) Hinweis: Im Zweifel fu
¨r den Angeklagten!
2. Bei Stiftung Warentest geht der Vorwurf ein, dass Nutellagl¨aser
im Mittel nicht die angegebenen 400 g Nutella enthalten. Stiftung Warentest kauft daraufhin 9 Nutellagl¨aser, stellt Abfu
¨llgewichte von 403 g, 400 g, 393 g, 396 g, 398 g, 401 g, 398
g, 397 g, 396 g fest und fu
¨hrt einen parametrischen Test zum
Signifikanzniveau α = 5% durch. Voruntersuchungen (⇒ Kap.
28) zeigten, dass eine Gaußverteilung angenommen werden kann.
• Welcher statistische Parameter der Zufallsgr¨oße X : Abfu
¨llgewicht eines Glases, wird getestet?
• Formulieren Sie eine sinnvolle Nullhypothese
• Bestimmen Sie - analog wie bei der Sch¨atztheorie - eine
Sch¨atzgr¨oße und ihre Verteilung, falls H0 grenzwertig zutrifft, d.h. der wahre Mittelwert µ = 400 g ist.
• Die Sch¨atzgr¨oße ist t-verteilt (d.h. sieht wie Gaußverteilung
aus). Formulieren Sie, zun¨achst rein grafisch, die Kriterien,
die zur Annahme bzw. Ablehnung von H0 fu
¨hren.
•
Tats¨achlich sei das mittlere Abfu
¨llgewicht nun 399.9
g, die Herstellerfirma fu
¨llt also in der Tat zu wenig Nutella
ein und die Nullhypothese (“Angeklagter ist unschuldig”) ist
nicht erfu
¨llt. Sch¨atzen Sie grob ohne Rechnung die Wahrscheinlichkeit ab, das Stiftung Warentest diesem Betrug nicht
auf die Schliche kommt (=Fehler zweiter Art)
27.2 Rezept zur Durchfu
¨hrung
1. Festlegen der Nullhypothese H0 und des Signifikanzniveaus α. Es gibt zwei Arten von Nullhypothesen
• Zweiseitige Tests: Gleichheits-Hypothese, z.B. µ = µ0,
• Einseitige Tests: Ungleichheits-Hypothese, z.B. µ > µ0.
2. Bestimmung der Testfunktion und deren Verteilung unter der vorl¨aufigen Annahme, dass H0 zutrifft (Gleichheits-Hypothese) bzw. grenzwertig zutrifft (Ungleichheits-Hypothese). In beiden F¨allen wird
also dieselbe Testfunktion verwendet und auch dessen hypothetische Verteilung unter der Annahme von
z.B. µ = µ0 ist dieselbe. Die Testfunktionen werden
auf den n¨achsten Seiten vorgestellt.
3. Bestimmung des konkreten, aus der Stichprobe ermittelten Wertes der Testfunktion.
4. Testentscheidung durch Vergleich der Schwellwerte
der Testverteilung mit dem aus der Stichprobe ermittelten Wert. Die Schwellwerte sind so definiert, dass
sie die Grenze(n) fu
¨r die Annahme von H0 darstellen:
• Bei zweiseitige Tests sind es die α/2- und (1−α/2)Quantile,
• Bei einseitigen Tests ist es das (1 − α)- Quantil.
27.3 Test des Mittelwertes µ
1. Nullhypothese H0:
– Entweder zweiseitiger Test auf Gleichheit µ = µ0
(z.B. “genau 400 g Nutella”),
– oder einseitiger Test auf Ungleichheit µ ≥ µ0 oder
µ ≤ µ0 (z.B. “mindestens 400 g Nutella” oder
“h¨ochstens 400 g Nutella”),
2. Die Testfunktion ist dieselbe wie bei der Ermittlung der Konfidenzintervalle, Kap. 28, wobei man den
bei den Konfidenzintervallen vorausgesetzten wahren
Wert µ durch die Nullhypothese µ0 ersetzt (die TestStatistik wird ja unter Annahme von H0 ermittelt!)
Bekannte Varianz:
Unbekannte Varianz:
Z=
√
¯
X−µ
0
n
σ
T =
∼ N (0; 1)
√
¯
X−µ
0
n
S
∼ T (n − 1)
3. Realisierung z von Z bzw. t von T aus der Stichprobe
4. Testentscheidung: H0 wird angenommen
– beim einseitigen Test auf µ ≥ µ0,
(n−1)
(n−1)
= −t1−α
falls z ≥ zα = −z1−α bzw. t ≥ tα
– beim zweiseitigem Test,
(n−1)
falls |z| ≤ z1− α2 bzw. |t| ≤ t1− α
2
27.3 (b) Beispiele und Aufgaben
.. weil so schließt er messerscharf, nicht
sein kann was nicht sein darf.
Christian Morgenstern
• L¨osen Sie das Nutellabeispiel fu
¨r α = 5% und 1%.
• Zeichnen Sie qualitativ die Testverteilung samt Annahme- und
Ablehnungsbereiche fu
¨r die Tests auf µ = µ0 und µ ≥ µ0
• Wie sehen die Annahme- und Ablehnungsbereiche sowie das
Kriterium fu
¨r die Testentscheidung fu
¨r den Test auf µ ≤ µ0
¨
aus? Andert
sich was, wenn man auf µ < µ0 anstelle µ ≤ µ0
testet?
• Von einer Zufallsgr¨oße hat man bereits das Konfidenzintervall
fu
¨r den Mittelwert berechnet: µ ∈ 50 ± 2. Kann man nun
ohne zus¨atzliche Rechnung fu
¨r dieselbe Fehlerwahrscheinlichkeit
α einen zweiseitigen Test z.B. auf µ0 = 47 oder µ0 = 51.5
durchfu
¨hren?
•
Bei einem Kfz-Hersteller wurde ein Teil der Motorenherstellung in ein neues Werk verlagert. Sowohl vor als auch nach
der Verlagerung wurde in Stichproben (Umfang in beiden F¨allen
n = 36) die PS-Zahl ermittelt. Man erhielt
– Vor der Verlagerung einen empirischen Mittelwert von 110
bei einer (als bekannt angenommenen) Varianz von 42,
– Nach der Verlagerung einen empirischen Mittelwert von 108
bei einer Varianz von 32
Hat sich die PS-Zahl “signifikant” (α = 5%) verschlechtert?
Fu
¨hren Sie den entsprechenden einseitigen Test an der Differenz
durch! Beru
¨cksichtigen Sie, dass die Differenz eine Varianz von
2
5 hat und das n > 30 ist!
27.3 (c) Zweiseitiger Test vs. Konfidenzintervalle
Beispiel fu
¨r eine t-Verteilung mit 8 Freiheitsgraden
P(t<−2.31)=α/2
P(t>+2.31)=α/2
w
t= 0
Ablehnungs− Annahme−
bereich
bereich
t= −2.31
T
Ablehnungs−
bereich
t= +2.31
Es gilt folgender wichtiger Zusammenhang:
Hat man ein empirisches Konfidenzintervall, so ergibt sich direkt auch das Ergebnis des zweiseitigen
Tests auf H0: µ = µ0:
• H0 abgelehnt, falls µ0 nicht im Konfidenzintervall,
• ansonsten wird H0 akzeptiert.
Die Umkehrung: Konfidenzintervall aus Ergebnis eines
zweiseitigen Tests geht natu
¨rlich nicht!
27.4 Pru
¨fen des Anteilswertes θ
Setzt man die Gu
¨ltigkeit des Zentralen Grenzwertsatzes voraus, nθ0(1 − θ0) > 9, so sind die einseitigen
(θ ≥ θ0 bzw. θ ≤ θ0) und zweiseitigen Tests (θ = θ0)
sowie der Zusammenhang des zweiseitigen Tests mit dem
Konfidenzintervall identisch zu den Mittelwert-Tests fu
¨r
bekannte Varianz.
Es ¨andert sich nur der Ausdruck fu
¨r die standardnormalverteilte Testfunktion:
Z = √ f −θ0
θ0 (1−θ0 )
√
n
mit dem Stichprobenanteil (=relative H¨aufigkeit) f = nh .
27.5 Exkurs: Einige weitere statistische Tests
¨
• Varianztest: z.B. Uberpr
u
¨fen einer oberen zul¨assigen Grenze σ0
der Streuung von gaußverteilten Bruchlasten sicherheitsrelevanter Teile (oder Check der Streuungen beim obigen FlugzeugBeispiel):
– Nullhypothese: H0 = “Varianz σ 2 > σ02”,
Pn
(n−1)s2
¯ 2,
(Xi − X)
= 1
– Test-Statistik: Q =
2
σ0
2
σ0
i=1
– Realisierung q von Q aus der Stichprobe,
– H0 ist verworfen und damit zul¨assige Grenze u
¨berpru
¨ft, falls
fu
¨r die Stichproben-Realisierung u gilt: u ≤ χ2n−1,α mit
χ2n−1,α dem α-Quantil der χ2-Verteilung mit (n − 1) Freiheitsgraden.
• Differenztest der Erwartungswerte bei zwei verbundenen Stichproben Xi und Yi, i = 1, · · · , n (z.B. Xi: K¨orpergewicht
vor, und Yi: K¨orpergewicht nach einem Amerikabesuch): Fu
¨hre
die ganz normalen Mittelwert-Tests an der Differenzvariablen
Zi = Yi − Xi durch, z.B. mit der Nullhypothese Z ≥ z0 = 0.
• Zwei-Stichproben-Differenztest der Erwartungswerte zweier unabh¨
angigen Stichproben {Xi, i = 1, · · · , n} und {Yj , j =
1, · · · , m} (z.B. K¨orpergewichte von n Deutschen und m
Amerikanern gleichen Alters). Falls n > 30 und m > 30 ist
bei beliebigen Verteilungen die Testvariable
¯ − Y¯
X
Z=q
∼ N (0, 1).
2
2
S
Sx
y
+
n
m
Ansonsten siehe z.B. Baur, Kap. 14.6. oder Bohley Kap. 18
Document
Kategorie
Gesundheitswesen
Seitenansichten
18
Dateigröße
132 KB
Tags
1/--Seiten
melden