close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

ANalysis Of VAriance (ANOVA) 1/2 - Seminar für Statistik

EinbettenHerunterladen
ANalysis Of VAriance (ANOVA) 1/2
Seminar für Statistik
Markus Kalisch | 16.10.2014 |
1
ANOVA - Idee
 ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und
Placebo (Faktor). Gibt es einen sign. Unterschied in der
Wirkung (kontinuierlich)?
 ~  +  1-weg ANOVA
 ANOVA 2: Zwei Medikamente zur Blutdrucksenkung,
Placebo (Faktor) und Geschlecht (Faktor). Gibt es einen
sign. Unterschied in der Wirkung (kontinuierlich) (evtl.
geschlechterspezifisch)?
 ~ 1 + 2 +  2-weg ANOVA
Seminar für Statistik
((Vorname Nachname)) | 16.10.2014 |
2
ANOVA: Mögliche Missverständnisse
 ANOVA = «Varianzanalyse»
Macht Aussagen über Mittelwerte (analysiert dazu
Varianzen)
 ANOVA = Spezialfall einer Linearen Regression
.  ~  + ℎ
 Verallgemeinerung des t-Test (2 Gruppen → viele
Gruppen)
 Historisch: Sehr verbreitet; heute: Immer noch extrem
verbreitet
Seminar für Statistik
Markus Kalisch | 16.10.2014 |
3
D: “Streuung” zwischen MW (“Signal”)
: “Streuung” um MW (“Fehler”)
Wdh: Ungepaarter t-Test
M
P
Medikament
Seminar für Statistik
5

-5
0
D
-10
0

Senkung Blutdruck [mmHg]
5 10
D
-10
Senkung Blutdruck [mmHg]

≈
;  0 :  ∼ −1 ≈ (0,1)

M
P
Medikament
Markus Kalisch | 16.10.2014 |
4
Streuung zwischen Gruppen:
“Between-Sum-of-Squares” ( )
RSS der Gruppenmittelwerte (rote Kreuze)
um den totalen Mittelwert (blaue Linie)
ANOVA: Idee
: ℎ  3
: ℎ .   10
Ann:  in jeder Gruppe gleich

 =  ∗
. − ..
2
20
5 10
2.
1.
..
Streuung innerhalb Gruppen:
“Within-Sum-of-Squares” ( )
RSS der Einzelbeobachtungen
(schwarze Kreise) um die einzelnen
Mittelwerte (rote Kreuze)
0

3.
-5
Senkung Blutdruck [mmHg]
=1
 =
 − .
2
=1 =1
M1
M2
Medikament
Seminar für Statistik

P

Teststatistik ≈  

Markus Kalisch | 16.10.2014 |
5
ANOVA: Teststatistik
M1
P
Medikament
Seminar für Statistik
0 5
15
B
-10
Senkung Blutdruck [mmHg]
0 5
15
A
-10
Senkung Blutdruck [mmHg]
In welchem Bild ist die Teststatistik der ANOVA grösser ?
M1
P
Medikament
Markus Kalisch | 16.10.2014 |
6
ANOVA: Modell
  =  +  +  ,  ~  0,  2 

Technische Nebenbedingung: =1  = 0
 0 : 1 = 2 = ⋯ =  = 0
 Teststatistik:  =
 /(−1)
 /(∗ −1 )
=


“Analyse der
Varianzen”
“Mean Squares”
 Theorie: Falls 0 stimmt
“Degrees of freedom (Df)”
 ~ −1,∗
−1
 Damit kann ein Hypothesentest mit den üblichen 6
Schritten durchgeführt werden
Seminar für Statistik
Markus Kalisch | 16.10.2014 |
7
Exkurs: Verteilungen
 Angenommen:  ~  0,1 ,  = 1, …  alle unabhängig

2
=
=1
Chi-Quadrat-Verteilung mit  Freiheitsgraden: A ~ 
 Angenommen:  ~ Χ ,  ~ Χ unabhängig
/
=
/
 F-Verteilung mit  und  Freiheitsgraden  ~ ;
Seminar für Statistik
Markus Kalisch | 16.10.2014 |
8
Beispiel in R: ANOVA-Tabelle
20
 = 872.3
 = 642.1
436.1
= 18.34
23.8
0
5 10
=
-5
Senkung Blutdruck [mmHg]
 = 3,  = 10
−1=2
M1
M2
P
g*(p-1)=27
Medikament
872.3
= 436.1
2
642.1
=
= 23.8
27
 =

Seminar für Statistik
Markus Kalisch | 16.10.2014 |
9
Wo ist der Unterschied ?
Teil 1: Paarweise Tests
 Falls ANOVA signifikant: Zwischen welchen Gruppen sind
signifikante Unterschiede ?
→ t-Tests für alle Gruppenpaare
 Problem: Multiples Testen
(−1)

Bei  Gruppen gibt es 2 =
t-Tests
2
Bsp:  = 20 → 190 Tests auf 5%-Niveau
Könnten etwa 0.05 ∗ 190 ≈ 10 falsch positive Tests haben
 Lösung: t-Test korrigieren (z.B. Bonferroni, …)
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 10
Beliebte Alternative bei ANOVA:
Tukey’s Honestly Significant Difference (HSD) Test
 Vorteil:
- Vertrauensintervalle für Differenzen der
Gruppenmittelwerte
- Wa., dass alle wahren Differenzen in den
Vertrauensintervallen liegen: 95%
 Alternative zum paarweisen t-Test
 Empfehlung: Tukey HSD verwenden
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 11
Beispiel in R: TukeyHSD
M2 ist deutlich wirksamer als M1
-15
-10
-5
0
5
20
5 10
0
M1
10
Differences in mean levels of g
Seminar für Statistik
-5
P-M2
P-M1
Senkung Blutdruck [mmHg]
M2-M1
95% family-wise confidence level
M1 und M2 sind deutlich
wirksamer als Placebo
M2
P
Medikament
Markus Kalisch | 16.10.2014 | 12
Wo ist der Unterschied ?
Teil 2: Allgemeine Kontraste
 Bisher: Differenz von zwei Gruppen
 Jetzt: Linearkombination von beliebigen Gruppen
 Bsp: Sind die beiden Medikamente im Mittel besser als
das Placebo ?
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 13

20
5 10
0
-5
 Vektor mit wahren
Gruppenmittelwerten:
 = 1 , 2 , 
 Kontraste-Matrix 
 Parameter-Vektor 
Senkung Blutdruck [mmHg]
Kontraste: Notation
M1
M2
P
Medikament
 0 :  ∗  = 
 Praxis: Benutzer definiert  und ; Computer berechnet
p-Werte für Hypothesen und korrigiert für mult. Testen
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 14
Konstraste – Bsp 1: Paarweise Vergleiche
(Alternative zu TukeyHSD)
K

m
2 − 1 = 0
 − 1 = 0
 − 2 = 0
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 15
Kontraste – Bsp 1: R
 Funktion ‘glht’ (General Linear Hypotheses Test) im
package ‘multcomp’
Approx. 95%-VI für Unterschied M1 vs. M2:
5.67 ± 2 ∗ 2.181
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 16
Kontraste – Bsp 2:
Gruppe der Medikamente vs. Placebo
Medikamente vs. Placebo
0.5 ∗ 1 + 0.5 ∗ 2 −  = 0
2 − 1 = 0
Medikamente untereinander
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 17
Kontraste – Bsp 2: R
Die Medikamente sind deutlich
wirksamer als Placebo
M2 ist deutlich wirksamer als M1
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 18
Kontraste
Angenommen, es gibt zwei Medikamente (M1, M2) und
auch zwei mögliche Formen von Placebo (P1, P2). Folgende
Matrix ist dann eine mögliche Kontrastmatrix für die
Vergleiche:
 (M1, M2) vs. (P1, P2)
 M1 vs. M2
 P1 vs. P2
• Ja
• Nein
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 19
Grundregeln für Kontraste
 Wenige Kontraste → viel Macht
 Software: Korrektur für multiples Testen innerhalb von
einem Funktionsaufruf (aber nicht bei mehreren
Funktionsaufrufen mit verschiedenen Kontrasten)
 Deshalb: Einen Satz von Kontrasten definieren, dann
auswerten; anschliessend keinen neuen Satz von
Kontrasten mehr untersuchen
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 20
Residuenanalyse bei ANOVA
 =  +  +  ,
 ~  0,  2 
1. Daten in jeder Gruppe normalverteilt
2. Gleiche Varianz in Gruppen
3. Unabhängige Fehler 
In R: Funktion “plot” wie bei Linearer Regression
Vorteil: “Balanciertes Experiment” (gleiche Anzahl pro Gruppe):
ANOVA ist robuster gegen Abweichungen obiger Annahmen
Seminar für Statistik
Markus Kalisch | 16.10.2014 | 21
Document
Kategorie
Gesundheitswesen
Seitenansichten
521
Dateigröße
586 KB
Tags
1/--Seiten
melden