close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Blatt 12

EinbettenHerunterladen
Generalisierte Regressionsmodelle
Gerhard Tutz, Florian Leitenstorfer
Blatt 12
WS 2006/07
Aufgabe 4.5:
Man betrachte wiederum ein nonparametrisches Regressionsmodell wie in Aufgabe 4.3. Aus der Vorlesung
ist bekannt, dass ein lokal konstanter (Nadaraya-Watson) Sch¨
atzer von f (.) an der Stelle x gegeben ist
durch
n
K((x − xj )/h)
ˆ
fh (x) =
yj ,
n
k=1 K((x − xk )/h)
j=1
wobei K(.) eine Kernfunktion darstellt. Gehen Sie nun von einem Datensatz (x, y) mit n Beobachtungen
¨
aus. Uberlegen
Sie sich zun¨achst, dass man den Nadaraya-Watson-Sch¨
atzer als linearen Smoother der
Form
ˆfh = Sh y
(1)
auffassen kann, wobei ˆfh = (fˆh (x1 ), . . . , fˆh (xn )) und Sh eine (n×n)-Smoothermatrix darstellt (dabei wird
der Sch¨atzer an den Beobachtungen xi , i = 1, . . . , n ausgewertet). Berechnen Sie nun f¨
ur den Datensatz
doppler (auf der Homepage der Vorlesung) einen Nadaraya-Watson-Sch¨
atzer gem¨
aß (1), indem Sie die
optimale Bandbreite mit Hilfe des GCV-Kriteriums,
n
GCV (h) = n−1
i=1
(yi − fˆh (xi ))2
(1 − tr(Sh )/n)2
bestimmen. W¨ahlen Sie h aus einem ¨aquidistanten Gitter von 9 Werten auf [0.01, 0.05]. Verwenden Sie
Gauß-Kerne, dnorm(). Geben Sie die optimale Bandbreite hopt (bzgl. GCV) und den zugeh¨
origen GCVScore an. Fertigen Sie einen Plot der gesch¨
atzten Kurve mit optimierter Bandweite an, in den Sie auch
die Daten einzeichnen (speichern!).
Aufgabe 4.6:
Der Datensatz geburt (Sie finden diesen auf der Homepage der Vorlesung) enth¨
alt Variablen u
¨ber n = 89
Neugeborene, die unmittelbar nach der Geburt in eine Intensivstation eingeliefert wurden. Auf der Homepage der Vorlesung findet man ein Handout mit der detaillierten Beschreibung der relevanten Variablen.
Als Response soll im Folgenden die Anzahl der in der Intensivstation verbrachten Tage INTENSIV nach
dem Einlieferungstag untersucht werden.
a) Lesen Sie den Datensatz geburt in R ein. Machen Sie sich mit den Variablen durch Berechnung explorativer Kenngr¨oßen vertraut. Betrachten Sie auch die Korrelationsmatrix zwischen der Zielgr¨
oße
INTENSIV mit den metrischen Kovariablen und interpretieren Sie diese kurz.
¨
Sie sich eine geeignete Verteilungsannahme f¨
ur ein GLM mit INTENSIV als Zielgr¨
oße.
b) Uberlegen
Ziehen Sie hierzu auch das Problem einer m¨
oglichen “Overdispersion” in Betracht. Fitten Sie ein
derartiges Modell mit den Haupteffekten aller Kovariablen. Kann man das Modell verbessern, indem man einen Interaktionsterm der kategorialen Kovariablen aufnimmt? Interpretieren Sie Ihr
gew¨ahltes Modell kurz.
Nun sollen nichtparametrische Gl¨attungsverfahren auf den Datensatz angewendet werden.
c) Laden Sie die R-library mgcv, um generalisierte additive Modelle (GAM) mit der Funktion gam()
fitten zu k¨
onnen. Machen Sie sich zun¨
achst mit dieser Funktion vertraut, indem Sie die Hilfe aufrufen. Fitten Sie nun ein GAM mit den in b) gew¨
ahlten Annahmen, nur mit der Einflussgr¨
oße
GEWICHT, diese glatt modelliert. Plotten Sie die gesch¨
atzte Kurve (linearer Pr¨
adiktor) mit der generischen Funktion plot(gam.object), zusammen mit den Konfidenzb¨
andern (Plot abspeichern!).
Was f¨allt Ihnen dabei auf?
¨
d) Fitten Sie nun ein GAM mit allen Kovariablen und den in b) gew¨
ahlten Annahmen. Uberlegen
Sie sich zuvor, welche Kovariablen sinnvollerweise nonparametrisch und welche parametrisch in das
Modell aufgenommen werden sollen und nehmen Sie neben den Haupteffekten auch den Interaktionsterm aus b) mit auf, falls Sie sich dort daf¨
ur entschieden haben. Speichern Sie das Summary ab
und plotten Sie alle gesch¨atzten Kurven Ihres Modells mit Konfidenzb¨
andern (speichern!). Interpretieren Sie diese.
e) Prognostizieren Sie mit dem Modell aus d) f¨
ur ein auf die Intensivstation eingelieferter neugeborener S¨augling, dessen Geburtsgewicht 3000 g betr¨
agt und das 47 cm groß ist, der nicht aus einer
Mehrlingsgeburt stammt und nicht durch einen Kaiserschnitt geboren wurde, das nach 36-w¨ochiger
Schwangerschaft geboren wurde, dessen Mutter 25 Jahre alt ist und am Ende der Schwangerschaft
65 kg wog, wie viele Tage er auf der Intensivstation bleibt.
Um an der Klausur teilzunehmen, bearbeiten Sie die Aufgaben 4.5 und 4.6 (beide!) korrekt. Geben Sie
die L¨
osungen bis sp¨
atestens zum 02.02.07 ab, vorzugsweise per e-Mail an florian.leitenstorfer@stat.unimuenchen.de. Die L¨
osungen m¨
ussen nachvollziehbar und reproduzierbar sein! Geben Sie also auf jeden
Fall den verwendeten R-Code ab. Sie k¨
onnen gerne in Zweier- oder Dreiergruppen arbeiten!
Document
Kategorie
Seele and Geist
Seitenansichten
4
Dateigröße
81 KB
Tags
1/--Seiten
melden