close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

6. Prognose Was kann man nach Beobachtung einer Zeitreihe y1

EinbettenHerunterladen
6. Prognose
Was kann man nach Beobachtung einer Zeitreihe y1, . . . , yn
u
¨ber das zuku
¨nftige Verhalten der Zeitreihe Yn+k sagen? Man
unterscheidet prinzipiell
• die Prognose des Erwartungswertes E(Yn+k )
• die Progonse des eigentlichen Wertes Yn(k) = Yˆn+k
Beide Prognosen sind h¨aufig identisch, aber deren Varianzen
sind unterschiedlich!
Zeitreihenanalyse
1
Beispiel: Linearer Trend
Yt = α + β(t − t¯) + Zt
t = 1, . . . , n
mit {Zt} weisses Rauschen mit Varianz σ 2. Basierend auf den
KQ-Sch¨atzern α
ˆ und βˆ ergibt sich die k-Schritt-Prognose
ˆ
E(Yn(k)) = Yn(k) = α
ˆ + β((n
+ k) − t¯).
Je nach Problemstellung kann man nun die Varianz V (k) fu
¨r
den extrapolierten Trend oder die Varianz fu
¨r die zuku
¨nftige
Beobachtung Yn(k) angeben: V ar(Yn(k)) = σ 2 + V (k).
Zeitreihenanalyse
2
7.2 Extrapolieren von polynomialen Trends
Mindestens zwei Nachteile:
• Die Extrapolation wird schnell nach ±∞ ausschlagen, insbesondere fu
oherer Ordnung
¨r Polynome h¨
• Beobachtungen in der Vergangenheit haben einen zu starken
Einfluss auf die Prognose
Berechnung der Ein-Schritt-Prognosen fu
¨r Woll-Daten mit Polynomen der Ordnung d, Betrachtung des mittleren Prognosefehlers
300
(Ym(k) − ym+k )2/101
rmse =
m=200
Zeitreihenanalyse
3
0.15
d=1
d=2
d=3
d=4
d=5
d=6
d=7
d=8
0.00
0.05
0.10
rmse
0.20
0.25
Ergebnisse
2
4
6
8
10
k
Beachte: Alle Koeffizienten hochsignifikant!
Zeitreihenanalyse
4
Lokale Anpassung von Polynomen
z.B. Sch¨atzung eines linearen Trends basierend auf den r letzten
Beobachtungen; Betrachtung des mittleren Prognosefehlers fu
¨r
verschiedene Werte von r und k. → Tabelle 7.2, Buch Seite
192.
Verfahren schl¨agt (!) den globalen Ansatz for k ≤ 6 und alle
betrachteten Werte r = 3, 5, 10, 25.
Grund: Lokale Sch¨atzung eines linearen Trends sind besser fu
¨r
kurzfristige Prognosen, da lokale Trends in den Daten zuf¨allig
variieren.
Zeitreihenanalyse
5
7.3 Exponentielle Gl¨
attung
Idee: Verwende eine lineare Kombination der beobachteten
Daten zur Prognose mit exponentiell abnehmenden Gewichten
fu
¨r weiter zuru
¨ckliegende Werte:
n−1
Yn(k) =
wj yn−j
j=0
wj = α(1 − α)j fu
¨r 0 < α < 1
Beachte: Yn(k) h¨angt nicht von k ab
Ferner:
wj ≈ 1 fu
¨r grosses n.
Zeitreihenanalyse
6
Exponentielle Gl¨
attung II
Es ergibt sich:
Yn(k) = αyn + (1 − α)Yn−1(k)
→ Einfache Formel zum Aufdatieren von Vorhersagen so bald
neue Daten vorliegen.
Praktische Probleme des exponentiellen Gl¨attens:
• Wahl von α
• Kein Prognosefehler vorhanden
Beachte: α = 1 entspricht naivem Ansatz Yn(k) = yn
Zeitreihenanalyse
7
Daten und Ein-Schritt-Vorhersagen fu
¨r Woll-Daten
●
0.35
●●●
●●
●
●
●
●
●
0.30
Prognose
0.40
0.45
alpha=0.1
alpha=0.2
alpha=0.3
alpha=0.4
alpha=0.5
alpha=0.6
alpha=0.7
alpha=0.8
alpha=0.9
alpha=1
● ● ● ●● ●
● ● ●
●
● ●● ●
●
●
● ●●
●
●●
●
●
●
● ● ● ●
●
●
●● ●
●●
●●●
● ●
0.25
0.20
●
●
220
●
●
●
●
●
●
● ●●
●● ●●
●
● ● ●
●●
●
●
●●● ●
●● ●
●●
●●●●●●
●●●●
200
●●
●●
● ●●
240
260
280
300
Zeit
Zeitreihenanalyse
8
Beispiel: Wolldaten
Ergebnisse fu
¨r α = 0.1, 0.2, . . . , 1.0 und k = 1, 5, 10:
• Fu
¨r jeden Wert von k ist rmse minimal bei α = 1.0
• Der Unterschied ist deutlicher fu
¨r k = 1 und weniger deutlich
fu
¨r k = 5 und k = 10.
• rmse ist fu
¨r α = 1.0 durchwegs besser als alle vorher besprochenen Verfahren: lokale und polynomiale Gl¨attung
Zeitreihenanalyse
9
7.4 Der Box-Jenkings Ansatz zur Prognose
• Ausgangspunkt: Ein (gesch¨atztes) ARMA(p, q)-Modell
φ(B)Yt = θ(B)Zt,
ist immer darstellbar als MA(∞)-Prozess
∞
Yt =
θiZt−i
i=0
• Wir interessieren uns fu
¨r lineare Prognosen der Form
t−1
Yt(k) =
wj Yt−j
j=0
Zeitreihenanalyse
10
Der Box-Jenkings Ansatz II
Man erh¨alt
∞
t−1
Yt(k) =
∞
wj
j=0
θiZt−j−i =
i=0
Wj Zt−j ,
j=0
mit nicht n¨aher spezifizierten Gewichten Wj , was man zur
Berechnung des erwarteten quadrierten Prognosefehlers verwenden kann:
M = E[{Yt+k − Yt(k)}2]
∞
k−1
= σ2
θi2 +
i=0
Zeitreihenanalyse
(θi − Wi−k )2
i=k
11
Die optimale Prognose
Die optimale Prognose erh¨alt man durch Minimierung des
erwarteten quadrierten Prognosefehlers, also durch Wi = θi+k :
∞
Yt(k) =
∞
Wj Zt−j =
j=0
∞
θj+k Zt−j =
j=0
θiZt+k−i
i=k
Vergleicht man dies mit der Modellgleichung
∞
Yt+k =
θiZt+k−i
i=0
so sieht man, dass sich die optimale Prognose einfach aus
der Modelldefinition ergibt, wobei die zuku
¨nftigen Werte
Zt+1, . . . , Zt+k gleich Null gesetzt werden.
Zeitreihenanalyse
12
Der Prognosefehler
Der Prognosefehler ist definiert als Yt+k − Yt(k) und ergibt sich
zu
k−1
Yt+k − Yt(k) =
θiZt+k−i,
i=0
insbesondere gilt fu
¨r k = 1, dass der Prognosefehler gleich Zt+1
ist, da immer θ0 = 1 gilt.
Ausserdem folgt dass der erwartete Prognosefehler E(Yt+k −
Yt(k)) gleich null ist. → Mittlerer quadratischer Fehler =
Prognosevarianz
Zeitreihenanalyse
13
Die Prognosevarianz
Die Prognosevarianz ergibt sich zu
k−1
k−1
θiZt+k−i) = σ 2
V ar(Yt+k − Yt(k)) = V ar(
i=0
θi2
i=0
Diese kann man sch¨atzen durch “plug-in” von σ
ˆ 2 und θˆi. Dabei
wird die Unsicherheit der Sch¨atzungen ignoriert.
Zeitreihenanalyse
14
Beispiel: AR(1)-Prozess
Die optimale Ein-Schritt-Prognose im Modell
Yt+1 = αYt + Zt+1
ist Yt(1) = αYt. Allgemein ergibt sich Yt(k) = αk Yt. Analoge
Ergebnisse fu
¨r µ = 0.
Die Prognosevarianz ergibt sich zu
2k
1
−
α
M = σ2
,
2
1−α
was fu
¨r k → ∞ gegen die station¨are Varianz σ 2/(1 − α2) des
Prozesses strebt.
Zeitreihenanalyse
15
Beispiel: ARIMA(0,1,1)-Prozess
Fu
¨r
Yt = Yt−1 + Zt + βZt−1
erh¨alt man unter Verwendung von Zt = Yt − Yt−1(1) die EinSchritt-Prognose
Yt(1) = (1 + β)Yt − βYt−1(1).
Dies entspricht fu
¨r α = 1 + β (wg α ∈ [0, 1] also β ∈ [−1, 0])
der Rekursivformel beim exponentiellen Gl¨atten!
→ ARIMA-Ansatz erlaubt Sch¨atzung des Parameters α fu
¨r das
exponentielle Gl¨atten und Sch¨atzung des Prognosefehlers.
Zeitreihenanalyse
16
Fallstudien
• lynx: Luchsdaten
• nile: Wasserstand des Nils
Zeitreihenanalyse
17
8. Erweiterungen
• Zeitreihenanalyse mit Kovariablen
• Beru
¨cksichtigung von Saisoneffekten → SARIMA-Modelle
Zeitreihenanalyse
18
8.1 Zeitreihenanalyse mit Kovariablen
Betrachtung von Regressionsmodellen fu
¨r Zeitreihen, bei denen
die Residuen einem ARIMA-Prozess folgen.
p
Y˜t =
γixti + Yt
i=1
φ(B)Yt = θ(B)Zt
mit:
xti: Auspr¨agung der i-ten Kovariable zum Zeitpunkt t, γi:
entsprechender Kovariableneffekt
{Zt} weisses Rauschen
Zeitreihenanalyse
19
Beispiel: Biber-Daten
• library MASS, data(beav1) und data(beav2)
• Ko
¨rpertemperatur in Abst¨anden von 10 Minuten
• Kovariable: Tier ist innerhalb (x = 0) oder ausserhalb (x =
1) seines Schlupfwinkels
• Syntax in R Funktion arima(): In Option xreg= listet man
relevante Kovariablen
• Alternative: Prozedur gls()(“general least squares”) in
library(nlme), mit Option correlation=, wobei ein Element der vorhanden Korrelationsstrukturen verwendet werden muss, z.B. corAR1, corCAR1 oder corARMA.
Zeitreihenanalyse
20
8.2. Adjustierung fu
¨r Saisoneffekte
• Sch¨atzung durch Prozeduren decompose oder stl
• Regressionsansatz: Fu
¨ge Indikatoren fu
¨r jede relevante Einheit zu, z.B. fu
¨r Quartalsdaten Indikatoren fu
¨r alle 4 Quartale,
sch¨atze z.B. unter der Restriktion, dass die Summe Null ist.
• Alternative bei relativ grosser Periodenl¨ange (zum Beispiel Monats- oder Wochendaten): Regressionsansatz mit
u
¨berlagerten Sinusschwingungen wie beim Periodogramm
Zeitreihenanalyse
21
SARIMA Modelle
Vergleiche Option season= in arima()
SARIMA Modelle kombinieren
• ARIMA-Modelle fu
¨r die entsprechend saison-differenzierten
Daten mit
• ARIMA-Modelle fu
¨r die urspru
¨ngliche Zeitreihe
• Beispiel: Nottingham Temperature Data
Zeitreihenanalyse
22
Document
Kategorie
Gesundheitswesen
Seitenansichten
2
Dateigröße
128 KB
Tags
1/--Seiten
melden