close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

3. Paneldaten 3.1 Was sind Paneldaten? Daten die bestimmte

EinbettenHerunterladen
3.
Paneldaten
3.1 Was sind Paneldaten?
Daten die bestimmte Einheiten (z.B. Personen, Firmen)
zu wiederholten Zeitpunkten beschreiben. Typisch sind:
Haushaltspanels, Firmenpanels, wiederholte
Konjunkturumfragen, möglich auch: gepoolte Zeitreihen,
gepoolte Querschnitte aggregierter Einheiten.
z.B. Deutsches Soziooekonomisches Panel
z.B. monatliche Makrodaten der EU
z.B. Schweizerische Arbeitskräfteerhebung (SAKE)
Unterscheidungen:
(i)
balanced panel: Für alle Beobachtungseinheiten liegen
Beobachtungen für alle Zeitpunkte vor. N (Einheiten) * T
(Zeitpunkte) Beobachtungen. Hier zentral.
unbalanced panel: Die Beobachtungen liegen nicht für
alle Einheiten für alle Zeiten vor. Durch Weglassen
könnte ein balanced panel erzeugt werden, aber Gefahr
dass durch Selektion Repräsentativität verloren geht.
(ii)
rotierendes Panel: Von vornherein begrenzte Anzahl
wiederholter Erhebungszeitpunkte z.B. SAKE, SIPP, dt.
Mikrozensus
permanentes Panel: Keine Begrenzung für Anzahl der
Wiederholungsbefragungen
1
2
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
Datensammlung:
Start der Stichprobe:
89
Rotierendes Panel (4 Jahre)
90
91
92
93
94
95
96
97
98
99
00
4
3
3.2. Vorteile und Nachteile von Paneldaten
(Diskussion bei Baltagi 2001, 1.2)
VORTEILE:
a.
Erlauben die Analyse von Verläufen über die Zeit
z.B. Querschnitt: 50 % Frauen erwerbstätig - offen ob
feste Gruppen 50 % ständig, 50 % nie erwerbstätig, oder
ob das Verhalten einzelner wechselt. Nur Paneldaten
erlauben zu unterscheiden, ob Wechsel zwischen
Erwerbstätigkeit und nicht-Erwerbstätigkeit vorkommen.
z.B. Dynamik der Arbeitslosigkeit. Querschnitt: Welcher
Anteil ist wann wie lange arbeitslos; wiederholte
Querschnitte: wie ändern sich die entsprechenden
Anteile; Panel: Welcher Anteil der Arbeitslosen wechselt
von Periode zu Periode in Erwerbstätigkeit
z.B. Querschnitt: 3 % der Bevölkerung erhalten
Fürsorge; wahre Verteilung der Dauer des Bezuges
unter allen Fürsorgeempfängern kann damit nicht geklärt
werden. Zu jedem Zeitpunkt überwiegt der Anteil
derjenigen, mit langen Bezugsdauern (length-biased
sampling). Mit Paneldaten kann individuelle
Bezugsdauer über die Zeit gemessen werden.
Durch wiederholte Beobachtung der gleichen Einheit
gelingt es, Entwicklungen in den Daten zu identifizieren,
die mit Querschnittsdaten nicht beschreibbar wären.
Dadurch können andere und verfeinerte Hypothesen
getestet werden als im Rahmen von Querschnittsdaten.
5
6
b.
Erlauben Kontrolle für beobachtete und
unbeobachtete Heterogenität
Beispiel: Zigarettennachfrage 1963-1988 in den US
Cit = f (Ci ,t −1 , Pit , Yit )
Bundesstaaten (i = 1,...52 ) :
Zusätzlich könnten bundesstaatspezifische Effekte (BEi)
- wie Religion und Bildung - und jahresspezifische
Effekte (JEt) - wie bundesweite Werbeaktionen - eine
Rolle spielen. Manche der Effekte sind messbar, andere
nicht.
Mit Querschnittsdaten können Jahreseffekte prinzipiell
nicht gemessen werden. Aber auch bei Querschnittsunterschieden gibt es Probleme z.B. Mormonen im Staat
Utah:
Ci = α + β 0 Ci ,t −1 + β1 Pi + β 2Yi + γ ⋅ Utahi + ε i
bei Querschnittsdaten kann ( nicht geschätzt werden,
da nur eine Beobachtung mit Utah = 1 vorliegt. Bei
Paneldaten wäre das möglich, da mehrere
Beobachtungen für Utah vorliegen.
Mit Zeitreihendaten (z.B. für gesamte USA oder einen
einzelnen Bundesstaat) können Bundesstaatseffekte
(BEi) prinzipiell nicht kontrolliert werden. Auch der Effekt
eines einzelnen Jahres ist nicht bestimmbar, da die
entsprechende Dummyvariable nur für eine
Beobachtung (z.B. Jahr 85) zutrifft; das ist nicht
schätzbar, da die Variation fehlt:
Ct = α + β 0 Ct −1 + β 1 Pt + β 2Yt + γ ⋅ Jahr85t + ε t
7
8
Selbst beobachtbare Heterogenität zwischen
Beobachtungseinheiten kann also z.T. nur mit
Paneldaten geschätzt werden.
Beobachtungseinheiten können sich durch unbeobachtbare Besonderheiten voneinander unterscheiden. Wenn
diese nicht gemessen werden können und aber mit den
abhängigen und den erklärenden Variablen korreliert
sind, sind die Schätzergebnisse verzerrt (omitted
variable bias).
yit = α + β 1 x1it + β 2 x2it + β 3 z i + ε it
Wahres Modell:
x1, x2, z exogene Variablen
i = 1, 2, ..., N
ε ~ N 0, σ 2
(
)
Geschätztes Modell:
t = 1, 2, ..., T
yit = α + β1 x1it + β 2 x2it +
µ it
mit µ it = β 3 z i + ε it , da zi nicht beobachtbar ist.
Beispiel: y
= Output
x1, x2 = Inputs
z = konstanter unbeobachtbarer Input
Ausgelassene Variable z führt zu verzerrter Schätzung,
wenn cov( z , x1 ) ≠ 0 oder cov( z, x2 ) ≠ 0 dann auch
cov(µ , x1 ) ≠ 0 oder cov(µ , x2 ) ≠ 0
Problem lässt sich durch Panelverfahren angehen.
9
10
c.
Reichhaltigere Datenbasis
Panels enthalten mehr Information und Variation als
Zeitreihendaten, weniger Kollinearität unter den
Variablen, und bieten mehr Freiheitsgrade für die
Analyse ("N > k"). Erklärende Variablen variieren über "i"
und "t". Effizientere Schätzung möglich, als bei
Zeitreihen oder gepoolten Querschnitten.
NACHTEILE:
a. Probleme bei der Datensammlung: Erinnerungsfehler
(recall bias), Einfluss des zeitlichen Rahmens und
Einfluss der Frequenz von Interviews (time-in-sample
bias).
b. Selektionsprobleme: Durch nicht zufällige Antwortverweigerung wird die Stichprobe unrepräsentativ,
ebenso durch Panelausfall ("Attrition") also Ausfall der
ganzen Befragungseinheit.
c. Probleme bei "kurzen" Panels (kleine Anzahl von
Wiederholungsbefragungen), wenn Eigenschaft des
Schätzers auf asymptotischen Argumenten beruht.
11
12
3.3 Schätzverfahren für Paneldaten
3.3.1
Allgemeines
Grundsätzlich geht es um die Korrektur von Problemen
unbeobachteter Heterogenität (z), wobei z auch im
Panel nicht beobachtet ist.
Wahres Modell
yit = α + β1 x1it + β 2 x2i + β 3 z i + ε it
Es werden 2 Ansätze unterschieden: Der Fixed Effects
Ansatz ("feste Effekte") geht davon aus, dass die
fehlende Variable für zi einen konkreten Wert annimmt,
den wir nicht beobachten.
Der Random Effects Ansatz ("zufällige Effekte" auch
"stochastische Effekte") geht davon aus, dass es einen
systematischen individuellen zufälligen Teil im
Fehlerterm gibt.
Ausgangslage
β 3 ⋅ zi
yit = α + β1 x1it + β 2 x2i + wi + ε it
Fixed Effects: w ist eine über die Zeit fixe Konstante,
deren Wert wir bestimmen wollen.
Random Effects: w ist eine individuell spezifische
Zufallsvariable, deren Verteilung wir bestimmen wollen.
13
14
3.3.2. Vorgehensweise beim Fixed Effects Schätzer
Da wir
yit = α + β1 x1it + β 2 x2i + wi + ε it
umschreiben können zu
yit = γ i + β1 x1it + β 2 x2i + ε it mit γ i = α + wi
wird der Fixed Effects Schätzer auch als Modell mit
individueller Regressionskonstante (γ i ) bezeichnet.
Methode 1: Für jede Beobachtung eine
Dummyvariable in der Spezifikation
berücksichtigen (LSDV=least squares
dummy variables)
yit = β1 x1it + β 2 x2i + γ 1 D1i + γ 2 D2i + γ 3 D3i + ... γ N DNi + ε it
N
yit = β1 x1it + β 2 x2i + ∑ γ j D ji + ε it
j =1
wobei
Dji = 1 wenn i = j
Dji = 0 wenn i ≠ j
i
t
yi
x1i
x2i
D1i D2i D3i ...
Dni
1
1
2
2
3
3
...
N
1
2
1
2
1
2
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
1
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
1
...
...
...
...
...
...
0
0
0
0
0
0
2
..
..
..
0
0
0
...
1
15
16
Da Dji nicht über die Zeit variiert, hat D keinen Zeitindex.
Wird ein vollständiger Satz an Dummyvariablen
berücksichtigt, so entfällt die Konstante, um Kollinearität
zu vermeiden. Das Modell ist per KQ schätzbar, die
Dummyvariablen fangen unbeobachtbare Heterogenität
auf.
Nachteil: Bei grosser Zahl von Beobachtungseinheiten
N, große Anzahl von N zusätzlichen erklärenden
Variablen. Während die β1 und β 2 Koeffizienten bei
hohem N konsistent und als KQ Schätzer unverzerrt
sind, sind die γ Koeffizienten nicht konsistent. Jeder
dieser Parameter wird nur durch eine kleine Anzahl von
Beobachtungen (T pro i) identifiziert.
[Bei KQ noch kein "incidental parameter" Problem, d.h.
Inkonsistenz der β1 und β 2 Koeffizienten wegen
Inkonsistenz der γ Koeffizienten.]
Die große Anzahl geschätzter Parameter führt - rein
technisch bedingt - zu hohen Werten für R2.
Methode 2: Within-Schätzer
Version a: Von Periode zu Periode
yit = β1 x1it + β 2 x2i + wi + ε it
yit −1 = β1 x1it −1 + β 2 x2i + wi + ε it −1
17
18
Differenz
yit − yit −1 = β1 ( x1it − x1it −1 ) + (ε it − ε it −1 )
Definiere:
yit * = yit − yit −1
x1it * = x1it − x1it −1
und schätze
yit * = β 1 x1it * +ε it *
Mit der ersten Differenz ist der fixe Effekt verschwunden
und β1 kann erwartungstreu geschätzt werden.
Anzahl der zu schätzenden Parameter sinkt von N + K
im Dummyvariablenmodell auf (höchstens) K. Nachteil:
β 2 nicht mehr schätzbar, da x2i ausdifferenziert wird.
Version b: Mittelwertbereinigung statt erste Differenzen,
gleiche Wirkung.
yit − yi = β1 ( x1it − x1i ) + (ε it − ε i )
Definiere:
yi =
1
∑ yit
T t
yit * * = yit − yi
xit * * = x1it − x1i
und schätze
yit * * = β1 xit * * + ε it * *
Auch hier ist β 2 nicht schätzbar
19
20
Da beide Versionen nur die Variation innerhalb einer
Beobachtung i nutzen, um die Parameter zu schätzen
(alle festen Differenzen zwischen den Beobachtungen i
werden ja durch die Differenzenbildung entfernt), spricht
man vom "Within Schätzer".
Verbeek (S.315): “The fixed effects model explains to
what extent yit differs from yi and does not explain why
yi is different from y j . The parametric assumptions
about β on the other hand, impose that a change in x
has the same effect, whether it is a change from one
period to the other or a change from one individual to the
other.”
Der Within Schätzer ist in beiden Versionen unverzerrt.
Er ist konsistent, wenn x1 strikt exogen ist, d.h. wenn gilt
E{xit , ε is } = 0 für alle s und t.
Unter den Standardannahmen (insbesondere sphärisch
verteilte Störterme) sollten Versionen a und b identisch
sein. CHECK: Ein Unterschied zwischen den Modellen
ergibt sich, wenn die Störprozesse autokorreliert sind.
Hier kann Version a zu effizienteren Ergebnissen führen
(z.B. wenn ε it einem random walk folgt: ε it = ε it −1 + µ it ).
Unter Standardannahmen sollten die Ergebnisse des
Within Schätzers denen des LSDV Modells (Methode 1)
entsprechen.
21
22
3.3.3. Vorgehensweise beim Random Effect Schätzer
Ausgangslage war
yit = α + β1 x1it + β 2 x2i + ωi + ε it
Random Effects: ω ist nicht eine fixe Konstante,
sondern eine individuell spezifische Zufallsvariable,
deren Verteilung wir bestimmen wollen.
Dazu machen wir folgende Annahmen:
α , die Konstante, sei für alle i und t identisch
cov( xkit , ωi ) = 0
∀i, t , k
...NEU !
cov(xkit , ε it ) = 0
∀i, t , k
...Standard
E (ε it )
E (ωi )
=0
=
0
=
σω2
( )
= σε
E (ε it , ω j )
=0
∀i, t , j
E (ε it , ε js )
=0
∀i ≠ j oder s ≠ t ...Standard
E (ωi , ω j )
=0
∀i ≠ j
E ε it
2
2
( )
E ωi
2
sphärische Verteilung
Unter diesen Annahmen kann das Modell mit dem KQ
Schätzer geschätzt werden. Die Schätzer für α und β
sind unverzerrt und konsistent, aber nicht effizient, da
die systematische Verteilung der Störterme nicht
23
24
berücksichtigt wurde. Die Schätzer der Standardfehler
für die KQ Schätzer sind daher verzerrt.
Was wissen wir über die Fehlertermvariation:
u it
=
ωi + ε it
E (u it )
=
0
( )
=
σω2 +σε 2
gegebene Person i
E (u it u is )
=
σω2
∀s ≠ t
versch. Personen
E (u it u jt )
=
0
∀i ≠ j
Definiere
dann
E u it
2
Da ωi nicht direkt geschätzt wird, geht ωi und σ ω in
die Fehlertermverteilung ein. Dies wird im Standard KQ
Schätzer nicht berücksichtigt und führt zur Ineffizienz.
Eine Korrektur kann über einen generalisierten KQ
Schätzer erfolgen, wie wir ihn aus der Behandlung von
Autokorrelations- und Heteroskedastieproblemen
kennen.
2
EXKURS:
Wiederholung GLS und FGLS Schätzer
Was ist ein generalisierter KQ-Schätzer?
Dieser war ein Lösungsansatz bei Problemen der
Heteroskedastie und Autokorrelation.
25
26
Wenn Var (ε it ) = σ 2 ⋅ Ω ,statt Var (ε it ) = σ 2 ⋅ I mit Ω ≠ I
ist der KQ-Schätzer ineffizient.
GLS: Wenn Ω bekannt ist:
Ω −1 = P' P
vormultiplizieren: P ⋅ y = P ⋅ xβ + P ⋅ ε
y* = x * β + ε *
schätze also:
Var (ε *it ) = P ⋅ σ 2 ⋅ Ω ⋅ P '
wobei jetzt:
=σ 2 ⋅I
Wenn E (ε * x *) = 0 , dann ist der GLS:
unverzerrt, konsistent, asymptotisch normalverteilt,
mit minimaler Varianz unter linearen, unverzerrten
Schätzern
FGLS: Wenn Ω unbekannt ist, muss es im Rahmne
des FGLS geschätzt werden. FGLS ergibt
effiziente Schätzer, wenn Ω konsistent
geschätzt werden kann.
Hier:
Nicht-sphärische Fehlerterm-VarianzKovarianzmatrix ≠ KQ-Annahme, aber nicht
Heteroskedastie/Autokorrelation, sondern die
für Paneldaten typische Struktur:
27
28
 Ω1
T × T
NT × NT

Ω =

0

Ω2
T ×T
Ideal wäre:
0 


 mit
...

ΩN 
T ×T 

σ 2

NT × NT
0
Ω =
 :

 0
ρ=
Definiere
1
ρ
T ×T
Ωi = 
:

ρ
NT × NT
Ω
Ω 1
 0
=
 :

 0
σ
:

ρ ... 1 
...
...
...
2
:
0
0
...
Ω2
...
:
0
...
...
(
...
σω 2 

...
σω 2 

...
:
2
2
... σ ε + σω 
0

0
... : 

... σ 2 
0
σω2
σε 2 +σω2
ρ ... ρ 
1 ... ρ 
:
σε 2+ σω 2
σω 2

T×T
σ 2
σ ε 2+ σ ω 2
Ωi =  ω
 :
:

2
2
σ
σ
ω
 ω
dann:
⋅ σε +σω
2
0 
0 
: 

ΩN 
2
)
mit Ω i = Ω j
∀ i, j
EXKURS ENDE.
29
30
Ω beschreibt die Korrelation in den Fehlertermen. Die
Struktur ist komplizierter als im Standard KQ Fall und
abhängig von ρ . Der Schätzwert für ρ zeigt an, ob
Korrelation über individuelle Beobachtungen existiert.
Wenn ρ = 0 , liegt keine unbeobachtete Heterogenität
der unterstellten Form vor.
Der feasible GLS Schätzer ist nur dann effizient und
konsistent, wenn die Annahmen, insbesondere
cov( xkit , ωi ) = 0 , erfüllt sind; wenn also die erklärenden x
Variablen nicht mit
zu.
ωi
korreliert sind. Dies trifft oft nicht
31
32
3.3.4
Bewertung von Fixed und Random Effects
Problem: Wenn unbeobachtete Faktoren wi die
abhängige Variable beeinflussen, aber im
Modell nicht kontrolliert werden, so sind KQ
Schätzer dann nicht mehr erwartungstreu,
wenn cov ( xi , wi ) ≠ 0 . Wenn cov( xi , wi ) = 0
aber σ ω ≠ 0 , dann ist der KQ Schätzer nicht
mehr effizient.
2
Lösung: Mit Fixed Effects, wenn unbeobachtete
Faktoren für jedes i konstant sind und
möglicherweise mit den erklärenden Variablen
korreliert sind.
Mit Random Effects, wenn die
unbeobachteten Faktoren nicht mit den
erklärenden Variablen im Modell korreliert
sind: cov (xi, wi) = 0. In diesem Fall wäre der
KQ Schätzer nicht verzerrt, aber ineffizient.
Besteht eine Korrelation mit den erklärenden
Variablen kann der Random Effects Schätzer
das Problem nicht lösen, KQ bleibt verzerrt.
Fixed Effects - Vorteile
-
weniger Annahmen für wi erforderlich
-
KQ unverzerrt auch bei Korrelation der Kovariate
mit den unbeobachteten festen Effekten, da diese
durch Differenzbildung beseitigt werden können
(wichtig!).
33
34
- LSDV Verfahren informiert über Werte der
individuellen Effekte, typischerweise von Interesse,
wenn N klein ist.
Fixed Effects - Nachteile
-
Der Einfluss konstanter Variablen kann nicht
identifiziert werden, er lässt sich nicht von Fixed
Effects unterscheiden (wichtig!)
-
Vorhersagen "out-of-sample" nicht ohne weiteres
möglich, da Parameter konditional auf tatsächliche
fixe Effekte berechnet.
E ( yit xit , wi )
= xit β + wi
Fixed Effects:
Random Effects: E ( yit xit )
= xit β
Verfahren sinnvoll, wenn Beobachtungen über die
gesamte Bevölkerung (statt Stichprobe) vorliegt,
z.B. alle Unternehmen einer bestimmten Art
-
"incidental parameter problem" bei kleinem T und
hohem N werden fixe Effekte selbst kaum
konsistent geschätzt (wichtig bei nichtlinearen
Modellen)
Random Effects - Vorteile
-
wenn Verteilungsannahmen hinsichtlich des
Random Effektes korrekt sind, existiert ein
effizienter Schätzer
35
36
-
Schlussfolgerung nicht auf Stichprobe bedingt.
Random Effects - Nachteile
-
Annahmen hinsichtlich des Random Effects wi nötig
-
Bei Korrelation des Random Effekts mit den
erklärenden Variablen ist die Schätzung verzerrt.
3.3.5
Fixed oder Random Effects? Ein Test
Testidee:
Prüfe ob die Annahme der Unkorreliertheit
("Orthogonalität") von erklärenden
Variablen und unbeobachtetem Faktor
H 0 : cov( xit , wi ) = 0
zutrifft.
H 1 : cov( xit , wi ) ≠ 0
Hausman-Test Grundprinzip
Schätzer 1 (z.B. GLS bzw. Random Effects)
- konsistent und effizient unter H0
- nicht konsistent unter H1
Schätzer 2 (z.B. KQ bzw. Fixed Effects)
- konsistent aber nicht effizient unter H0
- konsistent unter H1
37
38
Hausman-Test hier:
H0: der inviduenspezifische unbeobachtete Störterm
ωi und die erklärenden Variablen Xit sind unkorreliert
H1: ... korreliert
Unter H0 (keine Korrelation)
GLS (Random Effects) ist konsistent und effizient
KQ (Fixed Effects) ist konsistent, aber ineffizient
Unter H1 (Korrelation)
GLS (Random Effects) inkonsistent
KQ (Fixed Effects) konsistent
β FE ≈ β RE da beide konsistent
Also, unter H0:
β FE ≠ β RE da RE inkonsistent
unter H1:
Test-Statistik:
(
)
(
)
'
ˆ −1 βˆ FE − βˆ RE ~ χ 2
H = βˆ FE − βˆ RE ∑
k
k = Anzahl der Steigungsparameter in beiden β
Vektoren
Σˆ = geschätzte Varianz der Differenz der beiden
Schätzer
(
)
( )
( )
FE
RE
= Var βˆ FE − Var βˆ RE
= Var βˆ − βˆ
39
40
obwohl allgemein
Var ( x − y ) = Var ( x ) + Var ( y ) − 2 ⋅ Cov ( x, y ) ;
Hausmann hat gezeigt, dass die Kovarianz eines
e
effizienten Schätzers β mit seiner Differenz von einem
i
ineffizienten Schätzers β null ist.
Daher:
[(
) ]
(
)
( )
Cov β i − β e , β e = Cov β i , β e − Var β e = 0
(
)
( )
i
e
e
<=> Cov β , β = Var β
also hier: Var ( x − y ) = Var ( x ) + Var ( y ) − 2 ⋅ Var ( y )
= Var ( x ) − Var ( y )
41
42
Document
Kategorie
Gesundheitswesen
Seitenansichten
9
Dateigröße
191 KB
Tags
1/--Seiten
melden