close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Kapitel 3: Paneldaten 3. Paneldaten 3.1 Was sind Paneldaten? 3.2

EinbettenHerunterladen
Kapitel 3: Paneldaten
3. Paneldaten
3.1
Was sind Paneldaten?
3.2
Vorteile und Nachteile von Paneldaten
3.3
Schätzverfahren für Paneldaten
3.1 Was sind Paneldaten?
Daten, die bestimmte Einheiten (z.B. Personen, Firmen) zu wiederholten Zeitpunkten beschreiben. Typisch sind: Haushaltspanels, Firmenpanels, wiederholte Konjunkturumfragen, möglich auch: gepoolte Zeitreihen, gepoolte Querschnitte aggregierter Einheiten.
Zum Beispiel Deutsches Sozio-ökonomisches Panel (SOEP), monatliche Makrodaten der
EU, Schweizerische Arbeitskräfteerhebung (SAKE).
Unterscheidungen:
(i)
balanced panel: Für alle Beobachtungseinheiten liegen Beobachtungen für alle Zeitpunkte vor. N (Einheiten) * T (Zeitpunkte) Beobachtungen. Hier zentral.
unbalanced panel: Die Beobachtungen liegen nicht für alle Einheiten für alle Zeiten
vor. Durch Weglassen könnte ein balanced panel erzeugt werden, aber Gefahr, dass
durch Selektion Repräsentativität verloren geht.
(ii) rotierendes Panel: Von vornherein begrenzte Anzahl wiederholter Erhebungszeitpunkte z.B. SAKE, SIPP, Mikrozensus
permanentes Panel: Keine Begrenzung für Anzahl der Wiederholungsbefragungen
(iii) kurzes vs. langes Panel: großes vs. kleines T
(iv) zeitlich variante und zeitlich invariante, erklärende Variablen (xit kann über alle t konstant sein).
3–2
Rotierendes Panel (4 Jahre)
Datensammlung: 89
Start der Stichprobe:
90
91
92
93
94
95
96
97
98
99
00
1989
1990
1991
1992
1993
1994
1995
1996
1997
3–3
3.2. Vorteile und Nachteile von Paneldaten
(Diskussion bei Baltagi, 2001, 1.2)
3.2.1 Vorteile
a) Erlauben die Analyse von Verläufen über die Zeit
z.B. Querschnitt: 50 % Frauen erwerbstätig – offen, ob feste Gruppen 50% ständig, 50%
nie oder ob das Verhalten einzelner wechselt. Paneldaten erlauben zu unterscheiden:
z.B. Dynamik der Arbeitslosigkeit. Querschnitt: Welcher Anteil ist wann wie lange arbeitslos; wiederholte Querschnitte: wie ändern sich die entsprechenden Anteile; Panel: Welcher Anteil der Arbeitslosen wechselt von Periode zu Periode und unter welchen Bedingungen in die Erwerbstätigkeit.
Durch wiederholte Beobachtung der gleichen Einheit gelingt es, Entwicklungen in den
Daten zu identifizieren, die mit Querschnittsdaten nicht beschreibbar sind. Dadurch können andere und verfeinerte Hypothesen getestet werden als im Rahmen von Querschnittsdaten.
3–4
b) Erlauben Kontrolle für beobachtete und unbeobachtete Heterogenität
Beispiel: Zigarettennachfrage 1963-1988 in den US Bundesstaaten (i = 1,...,52 ) :
Cit = f (Ci ,t −1 , Pit , Yit )
Zusätzlich könnten bundesstaatspezifische Effekte (BEi) (z.B. Religion und Bildung) und
jahresspezifische Effekte (JEt) (z.B. bundesweite Werbeaktionen) eine Rolle spielen.
Mit Querschnittsdaten können Jahreseffekte prinzipiell nicht gemessen werden. Aber
auch bei Querschnittsunterschieden gibt es Probleme z.B. Mormonen im Staat Utah:
Ci = α + β 0 Ci ,t −1 + β1 Pi + β 2Yi + γ ⋅ Utahi + ε i
Bei Querschnittsdaten kann γ nicht geschätzt werden, da nur eine Beobachtung für Utah
vorliegt. Bei Paneldaten wäre das möglich, da mehrere Beobachtungen für Utah vorliegen.
Mit Zeitreihendaten (z.B. für gesamte USA oder einen einzelnen Bundesstaat) können
Bundesstaatseffekte (BEi) prinzipiell nicht kontrolliert werden. Auch der Effekt eines einzelnen Jahres ist nicht bestimmbar, da die entsprechende Dummyvariable nur für eine
3–5
Beobachtung (z.B. Jahr 85) zutrifft; das ist nicht schätzbar, da die Variation fehlt: Selbst
beobachtbare Heterogenität zwischen Beobachtungseinheiten kann also z.T. nur mit Paneldaten geschätzt werden.
Beobachtungseinheiten können sich zusätzlich durch unbeobachtbare Besonderheiten
voneinander unterscheiden. Wenn diese nicht gemessen werden können, aber mit den
abhängigen und den erklärenden Variablen korreliert sind, sind die Schätzergebnisse
verzerrt (omitted variable bias).
yit = α + β 1 x1it + β 2 x2it + β 3 z i + ε it
Wahres Modell:
x1, x2, z exogene Variablen
Geschätztes Modell:
i = 1, 2, ..., N
t = 1, 2, ...,
T
ε ~ N (0, σ 2 )
yit = α + β1 x1it + β 2 x2it + μ it
mit μ it = β 3 z i + ε it , da zi nicht beobachtbar.
3–6
Beispiel: y
= Output
x1, x2 = Inputs
z
= konstanter unbeobachtbarer Input (z.B. Managementqualität)
Ausgelassene Variable z führt zu verzerrter Schätzung. Wenn cov( z , x1 ) ≠ 0 oder
cov( z , x2 ) ≠ 0 , ist auch cov(μ , x1 ) ≠ 0 oder cov(μ , x2 ) ≠ 0 . Durch Panelverfahren lösbar.
c) Reichhaltigere Datenbasis
Panels enthalten mehr Information und Variation als Zeitreihendaten, weniger Kollinearität unter den Variablen, und bieten mehr Freiheitsgrade für die Analyse ("N > K"). Erklärende Variablen variieren über "i" und "t". Effizientere, d.h. präzisere Schätzung möglich
als bei Zeitreihen oder gepoolten Querschnitten.
3.2.2 Nachteile
a) Allgemeine Probleme bei der Datensammlung: Erinnerungsfehler (recall bias), Einfluss des zeitlichen Rahmens des Interviews (Belastung vs. Genauigkeit) und Einfluss
3–7
der Frequenz von Interviews (time-in-sample bias bei rotierenden Panelbefragungen),
Paneleffekte.
b) Selektionsprobleme: Durch nicht zufällige Antwortverweigerung wird die Stichprobe
unrepräsentativ, ebenso durch Panelausfall ("Attrition").
c) Probleme bei "kurzen" Panels (kleine Anzahl von Wiederholungsbefragungen), wenn
Eigenschaft des Schätzers auf asymptotischen Argumenten beruht.
d) Bei wiederholten Beobachtungen für jede Beobachtung i kann man nicht davon ausgehen, dass die KQ-Residuen unkorreliert sind. Selbst bei Verwendung von Panelschätzverfahren müssen die Standardfehler der Parameter noch mit Vorsicht betrachtet werden (vgl. Cameron und Trivedi, 2005, 21.2.3).
3–8
3.3 Schätzverfahren für Paneldaten
3.3.1 Allgemeines
Grundsätzlich geht es um die Korrektur von Problemen unbeobachteter Heterogenität (z),
wobei z auch im Panel nicht beobachtet ist.
Wahres Modell
yit = α + β1 x1it + β 2 x2i + β 3 zi + ε it
Es werden meist 2 Ansätze unterschieden: Der Fixed Effects Ansatz ("feste Effekte") geht
davon aus, dass die fehlende Variable zi einen konkreten Wert annimmt, den wir nicht
beobachten.
Der Random Effects Ansatz ("zufällige Effekte", auch "stochastische Effekte") geht davon
aus, dass es einen systematischen individuellen zufälligen Teil im Fehlerterm gibt.
Ausgangslage
β 3 ⋅ zi
yit = α + β1 x1it + β 2 x2i + wi + ε it
3–9
Fixed Effects: w ist eine über die Zeit fixe individuelle Konstante, deren Wert wir wie den
eines Parameters, also auch als Zufallsvariable, bestimmen wollen.
Random Effects: w ist eine individuell spezifische Zufallsvariable, deren Verteilung wir
bestimmen.
3.3.2. Vorgehensweise beim Fixed Effects Schätzer
Da wir yit = α + β 1 x1it + β 2 x2i + wi + ε it umschreiben können zu yit = γ i + β 1 x1it + β 2 x2 i + ε it
mit γ i = α + wi wird der Fixed Effects Schätzer auch als Modell mit individueller Regressionskonstante (γ i ) bezeichnet.
3–10
Methode 1: Für jede Beobachtung eine Dummyvariable in der Spezifikation berücksichtigen (LSDV=least squares dummy variables estimator)
yit = β1 x1it + β 2 x2i + γ 1 D1i + γ 2 D2i + γ 3 D3i + ... γ N DNi + ε it
N
yit = β1 x1it + β 2 x2i + ∑ γ j D ji + ε it
j =1
Dji = 0, wenn i ≠ j
wobei
Dji = 1, wenn i = j und
i
t
yi
x1i
x2i
D1i D2i D3i ...
DNi
1
1
..
..
..
1
0
0
...
0
1
2
..
..
..
1
0
0
...
0
2
1
..
..
..
0
1
0
...
0
2
2
..
..
..
0
1
0
...
0
3
1
..
..
..
0
0
1
...
0
3
2
..
..
..
0
0
1
...
0
..
..
..
..
..
..
..
..
…
..
N
2
..
..
..
0
0
0
...
1
3–11
Da Dji nicht über die Zeit variiert, hat D keinen Zeitindex. Wird ein vollständiger Satz an
Dummyvariablen berücksichtigt, so entfällt die Konstante, um Kollinearität zu vermeiden.
Das Modell ist per KQ schätzbar, die Dummyvariablen fangen unbeobachtbare Heterogenität auf.
Nachteil:
(a) Bei großer Zahl von Beobachtungseinheiten N, N zusätzliche erklärende Variablen.
Während die β1 Koeffizienten bei hohem N konsistent und als KQ Schätzer unverzerrt
sind, sind die γ Koeffizienten nicht konsistent. Jeder dieser Parameter wird nur durch
eine kleine Anzahl von Beobachtungen (T pro i) identifiziert.
(b) β 2 nicht mehr schätzbar, der Effekt zeitlich konstanter beobachtbarer Variablen lässt
sich nicht vom Effekt zeitlich konstanter unbeobachtbarer Variablen unterscheiden.
Bei KQ noch kein "incidental parameter" Problem für β, d.h. keine Inkonsistenz der Koeffizienten wegen Inkonsistenz der γ Koeffizienten, ändert sich bei nicht linearen Modellen.
Die große Anzahl geschätzter Parameter führt - rein technisch bedingt - zu hohen Werten
für R2.
3–12
Methode 2: Within-Schätzer
Version 2a: Periodendifferenz („First Differencing“)
yit
= β 1 x1it + β 2 x2i + wi + ε it
yit −1
= β 1 x1it −1 + β 2 x2i + wi + ε it −1
Differenz
yit − yit −1 = β 1 ( x1it − x1it −1 ) + (ε it − ε it −1 )
Definiere:
yit * = yit − yit −1
x1it * = x1it − x1it −1
und schätze
yit * = β 1 x1it * +ε it *
Mit der ersten Differenz ist der fixe Effekt verschwunden und β1 kann erwartungstreu geschätzt werden.
~
Anzahl der zu schätzenden Parameter sinkt von N + K im Dummyvariablenmodell auf
~
~
(höchstens) K , wobei K die Anzahl der zeitlich variablen Kovariaten im Modell angibt.
Auch hier β 2 nicht mehr schätzbar, da x2i ausdifferenziert wird.
3–13
Version 2b: Mittelwertbereinigung
yit − yi = β1 ( x1it − x1i ) + (ε it − ε i )
Definiere:
yi =
1
∑ yit
T t
yit * * = yit − yi
xit * * = x1it − x1i
und schätze
yit * * = β 1 xit * * + ε it * * , so dass
βˆ
WI
⎛ N T
⎞
= ⎜⎜ ∑∑ x*it* ' x*it* ⎟⎟
⎝ i =1 t =1
⎠
−1
⎛ N T
⎞
⎜⎜ ∑∑ x*it* ' y*it* ⎟⎟
⎝ i =1 t =1
⎠
Auch hier ist β 2 nicht schätzbar.
Die konsistenten Fixed Effects Schätzer sind nur dann effizient, wenn der Zufallsstörterm
ε it einer sphärischen Verteilung folgt, also weder heteroskedastisch noch autokorreliert
ist. Bei Paneldatenmodellen ist besonders das Auftreten von Autokorrelation denkbar.
Das Problem kann auf zweierlei Art gelöst werden:
3–14
(i) Statt herkömmlicher Standardfehler werden robuste, White-korrigierte oder NeweyWest-Standardfehler berechnet.
(ii) Die Annahme sphärischer Störtermverteilung wird aufgehoben und stattdessen wird
auf die differenzierten Daten ein GLS Schätzer angewendet, der die Elemente der Varianz-Kovarianz Matrix von ε frei schätzt. Das Verfahren ist allgemeiner als die Standard FE-Vorgehensweise. Es ermöglicht selbst bei nicht-sphärisch verteilten ε eine effiziente Fixed Effects GLS Schätzung (vgl. Wooldridge 2002, 10.5.4 und 10.5.5, sowie
10.6.3 und 10.6.4).
Da beide Versionen 2a und 2b nur die Variation innerhalb einer Beobachtung i nutzen,
um die Parameter zu schätzen (alle festen Differenzen zwischen den Beobachtungen i
werden ja durch die Differenzenbildung entfernt), spricht man vom "Within Schätzer".
Verbeek (2004), S. 347: “Essentially, the fixed effects model concentrates on differences
‘within’ individuals. That is, it is explaining to what extent yit differs from yi and does not
explain why yi is different from y j . The parametric assumptions about β on the other
hand, impose that a change in x has the same (ceteris paribus) effect, whether it is a
3–15
change from one period to the other or a change from one individual to the other.”
Der Within Schätzer ist in beiden Versionen unverzerrt. Er ist konsistent, wenn x1 strikt
exogen ist, d.h. wenn gilt E {xit , ε is } = 0 für alle s und t.
Unter den Standardannahmen (insbesondere sphärisch verteilte Störterme) sollten Versionen a und b identisch sein. Ein Unterschied zwischen den Modellen ergibt sich, wenn
die Störprozesse im Originalmodell autokorreliert sind. Hier kann Version 2a zu effizienteren Ergebnissen führen, da die Differenzierung zu sphärischen Störtermen führen kann
(z.B. wenn ε it einem random walk folgt: ε it = ε it −1 + μ it ).
Unter Standardannahmen entsprechen die Ergebnisse des Within Schätzers denen des
LSDV Modells (Methode 1). Mit beiden Methoden erhalten wir im linearen Modell konsistente Schätzer für β1.
Die beiden Versionen des Within Schätzers unterscheiden sich hinsichtlich der Bedingungen, unter denen sie effizient sind.
Beide fordern, dass (i) E (ε it xi , wi ) = 0 , t=1,...T und (ii) die Matrix der Rechthandvariablen
vollen Rang hat.
3–16
Das „First Differencing“ Verfahren unterstellt als dritte (iii) Bedingung und Voraussetzung
für effiziente Schätzung, dass die Verteilung der ersten Differenz der Zufallsstörterme
Δε it = ε it − ε it −1 sphärisch ist, während das Verfahren der Mittelwertbereinigung voraussetzt, dass die Verteilung der Zufallsstörterme ε selbst sphärisch ist.
(
(ε
Ann. zu Version 2a:
E Δε i Δε i'
Ann. zu Version 2b:
E
i
ε i'
)
xi1 , ... xiT , wi = σ Δ2ε I T −1
)
xi , wi = σ ε2 I T .
Diese Annahmen können nicht gleichzeitig erfüllt sein. Wenn es keine Autokorrelation in
Δεi gibt und Δε it = ε it − ε it −1 ⇔ ε it = ε it −1 + Δε it ,
dann folgt εit einem random walk, der deutliche Autokorrelation in εi impliziert.
Je nachdem welche der Annahmen gilt, ist die eine oder andere Version effizient, was
getestet werden kann. Nur für den Fall von T=2 führen beide Vorgehensweisen zu identischen Ergebnissen. Wenn T>2 hängt die Effizienz der Schätzung davon ab, ob die εit einem random walk folgen oder nicht autokorreliert sind.
3–17
(iv) Die Within Schätzer werden inkonsistent, wenn die erklärenden Variablen nicht strikt
exogen sind. Dies kann per Hausman-Test überprüft werden (vgl. Wooldridge 2002,
10.7.1).
3.3.3. Vorgehensweise beim Random Effects Schätzer
Ausgangslage war
yit = α + β1 x1it + β 2 x2i + ωi + ε it
Random Effects: ω ist nicht eine fixe Konstante, sondern eine individuell spezifische Zufallsvariable, deren Verteilung wir bestimmen wollen.
Dazu machen wir folgende Annahmen:
α , die Konstante, sei für alle i und t identisch
3–18
cov( xkit , ωi ) = 0
∀i, t , k
cov( xkit , ε it ) = 0
E (ε it )
∀i, t , k
=0
( )
E ε it
E (ε it , ω j )
2
E (ε it , ε js )
E (ωi , ω j )
= σε
E (ωi )
=
0
E ωi
=
σω2
( )
2
2
=0
∀i, t , j
=0
∀i ≠ j oder s ≠ t
∀i ≠ j
=0
sphärische Verteilung
Unter diesen Annahmen kann das Modell mit dem KQ Schätzer geschätzt werden. Die
Schätzer für α und β sind unverzerrt und konsistent, aber nicht effizient, da die systematische Verteilung der Störterme nicht berücksichtigt wurde. Die Schätzer der Standardfehler für die KQ Schätzer sind daher verzerrt.
3–19
Wir wissen über die Fehlertermvariation:
uit
Wenn
dann
E (u it )
( )
E u it
gegebene Person i
gegebene Periode t
Da
ωi
2
E (u it u is )
E (u it u jt )
=
ωi + ε it
=
0
=
σω2 +σε 2
=
σω2
=
0
nicht direkt geschätzt wird, geht
∀s ≠ t
∀i ≠ j
ωi und σ ω
2
in die Fehlertermverteilung ein. Dies
wird im Standard KQ Schätzer nicht berücksichtigt und führt zur Ineffizienz. Eine Korrektur kann über einen generalisierten KQ (GLS) Schätzer erfolgen, wie wir ihn aus der Behandlung von Autokorrelations- und Heteroskedastieproblemen kennen.
Wenn Var (uit ) = σ 2 ⋅ Ω ,statt Var (uit ) = σ 2 ⋅ I , mit Ω ≠ I ist der KQ-Schätzer ineffizient.
3–20
GLS: Wenn Ω bekannt ist: Ω −1 = P' P
vormultiplizieren: P ⋅ y = P ⋅ β ′x + P ⋅ u
y * = β ′x * +u *
schätze also:
β GLS = ( x * x * )−1 ( x * y * )
so dass
wobei jetzt:
Var (u *it ) = P ⋅ σ 2 ⋅ Ω ⋅ P'
u =σ 2 ⋅I
Wenn E (u * x * ) = 0 , dann ist der GLS Schätzer unverzerrt, konsistent, asymptotisch normalverteilt, mit minimaler Varianz unter linearen, unverzerrten Schätzern
FGLS: Wenn Ω unbekannt ist, muss es im Rahmen des FGLS geschätzt werden.
FGLS ergibt effiziente Schätzer, wenn Ω konsistent geschätzt werden kann.
Hier:
Nicht-sphärische Fehlerterm-Varianz-Kovarianzmatrix mit der für Paneldaten typischen Struktur:
3–21
⎡Ω 1
⎢T ×T
⎢
Ω =⎢
NT × NT
⎢
⎢0
⎢⎣
Ω2
T ×T
0 ⎤
⎥
⎥
⎥
...
⎥
ΩN ⎥
⎦
T ×T ⎥
⎡σ ε 2 + σ ω 2
σω2
⎢
σω2
σ ε 2+ σ ω 2
Ωi = ⎢
⎢
:
:
T ×T
⎢
2
σω2
⎣⎢ σ ω
Ideal wäre:
⎡σ 2 0
⎢
0 σ2
Ω =⎢
NT × NT
⎢ :
:
⎢
0
⎣0
... 0 ⎤
⎥
... 0 ⎥
... : ⎥
⎥
... σ 2 ⎦
Definiere
σω2
ρ= 2
σε +σω2
dann:
σω2 ⎤
...
⎥
σω2 ⎥
...
⎥
...
:
2
2⎥
... σ ε + σ ω ⎦⎥
3–22
⎡1
⎢ρ
Ωi = ⎢
⎢:
T ×T
⎢
⎣ρ
ρ ... ρ ⎤
1 ... ρ ⎥
:
ρ
⎡Ω 1
⎢0
Ω =⎢
NT × NT
⎢ :
⎢
⎣0
(
⎥ ⋅ σε 2 +σω2
... : ⎥
⎥
... 1 ⎦
)
0 ⎤
0 ⎥
⎥ mit Ω i = Ω j
... : ⎥
⎥
... Ω N ⎦
0
...
...
Ω2
:
0
∀ i, j
Wenn u it = ω i + ε it , dann u i = ω i jT + ε i , wobei jT ein T x 1 Vektor von Einsen ist und εi der
T x 1 Vektor aller Ausprägungen von ε für Beobachtung i ist.
(
)
Ω ≡ E u i u i′ ist die gleiche T x T Matrix für alle i,
Ω = σ ε2 I T + σ w2 jT jT′ ist die Random Effects Struktur, die nur durch die Parameter σε2
und σω2 bestimmt wird. Mit Schätzwerten für σε2 und σω2 lässt sich Ωˆ 2 ≡ σˆ ε2 I T + σˆ ω jT j ′
3–23
−1
N
⎛ N
ˆ −1 x ⎞⎟ ⎛⎜ x ′ Ω
ˆ −1 y ⎞⎟
′
x
=
Ω
⎜
∑
∑
RE
i
i
i
i .
bestimmen, so dass
⎠ ⎝ i =1
⎠
⎝ i =1
2
Wooldridge, 2002, S. 260 f. beschreibt, wie σˆ ε2 und σˆ ω bestimmt werden.
βˆ
Ω beschreibt also die Korrelation in den Fehlertermen und ist für alle Beobachtungen i
identisch. Die Struktur ist komplizierter als im Standard KQ Fall. Während Ω im allgemeinen GLS Fall aus T⋅(T+1) / 2 Parametern besteht, sieht die Random Effects Struktur nur
2
die Parameter σ ω und ρ vor. Der Schätzwert für ρ zeigt an, ob Korrelation über individuelle Beobachtungen existiert, bzw. welche Bedeutung ωi relativ zu
ρ = 0 , liegt keine unbeobachtete Heterogenität der unterstellten Form vor.
ε it hat.
Wenn
Der feasible GLS Schätzer ist nur dann effizient und konsistent, wenn die Annahmen,
insbesondere cov( xkit , ωi ) = 0 , erfüllt sind; wenn also die erklärenden x Variablen nicht mit
ωi
korreliert sind. Dies trifft oft nicht zu.
3–24
Verallgemeinerung
Der Random Effects Schätzer wurde für eine spezifische Form der Varianz–Kovarianz–
Matrix Ω entwickelt. Auch wenn tatsächlich eine andere Ausprägung von Ω vorliegt, ergibt
der RE Schätzer konsistente Parameterschätzungen. Da dann die Standardfehler inkonsistent geschätzt werden, benötigt man in diesem Fall flexiblere Annahmen bezüglich Ω,
um zu korrekter statistischer Inferenz zu gelangen. Zwei Abweichungen von den Annahmen der RE – Struktur von Ω sind besonders häufig:
′ ⎞
′⎞
′ ⎞
⎛
⎛
⎛
(a) E ⎜⎝ ui u i xi ⎟⎠ ist nicht konstant, so dass E ⎜⎝ ui u i xi ⎟⎠ ≠ E ⎜⎝ u i u i ⎟⎠
(b) Die
ε it Störterme
haben keine sphärische Verteilung. d.h. die Varianzen sind nicht
konstant, z. B. über die Zeit, oder die Störterme sind autokorreliert.
In diesem Fall ist die Schätzung einer „robusten“ Varianz–Kovarianz–Matrix den Annahmen der RE Struktur vorzuziehen (White–Schätzer).
Alternativ, wenn die ε it einer nicht sphärischen Verteilung folgen, lässt sich Ω auf Basis
3–25
KQ
von KQ – Residuen uˆit wie folgt schätzen: Ωˆ = N −1
N
∑
i =1
uˆitKQ uˆitKQ'
ˆ führt bei großen N zu effizienteren Schätzern als die RE Struktur, wenn letzteDieses Ω
ˆ wegen der Vielzahl seiner Elemente
re nicht vorliegt. Bei kleinen N kann Ω
(T(T+1)/2) nicht präzise geschätzt werden.
3.3.4 Bewertung von Fixed und Random Effects
Problem: Wenn unbeobachtete Faktoren wi die abhängige Variable beeinflussen, aber im
Modell nicht kontrolliert werden, so sind KQ Schätzer dann nicht mehr erwar2
tungstreu, wenn cov ( xi , wi ) ≠ 0 . Wenn cov( xi , wi ) = 0 , aber σ ω ≠ 0 , dann ist
der KQ Schätzer nicht mehr effizient.
Lösung: Mit Fixed Effects, wenn unbeobachtete Faktoren für jedes i konstant sind und
möglicherweise mit den erklärenden Variablen korreliert sind.
Mit Random Effects, wenn die unbeobachteten Faktoren nicht mit den erklärenden Variablen im Modell korreliert sind: cov (xi, wi) = 0. In diesem Fall wäre
3–26
der KQ Schätzer nicht verzerrt, aber ineffizient. Besteht eine Korrelation mit
den erklärenden Variablen, kann der Random Effects Schätzer das Problem
nicht lösen, KQ bleibt verzerrt.
Fixed Effects – Vorteile:
– weniger Annahmen für wi erforderlich
– KQ unverzerrt auch bei Korrelation der Kovariate mit den unbeobachteten festen Effekten, da diese durch Differenzbildung beseitigt werden können (wichtig!).
– LSDV Verfahren informiert über Werte der individuellen Effekte, gelegentlich von Interesse, wenn N klein ist.
Fixed Effects – Nachteile:
– Der Einfluss konstanter Variablen kann nicht identifiziert werden, er lässt sich nicht von
Fixed Effects unterscheiden (wichtig!)
– Vorhersagen "out-of-sample" nicht ohne weiteres möglich, da Parameter konditional
auf tatsächliche fixe Effekte berechnet.
3–27
Fixed Effects:
E ( yit xit , wi )
Random Effects:
E ( yit xit )
= β ′xit + wi
= β ′xit
Verfahren sinnvoll, wenn Beobachtungen über die gesamte Bevölkerung (statt Stichprobe) vorliegt, z.B. alle Unternehmen einer bestimmten Art
– "incidental parameter problem": Bei kleinem T und hohem N werden fixe Effekte selbst
kaum konsistent geschätzt (wichtig bei nichtlinearen Modellen)
Random Effects – Vorteile:
– wenn Verteilungsannahmen hinsichtlich des Random Effects korrekt sind, existiert ein
effizienter Schätzer
– Schlussfolgerung nicht auf Stichprobe bedingt.
Random Effects – Nachteile:
– Annahmen hinsichtlich des Random Effects wi nötig
– Bei Korrelation des Random Effects mit erklärenden Variablen ist Schätzung verzerrt.
3–28
– Unter den Annahmen des Random Effects Schätzers kann die Spezifikation keine verzögerten endogenen Variablen enthalten.
3.3.5 Fixed oder Random Effects? Ein Test
Testidee:
Prüfe, ob die Annahme der Unkorreliertheit ("Orthogonalität") von erklärenden Variablen und unbeobachtetem Faktor zutrifft.
H 0 : cov(xit , wi ) = 0
H 1 : cov(xit , wi ) ≠ 0
Hausman-Test Grundprinzip
Schätzer 1 (z.B. GLS bzw. Random Effects)
– konsistent und effizient unter H0
– nicht konsistent unter H1
Schätzer 2 (z.B. KQ bzw. Fixed Effects)
– konsistent, aber nicht effizient unter H0
– konsistent unter H1
3–29
Hausman-Test hier:
Unter H0 (keine Korrelation):
GLS (Random Effects) ist konsistent und effizient
KQ (Fixed Effects) ist konsistent, aber ineffizient
Unter H1 (Korrelation):
GLS (Random Effects) inkonsistent
KQ (Fixed Effects) konsistent
Also, unter H0:
unter H1:
β FE ≈ β RE , da beide konsistent
β FE ≠ β RE , da RE inkonsistent
(
)
(
)
2
FE
RE ' ˆ −1 ˆ FE
∑ β − βˆ RE ~ χ k
Test-Statistik: H = βˆ − βˆ
k = Anzahl der Steigungsparameter, die in beiden β Vektoren vorkommen
Σˆ = geschätzte Varianz der Differenz der beiden Schätzer
FE
RE
= Var βˆ FE − Var βˆ RE
= Var βˆ − βˆ
(
)
( )
( )
obwohl allgemein Var ( x − y ) = Var ( x ) + Var ( y ) − 2 ⋅ Cov ( x, y ) .
3–30
e
Hausmann hat gezeigt, dass die Kovarianz eines effizienten Schätzers β mit seiner Difi
ferenz von einem ineffizienten Schätzers β null ist:
[(
) ]
) = Var (β )
(
)
( )
Cov β i − β e , β e = Cov β i , β e − Var β e = 0
(
i
e
Somit folgt Cov β , β
und hier:
e
Var ( x − y ) = Var ( x ) + Var ( y ) − 2 ⋅ Var ( y )
= Var ( x ) − Var ( y )
Schwäche des Hausman-Tests: geringe Trennschärfe, H0 wird zu selten verworfen. Daher sollte immer auch ökonomische Intuition die Wahl des Ansatzes leiten.
3–31
Document
Kategorie
Gesundheitswesen
Seitenansichten
21
Dateigröße
86 KB
Tags
1/--Seiten
melden