ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA

Post on 06-Feb-2016

89 views 0 download

description

ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA. Predikce. Predikce bodová a intervalová Ex ante a ex post. Predikce. Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná - PowerPoint PPT Presentation

transcript

1

ZÁKLADY EKONOMETRIE

4. cvičeníPREDIKCE

MULTIKOLINEARITA

2

Predikce

1. Predikce bodová a intervalová

2. Ex ante a ex post

3

Predikce

Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace

Ex-ante - podmíněná

Ex-post - pseudopředpověď

Dělení predikce

období

extrapolaci do budoucna,

extrapolace do minulosti nazývanou jako retrospektiva,

znalosti endogenní proměnné v období prognózy na

ex-post predikci, kdy známe hodnotu endogenní proměnné v období - pseudopředpověď,

ex-ante - klasické chápání předpovědi,

znalosti exogenních proměnných v období prognózy na

podmíněnou predikci – pro období předpovědi neznáme hodnoty exogenních proměnných, tyto hodnoty musíme také predikovat, předpověď Y je tedy podmíněná předpovědí hodnot X,

nepodmíněnou predikci – pro období předpovědi známe hodnoty exogenních proměnných.

4

5

Predikce Ex-Ante

Podmíněná volbou vysvětlující proměnnévysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu

Predikce může být bodová

nebo intervalová – v GiveWinu 2 možnosti:

Intervalovou předpověď můžeme interpretovat tak, že pro opakované výběry daný interval obsahuje se spolehlivostí (1 – α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.

Y sigma

T1 1

ˆ .T TY x b

*1 /2

ˆ ,T pY t s T T 11 ( )p T Ts s x X X x

6

Predikce Ex-post

Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou.

Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci)

H1: Chyba je statisticky významná

Testujeme pomocí t-statistiky

7

Příklad 1 – eko1.xls

Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu.

Y – maloobchodní obrat potřeb pro domácnost v mld. CZK

X1 – disponibilní příjem v mld. CZK

X2 – cenový index

Proveďte predikci bodovou a intervalovou pro disponibilní příjem 211 mld. CZK a cenový index 113.

Ověřte, zda je model vhodný k predikci pomocí ex-post predikce.

Ekonomická specifikace

= tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu

b0 – úrovňová konstanta může být libovolná, vzniká z podmínky, aby součet čtverců reziduí byl minimální

b1 – v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami

b2 – by mělo být < 0

Příklad – eko1.xls

EQ( 1) Modelling y by OLS (using eko1.xls) The estimation sample is: 1966 to 1973  Coefficient Std.Error t-value t-prob Part.R^2Constant 3.01620 1.032 2.92 0.033 0.6308x1 0.103550 0.004550 22.8 0.000 0.9904x2 -0.0979638 0.01583 -6.19 0.002 0.8845 sigma 0.120682 RSS 0.0728202076R^2 0.997094 F(2,5) = 857.8 [0.000]**log-likelihood 7.44531 DW 1.95no. of observations 8 no. of parameters 3mean(y) 10.5 var(y) 3.1325

9

Výstup z GiveWinu:

Regresní nadrovina – zápis:

Napozorované hodnoty:

Y = 3,016 + 0,104X2 – 0,098X3 + e

Vyrovnané hodnoty:

Y^ = 3,016 + 0,104X2 – 0,098X3

Intervalový odhad

Provést intervalový odhad alespoň u jednoho parametru, který je statisticky významný

pro β2:

0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57

0,092 <= β2<= 0,114

Absolutní pružnost

dle vzorců:

b1 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X2 se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK.b2 = - 0,098 – vzroste-li cenový index X2 o jeden procentní bod a X1 se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. definovány v daných jednotkách

Relativní pružnost pro r. 2003

Y(73) = 13,6; X2(73) = 209, X3(73) = 113

zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 %

zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %

Predikce – EX ANTE

Bodová predikceDynamic (ex ante) forecasts for y (SE based on error

variance only) Horizon Forecast (SE) 2004 13.7953 0.1207Dynamic (ex ante) forecasts for y (SE with parameter

uncertainty) Horizon Forecast (SE) 2004 13.7953 0.1584

Intervalová predikceS parametrem sigma:

S parametrem chyby předpovědi:

14

ˆ 13,7953 0,1207.TY s

*1 /2

ˆ 13,7953 2,57 0,1207T pY t s

Predikce – EX POST

Odhadnutý model na období 1996 – 2001

Provedena predikce 2002, 2003 Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast SE Actual Error t-value 2002 12.3717 0.1076 12.1000 -0.271654 -2.524 2003 13.7732 0.1076 13.6000 -0.173184 -1.609

Intuitivní vyhodnocení pomocí % chyby z skutečné hodnoty:

X = 0,2716/12,1 = 0,022 = 2,2 % < 5 %

Pomocí t-testu: H0: Chyba není st. Významná 2,524 (z výstupu abs hodnota) < 2,57 (tabulková

hodnota) → Nezamítáme H0, chyba není statisticky významná.

15

16

MULTIKOLINEARITA

1. Podstata

2. Příčiny

3. Důsledky

4. Měření

17

MULTIKOLINEARITA

Multikolinearita = existence více než jednoho vztahu lineární závislost mezi pozorováními vysvětlujících proměnných

Kolinearita = existence pouze jednoho lineárního vztahu

Pozn. Většinou se v obou případech používá pojem multikolinearita

Multikolinearita

18

19

MULTIKOLINEARITA

Týká se pouze výběrového vzorku, nikoliv abstraktního modelu !!!

multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru

Podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými

Zda je či není multikolinearita únosná

20

Příčiny

Tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im)

Průřezová analýza (např. proměnná příjem a bohatství)

Zahrnutí zpožděné endo nebo exo proměnné.

Špatně diskretizovaná proměnné pomocí 0, 1

21

Důsledky

Snížená přesnost odhadů regresních koeficientů

Velké standardní chyby odhadové funkce MNČPochybnosti či nejistotu pokud jde o správnost specifikace modelu

Odhady zůstávají nestranné, vydatné

Velká citlivost odhadové funkce MNČ na velmi malé změny v matici X

Obtížné vyjádření odděleného působení silně kolineárních proměnných.

22

Měření multikolinearity – Metoda I

Použití párových korelačních koeficientů

Pouze pro 2 vysvětlující proměnné:

multikolinearita je únosná, pokud:rX1X2 ≤ 0,9 a současně

koeficient vícenásobné determinace modelu

1 2

1 2

1 2cov( )1,1x x

x x

x xr

s s

1 2

2

x xr R

23

Párové korelační koeficienty

modul PcGive

Package → Descriptive Statistics

Model → Formulate – Vložím proměnnézvolit nabídku korelační matice

24

Měření multikolinearity – Metoda II

Využívá se pomocných regresíVíce vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty)

Využívá se koeficientů pomocné regrese Ri2

Pokud máme model Y = f(X1, X2, X3) … z modelu … R2

X1= f (X2,X3) … R12

X2= f (X1,X3) … R22

X3= f (X1,X2) … R32

jsou-li všechna Ri2 < R2,

pak je multikolinearita únosná

25

Příklad 2 – eko1.xls

Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu.

Y – maloobchodní obrat potřeb pro domácnost v mld. CZK

X1 – disponibilní příjem v mld. CZK

X2 – cenový index

Je v modelu multikolinearita?

26

Příklad KUŘE

Určete, jak závisí počet prodaných kuřat na níže uvedených proměnných. K dispozici máme roční pozorování od roku 1960 do roku 1982.

Y – počet prodaných kuřat (v desítkách milionů kusů)

X2 – výše dotace do zemědělství (v miliardách Kč)

X3 – cena za kuře (Kč/kilo)

X4 – cena vepřového (Kč/kilo)

Je v modelu multikolinearita?

27

Možná otázka do závěrečného testu

Predikce

MultikolinearitaPodstata

Příčiny

Důsledky

Měření