1
ZÁKLADY EKONOMETRIE
4. cvičeníPREDIKCE
MULTIKOLINEARITA
2
Predikce
1. Predikce bodová a intervalová
2. Ex ante a ex post
3
Predikce
Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace
Ex-ante - podmíněná
Ex-post - pseudopředpověď
Dělení predikce
období
extrapolaci do budoucna,
extrapolace do minulosti nazývanou jako retrospektiva,
znalosti endogenní proměnné v období prognózy na
ex-post predikci, kdy známe hodnotu endogenní proměnné v období - pseudopředpověď,
ex-ante - klasické chápání předpovědi,
znalosti exogenních proměnných v období prognózy na
podmíněnou predikci – pro období předpovědi neznáme hodnoty exogenních proměnných, tyto hodnoty musíme také predikovat, předpověď Y je tedy podmíněná předpovědí hodnot X,
nepodmíněnou predikci – pro období předpovědi známe hodnoty exogenních proměnných.
4
5
Predikce Ex-Ante
Podmíněná volbou vysvětlující proměnnévysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu
Predikce může být bodová
nebo intervalová – v GiveWinu 2 možnosti:
Intervalovou předpověď můžeme interpretovat tak, že pro opakované výběry daný interval obsahuje se spolehlivostí (1 – α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.
Y sigma
T1 1
ˆ .T TY x b
*1 /2
ˆ ,T pY t s T T 11 ( )p T Ts s x X X x
6
Predikce Ex-post
Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou.
Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci)
H1: Chyba je statisticky významná
Testujeme pomocí t-statistiky
7
Příklad 1 – eko1.xls
Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu.
Y – maloobchodní obrat potřeb pro domácnost v mld. CZK
X1 – disponibilní příjem v mld. CZK
X2 – cenový index
Proveďte predikci bodovou a intervalovou pro disponibilní příjem 211 mld. CZK a cenový index 113.
Ověřte, zda je model vhodný k predikci pomocí ex-post predikce.
Ekonomická specifikace
= tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu
b0 – úrovňová konstanta může být libovolná, vzniká z podmínky, aby součet čtverců reziduí byl minimální
b1 – v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami
b2 – by mělo být < 0
Příklad – eko1.xls
EQ( 1) Modelling y by OLS (using eko1.xls) The estimation sample is: 1966 to 1973 Coefficient Std.Error t-value t-prob Part.R^2Constant 3.01620 1.032 2.92 0.033 0.6308x1 0.103550 0.004550 22.8 0.000 0.9904x2 -0.0979638 0.01583 -6.19 0.002 0.8845 sigma 0.120682 RSS 0.0728202076R^2 0.997094 F(2,5) = 857.8 [0.000]**log-likelihood 7.44531 DW 1.95no. of observations 8 no. of parameters 3mean(y) 10.5 var(y) 3.1325
9
Výstup z GiveWinu:
Regresní nadrovina – zápis:
Napozorované hodnoty:
Y = 3,016 + 0,104X2 – 0,098X3 + e
Vyrovnané hodnoty:
Y^ = 3,016 + 0,104X2 – 0,098X3
Intervalový odhad
Provést intervalový odhad alespoň u jednoho parametru, který je statisticky významný
pro β2:
0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57
0,092 <= β2<= 0,114
Absolutní pružnost
dle vzorců:
b1 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X2 se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK.b2 = - 0,098 – vzroste-li cenový index X2 o jeden procentní bod a X1 se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. definovány v daných jednotkách
Relativní pružnost pro r. 2003
Y(73) = 13,6; X2(73) = 209, X3(73) = 113
zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 %
zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %
Predikce – EX ANTE
Bodová predikceDynamic (ex ante) forecasts for y (SE based on error
variance only) Horizon Forecast (SE) 2004 13.7953 0.1207Dynamic (ex ante) forecasts for y (SE with parameter
uncertainty) Horizon Forecast (SE) 2004 13.7953 0.1584
Intervalová predikceS parametrem sigma:
S parametrem chyby předpovědi:
14
ˆ 13,7953 0,1207.TY s
*1 /2
ˆ 13,7953 2,57 0,1207T pY t s
Predikce – EX POST
Odhadnutý model na období 1996 – 2001
Provedena predikce 2002, 2003 Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast SE Actual Error t-value 2002 12.3717 0.1076 12.1000 -0.271654 -2.524 2003 13.7732 0.1076 13.6000 -0.173184 -1.609
Intuitivní vyhodnocení pomocí % chyby z skutečné hodnoty:
X = 0,2716/12,1 = 0,022 = 2,2 % < 5 %
Pomocí t-testu: H0: Chyba není st. Významná 2,524 (z výstupu abs hodnota) < 2,57 (tabulková
hodnota) → Nezamítáme H0, chyba není statisticky významná.
15
16
MULTIKOLINEARITA
1. Podstata
2. Příčiny
3. Důsledky
4. Měření
17
MULTIKOLINEARITA
Multikolinearita = existence více než jednoho vztahu lineární závislost mezi pozorováními vysvětlujících proměnných
Kolinearita = existence pouze jednoho lineárního vztahu
Pozn. Většinou se v obou případech používá pojem multikolinearita
Multikolinearita
18
19
MULTIKOLINEARITA
Týká se pouze výběrového vzorku, nikoliv abstraktního modelu !!!
multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru
Podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými
Zda je či není multikolinearita únosná
20
Příčiny
Tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im)
Průřezová analýza (např. proměnná příjem a bohatství)
Zahrnutí zpožděné endo nebo exo proměnné.
Špatně diskretizovaná proměnné pomocí 0, 1
21
Důsledky
Snížená přesnost odhadů regresních koeficientů
Velké standardní chyby odhadové funkce MNČPochybnosti či nejistotu pokud jde o správnost specifikace modelu
Odhady zůstávají nestranné, vydatné
Velká citlivost odhadové funkce MNČ na velmi malé změny v matici X
Obtížné vyjádření odděleného působení silně kolineárních proměnných.
22
Měření multikolinearity – Metoda I
Použití párových korelačních koeficientů
Pouze pro 2 vysvětlující proměnné:
multikolinearita je únosná, pokud:rX1X2 ≤ 0,9 a současně
koeficient vícenásobné determinace modelu
1 2
1 2
1 2cov( )1,1x x
x x
x xr
s s
1 2
2
x xr R
23
Párové korelační koeficienty
modul PcGive
Package → Descriptive Statistics
Model → Formulate – Vložím proměnnézvolit nabídku korelační matice
24
Měření multikolinearity – Metoda II
Využívá se pomocných regresíVíce vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty)
Využívá se koeficientů pomocné regrese Ri2
Pokud máme model Y = f(X1, X2, X3) … z modelu … R2
X1= f (X2,X3) … R12
X2= f (X1,X3) … R22
X3= f (X1,X2) … R32
jsou-li všechna Ri2 < R2,
pak je multikolinearita únosná
25
Příklad 2 – eko1.xls
Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu.
Y – maloobchodní obrat potřeb pro domácnost v mld. CZK
X1 – disponibilní příjem v mld. CZK
X2 – cenový index
Je v modelu multikolinearita?
26
Příklad KUŘE
Určete, jak závisí počet prodaných kuřat na níže uvedených proměnných. K dispozici máme roční pozorování od roku 1960 do roku 1982.
Y – počet prodaných kuřat (v desítkách milionů kusů)
X2 – výše dotace do zemědělství (v miliardách Kč)
X3 – cena za kuře (Kč/kilo)
X4 – cena vepřového (Kč/kilo)
Je v modelu multikolinearita?
27
Možná otázka do závěrečného testu
Predikce
MultikolinearitaPodstata
Příčiny
Důsledky
Měření