REGRESE
K čemu sloužiacute regrese
C Y
950 1000
910 1250
1130 1500
1150 1750
1475 2000
1550 2250
1800 2500
0
200
400
600
800
1000
1200
1400
1600
1800
2000
0 500 1000 1500 2000 2500 3000
119862
119884
119862 = 119862119886 + 119888 119884
119862 = 200 + 06 119884 + 119890
Budeme zjišťovat jak jedna proměnnaacute (nezaacutevislaacute)
Ovlivňuje jinou proměnnou (zaacutevislou)
Pozor na aplikaci regrese
Striktniacute podmiacutenky
Různeacute metody
Např probleacutem kauzality vztahů
119884 = 119862 + 119868 + 119866 + 119873119883
Uacutevod
Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti
Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP
Nejsou vztahy bdquovycucaneacuteldquo z prstů
Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy
Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)
Ovlivňuje jinou proměnnou (CIEX)
Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou
A pokud možno vše popsat matematickou funkciacute
Qx=20-054Px+012Py+02Y
Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)
Jak ale určit zda-li půjčitnepůjčit peniacuteze
A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta
119910 = β0 + β1 1199091
Deterministickyacute model
Jednoznačně existujiacuteciacute vztah
Pravděpodobnost =1
Spořeniacute (fixniacute sazba poplatky)
y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)
x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)
β- parametry (β0 absolutniacute člen β1 sklon)
119910 = β0 + β1 1199091 + ε
Stochastickyacute model
Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)
Napřiacuteklad i chyby v měřeniacute
Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy
Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza
Kč
čas
ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)
119862 = 119862119886 + 119888 119884
Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi
Vyacutenos pole a množstviacute hnojiva
Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)
ndash viacutece hnojiva většiacute vyacutenos
Jak ověřit tento vztah
Dotaacutežeme se všech zemědělců v ČR
Ziacuteskaacuteme statistickyacute soubor
bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)
snaha aby daty byla prostorově časově a věcně vymezena
bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119910 = β0 + β1 1199091
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
K čemu sloužiacute regrese
C Y
950 1000
910 1250
1130 1500
1150 1750
1475 2000
1550 2250
1800 2500
0
200
400
600
800
1000
1200
1400
1600
1800
2000
0 500 1000 1500 2000 2500 3000
119862
119884
119862 = 119862119886 + 119888 119884
119862 = 200 + 06 119884 + 119890
Budeme zjišťovat jak jedna proměnnaacute (nezaacutevislaacute)
Ovlivňuje jinou proměnnou (zaacutevislou)
Pozor na aplikaci regrese
Striktniacute podmiacutenky
Různeacute metody
Např probleacutem kauzality vztahů
119884 = 119862 + 119868 + 119866 + 119873119883
Uacutevod
Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti
Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP
Nejsou vztahy bdquovycucaneacuteldquo z prstů
Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy
Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)
Ovlivňuje jinou proměnnou (CIEX)
Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou
A pokud možno vše popsat matematickou funkciacute
Qx=20-054Px+012Py+02Y
Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)
Jak ale určit zda-li půjčitnepůjčit peniacuteze
A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta
119910 = β0 + β1 1199091
Deterministickyacute model
Jednoznačně existujiacuteciacute vztah
Pravděpodobnost =1
Spořeniacute (fixniacute sazba poplatky)
y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)
x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)
β- parametry (β0 absolutniacute člen β1 sklon)
119910 = β0 + β1 1199091 + ε
Stochastickyacute model
Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)
Napřiacuteklad i chyby v měřeniacute
Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy
Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza
Kč
čas
ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)
119862 = 119862119886 + 119888 119884
Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi
Vyacutenos pole a množstviacute hnojiva
Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)
ndash viacutece hnojiva většiacute vyacutenos
Jak ověřit tento vztah
Dotaacutežeme se všech zemědělců v ČR
Ziacuteskaacuteme statistickyacute soubor
bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)
snaha aby daty byla prostorově časově a věcně vymezena
bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119910 = β0 + β1 1199091
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Uacutevod
Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti
Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP
Nejsou vztahy bdquovycucaneacuteldquo z prstů
Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy
Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)
Ovlivňuje jinou proměnnou (CIEX)
Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou
A pokud možno vše popsat matematickou funkciacute
Qx=20-054Px+012Py+02Y
Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)
Jak ale určit zda-li půjčitnepůjčit peniacuteze
A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta
119910 = β0 + β1 1199091
Deterministickyacute model
Jednoznačně existujiacuteciacute vztah
Pravděpodobnost =1
Spořeniacute (fixniacute sazba poplatky)
y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)
x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)
β- parametry (β0 absolutniacute člen β1 sklon)
119910 = β0 + β1 1199091 + ε
Stochastickyacute model
Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)
Napřiacuteklad i chyby v měřeniacute
Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy
Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza
Kč
čas
ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)
119862 = 119862119886 + 119888 119884
Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi
Vyacutenos pole a množstviacute hnojiva
Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)
ndash viacutece hnojiva většiacute vyacutenos
Jak ověřit tento vztah
Dotaacutežeme se všech zemědělců v ČR
Ziacuteskaacuteme statistickyacute soubor
bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)
snaha aby daty byla prostorově časově a věcně vymezena
bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119910 = β0 + β1 1199091
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119910 = β0 + β1 1199091
Deterministickyacute model
Jednoznačně existujiacuteciacute vztah
Pravděpodobnost =1
Spořeniacute (fixniacute sazba poplatky)
y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)
x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)
β- parametry (β0 absolutniacute člen β1 sklon)
119910 = β0 + β1 1199091 + ε
Stochastickyacute model
Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)
Napřiacuteklad i chyby v měřeniacute
Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy
Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza
Kč
čas
ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)
119862 = 119862119886 + 119888 119884
Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi
Vyacutenos pole a množstviacute hnojiva
Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)
ndash viacutece hnojiva většiacute vyacutenos
Jak ověřit tento vztah
Dotaacutežeme se všech zemědělců v ČR
Ziacuteskaacuteme statistickyacute soubor
bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)
snaha aby daty byla prostorově časově a věcně vymezena
bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119910 = β0 + β1 1199091
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi
Vyacutenos pole a množstviacute hnojiva
Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)
ndash viacutece hnojiva většiacute vyacutenos
Jak ověřit tento vztah
Dotaacutežeme se všech zemědělců v ČR
Ziacuteskaacuteme statistickyacute soubor
bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)
snaha aby daty byla prostorově časově a věcně vymezena
bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119910 = β0 + β1 1199091
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
y
x
y
x
y
x
y
x
Zaacutevislost a jejiacute intenzita
Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute
Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute
Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci
A hypotetickou regresniacute funkci
Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)
Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)
Intenzitu zaacutevislosti (silnaacutetěsnaacute)
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119907yacute119899119900119904 = β0 + β1hnojivo +ε
Přiacuteklad
Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole
Myšlenka množstviacute hnojiva
vyacutenos- zaacutevislaacute proměnnaacute
hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute
ε- ostatniacute faktory
Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců
A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos
119910 = β0 + β1 1199091 + ε
vyacutenos
hnojivo
5
Sklon 15
119907yacute119899119900119904 = 5 + 15hnojivo + e
Když nebudeme hnojit vyacutenos=5
Když se změniacute množstviacute hnojiva o 1
Zvyacutešiacute se vyacutenos o 151=15
Změna hnojiva o 2 ndash vyacutenos=215=3
e- body neležiacute na čaacuterkovaneacute přiacutemce
Existujiacute dalšiacute faktory kromě hnojiva
Ovlivňujiacuteciacute vyacutenos
119910 = β0 + β1 1199091
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Jednoduchyacute lineaacuterniacute regresniacute model
Maacuteme pouze jednu nezaacutevisle proměnnou
Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute
My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo
Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej
Vyacutenos pole a množstviacute hnojiva
My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos
Ale neviacuteme jak přesně maacute danyacute vztah vypadat
Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)
bdquoideaacutelniacuteldquo regresniacute funkce
Teoretickyacute vztah ndash většinou neznaacuteme
Empirickaacute regresniacute funkce je
Odhad teoretickeacute regresniacute funkce
vyacutenos
hnojivo
119910 = β0 + β1 1199091
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Teoretickaacute a empirickaacute regresniacute funkce
Pro každeacute pozorovaacuteniacute (i) i=12hellip
yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)
ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)
εi- odchylka (naacutehodnaacute chyba) yi od ηi
Odchylka
Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)
Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)
y
x
119910119894 = η119894 + ε119894
Při neexistenci chyby (ε)
Model deterministickyacute (pevnaacute zaacutevislost)
η- předpis kdy x je přiřazeno y bdquopřesněldquo
y=2x
Teoretickaacute regresniacute funkce
Empirickaacute regresniacute funkce
ε119894
e119894
119910119894
e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
ε119894 ne e119946
Reziduum je odhadem naacutehodneacute chyby
(dopustili jsme se dalšiacutech chyb)
η119894 = β0 + β1 119909119894
119910119894 = β0 + β1 119909119894 + ε119894
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce
Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty
Musiacuteme najiacutet bdquovhodnouldquo přiacutemku
Každou empirickou hodnotu yi nahradiacuteme
určitou bdquovyrovnanouldquo hodnotou Yi
Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119910119894 = η119894 + ε119894
119910119894 = β0 + β1 119909119894 + ε119894
119884119894 = 1198870 + 1198871 119909119894
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho
Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost
Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty
Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo
jejich vzaacutejemneacute vykompenzovaacuteniacute
Kladneacute a zaacuteporneacute odchylky
Se bdquopožerouldquo
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
119894=1
119899
119910119894 minus 119884119894 =
119894=1
119899
119890119894 = 0
y7
Y7
e119946-reziduum
Rozdiacutel mezi empirickou regresniacute funkciacute
a empirickou hodnotou
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
y
x
y1
y3
Y2
y4
y5
y6
Y6
Y5
y4=Y4
Y3
y2
Y1
y7
Y7
Součet čtverců odchylek empirickyacutech hodnot y i
od hodnot teoretickyacutech ηi byl minimaacutelniacute
Metoda nejmenšiacutech čtverců (MNČ OLS)
119894=1
119899
119890119894 = 0
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
Reziduum e je odhadem ε
A Y je odhadem η
Musiacute platit že
119876 =
119894=1
119899
1198901198942 =
119894=1
119899
(119910119894 minus 119884119894)2hellip119898119894119899
119910119894 = η119894 + ε119894
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Přiacutemkovaacute regrese
η = β0 + β1 119909119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899
119884 = 1198870 + 1198871 119909
119876 119898119894119899119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
120597β0= 0
120597119876
120597β1= 0 119876 =
119894=1
2
(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )
2+(1199102 minus 1198870 minus 11988711199092 )2
1198870 119895119890 119900119889ℎ119886119889 β0
1198871 119895119890 119900119889ℎ119886119889 β1
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198870= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
120597119876
1205971198871= 2
119894=1
2
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
119910119894 = η119894 + ε119894
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119876 =
119894=1
119899
ε1198942 =
119894=1
119899
(119910119894 minus η119894)2hellip119898119894119899 119876 =
119894=1
119899
(119910119894 minus β0 minus β1119909119894 )2
120597119876
1205971198870= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0
120597119876
1205971198871= 2
119894=1
119899
119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0
120597119876
1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0
120597119876
1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0
119894=1
119899
119910119894 = 119899 1198870+1198871
119894=1
119899
119909119894
119894=1
119899
119910119894 119909119894 = 1198870
119894=1
119899
119909119894 +1198871
119894=1
119899
1199091198942
1198870 =
119910119894 119909119894 119910119894119909119894 119909119894
2
119899 119909119894 119909119894 119909119894
2
Normaacutelniacute rovnice
1198871 =
119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894
2
119899 119909119894
119909119894 1199091198942
119910119894
119910119894 119909119894
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119887119909119910 =119904119909119910
1199041199092
119887119909119910 =119888119900119907(119909 119910)
119881119886119903(119909)
119888119900119907(119909 119910) gt 0
119888119900119907(119909 119910) lt 0
119888119900119907 119909 119910 = 0
Lineaacuterniacute nezaacutevislost
Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)
Směrnice (sklon) regresniacute přiacutemky
Průměrnaacute změna zaacutevisle proměnneacute y
Při jednotkoveacute změně nezaacutevisle proměnneacute x
Může nabyacutet libovolnyacutech hodnot
Jednoduššiacute postup pro přiacutemkovou regresi
Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce
(lineaacuterniacute v parametrech)
Obraacuteceně nemusiacute platit
119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)
1198870 = 119910 minus 1198871 119909
119884 = 1198870 + 1198871 119909
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Linearizace modelu
Linearita v parametrech
Vzpomeňte na matice
Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model
Některeacute nelineaacuterniacute modely se dajiacute linearizovat
Linearizujiacuteciacute transformace
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 = 11988701199091198871
119874119870
119873119890119899iacute 119874119870 ∶)
119897119899119910 = 1198971198991198870 + 1198871119897119899119909
119910 =11988701199091198871
119897119899119910 = 1198971198991198870 minus 1198871119897119899119909
119910 = 11988701199091198871
119876 = 5 minus 2119897119899119875
119897119899119876 = 100 minus 004119875
119897119899119876 = 7 minus 001119897119899119875
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Dalšiacute typy regresniacutech funkciacute
Parabolickaacute regrese
Aplikujeme MNČ
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092
Neniacute viacutecenaacutesobnaacute regrese
ei = yi 1048576 b0 1048576 b1xi
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Polynomickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Hyperbolickaacute regrese
Logaritmickaacute regrese
Lineaacuterniacute v parametrech
Nelineaacuterniacute v
Interpretace vyacutesledků
η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909
119901
η = β0 +β1119909
η = β0 + β1119897119900119892119909
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Exponenciaacutelniacute regrese
Nelineaacuterniacute v parametrech
Nelze použiacutet MNČ
Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)
Interpretace vyacutesledků
η = β0 β1119909
log η = log β0 + 119909 log β1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Zdaacutenlivaacute regrese (spurious regression)
Někdy nastane situace že regresniacute model vykazuje vysokeacute R2
Přesto se jednaacute o nesmyslnyacute vztah
Vaacuteha dětiacute a znalost gramatiky
Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku
Zapomiacutenaacuteme na staacuteřiacute dětiacute
Vzaacutejemnyacute vztah přes třetiacute proměnnou
Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd
Daacutevat si na zdaacutenlivou regresi VELKYacute pozor
Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Interpolačniacute a extrapolačniacute odhady
Vzniklyacute model musiacuteme testovat
Interpolačniacute odhad
Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute
Extrapolačniacute odhad
Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute
Maacuteme hodnoty z intervalu (01000)
A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)
119907yacute119899119900119904 = 5 + 15hnojivo + u
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Kvalita regresniacute funkce a intenzita zaacutevislosti
Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute
Přiacutemkovaacute regrese parabolickaacute atd
Je však danyacute model bdquokvalitniacuteldquo
Regresniacute model bude tiacutem lepšiacute
čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute
soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce
Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu
y
x
y
x
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Index korelace
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119904(119910minus119884)2 =
1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
Při použitiacute MNČ platiacute mezi
rozptyly vztah
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Empirickyacute rozptyl (ER)
Teoretickyacute rozptyl (TR)
Residuaacutelniacute rozptyl (RR)
y
x
y6
Y6
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2 119904119884
2 =1
119899
119894=1
119899
(119884119894 minus 119910)2 119904(119910minus119884)
2 =1
119899
119894=1
119899
(119910119894 minus 119884119894)2
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
119910
1199041199102 = 119904119884
2Funkčniacute zaacutevislost
Všechny empirickeacute hodnoty (yi)
jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)
bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo
Uacuteplnaacute nezaacutevislost
Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem
bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo
Hodnoceniacute stochastickeacuteho modelu
Zvolenyacute model bude tiacutem kvalitnějšiacute
Čiacutem bude podiacutel teoretickeacuteho rozptylu
Na celkoveacutem rozptylu většiacute
Tiacutem silnějšiacute bude zaacutevislost y na x
1199041199102 = 119904(119910minus119884)
2
119956119936120784
119956119962120784
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
1199041198842
1199041199102 = 1 minus
119904(119910minus119884)2
1199041199102
119920119962119961120784 =119956119936120784
119956119962120784
Index
determinace
R2
Index nabyacutevaacute hodnot 0-1
R2=1 představuje funkčniacute zaacutevislost
R2=0 představuje nezaacutevislost
Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu
kterou se podařilo vysvětlit regresniacute funkciacute
1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897
119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897
1199041199102 = 119904119884
2 + 119904(119910minus119884)2
x y
0 2
1 22
2 24
3 26
4 28
5 3 25 275
1199041199102 =1
119899
119894=1
119899
(119910119894 minus 119910)2
1199041198842 =1
119899
119894=1
119899
(119884119894 minus 119910)2
119884119894 = 2 + 03 119909119894
Relativniacute čaacutest kteraacute se
nepodařila vysvětlit
modelem
119868119910119909 =1199041198842
1199041199102
Index korelace
119909 119910
y
x
119910
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119920119962119961120784 =119956119936120784
119956119962120784Index determinace lt01gt
Funkčniacute zaacutevislost ndash R2=1
Nezaacutevislost ndashR2=0
Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)
kterou se podařilo vysvětlit pomociacute regresniacute funkce
R2=08 ndash 10008=80
80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce
Index korelace 119868119910119909 =
1199041198842
1199041199102
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace
Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce
rxy- koeficient korelace
sxy- kovariance
s2(xy)- rozptyly
Koeficient korelace lt-11gt
rxy=-1
Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=1
Přiacutemaacute lineaacuterniacute zaacutevislost ndash
rxy=0 lineaacuterniacute nezaacutevislost
119868119910119909 =1199041198842
1199041199102
119903119910119909 = 119903119909119910 =119904119909119910
1199041199092 1199041199102
rxy=0
Nemusiacute znamenat nezaacutevislost
Může se jednat o silnou zaacutevislost
Ale NELINEAacuteRNIacute
x y
0 50
1 519
2 572
3 653
4 756
5 875
6 1004
7 1137
8 1268
9 1391
10 150
11 1589
12 1652
13 1683
14 1676
15 1625
16 1524
17 1367
18 1148
19 861
20 50
21 59
22 -468
119903119910119909 = minus002
-2 0 2 4 6 8 10 12 14 16 18 20 22 24
x
-60
-40
-20
0
20
40
60
80
100
120
140
160
180
y
minus011199093 + 21199092 + 50
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1
119903119910119909 = minus023
x y
1 5
2 125
3 0555555556
4 03125
5 02
6 0138888889
7 0102040816
8 0078125
9 0061728395
10 005
11 0041322314
12 0034722222
13 0029585799
14 0025510204
15 0022222222
16 001953125
17 0017301038
18 0015432099
19 0013850416
20 00125
-20 0 20 40 60 80 100 120 140
Prom1
-1
0
1
2
3
4
5
6
Pro
m2
119910 =5
1199092
119897119899119910 = 1198971198995 minus 2119897119899119909
-1 0 1 2 3 4 5 6
lnx
-10
-8
-6
-4
-2
0
2
lny
119903119910119909 = minus1