+ All Categories
Home > Documents > Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150...

Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150...

Date post: 07-Jul-2020
Category:
Upload: others
View: 9 times
Download: 0 times
Share this document with a friend
28
REGRESE
Transcript
Page 1: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

REGRESE

K čemu sloužiacute regrese

C Y

950 1000

910 1250

1130 1500

1150 1750

1475 2000

1550 2250

1800 2500

0

200

400

600

800

1000

1200

1400

1600

1800

2000

0 500 1000 1500 2000 2500 3000

119862

119884

119862 = 119862119886 + 119888 119884

119862 = 200 + 06 119884 + 119890

Budeme zjišťovat jak jedna proměnnaacute (nezaacutevislaacute)

Ovlivňuje jinou proměnnou (zaacutevislou)

Pozor na aplikaci regrese

Striktniacute podmiacutenky

Různeacute metody

Např probleacutem kauzality vztahů

119884 = 119862 + 119868 + 119866 + 119873119883

Uacutevod

Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti

Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP

Nejsou vztahy bdquovycucaneacuteldquo z prstů

Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy

Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)

Ovlivňuje jinou proměnnou (CIEX)

Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou

A pokud možno vše popsat matematickou funkciacute

Qx=20-054Px+012Py+02Y

Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)

Jak ale určit zda-li půjčitnepůjčit peniacuteze

A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta

119910 = β0 + β1 1199091

Deterministickyacute model

Jednoznačně existujiacuteciacute vztah

Pravděpodobnost =1

Spořeniacute (fixniacute sazba poplatky)

y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)

x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)

β- parametry (β0 absolutniacute člen β1 sklon)

119910 = β0 + β1 1199091 + ε

Stochastickyacute model

Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)

Napřiacuteklad i chyby v měřeniacute

Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy

Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza

čas

ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)

119862 = 119862119886 + 119888 119884

Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi

Vyacutenos pole a množstviacute hnojiva

Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)

ndash viacutece hnojiva většiacute vyacutenos

Jak ověřit tento vztah

Dotaacutežeme se všech zemědělců v ČR

Ziacuteskaacuteme statistickyacute soubor

bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)

snaha aby daty byla prostorově časově a věcně vymezena

bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119910 = β0 + β1 1199091

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 2: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

K čemu sloužiacute regrese

C Y

950 1000

910 1250

1130 1500

1150 1750

1475 2000

1550 2250

1800 2500

0

200

400

600

800

1000

1200

1400

1600

1800

2000

0 500 1000 1500 2000 2500 3000

119862

119884

119862 = 119862119886 + 119888 119884

119862 = 200 + 06 119884 + 119890

Budeme zjišťovat jak jedna proměnnaacute (nezaacutevislaacute)

Ovlivňuje jinou proměnnou (zaacutevislou)

Pozor na aplikaci regrese

Striktniacute podmiacutenky

Různeacute metody

Např probleacutem kauzality vztahů

119884 = 119862 + 119868 + 119866 + 119873119883

Uacutevod

Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti

Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP

Nejsou vztahy bdquovycucaneacuteldquo z prstů

Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy

Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)

Ovlivňuje jinou proměnnou (CIEX)

Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou

A pokud možno vše popsat matematickou funkciacute

Qx=20-054Px+012Py+02Y

Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)

Jak ale určit zda-li půjčitnepůjčit peniacuteze

A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta

119910 = β0 + β1 1199091

Deterministickyacute model

Jednoznačně existujiacuteciacute vztah

Pravděpodobnost =1

Spořeniacute (fixniacute sazba poplatky)

y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)

x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)

β- parametry (β0 absolutniacute člen β1 sklon)

119910 = β0 + β1 1199091 + ε

Stochastickyacute model

Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)

Napřiacuteklad i chyby v měřeniacute

Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy

Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza

čas

ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)

119862 = 119862119886 + 119888 119884

Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi

Vyacutenos pole a množstviacute hnojiva

Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)

ndash viacutece hnojiva většiacute vyacutenos

Jak ověřit tento vztah

Dotaacutežeme se všech zemědělců v ČR

Ziacuteskaacuteme statistickyacute soubor

bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)

snaha aby daty byla prostorově časově a věcně vymezena

bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119910 = β0 + β1 1199091

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 3: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Uacutevod

Pokoušiacuteme se zjistit přiacutečinneacutekauzalniacute souvislosti

Spotřebu ovlivňuje velikost důchodu 119862 = 119862119886 + 119888 119884Investice ovlivňuje velikost uacuterokoveacute miacutery 119868 = 119868119886 minus 119887119894Export ovlivňuje reaacutelnyacute měnovyacute kurz a zahraničniacute HDP

Nejsou vztahy bdquovycucaneacuteldquo z prstů

Chceme zjistit zda-li mezi proměnnyacutemi existujiacute konkreacutetniacute vztahy

Napřiacuteklad jak proměnnaacuteproměnneacute (i Y R)

Ovlivňuje jinou proměnnou (CIEX)

Detailně pochopit vztahy mezi nezaacutevisloumi a zaacutevislou proměnnou

A pokud možno vše popsat matematickou funkciacute

Qx=20-054Px+012Py+02Y

Jsme schopni bdquodobřeldquo určit některeacute proměnneacute (přiacutejem hodnota majetku atd)

Jak ale určit zda-li půjčitnepůjčit peniacuteze

A ktereacute proměnneacute nejviacutece ovlivniacute bankrot klienta

119910 = β0 + β1 1199091

Deterministickyacute model

Jednoznačně existujiacuteciacute vztah

Pravděpodobnost =1

Spořeniacute (fixniacute sazba poplatky)

y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)

x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)

β- parametry (β0 absolutniacute člen β1 sklon)

119910 = β0 + β1 1199091 + ε

Stochastickyacute model

Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)

Napřiacuteklad i chyby v měřeniacute

Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy

Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza

čas

ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)

119862 = 119862119886 + 119888 119884

Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi

Vyacutenos pole a množstviacute hnojiva

Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)

ndash viacutece hnojiva většiacute vyacutenos

Jak ověřit tento vztah

Dotaacutežeme se všech zemědělců v ČR

Ziacuteskaacuteme statistickyacute soubor

bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)

snaha aby daty byla prostorově časově a věcně vymezena

bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119910 = β0 + β1 1199091

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 4: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119910 = β0 + β1 1199091

Deterministickyacute model

Jednoznačně existujiacuteciacute vztah

Pravděpodobnost =1

Spořeniacute (fixniacute sazba poplatky)

y- zaacutevislaacute proměnnaacute (vysvětlovanaacute proměnnaacute)

x- nezaacutevislaacute proměnnaacute (vysvětlujiacuteciacute proměnnaacute)

β- parametry (β0 absolutniacute člen β1 sklon)

119910 = β0 + β1 1199091 + ε

Stochastickyacute model

Do modelu vstupuje nejistota (dalšiacute neuvažovaneacute vlivy)

Napřiacuteklad i chyby v měřeniacute

Jednostrannaacute zaacutevislost ndash regresniacute analyacutezy

Vzaacutejemnaacute zaacutevislost (lineaacuterniacute) ndash korelačniacute analyacuteza

čas

ε- naacutehodnaacute chyba (naacutehodnaacute veličina proto maacute pravděpodobnostniacute rozděleniacute)

119862 = 119862119886 + 119888 119884

Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi

Vyacutenos pole a množstviacute hnojiva

Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)

ndash viacutece hnojiva většiacute vyacutenos

Jak ověřit tento vztah

Dotaacutežeme se všech zemědělců v ČR

Ziacuteskaacuteme statistickyacute soubor

bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)

snaha aby daty byla prostorově časově a věcně vymezena

bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119910 = β0 + β1 1199091

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 5: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Ciacutel ndash snaha poznat a popsat přiacutečinneacute vztahy mezi proměnnyacutemi

Vyacutenos pole a množstviacute hnojiva

Uvažujeme existenci lineaacuterniacuteho vztahu (uacutevaha zemědělců)

ndash viacutece hnojiva většiacute vyacutenos

Jak ověřit tento vztah

Dotaacutežeme se všech zemědělců v ČR

Ziacuteskaacuteme statistickyacute soubor

bull Pozorovaacuteniacutem (n) statistickyacutech jednotek (sledujeme 100 zemědělců)

snaha aby daty byla prostorově časově a věcně vymezena

bull Pozorovaacuteniacutem určiteacute statistickeacute jednotky (HDP) v (n) časovyacutech intervalech

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119910 = β0 + β1 1199091

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 6: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

y

x

y

x

y

x

y

x

Zaacutevislost a jejiacute intenzita

Lineaacuterniacute zaacutevislost ndash slabaacute Lineaacuterniacute zaacutevislost ndash silnaacute

Nelineaacuterniacute zaacutevislost ndash silnaacute Nelineaacuterniacute

Snaha se co nejviacutece přibliacutežit(aproximovat) empirickou regresniacute funkci

A hypotetickou regresniacute funkci

Co nejleacutepe by měla vyjadřovat charakter zaacutevislosti (lineaacuterniacute logaritmickaacute atd)

Hledaacuteme průběh zaacutevislosti (lineaacuterniacute nelineaacuterniacute)

Intenzitu zaacutevislosti (silnaacutetěsnaacute)

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 7: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119907yacute119899119900119904 = β0 + β1hnojivo +ε

Přiacuteklad

Maacuteme pole a chceme zjistit co ovlivňuje vyacutenos z pole

Myšlenka množstviacute hnojiva

vyacutenos- zaacutevislaacute proměnnaacute

hnojivo ndash množstviacute hnojiva nezaacutevislaacute proměnnaacute

ε- ostatniacute faktory

Provedeme (n) naacutehodnyacutech vyacuteběrů ndash osloviacuteme n zemědělců

A zjistiacuteme kolik hnojili a jakyacute měli vyacutenos

119910 = β0 + β1 1199091 + ε

vyacutenos

hnojivo

5

Sklon 15

119907yacute119899119900119904 = 5 + 15hnojivo + e

Když nebudeme hnojit vyacutenos=5

Když se změniacute množstviacute hnojiva o 1

Zvyacutešiacute se vyacutenos o 151=15

Změna hnojiva o 2 ndash vyacutenos=215=3

e- body neležiacute na čaacuterkovaneacute přiacutemce

Existujiacute dalšiacute faktory kromě hnojiva

Ovlivňujiacuteciacute vyacutenos

119910 = β0 + β1 1199091

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 8: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Jednoduchyacute lineaacuterniacute regresniacute model

Maacuteme pouze jednu nezaacutevisle proměnnou

Vztah mezi zaacutevisle proměnnou (y) a nezaacutevisle proměnnou (x) je lineaacuterniacute

My ziacuteskaacuteme bdquonějakaacuteldquo data y a x (empirickeacutevyacuteběroveacute hodnoty) ndash co se naměřilo

Ciacutelem je najiacutet přiacutepadnyacute vztah mezi y a x a popsat jej

Vyacutenos pole a množstviacute hnojiva

My viacuteme že zde existuje lineaacuterniacute vztah ndash čiacutem viacutece hnojiva ndash tiacutem většiacute vyacutenos

Ale neviacuteme jak přesně maacute danyacute vztah vypadat

Teoretickaacute (hypotetickaacute) regresniacute funkce ndash nepozorovatelnaacute (η)

bdquoideaacutelniacuteldquo regresniacute funkce

Teoretickyacute vztah ndash většinou neznaacuteme

Empirickaacute regresniacute funkce je

Odhad teoretickeacute regresniacute funkce

vyacutenos

hnojivo

119910 = β0 + β1 1199091

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 9: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Teoretickaacute a empirickaacute regresniacute funkce

Pro každeacute pozorovaacuteniacute (i) i=12hellip

yi- i-taacute empirickaacute hodnota vysvětlovaneacute proměnneacute (vyacutenos pole)

ηi- i-taacute hodnota teoretickeacute regresniacute funkce (neznaacutem)

εi- odchylka (naacutehodnaacute chyba) yi od ηi

Odchylka

Na y působiacute dalšiacute naacutehodneacute proměnneacute než pouze (x)

Na pozorovaacuteniacute působiacute naacutehodneacute chyby (nepřesneacute vaacutehy)

y

x

119910119894 = η119894 + ε119894

Při neexistenci chyby (ε)

Model deterministickyacute (pevnaacute zaacutevislost)

η- předpis kdy x je přiřazeno y bdquopřesněldquo

y=2x

Teoretickaacute regresniacute funkce

Empirickaacute regresniacute funkce

ε119894

e119894

119910119894

e119946-reziduum ndash rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

ε119894 ne e119946

Reziduum je odhadem naacutehodneacute chyby

(dopustili jsme se dalšiacutech chyb)

η119894 = β0 + β1 119909119894

119910119894 = β0 + β1 119909119894 + ε119894

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 10: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Hledaacuteniacute konkreacutetniacuteho tvaru regresniacute funkce

Červeneacute body značiacute empirickeacute (napozorovaneacute) hodnoty

Musiacuteme najiacutet bdquovhodnouldquo přiacutemku

Každou empirickou hodnotu yi nahradiacuteme

určitou bdquovyrovnanouldquo hodnotou Yi

Kteraacute bude ležet na zvoleneacute empirickeacute (vyacuteběroveacute) regresniacute přiacutemce

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119910119894 = η119894 + ε119894

119910119894 = β0 + β1 119909119894 + ε119894

119884119894 = 1198870 + 1198871 119909119894

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 11: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Probleacutem je že takovyacutech přiacutemek může existovat nekonečně mnoho

Musiacuteme najiacutet kriteacuterium ndash nejleacutepe vystihne danou zaacutevislost

Zeleneacute šipky představujiacute odchylku skutečneacute hodnoty od bdquovyrovnaneacuteldquo hodnoty

Když už musiacute existovat odchylky ndash ideaacutelniacute by bylo

jejich vzaacutejemneacute vykompenzovaacuteniacute

Kladneacute a zaacuteporneacute odchylky

Se bdquopožerouldquo

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

119894=1

119899

119910119894 minus 119884119894 =

119894=1

119899

119890119894 = 0

y7

Y7

e119946-reziduum

Rozdiacutel mezi empirickou regresniacute funkciacute

a empirickou hodnotou

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 12: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

y

x

y1

y3

Y2

y4

y5

y6

Y6

Y5

y4=Y4

Y3

y2

Y1

y7

Y7

Součet čtverců odchylek empirickyacutech hodnot y i

od hodnot teoretickyacutech ηi byl minimaacutelniacute

Metoda nejmenšiacutech čtverců (MNČ OLS)

119894=1

119899

119890119894 = 0

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

Reziduum e je odhadem ε

A Y je odhadem η

Musiacute platit že

119876 =

119894=1

119899

1198901198942 =

119894=1

119899

(119910119894 minus 119884119894)2hellip119898119894119899

119910119894 = η119894 + ε119894

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 13: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Přiacutemkovaacute regrese

η = β0 + β1 119909119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899

119884 = 1198870 + 1198871 119909

119876 119898119894119899119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

120597β0= 0

120597119876

120597β1= 0 119876 =

119894=1

2

(119910119894 minus 1198870 minus 1198871119909119894 )2=(1199101 minus 1198870 minus 11988711199091 )

2+(1199102 minus 1198870 minus 11988711199092 )2

1198870 119895119890 119900119889ℎ119886119889 β0

1198871 119895119890 119900119889ℎ119886119889 β1

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198870= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

120597119876

1205971198871= 2

119894=1

2

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

119910119894 = η119894 + ε119894

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 14: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119876 =

119894=1

119899

ε1198942 =

119894=1

119899

(119910119894 minus η119894)2hellip119898119894119899 119876 =

119894=1

119899

(119910119894 minus β0 minus β1119909119894 )2

120597119876

1205971198870= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus1) = 0

120597119876

1205971198871= 2

119894=1

119899

119910119894 minus 1198870 minus 1198871119909119894 (minus119909119894 ) = 0

120597119876

1205971198870= 2 1199101 minus 1198870 minus 11988711199091 minus1 + 2 1199102 minus 1198870 minus 11988711199092 minus1 = 0

120597119876

1205971198871= 2 1199101 minus 1198870 minus 11988711199091 minus1199091 + 2 1199102 minus 1198870 minus 11988711199092 minus1199092 = 0

119894=1

119899

119910119894 = 119899 1198870+1198871

119894=1

119899

119909119894

119894=1

119899

119910119894 119909119894 = 1198870

119894=1

119899

119909119894 +1198871

119894=1

119899

1199091198942

1198870 =

119910119894 119909119894 119910119894119909119894 119909119894

2

119899 119909119894 119909119894 119909119894

2

Normaacutelniacute rovnice

1198871 =

119899 119910119894 119909119894 119910119894119909119894119899 119909119894 119909119894 119909119894

2

119899 119909119894

119909119894 1199091198942

119910119894

119910119894 119909119894

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 15: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119887119909119910 =119904119909119910

1199041199092

119887119909119910 =119888119900119907(119909 119910)

119881119886119903(119909)

119888119900119907(119909 119910) gt 0

119888119900119907(119909 119910) lt 0

119888119900119907 119909 119910 = 0

Lineaacuterniacute nezaacutevislost

Regresniacute koeficient (vyacuteběrovyacute regresniacute koeficient)

Směrnice (sklon) regresniacute přiacutemky

Průměrnaacute změna zaacutevisle proměnneacute y

Při jednotkoveacute změně nezaacutevisle proměnneacute x

Může nabyacutet libovolnyacutech hodnot

Jednoduššiacute postup pro přiacutemkovou regresi

Přiacutemkovaacute regrese je lineaacuterniacute regresniacute funkce

(lineaacuterniacute v parametrech)

Obraacuteceně nemusiacute platit

119884 = 119910 + 119887119909119910 (119909 minus 119909)119864 119884 119883 = 119910+ 119887119909119910(119909 minus 119909)

1198870 = 119910 minus 1198871 119909

119884 = 1198870 + 1198871 119909

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 16: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Linearizace modelu

Linearita v parametrech

Vzpomeňte na matice

Lineaacuterniacute algebra ndash pro praktičnost je vyacutehodnějšiacute miacutet lineaacuterniacute model

Některeacute nelineaacuterniacute modely se dajiacute linearizovat

Linearizujiacuteciacute transformace

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 = 11988701199091198871

119874119870

119873119890119899iacute 119874119870 ∶)

119897119899119910 = 1198971198991198870 + 1198871119897119899119909

119910 =11988701199091198871

119897119899119910 = 1198971198991198870 minus 1198871119897119899119909

119910 = 11988701199091198871

119876 = 5 minus 2119897119899119875

119897119899119876 = 100 minus 004119875

119897119899119876 = 7 minus 001119897119899119875

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 17: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Dalšiacute typy regresniacutech funkciacute

Parabolickaacute regrese

Aplikujeme MNČ

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092

Neniacute viacutecenaacutesobnaacute regrese

ei = yi 1048576 b0 1048576 b1xi

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 18: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Polynomickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Hyperbolickaacute regrese

Logaritmickaacute regrese

Lineaacuterniacute v parametrech

Nelineaacuterniacute v

Interpretace vyacutesledků

η = β0 + β1 119909 + β2 1199092 +⋯+ β119901 119909

119901

η = β0 +β1119909

η = β0 + β1119897119900119892119909

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 19: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Exponenciaacutelniacute regrese

Nelineaacuterniacute v parametrech

Nelze použiacutet MNČ

Logaritmickaacute transformace ndash zlogaritmujeme (linearizujeme)

Interpretace vyacutesledků

η = β0 β1119909

log η = log β0 + 119909 log β1

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 20: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Zdaacutenlivaacute regrese (spurious regression)

Někdy nastane situace že regresniacute model vykazuje vysokeacute R2

Přesto se jednaacute o nesmyslnyacute vztah

Vaacuteha dětiacute a znalost gramatiky

Čiacutem jsou děti těžšiacute tiacutem majiacute lepšiacute gramatiku

Zapomiacutenaacuteme na staacuteřiacute dětiacute

Vzaacutejemnyacute vztah přes třetiacute proměnnou

Možnost existence kraacutetkodobeacuteho vztahu např stochastickyacute trend atd

Daacutevat si na zdaacutenlivou regresi VELKYacute pozor

Zaacutejemci si mohou vyhledat termiacuten kointegrace časovyacutech řad

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 21: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Interpolačniacute a extrapolačniacute odhady

Vzniklyacute model musiacuteme testovat

Interpolačniacute odhad

Do vznikleacuteho modelu dosazujeme vysvětlujiacuteciacute proměnneacute z oblasti měřeniacute

Extrapolačniacute odhad

Do vznikleacuteho modelu dosazujeme hodnoty mimo interval měřeniacute

Maacuteme hodnoty z intervalu (01000)

A chceme predikovat chovaacuteniacute pro hodnoty z intervalu (10001500)

119907yacute119899119900119904 = 5 + 15hnojivo + u

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 22: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Kvalita regresniacute funkce a intenzita zaacutevislosti

Zjistiacuteme přiacutepadnyacute vztah lineaacuterniacutenelineaacuterniacute

Přiacutemkovaacute regrese parabolickaacute atd

Je však danyacute model bdquokvalitniacuteldquo

Regresniacute model bude tiacutem lepšiacute

čiacutem viacutece budou empirickeacute hodnoty vysvětlovaneacute proměnneacute

soustředěny (nalepany) kolem odhadnuteacute regresniacute funkce

Ciacutelem kapitoly je objasnit si naacutestroje na měřeniacute kvality regresniacuteho modelu

y

x

y

x

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 23: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Index korelace

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119904(119910minus119884)2 =

1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

Při použitiacute MNČ platiacute mezi

rozptyly vztah

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 24: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Empirickyacute rozptyl (ER)

Teoretickyacute rozptyl (TR)

Residuaacutelniacute rozptyl (RR)

y

x

y6

Y6

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2 119904119884

2 =1

119899

119894=1

119899

(119884119894 minus 119910)2 119904(119910minus119884)

2 =1

119899

119894=1

119899

(119910119894 minus 119884119894)2

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

119910

1199041199102 = 119904119884

2Funkčniacute zaacutevislost

Všechny empirickeacute hodnoty (yi)

jsou zaacuteroveň vyrovnanyacutemi hodnotami (Yi)

bdquočiacutem lepšiacute zaacutevislosti tiacutem viacutece se ER a TR bliacutežiacuteldquo

Uacuteplnaacute nezaacutevislost

Empirickyacute rozptyl shodnyacute s reziduaacutelniacutem

bdquočiacutem horšiacute zaacutevislost tiacutem se ER a RR bliacutežiacuteldquo

Hodnoceniacute stochastickeacuteho modelu

Zvolenyacute model bude tiacutem kvalitnějšiacute

Čiacutem bude podiacutel teoretickeacuteho rozptylu

Na celkoveacutem rozptylu většiacute

Tiacutem silnějšiacute bude zaacutevislost y na x

1199041199102 = 119904(119910minus119884)

2

119956119936120784

119956119962120784

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 25: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

1199041198842

1199041199102 = 1 minus

119904(119910minus119884)2

1199041199102

119920119962119961120784 =119956119936120784

119956119962120784

Index

determinace

R2

Index nabyacutevaacute hodnot 0-1

R2=1 představuje funkčniacute zaacutevislost

R2=0 představuje nezaacutevislost

Vynaacutesobeno 100 udaacutevaacute v tu čaacutest rozptylu

kterou se podařilo vysvětlit regresniacute funkciacute

1198772 =119907119910119904119907ě119905119897119890119899yacute 119903119900119911119901119905119910119897

119888119890119897119896119900119907yacute 119903119900119911119901119905119910119897

1199041199102 = 119904119884

2 + 119904(119910minus119884)2

x y

0 2

1 22

2 24

3 26

4 28

5 3 25 275

1199041199102 =1

119899

119894=1

119899

(119910119894 minus 119910)2

1199041198842 =1

119899

119894=1

119899

(119884119894 minus 119910)2

119884119894 = 2 + 03 119909119894

Relativniacute čaacutest kteraacute se

nepodařila vysvětlit

modelem

119868119910119909 =1199041198842

1199041199102

Index korelace

119909 119910

y

x

119910

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 26: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119920119962119961120784 =119956119936120784

119956119962120784Index determinace lt01gt

Funkčniacute zaacutevislost ndash R2=1

Nezaacutevislost ndashR2=0

Převedeniacutem na - vyjadřuje tu čaacutest rozptylu vysvětlovaneacute proměnneacute (y)

kterou se podařilo vysvětlit pomociacute regresniacute funkce

R2=08 ndash 10008=80

80 hodnot se naacutem podařilo vysvětlit pomociacute konkreacutetniacuteho typu reg fce

Index korelace 119868119910119909 =

1199041198842

1199041199102

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 27: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Koeficient korelace Zvlaacuteštniacute přiacutepad indexu korelace

Měřiacute těsnost zaacutevislosti daneacute LINEAacuteRNIacute regresniacute funkce

rxy- koeficient korelace

sxy- kovariance

s2(xy)- rozptyly

Koeficient korelace lt-11gt

rxy=-1

Nepřiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=1

Přiacutemaacute lineaacuterniacute zaacutevislost ndash

rxy=0 lineaacuterniacute nezaacutevislost

119868119910119909 =1199041198842

1199041199102

119903119910119909 = 119903119909119910 =119904119909119910

1199041199092 1199041199102

rxy=0

Nemusiacute znamenat nezaacutevislost

Může se jednat o silnou zaacutevislost

Ale NELINEAacuteRNIacute

x y

0 50

1 519

2 572

3 653

4 756

5 875

6 1004

7 1137

8 1268

9 1391

10 150

11 1589

12 1652

13 1683

14 1676

15 1625

16 1524

17 1367

18 1148

19 861

20 50

21 59

22 -468

119903119910119909 = minus002

-2 0 2 4 6 8 10 12 14 16 18 20 22 24

x

-60

-40

-20

0

20

40

60

80

100

120

140

160

180

y

minus011199093 + 21199092 + 50

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1

Page 28: Regrese - EkoFun · 2016-09-15 · K čemu slouží regrese? C Y 950 1000 910 1250 1130 1500 1150 1750 1475 2000 1550 2250 1800 2500 0 200 400 600 800 1000 1200 1400 1600 1800 2000

119903119910119909 = minus023

x y

1 5

2 125

3 0555555556

4 03125

5 02

6 0138888889

7 0102040816

8 0078125

9 0061728395

10 005

11 0041322314

12 0034722222

13 0029585799

14 0025510204

15 0022222222

16 001953125

17 0017301038

18 0015432099

19 0013850416

20 00125

-20 0 20 40 60 80 100 120 140

Prom1

-1

0

1

2

3

4

5

6

Pro

m2

119910 =5

1199092

119897119899119910 = 1198971198995 minus 2119897119899119909

-1 0 1 2 3 4 5 6

lnx

-10

-8

-6

-4

-2

0

2

lny

119903119910119909 = minus1


Recommended