+ All Categories
Home > Documents > Statistika

Statistika

Date post: 05-Feb-2016
Category:
Upload: tahlia
View: 55 times
Download: 0 times
Share this document with a friend
Description:
Statistika. Ing. Jan Popelka, Ph.D . odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem email: jan.popelka @ ujep.cz WWW: http://most. ujep.cz / ~ popelka. Analýza časových řad. Analýza časových řad. Úvod do časových řad - PowerPoint PPT Presentation
117
STATISTI KA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem email: [email protected] WWW: http://most. ujep.cz / ~ popelka
Transcript
Page 1: Statistika

STATISTIKAIng. Jan Popelka, Ph.D.odborný asistentKatedra informatiky a geoinformatikyUniverzita Jana Evangelisty Purkyně v Ústí nad Labememail: [email protected]: http://most.ujep.cz/~popelka

Page 2: Statistika

ANALÝZA ČASOVÝCH ŘAD

2003 2004 2005 2006 2007 2008 2009 20100

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

Výrobe el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 3: Statistika

ANALÝZA ČASOVÝCH ŘAD

Úvod do časových řad Elementární charakteristiky Jednorozměrné modely Trendová složka Sezónní složka Náhodná složka Předpovědi

Page 4: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časová řada je posloupnost hodnot určitého statistického znaku (ukazatele) uspořádaných z hlediska času ve směru od minulosti k přítomnosti.

Page 5: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Musí se jednat o ukazatel, který je věcně a prostorově shodně vymezen po celé sledované období.

Např.: měsíční ceny výrobku mohou být vyjádřeny v Kč, což ovšem vzhledem k neustále probíhající inflaci není dlouhodobě srovnatelný způsob vyjádření – věcně není stejně vymezen!

Page 6: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Např.: sledujeme-li počty krádeží ve sledované oblasti (okres, kraj) za rok, můžeme zaregistrovat jejich náhlý pokles, který je ovšem způsoben jen tím, že zákonem byla zvýšena hodnota minimální způsobené škody nutné k zahrnutí mezi krádeže - věcně není shodně vymezen!Prostorově však je shodně vymezen – je to tentýž kraj.

Page 7: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Hodnoty časové řady se standardně značí symbolem

yt,

kde t je pořadí hodnoty časové řady. t nabývá nejčastěji hodnot 1, 2, … , n nebo 0, 1, … , n.

Hodnoty jsou řazeny od nejstarší po nejnovější.

Page 8: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Dále je možné značit konkrétněji y1995, y1996, ... , y1997 , kde indexy označují přímo rok pozorování.

Lze také psát yI/1995, yII/1995, ... , yIV/1997 pro čtvrtletní údaje nebo yleden/1995, yúnor/1995 … pro měsíční údaje atd.

Page 9: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

a) časové hledisko

b) periodicita sledováníc) způsob vyjádření

Page 10: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

a) časové hledisko

1. okamžikové časové řady - udávají stav ukazatele v určitých okamžicích. Hodnoty stavu nezávisejí na časových vzdálenostech (intervalech) mezi okamžiky sledování. Sčítání hodnot řady nemá logický význam.

Např.: řada teplot ovzduší na hydrometeorologické stanici odečítaná každou hodinu; řada udávající počet zaměstnanců podniku na konci měsíce; řada koncentrací nečistoty v odpadních vodách měřená v pravidelných intervalech na výstupu ze závodu.

Page 11: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

a) časové hledisko

2. intervalové časové řady - hodnoty sledují vznik nebo zánik prvků za časový interval a závisejí na délkách intervalů. Časová řada udává změny (přírůstek, úbytek) za určité období. Hodnotu ukazatele za delší časový úsek lze získat sčítáním hodnot za dílčí části tohoto úseku (roční údaj je součtem údajů měsíčních).

Např.: počty narozených dětí ve státě za rok; produkce nebo spotřeba při výrobě za měsíc; počet autonehod za den.

Page 12: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

b) periodicita sledování

1. dlouhodobé časové řady – údaje měřené jednou za rok nebo za delší období. Nejčastěji se vyskytují roční časové řady.

Např.: výroba za komunisty oblíbenou pětiletku;počet narozených dětí v Čechách za rok.

Page 13: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

b) periodicita sledování

2. krátkodobé časové řady – údaje měřené za období kratší než jeden rok.

Např.: čtvrtletní, měsíční, týdenní, denní, hodinové (koncentrace NOx v ovzduší), minutové a dokonce i vteřinové časové řady (burza cenných papírů).

Page 14: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

c) způsob vyjádření

1. peněžní časové řady – ukazatel je veden v peněžních jednotkách (domácí i zahraniční měny).

Např.: nejčastěji u ekonomických časových řad – ceny téměř čehokoliv, platy, zisk, měnové kurzy.

Page 15: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Časové řady lze dělit podle několika hledisek:

c) způsob vyjádření

2. naturální časové řady – ukazatel je veden v naturálních jednotkách.

Např.: jakékoliv jiné jednotky než peněžní (počty událostí, koncentrace látek ve vodě, vzduchu).

Page 16: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 1: Těžba uhlí v letech 1993 a 1994 – měsíční údaje.

Spojnicový graf je ideální pro zobrazení vývoje časové řady

Jan/0

9

Feb/0

9

Mar

/09

Apr/09

May

/09

Jun/0

9

Jul/0

9

Aug/09

Sep/0

9

Oct/09

Nov/09

Dec/0

9

Jan/1

0

Feb/1

0

Mar

/10

Apr/10

May

/10

Jun/1

0

Jul/1

0

Aug/10

Sep/1

0

Oct/10

Nov/10

Dec/1

02500

3000

3500

4000

4500

5000

Težba hnědého uhlí v ČR (2009 - 2010)

měsíc a rok

hn

ědé

uh

lí (

tis.

tu

n)

Page 17: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 1: Těžba uhlí v letech 2009 a 2010 – měsíční údaje.

Měsíc Těžba uhlí [tisíce tun]

2009 2010

leden 4 413 3 887

únor 4 026 3 679

březen 4 085 3 957

duben 3 441 3 325

květen 3 338 3 332

červen 3 492 3 174

červenec 3 011 3 252

srpen 3 363 3 335

září 3 507 3 835

říjen 4 139 4 296

listopad 4 282 3 943

prosinec 4 063 3 759

Celkem 45 160 43 774

Časová řada je intervalová (udává celkové vytěžené množství za měsíc), krátkodobá (měsíční údaje) a naturální (ukazatel je v tisících tun).

Intervalovou řadu má smysl sčítat.Roční součet udává celkovou těžbu za rok 2009 (45 160 tis. t) a za rok 2010 (43 774 tis t).

Page 18: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 1: Těžba uhlí v letech 2009 a 2010 – měsíční údaje.

Měsíc Těžba uhlí [tisíce tun] Rozdíl

2009 2010

leden 4 413 3 887 -526

únor 4 026 3 679 -347

březen 4 085 3 957 -28

duben 3 441 3 325 -116

květen 3 338 3 332 -6

červen 3 492 3 174 -318

červenec 3 011 3 252 241

srpen 3 363 3 335 -28

září 3 507 3 835 328

říjen 4 139 4 296 157

listopad 4 282 3 943 -339

prosinec 4 063 3 759 - 304

Celkem 45 160 43 774 - 1 386

Smysl mají i rozdíly.

V roce 2010 bylo vytěženo o 1 386 tun uhlí méně než v roce 2009.

Rozdíly pro jednotlivé měsíce pak udávají změny z pohledu jednotlivých měsíců.

V lednu 2010 bylo vytěženo o 526 tun uhlí méně než v lednu předchozího roku.

Page 19: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 1: Těžba uhlí v letech 2009 a 2010 – měsíční údaje.Měsíc Těžba uhlí [tisíce tun] Klouzavé

úhrny 2010

2009 2010

leden 4 413 3 887 44 634

únor 4 026 3 679 44 287

březen 4 085 3 957 44 159

duben 3 441 3 325 44 043

květen 3 338 3 332 44 037

červen 3 492 3 174 43 719

červenec 3 011 3 252 43 960

srpen 3 363 3 335 43 932

září 3 507 3 835 44 260

říjen 4 139 4 296 44 417

listopad 4 282 3 943 44 078

prosinec 4 063 3 759 43 774

Celkem 45 160 43 774

Klouzavé úhrny jsou součtem za určité období délky p:

Yn(p)= yn-p+1 + yn-p+2 + ...+ +

yn-1 + yn =

Za období červenec 2009 až červen 2010 (p=12) bylo vytěženo 43 719 tisíc tun uhlí.

n

iiy

1p-n

Page 20: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 1: Těžba uhlí v letech 2009 a 2010 – měsíční údaje.

Měsíc Těžba uhlí [tisíce tun]

2009 2010

leden 4 413 3 887

únor 4 026 3 679

březen 4 085 3 957

duben 3 441 3 325

květen 3 338 3 332

červen 3 492 3 174

červenec 3 011 3 252

srpen 3 363 3 335

září 3 507 3 835

říjen 4 139 4 296

listopad 4 282 3 943

prosinec 4 063 3 759

průměr 3 763 3 648

Význam má i výpočet aritmetického průměru podle vzorce:

yi / n

MS EXCEL = PRŮMĚR(oblast)

V průměru bylo v letech 2009 a 2010 vytěženo 3 706 tis. tun uhlí měsíčně.

V roce 2009 byl průměr 3 763 tis. tun a v roce 2010 3 648 tis. tun měsíčně.

Page 21: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 2: Koncentrace dusíku v Bílině (Most;2010).

Okamžik měření

Koncentrace (mg/l)

5.1.2010 4,9

1.3.2010 4,5

5.5.2010 3,4

7.6.2010 2,6

12.7.2010 10

9.8.2010 5,3

6.9.2010 1,9

4.10.2010 6,6

1.11.2010 1,5

6.12.2010 3,1

Časová řada je okamžiková (udává zásobu uhlí k určitému datu), krátkodobá (měsíční údaje) a naturální (ukazatel je v tunách).

Okamžikovou řadu nemá smysl sčítat.

Page 22: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 2: Koncentrace dusíku v Bílině (Most;2010).

5.1.2010 1.3.2010 5.5.2010 7.6.2010 12.7.2010 9.8.2010 6.9.2010 4.10.2010 1.11.2010 6.12.20100

2

4

6

8

10

12

Koncentrace dusíku v Bílině (Most)

Datum měření

Kon

cen

trac

e (m

g/l)

Page 23: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 2: Koncentrace dusíku v Bílině (Most;2010).

Okamžik měření

Koncentrace (mg/l)

5.1.2010 4,9

1.3.2010 4,5

5.5.2010 3,4

7.6.2010 2,6

12.7.2010 10

9.8.2010 5,3

6.9.2010 1,9

4.10.2010 6,6

1.11.2010 1,5

6.12.2010 3,1

Počítá se tzv. chronologický průměr:

který je průměrem z průměrů dvou po sobě jdoucích hodnot.

Tento vzorec lze použít, pokud je doba mezi odečty vždy stejná.

2 3 11 2

12 3 2 1

...2 2 2

1

...2 2 ,

1

n n

nn n

y y y yy y

yn

yyy y y y

n

Page 24: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 2: Koncentrace dusíku v Bílině (Most;2010).

Okamžik měření

Koncentrace (mg/l)

5.1.2010 4,9

1.3.2010 4,5

5.5.2010 3,4

7.6.2010 2,6

12.7.2010 10

9.8.2010 5,3

6.9.2010 1,9

4.10.2010 6,6

1.11.2010 1,5

6.12.2010 3,1

Pokud doba mezi odečty není vždy stejná, je nutné počítat

vážený chronologický průměr,

kde vahami jsou délky intervalů mezi odečty (ti – ti-1)/Σ(ti – ti-1).

2 3 11 22 1 3 2 1

1

...2 2 2

( )

n nn n

i i

y y y yy yt t t t t t

yt t

Page 25: Statistika

ELEMENTÁRNÍ CHARAKTERISTIKY

Příklad 2: Koncentrace dusíku v Bílině (Most;2010).

Okamžik měření

Koncentrace (mg/l)

(yi-1+yi)

2

Délka intervalu (měsíce)

(yi-1+yi)·(ti-ti-1)

2

5.1.2010 4,9 - - -

1.3.2010 4,5 4,7 2 9,4

5.5.2010 3,4 3,95 2 7,9

7.6.2010 2,6 3 1 3

12.7.2010 10 6,3 1 6,3

9.8.2010 5,3 7,65 1 7,65

6.9.2010 1,9 3,6 1 3,6

4.10.2010 6,6 4,25 1 4,25

1.11.2010 1,5 4,05 1 4,05

6.12.2010 3,1 2,3 1 2,3

Celkem - - 11 48,45

Vážený chronologický průměr:

Průměrná koncentrace v roce 2010 byla 4,41 mg/l.

11

1

2( )

48,454,41

11

i ii i

i i

y yt t

yt t

Page 26: Statistika

ELEMENTÁRNÍ CHARAKTERISTIKY

K orientačnímu posouzení vlastností časových řad lze využít:

1. absolutní diference 1. řádu – rozdíly dvou po sobě jdoucích hodnot časové řady. Vyjadřují absolutní změny mezi dvěma obdobími.

Δt,t-1 = yt – yt-1 pro t = 2,3,...,n.

2. absolutní diference 2. řádu – rozdíly dvou po sobě jdoucích hodnot řady diferencí 1. řádu.

Δ(2)t,t-2 = Δt,t-1 – Δt-1,t-2 pro t = 3, 4 ...,n.

Page 27: Statistika

ELEMENTÁRNÍ CHARAKTERISTIKY

K orientačnímu posouzení vlastností veškerých časových řad lze využít:

3. průměrné diference – průměrná hodnota diferencí za sledované období

1

)(

1

)(...)()(

11123122

1,

n

yy

n

yyyyyy

nnnn

n

iii

Page 28: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

2003 2004 2005 2006 2007 2008 2009 20100

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

Výrobe el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 29: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.Rok Výroba el.

(MWh)1. diference (Δ)

2003 1 878 960 -

2004 2 742 932 863 972

2005 3 133 325 390 393

2006 3 518 883 385 558

2007 3 412 097 -106 786

2008 3 731 013 318 916

2009 4 654 969 923 956

2010 5 903 156 1 248 187

Celkem 28 975 335 4 024 196

Absolutní diference (diference 1. řádu):

Δ2010,2009 = y2010 – y2009 = = 4 654 969 - 5 903 156= 1 248 187 MWh

V roce 2010 vzrostla oproti roku 2009 výroba el. z obnovených zdrojů v ČR o 1 248 187 MWh.

Page 30: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

2003 2004 2005 2006 2007 2008 2009 2010-200000

0

200000

400000

600000

800000

1000000

1200000

1400000

Výrobe el. energie z obnovitelných zdrojů (1. diference)

Rok

1. D

ifer

ence

(M

Wh

)

Page 31: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Průměrné diference:

Mezi roky 2003 až 2010 rostla výroby elektřiny z obnovitelných zdrojů v průměru o 574 885 MWh za rok.

2010 2003( )

1(1878960 59036156)

574885.7

y y

n

Rok Výroba el. (MWh)

1. diference (Δ)

2003 1 878 960 -

2004 2 742 932 863 972

2005 3 133 325 390 393

2006 3 518 883 385 558

2007 3 412 097 -106 786

2008 3 731 013 318 916

2009 4 654 969 923 956

2010 5 903 156 1 248 187

Průměr 3 870 911 574 885

Page 32: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.Rok Výroba el.

(MWh)1. diference (Δ)

2. diference (Δ(2))

2003 1 878 960 - -

2004 2 742 932 863 972 -

2005 3 133 325 390 393 -473 579

2006 3 518 883 385 558 -4 835

2007 3 412 097 -106 786 -492 344

2008 3 731 013 318 916 425 702

2009 4 654 969 923 956 605 040

2010 5 903 156 1 248 187 324 231

Průměr 3 870 911 574 885 64 036

Absolutní diference (diference 2. řádu):

Δ(2)2010,2008 =

= Δ2010,2009 – Δ2009,2008 == 1 248 187 - 923 956 = = 324 231

Praktická interpretace ukazatele již nemá smysl, používá se k odhalení trendu vývoje časové řady.

Page 33: Statistika

ELEMENTÁRNÍ CHARAKTERISTIKY

4. tempa růstu (řetězové indexy) – podíl dvou po sobě jdoucích hodnot.

pro t = 2, 3, ...n.Je to relativní (procentuální) změna mezi dvěma po sobě následujícími obdobími.

5. průměrná tempa růstu – jsou geometrickým průměrem vypočítaným z řady temp růstu a udávají průměrnou relativní (procentuální) změnu za sledované období.

, 11

tt t

t

yk

y

1

1

11,2,31,2 ...

nnn

nn y

ykkkk

Page 34: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.Rok Výroba el.

(MWh)Tempo růstu (%)

2003 1 878 960 -

2004 2 742 932 146%

2005 3 133 325 114%

2006 3 518 883 112%

2007 3 412 097 97%

2008 3 731 013 109%

2009 4 654 969 125%

2010 5 903 156 127%

Průměr 3 870 911 119%

Tempo růstu:

V roce 2010 vzrostla oproti roku 2009 výroba elektřiny z obnovitelných zdrojů o 27 %.

V roce 2007 klesla oproti roku 2006 výroba elektřiny o 3 % (doplněk do 100%, tedy 100 % - 97 %).

20102010,2009

2009

59031561,27

4654969

yk

y

Page 35: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

2003 2004 2005 2006 2007 2008 2009 20100.8

0.9

1

1.1

1.2

1.3

1.4

1.5

Výrobe el. energie z obnovitelných zdrojů (tempa růstu)

Rok

Tem

po

růst

u

Page 36: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Průměrné tempo růstu:

V období mezi roky 2003 – 2010 rostla výroby elektřiny v průměru o 19 % za rok.

2010 71

2003

18789601,19

5903156ny

ky

Rok Výroba el. (MWh)

Tempo růstu (%)

2003 1 878 960 -

2004 2 742 932 146%

2005 3 133 325 114%

2006 3 518 883 112%

2007 3 412 097 97%

2008 3 731 013 109%

2009 4 654 969 125%

2010 5 903 156 127%

Průměr 3 870 911 119%

Page 37: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 4: Výroba elektrické energie v ČSSR a ČR

1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 201540000

50000

60000

70000

80000

90000

100000

Výroba elektřiny v ČSSR a ČR

Rok

Pro

du

kce

(m

il. k

Wh

)

1,043k 1,025k

Page 38: Statistika

JEDNOROZMĚRNÝ MODEL

Jednorozměrný model časové řady je nejjednodušším modelem, ale zároveň i nejvíce využívaným.

Stejně jako v regresní analýze je model zjednodušením reality.

Page 39: Statistika

JEDNOROZMĚRNÝ MODEL

Klasický (formální) model nemá ambice nalézt a popsat věcné příčiny vývoje časové řady. Zabývá se pouze popisem pohybu časové řady. Vychází z historického vývoje ukazatele.

Např.: nehledá příčiny rostoucí výroby elektřiny, jen popisuje, jak se tento ukazatel v čase vyvíjí.

Page 40: Statistika

JEDNOROZMĚRNÝ MODEL

Formální model rozkládá časovou řadu na čtyři složky (dekompozice časové řady).

Není podmínkou, že všechny složky jsou v každé časové řadě obsaženy.

Page 41: Statistika

JEDNOROZMĚRNÝ MODEL

Jednotlivé složky časové řady jsou:

1. Trendová složka (Tt)

Dlouhodobá tendence ve vývoji časové řady.Trend může být rostoucí, klesající, konstantní (časová řada kolísá kolem určité hodnoty) nebo může vykazovat parabolický průběh.

Page 42: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Časová řada s rostoucím trendem.

2003 2004 2005 2006 2007 2008 2009 20100

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

Výroba el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 43: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 5: Průměrná roční teplota v letech 1775 – 2007.

Časová řada s parabolickým trendem.

1775178818011814182718401853186618791892190519181931194419571970198319967.0

8.0

9.0

10.0

11.0

12.0

13.0

Průměrná roční teplota (Klementinum)

Rok

Prů

mšr

ročn

í tep

lota

(°C

)

Page 44: Statistika

JEDNOROZMĚRNÝ MODEL

Jednotlivé složky časové řady jsou:

2. Sezónní složka (St)

Jde o pravidelně se opakující odchylku od trendové složky.Tato odchylka je kratší než jeden rok nebo je rovna právě jednomu roku.

Doba po které se odchylka opakuje se nazývá perioda.

Page 45: Statistika

ÚVOD DO ČASOVÝCH ŘAD

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Časová řada se sezónní složkou s periodou dvanáct měsíců.

Spotřeba tepla výměník VS 903 (Litvínov)

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eba

tep

la (

GJ)

Page 46: Statistika

JEDNOROZMĚRNÝ MODEL

Jednotlivé složky časové řady jsou:

3. Cyklická složka (Ct)

Jde o kolísání kolem trendu v důsledku dlouhodobého vývoje s délkou vlny delší než jeden rok. U kratších časových řad (maximálně několik let se téměř nevyskytují).

Např.: hospodářské, demografické, strojírenské, inovační, klimatické cykly.

Page 47: Statistika
Page 48: Statistika

JEDNOROZMĚRNÝ MODEL

Jednotlivé složky časové řady jsou:

4. Náhodná složka (εt)

Ta část časové řady, kterou nelze popsat pomocí trendu, sezónní nebo cyklické složky. Jsou to výkyvy časové řady vlivem drobných a nepostižitelných příčin nebo vlivem náhody.Analýza vlastností náhodné složky je stejně jako u regresní analýzy důležitým nástrojem pro volbu vhodného modelu.

Page 49: Statistika

JEDNOROZMĚRNÝ MODEL

Není podmínkou, že všechny složky jsou v každé časové řadě obsaženy.

Aditivní model (složky se sčítají):

Yt = Tt + St + Ct + εt

V praxi velmi často používaný.

Multiplikativní model (složky se násobí):Yt = Tt · St · Ct · εt

Page 50: Statistika

TRENDOVÁ SLOŽKA

Ad 1. Trendová složka (Tt) je dlouhodobá tendence ve vývoji časové řady.

Popis trendové složky vede k získání informací o hlavní tendenci ve vývoji analyzovaného ukazatele. Může také posloužit pro odhad (předpověď) ukazatele do budoucnosti.

Nejčastěji se popisuje prostřednictvím konkrétní matematické funkce.

Page 51: Statistika

TRENDOVÁ SLOŽKA

Při praktické analýze časových řad se uplatňují matematické funkce používané v regresní analýze – přímka, parabola, logaritmická funkce a další.

Používají se i složitější např. exponenciální nebo logistická funkce (tzv. S-křivka).

Page 52: Statistika

TRENDOVÁ SLOŽKA

Parametry trendových funkcí se odhadují metodou nejmenších čtverců.

MS EXCEL: Nástroje – Analýza Dat – Regrese

Vysvětlovanou (závislou) proměnnou jsou hodnoty časové řady yt.

Vysvětlující (nezávislou) proměnnou jsou hodnoty času t.

Pozn.: Ty mají v nejjednodušším případě hodnoty t = 1, 2, 3 ... nebo t = 0, 1, 2, 3 ... nebo mohou být definovány konkrétněji např. letopočtem t = 1970, 1971, 1972 ... . Musí však jít o číslo.

Page 53: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Lineární trend (přímka)

yt = b0 + b1·t

Pozn.: jde o lineární (rostoucí) trend, proto směrnice trendové přímky b1 bude kladné číslo.

Lze zapsat i jako:Výroba = b0 + b1·rok

2003 2004 2005 2006 2007 2008 2009 20100

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

Výroba el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 54: Statistika

TRENDOVÁ SLOŽKA

Příklad 5: Průměrná roční teplota v letech 1775 - 2007

Kvadratický trend (parabola)

yt = b0 + b1·t + b2·t2

Lze zapsat i jako:

Průměrná teplota = = b0 + b1·rok + b2·rok2

17751790180518201835185018651880189519101925194019551970198520007.0

8.0

9.0

10.0

11.0

12.0

13.0

Průměrná roční teplota (Klementinum)

Rok

Prů

mšr

ročn

í tep

lota

(°C

)

Page 55: Statistika

TRENDOVÁ SLOŽKA

Příklad 7: Koncentrace CO2 v atmosféře, 1600-2007

Exponenciální trend (exponenciála)

yt = b0·b1t

Tuto funkci je třeba upravit (transformovat), aby mohly být parametry odhadnuty metodou nejmenších čtverců

ln yt = ln b0 + t·ln b1

Sleduje se závislost ln yt na čase t.

Koncentrace CO2 v atmosféře, 1600-2007

270

290

310

330

350

370

390

1600 1650 1700 1750 1800 1850 1900 1950 2000 2050

Zdroj: NOAA, Scripps, CDIAC, and Worldwatch

PP

M

Page 56: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Lineární trend (přímka)

yt = b0 + b1·t

Odhad parametrů lineárního trendu provedeme pomocí

MS ExcelNástroje – Analýza Dat – Regrese

2003 2004 2005 2006 2007 2008 2009 20100

1000000

2000000

3000000

4000000

5000000

6000000

7000000

Výroba el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 57: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Trendová funkce má tvar:yt = -937 900 379 + 469 236·t (pro časovou proměnnou t uvedenou v letech t= 2003, 2004, ..., 2010)

  KoeficientyChyba stř. hodnoty t stat Hodnota P Dolní 95% Horní 95%

Hranice -937900379 134917874 -6,95 0,00 -1268032525 -607768234

rok 469236 67240 6,98 0,00 304704 633767

Každý rok bylo podle modelu vyrobeno o 469 236 MWh elektřiny z obnovitelných zdrojů více než v roce předchozím.

V roce 0 n.l. by podle modelu bylo vyrobeno -937 900 379 MWh elektřiny (hypotetická hodnota bez praktického významu).

Page 58: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Lineární trend Výroba = -937 900 379 + 469 236·rok

2003 2004 2005 2006 2007 2008 2009 20101

1000001

2000001

3000001

4000001

5000001

6000001

7000001

Výroba el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 59: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Lineární trend zobrazený v MS Excel pomocí volby vložit trendovou funkci Výroba = 2E+06 + 469 236·t.

2003 2004 2005 2006 2007 2008 2009 20101

1000001

2000001

3000001

4000001

5000001

6000001

7000001

f(x) = 469236.130952381 x + 1510354.28571429R² = 0.890309401593851

Výrobe el. energie z obnovitelných zdrojů (tempa růstu)

Rok

El.

En

ergi

e (M

Wh

)

Page 60: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Trendová funkce má tvar:yt = 1 510 354 + 469 236·t(MS Excel: pro časovou proměnnou t = 1, 2, ...)

Každý rok bylo podle modelu vyrobeno o 469 236 MWh elektřiny z obnovitelných zdrojů více než v roce předchozím (parametr b1 je stejný = směrnice obou modelů je stejná).V roce 2002 (t = 0, protože t = 1 odpovídá roku 2003) by podle modelu bylo vyrobeno 1 510 354 MWh elektřiny (parametr b0 se mění).

  KoeficientyChyba stř. hodnoty t stat Hodnota P Dolní 95% Horní 95%

Hranice 1510354 339547 4,45 0,00 679512 2341196

t 469236 67240 6,98 0,00 304705 633767

Trendová funkce měla tvar:yt = -937 900 379 + 469 236·t(t uvedeno v letech t= 2003, 2004, ..., 2010)

Page 61: Statistika

TRENDOVÁ SLOŽKA

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Trendová funkce přímky má různý tvar v závislosti na hodnotách časové proměnné t.

Tyto funkce se liší absolutním členem (parametrem b0), ale obě funkce mají stejnou směrnici (parametr b1).

Z tohoto důvodu se v MS Excel mohou lišit odhady vypočtené v bodovém grafu funkcí „Přidat spojnici trendu“ pro spojnicový a bodový graf a odhady vypočtené v nabídce „Nástroje – Analýza Dat – Regrese“.

Page 62: Statistika

VOLBA VHODNÉHO MODELU

Kritérií pro volbu vhodného modelu (vhodné trendové funkce) je několik:

1. věcná analýza

2. grafická analýza

3. analýza diferencí a koeficientů růstu

4. volba na základě determinačních indexů a interpolačních kritérií

Page 63: Statistika

VOLBA VHODNÉHO MODELU

1. Věcná analýzaPosouzení na základě věcné znalosti problému. Jde o řadu rostoucí nebo klesající?

Page 64: Statistika

VOLBA VHODNÉHO MODELU

1. Věcná analýzaPosouzení na základě věcné znalosti problému. Roste (resp. klesá řada) konstantně nebo se její růst

(resp. klesání) zvyšuje nebo snižuje?

Page 65: Statistika

VOLBA VHODNÉHO MODELU

1. Věcná analýzaPosouzení na základě věcné znalosti problému. Roste (resp. klesá) nade všechny meze nebo má

asymptotu (přibližuje se k určité hodnotě)?

Page 66: Statistika

VOLBA VHODNÉHO MODELU

1. Věcná analýzaPosouzení na základě věcné znalosti problému. Má řada nějaký bod zlomu (do něj roste, pak klesá nebo

naopak)?

Page 67: Statistika

VOLBA VHODNÉHO MODELU

2. Grafická analýzaPosouzení grafu časové řady.

Stejný postup jako při regresní analýze. Snaha nalézt nejvhodnější funkci procházející zobrazenými body časové řady.

Tento způsob je ovšem subjektivní.

Page 68: Statistika

VOLBA VHODNÉHO MODELU

2. Grafická analýzaPříklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

2003 2004 2005 2006 2007 2008 2009 20101

1000001

2000001

3000001

4000001

5000001

6000001

7000001

Výroba el. energie z obnovitelných zdrojů

Series1Linear (Series1)Exponential (Series1)

Rok

El.

En

ergi

e (M

Wh

)

Page 69: Statistika

VOLBA VHODNÉHO MODELU

3. Analýza diferencí a koeficientů růstuPro elementární charakteristiky časových řad platí

jednoduchá pravidla:

Lineární trend – první diference Δ jsou přibližně konstantní

Kvadratický trend – druhé diference Δ(2)

jsou přibližně konstantní

Exponenciální trend – koeficienty růstu k jsou přibližně konstantní

Page 70: Statistika

VOLBA VHODNÉHO MODELU

4. Volba na základě determinačních indexů a interpolačních kritérií

Determinační indexy I2 resp. R2 používané v regresní analýze nejsou vhodné, pokud porovnáváme modely s různým počtem parametrů. Lepší je opravený det. index I2

opr.

Při analýze časových řad (i v regresi) se preferují jednodušší modely s nižším počtem parametrů.

Page 71: Statistika

VOLBA VHODNÉHO MODELU

4. Volba na základě determinačních indexů a interpolačních kritérií

Pro některé typy modelů nelze det. indexy počítat. Komplexnějším nástrojem jsou interpolační kritéria,

založená na porovnání skutečných hodnot časové řady yt a hodnot odhadnutých modelem . Počítají se z reziduí modelu.

Model je tím vhodnější, čím je hodnota interpolačního kritéria nižší.

ˆty

Page 72: Statistika

VOLBA VHODNÉHO MODELU

4. Volba na základě interpolačních kritérií M.S.E. (střední čtvercová chyba odhadu)

v praxi se využívá nejvíce

M.A.E. (střední absolutní chyba odhadu)

M.E. (střední chyba odhadu)

pokud je použit odhad MNČ, pak je vždy 0.

2ˆ( )M.S.E. t ty y

n

ˆM.A.E. t ty y

n

ˆM.E. t ty y

n

Page 73: Statistika

VOLBA VHODNÉHO MODELU

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

2003 2004 2005 2006 2007 2008 2009 20101

1000001

2000001

3000001

4000001

5000001

6000001

7000001

Výroba el. energie z obnovitelných zdrojů

Rok

El.

En

ergi

e (M

Wh

)

Page 74: Statistika

VOLBA VHODNÉHO MODELU

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Porovnání alternativních modelů pomocí interpolačních kritérií

Trend M.S.E. M.A.E. M.E.

Lineární 435 767 319 966 0

Kvadratický 419 075 319 966 0

Exponenciální 372 559 308 914 14 467

Podle kritérií M.S.E a M.A.E je nejvhodnější trendovou funkcí exponenciální funkce (hodnoty jsou nejnižší).

Page 75: Statistika

VOLBA VHODNÉHO MODELU

Příklad 3: Výroba el. energie v ČR z obnovitelných zdrojů.

Porovnání alternativních modelů pomocí determinačních indexů

Trend Opravený det. index

Lineární 87,20 %

Kvadratický 88,16 %

Exponenciální 89,16 %

Podle opraveného determinačního indexu je nejvhodnějším modelem exponenciální funkce (hodnoty jsou nejvyšší).

S přihlédnutím k principu jednoduchosti lze využít jednodušší model přímky.

Page 76: Statistika

SEZÓNNÍ SLOŽKA

Sezónní složka (St) je pravidelně se opakující odchylkou od trendové složky s periodou kratší než jeden rok nebo právě jeden rok.

Sezónní kolísaní do značné míry zakrývá trend časové řady.

Není vhodné odhadovat trendovou funkci přímo z řady obsahující sezónní složku. Předpovědi pak nebudou příliš dobré.

Page 77: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Odhad lineárního trendu bez popisu sezónní složky.

Spotřeba tepla výměník VS 903 (Litvínov)

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eba

tep

la (

GJ)

Model řady tvořený jen trendem je zcela nevhodný pro předpověď dalšího vývoje. Neakceptuje totiž pravidelné sezónní výkyvy.

Pozn.: rezidua modelu nebudou náhodná!!

Page 78: Statistika

SEZÓNNÍ SLOŽKA

Model s konstantní sezónností (aditivní model)

Yt = Tt + St + εt

Sezónní výkyvy jsou každý rok stejné.

K popisu sezónní složky se používají tzv. sezónní rozdíly aj (St = aj).

Jedná se o absolutní sezónní odchylku pro j-té období v rámci periody.

Dle délky periody lze značit např. aleden, aúnor nebo apondělí, aúterý ...

Page 79: Statistika

SEZÓNNÍ SLOŽKA

Sezónní rozdíl aj vyjadřuje absolutní rozdíl, tedy o kolik je hodnota sledovaného ukazatele vyšší nebo nižší oproti dlouhodobému průměru.

Tyto výkyvy se v rámci jedné periody kompenzují, tzn. že součet všech rozdílů aj je nulový.

Např.: Pokud je délka periody jeden rok, pak platí:

aleden + aúnor + ... + aprosinec = 0.Je-li délka periody jeden týden, pak platí:

apondělí + aúterý + ... + aneděle = 0.

Page 80: Statistika

SEZÓNNÍ SLOŽKA

Při odhadu sezónních rozdílů aj se provádí tzv. očištění časové řady od sezónní složky pomocí klouzavých průměrů.

Ty vycházejí z klouzavých úhrnů a jsou vlastně průměrnou hodnotou za předem stanovené období.

Např. sedmičlenný klouzavý průměr je průměrem za sedm po sobě jdoucích dní.

Prostý m členný klouzavý průměr:

1,

...1 pt p t p t p

t t ii p

y y yy y

m m

Page 81: Statistika

SEZÓNNÍ SLOŽKA

Příklad 5: Spotřeba tepla na výměníku v LitvínověMěsíc, rok Spotřeba tepla 3-členný

klouzavý pr.

I.95 1071,33 -

II.95 680,02 852,05

III.95 804,8 662,07

IV.95 501,4 560,02

V.95 373,87 354,26

VI.95 187,51 211,62

VII.95 73,5 116,97

VIII.95 89,9 184

IX.95 388,6 298,76

X.95 417,8 510,54

XI.95 725,22 693,41

XII.95 937,22 856,15

I.96 906,01 -

... ...

Trojčlenný klouzavý průměr

= (1 071,33 + 608,02 + 804,8)/3

= 852,05

Jde tedy o průměr tří po sobě jdoucích měsíců.Střední bod průměru připadá vždy na prostřední měsíc (zde únor 1995).

.95 .95 .95

3I II III

t

y y yy

Page 82: Statistika

SEZÓNNÍ SLOŽKA

Příklad 5: Spotřeba tepla na výměníku v LitvínověMěsíc, rok Spotřeba tepla 5-členný

klouzavý pr.

I.95 1071,33 -

II.95 680,02 -

III.95 804,8 686,284

IV.95 501,4 509,52

V.95 373,87 388,216

VI.95 187,51 245,236

VII.95 73,5 222,676

VIII.95 89,9 231,462

IX.95 388,6 339,004

X.95 417,8 511,748

XI.95 725,22 674,97

XII.95 937,22 -

I.96 906,01 -

... ...

Pětičlenný klouzavý průměr

= (608,02 + 804,8 + 501,4 + 373,87 + 187,51)/5 =

= 509,52

Jde tedy o průměr pěti po sobě jdoucích měsíců.Střední bod průměru připadá vždy na prostřední měsíc (zde duben 1995).

.95 .95 .95 .95 .95

5II III IV V VI

t

y y y y yy

Page 83: Statistika

SEZÓNNÍ SLOŽKA

Řada původních hodnot je při očišťování nahrazena řadou klouzavých průměrů.

Průměr „klouže“, protože se postupuje tak, že nejstarší pozorování se vypustí a novější se přidá. Při výpočtu se tak postupuje se vždy o jedno pozorování dopředu.

Page 84: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - klouzavé průměry

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eb

a t

ep

la (

GJ

)

teplo

kl. průměr 3

kl. průměr 5

kl. průměr 7

Page 85: Statistika

SEZÓNNÍ SLOŽKA

Centrovaný m členný klouzavý průměr(používá se pokud m je sudé)

V případě, že je rozsah klouzavé části m sudé číslo, je třeba počítat tzv. centrovaný klouzavý průměr.

Střední body klouzavých částí by jinak nebyla celá čísla. Průměr by nešlo přiřadit ke konkrétnímu měsíci, ale doprostřed mezi dva měsíce.

Proto se počítají prosté klouzavé průměry, ale dvě sousední hodnoty se ještě jednou zprůměrují.

Page 86: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v LitvínověMěsíc, rok Spotřeba tepla

I.95 1071,33

II.95 680,02

III.95 804,8

IV.95 501,4

V.95 373,87

VI.95 187,51

VII.95 73,5

VIII.95 89,9

IX.95 388,6

X.95 417,8

XI.95 725,22

XII.95 937,22

I.96 906,01

... ...

Dvoučlenný prostý klouzavý průměr

= (1 071,33 + 608,02)/ 2 =

= 875,675

Střední bod průměru se však nachází mezi dvěma měsíci (zde mezi lednem a únorem 1995).

.95 .951,5 2

I IIy yy

2-členný klouzavý pr.

875,675

742,41

653,1

437,635

280,69

130,505

81,7

239,25

403,2

571,51

831,22

921,615

Page 87: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v LitvínověMěsíc, rok Spotřeba

tepla

I.95 1071,33

II.95 680,02

III.95 804,8

IV.95 501,4

V.95 373,87

VI.95 187,51

VII.95 73,5

VIII.95 89,9

IX.95 388,6

X.95 417,8

XI.95 725,22

XII.95 937,22

I.96 906,01

... ...

Dvoučlenný centrovaný klouzavý průměr je průměrem dvou po obě jdoucích prostých průměrů

= (875,675+742,41)/2= = 809,04

Střední bod průměru připadá na určitý měsíc (zde únor 1995).

1,5 2,52 2

y yy

2-členný klouzavý pr.

875,675

742,41

653,1

437,635

280,69

130,505

81,7

239,25

403,2

571,51

831,22

921,615

2-členný centrovaný pr.

-

809,04

697,75

545,36

359,16

205,59

106,10

160,47

321,22

487,35

701,36

876,41

-

...

Page 88: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - klouzavé průměry

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eb

a t

ep

la (

GJ

)

teplo

centrovaný 2 členy

centrovaný 6 členů

centrovaný 12 členů

Page 89: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Při porovnání časových řad klouzavých průměrů je patrné, že centrovaný 12-ti členný klouzavý průměr dokázal jako jediný odstranit z časové řady sezónní složku.

Na jeho průběhu nejsou žádné pravidelné výkyvy patrné. Tento průměr je tedy vhodný po očištění časové řady.

Page 90: Statistika

SEZÓNNÍ SLOŽKA

Při odhadu sezónních rozdílů aj se provádí tzv. očištění časové řady od sezónní složky pomocí klouzavých průměrů.

Používá se klouzavý průměr s tolika členy (prostý nebo centrovaný), jak dlouhá je perioda.

Např.: Délka periody je 12 měsíců – použije se 12-ti členný centrovaný klouzavý průměr.

Délka periody je 7 dní – použije se 7 členný prostý klouzavý průměr.

Page 91: Statistika

SEZÓNNÍ SLOŽKA

Samotné sezónní rozdíly aj se pak odvozují z rozdílu mezi skutečnými hodnotami a hodnotami klouzavých průměrů.

Sezónní rozdíl je pak průměrem všech rozdílů spojených se stejným obdobím.

Např.: Zprůměrují se všechny rozdíly odpovídající měsíci lednu za celé sledované období a získá se sezónní rozdíl za leden.

Page 92: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Jan/95 Jul/95 Jan/96 Jul/96 Jan/97 Jul/97 Jan/98 Jul/98 Jan/99 Jul/990

200

400

600

800

1000

1200

Spotřeba tepla výměník VS 903 (Litvínov) - klouzavé průměry

Měsíc

Sp

otř

eba

tep

la (

GJ)

Page 93: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

. Měsíc, rok Spotřeba tepla 12-členný klouzavý pr.

Rozdíl

... ... - -

VI.95 187,51 - -

VII.95 73,5 514,04 -440,54

VIII.95 89,9 512,69 -422,79

IX.95 388,6 517,32 -128,72

X.95 417,8 513,41 -95,61

XI.95 725,22 508,05 217,16

XII.95 937,22 503,19 434,02

I.96 906,01 500,64 405,36

II.96 812,92 501,60 311,31

III.96 783,14 500,65 282,48

IV.96 429,21 500,30 -71,09

V.96 317,31 496,96 -179,65

... ... ...

Rozdíl mezi hodnotou časové řady yI.96 pro leden roku 1996 a odpovídajícím klouzavým průměrem je

405,36 =

= 906,01 – 500,64.

Page 94: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v LitvínověMěsíc Spotřeba tepla 12-členný

klouzavý pr.Rozdíl

I.95 1071,33 - -

I.96 906,01 500,64 405,36

I.97 932,74 459,71 473,02

I.98 716,4 384,47 331,92

I.99 751,41 426,04 325,36

Průměr 383,91

Rozdíly v měsíci lednu.

Empirický sezónní rozdíl je pak aritmetickým průměrem všech lednových rozdílů.

Pozn.: rozdíl za leden 1995 chybí, protože nelze spočítat klouzavý průměr.

Page 95: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v LitvínověMěsíc Empirický

sezónní rozdíl

leden 383,9195

únor 216,0355

březen 189,35075

duben -12,20725

květen -189,02225

červen -318,33825

červenec -386,0865

srpen -346,2545

září -170,91875

říjen 1,8905

listopad 213,61475

prosinec 395,59275

Celkem -22,42375

V tabulce jsou uvedeny empirické sezónní rozdíly.

Výkyvy se v rámci jedné periody mají kompenzovat, tzn. že jejich součet za rok by měl být nulový.

To ovšem pro empirické sezónní rozdíly neplatí, a proto je třeba je ještě upravit.

Page 96: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově Měsíc Empirický

sezónní rozdílUpravený sezónní rozdíl

leden 383,9195 385,79

únor 216,0355 217,90

březen 189,35075 191,22

duben -12,20725 -10,34

květen -189,02225 -187,15

červen -318,33825 -316,47

červenec -386,0865 -384,22

srpen -346,2545 -344,38

září -170,91875 -169,05

říjen 1,8905 3,76

listopad 213,61475 215,48

prosinec 395,59275 397,46

Celkem -22,42375 0

Upravené sezónní rozdíly se kompenzují, jejich součet je 0.

Vypočtou se:

empirický aj – (Σaj / s),

kde s je délka periody.

a*květen =

= -189,02 – (-22,42/12) =

= -187,15

Page 97: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v LitvínověMěsíc Upravený sezónní

rozdíl

leden 385,79

únor 217,90

březen 191,22

duben -10,34

květen -187,15

červen -316,47

červenec -384,22

srpen -344,38

září -169,05

říjen 3,76

listopad 215,48

prosinec 397,46

Celkem 0

a*květen = -187,15

V květnu je spotřeba tepla o 187,15 GJ nižší než je dlouhodobý průměr.

a*leden = 385,79

V lednu je spotřeba tepla o 385,79 GJ vyšší než je dlouhodobý průměr.

Takto je popsána sezónní složka St v modelu. Pro každý měsíc zvlášť.

Page 98: Statistika

SEZÓNNÍ SLOŽKA

Protože model konstantní sezónnosti (aditivní model) má tvar:

Yt = Tt + St + εt ,

provede se odstranění sezónnosti (očištění) podle vzorce:

Yt - St = Tt + εt

(od každé hodnoty časové řady odečteme odpovídající upravený sezónní rozdíl).

Pro očištěnou časovou řadu se pak snažíme nalézt vhodnou trendovou funkci.

Page 99: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Měsíc, rok Spotřeba tepla Sezónní rozdíl Očištěná řada

I.95 1071,33 385,79 685,54

II.95 680,02 217,90 462,11

III.95 804,8 191,22 613,58

IV.95 501,4 -10,34 511,73

V.95 373,87 -187,15 561,02

VI.95 187,51 -316,47 503,97

VII.95 73,5 -384,22 457,71

VIII.95 89,9 -344,38 434,28

IX.95 388,6 -169,05 557,65

X.95 417,8 3,76 414,04

XI.95 725,22 215,48 509,73

XII.95 937,22 397,46 539,75

I.96 906,01 385,79 520,22

... ... ... ...

Očištěná časová řadaod hodnot původní časové řady odčítáme odpovídající upravené sezónní rozdíly.

685,54 = yI.95 – a*leden =

= 1 071,33 – 685,54

Page 100: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - očištěná časová řada

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eba

tep

la (

GJ)

teplo

Očištěná časovářada

Page 101: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Pro očištěnou časovou řadu se zdá být vhodným trendem trend lineární.

Jeho tvar je 533,64 - 2,77174·t

Model časové řady spotřeby tepla má tedy následující tvar:

Yt = Tt + St = 533,64 - 2,77174·t + a*j

trendová složka modelu sezónní složka modelu

Page 102: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Model časové řady spotřeby tepla má tedy tvar:

Yt = Tt + St = 533,64 - 2,77174·t + a*j

Pro odhad hodnot se za t dosazuje časová proměnná (1 až 60) a za a*

j odpovídající upravené sezónní rozdíly.

YI.95 = 533,64 – 2,77174·1 + 385,79 = 916,65 GJ

Model časové řady odhadl, že v lednu roku 1995 byla spotřeba tepla ve výši 916,65 GJ.

Skutečná spotřeba tepla byla 1071,33 GJ. Rozdíl mezi oběma hodnotami je modelem nevysvětlená část (náhodná složka εt).

Page 103: Statistika

SEZÓNNÍ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - skutečné a modelové hodnoty

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Sp

otř

eba

tep

la (

GJ)

teplo

Modelem odhadnutéhodnoty

Page 104: Statistika

POSTUP ODHADU MODELU SE SEZÓNNÍ SLOŽKOU

1. Stanovení délky periody a výpočet odpovídajícího klouzavého průměru ČŘ.

2. Očištění ČŘ od sezónní složky pomocí klouzavého průměru.

3. Výpočte empirických sezónních rozdílů a korekce na upravené sezónní rozdíly.

4. Očištění ČŘ pomocí upravených sezónních rozdílů.

5. Volba vhodné trendové funkce očištěné ČŘ a výpočet parametrů trendu.

Page 105: Statistika

NÁHODNÁ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - rezidua modelu

-200

-150

-100

-50

0

50

100

150

200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99

Měsíc

Rez

idu

a

Page 106: Statistika

NÁHODNÁ SLOŽKA

Náhodná složka (εt) Ta část časové řady, kterou nelze popsat ani pomocí trendu ani sezónní nebo cyklické složky.

Aby byl model vhodný musí splňovat stejné podmínky jako u regresní analýzy (viz. přednáška 7).

1. Rezidua jsou náhodná a nezávislá.2. Rezidua mají normální rozdělení N(0;σ2).3. Rozptyl reziduí σ2 je konstantní.

Page 107: Statistika

NÁHODNÁ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

1. Rezidua jsou náhodná (Znaménkový test)Testovací statistika U = 0,26 < u0,975 = 1,96

Nezamítáme Ho. Rezidua jsou náhodná.

2. Rezidua jsou nezávislá (Durbin-Watsonův test)Testovací statistika DW = 1,98. d = 1,549, h = 1,616.h < DW < 2

Nezamítáme Ho. Rezidua jsou nezávislá.

Page 108: Statistika

NÁHODNÁ SLOŽKA

Příklad 6: Spotřeba tepla na výměníku v Litvínově

2. Rezidua mají normální rozdělení N(0;62,542).(Kolmogorov-Smirnovův test)

Testovací statistika D = 0,063 < 1,36/√60 = 0,18 Nezamítáme Ho. Rezidua mají normální rozdělení.Poznámka: za σ volíme výběrovou sm. odchylku reziduí modelu.

3. Rozptyl reziduí σ2 je konstantní (F-test o shodě rozptylů)

p-hodnota F-testu = 0,817 > α = 0,05Rezidua mají konstantní rozptyl.

Page 109: Statistika

PŘEDPOVĚDI

Pokud rezidua splňují všechny podmínky, lze model použít pro předpověď hodnot na určité období dopředu.

Pozor! To že model dobře popisuje minulost (dobře přiléhá k pozorovaným hodnotám časové řady) ještě neznamená, že předpovědi budoucího vývoje budou také dobré.

Page 110: Statistika

PŘEDPOVĚDI

Naopak! Je možné, že slabší model, který ne tak přesně popisoval minulost, bude mít přesnější předpovědi do budoucnosti.

Page 111: Statistika

PŘEDPOVĚDI

Co lze a nelze předpovědět?S jistotou 100%: fyzikální procesy – přesný pohyb vesmírných

těles, přesný čas východu a západu slunce na 100 let dopředu, odpor vodiče z určitého materiálu.

Page 112: Statistika

PŘEDPOVĚDI

Co lze a nelze předpovědět?S vysokou jistotou: události, které se v čase nemění, události, které nemohou být ovlivněny lidským

jednáním, Události na které nepůsobí náhoda.

Page 113: Statistika

PŘEDPOVĚDI

Co lze a nelze předpovědět?Velmi nepřesné: události ovlivněné kolektivním jednáním lidí

(burzy, kurzy měn), události, které mohou být ovlivněny lidským

jednáním, události, na které působí velké množství vlivů a

náhoda.

Page 114: Statistika

PŘEDPOVĚDI

Pro předpovědi obecně platí: Čím dále do budoucnosti předpovídáme, tím je

předpověď méně přesná.

Page 115: Statistika

PŘEDPOVĚDI

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Model časové řady spotřeby tepla má tvar:

Yt = Tt + St = 533,64 - 2,77174·t + a*j

Pro odhad hodnot na rok 2000 dosazujeme za časovou proměnnou t postupně hodnoty 61 – 72 a za a*

j odpovídající upravené sezónní rozdíly.

YI.2000 = 533,64 – 2,77174·61 + 385,79 = 750,35 GJ

YII.2000 = 533,64 – 2,77174·62 + 217,90 = 579,70 GJ

Page 116: Statistika

PŘEDPOVĚDI

Příklad 6: Spotřeba tepla na výměníku v Litvínově

Spotřeba tepla výměník VS 903 (Litvínov) - předpověď

0

200

400

600

800

1000

1200

I.95 VII.95 I.96 VII.96 I.97 VII.97 I.98 VII.98 I.99 VII.99 I.00 VII.00

Měsíc

Sp

otř

eba

tep

la (

GJ)

teplo

Modelem odhadnutéhodnoty

Page 117: Statistika

117

Intervalové a okamžikové časové řady Krátkodobé a dlouhodobé časové řady Klouzavé úhrny Diference a tempa růstu Model časové řady Trendová složka, Sezónní složka, Cyklická složka,

Náhodná složka Interpolační kritéria Předpovídání

ANALÝZA ČASOVÝCH ŘADDŮLEŽITÉ POJMY – 11. PŘEDNÁŠKA


Recommended