+ All Categories
Home > Documents > Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... ·...

Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... ·...

Date post: 15-Feb-2019
Category:
Upload: duongnga
View: 221 times
Download: 0 times
Share this document with a friend
83
VYSOK ´ A ˇ SKOLA POLYTECHNICK ´ A JIHLAVA Katedra matematiky Statistick´ a anal´ yza a ˇ casov´ rady v pˇ ıkladech Stanislava Dvoˇ akov´ a 2015
Transcript
Page 1: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

VYSOKA SKOLA POLYTECHNICKA JIHLAVA

Katedra matematiky

Statisticka analyza a casove rady

v prıkladech

Stanislava Dvorakova

2015

Page 2: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

Stanislava Dvorakova

STATISTICKA ANALYZA A CASOVE RADY V PRIKLADECH

1. vydanıISBN 978-80-88064-18-3

Vydala Vysoka skola polytechnicka Jihlava, Tolsteho 16, Jihlava, 2015Tisk Edicnı oddelenı VSPJ, Tolsteho 16, JihlavaZa jazykovou a vecnou spravnost obsah dıla odpovıda autor. Text neprosel jazy-kovou ani redakcnı upravou.

c© Ing. Stanislava Dvorakova, Ph.D., 2015

Page 3: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

Uvodnı slovo

Tento studijnı text je urcen studentum bakalarskeho studia na Vysoke skole poly-technicke v Jihlave, predevsım oboru Zdravotne socialnı pracovnık jako podporapri studiu predmetu Demografie a statisticka analyza. Jedna se o studenty, kterıjsou ve vetsı ci mensı mıre matematikou nezasazeni. Nicmene by meli mıt alesponpovsednı prehled o statistice a zakladnım statistickem zpracovanı dat (napr. z do-taznıku). Zaroven je mohou pouzıt i studenti jinych oboru jako podpurny material(nikoli dostacujıcı) pri studiu statistiky.

Tato skripta jsou rozdelena do trı zakladnıch kapitol. V prvnı kapitole se jednao popisnou statistiku, kde je zpracovavana jedna statisticka promenna. Vztahdvou promennych je rozebran ve druhe kapitole. Tretı kapitola se zameruje nazaklady casovych rad.

Ucebnic o teorii statisticke analyzy bylo uz napsano dosti. V techto sktiptechse budu odkazovat prevazne na dvoje, a to od kolegu B. Minarıka a J. Boruvkove(viz doporucena literatura na konci skript). V nich je statisticke zpracovanı datdocela dobre a srozumitelne popsane. Oboje skripta jsou ale urcena pro jine obory,ktere majı statistiky ve vyuce vıce, a nektere kapitoly jsou popsany podrobneji.

Proto v techto skriptech nebudeme probırat detailne teorii, ale zamerıme se naukazku konkretnıho zpracovavanı dat v prıkladech. Ovsem, aby student pochopilprobırany prıklad, je zapotrebı si prostudovat i prıslusnou teorii.

Prıklady nejsou razeny po sobe tak, jak to ve vetsine statistickych ucebnicbyva. Vzdy se zamerıme na jednu otazku a budeme se snazit ji vyresit od zacatkudo konce.

Po delsım premyslenı jsem se rozhodla, ze ukazu zpracovanı dat v programuMS Excel na konkretnıch prıkladech. Samozrejme, ze existujı specialnı statis-ticke softwary, ktere behem chvilky kyzene zpracovanı udelajı bez vetsı namahyzpracovatele. Pouzitı techto progmamu ma vsak nekolik

”ale“. Za prve musı mıt

uzivatel nektery program k dispozici. Za druhe ho musı umet ovladat (vetsinaje v anglictine). A za tretı musı zpracovatel take rozumet vysledkum a umet jedobre interpretovat. Kdezto MS Excel (a jine podobne tabulkove procesory) jsouhodne rozsırene a clovek v nich v podstate vypocıta jen to, co umı a cemu rozumı.Coz pro zakladnı analyzu dat stacı.

Autorka

VSP Jihlava, 2015 S. Dvorakova

Page 4: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

Obsah

Vysvetlivky k pouzıvanym symbolum 5

1 Zakladnı zpracovanı dat 61.1 Nominalnı promenna . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Ordinalnı promenna . . . . . . . . . . . . . . . . . . . . . . . . . 131.3 Kardinalnı promenna nespojita . . . . . . . . . . . . . . . . . . . 161.4 Kardinalnı promenna spojita . . . . . . . . . . . . . . . . . . . . . 261.5 Shrnutı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.6 Prıklady k procvicenı . . . . . . . . . . . . . . . . . . . . . . . . . 33

2 Zavislosti dvou promennych 392.1 Kategorialnı promenne . . . . . . . . . . . . . . . . . . . . . . . . 392.2 Korelacnı a regresnı analyza . . . . . . . . . . . . . . . . . . . . . 472.3 Shrnutı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.4 Prıklady k procvicenı . . . . . . . . . . . . . . . . . . . . . . . . . 54

3 Casove rady 573.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.2 Prumerovanı casovych rad . . . . . . . . . . . . . . . . . . . . . . 633.3 Mıry dynamiky . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.4 Dekompozice casovych rad . . . . . . . . . . . . . . . . . . . . . . 703.5 Shrnutı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783.6 Prıklady k procvicenı . . . . . . . . . . . . . . . . . . . . . . . . . 79

Doporucena studijnı literatura 83

VSP Jihlava, 2015 S. Dvorakova

Page 5: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

Vysvetlivky k pouzıvanym symbolum

Osvetlenı ucivaProhlubuje zakladnı ucivo a detailne popisuje pouzite vzorce nebopostupy.

Pojmy k zapamatovanıKlıcove pojmy, ktere byste po prostudovanı meli umet vysvetlit aktere se dale pouzıvajı.

PrıkladKonkretizace problematiky v praxi ci realnych prıpadech.

Shrnutı kapitolyKlıcove body pro opakovanı a signalizace k opakovanemu studiucastı, kterym nerozumıte.

Pojmy k zapamatovanıVycet pojmu uzitych v kapitole, ktere je zapotrebı si zapamatovata znat jejich pouzitı.

Testy a otazkyProverte do jake mıry jste ucivo pochopili, zapamatovali si pod-statne informace a pojmy. Venujte jim maximalnı pozornost!

LiteraturaPouzita literatura ve studijnım materialu, typy pro doplnenı arozsırenı zakladnıch poznatku nabytych studiem opory.

VSP Jihlava, 2015 S. Dvorakova 5

Page 6: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. Zakladnı statisticke zpracovanıdat – trıdenı a charakteristiky

V teto kapitole se podıvame na zakladnı statisticke zpracovanı jedne promenne.Jak bylo receno v uvodu, nebudeme zde rozebırat teorii (k tomu jsou jiz k dispo-zici jina skripta uvedena v seznamu literatury), ale vse si postupne ukazeme naprıkladech.

Vychazıme z toho, ze mame k dispozici vysledky nejakeho statistickeho (napr.dotaznıkoveho) setrenı. Prıslusne otazky budeme brat postupne a budeme je jed-notlive zpracovavat od zacatku do konce. Tzn. nejprve vytvorıme prehlednoutabulku, pak z nı udelame graf a nakonec, pokud to bude mozne, vypocıtamenejaka cısla, ktera nam budou charakterizovat vysledky setrenı.

Navod na to, jak vytvorit dotaznık, formulovat otazky, posbırat data a jak jezpracovat do elektronicke podoby, je popsan mimo jine i ve skriptu [1].

Prıklad 1.1. Z klientu dennıho stacionare jsme vybrali 25 klientu, o nichz jsmezjistili mimo jine i udaje uvedene v tabulce 1.1. Jedna se o cıslo klienta (kvuliprehlednosti, vetsinou nahrazuje jmeno apod.), pohlavı, rok narozenı, mısto tr-valeho bydliste (kvuli zjednodusenı ukazky statisticke analyzy se jedna pouzeo ctyri obce, ve skutecnosti se muze jednat o vıce obcı a vıce klientu), pocetvlastnıch detı, velikost oblecenı klienta, zda klient ma vlastnı zuby a castku jehoduchodu.

V nasledujıcıch prıkladech si ukazeme par moznostı, jak lze tyto udaje zpra-covat metodami popisne statistiky. Vetsinu teorie k temto metodam naleznetenapr. ve skriptech [2, Kap. 1 – 4] nebo [5, Moduly 1, 2]. 4

Pred samotnou analyzou by bylo zapotrebı data v tabulce klasifikovat. Je tonutne zejmena k tomu, abychom si uvedomili, co vlastne mame za informace,jak k nim tedy mame pristupovat a jake metody a charakteristiky lze pouzıt,abychom nepocıtali cısla, ktera nelze smysluplne interpretovat.

Nejprve si ale trochu objasneme statistickou terminologii, se kterou se budemenadale setkavat (viz [2, str. 8, 9]).

Populace (zakladnı soubor) je mnozina vsech existujıcıch predmetu po-zorovanı, u nichz se vyskytuje sledovana vlastnost. Napr. vsichni klienti

VSP Jihlava, 2015 S. Dvorakova 6

Page 7: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT

Tabulka 1.1: Udaje o klientech v dennım stacionari

c.klienta pohlavı rok nar. bydliste poc. detı velikost duchod v Kc vlastnı zuby

1 muz 1941 Jihlava 0 S 8 453 ano

2 zena 1928 Polna 2 L 7 536 ano

3 muz 1931 Brtnice 2 S 9 531 ne

4 muz 1930 Jihlava 3 XL 8 123 ne

5 muz 1929 Brtnice 2 M 8 942 ne

6 zena 1939 Stonarov 0 L 6 813 ne

7 zena 1938 Polna 1 XL 9 532 ano

8 muz 1927 Stonarov 3 M 7 642 ne

9 zena 1928 Jihlava 4 XL 7 545 ano

10 muz 1942 Jihlava 0 L 6 952 ano

11 muz 1936 Jihlava 1 L 5 164 ne

12 zena 1929 Stonarov 3 M 7 501 ano

13 muz 1932 Jihlava 2 S 6 218 ne

14 zena 1933 Brtnice 0 XL 9 002 ne

15 zena 1938 Brtnice 0 M 6 805 ano

16 zena 1934 Jihlava 4 L 10 645 ne

17 muz 1935 Brtnice 1 S 6 237 ano

18 zena 1932 Jihlava 2 L 7 432 ano

19 muz 1935 Polna 1 L 8 543 ne

20 muz 1930 Stonarov 5 XL 11 543 ne

21 zena 1936 Jihlava 1 M 6 572 ano

22 muz 1938 Jihlava 1 S 10 812 ne

23 zena 1935 Brtnice 2 L 7 218 ne

24 zena 1929 Polna 3 M 7 892 ano

25 muz 1941 Stonarov 2 XL 8 756 ne

VSP Jihlava, 2015 S. Dvorakova 7

Page 8: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT

dennıch stacionaru, vsichni seniori (vseobecne), vsichni studenti VSPJ, vsech-na auta jezdıcı po dalnici, apod.

Rozsah (velikost) populace se znacı N . V nasem prıpade rozsah zakladnıhosouboru nezname (tj. ze zadanı nevıme, jaky je pocet vsech klientu dennıhostacionare).

Statisticky soubor je mnozina vsech zkoumanych objektu. V nasem prıpadese jedna o 25 klientu dennıho stacionare. Tento soubor muze byt shodnys populacı (v nasem prıpade nenı) nebo se jedna o vyberovy soubor, v nemzjsou urcitym zpusobem vybrani zastupci populace (vzorek). Vetsinou sejedna o nahodny vyber.

Statisticke jednotky (prvky, elementy) jsou jednotlivı klienti. Kazde jed-notce nalezı jeden radek v tabulce 1.1.

Rozsah souboru je pocet vsech jednotek souboru a znacı se n. Platı n ≤ N(rozsah souboru nemuze byt nikdy vetsı nez velikost populace). V nasemprıpade je n = 25 (pocet vybranych klientu).

Statisticke znaky (promenne) jsou vlastnosti statistickych jednotek, kteremuzeme dale analyzovat. Jedna se tedy o nazvy sloupcu v tabulce, tj. po-hlavı, rok narozenı, atd.

Obmeny statistickeho znaku jsou hodnoty, jichz kazda promenna nabyva.Jsou to udaje, ktere jsou napsany v jednotlivych bunkach tabulky. Promen-na

”bydliste“ ma ctyri obmeny, a to Brtnice, Jihlava, Polna a Stonarov.

Podle obmen statistickeho znaku urcujeme typy dat:

Promenna

JJJJ

kvalitativnı(kategorialnı, slovnı . . . )

kvantitativnı(numericka, cıselna . . . )

���

PPP spojita

diskretnı

���

HHH ordinalnı

nominalnı

Nominalnı promenne majı obmeny slovnı. V nasem prıkladu jsou to”po-

hlavı“ (zena/muz),”vlastnı zuby“ (ano/ne) a

”bydliste“ (Brtnice/Jihlava/. . . ).

V prvnıch dvou prıpadech se jedna o slovnı znak alternativnı (binarnı), protozenabyvajı pouze a prave dvou obmen.

VSP Jihlava, 2015 S. Dvorakova 8

Page 9: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.1 Nominalnı promenna

Ordinalnı promennou je”velikost“. Jedna se o slovnı nebo cıselnou obmenu.

Dulezite ale je, ze jednotlivym variantam lze priradit logicke poradı. Muze se jed-nat napr. o spokojenost se sluzbami (spokojen hodne/spokojen malo/nespokojen),dosazene vzdelanı (zakladnı/ucnovske/s maturitou/vysokoskolske) nebo znamkuz matematiky v pate trıde zakladnı skoly.

Ostatnı promenne jsou kardinalnı (meritelne, cıselne). Promenna”duchod“

je spojita, protoze muze nabyvat jakekoli hodnoty v urcitem intervalu. Oprotidalsım znakum (

”rok narozenı“,

”pocet detı“), ktere jsou diskretnı (lze mıt jedno

nebo dve deti, ale ne 1,5 dıtete).

Zminme jeste dva dulezite pojmy. A to bodove a intervalove trıdenı. Bo-dove trıdenı pouzıvame u slovnıch promennych a u cıselne promenne, ktera mamalo obmen. Intervalove trıdenı se pouzıva u cıselne promenne s vıce obmenamia u spojite promenne. Vıce lze najıt napr. v [2, Kap. 1.3.1].

1.1 Nominalnı promenna

V nasledujıcım prıkladu si ukazeme, jak lze zpracovat nominalnı, nebo-li slovnı,promennou z tabulky 1.1.

Prıklad 1.2. Proved’me nynı statistickou analyzu promenne”bydliste“.

Jak bylo receno vyse, jedna se o nominalnı (slovnı) znak, ktery lze trıditpouze bodove. To znamena, ze spocıtame, kolik klientu je z Brtnice a dalsıchobcı. Urcıme tedy absolutnı cetnost ni pro kazdou obec a secteme. (Musımedostat rozsah souboru n = 25. Je to kontrola spravnosti vypoctu, jestli se nanejakeho klienta nezapomnelo.) Dale spocıtame relativnı cetnost

pi =ni

n.

Ta vyjadruje procento klientu (z celkoveho poctu vybranych 25 klientu), kterıbydlı v prıslusne obci. Relativnı cetnost se bud’ vyjadruje desetinnym cıslemnebo v procentech. (Soucet sloupce relativnı cetnosti musı vyjıt 1 = 100%.)

Vse napıseme do tabulky cetnostı (frekvencnı tabulky) a seradıme podlevelikosti (od nejpocetnejsı obce). Nekdy lze tabulku seradit i podle abecedy.Vysledek trıdenı nominalnı promenne

”bydliste“ je ukazan v tabulce 1.2.

V MS Excel lze pouzıt funkci COUNTIF nebo nastroj Kontingencnı tabulka,ktery najdeme v nabıdce Vlozit.

Popisovat pouzıvanı funkcı v MS Excel nenı naplnı tohoto textu.(Predpoklada se totiz, ze student ma nejake zakladnı znalosti. At’ ze strednı

VSP Jihlava, 2015 S. Dvorakova 9

Page 10: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.1 Nominalnı promenna

Tabulka 1.2: Bodove trıdenı promenne”bydliste“

bydliste absolutnı cetnost relativnı cetnost

xi ni pi

Jihlava 10 10/25 = 0, 40 = 40 %

Brtnice 6 6/25 = 0, 24 = 24 %

Stonarov 5 5/25 = 0, 20 = 20 %

Polna 4 4/25 = 0, 16 = 16 %

celkem 25 1 =100 %

skoly nebo z predmetu Zaklady informatiky.) Nicmene u funkce COUNTIFse zastavıme, protoze to je mene znama, ale velice uzitecna vec. Tato funkcevratı pocet bunek v zadane oblasti, ktere splnujı pozadovane kriterium. Tımkriteriem muze byt v nasem prıpade nazev pozadovane obce (na obrazku1.1 je nazev vlozen odkazem na Jihlavu). Tuto funkci lze pouzıt i v prıpade,ze budeme chtıt vedet napr. kolik lidı ma duchod mensı nebo roven castce7000 Kc (obrazek 1.2).

Obrazek 1.1: Vypocet poctu klientu z Jihlavy pomocı funkce COUNTIF

V dalsım textu popıseme, jak lze vytvorit kontingencnı tabulku. Na karteVlozit zvolıme Kontingencnı tabulka. Za vstupnı oblast muzeme oznacit celou ta-bulku 1.1 (je to jednodussı a prehlednejsı) a kontingencnı tabulku je lepsı umıstitdo noveho prazdneho listu. Promennou

”bydliste“ mysı presuneme do Radky a

”c. klienta“ do Hodnoty (sem se muze presunout v podstate jakakoli promenna,

VSP Jihlava, 2015 S. Dvorakova 10

Page 11: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.1 Nominalnı promenna

Obrazek 1.2: Vypocet poctu klientu majıcı duchod ≤ 7000 Kc pomocı COUNTIF

ale”c. klienta“ ma jednoznacne a neopakujıcı se hodnoty, takze je jistota, ze bu-

dou cetnosti spocıtany spravne). Musıme jeste zkontrolovat, ze se pocıta Pocet ane Soucet hodnot (pokud se jedna o cısla, je automaticky nastaven prave soucet).Poprıpade to musıme zmenit v nabıdce Nastavenı polı hodnot, jak je ukazano naobrazku 1.3. Kontrola je takova, ze se podıvame na poslednı radek kontingencnıtabulky, kde je soucet vsech hodnot (Celkovy soucet) a toto cıslo musı byt stejnejako rozsah souboru. V nasem prıpade n = 25.

Obrazek 1.3: Vypocet absolutnıch cetnostı promenne”bydliste“ v kontingencnı

tabulce

Relativnı cetnost zıskame tak, ze do pole Hodnoty pridame znovu”c. klien-

ta“ a hodnoty nechame zobrazit jako % z celkoveho souctu (viz obrazek 1.4).Na zaver kontingencnı tabulku seradıme od nejcetnejsı obce (obrazek 1.5).

Nastroj Kontingencnı tabulka je relativne jednoduchy a rychly. Nesmımeovsem zapomınat na to, ze MS Excel spoustu vecı nastavuje automaticky

VSP Jihlava, 2015 S. Dvorakova 11

Page 12: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.1 Nominalnı promenna

(jak si”myslı“, ze to ma byt) a my to tak obcas nechceme. Proto nesmıme

zapomenout poradne zkontrolovat, jestli v tabulce mame opravdu to, cotam chceme mıt.Dale je treba si uvedomit, ze se kontingencnı tabulka sama neprepocıta(tak, jak to delajı funkce). Pri jakekoli zmene puvodnıch dat je zapotrebıtabulku aktualizovat.

Obrazek 1.4: Zobrazenı relativnı cetnosti v kontingencnı tabulce

Obrazek 1.5: Serazenı kontingencnı tabulky od nejcetnejsı obce

Dale je vhodna graficka prezentace dat. Pro nominalnı promennou se hodınapr. vysecovy, sloupcovy nebo pruhovy graf (viz [2, Kap. 2.1]). Na obrazku 1.6je ukazan jednoduchy vysecovy graf.

Nejcetnejsı statisticka obmena znaku se nazyva modus. V nasem prıpade sejedna o obec, ze ktere pochazı nejvıce kientu, tj. x =Jihlava.

VSP Jihlava, 2015 S. Dvorakova 12

Page 13: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.2 Ordinalnı promenna

Obrazek 1.6: Vysecovy graf promenne”bydliste“

To je vse, co se da delat s nominalnımi daty. Kumulativnı cetnost nebo ruznecharakteristiky (prumer atd.) nema smysl pocıtat.

V prıpade zobrazovanı relativnı cetnosti si dejte pozor na spravnou inter-pretaci grafu, aby nekdo neznaly problemu z neho nevyvodil spatny zaver.Uved’me si prıklad: Zeptame se dvou studentek, zda majı rady matematiku(zrovna jdou ze zkousky ze Statistiky a dostaly vybornou). Pak napıseme,ze 100 % studentek ma rado matematiku.Graf proto musı byt vzdy zcela jasny, jednoznacny, dobre popsany a pokudmozno i jednoduchy (pokud je toho v grafu moc, spatne se v nem orientuje).Je lepsı vytvorit graf vlastnı a nepouzıvat Kontingencnı graf. Nelze v nemtotiz menit vsechna nastavenı, ktera by byla zapotrebı, aby byl graf

”pekny“, prehledny a mel tu spravnou vypovıdajıcı schopnost.

4

1.2 Ordinalnı promenna

Pri zpracovavanı ordinalnı promenne postupujeme ze zacatku stejne jako u no-minalnı promenne. Je jedno, zda se jedna o slovnı nebo cıselne obmeny. Duleziteje, ze je muzeme seradit, tj. urcit, ktera je

”mensı“ a ktera

”vetsı“. Frekvencnı

tabulku navıc rozsırıme o kumulativnı cetnost. Ukazeme si to v nasledujıcımprıkladu.

VSP Jihlava, 2015 S. Dvorakova 13

Page 14: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.2 Ordinalnı promenna

Prıklad 1.3. Proved’me statisticke zpracovanı promenne”velikost“. Jedna se

o slovnı ordinalnı promennou. Jejı obmeny muzeme logicky seradit od nejmensıpo nejvetsı: S, M, L, XL.

Pro kazdou obmenu (velikost) spocıtame absolutnı cetnost (kolikrat se v sou-boru vyskytuje) a relativnı cetnost (procentualnı zastoupenı) a vytvorıme frek-vencnı tabulku analogicky jako v prıkladu 1.2 pro nominalnı promennou (jenomtabulku nebudeme radit podle cetnosti, ale logicky (ne abecedne) podle znaku x– velikosti), viz tabulka 1.3.

Tabulka 1.3: Frekvencnı tabulka pro promennou”velikost“

cetnosti

velikost absolutnı relativnı kumulativnı relativnı

xi ni pi kpi

S 5 0,20 0, 20

M 6 0,24 0, 2 + 0, 24 = 0, 44

L 8 0,32 0, 2 + 0, 24 + 0, 32 = 0, 76

XL 6 0,24 0, 2 + 0, 24 + 0, 32 + 0, 24 = 1, 00

celkem 25 1,00 x (nescıta se)

Kumulativnı absolutnı cetnost je pocet hodnot, ktere nabyvajı variantynizsı nebo rovne variante, pro kterou kumumulativnı cetnost pocıtame. U kumu-lativnı relativnı cetnosti se jedna o vyjadrenı v procentech a pocıta se podlevzorce:

kpi =i∑

j=1

pj .

Muzeme rıci, ze 76 % klientu ma velikost L a mensı. Logicky musı byt kumul. rel.cetnost v poslednım radku tabulky rovna 1 (100 %), protoze jsou secteni vsichniklienti (klienta s vetsı velikostı uz nemame).

Kumulativnı relativnı cetnost nechame v kontingencnı tabulce spocıtat tak,ze do pole Hodnoty pridame znovu

”c. klienta“ a hodnoty zobrazıme jako

% mezisouctu (viz obrazek 1.7).

Pro grafickou prezentaci ordinalnı promenne se muze pouzıt sloupcovy apruhovy graf. Vynaset muzeme cetnosti absolutnı, relativnı a kumulativnı. Naobrazku 1.8 je ukazka pruhoveho grafu relativnı cetnosti.

VSP Jihlava, 2015 S. Dvorakova 14

Page 15: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.2 Ordinalnı promenna

Obrazek 1.7: Zobrazenı kumulativnı relativnı cetnosti v kontingencnı tabulce

Obrazek 1.8: Pruhovy graf promenne”velikost“

Jednou z charakteristik, kterou zde ma smysl uvadet je modus. Jedna seo nejcastejsı hodnotu, nejcetnejsı moznost, odpoved’ na otazku:

”Jakou velikost

ma nejvıce lidı?“. Modus urcıme z frekvencnı tabulky nebo grafu. Nejvıce lidı mavelikost L, tzn. modus x = L.

Dale je mozno uvest charakteristiky, ktere se urcujı z kumulativnı cetnosti.Jedna se o tzv. kvantily. Nejpouzıvanejsı je median, dolnı a hornı kvartil.(Pozor na zamenu sluvek kvantil a kvartil!)

Vysvetleme si podstatu medianu, ostatnı kvantily jsou obdobne.Medianu se take nekdy rıka

”prostrenı hodnota“. Takze se jedna o cıslo,

ktere je presne uprostred. Ale jak na nej prijıt? Predstavme si, ze klien-ty seradıme do rady podle velikosti (jako v telocviku) od nejmensıho po

VSP Jihlava, 2015 S. Dvorakova 15

Page 16: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

nejvetsıho. Nebo je seradıme od nejlehcıho po nejtezsıho, od nejmenevzdelaneho po nejvıce vzdelaneho, od nejmladsıho po nejstarsıho, prosteje seradıme podle znaku, ktery zrovna zkoumame. Potom najdeme toho,ktery stojı presne uprostred rady a jeho velikost je zadany median.Problem je s tım presne uprostred. Pokud budu mıt 3 lidi (lichy pocet),prostrednı je druhy a je to. Pokud ale budou 4 klienti (sudy pocet),prostrednıho nemame. Pulka je nekde mezi druhym a tretım. Potom seobvykle spocıta prumer druheho a tretıho a prohlası se to za median.Na median se da pohlızet i tak, ze delı soubor na dva stejne pocetne dıly,kde v prvnı polovine jsou vsechny mensı nebo stejne a ve druhe vetsı nebostejne hodnoty. Proto hledame prostrednıho, cili 50% klienta.

Pokud mame spocıtanou kumulativnı cetnost (nejlepe relativnı), lze kvantilyurcovat z nı, protoze mame klienty serazene podle velikosti a postupne sectene.Median rozdeluje soubor na poloviny, takze hledame 50 %. Najdeme takovy radekfrekvencnı tabulky 1.3, kde kumulativnı relativnı cetnost poprve presahne 0,5 (tj.50 %). Potom je median x =L.

Kvartily rozdelujı soubor na 4 stejne pocetne dıly. Dolnı (prvnı) kvartil urcujehodnota 25 % a hornı (tretı) odpovıda 75 %. Hledajı se obdobne jako median.Dolnı kvartil je tam, kde kumul. rel. cetnost poprvne presahne 0,25, tj. x0,25 =M.A hornı kvartil je x0,75 =L.

Zkuste vsech 25 klientu tabulky 1.1 seradit podle velikosti a carami je rozdelitna poloviny a ctvrtiny. Zjistıte, ze hodnoty odpovıdajı nami vypoctenym.

Pozor! Prumer zde nema smysl pocıtat. Bylo by to hezke rıci: prumerna veli-kost klientu je . . .. Ale jak vypocıtat prumer, kdyz velikost mame danou pısmeny?

4

1.3 Kardinalnı promenna nespojita

Nespojitou cıselnou promennou lze trıdit bodove i intervalove. Rozhoduje pocetobmen, rozsah souboru a ucel statistickeho zpracovanı. Pro popis dat se pouzijıcharakteristiky (mıry). Statisticke charakteristiky jsou takova cısla, ktera obsa-hujı informace o podstatnych statistickych vlastnostech studovaneho souboru.Vyznam charakteristik spocıva predevsım v moznosti srovnavat, jak dalece sejednotlive datove soubory ve svych vlastnostech shodujı nebo lisı.

Nejcasteji se urcujı tri skupiny charakteristik:

Mıry polohy (urovne) – urcujı umıstenı na cıselne ose (jestli se hodnoty po-hybujı v jednotkach nebo milionech).

VSP Jihlava, 2015 S. Dvorakova 16

Page 17: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Mıry variability (promenlivosti) – urcujı variabilitu hodnot, vetsinou kolemjedne (typicke) polohy.

Momentove charakteristiky – nejznamejsı je asymetrie (sikmost) a spicatost.

Detailnejsı popis charakteristik lze najıt napr. v [2, Kap. 1.4 – 1.6].

Prıklad 1.4. Zpracujte pocet detı klientu dennıho stacionare z tabulky 1.1.Promenna

”pocet detı“ nabyva sesti hodnot, a to 0 az 5. Pouzijeme proto

bodove trıdenı (pocet obmen je”rozumny“). Postupovat budeme stejne, jako

v predchozım prıkladu 1.3. Pomocı nastroje Kontingencnı tabulka v MS Excel vy-tvorıme frekvencnı tabulku obsahujıcı absolutnı, relativnı a kumulativnı cetnosti.Toto bodove trıdenı je v tabulce 1.4.

Tabulka 1.4: Bodove trıdenı promenne”pocet detı“

pocet detı abs. cetnost relat. cetnost kumulativnı r. c.

xi ni pi kpi

0 5 0,20 0,20

1 6 0,24 0,44

2 7 0,28 0,72

3 4 0,16 0,88

4 2 0,08 0,96

5 1 0,04 1,00

celkem 25 1,00 x

Nasledne muzeme vytvorit graf. Vhodny je sloupcovy, skladany pruhovy atd.(viz [2, Kap. 2.1]). Na osu y grafu muzeme vynest jakoukoli cetnost (absolutnı,relativnı, kumulativnı) podle toho, jak a na co graf potrebujeme. Na obrazku 1.9je ukazka sloupcoveho grafu s relativnı cetnostı.

Pro dobry prehled o datech je vhodne spocıtat nektere statisticke charakte-ristiky polohy ([2, Kap. 1.4]), charakteristiky variability ([2, Kap. 1.5]) a charak-teristiky sikmosti a spicatosti ([2, Kap. 1.6]).V MS Excel lze k teto zalezitosti pristupovat nekolika zpusoby:

1. Pouzitım nastroje Popisna statistika.

2. Pouzitım funkcı MS Excel.

3. Vypocıtanım charakteristik z frekvencnı tabulky.

VSP Jihlava, 2015 S. Dvorakova 17

Page 18: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Obrazek 1.9: Sloupcovy graf promenne”pocet detı“

Ke kyzenym hodnotam je mozno dobrat se i jinym zpusobem, ale zde uvedenejsou nejjednodussı a relativne snadno pochopitelne. Pri vyberu zpusobu vypoctuzalezı na tom, zda mame k dispozici puvodnı data nebo jenom zpracovanou ta-bulku cetnostı, zda potrebujeme pouze jednu hodnotu (napr. prumer) nebo vıcecharakteristik.

Pokud jsou k dispozici puvodnı data, tzn. mame v tabulce vsechny vysledkysetrenı tak jako v tabulce 1.1, potom muzeme pouzıt kteroukoli metodu.Mame-li ovsem k dispozici pouze frekvencnı tabulku, napr. tabulku 1.4,prvnı dve metody pouzıt nemuzeme!

Ze cvicnych duvodu si ukazeme vsechny tri moznosti, kazdy uzivatel necht’ sipotom vybere takovy, ktery mu bude vyhovovat. Zacneme od poslednı moznosti,nebot’ tam budeme pocıtat jednotlive charakteristiky postupne a muzeme si tedylepe a podrobneji popsat jejich interpretaci.

Ad 3) Rucnı pocıtanı z frekvencnı tabulky:Pokud mame k dispozici pouze trıdena data (v frekvencnı tabulce), a ne puvodnıhodnoty, nelze pouzıt ani funkce MS Excel, ani nastroj Popisna statistika amusıme pouzıt tento zpusob vypoctu. Jedna se vetsinou o data odnekud stazena,napr. ze statistickeho uradu, kde jsou ruzne tabulky volne k dispozici. Tzn., zestahneme (dostaneme) uz zpracovanou tabulku obsahujıcı pouze obmeny statis-tickeho znaku a absolutnı (prıpadne relativnı) cetnost. Puvodnı data k dispozicinemame (v prıpade scıtanı lidu ze statistickeho uradu by se jednalo o milionyhodnot).

Vzorce a popis vypoctu charakteristik lze najıt napr. v [2, Kap. 1]. Nebudemeproto vypocet popisovat detailne. Spocıtejme nejprve aritmeticky prumer.

VSP Jihlava, 2015 S. Dvorakova 18

Page 19: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Na tomto mıste dovolte malou odbocku od prıkladu. Vetsine ctenaru,kterym je tento text urcen, jsou uvedene vzorce pro vypocet vazenehoprumeru (a dalsıch) na prvnı pohled necitelne. Nicmene, pri malemzamyslenı je mohou sami odvodit a vysvetlit. Ukazeme si to na jablkach.Predstavte si, ze v domove duchodcu jsou tri muzi a dvanact zen. Kazdymuz snı ctyri jablka a kazda zena jedno jablko za den. Kolik prumernejablek kazdy bez ohledu na pohlavı snı? To umı spocıtat deti na zakladnıskole: Celkem se denne snı 3 · 4 + 12 · 1 = 24 jablek. Vydelenım celkovympoctem lidı (15) dostavame prumerny pocet jablek na jednoho klientax = 3·4+12·1

15= 24

15= 1, 6, tj. kazdy snı prumerne 1,6 jablka za den.

Co toto cıslo znamena? Pokud by opravdu kazdy z 15-ti klientu snedl 1,6jablka, rozdali bychom 24 jablek dohromady vsem klientum.A ted’ si to preved’me do reci matematiky: mame promennou

”pocet jablek“

– ozn. xi, a absolutnı cetnost – ozn. ni (kolik lidı snı prıslusny pocet jablek),pricemz celkovy pocet lidı je n = 15. (Proc zrovna pocet jablek jsme oznacilix a pocet lidı n a ne obracene? Protoze pocıtame prumerny pocet jablek najednoho cloveka a ne prumerny pocet lidı na jedno jablko. A to, co pocıtame,oznacujeme jako neznamou x.) Prumerny pocet jablek jsme vypocıtali tak,ze jsme pocet jablek vynasobili prıslusnym poctem lidı (xi ·ni), secetli (znak∑

) a vydelili celkovym poctem lidı ( 1n). Kdyz to vse slozıme dohromady,

dostavame vzorec pro vypocet aritmetickeho prumeru:

x =1

n

∑xi · ni .

Predstavme si, ze nevıme, kolik lidı je v domove duchodcu, ale vıme, ze jetam

(315

=)

20 % muzu a(1215

=)

80 % zen. Kolik prumerne jablek snı? Taksi rekneme, ze v domove duchodcu je 100 lidı, tedy 20 muzu a 80 zen, avypocet prumeru provedeme jako v predchazejıcım prıpade: x = 20·4+80·1

100=

160100

= 1, 6.Nebo si muzeme rıci, ze je tam jeden celek, z toho petina muzu (20% =0, 2) a ctyri petiny zen (80% = 0, 8). Prumerny pocet jablek je potomx = 0,2·4+0,8·1

1= 1, 6. V tomto prıpade jsme pouzili mısto absolutnı cetnosti

(ni) cetnost relativnı (pi) a vzorec pro vypocet aritmetickeho prumeru je

x =∑

xi · pi

(deleno cıslem jedna jsme vynechali). Z uvedenych vztahu vyplyva, zeje jedno, zda pri vypoctu pouzıvame absolutnı nebo relativnı cetnost(vysledky musı vyjıt stejne). Pouzitı relativnı cetnosti je jednodussı v tom,

VSP Jihlava, 2015 S. Dvorakova 19

Page 20: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

ze nemusıme delit rozsahem souboru.Nemusıme uvazovat o jablkach, muzeme seniorum rozdavat deti, duchodynebo vek a vypocet se bude provadet vzdy stejnym zpusobem podlestejneho vzorce.Pri vypoctu postupujeme

”zevnitr“ vztahu. To znamena, ze nejprve pro

kazdy radek vypocteme to, co je uvnitr sumy (to s indexy i) – vyhodne jepouzıt kopırovanı vypoctu s odkazy na prıslusne bunky. Potom cely sloupecsecteme, prıpadne jeste vydelıme a dostaneme vysledek.

Vypocet prumeru je ukazan v tabulce 1.5 v patem sloupci. Prumerny pocetdetı klientu dennıho stacionare je 1,8.

Tabulka 1.5: Pracovnı tabulka pro vypocet charakteristik promenne”pocet detı“

pocet detı abs.c. rel.c. kum.rel.c. pro prumer pro rozptyl

xi ni pi kpi xipi x2i pi

0 5 0,20 0,20 0 0

1 6 0,24 0,44 0,24 0,24

2 7 0,28 0,72 0,56 1,12

3 4 0,16 0,88 0,48 1,44

4 2 0,08 0,96 0,32 1,28

5 1 0,04 1,00 0,20 1,00∑25 1 x 1,80 5,08

Nejcastejsı hodnota, nebo-li modus, se nejlepe urcuje ze sloupcoveho grafu.Na obrazku 1.9 je jasne videt, ze nejvıce lidı ma dve deti. Modus je tedy x = 2.

Median, kvartily, kvantily a percentily se urcujı z frekvencnı tabulky, ato z kumulativnı relativnı cetnosti. U techto charakteristik mame vzdy zadanaprocenta (median = 50 %, dolnı kvartil = 25 % a hornı kvartil = 75 %, poprıpadedalsı). Na kterem radku kumulativnı rel. cetnost poprve prekrocı pozadovaneprocento, tam odecteme prıslusnou charakteristiku. Proto je median x = 2, dolnıkvartil x0,25 = 1 a hornı kvartil x0,75 = 3.

Co nam vlastne tyto charakteristiky rıkajı? Pokud klienty seradıme vedle sebepodle poctu detı a vybereme prvnıch napr. 25 % (tj. 6,25 klientu), muzeme s jis-totou rıci, ze vsichni budou mıt jedno a mene detı.

VSP Jihlava, 2015 S. Dvorakova 20

Page 21: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Dovolte jeste malou poznamku o charakteristikach urovne. Aritmetickyprumer je tou nejpouzıvanejsı charakteristikou. Jenze, oproti kvantilum(hlavne medianu), je velice citlivy na extremnı hodnoty (at’ uz nızke nebovysoke). Predstavme si, ze mame firmu s deseti zamestnanci. Devet pra-covnıku ma plat deset tisıc korun a reditel padesat tisıc. Prumerny platje 9·10 000+50 000

10= 14 000 Kc. Reditel si zvedne plat na pet set tisıc, takze

prumerny plat ve firme vzroste na 59 000 Kc. Kdezto 85% kvantil je ne-ustale 10 000 Kc. Zaver o statistikach, kde se mluvı pouze o prumeru, necht’

si kazdy laskavy ctenar vytvorı sam.Pokud nejaka charakteristika nenı citliva na odlehle hodnoty, mluvı se o ro-bustnı charakteristice.

Variacnı rozpetı je rozdıl mezi extremy, vzdalenost mezi maximem a mini-mem, R = xmax − xmin = 5 − 0 = 0. Jedna se o sırku intervalu, ve kterem senachazı vsechny hodnoty souboru.

Mezikvartilove rozpetı je rozdıl mezi dolnım a hornım kvartilem Q =x0,75 − x0,25 = 3 − 1 = 2. Jedna se o sırku intervalu, ve kterem se nachazıprostrednıch 50 % hodnot.

Rozptyl je dulezita charakteristika variability. Zjednodusene receno nam rıka,jak moc jsou data

”rozptylena“ (odchylena) kolem prumeru. Vıce o rozptylu

a jeho vlastnostech lze najıt napr. v [5, Moduly 1, 2]. Nejznamejsı vzorec provypocet rozptylu je nasledujıcı

s2 =∑

(xi − x)2pi .

Pro prakticky vypocet je lepsı pouzıt upraveny vzorec, a to

s2 =(∑

x2i pi

)− (x)2 = 5, 08− 1, 82 = 1, 84 .

Vypocet prvnı sumy (∑x2i pi) je ukazan v tabulce 1.5 v sestem sloupci.

Opet lze pro vypocet pouzıt krome relativnı cetnosti i cetnost absolutnı podlevzorcu

s2 =1

n

∑(xi − x)2ni =

1

n

(∑x2ini

)− (x)2 .

Pokud v predeslem vzorci nedelıme velikostı souboru n, ale cıslem n − 1,jedna se o tzv. vyberovy rozptyl. Mezi rozptylem a vyberovym rozptylem

VSP Jihlava, 2015 S. Dvorakova 21

Page 22: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

je maly rozdıl a cım vıce mame dat, tım je tento rozdıl mensı. Vyberovyrozptyl se pouzıva tam, kde nemuzeme z nejakeho duvodu

”zmerit“ vsechny

jednotky, tj. celou populaci, zapıseme tedy jenom cast jednotek (vyber,tj. mısto vsech klientu stacionare zmerıme pouze par nahodne vybranychklientu), ale vysledek vztahneme na celou populaci (vsechny klienty).

S rozptylem je problem ten, ze vyjadruje”pocet detı na druhou“, coz je tezko

predstavitelne. Proto se zavadı smerodatna odchylka, kterou vypocıtame jakoodmocninu z rozptylu

s =√s2 =

√1, 84 = 1, 36.

Muzeme potom rıci, ze pocet detı klientu se pohybuje zhruba v hodnotach 1,8dıtete plus minus 1,36 dıtete. Dulezite je to sluvko

”zhruba“, protoze to nenı zcela

presna interpretace, ale pro zakladnı predstavu to stacı.Pro porovnanı rozptylu dvou ruznych promennych nemuzeme pouzıt rozptyl

ani smerodatnou odchylku. Ty dve porovnavane promenne mohou totiz mıt jinejednotky, napr. vaha v kg a vyska v cm. A pokud jsou ve stejnych jednotkach,mohou se pohybovat v jinych cıslech (majı jiny prumer), napr. plat poslance aplat uklızecky.

Vypocıtame proto variacnı koeficient

v =s

x=

1, 36

1, 8= 0, 7556 = 75, 56 %.

Jedna se o bezrozmernou velicinu, pomocı ktere muzeme srovnavat ruzne promenne,napr. pocet detı × vek klienta, a nezalezı na jejich jednotkach.

Nekdy je potreba vedet, jak jsou data usporadana kolem prumeru. K tomunestacı smerodatna odchylka (variacnı koeficient). Pokud se podıvame na graf naobrazku 1.9, je videt, ze data jsou levostranna (vrchol grafu je vychylen smeremk nizsım hodnotam – vlevo). Cıselne nam to rekne koeficient sikmosti (asy-metrie). Vypocet tohoto koeficientu ovsem uvadet nebudeme. Zajemci mohouprıslusne vzorecky najıt napr. v [5].

Obcas stacı urcit asymetrii pouze z grafu a velikosti modu a prumeru.Pokud je nejvyssı sloupec vıce v levo a modus je mensı nez prumer, jsoudata levostranna. Pokud je nejvyssı sloupec vpravo a modus je vetsı nezprumer, jsou data pravostranna. Pokud je nejvyssı sloupecek uprostred amodus s prumerem se rovnajı, lze rıci, ze data jsou symetricka. Schematickyje to znazorneno na obr. 1.10. Ale mejte na pameti, ze je to pouze odhad.

Nekdy se take pocıta koeficient spicatosti (excesu). Je-li tento koeficientroven nule, hovorı se o normalnı spicatosti. Pak muze byt podnormalnı a nad-normalnı spicatost. Tato hodnota je opet citliva na odlehle hodnoty a navıc ji

VSP Jihlava, 2015 S. Dvorakova 22

Page 23: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Obrazek 1.10: Asymetrie statistickych dat

ovlivnuje i asymetrie. Proto se doporucuje pri jejı interpretaci postupovat velmiopatrne. Vzorec pro vypocet najdete napr. v [2, Kap. 1.6].

Samozrejme zde nejsou popsane vsechny charakteristiky, ktere lze pocıtat.Ukazali jsme jenom par nejpouzıvanejsıch. V prıpade potreby lze dalsı najıtv ruznych ucebnicıch statistiky. Jedna se napr. o percentily, ruzne odchylky kolemprumeru nebo medianu, atd.

Ad 2) Preddefinovane funkce MS Excel:Tyto funkce lze pouzıt pouze a vyhradne jenom na netrıdena puvodnı data!!!V tabulce 1.6 je prehled nejpouzıvanejsıch funkcı se strucnym popisem pouzitı.Nazvy funkcı jsou psane pro verzi MS Excel 2013, ktery se v soucsne dobe pouzıvak vyuce na VSPJ. U starsıch (prıpadne novejsıch) verzı se nektere nazvy mohoulisit.

Pokud budeme pocıtat vıce charakteristik, je vyhodne oblast dat pojmeno-vat (obrazek 1.11). Pote muzeme do funkce napsat pouze nazev a nemusımepokazde prıslusnou oblast dat vyznacovat. (Pro nasich 25 hodnot to nenı ta-kovy problem, ale pokud budeme mıt rozsah souboru vetsı, uz by se mohlyvyskytovat chyby v tom, ze nemusı byt pokazde oznacena vsechna data.)Vysledne hodnoty jsou uvedeny v tabulce 1.7. Poznamenejme k nim toliko:Pozor na funkci MODE.SNGL, ta najde jeden modus a pokud data obsahujımodu nekolik (nebo zadny, zalezı na uhlu pohledu), tak to nezjistı. FunkceMODE.MULT najde mody vsechny, ale jedna se o maticovou funkci, kterase vklada kombinacı klaves Ctrl+Shift+Enter. Pokud nekdo nevı, o co jde,tak to tezko pouzije. Dale je potreba poznamenat, ze koeficient spicatostivypocıtany funkcı KURT je vyberovy a o neco malo se lisı oproti koeficientuspicatosti vypoctenemu v bode 3). To same platı o koeficientu sikmosti afunkci SKEW.

VSP Jihlava, 2015 S. Dvorakova 23

Page 24: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Tabulka 1.6: Vyber funkcı MS Excel 2013 pro popisnou statistiku

CETNOSTI Matice absolutnıch cetnostı na zaklade intervalu

(maticova funkce)

COUNTIF Absolutnı cetnost dat splnujıcı dane kriterium

CORREL Vypocet korelacnıho koeficientu

KURT Vyberova spicatost

MAX Maximum

MEDIAN Median

MIN Minimum

MODE.MULT Matice modu (maticova funkce)

MODE.SNGL Modus

PERCENTIL.INC Percentily

POCET Pocet cısel

POCET2 Pocet neprazdnych bunek

PRUMER Aritmeticky prumer

QUARTIL.INC Kvartily

SKEW Koeficient asymetrie

SMODCH.P Smerodatna odchylka

SMODCH.VYBER.S Vyberova smerodatna odchylka

VAR.P Rozptyl

VAR.S Vyberovy rozptyl

Ad 1) Popisna statistika:Pouzıva se na puvodnı data a jedna se o doplnkovy nastroj MS Excel. Nemusı byttedy na kazdem pocıtaci nainstalovan. Pri doinstalovanı postupujeme nasledovne(nenı zapotrebı instalacnı CD): Soubor – Moznosti – Doplnky a pridame Analytickenastroje. Ty pak najdeme na karte Data. V techto nastrojıch vybereme Popisnastatistika a nastavıme pozadovane moznosti analyzy (data by mela byt v jednomsloupci). Vystup je zobrazen na obrazku 1.12.

VSP Jihlava, 2015 S. Dvorakova 24

Page 25: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.3 Kardinalnı promenna nespojita

Obrazek 1.11: Nadefinovanı noveho nazvu v MS Excel

Tabulka 1.7: Vysledky stat. analyzy promenne”pocet detı“ pouzitım funkcı

pocet 25

minumim 0

maximum 5

prumer 1,8

modus 2

median 2

dolnı kvartil 1

hornı kvartil 3

rozptyl 1,840

smerodatna odchylka 1,356

Na jednotlive hodnoty jsme se zamerili v ostatnıch bodech. Na tomto mıstejenom poznamenejme, ze prumer je tu oznacen jako strednı hodnota, pocetje rozsah souboru. Rozptyl (a tım i smerodatna odchylka) je vypocıtan jakovyberovy rozptyl. Koeficienty sikmosti a spicatosti jsou take vyberove.

VSP Jihlava, 2015 S. Dvorakova 25

Page 26: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

Obrazek 1.12: Vysledek statisticke analyzy promenne”pocet detı“ nastrojem Po-

pisna statistika

4

1.4 Kardinalnı promenna spojita

V teto kapitole se zamerıme na zpracovanı kardinalnı promenne spojite. Pripo-menme, ze se jedna o takovy statisticky znak, jehoz hodnoty jsou cısla, a tov podstate jakekoliv hodnoty (napr. vek, vyska, vaha, plat, atd.). Pro spojitoucıselnou promennou pouzijeme intervalove trıdenı (vıce [2, Kap. 1.3.2]).

Nez zacneme trıdenı provadet, je potreba se zastavit a poradne zamyslet (ne-jednat zbrkle). Musıme zvolit pocet intervalu (trıd) k, jejich sırku h a jejich hra-nice (meze). Intervaly volıme tak, aby se neprekryvaly a tesne na sebe navazovaly.Dale je treba rozhodnout, do ktereho intervalu majı spadat krajnı body intervalu,zda do praveho nebo leveho, tj. zda budou intervaly zprava nebo zleva otevrene.Tzn. bud’ 〈10; 20) nebo (10; 20〉.

Obvykla byva stejna sırka (h) pro vsechny intervaly. Nekdy se muze vyskyt-nout prıpad, kdy je potreba mıt intervaly ruzne velke (jinak by trıdenı nemelotu spravnou vypovıdajıcı hodnotu). Jako prıklad muze poslouzit demografickerozdelenı obyvatelstva napr. na detskou slozku do 14-ti let, produktivnı vek 15 az64 let a postproduktivnı vek nad 65 let (seniori). Tımto problemem se ale zabyvatnebudeme, je tam slozitejsı vypocet potrebnych charakteristik.

VSP Jihlava, 2015 S. Dvorakova 26

Page 27: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

Casto se nechavajı prvnı a poslednı interval”otevrene“ pro extremnı hodnoty.

Jejich sırku pro jednoduchost uvazujeme take rovnu h.Existujı ruzne vzorce a predpisy pro urcenı poctu trıd. Zalezı ovsem take na

ucelu zkoumanı, jaka jsou data a rozsahu souboru. Mene nez 5 trıd nema smysl anemeli bychom ani volit pres 20 trıd, protoze tak trıdenı ztracı na prehlednosti.

Hranice intervalu take volıme s rozvahou. Uvedomme si, ze pri vypoctu ruznychcharakteristik jednotlive intervaly nahrazujeme jedinou hodnotou, a to stredemtrıdy (cıslem, ktere je presne uprostred intervalu – aritmetickym prumerem oboumezı trıdy). Radeji vytvorıme interval 〈10, 20), ktery ma stred 15, nez interval〈10, 21) se stredem 15, 5.

Prıklad 1.5. Proved’me nynı statistickou analyzu promenne”duchod“.

Zjistıme rozsah souboru (n = 25), minimalnı (xmin = 5 164) a maximalnı(xmax = 11 543) hodnotu, vypocıtame variacnı rozpetı R = 6 379. Z podstaty datvytvorıme 7 trıd s sırkou h = 1 000 a prvnım stredem 5 500, viz tabulka 1.8. Tutotabulku lze opet v MS Excel vytvorit nekolika zpusoby:

• funkcı CETNOSTI, do ktere se vklada matice hornıch hranic intervalu ajedna se o maticovou funkci (ukazovat ji nebudeme).

• nastrojem Kontingencnı tabulka. Z promenne”duchod“ vytvorıme kon-

tingencnı tabulku jako u promenne”bydliste“ v prıkladu 1.2. Potom nechame

sloupecek s duchody Seskupit (viz obrazek 1.13), kde vetsinou zmenımeZacatek a Prırustek, oproti tomu, co MS Excel automaticky navrhne. Ne-zapomente zkontrolovat, zda se vytvorily intervaly tak, jak jste chteli.

Obrazek 1.13: Vytvorenı intervalu v kontingencnı tabulce

VSP Jihlava, 2015 S. Dvorakova 27

Page 28: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

Poznamenejme, ze v MS Excel v kontingencnı tabulce se intervaly tvorızprava otevrene (napr. 〈6 000; 7 000), 〈7 000; 8 000), atd.). To znamena, zeduchod 7 000 pripadne do druheho intervalu. POZOR, funkce CETNOSTIuvazuje intervaly presne obracene, tedy zprava uzavrene.

Tabulka 1.8: Intervalove trıdenı promenne”duchod“

c. inter. interval stred inter. abs. cetn. relat. cetn. kumul. rel. c.

xi ni pi kpi

1 do 6 000 5 500 1 0,04 0,04

2 6 000 – 7 000 6 500 6 0,24 0,28

3 7 000 – 8 000 7 500 7 0,28 0,56

4 8 000 – 9 000 8 500 5 0,20 0,76

5 9 000 – 10 000 9 500 3 0,12 0,88

6 10 000 – 11 000 10 500 2 0,08 0,96

7 11 000 a vıce 11 500 1 0,04 1,00∑25 1,00 x

Dale vytvorıme grafy. Pro spojity kardinalnı znak se v MS Excel nejvıce hodısloupcovy nebo spojnicovy graf (vıce v [2, Kap. 2.2]). Sloupcovemu grafu se rıkahistogram a jeho specifikace je ta, ze nema mezery mezi sloupci. Je to z tohoduvodu, ze se jedna o spojita cısla a mela by byt v grafu zahrnuta vsechna (tedymez mezer). Ukazka histogramu je na obrazku 1.14. Jako popis osy x muzemepouzıt stred trıdy nebo intervaly pri vynasenı absolutnı ci relativnı cetnosti ahornı hranice trıd pri vynasenı kumulativnı cetnosti. Hodne zalezı na mıstu,ktere mame k dispozici pro zobrazenı grafu, ale take na tom, zda prıslusny grafpouzijeme v tiskove podobe v nejake publikaci (napr. bakalarske praci) neboho budeme nekde prezentovat (napr. pri obhajobe prace). Pri vytvarenı grafunesmıme zapomenout na prehlednost. Melo by platit pravidlo

”kouknu a vidım“

(a pochopım).Na obrazku 1.15 je ukazka spojnicoveho grafu kumulativnı relativnı cetnosti.

Na osu x vynasıme hornı hranice trıd, pricemz vlozıme jeste nultou trıdu s nulovoucetnostı, aby graf zacınal od nuly (na ose y).

Dale budeme pocıtat charakteristiky polohy a variability. Podrobny vypocettechto charakteristik byl popsan v prıkladu 1.4.

VSP Jihlava, 2015 S. Dvorakova 28

Page 29: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

Obrazek 1.14: Histogram promenne”duchod“

Obrazek 1.15: Graf kumulativnı cetnosti duchodu klientu

Predefinovane funkce MS Excel a nastroj Popisna statistika se pouzıva nanetrıdena (puvodnı) data. Pokud mame k dispozici pouze frekvencnı tabulku,musıme charakteristiky pocıtat rucne pomocı vzorcu (viz [2, Kap. 1.4, 1.5, 1.6]).Za xi dosazujeme stredy trıd, jinak se vse pocıta analogicky jako u bodovehotrıdenı. Vysledky jsou napsany v tabulce 1.9.

Kdyz se na vysledky vypoctu podıvame pozorne, zjistıme, ze se cısla lisı.Je to tım, ze Popisna statistika a preddefinovane funkce pouzıvajı puvodnıdata, kdezto pri rucnım vypoctu za kazde cıslo v intervalu dosazujemedo vzorce stred trıdy a tım je vypocet zkreslen. Popisna statistika pocıtarozptyl jako vyberovy rozptyl (a tım i smerodatnou odchylku).

VSP Jihlava, 2015 S. Dvorakova 29

Page 30: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

Tabulka 1.9: Charakteristiky promenne”duchod“

pomocı popisne funkcemi rucne z frekvencnı

statistiky MS Excel tabulky

pocet 25 25 25

minimum 5 164 5 164 x

maximum 11 543 11 543 x

prumer 8 056,36 8 056,36 8 020,0

modus x x 〈7 000; 8 000)

median 7 642 7 642 〈7 000; 8 000)

dolnı kvartil x 6 952 〈6 000; 7 000)

hornı kvartil x 8 942 〈8 000; 9 000)

rozptyl 2 378 844 2 283 690 2 169 600

smerodatna odchylka 1 542 1 511 1 473

variacnı koeficient x 0,188 0,184

Modus jsme urcili z grafu nebo z frekvencnı tabulky, jinak to nejde, protozekazdy duchod je jinak velky (kazde cıslo je v datech pouze jednou). Tımpadem jsme v podstate neurcovali modus, ale modalnı interval (trıdu).Tj. takovy interval, ve kterem je zastoupeno nejvıce hodnot. V nasemprıkladu se jedna o 3. interval 〈7000; 8000). Popr. za modus prohlasımestred prıslusneho modalnıho intervalu.Pri urcovanı kvantilu z frekvencnı tabulky se postupuje tak, ze se najdeinterval, ktery obsahuje prıslusny kvantil, napr. median (50% kvantil). Pakza median prohlasıme stred trıdy. Pokud nam to takto nestacı a chtelibychom median urcit presneji, lze jej aproximovat. Tımto se ale zabyvatnebudeme.

Z grafu 1.14 muzeme usuzovat, ze se jedna o mırne levostranna data. V tomtoprıpade to lze odhadnout i z velikosti modu a prumeru. Pro levostannou asymetriije modus mensı nez prumer.

Z vypocıtanych charakteristik polohy lze sestrojit krabicovy graf, kteryje vhodny mimo jine pro porovnavanı. Na obrazku 1.16 je ukazano srovnanıduchodu muzu a zen v dennım stacionari. Carky nejvıce vlevo znacı minimum,

VSP Jihlava, 2015 S. Dvorakova 30

Page 31: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.4 Kardinalnı promenna spojita

carky nejvıce vpravo maximum. Levy kraj”krabice“ je dolnı kvartil, pravy kraj

je hornı kvartil. Cara uvnitr znacı median. Jinymi slovy carky ctene z leve stranyznamenajı: minimum, dolnı kvartil, median, hormı kvartil a maximum. Krızekuprostred je prumer.

Obrazek 1.16: Krabicovy graf srovnanı duchodu muzu a zen v dennım stacionari

V podstate pouhym pohledem muzeme okomentovat rozdıly mezi duchodymuzu a zen. Muzi majı vetsı rozsah duchodu nez zeny. Ale vıce nez 75 % zen(hornı kvartil) ma duchod mensı nez 50 % muzu (median) a nez je dokonceprumerny duchod u muzu. A tak podobne bychom mohli pokracovat dal.

Tyto grafy lze umıstit vodorovne i svisle. Nevyhodou je, ze MS Excel krabicovygraf neumı sam a jednoduse sestrojit. Je potreba vetsı znalosti MS Excel nebopouzıt nejaky statisticky program (Statistica, SPSS a dalsı), ktery umı krabicovygraf konstruovat jednoduse. 4

VSP Jihlava, 2015 S. Dvorakova 31

Page 32: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.5 Shrnutı

1.5 Shrnutı

Statistika se zabyva zıskavanım informacı z dat. V prezentaci vysledku zpracovanıdat a analyzy se vyuzıvajı tabulky a grafy. Statisticke udaje delıme na kardinalnı(cıselna), ordinalnı (poradova) a nominalnı (slovnı).

Zakladnı metodou statistickeho zpracovanı dat je trıdenı. Bodove trıdenı sepouzıva pro promenou nominalnı, ordinalnı a nespojitou kardinalnı, obsahuje-li

”rozumny“ pocet variant. Na spojita kardinalnı data se pouzije intervalove trıdenı.

Vysledkem trıdenı je frekvencnı tabulka, ktera obvykle obsahuje hodnoty znaku,absolutnı cetnost, relativnı cetnost a kumulativnı cetnosti (absolutnı ci relativnı).

V datovem souboru lze najıt urcite vyznamne hodnoty. Jedna se predevsımo charakteristiky polohy (minumim, maximum, prumer, modus, median, dolnı ahornı kvartil, atd.), charakteristiky variability (variacnı rozpetı, rozptyl, smerodat-na odchylka, variacnı koeficient, atd.), koeficient sikmosti (asymetrie), koeficientspicatosti a mnoho dalsıch.

Pro zpracovanı dat je dulezite, zda mame k dispozici puvodnı data nebo jenomfrekvencnı (kontingencnı) tabulku. V prvem prıpade muzeme pro zpracovanı pouzıtfunkce MS Excel, nastroj kontingencnı tabulka nebo Popisna statistika. Ve druhemprıpade pozadovane charakteristiky muzeme pouze pocıtat

”rucne“ z tabulky podle

vzorecku.

Pojmy k zapamatovanı:

• Statisticky soubor, jednotky, znaky, promenne, rozsah, obmeny,

• statisticke znaky nominalnı, ordinalnı, kardinalnı, spojite, nespojite, alter-nativnı,

• cetnost absolutnı, relativnı, kumulativnı,

• frekvencnı tabulka,

• graf sloupcovy, spojnicovy, vysecovy, histogram,

• charakteristiky urovne, variability,

• aritmeticky prumer, modus, median, kvantily, hornı a dolnı kvartil,

• variacnı rozpetı, rozptyl, smerodatna odchylka, variacnı koeficient,

• koeficient sikmosti, spicatosti.

VSP Jihlava, 2015 S. Dvorakova 32

Page 33: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

1.6 Prıklady k procvicenı

1. Vymyslete prıklad nominalnı alternativnı promenne.

2. Vymyslete dva prıklady ordinalnı promenne, a to slovnı a cıselnou.

3. Vymyslete prıklad kardinalnı promenne spojite.

4. Jake trıdenı pouzijete na nasledujıcı promennou? Jaky lze pouzıt graf proprezentaci? Jake charakteristiky ma smysl spocıtat?

(a)”Nejoblıbenejsı cetba“ s obmenami detektivka, roman, pohadka, sci-fi,

comics,

(b)”Znamka z matematiky“,

(c)”Vek detı chodıcıch do MS“,

(d)”Vek bydlıcıch na sıdlisti Brezinovy sady“,

(e)”Vyska studentu VSPJ“.

5. Proved’te trıdenı promennych”pohlavı“ a

”rok narozenı“ z tabulky 1.1.

Vytvorte vhodne grafy. Vysledky zkuste interpretovat.

6. V tabulce 1.1 vytvorte novou promennou”vek“, statisticky ji zpracujte a

interpretujte.

(Jake trıdenı pouzijete? Jaky lze pouzıt graf pro prezentaci? Jake charak-teristiky ma smysl spocıtat?)

V dalsım se budeme odkazovat na tabulku 1.10. Jedna se o vysledky statistickehosetrenı mezi zamestnanci jedne firmy. Sloupce postupne znamenajı:

c. – cıslo zamestnance kourıte – Kourıte?

pohlavı pijete – Jak casto pijete alkohol?

bydliste zmena – Kolikrat jste zmenili zamestnanı?

vaha (v kg) delka – delka nynejsıho zamestnanı (v letech)

vyska (v cm) plat (v Kc)

7. Klasifikujte vsechny statisticke znaky, tj. urcete jejich typ, jejich obmeny, ajake se pouzije trıdenı na jejich zpracovanı.

8. Zpracujte promennou”bydliste“. Pouzijte bodove trıdenı, vypoctete rela-

tivnı cetnost, vytvorte vysecovy graf, urcete modus a interpretujte.

VSP Jihlava, 2015 S. Dvorakova 33

Page 34: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

Tabulka 1.10: Vysledky setrenı mezi zamestnanci jedne firmy

c. pohlavı bydliste vaha vyska kourıte pijete zmena delka plat

1 muz Jihlava 90 182 2 ne vyjimecne 26 17 800

2 zena Praha 82 170 2 ne casto 6 9 690

3 muz Brno 94 180 4 ne obcas 9 10 100

4 muz Ostrava 75 170 1 ne casto 29 19 990

5 zena Plzen 79 179 2 ne casto 15 14 980

6 muz Praha 84 176 2 ne obcas 9 10 990

7 muz Ostrava 76 176 2 ne casto 10 11 500

8 muz Jihlava 96 186 3 ne obcas 2 9 310

9 zena Plzen 53 157 2 ne obcas 17 12 750

10 zena Praha 55 154 4 ano vyjimecne 23 15 650

11 muz Jihlava 50 155 1 ne obcas 6 9 470

12 zena Brno 70 174 0 ano nikdy 5 9 340

13 muz Brno 50 163 1 ano casto 25 17 120

14 muz Plzen 92 187 2 ano nikdy 8 9 820

15 zena Praha 69 158 1 ano vyjimecne 31 21 310

16 zena Brno 83 183 1 ne nikdy 12 10 870

17 muz Praha 85 172 2 ano nikdy 13 11 110

18 zena Ostrava 57 162 1 ano obcas 33 23 160

19 muz Praha 59 164 2 ne vyjimecne 21 14 760

20 muz Ostrava 62 170 3 ano vyjimecne 21 17 040

21 zena Praha 87 179 1 ne obcas 1 8 800

22 muz Brno 88 185 3 ne casto 18 13 200

23 zena Ostrava 83 177 1 ano nikdy 10 10 300

24 zena Plzen 87 173 2 ne vyjimecne 15 11 950

25 zena Jihlava 72 163 3 ne casto 2 8 950

26 muz Praha 75 168 4 ne casto 4 9 260

27 muz Ostrava 68 164 3 ano vyjimecne 34 24 500

28 zena Brno 80 173 0 ne casto 16 12 520

29 muz Brno 78 169 1 ano nikdy 35 25 100

30 zena Plzen 90 186 2 ne obcas 14 18 360

VSP Jihlava, 2015 S. Dvorakova 34

Page 35: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

9. Statisticky zpracujte otazku”Kolikrat jste zmenili zamestnanı?“. Pouzijte

bodove trıdenı, vypoctete relativnı a kumulativnı cetnosti, vytvorte sloup-covy graf, urcete modus, prumer, median a smerodatnou odchylku a inter-pretujte.

Urcovanı charakteristik vyzkousejte jak pomocı funkcı MS Excel, tak z ta-bulky trıdenı. Tyto hodnoty porovnejte, jestli se od sebe lisı.

10. Zpracujte promennou”plat“. Pouzijte intervalove trıdenı, vypoctete re-

lativnı a kumulativnı cetnosti, vytvorte spojnicovy graf, urcete modus,median, kvartily, prumer a smerodatnou odchylku a interpretujte.

Urcovanı charakteristik vyzkousejte jak pomocı funkcı MS Excel, tak z ta-bulky trıdenı. Tyto hodnoty porovnejte, jestli se od sebe lisı.

Dale z vypoctenych charakteristik sestrojte krabicovy graf (stacı nacrtnoutrukou na papır).

Vysledky

Nasledujı vysledky k predchazejıcım ukolum. Prvnı ctyri otazky necht’ zodpovıkazdy ctenar sam (odpovedi lze v podstate najıt v ukazkovych prıkladech a vevykladu v jednotlivych kapitolach).

Vysledky dalsıch prıkladu jsou napsany pouze odrazkove, interpretace chybı.Samozrejme, ze grafy muze kazdy vytvorit podle sebe, takze budou vypadat jinak.U prıkladu s intervalovym trıdenım je mnoho moznych vysledku, podle toho, jakkazdy utvorı intervaly.

5. U promenne”rok narozenı“ jsou ukazany dve moznosti zpracovanı. V obou

prıpadech je sırka intervalu 3 roky, ale jsou zvoleny jine hranice intervalu.

pohlavı ni pi

muz 13 52 %

zena 12 48 %

Celkem 25 100 %

VSP Jihlava, 2015 S. Dvorakova 35

Page 36: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

rok narozenı xi ni pi kpi

1 do 1927 1926 1 0,04 0,04

2 1928 – 1930 1929 7 0,28 0,32

3 1931 – 1933 1932 4 0,16 0,48

4 1934 – 1936 1935 6 0,24 0,72

5 1937 – 1939 1938 4 0,16 0,88

6 1940 a vıce 1941 3 0,12 1∑25 1,00 x

rok narozenı xi ni pi kpi

1 do 1929 1928 6 0,24 0,24

2 1930 – 1932 1931 5 0,20 0,44

3 1933 – 1935 1934 5 0,20 0,64

4 1936 – 1938 1937 5 0,20 0,84

5 1939 a vıce 1940 4 0,16 1∑25 1,00 x

6. Stejne jako v predchozım prıkladu, je zde ukazan jenom jeden prıklad vy-tvorenı intervaloveho trıdenı.

vek ni pi kpi

1 do 73 3 0,12 0,12

2 74 – 76 4 0,16 0,28

3 77 – 79 5 0,20 0,48

4 80 – 82 4 0,16 0,64

5 83 – 85 6 0,24 0,88

6 86 a vıce 3 0,12 1∑25 1,00 x

modalnı trıda 83 – 85, median x = 80, dolnı kvartil x0,25 = 76, hornı kvartilx0,25 = 84, aritmeticky prumer x = 80, 16, rozptyl s2 = 19, 65, smerodatnaodchylka s = 4, 43, variacnı koeficient v = 5, 5 %. (Vsechny hodnoty jsouspocıtany pomocı funkcı MS Excel z puvodnıch dat.)

VSP Jihlava, 2015 S. Dvorakova 36

Page 37: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

7.

pohlavı nominalnı bodove trıdenı muz, zena

alternativnı

bydliste nominalnı bodove trıdenı Brno, Jihlava, Ostrava, Plzen, Praha

vaha kardinalnı intervalove trıdenı cısla od 50 do 96 kg

spojita

vyska kardinalnı intervalove trıdenı cısla od 154 do 187 cm

spojita

kourıte nominalnı bodove trıdenı ano, ne

alternativnı

pijete ordinalnı bodove trıdenı nikdy, vyjimecne, obcas, casto

zmena kardinalnı bodove trıdenı cısla 0, 1, 2, 3, 4

diskretnı

delka kardinalnı bodove i intervalove tr. cısla od 1 do 49

diskretnı zalezı na poctu obmen

plat kardinalnı intervalove trıdenı cısla od 10 060 do 18 360 Kc

spojita

8. Bydliste: modus = Praha

bydliste ni pi

Praha 8 26,7 %

Brno 7 23,3 %

Ostrava 6 20,0 %

Plzen 5 16,7 %

Jihlava 4 13,3 %∑30 100,0 %

9.”Kolikrat jste zmenili zamestnanı?“: x = 2, x = 2, x = 1, 93, s = 1, 06

xi ni pi kpi

0 2 7 % 6,67 %

1 9 30 % 36,67 %

2 11 37 % 73,33 %

3 5 17 % 90,00 %

4 3 10 % 100,00 %∑30 100 %

VSP Jihlava, 2015 S. Dvorakova 37

Page 38: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

1. ZAKLADNI ZPRACOVANI DAT 1.6 Prıklady k procvicenı

10.”Plat zamestnancu“: modalnı trıda 〈10 000; 13 000), x = 12 235 Kc, x0,25 =

9 890 Kc, x0,75 = 17 100 Kc, x = 13 990 Kc, s = 4 863 Kc

plat [Kc] xi ni pi kpi

do 10000 8500 8 26,7 % 26,7 %

〈10000; 13000) 11500 9 30,0 % 56,7 %

〈13000; 16000) 14500 4 13,3 % 70,0 %

〈16000; 19000) 17500 4 13,3 % 83,3 %

〈19000; 22000) 20500 2 6,7 % 90,0 %

〈22000; 25000) 23500 2 6,7 % 96,7 %

nad 25000 26500 1 3,3 % 100,0 %∑30 100 %

VSP Jihlava, 2015 S. Dvorakova 38

Page 39: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. Zavislosti dvou promennych

Potrebujeme-li zkoumat zaroven dve promenne (napr. vztah mezi pohlavım avekem, vzdelanım a platem, apod.), pouzijeme kombinacnı trıdenı. Vysledkytohoto trıdenı se zapisujı do tzv. kontingencnı tabulky. Pri kombinacnımtrıdenı dvou alternativnıch znaku se tabulka nazyva asociacnı (ctyrpolnı). (Al-ternativnı znaky majı dve obmeny.)

Pri zkoumanı vztahu mezi dvema promennymi se musı rozlisit, jedna-li seo cıselne nebo slovnı znaky. Detailneji si to rozebereme v nasledujıcıch kapitolach.Nejprve se zamerıme na dva prıpady, kdy alespon jedna zkoumana promennaje slovnı. Potom si ukazeme dva prıklady urcovanı zavislosti u dvou cıselnychpromennych. V prıkladech se budeme opet odkazovat na tabulku 1.1 obsahujıcıdata o klientech v dennım stacionari.

Stejne jako v predchazejıcı kapitole o popisne statistice se nebudeme prıliszabyvat teoriı (tu lze v dostatecne mıre najıt napr. v [2] nebo [5, Modul 5]), alezamerme se na prakticke pocıtanı.

2.1 Kategorialnı promenne

Jako prvnı si ukazeme prıklad zpracovanı asociacnı tabulky, tzn. budeme zkoumatzavislost dvou alternativnıch slovnıch znaku. Potom pristoupıme k prıkladu, kdejedna promenna je slovnı a druha cıselna (nebo by druha mohla byt i slovnı).

Prıklad 2.1. Prozkoumejme vztah mezi promennymi”pohlavı“ a

”vlastnı zuby“

z tabulky 1.1.V MS Excel nastrojem Kontingencnı tabulka vytvorıme tabulku kombinacnıho

trıdenı (obrazek 2.1) – do radku dame napr. promennou”pohlavı“ a do sloupcu

promennou”vlastnı zuby“. Tım dostaneme ctyrpolnı tabulku 2.1.

Jak v asociacnı tabulce 2.1 cıst? Zen, ktere majı vlastnı zuby, je 8. Muzu,kterı vlastnı zuby nemajı, je 10. Zen je celkem 12 (soucet druheho radku 4 + 8),klientu s vlastnımi zuby je 11 (soucet druheho sloupce 3 + 8). Klientu je celkem25 (soucet cele tabulky 10 + 3 + 4 + 8, soucet poslednıho sloupce 13 + 12, soucetposlednıho radku 14 + 11).

V obecne asociacnı tabulce 2.1 jsou promenne oznacene pısmeny X, Y , jejichhodnoty jsou 0 a 1 (vyjadrujı v podstate ano/ne). Jednotlive cetnosti potom

VSP Jihlava, 2015 S. Dvorakova 39

Page 40: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Tabulka 2.1: Asociacnı tabulka obecna a pro promenne”pohlavı“ a

”vlastnı zuby“

y = 0 y = 1 soucet

x = 0 n00 n01 n0∗

x = 1 n10 n11 n1∗

soucet n∗0 n∗1 n

vlastnı zuby

pohlavı ne ano celkem

muz 10 3 13

zena 4 8 12

celkem 14 11 25

majı v indexu oznacenı hodnot promennych (n01 je cetnost pro x = 0 a y = 1).Symbol

”hvezdicka“ znamena soucet cetnostı pres obe hodnoty v radku, resp.

sloupci, napr. n∗1 = n01 + n11 je soucet cetnostı ve sloupci oznacenem y = 1.Tyto cetnosti se nazyvajı marginalnı cetnosti. Rozsah souboru je n = n∗∗(soucet cetnostı pres vsechny radky a vsechny sloupce).

Umıstenı promennych v kontingencnı tabulce lze prohodit a dat”pohlavı“

do sloupcu. Zalezı na zpracovateli, kterak se mu to lıbı, protoze musıme do-stat vzdy stejne vysledky o zavislosti (tj. jestli pohlavı ovlivnuje vlastnictvızubu nebo ne).Je ale lepsı tabulku seradit podle cetnostı tak, aby v souctovem sloupci asouctovem radku byly marginalnı cetnosti serazeny od nejvetsı do nejmensı.Jakmile vytvorıme tabulku, je dobre mısto

”Popisky radku“ napsat jmeno

promenne”pohlavı“ a mısto

”Popisky sloupcu“ napsat

”vlastnı zuby“.

V tomto konkretnım prıpade to nenı zase tak aktualnı, protoze muz aano neprohodıme (proste pozname, ktery radek a sloupec k cemu patrı).Ale kdyz budeme zpracovavat dve promenne, kdy obe budou mıt obmenyano/ne, muzeme je nevedomky prohodit.

Obrazek 2.1: Vytvorenı kontingencnı tabulky

VSP Jihlava, 2015 S. Dvorakova 40

Page 41: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Pro graficke znazornenı lze pouzıt napr. sloupcovy 3D graf (obrazek 2.2) nebojine grafy z siroke nabıdky (zalezı na cetnostech a vkusu autora grafu). Je ovsempotreba dati pozor na to, aby se ve 3D grafu sloupce neprekryvaly a bylo videtvse, co ma byti videt. Je lepsı pouzıvat sloupcovy graf nezli napr. kuzelovy. Tenvelice zkresluje vysledky.

Obrazek 2.2: Sloupcovy 3D graf promennych”pohlavı“ a

”vlastnı zuby“

Muze nas napr. zajımat, kolik procent muzu ma vlastnı zuby. Tady simusıme dat pozor, zda budeme pocıtat procenta jenom z muzu nebo zevsech klientu.Pokud budeme uvazovat prvnı moznost, tzn. budeme zeny a muze pocıtatzvlast’, dostaneme relativnı cetnosti v tabulce 2.2. Zobrazit to muzeme dopruhoveho grafu na obrazku 2.3.Ale pozor! Je rozdıl, zda rekneme, ze 3

13= 23 % muzu ma vlastnı zuby nebo

ze 325

= 12 % klientu jsou muzi s vlastnımi zuby. V prvem prıpade jsme za100 % brali jenom muze, kdezto ve druhem jsme pocıtali i se zenami.

Tabulka 2.2: Tabulka s vypoctem”Kolik procent muzu a zen ma vlastnı zuby?“

vlastnı zuby

pohlavı ne ano

muz 10/13 = 0, 77 = 77 % 3/13 = 0, 23 = 23 %

zena 4/12 = 0, 33 = 33 % 8/12 = 0, 67 = 67 %

VSP Jihlava, 2015 S. Dvorakova 41

Page 42: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Obrazek 2.3: Pruhovy skladany graf promennych”pohlavı“ a

”vlastnı zuby“ pro

relativnı cetnost v %

Pro posouzenı zavislosti dvou alternativnıch promennych pocıtame koeficientasociace

V =nn11 − n1∗n∗1√n1∗n∗1n0∗n∗0

=25 · 10− 13 · 14√

13 · 14 · 12 · 11=

68

155= 0, 439 .

Znacenı cetnostı je vysvetleno vyse a cetnosti cteme v tabulce 2.1. Muzeme rıci,ze se jedna o strednı pozitivnı zavislost, zeny majı vıce vlastnıch zubu nez muzi.

Podotkneme jeste, ze koeficient asociace muze nabyvat pouze hodnot z in-tervalu 〈−1; 1〉. Pokud je V = 0, jsou promenne zcela linearne nezavisle.Naopak, pokud se koeficient asociace rovna jedne z krajnıch hodnot, tj. 1nebo −1, jsou promenne zcela linearne zavisle. V praxi ani jeden z techtoextremu nenastava.Znamenko koeficientu asociace reprezentuje smer zavislosti. Zaporny koe-ficient znacı negativnı korelaci (pri rustu jedne promenne, druhapromenna klesa, nebo naopak) a u kladneho koeficientu mluvıme o po-zitivnı korelaci (obe promenne zaroven rostou nebo klesajı).V [2, Kap. 3] je uvedena tabulka pro interpretaci sıly zavislosti. Lze rıci, zepod V = 0, 3 se jedna o slabou zavislost a nad V = 0, 7 o silnou zavislost.Vıce o koeficientu asociace lze najıt napr. v [5, Kap. 5.3].

4

VSP Jihlava, 2015 S. Dvorakova 42

Page 43: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Prıklad 2.2. Prozkoumejme vztah mezi promennymi”pohlavı“ a

”pocet detı“

z tabulky 1.1.V tomto prıpade se jedna o jednu alternativnı slovnı promennou (

”pohlavı“) a

jednu cıselnou (”pocet detı“). Postup zpracovanı bude stejny, i kdyby se jednalo

o dve slovnı promenne.

Obrazek 2.4: Vytvorenı kontingencnı tabulky promennych”pohlavı“ a

”pocet

detı“

V MS Excel vytvorıme kontingencnı tabulku pomocı stejnojmenneho nastroje(viz obrazek 2.4) v podstate stejne jako v prıkladu 2.1. (V tomto prıpade uztabulku neradıme podle cetnostı, ale logicky podle obmen znaku, tj. podle poctudetı.) Udelame take nejaky vhodny graf. Na obrazku 2.5 je ukazka sloupcovehografu. Lze samozrejme vytvorit i jine. Dobre vypada pruhovy, skladany pruhovynebo 3D sloupcovy (valcovy) graf. Opet zalezı na autorovi, jeho vkusu a vysledneprehlednosti grafu.

Pro posouzenı zavislosti dvou promennych v kontingencnı tabulce pocıtamectvercovou kontingenci χ2 (cteme

”chı kvadrat“). Tato charakteristika je po-

drobneji popsana napr. v [5, Kap. 5.2]. Pro vypocet χ2 musıme nejprve spocıtattzv. vypoctenou cetnost podle vztahu

n′ij =ninj

n.

VSP Jihlava, 2015 S. Dvorakova 43

Page 44: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Obrazek 2.5: Sloupcovy graf poctu detı klientu s ohledem na pohlavı klienta

Tabulka 2.3: Tabulka s vypoctem ctvercove kontingence χ2

puvodnı cetnosti n

zena muz∑

0 3 2 5

1 2 4 6

2 3 4 7

3 2 2 4

4 2 0 2

5 0 1 1∑12 13 25

vypoctene cetnosti n′

zena muz∑

0 2,4 2,6 5

1 2,88 3,12 6

2 3,36 3,64 7

3 1,92 2,08 4

4 0,96 1,04 2

5 0,48 0,52 1∑12 13 25

vypocet χ2

zena muz∑

0 0,150 0,138 0,288

1 0,269 0,248 0,517

2 0,039 0,036 0,074

3 0,003 0,003 0,006

4 1,127 1,040 2,167

5 0,480 0,443 0,923∑2,067 1,908 3,976

Kazdou bunku (teoretickou vypoctenou cetnost) kontingencnı tabulkyprepocıtame tak, ze vzdy vynasobıme soucet prıslusneho radku se souctemprıslusneho sloupce a vydelıme rozsahem souboru (souctem vsech bunektabulky), viz druha tabulka 2.3. Napr. pro zenu s 0 detmi je n′ = 5·12

25= 2, 4

a pro muze se 3 detmi je n′ = 4·1325

= 2, 08.Tato vypoctena cetnost je cetnost, ktera by byla v prıpade, ze by promennebyly naprosto nezavisle. Protoze se jedna o teoreticke cıslo, nemusı byt cele(coz vetsinou ani nenı).

VSP Jihlava, 2015 S. Dvorakova 44

Page 45: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Dale uz muzeme pristoupit k vypoctu zadane charakteristiky

χ2 =∑i

∑j

(nij − n′ij)2

n′ij= 3, 976 .

Pro kazdou bunku v tabulce vypocıtame cıslo uvnitr sum, tj. odskutecne cetnosti odecteme vypoctenou, umocnıme na druhou a vydelıme

vypoctenou cetnostı (v tomto poradı). Napr. pro zenu s 0 detmi je (3−2,4)22,4

=

0, 150 a pro muze se 3 detmi je (2−2,08)22,08

= 0, 003.

Potom vsechna cısla v tabulce secteme (dva znaky sumace) a dostanemectvercovou kontingenci χ2 = 3, 976, viz tabulka 2.3.

POZOR! Kdyz si poradne precteme teorii k analyze zavislostı ak prıslusnemu χ2 testu, zjistıme, ze nelze pouzıt vzdy. Podmınky jsou ta-kove, ze zadna z teoretickych vypoctenych cetnostı n′ij nesmı byt mensınez 2 a alespon 80 % z nich musı byt vetsı nez 5. Nekde se uvadı pouze, zevetsina cetnostı nij by mela byt vetsı nez 5.Pokud tyto podmınky splneny nejsou, coz je i v nasem prıklade, jedna seo velice hruby odhad. Cım vetsı je rozsah souboru, tım jsou podmınky lepesplneny. My mame malo hodnot (pouze 25 klientu).

Podle velikosti ctvercove kontingence nelze rıci, jak moc jsou promenne zavisle(χ2 muze v podstate byt jakekoli kladne cıslo, zalezı na velikosti kontingencnıtabulky a rozsahu souboru). Proto se pocıtajı dalsı koeficienty kontingence. Vy-pocıtame napr. Pearsonuv koeficient kontingence

P =

√χ2

χ2 + n=

√3, 976

3, 976 + 25= 0, 37 .

Tento koeficient muze nabyvat hodnot mezi 0 a 1, pricemz 0 znamena naprostounezavislost promennych. Interpretace je podobna jako u koeficientu asociace.

O dalsıch koeficientech kontingence je mozno se docıst v [5, Kap. 5.2].

Nekdy je dobre overenı zavislosti dvou prommennych udelat pomocı hypotez.Teorii k tomuto tematu lze najıt v [2, Kap. 5]. Princip je takovy, ze stanovımetzv. nulovou hypotezu: Dve sledovane promenne jsou nezavisle (nenı mezi nimizavislost). Potom protichudnou alternativnı hypotezu: Promenne jsou zavisle.Dale jeste musıme stanovit hladinu vyznamnosti, tj. riziko, ze se spleteme, napr.α = 5 %. A nakonec musıme vybrat ten spravny test. V nasem prıpade se budejednat o χ2 test o nezavislosti.

VSP Jihlava, 2015 S. Dvorakova 45

Page 46: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.1 Kategorialnı promenne

Z tabulek 2.3 pro vypocet hodnoty ctvercove kontingence vypocıtame tzv.p-hodnotu. Nejlepsı je to udelat pomocı nejakeho softwaru. V MS Excel lzepouzıt funkci CHITEST, do ktere se vlozı pozorovane cetnosti (prvnı tabulka) aocekavane cetnosti (druha tabulka), jak je videt na obrazku 2.6.

Obrazek 2.6: Vypocet p-hodnoty pro χ2 test o nezavislosti

Tuto vypoctenou p-hodnotu, v nasem prıpade vysla 0,55, porovname s po-zadovanym rizikem. Pokud je p-hodnota vetsı 0, 55 > 0, 05, potom zamıtamealternativnı hypotezu, ze jsou promenne zavisle. Tudız by mohly byt nezavisle.

Pozor pri interpretaci zaveru hypotez. Hypotezy vzdy zamıtame. Nikdybychom nemeli rıci, ze nektera hypoteza platı!

Pokud by p-hodnota byla mensı nez pozadovana hladina vyznamnosti α,zamıtli bychom nulovou hypotezu o nezavislosti.

Pokud si poradne prectete teorii k prave pouzitemu χ2 testu o nezavislosti,zjistıte, ze jsme ho nemeli pouzıt. Jedna z podmınek je, ze by ocekavanecetnosti mely mıt hodnotu nejmene 5. Coz v nasem prıkladu rozhodne nenıdodrzeno! Zavery z hypotezy tudız mohou byt spatne.

4

VSP Jihlava, 2015 S. Dvorakova 46

Page 47: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

2.2 Korelacnı a regresnı analyza

V teto kapitole se budeme zabyvat zavislostmi mezi cıselnymi promennymi. Jednase o korelacnı a regresnı analyzu. Teorii k teto kapitole lze najıt napr. v [2,Kapitoly 3, 4] nebo [5, Modul 5].

Na zacatku zkoumanı zavislostı si musıme objasnit, o jakou zavislost se jedna.Mame jednostrannou a oboustrannou zavislost. U jednostranne zavislostidokazeme rıci, co je prıcina a co dusledek, tj. muzeme urcit nezavisle promen-nou x a zavisle promennou y. Napr. vykupnı cena obilı prımo ovlivnı prodejnıcenu peciva (ale ne obracene). U oboustranne zavislosti toto urcit nedokazeme.Nemuzeme rıci, co bylo drıve (prıcina) a co pozdeji (dusledek). Napr. cena pecivaa cena masa nejakou spojitost majı, ale nemuzeme rıci, ze cena masa vzrostla,protoze zdrazili rohlıky.

Nez pristoupıme k vlastnımu pocıtanı, vytvorıme bodovy graf. U jedno-stranne zavislosti je to jasne, na osu x vyneseme nezavisle promennou, na osu yzavisle promennou. U oboustranne zavislosti je to jedno a zalezı na nas, jak sioznacenı promennych vybereme (vetsinou v souladu se zadanım ci cıli vyzkumu).Kazdy bod grafu odpovıda jednomu paru dat (odpovedi jednoho cloveka, hodnotz jednoho pokusu atd.).

Pri vytvarenı bodoveho grafu v MS Excel si dejte pozor, abyste vytvoriliopravdu bodovy graf a ne spojnicovy (viz obrazek 2.7). Pro normalnıhouzivatele v nich na prvnı pohled nenı rozdıl, ale kazdy ma jine vlastnosti.Uzivatele MS Excel vetsinou pouzıvajı Pruvodce vytvorenım grafu, alenekdy to nenı vyhodne. Obcas je lepsı v grafu zvolit Vybrat data, Pridatradu a prıslusne promenne (tj. x a y) oznacit rucne (obrazek 2.8).

Obrazek 2.7: Vlozenı bodoveho grafu

Graf muze mnoho vecı napovedet. V prvnı rade by se nemely vyskytovat zadneodlehle hodnoty. Jedna se o jednotlive body, ktere jsou vyrazne mimo ostatnı.Nam prozatım postacı odlehle hodnoty urcit pohledem na graf. V [5, Kap. 5.2]

VSP Jihlava, 2015 S. Dvorakova 47

Page 48: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

Obrazek 2.8: Uprava dat v bodovem grafu

lze najıt teorii, jak presneji odlehle hodnoty urcit a vyradit z dat.Dalsı dulezitou vlastnostı je homogenita dat. Pokud data nejsou homogennı,

v bodovem grafu se vetsinou objevı dva shluky bodu. Jedna se napr. o rozdılnostv pohlavıch (zeny jsou mensı nez muzi, majı mensı platy apod.). V takovemprıpade je zapotrebı kazdy shluk resit zvlast’ (tj. zavislosti zkoumat zvlast’ promuze a zvlast’ pro zeny). Vıce lze najıt i v [2, Kapitola 3].

V prvnım prıkladu ukazeme, jak zjist’ovat intenzitu u oboustranne zavislosti.Potom bude nasledovat prıklad pro urcovanı jednostranne zavislosti.

Prıklad 2.3. Ptali jsme se dvanacti zen, kolik rocne utratı za kadernıka a za ma-nikuru. Vysledky pruzkumu (v tis. Kc) jsou zaznamenamy v tabulce 2.4. Zjistete,zda existuje zavislost mezi temito vydaji a jak je silna.

Tabulka 2.4: Rocnı vydaje za kadernıka a manikuru v tis. Kc

c. 1 2 3 4 5 6 7 8 9 10 11 12

kadernık 5,2 6,7 9 0,2 6 3,7 7,1 3,1 8,1 2 3,4 4,9

manikura 3,7 6,2 9,7 0,1 7,3 4,8 8,2 5,2 6,7 0,5 1,2 1,8

Nejprve si bychom meli rozmyslet, o jakou zavislost se jedna (o jedno nebooboustrannou). Dokazeme urcit prıcinu a dusledek? V tomto prıpade ne, protose jedna o oboustrannou zavislost. Promenne si tedy muzeme oznacit libovolne,napr. x – kadernık a y – manikura.

Dalsım krokem je vytvorenı bodoveho grafu. Ten je na obrazku 2.9. Po pro-zkoumanı tohoto grafu muzeme rıci, ze tam nenı viditelna nehomogenita dat, aniodlehle hodnoty. Muzeme tedy pristoupit k vypoctu.

Pro urcenı sıly zavislosti pouzijeme korelacnı analyzu. Nejcasteji se pouzıvaPearsonuv korelacnı koeficient, oznacovany pısmenem r. Vzorec pro vypocetuvadet nebudeme, lze ho najıt v ruznych ucebnicıch statistiky zabyvajıcıch se

VSP Jihlava, 2015 S. Dvorakova 48

Page 49: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

Obrazek 2.9: Bodovy graf pro urcovanı zavislosti vydaju za kadernıka a manikuru

problematikou analyzy zavislostı. V MS Excel tento koeficient zjistıme pomocıfunkce CORREL. Nebo lze pouzıt nastroj Analyza dat – Korelace.

V nasem prıpade vyjde r = 0, 861. Hodnota r2 = 0, 742 byva oznacovana jakokoefecient determinace nebo spolehlivost.

Zaver je takovy, ze mezi vydaji za kadernıka a manikuru existuje docela silnapozitivnı linearnı zavislost.

Pearsonuv koeficient korelace je velmi ovlivnen odlehlymi hodnotami.Koeficient korelace r merı pouze sılu linearnı zavislosti! Pokud je skutecnazavislost dat jina (kvadraticka, exponencianı apod.), hodnota tohoto koefi-cientu nenı vypovıdajıcı.Koeficient korelace se pohybuje v rozmezı hodnot −1 ≤ r ≤ 1.Znamenko koeficientu korelace urcuje smer zavislosti. Pozitivnı zavislost(kladne hodnoty) je tehdy, kdyz se druha promenna zvetsuje pri ros-toucı prvnı promenne. Pri negativnı zavislosti (zaporne hodnoty) se druhapromenna zmensuje pri rostoucı prvnı promenne.Naprosto nezavisle promenne jsou tehdy, pokud r = 0. Cım vıce se koefi-cient korelace blızı k hodnote 1 nebo −1, tım vıce jsou promenne zavisle.V krajnıch hodnotach, tj. pro r = 1, resp. r = −1, lezı vsechny body grafuna jedne prımce, a to na rostoucı, resp. klesajıcı.Nekdy se zarazujı hodnoty korelace do pasem podle velikosti koeficientu|r|, napr. mala zavislost pro 0, 1 − 0, 3, strednı pro 0, 3 − 0, 7 a velka pro0, 7− 1. Jine delenı lze najıt napr. v [2, Kap. 4.1.2].

4

VSP Jihlava, 2015 S. Dvorakova 49

Page 50: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

Prıklad 2.4. Zjistete prıpadnou zavislost mezi vekem a velikostı duchodu klientudennıho stacionare z tabulky 1.1.

Lze predpokladat, ze se jedna o jednostrannou zavislost, protoze vek ovlivnujeveliskost duchodu. Proto promennou vek oznacıme jako x a duchod jako y. (Po-kud v datech nemame promennou

”vek“, lze ji dopocıtat z roku narozenı.) Pote

nakreslıme bodovy graf (obrazek 2.10), abychom odhalili prıpadne odlehle hod-noty a nehomogenitu dat.

Obrazek 2.10: Bodovy graf zavislosti velikosti duchodu na veku

Pro urcenı sıly zavislosti pouzijeme korelacnı analyzu. Ta byla popsana v pred-chozım prıkladu 2.3. Pouzijeme funkci CORREL a vyjde r = 0, 076. Lze rıci, zezavislost je velmi slaba.

Korelacnı koeficient nenı uplnym popisem dat i pri velmi silnem linearnımvztahu. Pro uplnejsı popis potrebujeme znat rovnici prımky, ktera vyjadruje tvarvztahu. Proto pristoupıme k regresnı analyze.

V techto skriptech budeme predpokladat pouze linearnı vztah mezi promenny-mi, tj. body v grafu prolozıme prımkou

y = a+ bx ,

kde a je absolutnı clen (v tomto bode prımka protına svislou osu y), b jesmernice (sklon) prımky.

Je jasne, ze vsechny body grafu na prımce lezet nemohou. Pro prvotnı orien-taci stacı prımku narysovat od ruky. Jenze existuje velmi mnoho moznostı,jak tuto prımku nakreslit. Regresnı analyza hleda tu

”nejlepsı“ prımku a

to metodou nejmensıch ctvercu. Jedna se v podstate o to, ze v kazdem

VSP Jihlava, 2015 S. Dvorakova 50

Page 51: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

bode vypocıtame rozdıl mezi skutecnou hodnotou yi a hodnotou na prımcey′i (jedna se o vzdalenost ve smeru svisle osy). Temto hodnotam se rıkarezidua. Kdyz tyto rozdıly umocnıme na druhou a secteme pro vsechnybody grafu, dostaneme rezidualnı soucet ctvercu

S =∑i

(yi − y′i)2 .

Hledame tu prımku, pro kterou je tento soucet nejmensı. Pro metodunejmensıch ctvercu jsou jiz odvozeny vzorce pro vypocet koeficientu prımky,takze nemusıme pouzıvat slozitejsı matematiku pro minimalizaci souctu.

Nejjednodussı moznostı, jak regresnı prımku zjistit, je v bodovem grafu pridatspojnici trendu (obrazek 2.11 vlevo). Nezapomeneme zaskrtnout moznost zob-razenı rovnice a spolehlivosti (obrazek 2.11 vpravo). Vysledek je zobrazen naobrazku 2.12.

Obrazek 2.11: Pridanı a nastavenı spojnice trendu do bodoveho grafu

Pokud bychom potrebovali znat koeficient korelace, hodnotu spolehlivosti od-mocnıme a doplnıme znamenko (plus pro rostoucı a minus pro klesajıcı prımku).

Dalsı moznostı, jak zjistit koeficienty regresnı prımky, je pouzitı funkcı MSExcel. Smernici prımky zıskame funkcı SLOPE a absolutnı clen pomocı INTER-CEPT. Korelacnı koeficient potom zjistıme funkcı CORREL.

VSP Jihlava, 2015 S. Dvorakova 51

Page 52: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.2 Korelacnı a regresnı analyza

Obrazek 2.12: Regresnı prımka a spolehlivost pro zavislost duchodu a veku

K cemu potrebujeme znat rovnici regresnı prımky? Pro odhad hodnot, kterenezname. Napr. jaky bude asi mıt duchod budoucı 74-lety klient? Toho jestenemame, ale je to vek nachazejıcı se mezi veky stavajıcıch klientu. Jedna seo tzv. interpolaci. Hodnotu 74 dosadıme za x do rovnice regresnı prımkya dostaneme predpokladanou velikost duchodu 26 · 74 + 5971 = 7896 Kc.Pri extrapolaci odhadujeme hodnotu, ktera lezı

”mimo“ analyzovane hod-

noty. Toto cıslo by se nemelo prılis vzdalovat od krajnıch hodnot. Napr.budeme odhadovat velikost duchodu pro klienta, kteremu je 88 let, tj.26 · 88 + 5971 = 8260 Kc.Samozrejme, ze v nasem prıpade, kdy se jedna o velmi slabou zavislost,nelze z interpolace a extrapolace delat nejake dulezite zavery.

4

Jedna-li se o slozitejsı zavislosti mezi promennymi, nez je linearnı zavislost,lze zase vyuzıt metodu nejmensıch ctvercu a spojnici trendu v bodovem grafu.Temito prıpady se ale v tomto textu zabyvat nebudeme.

VSP Jihlava, 2015 S. Dvorakova 52

Page 53: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.3 Shrnutı

2.3 Shrnutı

Pri zpracovavanı dat z nejakeho statistickeho setrenı nestacı zpracovavat kazdouotazku zvlast’. Nekdy je zapotrebı dıvat se na dve promenne najednou. Napr.rozdelit si dotazane podle pohlavı, dosazeneho vzdelanı atd. K tomu slouzı kom-binacnı trıdenı.

Pak je dobre zjist’ovat, zda jsou dve promenne spolu nejak provazane, jestlina sobe nejakym zpusobem zavisı. Pokud je alespon jedna zkoumana promennaslovnı, vytvorı se kontingencnı tabulka a pocıtajı se koeficienty kontingence. Lzepouzıt i testovanı hypotez o nezavislosti dvou proennych.

Jedna-li se o dve cıselne promenne, pristoupı se ke korelacnı a regresnı analyze,kde se nejprve vytvorı bodovy graf, pote vypocıta koeficient korelace a urcı seprıpadna regresnı krivka.

Pojmy k zapamatovanı:

• Kombinacnı trıdenı,

• kontingencnı tabulka, asociacnı tabulka,

• marginalnı cetnosti,

• koeficient asociace,

• ctvercova kontingence, koeficienty kontingence,

• χ2 test o nezavislosti promennych,

• korelacnı a regresnı analyza,

• jednostranna a oboustranna zavislost,

• zavisla a nezavisla promenna,

• bodovy graf,

• koeficient korelace,

• regresnı krivka, linearnı zavislost.

VSP Jihlava, 2015 S. Dvorakova 53

Page 54: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.4 Prıklady k procvicenı

2.4 Prıklady k procvicenı

V dalsım se budeme odkazovat na tabulku 1.10. Jedna se o vysledky statistickehosetrenı mezi zamestnanci jedne firmy. Sloupce postupne znamenajı:

c. – cıslo zamestnance kourıte – Kourıte?

pohlavı pijete – Jak casto pijete alkohol?

bydliste zmena – Kolikrat jste zmenili zamestnanı?

vaha (v kg) delka – delka nynejsıho zamestnanı (v letech)

vyska (v cm) plat (v Kc)

1. Zjistete, zda to, ze clovek kourı je ovlivneno pohlavım nebo ne. Vytvorteasociacnı tabulku, vypoctete koeficient asociace a interpretujte. Vytvortevhodny graf.

2. Zjistete, zda je castejsı pitı alkoholu ovlivneno tım, ze clovek kourı. Vy-tvorte kontingencnı tabulku, vypoctete ctvercovou kontingenci, Pearsonuvkoeficient kontingence a interpretujte. Vytvorte vhodny graf.Testujte hypotezu o zavislosti promennych na hladine vyznamnosti α =0, 05.

3. Zjistete, zda je plat zamestnance nejak ovlivnen odpracovanymi roky v ny-nejsım zamestnanı. Urcete, o jakou zavislost se jedna. Vytvorte bodovygraf, vypoctete regresnı koeficient, urcete regresnı prımku a interpretujte.Pomocı rogresnı prımky odhadnete plat pro zamestnance, ktery odpracuje20 let.

4. Zjistete, zda vaha cloveka zavisı na jeho vysce. Urcete, o jakou zavislost sejedna. Vytvorte bodovy graf, vypoctete regresnı koeficient, urcete regresnıprımku a interpretujte. Pomocı regresnı prımky odhadnete vahu clovekas vyskou 165 cm.

5. Z tabulky 1.10 vyberte dve promenne, jednu slovnı a jednu cıselnou a zjistetejejich zavislost.

6. Z tabulky 1.10 vyberte dve cıslene promenne a zjistete jejich zavislost.

7. Testujte hypotezu na hladine vyznamnosti 5 %, zda je uroven neschopnostilidı v domove duchodcu zavisla na veku. Dala o poctech jsou v nasledujıcıtabulce:

do 60 60 - 70 70 - 80 nad 80

I. St 30 28 12 6

II. St 21 22 13 10

III. St 10 18 15 15

VSP Jihlava, 2015 S. Dvorakova 54

Page 55: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.4 Prıklady k procvicenı

Vysledky

1. koef. asociace V = −0, 018 – skoro nezavisle

Kourıte? muz zena

ano 10 9 19

ne 6 5 11

16 14 30

2. χ2 = 11, 43, Pearson P = 0, 52 – stredne zavislenulova hypoteza: jsou nezavisle; alternativnı hypoteza: jsou zavislep-hodnota = 0, 009 < α = 0, 05 ⇒ zamıtame nulovou hypotezu, tj.pripoustıme zavislost

Kourıte?

Pijete? ano ne

nikdy 1 5 6

vyjimecne 3 1 7

obcas 7 1 8

casto 8 1 9

19 11 30

3. jednostranna zavislost (x – odpracovane roky, y – plat), regr. prımka y =6495 + 465x, regr. koef. r = 0, 96 – silne zavisle, pro 20 odpracovanych letje odhad platu 15 481 Kc.

Na tomto prıkladu je videt, ze prımkou lze body prolozit (modra carav grafu), i regresnı koeficient je vysoky, takze vyse platu hodne zavisı naodpracovanych letech. Ale kdyz se poradne podıvate na bodovy graf, byloby vhodnejsı body prolozit jinou krivkou (cervena cara v grafu). Jedna seo kvadratickou funkci, body lepe

”kopıruje“ a ma vetsı hodnotu spolehli-

vosti r2.

VSP Jihlava, 2015 S. Dvorakova 55

Page 56: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

2. ZAVISLOSTI DVOU PROMENNYCH 2.4 Prıklady k procvicenı

4. jednostranna zavislost (x – vyska, y – vaha), regr. prımka y = −137+1, 2x,regr. koef. r = 0, 86 – zavisle, pro vysku 165 cm je odhad vahy 67 kg(oranzovy bod v grafu).

5. puvodnı:

do 60 60 - 70 70 - 80 nad 80

I. st 30 28 12 6 76

II. st 21 22 13 10 66

III. st 10 18 15 15 58

61 68 40 31 200

ocekavane:

do 60 60 - 70 70 - 80 nad 80

I. st 23,18 25,84 15,2 11,78

II. st 20,13 22,44 13,2 10,23

III. st 17,69 19,72 11,6 8,99

p-hodnota= 0, 027 = 2, 7 % < 5 % ⇒ zamıtame nezaavislost (pripoustımezavislost)

VSP Jihlava, 2015 S. Dvorakova 56

Page 57: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY

3. Casove rady

3.1 Uvod

Data, ktera zıskavame v mnoha oblastech lidskeho konanı a ktera chceme naslednestatisticky hodnotit, jsou casto ve forme tzv. casovych rad. Casova rada je po-sloupnost hodnot urciteho statistickeho znaku (jevu – napr. vek, pocet obyvatel,plat, cena, teplota, atd.) chronologicky usporadanych z hlediska casu ve smeruod minulosti k prıtomnosti. Casova rada je tedy zmena urciteho jevu v case.

Cılem analyzy casovych rad je vetsinou konstrukce modelu, ktery nejlepe vy-stihuje chovanı zkoumane casove rady. Na zaklade konstrukce modelu muzeme od-halit, co ovlivnuje hodnoty prıslusne casove rady a na cem naopak pravdepodobnenezavisı (jaky je mechanismus zkoumanych dat). Muzeme take podrobneji studo-vat vyvoj a trend casove rady. Model muzeme take vyuzıt k predikci budoucıchhodnot rady. Uvedomme si ale, ze ani sebelepsı model nam nenı schopen presneurcit budoucı hodnotu, muzeme ji pouze odhadnout.

Problematika casovych rad je velice rozsahla a neustale se rozvıjı. Ve vetsineanalyz casovych rad neexistuje jednoznacny postup a zalezı na zkusenostech avedomostech analytika. Pro hledanı vhodneho modelu k popisu chovanı casoverady existuje mnoho ruznych metod a jejich kombinacı. Pricemz pochopitelne priruznych postupech dosahneme ruznych vysledku. Otazkou tedy je, jak posouditvhodnost daneho modelu.

Tato skripta jsou ovsem urcetna k tomu, aby si ctenar udelal prvotnı predstavuo tom, co jsou vlastne casove rady zac. Pokud nekdo bude potrebovat zaobırat setımto tematem podrobneji, je nutne studovat specialnı literaturu k tomu urcenou.V dalsım textu si ukazeme pouze jednu nejpouzıvanejsı jednoduchou metodu.

Nez pristoupıme k prıkladum, na kterych popıseme zmıneny model pro analyzucasovych rad, zminme par dulezitych drobnostı, nad kterymi by se student mel za-myslet jeste pred zpracovavanım. Pri stanovovanı hodnot casovych rad se mohouvyskytnout nasledujıcı problemy:

• Zastaravanı udaju ma mnoho prıcin. Vlivem technickeho pokroku nenıvyrobek, ktery je vyroben v dnesnı dobe, ten stejny, jako vyrobek vyro-ben pred nekolika lety. Ceny se casem take vyvıjı a nelze nakup za 100 Kcpred dvaceti lety srovnavat s nakupem za 100 Kc dnes. Pokud to lze, je

VSP Jihlava, 2015 S. Dvorakova 57

Page 58: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.1 Uvod

potreba tyto udaje prepocıtat. Je dobre se zamyslet na tım, jak dlouhouradu hodnot potrebujeme pro prıslusnou analyzu.

• Problem kalendarovych variacı je zpusoben predevsım tım, ze kazdy mesıcma jiny pocet dnu, pracovnıch dnu, vıkendu a svatku. Nejvetsı problemydela prestupny rok a pohyblive svatky (Velikonoce). V prıpade potrebyse provadı ocist’ovanı rady od vlivu kalendarovych variacı. Hodnota zakazdy mesıc se prepocıta na prumerny (standartizovany) mesıc, ktery ma36512

=30, 42 dnu. Napr. mame-li za leden 156 narozenych detı, dostaneme

prepocıtanou hodnotu 156 · 30,4231

= 153, 08 narozenych detı za prumernymesıc (ukazka v prıkladu 3.2). Nekdy se za standartizovany mesıc bere 30dnu (rok ma pote pouze 360 dnu). Podle potreby se data ocist’ujı i napracovnı dny (nebere se v uvahu sobota, nedele a svatky).

Ke zjistenı poctu pracovnıch dnu v urcitem mesıci a roce muzemev MS Excel pouzıt funkci NETWORKDAYS.

• Volbu casovych okamziku, prıp. useku, je potreba dobre uvazit. Nekdy nemasmysl volit pozorovanı prılis casto (hodnoty jsou podobne a nedozvıme senic noveho, ale zvysıme vypoctovou narocnost). Na druhou stranu nesmımevolit casove body prılis vzdalene, abychom neminuli nejakou podstatnouhodnotu. Pokud to situace dovolı, snazıme se volit pozorovanı se stejnymiintervaly.

• Dulezite u zıskavanı hodnot casove rady je vecne a prostorove vymezenıpo cele sledovane obdobı. To znamena, ze pokud se zmenı napr. metodikazıskavanı urciteho ukazatele (pocıtanı porodnosti z jinych statistik, tj. jestlije pocet zive narozenych detı vztazeno na pocet vsech zen nebo jen na zenyv produktivnım veku) nebo prostorove vymezenı (pocet obyvatel Jihlavy,kdy se k mestu pripojı dalsı mıstnı casti), je treba zabezpecit srovnatelnosthodnot pomocı vıce ci mene slozitych prepoctu.

Podıvejme se blıze na casovy parametr rad. Podle zvyklosti se oznacuje t.Nekdy udava prımo cas, ke kteremu se prıslusna hodnota casove rady vztahuje,napr. t = 1980. Jindy se jedna o poradı prıslusne pozorovane casove hodnoty, tj.t = 1 je pro prvnı pozorovanı atd.

Podle casu zıskavanı hodnot se casove rady delı na:

Casove rady okamzikove – zjistene hodnoty se vztahujı k urcitemu casovemuokamziku. Vzdalenosti techto okamziku mohou byt stejne (ekvidistantnı)nebo ruzne. Soucet hodnot teto rady nelze smysluplne interpretovat.

Muze se jednat napr. o pocet klientu poradny poslednı den v mesıci, pocetobyvatel urcite obce k 1.1. prıslusneho roku nebo inventuru zasob na sklade.

VSP Jihlava, 2015 S. Dvorakova 58

Page 59: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.1 Uvod

Casove rady usekove (intervalove) – zjistene hodnoty se vztahujı k urcitemucasovemu useku. Soucet teto rady ma smysl. Souctem dennıch hodnot zıska-me tydennı, mesıcnı, ctvrtletnı nebo rocnı udaje (coz je vytvorenı odvozenerady).

Jedna se napr. o pocet narozenych detı za mesıc, pocet prijatych (vyrızenych)zadostı za den, atd.

Okamziky sledovanı hodnot casove rady lze na care (ose) casu znazornitbodem, kdezto casovy interval useckou.

Prvnı dulezitou soucastı analyzy je graficke zobrazenı zkoumane casove rady ana zaklade grafu je mozno se rozhodnout o dalsım postupu. Pri prvnım zobrazenıstacı pouzıt spojnicovy graf. Nekdy je lepsı zvolit bodovy. Zalezı na povaze dat azda mame zkoumane casove okamziky stejne daleko od sebe ci nikoli. Na osu xse vzdy vynası cas a na osu y hodnoty zkoumane casove rady.

Prıklad 3.1. V obci Treskoprsky behem roku 2015 zaznamenavali, kolik majıaktualne pocet obyvatel. Data jsou v tabulce 3.1.

V tomto prıpade se jedna o okamzikovou casovou radu, protoze pocet obyvatelje stanoven v urcity okamzik (datum). Kdyz se blıze podıvame na tabulku 3.1,zjistıme, ze datumy zjist’ovanı jsou ruzne vzdalene od sebe. Pri vytvarenı grafusi na to musıme dat pozor.

Pokud bychom secetli napr. prvnı tri hodnoty, tj. 1313+1173+1271 = 3757,nedostaneme zadnou smysluplnou hodnotu. Rozhodne to neznamena, zev obci Treskoprsky bydlelo v prvnım ctvrtletı dohromady 3757 obyvatel.U okamzikovych casovych rad totiz soucet jednotlivych hodnot nema smysl.

datum 1. 1. 3. 2. 8. 3. 1. 4. 10. 5. 2. 6. 30. 6. 1. 9. 5. 10. 7. 11. 31. 12.

poc. obyv. 1 313 1 173 1 271 1 301 1 387 1 417 1 634 1 552 1 618 1 653 1 526

Tabulka 3.1: Pocet obyvatel obce Treskoprsky v prubehu roku 2015

Na obrazcıch 3.1 a 3.2 jsou ukazany dva grafy, ktere jsou vytvorene zestejnych dat (z tabulky 3.1), stejnym typem grafu (spojnicovy graf), s je-

VSP Jihlava, 2015 S. Dvorakova 59

Page 60: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.1 Uvod

Obrazek 3.1: Ukazka vytvorenı grafu okamzikove rady s nestejne vzdalenymiokamziky – spojnicovy graf

Obrazek 3.2: Ukazka vytvorenı grafu okamzikove rady s nestejne vzdalenymiokamziky

dinym rozdılem, a to typem osy x.Na prvnım obrazku 3.1 je typ Osa textu. Je videt, ze na ose x jsou presnevypsany jednotlive datumy zapisovanı poctu lidı, ale vsechny body grafujsou od sebe stejne vzdalene. Coz neodpovıda realite, protoze mezi jednot-livymi okamziky zapisovanı udaju je ruzny pocet dnı.Kdezto na druhem obrazku 3.2, kde se jedna o typ Osa data, majı bodygrafu ruzne vzdalenosti (podle reality), ale na ose x nejsou vypsane presne

VSP Jihlava, 2015 S. Dvorakova 60

Page 61: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.1 Uvod

datumy zapisovanı poctu obyvatel.Prıslusne grafy jsou vytvorene v MS Excel 2013. Ve starsıch verzıch sevlastnosti spojnicoveho grafu mohou trochu lisit (nemusı tam byt vybertypu osy).

4

Prıklad 3.2. V obci Treskoprsky behem roku 2015 zaznamenavali, kolik se kazdymesıc narodilo detı. Data jsou v tabulce 3.2.

mesıc leden unor brezen duben kveten cerven

pocet narozenych detı 21 17 18 13 16 15

mesıc cervenec srpen zarı rıjen listopad prosinec

pocet narozenych detı 14 21 24 18 15 13

Tabulka 3.2: Pocet narozenych detı v obci Treskoprsky v prubehu roku 2015

V tomto prıpade se jedna o usekovou (intervalovou radu), protoze cıslo vzdyvyjadruje pocet narozenych detı behem celeho mesıce a ne v urcity ukamzik.Pokud secteme hodnoty napr. z ledna az brezna, dostaneme pocet narozenychdetı v prvnı ctvrtine roku (21 + 17 + 18 = 56).

Obrazek 3.3: Ukazka grafu intervalove rady – pocet narozenych detı v jednotlivychmesıcıch

VSP Jihlava, 2015 S. Dvorakova 61

Page 62: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.1 Uvod

Jak bylo receno vyse, u casovych rad byva problem s kalendarem, presnejireceno s ruznym poctem dnu jednotlivych mesıcu. Pokud nam to z nejakehoduvodu vadı, lze casovou radu ocistit, tj. hodnoty rady prepocıtat na stan-dartizovany mesıc. Ukazka takoveho prepoctu je v tabulce 3.3 ve ctvrtemsloupci. Na prıslusny vzorecek lze prijıt i trojclenkou.

Vzhledem k tomu, ze u usekovych casovych rad ma soucet jednotlivych hodnotsmysl, lze v tomto prıkladu sestrojit i tzv. odvozene rady. Jedna se o kumu-lativnı a klouzavou radu.

Prvnı zmınena rada, kumulativnı nebo-li souctova, vznikne postupnym nacı-tanım hodnot puvodnı casove rady (podobne, jako je tomu u kumulativnı cetnostiukazane v prvnı casti techto skript). Hodnota kumulativnı rady v cervnu rıka, zese od zacatku roku az do cervna (vcetne) narodilo v obci Treskoprsky prave 100detı (viz tabulka 3.3 paty sloupec).

rok pocet nar. pocet dnı prepocet na kumulativnı klouzava rada

2015 detı v mesıci standar. mesıc rada p = 3 p = 4

leden 21 31 21 · 30,4231 = 20, 6 21

unor 17 28 17 · 30,4228 = 18, 47 38

brezen 18 31 17,66 56 56

duben 13 30 13,18 69 48 69

kveten 16 31 15,7 85 47 64

cerven 15 30 15,21 100 44 62

cervenec 14 31 13,74 114 45 58

srpen 21 31 20,6 135 50 66

zarı 24 30 24,33 159 59 74

rıjen 18 31 17,66 177 63 77

listopad 15 30 15,21 192 57 78

prosinec 13 31 12,76 205 46 70

soucet 205 365 205,12 x x x

Tabulka 3.3: Prepocet hodnot na standartizovany mesıc a odvozene rady

Pokud chceme vypocıtat klouzavou radu, musıme si nejprve urcit delku jejıklouzave casti p. V tabulce 3.3 jsou ukazany dve klouzave rady, a to trı- a ctyr-

VSP Jihlava, 2015 S. Dvorakova 62

Page 63: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.2 Prumerovanı casovych rad

mesıcnı. Princip je podobny jako u kumulativnı rady, ale nescıtame hodnoty odzacatku, nybrz pouze poslednıch p hodnot. Pro trımesıcnı (p = 3) kluzavou raduhodnota v rıjnu (63) vyjadruje pocet narozenych detı za srpen, zarı a rıjen.

V MS Excel lze klouzave rady velice rychle spocıtat pomocı funkce SUMA(kdy oznacıme prıslusne hodnoty, ktere se majı prave secıst), jak je ukazanona obrazku 3.4. Pote zkopırovanım do celeho slouce dojde k vypocıtanı celerady a to dıky posunu prıslusnych odkazu.

Obrazek 3.4: Ukazka vypoctu klouzave rady

4

3.2 Prumerovanı casovych rad

Pokud chceme urcit prumer hodnot casove rady, musıme rozlisit dva drıve zmınenetypy casovych rad:

usekove casove rady – vypocet se provadı klasicky pomocı aritmetickeho pru-meru (jak je ukazano v prıkladech 3.3 a 3.4).

okamzikove casove rady – aritmeticky prumer nelze pouzıt (protoze soucethodnot okamzikove rady nedava smysl, jak bylo ukazano v prıkladu 3.1).Pouzıva se tzv. chronologicky prumer. Pri jeho pocıtanı musıme zohled-nit, zda byly okamziky merenı stejne vzdalene, ci nikoli. Vyskytuje se vedvou formach (stejne jako aritmeticky prumer):

VSP Jihlava, 2015 S. Dvorakova 63

Page 64: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.2 Prumerovanı casovych rad

• prosta forma – v prıpade stejne vzdalenosti mezi jednotlivymi okamziky(ukazano v prıkladu 3.6)

y =y12

+ y2 + · · ·+ yn−1 + yn2

n− 1,

• vazena forma – v prıpade nestejnych vzdalenostı mezi jednotlivymiokamziky (viz prıklad 3.5)

y =y1+y2

2(t2 − t1) + y2+y3

2(t3 − t2) + · · · yn−1+yn

2(tn − tn−1)

tn − t1.

Podrobnejsı popis teorie k vypoctu prumeru casovych rad (tzv. merenı urovnedynamiky jevu) lze najıt napr. v [5, Modul 6 – Kap. 1.4].

Prıklad 3.3. Spocıtejme prumerny pocet narozenych detı v obci Treskoprskyza rok 2015. Prıslusne udaje jsou v tabulce 3.2.

Protoze se jedna o usekovou radu, budeme prumer pocıtat klasicky aritme-tickym prumerem. Za rok 2015 se narodilo celkem 205 detı (soucet hodnot zevsech mesıcu). Prumerne se tedy v kazdem mesıci narodilo 205

12= 17, 08 detı.

Pokud by se opravdu kazdy mesıc narodilo 17,08 detı, pak se za cely rok narodıcelkem 12 · 17, 08 = 205 detı.

4

Prıklad 3.4. V obci Treskoprsky v prubehu roku 2015 zaznamenavali pocet naro-zenych detı trochu neporadne. V lednu se narodilo 21 detı, v unoru 17, za brezen,duben a kveten dohromady 47 detı, v cervnu 15, o prazdninach (v cervenci asrpnu) dohromady 35 detı, v zarı 24 a do konce roku 46 detı. Spocıtejme prumernypocet narozenych detı.

V tomto prıpade se jedna o usekovou radu s nestejne velkymi intervaly. Po-kud se ale zamyslıme, tak na vypocet logicky prijdeme. Za cely rok se narodilodohromady 21 + 17 + 47 + 15 + 35 + 24 + 46 = 205 detı. A protoze rok ma 12mesıcu, tak prumerny pocet narozenych detı kazdy mesıc je 205

12= 17, 08.

4

Prıklad 3.5. Spocıtejme prumerny pocet obyvatel obce Treskoprsky v roce 2015z prıkladu 3.1. Data jsou v tabulce 3.1.

Jedna se o okamzikovou radu. Mezi jednotlivymi daty zapisovanı poctu oby-vatel je ruzny pocet dnı. Pro vypocet prumeru se tedy musı pouzıt chronologickyprumer ve vazene forme. Nejprve musıme zjistit vzdalenost okamziku, tj. pocetdnı mezi zapisovanım udaju (v tabulce 3.4 tretı sloupec). (V MS Excel stacı dvebunky s datumy od sebe odecıst.) Potom vypocıtame fiktivnı intervalovou radu

VSP Jihlava, 2015 S. Dvorakova 64

Page 65: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.2 Prumerovanı casovych rad

datum pocet obyvatel pocet dnı prepocıtana usek. rada vypocet chronol. pr.

ti yi ti − ti−1 yi+yi−1

2yi+yi−1

2 · (ti − ti−1)

1. 1. 2015 1313 x x x

3. 2. 2015 1173 33 1173−13132 = 1243 1243 · 33 = 41019

8. 3. 2015 1271 33 1271−11732 = 1222 1222 · 33 = 40326

1. 4. 2015 1301 24 1301−12712 = 1286 1286 · 24 = 30864

10. 5. 2015 1387 39 1344 52416

2. 6. 2015 1417 23 1402 32246

30. 6. 2015 1634 28 1525,5 42714

1. 9. 2015 1552 63 1593 100359

5. 10. 2015 1618 34 1585 53890

7. 11. 2015 1653 33 1635,5 53971,5

31. 12. 2015 1526 54 1589,5 85833

soucet x 364 x 533638,5

Tabulka 3.4: Vypocet chronologickeho prumeru poctu obyvatel obce Treskoprsky

y1+y22

, y2+y32

, . . . (ctvrty sloupec). (V MS Excel bud’ vypocıtame pomocı vzorce

’=(B3+B4)/2’ s odkazy na prıslusne bunky nebo funkcı PRUMER(B3:B4) azkopırovanım do celeho sloupce.) Dale hodnoty teto rady vynasobıme prıslusnychpoctem dnu mezi okamziky a cele secteme (paty sloupec). Nakonec tento soucetvydelıme poctem dnı mezi prvnım a poslednım zapisem. Prumerny pocet obyvatelje

y =533 638, 5

364= 1466, 04.

4

Prıklad 3.6. Vzdy prvnıho zarı evidujeme pocet zaku strednı skoly. Pocınajerokem 2000 byly udaje nasledujıcı: 601, 525, 405, 567, 593, 505, 621. Vypocıtejmeprumerny pocet zaku za sledovane roky.

V tomto prıpade se jedna o okamzikovou radu se stejne vzdalenymi okamziky(vzdy jeden rok). Pro vypocet prumeru tedy pouzijeme prosty chronologickyprumer (viz vyse). Za y1, . . . , yn dosazujeme pocty zaku v jednotlivych letecha n = 7 je pocet zapsanych let. Potom prumerny pocet zaku v obdobı let 2000 –

VSP Jihlava, 2015 S. Dvorakova 65

Page 66: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.3 Mıry dynamiky

2006 je:

y =6012

+ 525 + 405 + 567 + 593 + 505 + 6212

7− 1=

3206

6= 534, 33.

Druha moznost, jak vypocıtat prosty chronologicky prumer, je takova, ze hod-noty okamzikove rady prepocıtame na teoretickou usekovou radu (jako v prıpadenestejne vzdalenych okamziku a vazeneho chronologickeho prumeru v predchozımprıkladu). Hodnoty nalezneme v tabulce 3.5. Z teto prepocıtane rady potomvypocıtame obycejny aritmeticky prumer (secteme a vydelıme poctem):

y =3206

6= 534, 33.

pocet prepocıtanat rok

zaku usekova rada

1 2000 601 x

2 2001 525 601+5252 = 563

3 2002 405 525+4052 = 465

4 2003 567 486

5 2004 593 580

6 2005 505 549

7 2006 621 563

soucet 3206

Tabulka 3.5: Vypocet chronologickeho prumeru poctu zaku

4

3.3 Mıry dynamiky

Krome prumeru nas mnohdy zajımajı i zakladnı mıry dynamiky chovanı casovychrad. Nechceme vedet pouze, ze pocet obyvatel za rok je prumerne 628, ale i napr.jestli obyvatel behem roku pribyva nebo naopak ubyva.

Pro dale uvedene charakteristiky budeme uvazovat pouze casove rady, kterenajı stejnou delku casovych useku nebo stejne vzdalene casove okamziky.

Absolutnı prırustky nam rıkajı, o kolik se zmenila hodnota rady mezi jed-

VSP Jihlava, 2015 S. Dvorakova 66

Page 67: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.3 Mıry dynamiky

notlivymi okamziky. Jedna se o rozdıl hodnoty v urcitem obdobı a hodnotouobdobı predchazejıcıho (nejedna se o jedno cıslo, ale posloupnost cısel)

∆t = yt − yt−1 t = 2, 3, . . . , n.

Pokud z rady absolutnıch prırustku vypocıtame prumer, dostaneme prumernyabsolutnı prırustek. Tedy v podstate cıslo prumerne zmeny mezi zacatkem akoncem sledovaneho obdobı yn−y1

n−1 .Pokud bychom chteli vedet, o kolik procent se zmenila hodnota casove rady

mezi jednotlivymi okamziky, vypocıtame relativnı prırustky

δt =∆t

yt−1· 100 =

yt − yt−1yt−1

· 100 t = 2, 3, . . . , n

Koeficienty rustu udavajı kolikrat se zmenila casova rada mezi jednotlivymiokamziky. Jedna se tedy po podıl hodnoty k predchazejıcı hodnote v rade (opetse jedna o radu cısel)

kt =ytyt−1

t = 2, 3, . . . , n

Pro uplnost uvedeme jeste vztah pro prumerny koeficient rustu

k = n−1√k2k3 · · · kn = n−1

√yny1

(jedna se o geometricky prumer koeficientu rustu) udavajıcı, kolikrat se prumernezmenila casova rada behem sledovaneho obdobı. Prumerny relativnı prırustekpotom udava, o kolik procent se prumerne zmenila casova rada ve sledovanemobdobı

δ = (k − 1) · 100.

Prıklad 3.7. Vsechny predchazejıcı pojmy ukazeme na jednom prıkladu. Mamecasovou radu poctu narozenych detı v obci Treskoprsky za rok 2015 (viz. tabulka3.2).

Spocıtame radu absolutnıch prırustku (v tabulce 3.6 ctvrty sloupec). Prvnıhodnotu v unoru dostaneme tak, ze pocet narozenych detı v lednu odecteme odhodnoty v unoru, tj. 17 − 21 = −4. A tak dale az absolutnı prırustek v prosincivypocteme jako rozdıl hodnoty v prosinci a listopadu 13−15 = −2. Tyto hodnotylze zobrazit do grafu, jak je ukazano na obrazku 3.5.

VSP Jihlava, 2015 S. Dvorakova 67

Page 68: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.3 Mıry dynamiky

pocet absolutnı relativnı koeficienty

naroz. detı prırustky prırustky rustu

t yt ∆t δt kt

1 leden 21 x x x

2 unor 17 −4 −19 % 0, 81

3 brezen 18 1 5, 9 % 1, 059

4 duben 13 −5 −27, 8 % 0, 722

5 kveten 16 3 23, 1 % 1, 231

6 cerven 15 −1 −6, 3 % 0, 938

7 cervenec 14 −1 −6, 7 % 0, 933

8 srpen 21 7 50 % 1, 5

9 zarı 24 3 14, 3 % 1, 143

10 rıjen 18 −6 −25 % 0, 75

11 listopad 15 −3 −16, 7 % 0, 833

12 prosinec 13 −2 −13, 3 % 0, 867

Tabulka 3.6: Vypocty mer dynamiky

Kazda prıslusna hodnota absolutnıho prırustku vyjadruje o kolik detı sev prıslusnem mesıci narodilo vıce (ci mene) oproti predchazejıcımu.

Vsechny vypocty lze v MS Excel udelat jednoduse tak, ze prvnı pocıtanouhodnotu udelame pomocı odkazu na prıslusne bunky a pak vzoreczkopırujeme do celeho sloupecku.

Pokud spocıtame prumer z rady absolutnıch prırustku, dostaneme prumernyabsolutnı prırustek. (Cıslo v citateli take spocıtame jako rozdıl poslednı a prvnıhodnoty v casove rade poctu narozenych detı.)

∆ =−4 + 1− 5 + 3 + . . .− 3− 2

11=

13− 21

12− 1=−8

11= −0, 73.

VSP Jihlava, 2015 S. Dvorakova 68

Page 69: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.3 Mıry dynamiky

Obrazek 3.5: Graf absolutnıch prırustku pro pocet narozenych detı obceTreskoprsky v roce 2015

Pokud by absolutnı prırustek (v nasem prıpade spıse ubytek), byl kazdymesıc stejny, tj. kazdy mesıc by se narodilo o 0,73 dıtete mene nez tenpredchazejıcı, potom se z hodnoty 21 narozenych detı v lednu dotaneme na13 narozenych detı v prosinci. (Coz lze jednoduse overit vypoctem.)

Radu relativnıch prırustku vypocıtame podle vzorce uvedeneho vyse. Prvnıhodnotu dostaneme jako 17−21

21· 100 = −19 %, druhou 18−17

17· 100 = 5, 9 % atd.

Kazda hodnota relativnıho prırustku vyjadruje, o kolik procent se narodilodetı vıce v urcitem mesıci oproti mesıci predchazejıcımu. Napr. relativnıprırustek v srpnu je 50 %. V cervenci se narodilo 14 detı, polovina (50 %)z toho je 7 detı. V srpnu se tedy narodilo 14 + 7 = 21 detı.

Vydelenım poctu narozenych detı v urcitem mesıci a v mesıci predchazejıcımdostaneme radu koeficientu rustu. V tabulce 3.6 je to poslednı sloupec.

Koeficient rustu v rıjnu je 0,75. Takze pocet narozenych detı za rıjen je na75% poctu narozenych detı v zarı, tj. 0, 75 · 24 = 18 (na tento vypocet lzeprijıt i pouzitım trojclenky).

Vypocıtanım prumeru z rady koeficientu rustu dostaneme prumerny koeficientrustu. Ale pozor! Nejedna se o obycejny aritmeticky prumer, nybrz o prumergeometricky. Vynasobıme vsechny koeficienty rustu mezi sebou a potom udelame

VSP Jihlava, 2015 S. Dvorakova 69

Page 70: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

jedenactou odmocninu:

k = 11√

0, 81 · 1, 059 · 0, 722 · · · 0, 833 · 0, 867 = 11√

0, 7647 = 0, 957.

Pokud by se kazdy mesıc pocet narozenych detı zmensil na 95,7 % poctunarozenych detı mesıce predchazejıcıho, potom z 21 narozenych detı v lednudostaneme 13 narozenych detı v prosinci. Tj. v unoru by bylo 0, 957 · 21 =20, 27, v breznu 0, 957 · 20, 27 = 19, 55, v dubnu 0, 957 · 19, 55 = 18, 82narozenych detı atd.

V MS Excel lze geometricky prumer spocıtat nekolika zpusoby. Nejjed-nodussı je asi pouzitı funkce GEOMEAN, kde za argument oznacıme celouradu koeficientu rustu.Dalsı moznostı je pouzıt funkci SOUCIN pro vypocıtanı soucinu vsech koefi-cientu rustu (ty vlozıme zase jako argument). Jedenactou odmocninu potomvypocıtame funkcı POWER(bunka vysledku soucinu;1/11).

Prumerny koeficient rustu take spocıtame podle vzorecku uvedeneho vyseu teorie, tj. jedenacta odmocnina z podılu poslednıho a prvnıho clenu casove

rady k = 11

√1321

= 0, 957.

4

3.4 Dekompozice casovych rad

Princip dekompozice ma velmi jednoduchou a krasnou myslenku. Tım je predstava,ze casova rada obsahuje ctyri mozne slozky – trend, sezonnı slozku, cyklickouslozku a nahodnou slozku. Ne kazda casova rada musı nutne obsahovat vsechnyslozky. Poslednı slozka se tez nekdy nazyva reziduum, jako jedinna obsahujenahodu a vyskytuje se prakticky ve vsech radach.

• Trend (T) – vyjadruje dlouhodobe zmeny v chovanı casove rady, typ (tvar,funkci) dlouhodobeho rustu ci poklesu jejı strednı hodnoty. Funkci trendumuzeme zıskat i vyuzitım regresnı analyzy.

• Sezonnı slozka (S) – vyjadruje periodicke zmeny, ktere se odehravajıv prubehu nejakeho obdobı. Typicky tyto zmeny souvisejı se zmenou rocnıhoobdobı (ctvrtletı, mesıce), prubehem pracovnıho tydne apod.

• Cyklicka slozka (C) – vyjadruje nejake pravidelne faze rustu a poklesuokolo trendu, ktere neodpovıdajı delce nejake kalendarnı jednotky (hodina,den, tyden, mesıc, ctvrtletı, atd.).

VSP Jihlava, 2015 S. Dvorakova 70

Page 71: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

• Nahodna slozka (ε)– predstavuje nahodne vykyvy, ktere nemajı zadnysystematicky charakter.

Sezonnı a cyklicke slozce se dohromady rıka periodicka slozka.Rozlozit casovou radu na jednotlive slozky nenı uplne jednoduche. Zalezı na

spouste faktoru, podle kterych se vybıra nejaka vhodna metoda. Ta toto temajsou napsany cele knihy. V techto skriptech na dukladnejsı popis nenı mısto, aani to nenı jejich ucelem, proto na prıkladu ukazeme jednu nejjednodussı metodu.Teorii k teto metode lze najıt v [5, Modul 6].

Klasicky rozklad casove rady na slozky predpoklada, ze hodnoty obsahujıprevazne trend a periodickou slozku (sezonnı a cyklicka), ktere jsou v celemprubehu rady nemenne a jsou predvıdatelne. Toho se potom vyuzıva v pred-povedıch budoucıho chovanı casove rady. Tyto dve slozky dohromady davajıtzv. systematickou slozku Yt, kterou muzeme dostat bud’ sectenım trendovea periodicke slozky (aditivnı prıstup) nebo jejich vynasobenım (multiplikativnıprıstup). Rozdıl mezi skutecnou hodnotou casove rady yt a vypoctenou systema-tickou slozkou Yt se nazyva reziduum a reprezentuje nepravidelnou nahodnouslozku.

Z internetovych stranek Ceskeho statistickeho uradu lze stahnout spoustudat, i ruzne casove rady. Na adrese https://www.czso.cz/csu/czso/oby_cr_m

stahneme excelovsky soubor nazvany Pohyb obyvatelstva v Ceske republice v le-tech 1992 az 2015, absolutnı mesıcnı udaje. Tento soubor obsahuje udaje o poctuobyvatel, o snatcıch a rozvodech, o zive narozenych, potratech, zemrelych, o mi-graci (pristehovalı a vystehovalı) atd. A to vse v mesıcnıch, ctvrtletnıch a rocnıchhodnotach.

Prıklad 3.8. Zkusme rozlozit casovou radu zive narozenych detı za ctvrtletıv letech 2002–2006 na jednotlive slozky. Data najdeme ve vyse uvedenem souboruCeskeho statistickeho uradu.

2002 2003 2004 2005 2006

1. ctvrtletı 22 782 22 529 23 508 24 261 24 734

2. ctvrtletı 24 396 24 162 25 422 27 000 27 540

3. ctvrtletı 23 912 25 143 25 558 27 159 27 778

4. ctvrtletı 21 696 21 851 23 176 23 791 25 779

Tabulka 3.7: Pocet zive narozenıch v CR v obdobı 2002–2006

Do tabulky 3.7 vykopırujeme pouze udaje, ktere potrebujeme. Takto jsouhodnoty docela prehledne, nicmene pro dalsı zpracovanı pomocı MS Excel je

VSP Jihlava, 2015 S. Dvorakova 71

Page 72: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

lepsı mıt cısla v jednom sloupci pod sebou (obrazek 3.8). Pro dobrou predstavuo datech je dobre prıslusnou casovou radu zobrazit do grafu, viz obrazek 3.6.

Obrazek 3.6: Casova rad zive narozenych v CR v letech 2002–2006

Pokud se na tento graf podıvame pozorne, je videt, ze prumerny pocet naro-zenych detı roste (trendova slozka) vıce mene linearne (po prımce). Pak se tamvyskytuje nejaka periodicita (sezonnost), protoze ve tretım ctvrtletı je vzdy na-rozenych nejvıce a ve ctvrtem nejmene. Nahodna slozka je tam ocividne take,protoze kolısanı v jednotlivych letech nenı uplne stejne. Pro predstavu o sezonnıslozce lze z tabulky 3.7 vytvorit i graf na obrazku 3.7.

Obrazek 3.7: Zive narozenı v CR v letech 2002–2006 po ctvrtletıch

VSP Jihlava, 2015 S. Dvorakova 72

Page 73: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

Protoze se jedna o usekovou radu, lze vytvorit kumulovanou radu a ruzneklouzave rady. Je to tak jednoduche, ze uz to v tomto prıkladu delat ne-budeme. Ukazka vypoctu je v prıkladu 3.2. Prumerny pocet narozenychdetı spocıtame obycejnym aritmetickym prumerem (hodnoty secteme avydelıme poctem nebo pouzijeme funkci PRUMER): y = 492 177

20= 24 609.

Dale se dajı vypocıtat prumery za kazdy rok, kazde ctvrtletı a vse dat dografu. Vzdy je dobre rozvazit, co je vlastne potreba vypocıtat. Pri zpra-covavanı casovych rad nema cenu pocıtat hodne vecı a ruznych charak-teristik. Mnohdy jsou vysledky slozitejsı nez samotna casova rada. Takjako u kazdeho statistickeho zpracovavanı dat, by se mely brat v uvahupredevsım cıle nejakeho projektu, tedy to, co od analyzy casove radyocekavame a co potrebujeme vedet.

Obrazek 3.8: Tabulka vypoctu dekompozice casove rady zive narozenych v CRv letech 2002–2006

Pri hledanı trendove slozky se uspesne vyuzıva regesnı analyza. Trend jev podstate regresnı funkce, v nasem prıpade regresnı prımka. V techto skriptechlze toto tema najıt v kapitole 2.2, presneji v prıkladu 2.4.

Abychom dokazali napsat rovnici trendove prımky, musıme jeste zavet nejakoucasovou promennou (nemuzeme se odkazovat na slova jako 1. ctvrtletı, proste

VSP Jihlava, 2015 S. Dvorakova 73

Page 74: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

potrebujeme cısla). Je nekolik metod, jak to udelat, ale nejjednodussı je asi prvnımerenı (2002 – 1. ctvrtletı) oznacit jako t = 1, druhe t = 2 atd. az poslednı (2006– 4. ctvrtletı) jako t = 20.

Potom bud’ pomocı spojnice trendu v grafu nebo funkcemi SLOPE a INTER-CEPT vypocıtame smernici a absolutnı clen trendove prımky, jak je ukazano naobrazku 3.9. Trendova prımka ma tedy rovnici

Tt = 205, 56 t+ 22 450, 47.

Obrazek 3.9: Vypocet smernice a absolutnıho clenu trendove prımky pomocıfunkcı MS Excel

Dale vypocıtame hodnotu trendu pro kazdy radek tabulky, tj. pro vsechnactvrtletı let 2002 az 2006. Do predpisu trendove funkce se za t dosazuje zavedenacasova promenna. Nejrychlejsı vypocet v MS Excel je pomocı okdazu na prıslusnebunky, jak je ukazano na obrazku 3.10. Vzorec pro vypocet se potom zkopırujedo celeho sloupce.

Pro vypocet periodicke slozky pouzijeme empiricky sezonnı index Ij. Pro-toze pocet narozenych detı je uveden ve ctvrtletıch, lze predpokladat (a podlegrafu je to i videt), ze delka periody bude 4 (za rok mame 4 ctvrtletı), tedybudeme mıt i 4 indexy (pro kazde ctvrtletı jeden). Vzorec pro vypocet empirickychsezonnıch indexu je nasledujıcı:

Ij =1

k

k∑i=1

yijTij

, j = 1, 2, . . . , k.

Coz je aritmeticky prumer podılu pozorovanych hodnot (y) a trendovych hod-not (T ) z kazdeho obdobı. Presny popis vzorecku a vyznam jednotlivych pısmenctenar nalezne v [5, Kapitola 3.2]. Prakticky vypocet je ukazan dale na obrazcıch.

VSP Jihlava, 2015 S. Dvorakova 74

Page 75: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

Obrazek 3.10: Vypocet smernice a absolutnıho clenu trendove prımky pomocıfunkcı MS Excel

Obrazek 3.11: Vypocet empirickych sezonnıch indexu

Pro vsechny radky vypocıtame podıly puvodnıch hodnot a trendu, tj. ytTt

(obrazek 3.11). Potom z techto hodnot vypocıtame prumer, ale vzdy jenpro prıslusne ctvrtletı.Kontrola spravnosti vypoctu je ta, ze soucet sezonnıch indexu je priblizne4 (protoze mame 4 indexy). Kdybychom pocıtali periodu v mesıcıch, melibychom indexu 12 a jejich soucet by byl take zhruba 12.

Takto se pocıta periodicita, pokud predpokladame konstantnı sezonnost.Pro proporcionalnı (menıcı se) sezonnost se indexy pocıtajı trosku jinak.Teorii k tomu lze najıt v [5, Kapitola 3.3].

VSP Jihlava, 2015 S. Dvorakova 75

Page 76: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

Pokud se na vysledne empiricke sezonnı indexy podıvame, lze rıci, ze v prvnıma ctvrtem ctvrtletı je pocet narozenych detı mene (indexy mensı nez 1) a vedruhem a tretım vıce (indexy vetsı nez 1).

Pomocı vypocıtanych empirickych indexu lze casovou radu tzv. vyrovnat (urcitsystematickou slozku). Tato slozka casove rady obsahuje pouze trend a perio-dicitu. Neobsahuje tudız nahodnou slozku. Vyrovnane hodnoty Y vypocetemejako soucin trendu a prıslusneho empirickeho sezonnıho indexu Yt = Tt · Ij. Je toukazano na obrazku 3.12.

Pro jednodussı vypocet vyrovnanych hodnot v MS Excel zkopırujeme em-piricke indexy pod sebe do jednoho sloupce. Pro vsechny roky jsou indexystejne. Potom pouze odkazy na prıslusne bunky vypocıtame prvnı vyrov-nanou hodnotu a do celeho sloupce vzorec vypoctu zkopırujeme.

Obrazek 3.12: Vyrovnanı casove rady – vypocet systematicke slozky

Zaroven muzeme predpovedet vyvoj casove rady (poctu narozenych detı) nanekolik dalsıch obdobı. V tabulce 3.8 je vypocıtana predpoved’ na dalsı rok 2007.Vse lze zobrazit do grafu na obrazku 3.13.

Pri predpovedi nesmıme zapomenout na to, ze se jedna pouze o teoretickehodnoty (protoze neobsahujı nahodnou slozku, kterou nedokazeme predpovedet).Nema take smysl predpovıdat na mnoho obdobı dopredu, protoze skutecne hod-noty se potom velice lisı.

Pro jednoduchou kontrolu, zda je vyrovnanı udelano dobre, slouzı rezidua,coz je rozdıl mezi skutecnou a vyrovnanou hodnotu et = yt − Yt. Pravidel prohodnocenı kvality vyrovnanı je vıce, ale nejjednodussı je to, ze prumerna hodnotareziudı by mela byti rovna nule (respektive stacı jejich soucet). V nasem prıpadeto platı, jak je videt v tabulce 3.8

Nakonec jeste muzeme casovou radu ocistit od sezonnosti. Pokud kazdoupozorovanou hodnotu vydelıme prıslusnym sezonnım indexem yt

Ij(obrazek 3.14),

dostaneme ocistenou casovou radu od sezonnosti, ktera obsahuje pouze trend anahodnou slozku, viz obrazek 3.15.

4

VSP Jihlava, 2015 S. Dvorakova 76

Page 77: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.4 Dekompozice casovych rad

Obrazek 3.13: Graf vyrovnane casove rady

Obrazek 3.14: Ocistenı casove rady od sezonnosti

Obrazek 3.15: Graf ocistene casove rady

.

VSP Jihlava, 2015 S. Dvorakova 77

Page 78: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.5 Shrnutı

3.5 Shrnutı

Demograficka data byvajı velmi casto ve forme casove rady. Jsou to vlastne de-mograficke udaje sbırane v prubehu casu (dnu, mesıcu a let). Aby bylo moznotakova data dobre analyzovat, je dulezite, aby jejich vecne a prostorove vymezenıbylo v celem sledovanem obdobı stejne.

Casove rady se delı na okamzikove a usekove. Rozdıl je v tom, zda je hodnotacasove rady vztazena k urcitemu okamziku nebo nejakemu casovemu intervalu.Sectenı usekove rady dava smysluplou interpretaci a lze u nı pocıtat odvozenerady, predevsım kumulativnı a klouzavou.

Pri sbıranı dat casove rady je potreba dopredu rozmyslet velikost intervalunebo vzdalenost okamziku. Aby nebylo prılis mnoho nebo naopak malo dat. Daleje dobre mıt vzdalenosti merenı stale stejne (ekvidistantnı).

Usekove casove rady lze prumerovat obycejnym aritmetickym prumerem, kdeztou okamzikovych rad je zapotrebı pouzıt chronologicky prumer.

Pro popis prubehu casove rady lze pouzıt ruzne absolutnı a relativnı prırustkya koeficienty rustu.

Vetsina casovych rad lze rozlozit na slozky. Trend vyjadruje dlouhodobe chovanıcasove rady (v podstate, zda prumery rostou ci klesajı). Periodicka slozka (sezonnıa cyklicka) popisuje nejake periodicky opakujıcı se zmeny rady (vetsinou souvisıs kalendarem). Kazda casova rada take obsahuje nahodnou slozku, kterou nelzeporadne popsat ani dopredu odhadnout.

Pojmy k zapamatovanı:

• Casova rada okamzikova a usekova (intervalova),

• zastaravanı udaju, problem kalendarovych variacı, vecne a prostorove vy-mezenı casove rady,

• odvozene casove rady – kumulativnı a klouzava,

• prumerovanı casovych rad – aritmeticky a chronologicky prumer,

• mıry dynamiky – absolutnı prırustky, relativnı prırustky, prumerny abso-lutnı a relativnı prırustek, koeficienty rustu, prumerny koeficient rustu,

• slozky casovych rad – trendova, sezonnı, cyklicka, nahodna,

• dekompozice casovych rad,

• empiricky sezonnı index, systematicka slozka, vyrovnane a ocistene hodnoty,reziduum.

VSP Jihlava, 2015 S. Dvorakova 78

Page 79: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.6 Prıklady k procvicenı

3.6 Prıklady k procvicenı

1. Vymyslete prıklady usekovych casovych rad se stejne a nestejne dlouhymiintervaly.

2. Vymyslete prıklady okamzikovych rad se stejne nebo nestejne vzdalenymiokamziky.

3. U kterych z predchazejıcıch prıkladu pouzijete k prumerovanı aritmetickyprumer?

4. U kterych z predchazejıcıch prıkladu pouzijete k prumerovanı vazeny chro-nologicky prumer?

5. U kterych z predchazejıcıch prıkladu muzete vypocıtat odvozene rady? (tj.kumulativnı a klouzave)

6. Jaky ukazatel o casove rade prozradı kolikrat se prumerne zmenily hodnotyza cele sledovane obdobı.

7. Mame-li mesıcnı udaje umrtnosti za tri roky, kolik hodnot zıskame, budeme-li pocıtat absolutnı prırustky?

8. Na jake slozky lze rozlozit casovou radu?

9. Kterou ze slozek obsahuje kazda casova rada?

10. Pokud spocıtame vyrovnane hodnoty casove rady (systematickou slozku),dostaneme slozku, ktera obsahuje pouze . . . (doplnte).

11. Jak se rıka procesu, pri kterem hodnoty casove rady zbavıme periodicity?(zustane pouze trend a nahodna slozka)

12. Kazdy prazdninovy tyden v roce 2014 (vzdy v nedeli) evidujeme, kolikza prıslusny tyden prislo na ambulaci detı se zlomenou novou. Vypocteteprumerny pocet detı se zlomenou nohou za jeden prazdninovy den a zajeden prazdninovy tyden.

datum 6.7. 13.7. 20.7. 27.7. 3.8. 10.8. 17.8. 24.8. 31.8.

pocet 11 9 7 6 5 8 11 10 12

13. Za prvnı tyden cinnosti ambulance osetrila 5 prıpadu. Za dalsı dva tydnydohromady 21 prıpadu a za dalsı mesıc (4 tydny) celkem 60 prıpadu. Urceteprumerny pocet osetrenych prıpadu za tyden.

VSP Jihlava, 2015 S. Dvorakova 79

Page 80: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.6 Prıklady k procvicenı

14. Vzdy po trech mesıcıch zjist’ujeme aktualnı pocet klientu. Za lonsky rok sejednalo o nasledujıcı pocty: 43 (1. leden), 55 (1. duben), 38 (1. cervenec),52 (1. rıjen) a 40 (1. leden). Zjistete prumerny pocet klientu za cely rok(pricem nebereme v uvahu kalendarove variace).

15. V jedne nejmenovane obci bylo v roce 1990 celkem 70 obyvatel. Dalsı zapisyo poctu obyvatel mame z let 1992, 1999, 2000, 2004, 2008 a 2010. Bylo jichpostupne: 85, 87, 96, 108, 115 a 130. Vypoctete prumerny pocet obyvatelobce behem sledovanych let.

16. Z dat v prıkladu 12 vypoctete kumulovanou radu a klouzavou radu prop = 3. Nektera cısla zkuste interpretovat. Zobrazte do grafu.Dale spocıtejte absolutnı prırustky a koeficienty rustu, prumerny absolutnıprırustek a prumerny koeficient rustu.

17. Ze souboru Pohyb obyvatelstva v Ceske republice v letech 1992–2015, abso-lutnı mesıcnı udaje Ceskeho statistickeho ustavu stahnete ctvrtletnı datao poctu rozvodu za roky 2005–2008, proved’te dekompozici na jednotliveslozky a odhadnete vyvoj poctu rozvodu na rok 2009.

18. Ze souboru Pohyb obyvatelstva v Ceske republice v letech 1992–2015, ab-solutnı mesıcnı udaje Ceskeho statistickeho ustavu stahnete mesıcnı datao poctu zive narozenych za roky 2012–2014, proved’te dekompozici na jed-notlive slozky a odhadnete vyvoj zive narozenych na rok 2015.

Vysledky

3. U casovych rad usekovych.

4. U casovych rad okamzikovych s nestejne vzdalenymi okamziky.

5. U casovych rad usekovych.

6. Prumerny koeficient rustu.

7. 3 · 12− 1 = 35 hodnot.

8. Trend, periodicka slozka (sezonnı + cyklicka) a nahodna slozka.

9. Nahodnou slozku.

10. . . . trend a periodicitu.

11. Ocist’ovanı casove rady od sezonnosti.

VSP Jihlava, 2015 S. Dvorakova 80

Page 81: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.6 Prıklady k procvicenı

12. Celkem prislo 79 detı. Prazdniny trvaly 9 tydnu (nebo 63 dnı). Prumerne zatyden prislo 79

9= 8, 78 detı se zlomenou nohou a za den prumerne 79

63= 1, 25

dıtete.

13. Ambulance osetrila celkem 5+21+60 = 86 pacientu za 1+2+4 = 7 tydnu,tj. prumerne 86

7= 12, 3 pacientu za jeden tyden.

14. chronologicky prumer prosty: y =432+55+38+52+ 40

2

5−1 = 186,54

= 46, 625

15. chronologicky prumer vazeny: y = 1947,520

= 97, 4

rok poc. obyvatel prep. usek poc. let vynasobene

1990 70 x x x

1992 85 77,5 2 155

1999 87 86 7 602

2000 96 91,5 1 91,5

2004 108 102 4 408

2008 115 111,5 4 446

2010 130 122,5 2 245

soucet 20 1947,5

16.

datum pocet kumulovana klouzava p = 3 abs. prır. koef. rustu

6.7 11 11 x x x

13.7 9 20 x -2 0,818

20.7 7 27 58 -2 0,778

27.7 6 33 80 -1 0,857

3.8 5 38 98 -1 0,833

10.8 8 46 117 3 1,6

17.8 11 57 141 3 1,375

24.8 10 67 170 -1 0,909

31.8 12 79 203 2 1,2

prumerny absolutnı prırustek 12−119−1 = 0, 125,

prumerny koeficient rustu 8

√1211

= 1, 011.

VSP Jihlava, 2015 S. Dvorakova 81

Page 82: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

3. CASOVE RADY 3.6 Prıklady k procvicenı

17.

18.

VSP Jihlava, 2015 S. Dvorakova 82

Page 83: Statistick a analyza a casov e rady v p r kladech - VŠPJ/Statistická analýza a časové... · Tato skripta jsou rozd elena do t r z akladn ch kapitol. ... kter e se d ale pou z

Literatura

[1] BORUVKOVA, Jana, Zaklady statistiky – dotaznıkove setrenı, Vysoka skolapolytechnicka Jihlava, 2013, ISBN 978-80-87035-80-1.

[2] BORUVKOVA, Jana, HORACKOVA, Petra, HANACEK, Miroslav, Statis-tica – Uvod do zpracovanı dat. Vysoka skola polytechnicka Jihlava, 2013,ISBN 978-80-87035-79-5.

[3] BORUVKOVA, Jana, HORACKOVA, Petra, HANACEK, Miroslav, Statis-tika v SPSS. Vysoka skola polytechnicka Jihlava, 2014, ISBN .

[4] LITSCHMANNOVA, Martina, Uvod do statistiky (interaktivnı ucebnıtext). Vysoka skola banska – Technicka univerzita Ostrava a Zapadoceskauniverzita v Plzni, 2012.http://www.cs.vsb.cz/ochodkova/courses/MADI/interaktivni_uvod_do_statistiky.pdf

http://mi21.vsb.cz/sites/mi21.vsb.cz/files/unit/uvod_do_statistiky.pdf

[5] MINARIK, Bohumil, Statistika (e-learningova studijnı opora pro studentybakalarskych oboru). Mendelova univerzita v Brne, 2013, ISBN 978-80-7375-721-2.

VSP Jihlava, 2015 S. Dvorakova 83


Recommended