+ All Categories
Home > Documents > StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet...

StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet...

Date post: 19-Aug-2019
Category:
Upload: leminh
View: 225 times
Download: 0 times
Share this document with a friend
17
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Statistické zpracování dat v aplikaci STAT1 Výuková pomůcka pro předmět Statistika Jiří Neubauer, Marek Sedlačík 3. 11. 2012
Transcript
Page 1: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

UNIVERZITA OBRANY

Fakulta ekonomiky a managementu

Statistické zpracování datv aplikaci STAT1

Výuková pomůcka pro předmět Statistika

Jiří Neubauer, Marek Sedlačík

3. 11. 2012

Page 2: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Obsah

Popis STAT1 1

Použití 2Vložení dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2Popisné charakteristiky . . . . . . . . . . . . . . . . . . . . . . . . . . . 3Bodové rozdělení četností . . . . . . . . . . . . . . . . . . . . . . . . . 4Intervalové rozdělení četností . . . . . . . . . . . . . . . . . . . . . . . 6Bodové a intervalové odhady . . . . . . . . . . . . . . . . . . . . . . . . 8

Odhady parametrů normálního rozdělení . . . . . . . . . . . . . . 8Odhady střední hodnoty pro výběry velkého rozsahu . . . . . . . 10Odhady parametru alternativního rozdělení . . . . . . . . . . . . . 10

Testy statistických hypotéz . . . . . . . . . . . . . . . . . . . . . . . . 12Jednovýběrové testy . . . . . . . . . . . . . . . . . . . . . . . . . 12Dvouvýběrové testy . . . . . . . . . . . . . . . . . . . . . . . . . . 12Testy normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Chí-kvadrát test nezávislosti v kontingenční tabulce . . . . . . . . . . . 16Statistické tabulky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2

Page 3: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Popis STAT1

Aplikace STAT1 pracuje pod Microsoft Office Excel a je určena pro základnízpracování dat prostřednictvím exploratorní analýzy dat, metod jednorozměrnéinduktivní statistiky, dále jsou zde implementovány dvouvýběrové testy a chí-kvadrát test nezávislosti v kontingenční tabulce. Aplikace poskytuje řadu užiteč-ných výstupů v podobě tabulek, grafů a statistických závěrů.

Uživatel může pomocí tohoto nástroje zpracovávat vlastní datové soubory,případně lze využít již vložených dat. Ovládání se provádí pomocí nabízenýchmenu nebo pomocí parametrů, které jsou označeny červeně. Oporu lze najít rov-něž v knize Neubauer, J., Sedlačík, M. a O. Kříž. Základy statistiky: Aplikacev technických a ekonomických oborech. Praha: Grada, 2012. ISBN 978-80-247-4273-1.

1

Page 4: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Použití

Vložení dat

Pro vložení vlastního datového souboru přejděte na list „dataÿ. Do prvních třechsloupců označených „moje data 1ÿ, „moje data 2ÿ a „moje data 3ÿ vložte data.

Data obsažená v knize Základy statistiky jsou uvedena v daném listu v pořadí,v jakém se v knize objevují.

2

Page 5: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Popisné charakteristiky

List „popisné charakteristikyÿ nabízí výpočet vybraných číselných charakteris-tik datového souboru. Z nabízeného menu vyberte datový soubor, který mátev úmyslu zpracovávat. (Název datového souboru odpovídá názvu uvedenémuv prvním řádku v listu „dataÿ). Číselné charakteristiky v tabulkové podobě sespočítají automaticky.

Kromě těchto charakteristik lze na listu nalézt dva grafy: krabicový diagram(boxplot) a Q-Q plot. Krabicový diagram zachycuje minimální a maximální hod-notu datového souboru, dolní kvartil, medián, horní kvartil a aritmetický průměr(červená linka). Q-Q plot porovnává teoretické kvantily normovaného rozděleníN(0,1) s empirickými kvantily určených z dat. Dále jsou spočteny testy normalityzaložené na koeficientech šikmosti a špičatosti – viz testy hypotéz.

Page 6: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Bodové rozdělení četností

Pro vytvoření tabulky bodového rozdělení četností a grafů popisující toto roz-dělení přejděte na list „bodové rozděleníÿ. Z nabízeného menu vyberte datovýsoubor, který máte v úmyslu zpracovávat. (Název datového souboru odpovídánázvu uvedenému v prvním řádku v listu „dataÿ).

Tabulka rozdělení četností se vytvoří automaticky s krokem uvedeným v po-líčku „krokÿ, nastavenou hodnotu „1ÿ lze měnit v závislosti na vlastnostech da-tového souboru. Spolu s tabulkou se vypočítají základní popisné charakteristikya vytvoří se dva grafy: polygon četností a součtová křivka. Řádky s nulovýmičetnostmi je možné skrýt (tyto hodnoty se nebudou objevovat v grafech).

Page 7: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Dále jsou spočteny testy normality založené na koeficientech šikmosti a špiča-tosti – viz testy hypotéz.

Page 8: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Intervalové rozdělení četností

Pro vytvoření tabulky intervalového rozdělení četností a grafů popisující totorozdělení přejděte na list „intervalové rozděleníÿ. Z nabízeného menu vyberte da-tový soubor, který máte v úmyslu zpracovávat. (Název datového souboru odpo-vídá názvu uvedenému v prvním řádku v listu „dataÿ). Ke správnému vytvořenítabulky rozdělení četností je potřeba zadat následující tři parametry (označenéčerveně): k . . . plánovaný počet tříd (řádků) v tabulce, h . . . šířka třídy (inter-valu), a . . . počáteční hodnota, od které se začne tabulka vytvářet. Jako pomůckapro určení optimálního počtu tříd jsou zde uvedena dvě pravidla. Konkrétní volbapotom závisí na zpracovateli.

Spolu s tabulkou se vypočítají základní popisné charakteristiky a vytvoří se dvagrafy: histogram a součtový histogram. Řádky s nulovými četnostmi je možnéskrýt (tyto hodnoty se nebudou objevovat v grafech).

Page 9: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Dále jsou spočteny testy normality založené na koeficientech šikmosti a špičatosti– viz testy hypotéz.

Page 10: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Bodové a intervalové odhady

Odhady parametrů normálního rozdělení

Bodové a intervalové odhady střední hodnoty a rozptylu (příp. směrodatné od-chylky) získáme přepnutím na list „1V – normálníÿ. Poté, co vybereme analy-zovaný datový soubor a zadáme riziko odhadu α (implicitně nastaveno na hod-notu 0,05), bodové odhady a intervaly spolehlivosti pro střední hodnotu, rozptyli směrodatnou odchylku (oboustranný, dolní i horní) se vypočítají.

Odhady parametrů lze také získat přímým zadáním číselných charakteristik(rozsahu, aritmetického průměru a výběrové směrodatné odchylky).

Page 11: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Odhady střední hodnoty pro výběry velkého rozsahu

Bodové a intervalové odhady střední hodnoty získáme přepnutím na list „1V –libovolnéÿ. Ovládání je obdobné jako u odhadů parametrů normálního rozdělení.

Odhady parametru alternativního rozdělení

Bodové a intervalové odhady parametru alternativního rozdělení získáme přepnu-tím na list „1V a 2V – podílyÿ. Zde je nutné zadat vstupní n a m, kde podíl m/nje bodovým odhadem parametru π alternativního rozdělení.

Page 12: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Testy statistických hypotéz

Jednovýběrové testy

Aplikace STAT1 obsahuje tyto jednovýběrové testy hypotéz: test střední hodnotya rozptylu normálního rozdělení (list „1V – normálníÿ), test střední hodnoty provelké výběry (list „1V – libovolnéÿ) a test parametru alternativního rozdělenípro velké výběry (list 1V a 2V – podíly). Testování se ve všech případech provádípodobně, zaměříme se na jeden konkrétní – test střední hodnoty normálníhorozdělení. Přejdeme na list „1V – normálníÿ a vybereme datový soubor. Zvolímehladinu významnosti α (implicitně nastaveno na hodnotu 0,05), zadáme nulovouhypotézu H a vybereme jednu ze tří nabízených alternativních hypotéz A.

Jako výstup obdržíme hodnotu testového kritéria, kritickou hodnotu, p-hodnotua slovní odpověď (H se nezamítá, nebo H se zamítá A se přijímá). Testy je možnétaké počítat zadáním číselných charakteristik (v dolní části listu).

Dvouvýběrové testy

Aplikace STAT1 obsahuje tyto dvouvýběrové testy hypotéz: test shody dvou roz-ptylů nezávislých normálních rozdělení (list „2V – normálníÿ), test shody dvoustředních hodnot nezávislých normálních rozdělení (za předpokladu homoskedas-ticity a heteroskedasticity – list „2V – normálníÿ), test shody dvou středníchhodnot pro velké nezávislé výběry (list „2V – libovolnéÿ), test shody dvou střed-ních hodnot pro závislé výběry (párový test – list „2V – párový testÿ) a testshody dvou parametrů alternativního rozdělení pro velké nezávislé výběry (list1V a 2V – podíly). Testování se provádí podobně jako u jednovýběrových testů,zde je třeba vybrat dva datové soubory.

Page 13: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Testy normality

Základní představu o tvaru rozdělení datového souboru můžeme získat konstrukcíhistogramu, případně polygonu četností (viz intervalové a bodové rozdělení čet-ností). V listu „popisné charakteristikyÿ lze nalézt kromě krabicového diagramui Q-Q plot porovnávající teoretické kvantily normovaného rozdělení N(0,1) s em-pirickými kvantily určených z dat. Leží-li tyto body přibližně na přímce, můžemeusoudit, že zkoumaný náhodný výběr pochází z normálního rozdělení.

Listy „popisné charakteristikyÿ, „bodové rozděleníÿ a „intervalové rozděleníÿobsahují v dolní části testy normality založené na výběrových koeficientech šik-

Page 14: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

mosti a špičatosti.

Výpočet těchto testů zadáním potřebných charakteristik (rozsah, koeficientšikmosti a špičatosti) lze provést v dolní části listu „popisné charakteristikyÿ.

Page 15: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Chí-kvadrát test nezávislosti v kontingenční ta-bulce

List „kontingenční tabulkaÿ je určen pro testování nezávislosti v kontingenčnítabulce užitím tzv. chí-kvadrát testu nezávislosti dvou statistických znaků. Tentotest patří mezi neparametrické metody, to znamená, že nevyžaduje znalost roz-dělení zkoumaných statistických proměnných. Při chí-kvadrát testu nezávislostitestujeme nulovou hypotézu H, že sledované znaky jsou nezávislé, proti alterna-tivní hypotéze A, která je naopak hypotézou o jejich závislosti. Uživatel doplnípoze hodnoty absolutních četností do připravené kontingenční tabulky a zvolíhladinu významnosti testu α (implicitně nastaveno na hodnotu 0,05).

Page 16: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Statistické tabulky

Poslední list „tabulkyÿ obsahuje hodnoty pravděpodobnostních a distribučníchfunkcí Poissonova, binomického a hypergeometrického rozdělení dále funkce hus-toty pravděpodobnosti, distribuční funkce a kvantily rozdělení rovnoměrného, ex-ponenciálního, normálního a log-normálního (u verze pro MS Office 2003 a 2007- STAT.xls - chybí distribuční funkce hypergeometrického rozdělení a funkce hus-toty pravděpodobnosti log-normálního rozdělení, která nejsou dispozici). Jsou zdeuvedeny i kvantily Pearsonova, Studentova a Fisher-Snedecorova rozdělení.

Page 17: StatistickØ zpracovÆní dat v aplikaci STAT1 - k101.unob.czneubauer/pdf/STAT1.pdf · VýpoŁet tìchto testø zadÆním potłebných charakteristik (rozsah, koe cient „ikmosti

Použité zdroje

• Anděl, J. Základy matematické statistiky. 1. vyd. Praha: Matfyzpress, 2005.ISBN 80-86732-40-1.

• Budíková, M., M. Králová a B. MAROŠ. Průvodce základními statistickýmimetodami. 1. vyd. Praha: Grada, 2010. ISBN 978-80-247-3243-5.

• Chajdiak, J. Štatistika v Exceli 2007. 1. vyd. Bratislava: Statis, 2009. ISBN978-80-85659-49-8.

• Neubauer, J., Sedlačík, M. a O. Kříž Základy statistiky: Aplikace v technic-kých a ekonomických oborech. Praha: Grada, 2012. ISBN 978-80-247-4273-1.

• Schels, I. Excel 2007 – vzorce a funkce. 1. vyd. Praha: Grada, 2008. ISBN978-80-247-2074-6.

15


Recommended