+ All Categories
Home > Documents > Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické...

Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické...

Date post: 26-Jun-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
28
Statistika verze 1.0 - 1 - Jiří Sitta © 2004 Obsah Obsah.......................................................................................................................................... 1 1. Význam pojmu STATISTIKA ............................................................................................... 2 2. Kombinatorika........................................................................................................................ 4 3. Statistická jednotka, soubor, znak, data a ukazatele............................................................... 5 4. Úvod do pravděpodobnosti .................................................................................................... 7 5. Objektivní, subjektivní, podmíněná pravděpodobnost a nezávislé jevy ................................ 9 6. Úplná pravděpodobnost........................................................................................................ 11 7. Tříděčíselných znaků ....................................................................................................... 13 8. Klasifikace charakteristik podle jejich významu, kontingenční tabulka .............................. 15 9. Náhodné veličiny.................................................................................................................. 17 10. Metody statistické indukce ................................................................................................. 20 11. Statistické srovnávání ekonomických jevů ........................................................................ 22 12. Indexy ................................................................................................................................. 26 Tyto podklady slouží pouze pro přípravu ke zkoušce z předmětu STATISTIKA. Kapitoly se shodují s jednotlivými okruhy otázek. Některé otázky chybějí nebo se s jinými překrývají. Veškerý zde uvedený text je převzat z přednášek a cvičení a není určen pro komerční účely.
Transcript
Page 1: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 1 - Jiří Sitta © 2004

Obsah Obsah.......................................................................................................................................... 1 1. Význam pojmu STATISTIKA............................................................................................... 2 2. Kombinatorika........................................................................................................................ 4 3. Statistická jednotka, soubor, znak, data a ukazatele............................................................... 5 4. Úvod do pravděpodobnosti .................................................................................................... 7 5. Objektivní, subjektivní, podmíněná pravděpodobnost a nezávislé jevy ................................ 9 6. Úplná pravděpodobnost........................................................................................................ 11 7. Třídění číselných znaků ....................................................................................................... 13 8. Klasifikace charakteristik podle jejich významu, kontingenční tabulka.............................. 15 9. Náhodné veličiny.................................................................................................................. 17 10. Metody statistické indukce................................................................................................. 20 11. Statistické srovnávání ekonomických jevů ........................................................................ 22 12. Indexy................................................................................................................................. 26

Tyto podklady slouží pouze pro přípravu ke zkoušce z předmětu STATISTIKA. Kapitoly se shodují s jednotlivými okruhy otázek. Některé otázky chybějí nebo se s jinými překrývají. Veškerý zde uvedený text

je převzat z přednášek a cvičení a není určen pro komerční účely.

Page 2: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 2 - Jiří Sitta © 2004

1. Význam pojmu STATISTIKA

Význam pojmu statistika • praktická činnost - statistika administrativy

o statistika evidence (sběr údajů, evidence, sumarizace) o instituce, která tuto evidenci provádí (ČSÚ, ministerstva) o souhrn údajů o nějaké skutečnosti (statistika nezaměstnanosti aj.)

• vědní disciplína – teorie statistiky

- Popisná statistika - Matematická statistika (cílem je výsledky zobecnit, používá počtu pravděpodobností) - Teorie výběrových zjišťování - Aplikované vědy - Vědy se silným statistickým základem (sociologie, psychologie aj.).

Statistika

1. je nástrojem poznání. Informace, které poskytuje nám umožní vytvořit si obraz o skutečnosti. Poznání podněcuje poznání příčin, které vedou k určité úrovně sledovaného jevu.

2. je nástrojem rozhodování. Poznání je předpokladem k vytváření závěrů a přijímání rozhodnutí.

Statistika znamená

1. údaje, data 2. činnosti spočívající v získávání statistických dat 3. věda zkoumající statistické zákonitosti jevů

Název je odvozen z latinského STATUS = STÁT. Původně se označovala věda

zabývající se počtem obyvatel, kolik se prodalo => popis státu (hospodářství, politika a zeměpisný stav státu).

- Starověk: císař Augus, Vilém dobyvatel - Thomas Cromwel – zaznamenávání o narození a úmrtí v církevních matrikách - Sir William Petty – spojil hospodářské vědy a matematiku. Zakladatel vědecké

statistiky v 16. století. Matematici

Pascard, Laplas, Plason, Gaus (gausovy křivky), Adolf Phejackues Quetelet – belgičan, výzkumy na lidech, spojení statistických souhrnů, třídění, porovnávání o určitých hromadných jevech.

Co je typické pro statistiku - zkoumá hromadné jevy (jev, který se vyskytuje mnohokrát) - zabývá se proměnlivými (variabilními) vlastnostmi - pracuje s čísly a vyjadřuje se pomocí čísel (zajímá se o kvantitativní stránku reality) - používá výpočetní techniku k vytváření a správě databází k provádění hromadného

zpracování a analýzy.

Page 3: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 3 - Jiří Sitta © 2004

Co „umí“ a „neumí“ statistika • UMÍ

o Řeší různé úlohy různého stupně složitosti, počínaje zjišťováním (počet domácností v ČR) přes popis struktury (věk aj.), shrnování dílčích ukazatelů v čase a prostoru (výpočet průměrných ukazatelů cenové hladiny aj.) srovnávání takto agregovaných ukazatelů v čase a prostoru, předvídání dalšího vývoje, a měření závislosti.

• NEUMÍ o Selhává pokud nemá adekvátní číselné údaje. Chybí-li představa o velikosti

chyb měření a vlivu určitých doprovodných činitelů. Nemá-li k dispozici dostatečně veliký soubor příkladů a dostatečnou variabilitu.

Etapy statistické činnosti 1. Zjišťování – shromažďuje a zaznamenává a kontroluje údaje 2. Zpracování – uspořádání, shrnování, sumarizace a seskupení 3. Analýza – výpočet charakteristik (rozpětí), měření závislosti, srovnávání a měření

dynamiky. 4. Prezentace výsledků – tabulkové, grafické a slovní vyjádření výsledků

předcházejících etap.

Rámcové informace o statistickém zjišťování Klasifikace:

1. podle zdroje a. primární (základní) b. sekundární (upravené)

2. podle reálnosti a. skutečné b. simulované

3. podle peridiocity zjišťování a. průběžné b. periodické c. jednorázové

4. podle časového hlediska a. okamžikové b. intervalové (větší rozsah)

Základy metody zjišťování 1) Podle úplnosti zjišťování dělíme na úplné a neúplné. Výběrové jsou

reprezentativní a ostatní jsou nereprezentativní. Spolehlivou metodou je pravděpodobnostní výběr (náhodný výběr).

2) Podle stupně kontroly podmínek při zjišťování dělíme na prosté pozorování a na řízený experiment. V oblasti sociálně ekonomických jevů je metoda pozorování prosté pozorování.

Page 4: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 4 - Jiří Sitta © 2004

2. Kombinatorika

Kombinace bez opakování - Nezáleží na pořadí prvků. - Kombinace k-té třídy z n prvků je k prvková podmnožina n prvkové množiny. Platí

zde neuspořádaný výběr.

- Označujeme ji: )!(!

!)(knk

nkn

nCk −=⎟⎟

⎞⎜⎜⎝

⎛=

Variace bez opakování - Záleží na pořadí prvků, uspořádaný výběr - Variace k-té třídy z n prvků je uspořádaná k-tá podmnožina n prvkové množiny

- Označujeme ji: )!(

!)(kn

nnVk −=

Permutace bez opakování - Permutace n prvků bez opakování je každé uspořádání n-prvkové množiny - Počet permutací: P(n) = n!

Kombinace s opakováním - Kombinace k-té třídy z n prvků s opakováním je k-prvková skupina prvků vybraných

z n-prvkové základní množiny tak, že se kterýkoliv prvek může ve skupině libovolněkrát opakovat.

- Jde o neuspořádaný výběr

- Počet kombinací s opakováním značíme: )!(!

!1)(´

knkn

kkn

nC k −=⎟⎟

⎞⎜⎜⎝

⎛ −+=

Variace s opakováním - Variace k-té třídy z n prvků s opakováním je uspořádaná skupina k prvků vybraných

ze základní množiny tak, že kterýkoliv prvek se může ve skupině libovolněkrát opakovat.

- Záleží na pořadí prvků - Značíme: k

k nnV =)(´

Permutace s opakováním - k = k1; k2; k3 … kn prvků s opakováním je každé uspořádání skupiny k prvků v níž je

všech n prvků základní množiny

- Značíme: !!...2!1

!)(´ ...2,1 knkkkkP knkk =

Page 5: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 5 - Jiří Sitta © 2004

3. Statistická jednotka, soubor, znak, data a ukazatele Statistická jednotka

- nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné povahy:

o lidé, jako jedinci v různých rolích (zákazníci, voliči aj.) o organismy a jejich skupiny (zvířata, rostliny aj.) o neživé přírodní předměty o hmotné výsledky lidské činnosti

- právně, politicky či jinak smluvně vymezené části společenského prostoru (ekonomické subjekty, hospodářské odvětví, státy, kraje)

- nehmotné výsledky lidské činnosti (sportovní či umělecké výkony) - živelné a jiné události (požáry, narození, smrt, tornáda, úrazy apod.) - neopakovatelné vzorky ze spojitého prostředí (vzorky atmosféry, vody aj.)

Příbuzné jevy

• zpravodajské jednotky – statistické jednotky, které mají ze zákona zpravodajskou povinnost vůči orgánům státní statistické služby

• výběrové jednotky – při výběrovém způsobu zjišťování mohou být vybírány buď statistické jednotky nebo jejich přesně definované skupiny -> výběrové jednotky.

Statistický soubor - množina statistických jednotek, které společně tvoří určitý jev (domácnosti ČR, obce

jednoho kraje aj.) - dva atributy statistického souboru:

o kvalita: (obsah, identifikace, vymezení) -> CO? KDE? KDY?. Explicitní vymezení (seznam jednotek) a implicitní vymezení (vlastnosti jednotek).

o kvantita: (počet, množství, rozsah) -> KOLIK? Rozsah statistického souboru - v popisné statistice značíme „n“ bez další specifikace - v induktivní statistice rozdělujeme základní („N“) a výběrový („n“) soubor

Statistický znak Znaky = zkoumané vlastnosti statistických jednotek Klasifikace statistického znaku (základní klasifikace):

• znaky identifikační o z věcného, časového a prostorového hlediska. Identifikují statistickou

jednotku, rozhodují o zařazení či nezařazení do souboru. Nejsou předmětem analýzy (jednotky se v nich shodují).

• znaky variabilní o rozhodují o způsobu a výsledku zpracování a analýzy. Klasifikace variabilních

znaků:

Page 6: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 6 - Jiří Sitta © 2004

znaky číselné: • znaky měřitelné (kardinální) – hmotnost, počet obyvatel;

intervalové, poměrové • znaky pořadové (ordinální) – školská klasifikace, datum

znaky slovní (nominální – kvalitativní) • znaky alternativní (dvojné, binární, dichotomické – např. kuřák,

nekuřák, slovní rozhodnutí) • znaky možné (více kategoriální např. rodinný stav)

Měřitelné znaky dále klasifikujeme na:

• spojité (reálná čísla) např. časové údaje, rozměry, příjmy, výdaje aj. • diskrétní (nespojité, izolované hodnoty) často celočíselné, nezáporné (počet dětí,

pracovníků ve firmě apod.) Symbolika a terminologie

• číselný znak – velká písmena z konce abecedy (X, Y, Z) hodnoty znaku písmena malá (x, y. z).

• slovní znak – velká písmena ze začátku abecedy (A, B, C) obměny znaku písmena malá (a, b, c)

Statistické údaje – data - hodnoty číselného znaku X, které tvoří statistický soubor o rozsahu „n“ označíme jako

x1, x2 … xi … xn. Stručně x,i = 1,2 … n. - obměny slovního znaku A, které tvoří statistický soubor o rozsahu „n“ označíme jako

a1, a2…ai….an, stručně a,i = 1,2 … n.

Statistické ukazatele - charakteristiky - statistický údaj charakterizuje každou statistickou jednotku zvlášť - statistická charakteristika charakterizuje určitou vlastnost statistického souboru jako

celku - např. tyto údaje 3,7,7,7,10,11,14,20,20

o číslo 10 je v tomto souboru uprostřed -> MEDIÁN o číslo 7 je nejčastěji opakující se hodnota -> MODÁLNÍ o číslo 11 je aritmetickým průměrem

- a všechny tyto charakteristiky, každá svým způsobem vypovídají o úrovni statistického souboru

- pro stejné údaje platí: o číslo 17 je rozpětím hodnot znaku o číslo 31,56 je rozptylem o číslo 5,62 je směrodatnou odchylkou o číslo 51,1 % je variačním koeficientem o a všechny tyto charakteristiky (každá svým způsobem) vypovídají o proměnné

variabilitě tohoto datového souboru.

Page 7: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 7 - Jiří Sitta © 2004

4. Úvod do pravděpodobnosti

Nechť je definován komplex podmínek, za kterých je sledovaná možnost nastoupení nějakého jevu (přeměna vody v páru při dané teplotě a tlaku).

a) jev, který za těchto podmínek nemůže nikdy nastat nazveme jevem NEMOŽNÝM (značíme jej „/“)

b) jev, který za těchto podmínek nutně musí nastat se nazývá jev JISTÝ (značíme „V“)

c) jev, který i při striktním dodržení podmínek může, ale nemusí nastat případně nastává s růstnou intenzitou, nazveme jako jev NÁHODNÝ (označujeme velkými písmeny abecedy – A, B, C)

- Náhodný jev nemusí být určen komplexem podmínek, ale o tom jestli jev nastane

nebo ne, rozhoduje náhoda. Každý takový děj nazýváme náhodný experiment (např. házení kostkou).

- Skončí-li náhodný experiment nastoupením nějakého náhodného jevu A, říkáme, že nastal příznivý případ pro jev A. V opačném případě nastal nepříznivý případ pro jev A.

- Můžeme mít jev: o ELEMENTÁRNÍ o SLOŽENÝ

- Jev A budeme nazývat elementárním, jestliže pro něj neexistují jevy B, C různé od A, takové, že A = B U C (B sjednocení C)

- Elementární jev je nejjednodušší výsledek náhodného pokusu, který nelze rozložit. Elementárním jevem při házením kostkou je jev padne-li číslo 3.

- Složený jev může být, pokud padne sudé číslo při hodu kostkou. Složený jev je množina všech elementárních jevů, které mohou nastat jako výsledek daného náhodného pokusu. Libovolný náhodný jev je potom podmnožinou prostoru libovolných elementárních jevů a značíme ho „U“.

Vztahy mezi jevy PRŮNIK JEVŮ A,B:

- dva jevy A, B se částečně překrývají - např. A: 2,3,4 B: padne sudé číslo => A∩B = 2,4

SJEDNOCENÍ JEVŮ A,B:

- jestliže nastane jev A neb jev B - např. A: 2,3,4 B: sudé číslo => AUB = 2,3,4,6 - disjunktní jevy jsou takové, které nemají spolu žádný společný výsledek …. A∩B = Ø

ROVNOST JEVŮ A,B: PODMNOŽINA:

- jeden jev je obsažen v jevu druhém. Jev A je podjevem jevu B - značíme: A ⊂ B - např. A: 2 B: sudá čísla => A ⊂ B = 2

Page 8: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 8 - Jiří Sitta © 2004

OPAČNÝ JEV - je tzv. doplňkovým jevem a je to jev, který nastane, když nenastane jev A - značíme A

ROZDÍL JEVŮ

- rozdílem jevů A a B je jev, který nastane právě tehdy, nastane-li jev A a nenastane jev B

- značíme A – B

Pravděpodobnosti Jestliže je pokus opakovatelný neomezeně mnohokrát, hovoříme o Objektivní

pravděpodobnosti, pokud se podmínky mnění při každém pokusu, hovoříme o subjektivní pravděpodobnosti. Objektivní pravděpodobnost je založena na četnosti výskytu sledovaného jevu. Zdá se rozumné považovat toto číslo za objektivní míru opakování a nazvat jej pravděpodobností. Pravděpodobnost jevu A je číslo P(A) přiřazené jevu A, které má tu vlastnost, že relativní četnost jevu A se s rostoucím počtem realizací pokusů blíží k číslu P(A). Hodnota pravděpodobnosti je v intervalu <0;1>.

nAn

nmAP )()( ==

m…počet pokusů příznivých pro jev A n…počet všech možností, které se mohou vyskytnout

)()()()( BAPBPAPBAP ∩−+=∪ )(...)()()...( 2121 nn APAPAPAAAP •••=∩∩ ………. předpokládáme že jevy jsou nezávislé

Page 9: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 9 - Jiří Sitta © 2004

5. Objektivní, subjektivní, podmíněná pravděpodobnost a nezávislé jevy

Objektivní pravděpodobnost Je založena na četnosti výskytu sledovaného jevu. Pravděpodobnost jevu A je tedy

v tomto případě P(A) přiřazené jevu A, která má tu vlastnost, že relativní četnost jevu A se s rostoucím počtem realizací pokusí blíží číslu P(A).

Subjektivní pravděpodobnost Je pravděpodobnost, kterou přiřazujeme výsledku pokusu, jež není za stejných

podmínek opakovatelný (HDP v ČR v letošním roce je pokus sledovatelný jen jednou)

Pro oba typy pravděpodobností platí stejné zákona a pravidla jimiž se nyní budeme zabývat. Platí 3 axiomy: AXIOM 1.:

- Pravděpodobnost náhodného jevu je nezáporné číslo nejvýše rovné jedné. - 0 ≤ P(A) ≤ 1

AXIOM 2.:

- je-li A1, A2, A3 … konečný nebo spočetný disjunktní systém náhodných jevů, pak pravděpodobnost je sjednocení An. A je rovna součtu pravděpodobností.

- A1 ∩ A2 = Ø pro všechna i ≠ j => P(Ui Ai) = ∑i

iAP )(

AXIOM 3.:

- pravděpodobnost jevu jistého S je rovná jedné - P(S) = 1

Bezprostředně z těchto tří axiomů vyplývají další VLASTNOSTI pravděpodobnosti:

• z axiomu 3 dostáváme pro jev A a jeho doplněk 1)()()()( ==+=∪ SPAPAPAAP

Podmíněná pravděpodobnost Často se setkáme s podmínkou pravděpodobností => jedná se o pravděpodobnost jevu,

že nastal určitý jev jiný (n-krát realizujeme nějaký náhodný pokus a uvažujeme dvě množiny A a B v příslušném prostoru elementárních jevů, tj. dva jevy souvisejí s tímto pokusem. Vybereme z posloupností realizací pokusy jen ty realizace, při kterých nastal jev B. pak nás zajímá kolikrát za takové podmínky nastal i jev A.). Vztahy pro výpočet podmíněné pravděpodobnosti

)()()/(

APBAPABP ∩

= kde P(A) ≠ 0

)()()/(

BPABPBAP ∩

= kde P(B) ≠ 0

Page 10: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 10 - Jiří Sitta © 2004

Bayesova věta

)()()/()/(

BPAPABPBAP •

=

Nezávislé jevy • Jevy A a B nazýváme nezávislé navzájem, jestliže platí:

)()()( BPAPABP •=∩ • Jevy A a B jsou tedy nezávislé, jestliže pravděpodobnost průniku těchto dvou jevů je

rovna součinu pravděpodobností jednotlivých jevů • Příkladem nezávislých jevů je házení kostkou. Jestliže v prvním hodu hodíme

jedničku, nijak to neovlivní pravděpodobnost, že jednička padne také ve druhém hodu.

• )(

)()/(BP

BAPABP •=

Značení pravděpodobnosti • bodový graf • sloupcový graf • čárový graf

Bernuliho vzorec Uvažujeme pokus, jehož výsledkem může být jev A s pravděpodobností B a

opakujeme-li tento pokus n-krát, přičemž výsledky jsou na sobě nezávislé a jev A nastal k-krát, pak pravděpodobnost vypočítáme pomocí bernuliho vzorce.

knk ppkn

AP −−••⎟⎟⎠

⎞⎜⎜⎝

⎛= )1()(

p … pravděpodobnost, že nastane jev A pk … pravděpodobnost, že jev A nastal k-krát

⎟⎟⎠

⎞⎜⎜⎝

⎛kn

… vyčísluje všechny možnosti jak se v n pokusech může jev A objěvit právě k-krát

Page 11: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 11 - Jiří Sitta © 2004

6. Úplná pravděpodobnost Úplná pravděpodobnost jevu A. Pravděpodobnost jevu A bez ohledu na jev B, tj.

výsledek jevu B neznáme nebo neuvažujeme jej. )()/()()/()( BPBAPBPBAPAP •+•=

)( BAP ∩ )( BAP ∩

Příklad: U konkursu na místo obchodního zástupce firmy má vysokoškolák 60% šanci na

přijetí, středoškolák 20%. Mezi zájemci o místo je 40 % vysokoškoláků a 60 % středoškoláků. Jakou šanci má náhodně vybraný zájemce, pokud neznáme jeho vzdělání? Jev B … vysokoškolák (VŠ) … 0,4 Jev A … byl přijat Jev B … středoškolák (SŠ) … 0,2 P(A) = P(A/VŠ) * P(VŠ) + P(A/SŠ) * P(SŠ) P(A) = 0,6 * 0,4 + 0,2 * 0,6 = 0,36 Náhodně vybraný zájemce má 36% šanci na přijetí. Pokračování: Uchazeč byl přijat. S jakou pravděpodobností měl vysokoškolské vzdělání?

66,036,0

4,06,0)(

)()/()(

)()/( =•

=•

=∩

=AP

VŠPVŠAPAP

AVŠPAVŠP

Uchazeč o místo byl odmítnut. S jakou pravděpodobností to byl středoškolák?

75,064,0

6,08,0)(

)()/()(

)()/( =•

=•

=∩

=AP

SŠPSŠAPAP

ASŠPASŠP

Rozhodovací strom

Page 12: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 12 - Jiří Sitta © 2004

Rozhodovací strom – obrácený

Opakované pokusy Nezávislé opakované pokusy:

Nechť posloupnost nastoupení jevu A v jediném pokuse je rovna P(A) = p a sledujeme pravděpodobnost jeho nastoupení postupně ve dvou, třech atd. nezávislých opakovaných pokusech.

Jsou-li výskyty jevu A skutečně nezávislé,můžeme např. pro dva pokusy, které mohou

končit možnými čtyřmi výsledky AA , AA , AA , AA , určit pravděpodobnosti jednotlivých výsledků jako p2, p(1-p), (1-p)*p, (1-p)2. Nebudeme-li rozlišovat pořadí, v jakém jevy nastaly, můžeme místo prostředních dvou výrazů napsat 2p(1-p). Podobně pro tři a více pokusů.

Uskutečníme-li n pokusů a ptáme se jaká je pravděpodobnost, že jev A nastal právě

x-krát bez ohledu na pořadí, můžeme tuto pravděpodobnost vyjádřit jako: Bernoulliův binomický vzorec

xnxxn pp

xn

AP −−••⎟⎟⎠

⎞⎜⎜⎝

⎛= )1()(,

Page 13: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 13 - Jiří Sitta © 2004

7. Třídění číselných znaků Číselný znak obecně vykazuje několik málo (obecně k) hodnot. Třídíme podle každé

hodnoty znaku. Hodnoty znaku v tabulce uvedeme ve vzestupném pořadí. Ke každé hodnotě určíme počet výskytů v souboru => četnost. Příklad:

P.č. xi ni 1 1 4 2 2 3 3 3 5

Součet x 12

Třídění číselných znaků – Skupinové třídění Spojitý číselný znak vykazuje velké množství vzájemně od sebe různých hodnot. Třídíme v rámci uměle vytvořených skupin (tříd, intervalů). Zásady:

- třídy s konstantní šířkou - počet tříd koresponduje s rozsahem souboru a je v rozsahu rozmezí od 6 do 15 - šířku, hranice a středy tříd volíme s ohledem na maximální přehlednost - nesporné vymezení hranic tříd - první a poslední třída mohou být otevřené, jejich šířka se považuje za h.

Co se rozumí pod pojmem „nesporné vymezení“ - celočíselný znak

do 99 do 100 do 100 100 - 199 101 - 200 100 - 200 200 - … 201 - … 200 - …

nevhodné h = 101 nelze jednoznačně určit střed intervalu

Druhy četnosti

• absolutní četnost – počet hodnot ve třídě – ni platí: ∑=

=k

ii nn

1

• relativní četnost – podíl hodnot ve třídě na rozsahu souboru npp i

i = . Platí ∑=

=k

iip

1

1

• součtová četnost - ∑=

=i

jini nk

1; ∑

=

=i

jipi pk

1. Alternativně opět v % (absolutní nebo

relativní). Počet / podíl hodnot od počátku po danou třídu včetně. Příklad:

Součtová Pořadové číslo

Vymezení intervalu

Střed tříd xi

Absolutní četnost ni

Relativní četnost pi absolutní kni relativní 100kni

1 do 20) 17,5 12 0,15 12 15,0 2 <20 až 25) 22,5 32 0,40 44 55,0 3 <25 až 30) 27,5 20 0,25 64 80,0 4 <30 až 35) 32,5 8 0,10 72 90,0 5 <35 až 40) 37,5 6 0,08 78 98,0 6 <40 a více 42,5 2 0,02 80 100,0

Celkem X X 80 1 X X

Page 14: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 14 - Jiří Sitta © 2004

Grafy skupinového rozdělení četností • histogram absolutní četností • spojnicový graf součtové relativní četnosti v %

Různé typy rozdělení četnosti (typické tvary)

- symetrické modální - levostranné nesouměrné - extrémně pravostranné - rovnoměrné - tvar „U“ - dvouvrcholové

Kvantily Kvantil xp (= p – procentní kvantil) je taková hodnota znaku, pro kterou platí, že nejméně p-procent prvků má hodnotu menší nebo rovnou xp a 100-p prvků je větších nebo rovno xp.

k = (počet pozorování ~ n) * (úroveň kvantilu ~ p) / 100 Kvartily jsou p-kvantily pro p = 25, 50, 75 (x25, x50, x75). Dolní kvartil = x25 Medián = x50 označujeme Při lichém rozsahu souboru je medián jednoduše vždy hodnota konkrétní prostřední číslo statistické jednotky souboru (musí to být uspořádaný soubor podle velikosti). Při sudém rozsahu souboru však medián leží mezi dvěma prostředními statistickými jednotkami, proto z těchto dvou jednotek stanovíme průměr a ten označíme jako medián.

Výpočet kvantilů z hodnot neuspořádaných do tabulky rozdělení četností je velmi jednoduchý. Poněkud složitější je pouze výpočet kvantilů z intervalového rozdělení, kde k odhadu použijeme následující vzorec.

ppp

p ahn

nzx +•

−=

2

1 , kde 5,0100

+•=p

nzp

zp … pořadové číslo jednotky, jejíž hodnota je hledaný kvantil n … počet pozorování (součet všech hodnot) p … relativní četnost nižších hodnot n1 … kumulativní četnost prvků ležících před kvantilovým intervalem n2 … četnost intervalu, v němž leží hledaný kvantil hp … délka kvantilového intervalu ap … hodnota, která tvoří dolní hranice kvantilového intervalu

Modus Modus znaku x značíme x se stříškou. Je to hodnota znaku x s největší absolutní

četností. Jsou-li takové hodnoty se stejnou největší četností dvě (tři,…) hovoříme o rozložení dat na bi- (tri-,…) modálním.

Page 15: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 15 - Jiří Sitta © 2004

8. Klasifikace charakteristik podle jejich významu, kontingenční tabulka Charakteristika:

- polohy - variability - šikmosti - špičatosti

Míra úrovně (polohy) - Patří se průměry (aritmetický, geometrický, harmonický atd.)

- Aritmetický průměr: n

x

nxxxx

n

in∑==

+++= 1

121 ...

- Jsou-li zjištěné hodnoty uspořádané do tabulky rozdělení četnosti, používáme pro výpočet vážený aritmetický průměr.

- Vážený aritmetický průměr: ∑

=

==++++++

= k

ii

k

iii

k

kk

n

nx

nnnnxnxnxx

1

1

21

2211

......

- Do míry polohy patří také kvantily a modus.

Míra variability - míru absolutní variability (proměnlivosti) počítáme zde variační rozpětí

R = Xmax - Xmin

- míra relativní variability (proměnlivosti): počítáme variační koeficient x

Vxσ

= (sigma

=> směrodatná odchylka)

- rozptyl: n

xxn

ii∑

=

−= 1

2

2)(

σ nebo také 222 xx −=σ

- směrodatná odchylka: 2σσ =

Směrodatná odchylka - je druhou odmocninou rozptylu a vychází z původních měrných jednotkách znaků - 2σσ = - velikost je ovlivněna nejen variabilitou, kterou měří, ale i úrovní zkoumaného

kvantitativního znaku - je absolutní mírou variace

Page 16: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 16 - Jiří Sitta © 2004

Variační koeficient - je relativní mírou variace - počítá se jako podíl směrodatné odchylky a průměru. Tím se získá bezrozměrné číslo.

Pro praktické účely se počítá 100 násobek tohoto čísla a výsledek je udáván v procentech

- 100•=x

Vxσ

- variačním koeficientem lze porovnávat nejen variabilitu stejných znaků se stejnými měrnými jednotkami různých souborů lišících se svou absolutní úrovní, ale i různých znaků s odlišnými měrnými jednotkami.

Šikmost

- charakteristika šikmosti je definována jako 31

31 )(

σα

−=∑=

n

xxn

i

- z kladné (záporné) nodnoty těchto měr se pak usuzuje většinou na kladně (záporně) zešikmené rozdělení a zároveň na větší koncentraci malých (velkých) hodnot ve srovnání s koncentrací velkých (malých) hodnot.

Špičatost

- charakteristika špičatosti je definována jako 3)(

41

41

−•

−=∑=

σβ

n

xxn

i

Dvoustupňové třídění - zkoumáme výskyt a hodnost dvou statistických znaků pocházejících ze stejného

základního X souboru (výška – váha, cena – prodané množství aj.) - pro dvoustupňové třídění se zavádí kontingenční tabulka znaků x a y.

Kontingenční tabulka pro x a y

x y y1 y2 … Celkem x1 n11 n12 … n10 x2 n21 n22 … n20 … … … … … Celkem n01 n02 … n

n12 počet prvků s vlastnostmi x1 a y2 n20 počet prvků s vlastnostmi x2 n počet prvků v souboru n02 počet prvků s vlastnostmi y2 n01; n02; n03 marginální četnosti rozdělení znaku y

Page 17: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 17 - Jiří Sitta © 2004

9. Náhodné veličiny

Náhodná proměnná je zobrazení, které každému elementárnímu jevu ze základního prostoru elementárních jevů přiřadí číslo reálné. Obor hodnot náhodné proměnné je množina všech R čísel, kterých může náhodná proměnná nabývat. Příklad:

Náhodná proměnná X bude počet teček na horní straně hrací kostky. Obor hodnot je D = (1,2,3,4,5,6). Podle oboru hodnot rozlišujeme dva typy náhodných proměnných:

1) diskrétní náhodné proměnné – definiční obor je spočetná množina (konečná nebo nekonečná posloupnost, nebo množina izolovaných bodů) značíme ji DNP

2) spojitá náhodná proměnná – značíme SNP, definiční obor je nespočetná množina (ohraničený nebo neohraničený interval)

Příklad: a) počet automobilů vyrobených za jednu pracovní směnu => DNP b) životnost PC v konkrétní učebně => SNP

Zákon rozdělení (rozložení) pravděpodobnosti náhodné veličiny Je to pravidlo, které každé číselné hodnotě DNP nebo každému intervalu hodnot SNP

přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty nebo hodnoty z tohoto intervalu.

K popisu rozložení se používá distribuční a frekvenční funkce. Distribuční funkce F(x)

náhodné veličiny X je reálná funkce, která každému reálnému číslu X od );( ∞−∞ přiřazuje pravděpodobnost toho, že náhodná proměnná X nabývá hodnot menších než x (malé x; hodnota) F(x) = P(X < x); Rx∈ .

Vlastnosti distribuční funkce (platí pro všechny distribuční funkce)

1) Funkce je neklesající na množině R 2) F(x) je zleva spojitá v každém bodě 3) Limita 0lim )( =

−∞→ xxf

&

4) Limita 1lim )( =+∞→ xx

f&

5) )(0 xf≤ 6) )()()( bxaPaFbF <≤=−

Frekvenční funkce Definuje se různě pro různé typy proměnné. Pravděpodobnostní funkce p(x). U spojité

ji označujeme funkce hustoty a značíme f(x). Pravděpodobnostní funkce p(x) je reálná funkce, která každému reálnému číslu X určí

pravděpodobnost toho, že DNP X nabývá této hodnoty. Zapisujeme ji p(x) = P(X=x).

Page 18: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 18 - Jiří Sitta © 2004

Vlastnosti: 1) p(x) ≥ 0

2) ∑+∞

−∞→

=x

xp 1

x=xi x1 x2 … xn P(xi) p(x1) p(x2) … p(xn)

Znázorňujeme graficky, existují 4 možnosti:

1) bodový diagram 2) úsečkový diagram 3) polygon 4) histogram

- V popisu rozložení DNP můžeme použít i distribuční funkci F(x) hodnotu F(x) určíme

jako souček pravděpodobnostní funkce pxi pro xi < X … ∑<Xxi

ixp )(

- Graf F(x) je stupňovitý, schodovitý

Spojitá náhodná proměnná SNP má nespočetně mnoho hodnot tvořící interval. Nemá význam popisovat rozdělení

pomocí pravděpodobností. Opět použijeme distribuční funkci. Na rozdíl od DNP je tato funkce spojitá v obou krajních bodech.

Funkce hustoty SNP f(x) je dána jako h

hxXxPxfh

)(lim:)(0

+<≤+→

; x∈R

Vlastnosti funkce: 1) 0)( ≥xf

2) ∫+∞

∞−

= 1)( dxxf

Vztahy:

- f(x) = F´(x)

- ∫∞−

=x

dttfxF )()´(

Typy rozložení náhodných proměnných 1) Rovnoměrné rozložení NP: toto rozložení má DNP x jejíž všechny možné hodnoty xi

se vyskytuje se stejnou pravděpodobností. Závisí na parametru n (počet realizací).

Označuje se R(n). Pravděpodobnostní funkce f },...,{;1)( 1 ni xxDn

xp == např.

házení hrací kostkou aj.) 2) Binomické rozložení: toto rozložení má DNP x, která vyjadřuje počet výskytů jevu

„a“ v Bernouliho posloupnosti „n“ nezávislých pokusů. Závisí na dvou parametrech:

Page 19: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 19 - Jiří Sitta © 2004

n – počet pokusů; p – je pravděpodobnost sledovaného jevu „a“ v jednom pokusu. Značíme Bi (n;p). Pravděpodobnostní funkce f

Poissonovo rozložení Toto rozložení má DNP x, která vyjadřuje počet výskytů sledovaných jevů v určitém

časovém intervalu nebo určité oblasti (příklad: počet zákazníků za den, počet chyb v jednom daňovém přiznání). Závisí na jednom parametru λ (lambda) (průměrný počet výskytů sledovaného jevu v daném intervalu).

Značíme: Po(λ ) λλλ ;!

)(i

xi

xexip •= − >0; xi = 0,1,…, n

Nechť v Bernouliho posloupnosti kde +∞→n a pravděpodobnost výskytu v jednom pokusu se blíží nule, pak binomické rozložení lze aproximovat (přiblížit) poisonově rozdělení:

)Po(~);( λpnBi kde np •=λ

Typy rozložení pravděpodobností SNP 1) Rovnoměrné rozložení: toto rozložení má SNP x jejíž realizace vyplňují interval

konečné délky a mají stejnou možnost výskytu (doba čekání na uskutečnění opakujícího se jevu v časových intervalech). Závisí na dvou parametrech „a“ (dolní mez intervalu možných hodnot) a „b“ (horní mez intervalu možných hodnot). Značíme ji: R(a;b). Funkce hustoty potom následovně:

2) Normované normální rozdělení: toto rozložení je speciálním příkladem obecného normálního rozložení, pro 0=µ a 12 =δ . Označujeme Z. funkce hustoty značíme ϕ a distribuční funkci značíme Φ . Značíme N(0;1). Funkce hustoty

),(;21 2

21

)( ∞−∞∈•=•

zez

z πϕ Graf ϕ (z) se nazývá Gausova křivka.

Distribuční funkce: ),(;21 2

21

)( ∞−∞∈•=Φ•

−∞

∞−∫ zdtet

z π

nxppxn

xp ixinxi

i ;...;1;0;)1()( =−••⎟⎟⎠

⎞⎜⎜⎝

⎛= −

bax ;∉

bax ;∈ab

1

0)(xf

Page 20: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 20 - Jiří Sitta © 2004

10. Metody statistické indukce

- Umožňuje vyslovovat závěry o rozložení a vlastnostech souborů o němž nemáme úplnou informaci. Místo toho, abychom pracovali s celým souborem, vybereme z něj poměrně malou část (výběr).

- Základní soubor označujeme ZS a je to soubor, o němž nemáme úplnou informaci, protože je:

o Neukončený (soubor nekonečné řady pokusů) o Konečný, ale velkého rozsahu o Konečný, ale je nemožné nebo nesmyslné jej celý prozkoumat (zjišťování

kvality skladovaných konzerv) - Sledujeme rozsah a značíme ho N. Základní soubor považujeme za popsaný, známe-li

jeho frekvenční funkci náhodné proměnné X. Máme-li X, která má normální rozložení, považujeme ZS za normálně rozložený.

- Charakteristiky se nazývají parametry ZS a jsou to konstanty a označujeme je konkrétně jako 2,δµ atd.

- Náhodný výběr je podmnožinou ZS a rozsah výběru značíme „n“. - Můžeme rozlišovat:

o Výběr s vracením – prvek se může opakovat o Výběr bez vracení – prvek maximálně jednou

- Náhodný výběr rozsahu n je takový výběr, který poskytuje každému prvku ZS stejnou a nezávislou šanci být vybrán. Konkrétní výběr se provádí:

o Losováním o Použitím generátoru náhodných čísel o Systematickým výběrem (u setřízeného ZS se vybere prvek „k“) o Stratifikovaným výběrem, který se používá tam, kde je základní soubor vnitřně

rozdělen do skupin v nichž je rozptyl sledovaného znaku menší než v celém ZS (předvolební průzkum)

Výběrová statistika - Protože ze ZS můžeme provést více výběrů, tak pro každý výběr můžeme vypočítat

základní charakteristiky (střední hodnota, rozptyl). - Pro různé konkrétní výběry můžeme dostat odlišné výsledky. Obecně lze říct, že

charakteristiky náhodného výběru jsou náhodnou proměnnou, které nabývají svých hodnot v závislosti na konkrétním náhodném výběru ze ZS. Hodnoty značíme x1….xn ze ZS. Náhodné proměnné X1….Xn.

- Protože je výběrová statistika náhodnou proměnnou, musí mít své rozložení pravděpodobností (výběrové rozložení)

Výběrová střední hodnota:

Je náhodná proměnná ∑=

=n

xiX

nX

1

1

∑=

−=n

xi XX

nS

1

22 )(1

Page 21: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 21 - Jiří Sitta © 2004

Věty o náhodných výběrech a statistikách 1) Centrální limitní věta: Jsou-li n členné náhodné výběry X1….Xn vybrány z velkého

nebo nekonečného ZS s rozložením jehož střední hodnota je µ a konečný rozptyl je 2δ pak výběrové rozložení výběrové střední hodnoty X konverguje k normálnímu

rozložení se střední hodnotou µ a směrodatnou odchylkou nδ .

2) Věta o jednom výběru: jsou-li X1….Xn , které tvoří n členný náhodný výběr ze

základního souboru se normální rozložením N( ); 2δµ a je-li ∑=

=n

xiX

nX

1

1 a

∑=

−=n

xi XX

nS

1

22 )(1 pak náhodná proměnná může být:

I. 1−•−

= nS

XT µ má Studentovo rozložení T s (n-1) stupni volnosti.

II. nXU •−

=δµ má základní rozložení N(0,1)

III. µ

χ2

2 Sn •= má Pearsonovo rozložení )1(2 −nsχ stupeň volnosti

Nechť X1 až Xn jsou nezávislé náhodné proměnné z nich každá se řídí rozložením

N(0;1), potom náhodná proměnná ∑=

=++=n

iin XXX

1

2221

2 ...χ má Pearsonovo rozložení s µ

stupni volnosti. Značíme ho )(2 nχ a čteme „chý kvadrát volnosti“. Funkce hustoty: Studentovo rozložení se vztahuje na 2 proměnné. Nechť X1 a X2 jsou nezávislé proměnné a nechť X1 se řídí rozložením N(0,1) a X2 rozložení )(2 nχ potom náhodná proměnná

nXXT •=

2

1 má studentovo rozložení s n stupni volnosti. Značíme t(n) a funkce hustoty je

dána 2

21

2

21

1)(2 +

−⎟⎟⎠

⎞⎜⎜⎝

⎛+•

⎟⎠⎞

⎜⎝⎛

⎟⎟⎠

⎞⎜⎜⎝

⎛ −

••

=n

nx

n

n

nxfn π

=)(Xfn

0>x⎟⎟⎠

⎞⎜⎜⎝

⎛•

−+•

22

21

2

2nn

xn

ex

0≤x0

Page 22: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 22 - Jiří Sitta © 2004

11. Statistické srovnávání ekonomických jevů

Ukazatel je specifickou statistickou veličinou popisující určitou ekonomickou skutečnost. Každý ukazatel má tedy svůj věcný obsah a zároveň svoji formálně logickou konstrukci, která ho řadí mezi statistické veličiny.

Statistický ukazatel je statistickou veličinou a předpokládá se, že daný statistický

soubor je obecně, prostorově a časově vymezen (např. ukazatel odpracovaná doba -> tento ukazatel je vymezen jako úhrn doby odpracované pracovníky podniku v měsíci). Jestliže přesně definujeme prostor a čas (březen 2004 podnik A) dostaneme konkrétní hodnotu ukazatele -> údaj. Ukazatel je tedy proměnná veličina a hodnota ukazatele je hodnotou této proměnné veličiny, která vzniká konkrétním vymezením v čase a prostoru.

Dělení ukazatele: 1) Primární a sekundární (druhotné): Primární ukazatelé jsou přímo zjišťované –

neodvozené. Např. odpracovaná doba, počet pracovníků k určitému datu atd. Jedná se o ukazatele, kde lze přímo určit typ charakteristiky statistické jednotky i statistického znaku. Sekundární ukazatelé mohou vznikat třemi způsoby:

a. Jako funkce (rozdíl nebo podíl) různých primárních ukazatelů (např. zisk, doba obratu zásob)

b. Jako funkce různých hodnot téhož primárního ukazatele (časový průměr, ukazatel struktury, hrubý obrat)

c. Jako funkce dvou primárních ukazatelů, kde aspoň u jednoho pracujeme s více hodnotami (spojení předcházejících dvou kroků) (produktivita práce na pracovníka, ziskovost produkce)

• Indexy, absolutní rozdíly a další míry rozdílnosti jsou nástroji srovnávání a nástroji

analýzy výsledků srovnání. • Ukazatelé samy o sobě vypovídají o nějaké skutečnosti, ale nehodnotí ji, zatímco

indexy a absolutní přírůstky měří rozdílnost dvou hodnot téhož ukazatele. • Další členění je na absolutní a relativní.

o Absolutní ukazatelé vyjadřují velikost absolutního jevu bez vztahu k dalšímu jevu. Patří sem všechny primární ukazatelé – vznikající úhrnem, ale i některé ukazatele sekundární (časové průměry a rozdílové ukazatelé – např. zisk).

o Relativní ukazatelé vyjadřují velikost jednoho jevu vzhledem k jinému jevu. Relativní ukazatelé jsou vždy sekundární, neboť vznikají jako podíl absolutních (primárních i sekundárních) ukazatelů. Toto členění je vyčerpávající.

• Další dvojce dělení je na Extenzivní a Intenzitní ukazatele. Nejsou už vyčerpávající. o Extenzivní ukazatelé jsou ukazatelé množství a patří do skupiny absolutních

ukazatelů. o Intenzitní ukazatelé jsou ukazatelé úrovně, nepokrývají však celou skupinu

relativních ukazatelů, ale pouze jen ty, které vyjadřují intenzitu určitého jevu. Toto členění je důležité především při práci s indexy.

• Okamžikové a intervalové ukazatele. Toto členění definuje vlastnost ukazatele a předurčuje způsob jeho shrnování v čase. Jedná se pouze u absolutních ukazatelů.

Page 23: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 23 - Jiří Sitta © 2004

Typické vlastnosti ukazatelů Patří sem stejnorodost, porovnatelnost a shrnovatelnost.

• Stejnorodost statistických ukazatelů je dána povahou statistických jednotek. Kritérium je pak statistický znak, který na daných jednotkách sledujeme. Stejnorodost statistických ukazatelů je relativní. Absolutní ukazatel je stejnorodý tehdy, jestliže má věcný smysl shrnovat jeho dílčí hodnoty součtem. Relativní je stejnorodý jen tehdy, když jsou stejnorodé oba absolutní ukazatelé z nichž se skládá. Pokud toto neplatí je ukazatel nestejnorodý.

• Srovnatelnost statistických ukazatelů je vlastnost, která má vazbu na tvorbu relativních ukazatelů. Za srovnatelné považujeme takové ukazatele, jejíchž srovnáním respektive srovnáním hodnot, získáme smysluplnou veličinu (produktivita práce). Za nesrovnatelné považujeme takové, jejichž srovnání nemá smysl z hlediska srovnání rozdílného druhového, časového nebo prostorového rozdělení.

• Shrnovatelnost vyjadřuje schopnost ukazatele určit jeho celkovou hodnotu na základě jeho dílčích hodnot. Z tohoto hlediska je dělíme na přímo shrnovatelné, nepřímo shrnovatelné a neshrnovatelné ukazatele. Přímo shrnovatelné jsou takové, které můžeme dílčí hodnoty přímo shrnout. Nepřímo shrnovatelné jsou takové, u kterých musíme znát dílčí hodnoty tohoto ukazatele, ale i dílčí hodnoty jiného ukazatele (typické pro všechny relativní ukazatele). Neshrnovatelné nelze určit ani při dílčích znalostech jiných ukazatelů.

Indexy a absolutní rozdíly V praxi nepracujeme s určitými izolovanými hodnotami ukazatele, ale snažíme se

zajistit určitou změnu oproti téže skutečnosti v minulém období či v jiném územní či organizační jednotce. Zajímá nás o kolik je hodnota daného ukazatele v dané situaci vyšší nebo nižší než hodnota ukazatele v jiné situaci.

Chceme-li vědět kolikrát nebo o kolik % je jedna hodnota vyšší nebo nižší než

hodnota jiná, budeme obě hodnoty srovnávat podílem. Pokud o kolik jednotek je jedna vyšší nebo nižší než druhá, srovnáváme rozdílem. Podílem dvou hodnot téhož ukazatele získáme INDEX, obě tyto míry rozdílnosti jsou rovnocenné a vzájemně se doplňují.

Index: je bezrozmezné číslo (podíl dvou hodnot) udávající kolikrát je hodnota čitatele vyšší nebo nižší než jmenovatel.

Absolutní přírůstek udává o kolik měrných jednotek je hodnota menšence vyšší nebo nižší než hodnota menšitele. Časový index je, budeme-li srovnávat zisk podniku ve dvou letech.

Budeme-li srovnávat zisk podniku α se ziskem podniku β v určitém roce, sestrojíme prostorový index.

Budeme-li porovnávat zisk při výrobě výrobku x a y v podniku α v roce 2002, získáme

druhový index.

Page 24: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 24 - Jiří Sitta © 2004

Dělení indexů • množství

o souhrnné o individuální

jednoduché složené

• úrovně o souhrnné o individuální

jednoduché složené

První členění na indexy množství a úrovně je členěním na indexy extenzivních a

intenzitních ukazatelů a vychází z typu ukazatele. Ve druhém stupni dělíme indexy na individuální a souhrnné. Kritériem je stejnorodost či nestejnorodost ukazatele. Individuální indexy jsou indexy stejnorodých (extenzivních i intenzitních). Indexy stejnorodých ukazatelů dále členíme na jednoduché a složené indexy. Jednoduché indexy jsou takové, ve kterých neprovádíme shrnování. Složené indexy jsou indexy stejnorodého intenzitního nebo extenzivního ukazatele, kde shrnujeme dílčí hodnoty sledovaného ukazatele.

Obecně jsou definovány tři ukazatelé. Dva extenzivní označeny q a Q a jeden

intenzitní označený p, pro který platí qQp = . Toto označení vychází ze vztahu mezi cenou,

hodnotou a množstvím.

Jednoduché individuální indexy Jednoduché indexy jsou veličinami, které srovnávají dvě hodnoty téhož ukazatele. Budeme-li srovnávat hodnotu intenzitního ukazatele p v situaci 1 (v časovém období -> i) a

v situaci 0 (v časovém nazývání jako základní období) dostaneme 0

1

ppI p = . Analogicky

potom 0

1

QQIQ = a

0

1

qqIq = . Z těchto vztahů vyplývá pqQ III •= . Odpovídající přírůstky

∆p = p1 – p0; ∆Q = Q1 – Q0 a ∆q = q1 – q0. Individuální jednoduché indexy se často vyskytují sdružené do delších časových řad (období 5 až 10 let). V takovém případě mohou být indexy počítány ke stejnému indexu (nejstarší hodnota) nebo k proměnlivému základu a to tak bezprostředně předcházejícímu časovému údaji. Pokud budeme srovnávat ke stejnému základu => bazické indexy, pokud srovnáváme za sebou jdoucí hodnoty => řetězové indexy.

Gausovo rozložení Toto rozložení je nejdůležitějším rozložením SNP. Řídí jím náhodná proměnná, která

je výsledkem působení mnoha vzájemně nezávislých jevů. Používá se k aproximaci jiných, často složitějších náhodných proměnných a má ¨klíčovou roli při aplikaci mnoha statistických metod.

Page 25: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 25 - Jiří Sitta © 2004

Obecné rozložení závisí na dvou parametrech. Na µ a 2δ . Střední hodnota a rozptyl popisují střed a náhodný rozptyl bodu kolem něho. N(µ ; 2δ )

Funkce hodnoty: ( )∞∞−∈•=⎟⎠⎞

⎜⎝⎛ −−

;;2

1)(2

21

xexfxδµ

πδ

Graf f(x) je Gausova křivka

- křivka má zvonovitý tvar a je souměrná podle křivky x = µ - střední hodnota rozhoduje o vrcholu křivky a δ o rozptýlení křivky

- souřadnice vrcholu ⎥⎦

⎤⎢⎣

⎡• πδ

µ2

1;

- distribuční funkce ∫ ∞−

⎟⎠⎞

⎜⎝⎛ −•

••

=x

x

dxexF δµ

πδ21

21)(

Page 26: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 26 - Jiří Sitta © 2004

12. Indexy Vztahy mezi řetězovými a bazickými indexy

• Postupným násobením řetězových indexů získáme řadu bazických indexů. Součin řady řetězových indexů = bazický index

• Postupným dělením bazických indexů získáme řadu řetězových indexů. Podíl dvou za sebou následujících bazických indexů = řetězový index.

Kruhová zkouška • řetězové indexy lze jakoby „uzavřít“ • součin řetězových indexů vydělený posledním bazickým musí dát 1, pokud nevyjde 1,

pak jsme někde udělali chybu

Růměné tempo růstu • roční tempa růstu měříme pomocí řetězových indexů • průměrné tempo růstu určíme geometrickým průměrem n ročních temp růstu

Složené individuální indexy • jsou to indexy stejnorodého, extenzivního nebo intenzitního ukazatele, které

používáme za situace, kdy hodnoty daného ukazatele jsou členěny na dílčí hodnoty a v rámci výpočtu indexů provádíme shrnování

=

==∑ n

ii

n

ii

Q

QQI

10

11

)( 111 qpQ i = ∑

=

==∑ n

ii

n

ii

q

qqI

10

11

)(

012

3

1

2

0

1 ......qq

qq

qq

qq

qq n

n

n =••−

10

1

0

:−

− =k

kkk

qq

qq

qq

1/......012

3

1

2

0

1 =⎟⎟⎠

⎞⎜⎜⎝

⎛••

− qq

qq

qq

qq

qq n

n

n

n

n

n

qq

qq

qq

qq

12

3

1

2

0

1 ......−

••

Page 27: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 27 - Jiří Sitta © 2004

Index proměnlivého složení • intenzitní ukazatel, který shrnuje průměr

=

=

=

=

=

n

ii

n

ii

n

ii

n

ii

p

q

Q

q

Q

pIpII

10

10

11

11

0

1

Index stálého složení • index s váhou 1 ISS (q1)

• index s váhou 0 ISS (q0)

Index agregátní (souhrnný) • různorodé veličiny na jednom místě nestejnorodé veličiny (různorodé) nelze

průměrkovat, lze je agregovat (shrnovat) • typ agregace vyjádříme ∑ ∑== iiii pqQQ • z toho vytvoříme index – index hodnotový

∑=

i

H

qp

qpI

00

11

∆H = ∑ ∑−= 00 pqpqQ iii

• postupným rozkladem hodnotového indexu můžeme získat dvě varianty indexů

∑∑

∑∑

∑∑ •=

00

10

10

11

00

11

pqpq

pqpq

pqpq

nebo ∑∑

∑∑

∑∑ •=

01

11

00

01

10

11

pqpq

pqpq

pqpq

• index hodnotový jsme rozložili na index objemový a index cenový.

i

ii p

Qq1

11 =

iii qpQ 111 =

=

=

=

=

=

= = n

iii

n

iii

n

ii

n

iii

n

ii

n

iii

qp

qp

q

qp

q

qp

10

111

11

110

11

111

:

=

=

=

=

=

= = n

iii

n

iii

n

i

n

iii

n

ii

n

iii

qp

qp

q

qp

q

qp

100

101

10

100

10

101

:

Page 28: Obsah - Webzdarma.czlisak.webzdarma.cz/downloads/statistika_10a.pdf · - nositel statistické informace, elementární prvek hromadného jevu - reálně existují objekty hmotné

Statistika verze 1.0

- 28 - Jiří Sitta © 2004

Cenové indexy • Cenové indexy mají své názvy:

o Paascheho

∑∑

∑∑

∑∑ ===

0

1

11

11

111

0

11

01

11

pppqpq

pqpp

pqpqpq

I paac

o Laspeyresův

∑∑

∑∑

∑∑ ===

00

000

1

00

10

00

10

qp

pqpp

pqpq

pqpq

I lac

Fisherův index • Hodnoty Laspeyresova a Paascheho SCI dávají při srovnání stejných souborů více či

méně odlišné výsledky. I. Fisher navrhl kompromisní řešení ve formě geometrického průměru těchto dvou indexů

∑∑

∑∑ •=•=

10

11

00

01)()()(qpqp

qpqp

pIpIpI paalaF


Recommended