4ST201 STATISTIKA 2. cvičení 4.8tomaskarel.cz/vse/4ST201/prezentace/cv_3_karel_web.pdf · A =...

Post on 24-Nov-2020

3 views 0 download

transcript

Tomáš Karel

LS 2012/2013

Doplňkový materiál ke cvičení z předmětu 4ST201.

Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji.

Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo

zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!

15.10.2013 Tomáš Karel - 4ST201 2

cv. Program cvičení

1. Úvod, popisná statistika

2. Popisná statistika

3. Míry variability, pravděpodobnost

4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky

5. Pravděpodobnostní rozdělení

6. TEST, odhady parametrů

7. Testování hypotéz

8. Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA

9. Regrese

10. Regrese, korelace

11. TEST, časové řady (bazické a řetězové indexy)

12. Časové řady

13. Indexní analýza

Absolutní ◦ Rozptyl – kvadratická odchylka od průměru

(Klasický) rozptyl – známe všechny hodnoty všech jednotek (v každém městě je pouze 10 obyvatel)

Výběrový rozptyl – známe pouze některé hodnoty ze souboru

(v každém městě je víc jak 10 obyvatel)

◦ Směrodatná odchylka – je druhá odmocnina z rozptylu

◦ Variační rozpětí - nejvyšší hodnota mínus nejnižší

Relativní ◦ Variační koeficient – směrodatná odchylka dělená průměrem

n2 2

x i

i 1

1s (x x)

n

n2 2

x i

i 1

1s (x x)

n 1

x xs nebo s´

max minR x x

x xx x

s sV ,nebo V´

x x

Máme informace o • skupinových četnostech • skupinových průměrech • skupinových rozptylech

Celkový průměr Celkový rozptyl

in

ix

ix

2s

k

i i

i 1

k

i

i 1

n x

x

n

2 2 2

x xs s s

k2

i i2 i 1x k

i

i 1

(x x) n

s

n

k

ix i2 i 1

k

i

i 1

s n

s

n

Meziskupinová variabilita

Vnitroskupinová variabilita

Pokud místo skupinových absolutních četností ni máme k dispozici skupinové relativní četnosti pi, používáme pro výpočet celkového rozptylu místo vzorce

vzorec

Výpočet rozptylu z variačního koeficientu a průměru

resp. sm. odchylky z variačního koeficintu a průměru

k k2 2 2 2

x i i ix i

i 1 i 1

s (x x) p s p

k k2

i i ix i2 i 1 i 1x k k

i i

i 1 i 1

(x x) n s n

s

n n

2 2

x xs (V x)

x xs V x

Obchodní řetězec odebírá určitý výrobek, jehož cena v průběhu roku sezónně kolísá, od dvou stálých dodavatelů (A a B). Průměrná cena za celý rok od dodavatele A je 9 CZK, její směrodatná odchylka činí 2 CZK, od dodavatele A se nakoupilo 1000 kusů. U dodavatele B činí průměrná cena 10 CZK při směrodatné odchylce 1 CZK, nákup od dodavatele B byl 4000 kusů. Určete a.) variační koeficient vyjadřující variabilitu kolísání nákupní ceny během roku souhrnně za oba dva dodavatele dohromady. b.) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.

Výrobce A 9 1 000 22=4

Výrobce B 10 4 000 12=1

ix in 2

ixs

1 1 2 2

1 2

n x n x 1000 9 4000 10x 9,8

n n 5000

Celkový průměr: Meziskupinová variabilita: Vnitroskupinová variabilita: Celkový rozptyl: Variační koeficient:

k2

2 2i i2 i 1x k

i

i 1

(x x) n(9 9,8) 1000 (10 9,8) 4000 640 160 8

s1000 4000 5000 50

n

k

2

2 2ix i2 i 1

k

i

i 1

s n2 1000 1 4000 8

s5000 5

n

2 2 2

x meziskup. vnitroskup. x

8 8 88s s s s s 1,76

50 5 50

xx

s 1,76V 0,135

x 9,8

2 2

x

8 8protože je s s

5 50

B) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.

Vnitroskupinová variabilita je větší, než meziskupinová => Sezónní kolísání cen je důležitější

Soubor o 6 hodnotách má průměr 12 a rozptyl 4,667.

Jak se změní průměr a rozptyl souboru, pokud do souboru přibude hodnota 15?

starý

2

x starý

starý

nový

672 22ii

i 12 2 2i 1x nový nový

2 22

x 12

s 4,667

6 x 15 6 12 15x 12,43

7 7

x 15x

s x 12,437 7

6 (4,667 12 ) 1512,43 5,07

7

Náhodný pokus

pokus, jehož výsledek se i při dodržení podmínek mění, tj. jehož výsledek závisí na

náhodě (např. hod kostkou).

Náhodný jev

výsledek náhodného pokusu (např. na kostce padla šestka). Náhodný jev budeme

značit většinou velkými písmeny, např. A, B atd. Pravděpodobnost náhodného jevu A budeme označovat jako P(A).

Jev jistý (označíme např. jako nebo E) Jev, jež nastane vždy, tj. při každém opakování náhod. pokusu (např. na kostce

padne nějaké číslo z 1, 2, 3, 4, 5, 6), P( ) =1

Jev nemožný (označíme jako Ø) Jev, jež nikdy nenastane (např. na kostce padne číslo 7), P(Ø ) = 0

Elementární jev

nelze vyjádřit jako sjednocení (viz. další slide) dvou jevů, jež jsou různé od tohoto

jevu.

Doplňkový (opačný) jev k jevu A (označíme ) Jev jež nastane právě, když nenastane jev A, P( ) = 1 - P( A )

A

A

Jednou hodíme klasickou hrací kostkou. Znázorněte pomocí Vennových diagramů následující jevy:

a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí

sudého počtu teček

b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí

sudého počtu teček dělitelných třemi

c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená

padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček

d) jev D spočívající v padnutí více než šesti teček

(jev jistý značíme E a jev nemožný Ø)

a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého

počtu teček

b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého

počtu teček dělitelných třemi

c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí

sudého počtu teček a jev B padnutí pěti nebo šesti teček

d) jev D spočívající v padnutí více než šesti teček

KLASICKÁ DEFINICE PRAVDĚPODOBNOSTI

◦ říká, že pravděpodobnost nějakého jevu je rovna podílu počtu výsledků, jež jsou danému jevu příznivé, ku celkovému (konečnému) počtu výsledků, jež jsou apriori stejně pravděpodobné.

STATISTICKÁ DEFINICE PRAVDĚPODOBNOSTI

◦ říká, že pravděpodobnost nějakého jevu je relativní četností výskytu tohoto jevu v souboru o velké velikosti (v limitě blížící se k nekonečnu).

Příklad nezávislých jevů při hodu dvěma kostkami:

A = na první kostce padne 1, B = na druhé kostce padne 1.

Příklad závislých jevů při hodu dvěma kostkami:

A = na první kostce padne 1, B = součet na obou kostkách bude 10.

Jev je jevem nemožným (nemůže na první kostce padnou 1 a zároveň být součet 10), proto:

)()()( BPAPBAP

36

1

6

1

6

1)()()( BPAPBAP

36

3

6

1)()()(0 BPAPBAP

plocha průniku je při součtu

P(A)+P(B) započítána 2x,

proto jí musíme 1x odečíst

pokud jevy A a B nemají průnik,

nazýváme je neslučitelné (disjunktní)

pokud jevy A a B jsou neslučitelné, přechází pravidlo o sčítání PP. na:

)()()()( BAPBPAPBAP

)()()( BPAPBAP

Příklad neslučitelných jevů při hodu jednou kostkou:

A = padne liché číslo

B = padne sudé číslo

Příklad jevů, které nejsou neslučitelné při hodu jednou kostkou:

A = padne některé z čísel

1, 2, 3 nebo 4

B = padne 4, 5 nebo 6

3 3P(A B) P(A) P(B) 1

6 6

4 3 1P(A B) P(A) P(B) P(A B) 1

6 6 6

Jaká je pravděpodobnost, že při hodu dvěma kostkami padne:

a) na obou kostkách šestka

b) alespoň jedna šestka

c) právě jedna šestka

d) žádná šestka

e) na obou kostkách sudé číslo

Jev A . . . padla šestka na první kostce Jev B . . . padla šestka na druhé kostce Jev C . . . padlo sudé číslo na první kostce

Jev D . . . padlo sudé číslo na druhé kostce

Z publikací Českého statistického úřadu byl převzat počet narozených chlapců a děvčat v letech 1990 – 1997. Vypočítejte přibližnou pravděpodobnost, že narozené dítě bude chlapec a přibližnou pravděpodobnost, že narozené dítě bude děvče.

Absolutní četnosti

Rok Chlapci Děvčata Celkem

1990 67 234 63 860 131 094

1991 66 895 62 955 129 850

1992 62 946 59 196 122 142

1993 62 362 59 108 121 470

1994 54 887 52 028 106 915

1995 49 570 46 827 96 397

1996 46 605 44 158 90 763

1997 46 705 44 225 90 930

Celkem 457 204 432 357 889 561

P(chlapec) 457 204P(chlapec) 0,514

P(celkem) 889 561

P(dívka) 432 357P(dívka) 0,486

P(celkem) 889 561

Na viděnou na příštím cvičení.

Pokud jste něčemu nerozuměli, nebo Vám je něco nejasné,

zastavte se v konzultačních hodinách nebo mi pošlete e-mail. Rád Vám nejasnosti vysvětlím.

Email: tomas.karel@vse.cz