+ All Categories
Home > Documents > Statistická indukce

Statistická indukce

Date post: 30-Dec-2015
Category:
Upload: joy-daugherty
View: 62 times
Download: 0 times
Share this document with a friend
Description:
Statistická indukce. Teorie odhadu. Intervalový odhad rozptylu ZS Konstrukce intervalu spolehlivosti pro rozptyl závisí na předpokladech: výběr pochází ze ZS s normálním rozdělením, známe parametr , neznáme parametr  (častější případ). - PowerPoint PPT Presentation
22
Statistická indukce Teorie odhadu
Transcript
Page 1: Statistická indukce

Statistická indukce

Teorie odhadu

Page 2: Statistická indukce

Intervalový odhad rozptylu ZSKonstrukce intervalu spolehlivosti pro rozptyl závisí na předpokladech:

výběr pochází ze ZS s normálním rozdělením, známe parametr , neznáme parametr (častější případ).

Konstrukce intervalu spolehlivosti se opírá o veličinu, která má 2 – rozdělení o (n-1) stupních volnosti.

Interval spolehlivosti bude vycházet z veličiny:

.s)1n(

2

2

Tato veličina (ný) má také 2 – rozdělení o (n-1) stupních volnosti.

Page 3: Statistická indukce

Při odvození intervalu spolehlivosti vyjdeme ze vztahu:

Čísla c1 a c2 je možno nalézt v tabulkách kritických hodnot 2 – rozdělení pro (n-1) stupeň volnosti.

Takových čísel by se ovšem mohlo určit nekonečně mnoho.

Uvažují se tedy takové intervaly spolehlivosti, aby byla splněna podmínka:

1cs)1n(

cP 22

2

1

.2

cPcP 22

12

Page 4: Statistická indukce

První část výrazu lze upravit takto:

Z předchozích vztahů tedy vyplývá, že c1 představuje

kritickou hodnotu a c2 kritickou hodnotu .

Úpravou prvního vztahu dostaneme dvoustranný interval spolehlivosti, který vzhledem k hodnotě s2 není symetrický.

2

1cP2

cP1cP 12

12

12

2

21

2

2

1s)1n(s)1n(

P2

)1n(2

1

22

2

)1n(2

2

Page 5: Statistická indukce

Jednostranné intervaly

Levostranný

Pravostranný

1s)1n(

P 22

)1n(

2

1s)1n(

P2

)1n(1

22

Page 6: Statistická indukce

Z intervalů pro rozptyl lze snadno odvodit intervaly spolehlivosti pro směrodatnou odchylku .

Dvoustranný interval

Levostranný interval

11n

s1n

sP2

)1n(2

1

2

1n2

11n

sP2

)1n(

11n

sP2

)1n(1

Pravostranný interval

Page 7: Statistická indukce

Pokud výběrový soubor je velkého rozsahu (n 120),

lze využít toho, že směrodatná odchylka s má přibližně

rozdělení .

Interval spolehlivosti pro směrodatnou odchylku je pak

přibližně určen vztahem:

n2;N

2

1

n2

u1

s

n2

u1

sP

u ke kritická hodnota normovaného normálního rozdělení

Page 8: Statistická indukce

PříkladZ velké zásilky součástek jsme jich náhodným výběrem vybrali 400 a zjistili pro některý jejich rozměr průměr 116 mm a výběrovou směrodatnou odchylku 4,081 mm. Na základě těchto údajů chceme stanovit 95% dvoustranný interval spolehlivosti pro variabilitu tohoto rozměru přejímaných součástek v celé zásilce.

Bodový odhad rozptylu 2 = 16,654561

Bodový odhad směrodatné odchylky = 4,081

Intervalový odhad

požadovaná spolehlivost (1-) = 0,95

Page 9: Statistická indukce

722,452)29(2/05,0

2)1n(2/

047,162)29(2/05,01

2)1n(2/1

95,0047,16

081,4)130(

722,45

081,4)130(P

22

2

95,0097979,30563455,10P 2

95,0097979,30563455,10P

95,0486,5250,3P

Page 10: Statistická indukce

Intervalový odhad parametru p () alternativního rozdělení (intervalový

odhad relativní četnosti ZS)

Jedná se o odhad pravděpodobnosti výskytu určitého jevu, resp. podílu jednotek s určitou vlastností v konečném základním souboru.

Bodovým odhadem je výběrová relativní četnost fi = m/n, kde n je rozsah výběrového souboru a m počet jednotek s určitou vlastností.

Tento výběrový podíl je nestranným odhadem parametru p.

Page 11: Statistická indukce

Při konstrukci intervalu spolehlivosti pro parametr p je nutno rozlišovat, zda pracujeme s malými nebo velkými výběry. Při malých rozsazích vycházíme z toho, že výběrová absolutní četnost m má při výběrech s vracením binomické rozdělení a při výběrech bez vracení rozdělení hypergeometrické.

V praxi obvykle určujeme krajní hodnoty pomocí tabulek (95% intervaly spolehlivosti). Jestliže se jedná o výběrový soubor velkého rozsahu, lze rozdělení výběrové relativní četnosti m/n aproximovat normálním rozdělením se střední hodnotu p a směrodatnou odchylkou .

n

)p1(p

Page 12: Statistická indukce

Normální aproximaci lze použít za předpokladu, že

.p1p

9n

Konstrukce intervalu spolehlivosti pro odhad relativní četnosti ZS je podobná jako u intervalu spolehlivosti pro průměr, tzn. fi .

Vyjdeme ze vztahu:

1u

n)f1(f

pfuP

ii

i

Page 13: Statistická indukce

Po úpravách lze dvoustranný interval zapsat takto:

1

n

)f1(fufp

n

)f1(fufP ii

iii

i

Z uvedeného zápisu lze odvodit intervaly jednostranné, a to interval levostranný

nebo interval pravostranný

1p

n

)f1(fufP ii

2i

.1

n

f1fufpP ii

2i

Page 14: Statistická indukce

V případě výběru bez vracení je potřeba opět rozšířit výpočet přípustné chyby o konečnostní násobitel.

11N

nN

n

f1fufp

1N

nN

n

f1fufP ii

iii

i

1N

nN

n

f1fu ii

Tzn.

Vzorec pro výpočet přípustné chyby lze stejně jako u průměru použít ke stanovení:

vlastního intervalu, požadovaného rozsahu výběru, k výpočtu spolehlivosti odhadu.

Page 15: Statistická indukce

Vypočtené intervaly spolehlivosti jsou intervaly přibližné. Je to především dáno tím, že normálním rozdělením aproximujeme rozdělení diskrétní.

Nejsprávnější proto je použít při nahrazování nějakého diskrétního rozdělení rozdělením spojitým tzv. opravu na spojitost.

Pro výběr s opakováním a opravou na spojitost lze interval spolehlivosti pro parametr p zapsat takto:

1

n

f1fu

n2

1fp

n

f1fu

n2

1fP ii

iii

i

Page 16: Statistická indukce

Při řešení praktických úloh se však obvykle spokojíme s jednodušším výpočtem, protože rozdíly, které vznikají při obou postupech, jsou velmi malé.

Neparametrický odhad mediánu ZSPředpokladem použití tohoto postupu neparametrického odhadu je spojitost náhodné veličiny.

Náhodný výběr uspořádáme do řady vzestupným způsobem podle velikosti (tzv. variační řada).

V tabulce je uvedeno pro rozsah n náhodného výběru takové číslo k, že medián ZS je pokryt intervalem

P (xk M xn-k+1) 1 - .

Page 17: Statistická indukce

PříkladU 100 pojištěných aut bylo zjištěno, že 18 aut je starších než 7 let. Chceme stanovit 95% interval spolehlivosti pro podíl aut starších 7 let v základním souboru.

18,0100

18

n

nf i

i 96,1uu 05,0

%53,70753,0

100

)18,01(18,096,1

n

f1fu ii

95,00753,018,0p0753,018,0P

95,02553,0p1047,0P

Page 18: Statistická indukce

Jak velký výběrový soubor bychom potřebovali v případě, že požadujeme velikost přípustné chyby pouze 5 %?

22781,22605,0

)18,01(18,096,1n

)f1(fun

2

2

2ii

2

Jakou spolehlivost zaručuje výběr 100 respondentů s přípustnou chybou 5 %?

3,182,018,0

10005,0

)f1(f

nu

2

ii

2

P(-1,3 < u 1,3) = F(1,3) – F(-1,3) = 2F(1,3) – 1=

= 2 · 0,9032 – 1 = 0,8064

Page 19: Statistická indukce

PříkladZ celkového počtu 500 000 pojištěnců byl zjišťován u 100 z nich jejich věk, kdy 45 respondentů bylo starších 40 let. Chceme stanovit 95% interval spolehlivosti pro podíl pojištěnců starších 40 let.

45,0100

45

n

nf i

i 96,1uu 05,0

0975,0097499,0150000

100500000

100

)45,01(45,096,1

1N

nN

n

f1fu ii

Page 20: Statistická indukce

95,00975,045,0p0975,045,0P

95,03525,0p3525,0P

Jak velký výběrový soubor bychom potřebovali v případě, že požadujeme velikost přípustné chyby pouze 5 %?

38103,38055,045,096,149999905,0

50000055,045,096,1n

)f1(fu)1N(

N)f1(fun

22

2

ii22

ii2

Page 21: Statistická indukce

Jakou spolehlivost zaručuje výběr 100 respondentů s přípustnou chybou 5 %?

005,149990055,045,0

05,0499999100u

)nN()f1(f

)1N(nu

2

ii

2

P(-1 < u 1) = F(1) – F(-1) = 2F(1) – 1=

= 2 · 0,8413 – 1 = 0,6826

Page 22: Statistická indukce

PříkladMáme k dispozici následující data. V jakých mezích se s pravděpodobností 0,95 pohybuje medián ZS?

Pro určení intervalového odhadu mediánu je potřeba seřadit zadané hodnoty podle velikosti.

2,8 3,1 3,7 5,4 6,2 6,9 7,2 8,9 12,7 22,2 29,8

9,6x~Medián

V tabulkách je potřeba nalézt číslo k k = 2

P (xk M xn-k+1) = 1 -

P (x2 M x11-2+1) = 0,95

P (3,1 M 22,2) = 0,95


Recommended