+ All Categories
Home > Documents > Testování statistických hypotéz

Testování statistických hypotéz

Date post: 13-Feb-2016
Category:
Upload: ryder
View: 26 times
Download: 1 times
Share this document with a friend
Description:
Testování statistických hypotéz. Co je to statistická hypotéza?. Hypotéza o základním souboru (populaci). Typy stat. hypotéz. Parametrické hypotézy - hypotézy o parametrech populace a) Hypotézy o parametru jedné populace (o střední hodnotě, mediánu, rozptylu, relativní četnosti…) - PowerPoint PPT Presentation
32
Testování statistických hypotéz
Transcript
Page 1: Testování  statistických hypotéz

Testování statistických hypotéz

Page 2: Testování  statistických hypotéz

Co je to statistická hypotéza?

Hypotéza o základním souboru (populaci).

Page 3: Testování  statistických hypotéz

Typy stat. hypotéz

• Parametrické hypotézy- hypotézy o parametrech populace

a) Hypotézy o parametru jedné populace (o střední hodnotě, mediánu, rozptylu, relativní četnosti…)

b) Hypotézy o parametrech dvou populací (srovnávací testy)c) Hypotézy o parametrech více než dvou populací (ANOVA …)

• Neparametrické hypotézy- hypotézy o jiných vlastnostech populace (tvar rozdělení, závislost proměnných…)

Page 4: Testování  statistických hypotéz

Zdroje hypotéz

• Hypotéza je založena na předchozí zkušenosti

• Hypotéza vychází z teorie, kterou je třeba doložit

• Hypotéza vychází z požadavku na kvalitu produktu

• Hypotéza je pouhým dohadem založeným na náhodném pozorování

Page 5: Testování  statistických hypotéz

Co to je testování hypotéz?

Egon Sharpe Pearson (1895-1980) Jerzy Neymann (1894-1981)

Rozhodovací proces, v němž proti sobě stojí 2 tvrzení - nulová a alternativní hypotéza.

Page 6: Testování  statistických hypotéz

Nulová hypotéza- takové tvrzení o populaci, které je bráno jak

předpoklad při testování - představuje určitý rovnovážný stav a bývá

vyjádřena rovnosti „=“ např. μ = 100, μ1 = μ2 = μ3 …

Alternativní hypotéza- představuje porušení rovnovážného stavu a

zapisujeme ji tedy jedním ze tří možných zápisů nerovnosti ( ≠ , <, >)

Page 7: Testování  statistických hypotéz

Výběr vhodné alternativní hypotézy

• jednostranná vs. oboustranná alternativa

• alternativní hypotéza musí být v souladu s výběrovým souborem

Page 8: Testování  statistických hypotéz

Princip testování hypotéz

Základní soubor

(populace)

Hypotéza o populaci

Výběrový soubor

Jsou data konzistentní s hypotézou o populaci ?

Page 9: Testování  statistických hypotéz

Chyby při testování hypotéz

jsou nevyhnutelnou součásti testování

Rozhodnutí

Nezamítáme H0 Zamítáme H0

Platí H0Správné rozhodnutí

Pravděpodobnost: 1 – α(spolehlivost)

Chyba I. druhuPravděpodobnost: α (hladina významnosti)

Platí HAChyba II. druhu

Pravděpodobnost: β Správné rozhodnutí

Pravděpodobnost: 1 – β(síla testu)

Skut

ečno

st

Page 10: Testování  statistických hypotéz

• Chyba I. druhu- nulová hypotéza platí, ale my ji zamítneme - maximální přípustná pravděpodobnost chyby I. druhu (hladina významnosti) se volí ještě před pořízením výběrového souboru)

• Chyba II. druhu- nulová hypotéza neplatí, ale my ji nezamítneme (nepoznáme, že neplatí)- síla testu závisí na zvolené testové metodě (zejména na skutečném rozdělení dat)

Page 11: Testování  statistických hypotéz

Grafický zápis chyby II. druhu (pro konkrétní alternativu)

Operativní charakteristika Křivka síly testu (Power Curve)

Page 12: Testování  statistických hypotéz

Příklad

Standardním výrobním způsobem lze vyrobit monitory se střední životnosti 1200 hodin a směrodatnou odchylkou 300 hodin. Novou technologií, kterou navrhuje vývojové centrum bylo zkušebně vyrobeno 100 obrazovek, jejichž průměrná životnost byla 1265 hodin. Předpokládejme, že výběr pocházel z normálního rozdělení.

Jde o kvalitnější technologii, nejde pouze o náhodný rozdíl?

Page 13: Testování  statistických hypotéz

hodinHhodinH

A 1200:1200:0

hodinX 1265

Nakolik průměr odpovídá nulové hypotéze?

Page 14: Testování  statistických hypotéz

900;1200

100300;1200

;

2

2

NX

NX

nNX

Page 15: Testování  statistických hypotéz

α (volíme)β

CX

1200:0 H1200: AH

Jestliže platí H0

µ0 =1200

Jestliže platí konkrétní HA

μA = 1240

H0 HA

H0 OK Chyba I. druhu

HA Chyba II.druhu

OK

Výsledek testu

Sku

tečn

ost

1240:1

AH

Zamítáme H0Nezamítáme H0

Page 16: Testování  statistických hypotéz
Page 17: Testování  statistických hypotéz

Jak snížit pravděpodobnost obou chyb?

Page 18: Testování  statistických hypotéz

1200:0 H1200: AH

1240:1

AH

Jestliže platí H0

µ0 =1200 CX

Jestliže platí konkrétní HA

μA = 1240

Zamítáme H0Nezamítáme H0

αβ

Vliv rostoucího rozsahu výběru na pravděpodobnost chyb I. a II. druhu

Page 19: Testování  statistických hypotéz

Přístupy k testování hypotéz

• Testování pomocí intervalových odhadů• Klasický test

• Čistý test významnosti (testování pomocí p-value (p-hodnoty))

Page 20: Testování  statistických hypotéz

Testování pomocí intervalových odhadů

1. Formulace nulové a alternativní hypotézy2. Nalezení příslušného intervalového odhadu (POZOR! Umíme

zatím nalézt pouze int. odhady parametrů normálního rozdělení!!!)3. Ověření toho, zda testovaná hodnota parametru leží v nalezeném

intervalovém odhadu4. Formulace závěru testu

Lze použít pouze pro testování parametrických hypotéz

Page 21: Testování  statistických hypotéz

Klasický test

1. Formulace nulové a alternativní hypotézy2. Volba testové statistiky (testového kritéria) T(X),

musíme znát (nulové rozdělení)3. Ověření předpokladů testu4. Sestrojení kritického oboru a oboru přijetí5. Výpočet pozorované hodnoty testové statistiky T(X) -

xOBS

6. Formulace závěru testu

) )(( )( 00 HxXTPxF

Page 22: Testování  statistických hypotéz

Konstrukce kritického oboru - C

1. Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky)

C ≤ Tα

2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako:

C ≥ T1-α

3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!!

(C ≤ Tα/2) nebo (C ≥ T1-α/2)

0HCXTP

Page 23: Testování  statistických hypotéz

Příklad

1200:0 H1200: AH

1. Formulace nulové a alternativní hypotézy:

2. Volba testového kritéria:

1;0NnXZXT

4. Výpočet pozorované hodnoty:

100.,300.,1265 nhodhodX

17,2100300

1200126500

nXZx HOBS

3. Ověření předpokladu testu:

Viz. předpoklad v zadání úlohy.

Page 24: Testování  statistických hypotéz

5. Konstrukce kritického oboru:

CX

Jestliže platí H0

µ0 =1200

Zamítáme H0Nezamítáme H0

α

z0,95=1,64

T(X), jestliže platí H0

µ =0

Zamítáme H0Nezamítáme H0

α C

Page 25: Testování  statistických hypotéz

6. Rozhodnutí:

Zamítáme H0 ve prospěch HA, tj. s 95% ní pravděpodobnosti lze tvrdit, že došlo ke zlepšení střední životnosti monitorů.

1,64

T(X), jestliže platí H0

µ =0

Zamítáme H0Nezamítáme H0

α C

xOBS=2,17

Page 26: Testování  statistických hypotéz

Vliv volby α na rozhodnutí

1,64

T(X), jestliže platí H0

µ =0

Zamítáme H0Nezamítáme H0

α C

xOBS=2,17

Page 27: Testování  statistických hypotéz

Čistý test významnosti1. Formulace nulové a alternativní hypotézy2. Volba testové statistiky (testového kritéria) T(X),

musíme znát (nulové rozdělení) 3. Ověření předpokladů testu4. Výpočet pozorované hodnoty testové statistiky T(X) –

xOBS

5. Určení p-value6. Formulace závěru testu

Page 28: Testování  statistických hypotéz

Co je to p-value?

1,64

T(X), jestliže platí H0

µ =0

Zamítáme H0Nezamítáme H0

α C

xOBS=2,17

p-value

p-value je pravděpodobnost, že testová statistika bude alespoň tak „extrémní“ jako pozorovaná hodnota.

Page 29: Testování  statistických hypotéz

Jak určujeme p-value?1.Alternativní hypotéza ve tvaru „<“ (ve prospěch alternativy svědčí nízké hodnoty testové statistiky)

p-value = F0(xOBS)

2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako:

p-value = 1-F0(xOBS)

3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) – POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!!

p-value = 2.min{F0(xOBS) ;1-F0(xOBS)}

Page 30: Testování  statistických hypotéz

Jak rozhodujeme pomocí p-value?

1,64

T(X), jestliže platí H0

µ =0

Zamítáme H0Nezamítáme H0

α C

xOBS=2,17

p-value

α>p-value zamítáme H0

α<p-value nezamítáme H0

Page 31: Testování  statistických hypotéz

α>p-value zamítáme H0

α<p-value nezamítáme H0

• P-value je nejvyšší hladina významnosti na níž nezamítáme nulovou hypotézu.

• P-value je nejnižší hladina významnosti na níž zamítáme nulovou hypotézu.

Page 32: Testování  statistických hypotéz

Rozhodování na klasických hladinách významnosti (0,05 a 0,01)

0,01 0,05

p-value

Nezamítáme H0Zamítáme H0 Nerozhodná oblast


Recommended