+ All Categories
Home > Documents > 6. T e s t o v Æ n í h y p o t Ø z - math.feld.cvut.cz · PDF file6. T e s...

6. T e s t o v Æ n í h y p o t Ø z - math.feld.cvut.cz · PDF file6. T e s...

Date post: 06-Mar-2018
Category:
Upload: tranthien
View: 216 times
Download: 2 times
Share this document with a friend
33
6. Testování hypotéz Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlast- nostech. Používáme k tomu vhodně zvolené funkce náhodného výběru (statistiky), jejíž rozdělení známe a na jejíchž hodnotách se projevují sledované vlastnosti. Rozeznáváme dva základní typy testů: Parametrické testy jsou testy o hodnotách parametrů rozdělení, ze kterého je proveden náhodný výběr. Neparametrické testy jsou testy o vlastnostech rozdělení, např. typ rozdělení, shoda dvou a více rozdělení, či symetrie rozdělení. Strategie testování. 1. Na základě hodnot náhodného výběru a charakteru úlohy zvolíme: nulovou hypotézu H 0 a alternativní hypotézu H 1 , kterou příjímáme v případě odmítnutí nulové hypotézy. 2. Volíme testovací kritérium. Vybereme statistiku, funkci ná- hodného výběru, jejíž rozdělení známe a která charakterizuje testovanou vlastnost rozdělení. 3. Stanovíme hladinu významnosti testu jako hodnotu α, číslo α je blízké nule. Obvykle z intervalu (0, 01; 0, 1), nejčastěji 0, 05, která bývá zadavaná ve statistických programech. 4. Na základě hodnoty hladiny, stanovíme kritický obor W α testu, kdy v případě, že zvolená statistika má hodnotu z kritického oboru za- mítneme nulovou hypotézu H 0 a přijmeme alternativní hypotézu H 1 . Chyby testu. Je-li T testovací statistika, α je hladina významnosti testu a W α je kritický obor testu, pak při rozhodovaní nastanou následující situace. Skutečnost H 0 H 1 H 0 T/ W α T/ W α , správně chyba 2. druhu β H 1 T W α , T W α chyba 1. druhu α správně Stanovení kritického oboru. Požadujeme, aby chyba 1. druhu, kdy odmítneme nulovou hypotézu H 0 , ačkoliv platí, byla menší než α. K 83
Transcript

6. T e s t o v á n í h y p o t é z

Na základě hodnot z realizace náhodného výběru činíme rozhodnutí oplatnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlast-nostech. Používáme k tomu vhodně zvolené funkce náhodného výběru(statistiky), jejíž rozdělení známe a na jejíchž hodnotách se projevujísledované vlastnosti.

Rozeznáváme dva základní typy testů:Parametrické testy jsou testy o hodnotách parametrů rozdělení, ze

kterého je proveden náhodný výběr.Neparametrické testy jsou testy o vlastnostech rozdělení, např. typ

rozdělení, shoda dvou a více rozdělení, či symetrie rozdělení.

Strategie testování.1. Na základě hodnot náhodného výběru a charakteru úlohy zvolíme:nulovou hypotézu H0 a alternativní hypotézu H1,

kterou příjímáme v případě odmítnutí nulové hypotézy.2. Volíme testovací kritérium. Vybereme statistiku, funkci ná-

hodného výběru, jejíž rozdělení známe a která charakterizuje testovanouvlastnost rozdělení.

3. Stanovíme hladinu významnosti testu jako hodnotu α, číslo αje blízké nule. Obvykle z intervalu (0, 01; 0, 1), nejčastěji 0, 05, která bývázadavaná ve statistických programech.

4. Na základě hodnoty hladiny, stanovíme kritický obor Wα testu,kdy v případě, že zvolená statistika má hodnotu z kritického oboru za-mítneme nulovou hypotézu H0 a přijmeme alternativní hypotézu H1.

Chyby testu.Je-li T testovací statistika, α je hladina významnosti testu a Wα je

kritický obor testu, pak při rozhodovaní nastanou následující situace.S k u t e č n o s tH0 H1

H0 T /∈ Wα T /∈ Wα,správně chyba 2. druhu ≤ β

H1 T ∈ Wα, T ∈ Wα

chyba 1. druhu ≤ α správně

Stanovení kritického oboru. Požadujeme, aby chyba 1. druhu, kdyodmítneme nulovou hypotézu H0, ačkoliv platí, byla menší než α. K

83

tomu stačí, aby byl kritický obor Wα doplňkem k (1−α)100% intervaluspolehlivosti pro testovaný parametr rozdělení. Chybu 2. druhu můžemepouze ve většině případů alespoň odhadnout. Při této volbě kritickéhooboru jsou chyby 1. a 2. druhu na sobě závislé. Je-li zvolená chyba 1.druhu α příliš malá, může být chyba 2. druhu velká. Na obrázku Obr. 6.1znázorníme jednoduchou situaci, která ilustruje závislost velikostí chyb.

µ0 µ1tαT x

• Wα

@@@ @@@

@@@ @@

@@@@

@@

@@

@@

@@

@

@@

@

@

��������

Obr. 6.1.Znázorníme si vztah chyby 1. druhu α a chyby 2. druhu β. Testujeme

nulovou hypotézu H0 : µ = µ0 na hladině významnosti α pro případvýběru z normálního rozdělení N(µ; σ2). Použijeme testovací statistikuT = (X − µ)

√n/S, o které víme , že má Studentovo rozdělení t(n− 1).

Označme T hodnotu testovací statistiky, tα je hranicekritického oboruWα (kritická hodnota.) Jestliže je ale ve skutečnosti µ = µ1, pak nulováhypotéza H0 neplatí. Chyba 2. druhu β odpovídá ploše obrazce \\\\a hodnota chyby 1. druhu α odpovídá ploše obrazce ////. Je vidět, žepokud budeme hodnotu α zmenšovat, pak se bude hranice tα kritickéhooboru posunovat doprava a hodnota chyby 2. druhu β se bude zvětšovat.Proto v praxi volíme hodnotu α podle charakteru úlohy. Musíme se roz-hodnout, zda je pro nás přijatelnější odmítnou testovanou hypotézu H0

i když je ve skutečnosti pravdivá a nebo zda je přijatelnější ji přijmout,i když ve skutečnosti platí alternativní hypotéza.

Poznámka: p−hodnota testu. V současné době se používá místopopsaného rozhodovacího procesu rozhodovaní na základě p− hodnotytestu. Je to umožněno tím, že pro většinu používaných statistik známejeich rozdělení a dovedene určit pravděpodobnosti a kvantily v celémrozsahu a nejsme odkázáni na několik tabulkových hodnot pro vybranéhladiny významnosti. p−hodnota testu je definována jako hodnota hla-diny významnosti, při které se hodnota testovací statistiky stává hra-niční hodnotou kritického oboru. Situaci si znázorníme na obrázku projednotlivé varianty testu. Symboly tβ jsou označeny β−kvantily rozdělení

84

testovací statistiky T, které tvoří hranice kritického oboru testu.Je-li T testovací statistika a t0 je její hodnota, pak je p−hodnota testu

definována jako:p = 2min{P (T ≥ t0), P (T ≤ t0)} pro oboustranný test;

0Wα Wαt1−α2tα2

p/2 = P (T ≥ t0)

t0

p = P (T ≥ t0) pro pravostranný test;

0 Wαt1−α•

p = P (T ≥ t0)

t0

p = P (T ≤ t0) pro levostranný test.

0Wα tα•

p = P (T ≤ t0)

t0

Nulovou hypotézu H0 zamítáme na hladině významnosti α, jestliže jep < α. Velikost pravděpodobnosti p je přesnějším popisem rozhodovacíhoprocesu, než je minimální „vzdálenostÿ bodu t0 od hranice kritickéhooboru.

Testy o parametrech rozdělení.

6.1. Test o střední hodnotě, jednovýběrový t-test. Předpoklá-dáme, X1, X2, . . . Xn je náhodný výběr z normálního rozdělení N(µ;σ2).Jako odhad střední hodnoty µ použijeme výběrový průměr X a jakoodhad rozptylu σ2 použijeme výběrový rozptyl S2.

a) Testujeme nulovou hypotézu (oboustranný test)H0 : µ = µ0 proti alternativní hypotéze H1 : µ 6= µ0.

Za testovou statistiku volíme

T =X − µ0

S

√n,

85

o které je známo, že má Studentovo t(n− 1) rozdělení. Je totiž

T =X−µ0σ0/√n

S=

X−µ0σ0/√n√

n∑i=1

(Xi−Xσ0

)2/√n− 1

=U√

Z/(n− 1),

kde U ∼ N(0; 1) a Z ∼ χ2(n− 1).Kritickým oborem je

Wα = {T ; |T | > t1−α2 (n− 1)}

doplněk k (1 − α)100% intervalu spolehlivosti pro parametr µ. Při tétovolbě je chyba 1. druhu menší než α. To znamená, že ve 100α% případůodmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ač-koliv neplatí. Situace je znázorněná na obrázku.

0Wα Wα

t1−α2tα2

Obdobně provádíme test jednostranných hypotéz:b) H0 : µ ≤ µ0, H1 : µ > µ0, pak

Wα = {T ; T > t1−α(n)};

0Wα

t1−α

c) H0 : µ ≥ µ0, H1 : µ < µ0, pak

Wα = {T ; T < tα(n)}.

0Wα

Kritické hodnoty testu. Krajní body intervalů, které tvoří kritickéobory se nazývají kritické hodnoty testu. Označují se symbolem t(α),ačkoliv jsou to 1− α

2 kvantily. Při práci s tabulkami je třeba dávat pozor,jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždyuvedeno.

Poznamenejme, že pro rozsahy výběru n ≥ 30 můžeme nahradit kvan-tily, či kritické hodnoty Studentova t−rozdělení hodnotami z normova-ného normálního rozdělení. Obvykle bývají označeny symbolem u(α).

86

Příklad:Soubor {Xi, 1 ≤ i ≤ n} je náhodným výběrem z normálního rozdělení

N(µ;σ2).Testovaná hypotéza: H0 : µ = µ0, alternativní hypotéza H1 : µ 6= µ0.

a) VS-1: n = 35, X = 182, 11, S2 = 61, 1, S = 7, 81665.Testujeme hypotézu H0 : µ = µ0 = 180, proti alternativě H1 : µ 6=

180.Potom je

T =182, 11− 180

7, 81665

√35 = 1, 5969.

Kritické hodnotyt(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758.Protože je T /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. p− hodnota testu je p = 0, 12, je tedy rozhodování blízké hladiněvýznamnosti.

b) VH-4: n = 27, X = 76, 74, S2 = 59, 74, S = 7, 72916.Testujeme hypotézu H0 : µ = µ0 = 75, proti alternativě H1 : µ 6= 75.Potom je

T =76, 74− 75

7, 72916

√27 = 1, 1698.

Kritické hodnotyt(0, 1) = 1, 7056, t(0, 05) = 2, 0555, t(0, 01) = 2, 7787.Protože je T /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. p− hodnota testu je p = 0, 253, můžeme tedy považovat chybu 2.druhu za malou ve srovnání s hodnotou α.

6.2. Test o rozptylu normálního rozdělení jednovýběrový F−test. Pro náhodný výběr X1, X2, . . . Xn je náhodný výběr z normálníhorozdělení N(µ;σ2) hledáme hodnotu rozptylu σ2. Jako jeho odhad pou-žijeme výběrový rozptyl S2.

a) Testujeme nulovou hypotézuH0 : σ2 = σ2

0 proti alternativní hypotéze H1 : σ2 6= σ20.

Za testovou statistiku volíme

V =(n− 1)S2

σ20

=n∑i=1

Xi −Xσ0

2

,

87

o které je známo, že má χ2(n−1) rozdělení. Kritickým oborem je množina

Wα = {V ; V < χ2α2(n− 1) nebo V > χ2

1−α2(n− 1)},

která je doplňkem k (1−α)100% intervalu spolehlivosti pro parametr σ2.Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 100α%případů odmítneme pravdivou skutečnost a příjmeme alternativní hypo-tézu, ačkoliv neplatí. Situace je znázorněná na obrázku.

0

Wα Wα

χ21−α2

χ2α2

Obdobně provádíme test jednostranných hypotéz:b) H0 : σ2 ≤ σ2

0, H1 : σ2 > σ20, pak

Wα = {V ; V > χ21−α(n− 1)};

0Wα

χ21−α

c) H0 : σ2 ≥ σ20, H1 : σ2 < σ2

0, pak

Wα = {V ; V < χ2α(n− 1)}.

0Wα

χ2α

Kritické hodnoty testu. Krajní body intervalů, které tvoří kritickéobory se nazývají kritické hodnoty testu. Označují se symbolem χα,ačkoliv jsou to 1− α

2 kvantily. Při práci s tabulkami je třeba dávat pozor,jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždyuvedeno.

Příklad: Soubor {Xi, 1 ≤ i ≤ n} je náhodným výběrem z normál-ního rozdělení N(µ;σ2).

a) VS-2: n = 30, X = 183, S2 = 64, 97.Testujeme hypotézu H0 : σ2 = σ2

0 = 70, proti alternativěH1 : σ2 6= 70.

Potom je

V =29.64, 97

70= 26, 916.

88

Kritické hodnotyα = 0, 1 : 17, 708, 42, 557; α = 0, 05 : 16, 047, 45, 722;

α = 0, 01 : 13, 121, 52, 336.Protože je V /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. p− hodnota testu je p = 0, 848. Je p >> α, tedy závěr je poměrněspolehlivý, chyba 2. druhu je velice malá.

b) VH-4: n = 27, X = 76, 74, S2 = 59, 74.Testujeme hypotézu H0 : σ2 = σ2

0 = 100, proti alternativěH1 : σ2 6= 100.

Potom je

V =26.59, 74

100= 15, 532.

Kritické hodnotyα = 0, 1 : 15, 375, 38, 885; α = 0, 05 : 13, 844, 41, 923;

α = 0, 01 : 11, 160, 48, 290.Protože je V /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. p− hodnota testu je p = 0, 106 a hodnota je velice blízká uvažovanýmhladinám významnosti α = 0, 1, resp. α = 0, 05. Chyba 2. druhu můžebýt významná.

6.3. Test pro parametr δ exponenciálního rozdělení Exp(0; δ).Pomocí hodnot náhodného výběru X1, X2, . . . , Xn z exponenciálního

rozdělení Exp(0; δ) testujeme hypotézu o střední hodnotě δ. Nulovouhypotézou jeH0 : δ = δ0 proti alternativě H1 : δ 6= δ0.

Za testovou statistiku volíme náhodnou veličinu

T =2nXδ0

,

o níž jsme ukázali, že má rozdělení χ2(2n). Kritickým oborem je

Wα = {T ; T < χ2α2(n− 1) nebo T > χ2

1−α2(n− 1)},

což je doplněk k (1− α)100% intervalu spolehlivosti pro parametr δ.

Příklad: Soubor {Xi; 1 ≤ i ≤ n} je výběrem s exponenciálníhorozdělení Exp(0; 1, 5), kde n = 40.

89

Testujeme hypotézu H0 : δ = δ0 = 1, 3 proti alternativní hypotézeH1 : δ 6= δ0.

Pro data jsme dostali X̃ = 60, 43627. Pro testovací statistiku dosta-neme hodnotu

T =2nXδ0

= 92, 98.

Kritický obor na hladině významnosti α = 0, 1 získáme z kvantilůrozdělení χ2(80). Je

W = {T ; T < χ20,05(80) = 60, 391, nebo T > χ2

0,95(80) = 101, 88}.

Protože je T /∈ W nezamítáme nulovou hypotézu H0. Z kvantilové funkcezískáme p− hodnotu testu p = 0, 304, což je přijatelná hodnota, kterásignalizuje menší hodnoty chyby 2. druhu.

Pro zajímavost uvedeme interval spolehlivosti (δ1; δ2) pro parametrδ, kdy jeho hranice dostaneme z rovnic

T =120, 873

δ1= 101, 88, resp. T =

120, 873δ2

60, 391.

Odtud plyne, že pro hodnoty δ0 ∈ (1, 19; 2) nebudou hodnoty testovacístatistiky v kritickém oboru, tedy nulovou hypotézu nezamítneme.

6.4. Test o rovnosti středních hodnot, dvouvýběrový t-test.Předpokládáme, že X1, X2, . . . , Xn je náhodný výběr z normálního

rozdělení N(µ1;σ21) a Y1, Y2, . . . , Ym je náhodný výběr z normálního roz-

dělení N(µ2;σ22). Jako odhady středních hodnot µ1 a µ2 použijeme výbě-

rové průměry X a Y a jako odhady rozptylů σ21 a σ2

2 použijeme výběrovérozptyly S2

X a S2Y . Předpokládáme, že jsou výběry nezávislé a že se roz-

ptyly rovnají, tedy σ21 = σ2

2 = σ2.

Testujeme nulovou hypotézu H0 : µ1 − µ2 = ∆, obvykle ∆ = 0,proti alternativní hypotéze H1 : µ1 − µ2 6= ∆.

A) Dvouvýběrový t-test. Za testovou statistiku volíme

T =X − Y − (µ1 − µ2)√

(n− 1)S2X + (m− 1)S2

Y

√√√√nm(n+m− 2)n+m

,

o které je známo, že má Studentovo t(n+m− 2) rozdělení. K odvozenítéto skutečnosti postupně použijeme vlastností:

X ∼ N

µ1,σ2

n

, Y ∼ N

µ2,σ2

m

.90

Dále jeE(X − Y ) = E(X)− E(Y ) = µ1 − µ2.

Z nezávislosti výběrů plyne, že

D(X − Y ) = D(X) +D(Y ) =σ2

1

n+σ2

2

m= σ2

(1n

+1m

)= σ2 n+m

nm.

Výraz pro S je odhadem rozptylu obou souborů. Náhodná veličina

Z =(n− 1)S2

X + (m− 1)S2Y

σ2=

n∑i=1

Xi −Xσ

2

+m∑i=1

Yi − Yσ

2

∼ χ2(n− 1) + χ2(m− 1) = χ2(n+m− 2).

Potom je

T =U√

Z/(n+m− 2),

kde

U =X − Y − (µ1 − µ2)

σ√n+mnm

∼ N(0; 1)

a tedy statistika T má Studentovo rozdělení t(n+m− 2).Kritickým oborem testu je množina

Wα = {T ; |T | > t1−α2 (n+m− 2)},

která je doplňkem k (1 − α)100% intervalu spolehlivosti pro parametr∆ = µ1−µ2. Při této volbě je chyba 1. druhu menší než α. To znamená,že ve 100α% případů odmítneme pravdivou skutečnost a příjmeme al-ternativní hypotézu, ačkoliv neplatí.

Porušení normality výběru se ve výsledcích testů výrazněji neprojeví.Shodu rozptylů před výpočtem ověříme testem pro jejich rovnost. Po-kud nám test pro rovnost rozptylů dá negativní výsledek, použijeme proověření hypotézy některou z uvedených variant testu, např. Cochranův-Coxův test nebo neparametrické testy, např. dvouvýběrový Wilco-xonův test, či Kolmogorovův-Smirnovův test, nebo test dobréshody.

B) Cochranův-Coxův test volíme v případě, že není splněn před-poklad o rovnosti rozptylů. Za testovou statistiku volíme

T ∗ =X − Y −∆

S, S =

√vX + vY , vX =

S2X

n, vY =

S2Y

m.

91

Je pak

T ∗ =X − Y −∆√

S2Xn + S2Y

m

=X − Y −∆√

mS2X+nS2Ynm

=X−Y−∆

σ

√nmn+m√

mS2X+nS2Yσ(n+m)

.

Náhodná veličina v čitateli má normované normální rozdělení a ve jme-novateli χ2. Ve jmenovateli představuje vážený průměr odhad rozptylu.Kritickým oborem je

Wα = {T ∗; |T ∗| > t∗}, t∗ =vXtn−1(α) + vY tm−1(α)

vX + vY,

kde tk(α) je kritická hodnota jednovýběrového t−testu. Kritickou hod-notu t∗ dostaneme jako vážený průměr kritických hodnot jednovýběro-vých testů.

Uvedený test má ještě některé jiné varianty, které pro menší rozsahyvýběrů dávají poněkud jiné kritické obory. Uvedeme si na ukázku dvě znich.

C) Satterthwaite (1946).Při použití statistiky T∗ stanovujeme kritický obore jako

Wα = {T ∗; |T ∗| > tf(α)}, f =S4

v2Xn−1 + v2Y

m−1

,

kde tk(α) je kritická hodnota jednovýběrového t−testu.

D) Welch (1947).Pro statistiku T ∗ je kritickým oborem

Wα = {T ∗; |T ∗| > th(α)}, h =S4

v2Xn + v2Y

m

− 2,

kde tk(α) je kritická hodnota jednovýběrového t−testu.Varianty majípraktické využití při menších rozsazích výběrů. Je-li m+

n > 30 dávají všechny stejné výsledky. Kritické hodnoty se při změněpočtu stupňů volnosti již nemění.

Příklad: Soubor {Xi, 1 ≤ i ≤ n} je náhodným výběrem z normál-ního rozdělení N(µ1;σ2

1) a soubor {Yi, 1 ≤ i ≤ m} je náhodným výběremz normálního rozdělení N(µ2;σ2

2).

92

a) VS-2: n = 30, X = 183, S2X = 64, 97;

VS-4: m = 27, Y = 181, S2Y = 74, 77.

Testujeme hypotézu H0 : µ1 = µ2, proti alternativě H1 : µ1 6= µ2.Potom je

T =183− 181− 0

61, 87227, 9567 = 0, 90369.

Kritické hodnotyt(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758.Protože je T /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. Pro test dostaneme p− hodnotu rovnu p = 0, 37, která je výrazněvětší než uvažované hladiny významnosti testu.

b) VH-1: n = 35, X = 75, 4, S2X = 110, 78;

VH-3: m = 34, Y = 77, 53, S2Y = 134, 62.

Testujeme hypotézu H0 : µ1 = µ2, proti alternativě H1 : µ1 6= µ2.

Potom je

T =75, 4− 77, 53− 0

90, 603433, 9927 = 0, 79913.

Kritické hodnotyt(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758.Protože je T /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. Pro test dostaneme p− hodnotu rovnu p = 0, 42, která je výrazněvětší než uvažované hladiny významnosti testu.

6.5. Test o rovnosti rozptylů, dvouvýběrový F-test.Předpokládáme, že X1, X2, . . . , Xn je náhodný výběr z normálního

rozdělení N(µ1;σ21) a Y1, Y2, . . . , Ym je náhodný výběr z normálního roz-

dělení N(µ2;σ22). Jako odhady středních hodnot µ1 a µ2 použijeme výbě-

rové průměry X a Y a jako odhady rozptylů σ21 a σ2

2 použijeme výběrovérozptyly S2

X a S2Y . Předpokládáme, že jsou náhodné výběry nezávislé.

Testujeme nulovou hypotézu H0 : σ21 = σ2

2 proti alternativě H1 :σ2

1 6= σ22.

Jako výběr Xi označíme ten, pro který je S2X > S2

Y . Za testovoustatistiku volíme

F =S2X

S2Y

,

93

o které je známo, že má Fn−1,m−1 rozdělení. Kritickým oborem je

Wα = {F ; F > Fn−1,m−1(α), }

kde Fn−1,m−1(α) je kritická hodnota z tabulek, která je (1−α/2)−kvanti-lem rozdělení Fn−1,m−1. Poznamenejme, že při této volbě označení výběrůvyjde vždy hodnota testovací statistiky větší než jedna. Kritický obor jetedy volen tak, že tento poměr nesmí přesáhnout kritickou hodnotu. Proobecnou situaci by měl kritický obor ještě část hodnot blízkých nule. Tove zvolené variantě testu ale nemůže nastat. Testy ve statistických soft-warových produktech někdy předpokládají volbu této varianty a testujíobvykle pouze překročení horní kritické hodnoty.

Při této volbě je chyba 1. druhu menší než α. To znamená, že ve100α% případů odmítneme pravdivou skutečnost a příjmeme alterna-tivní hypotézu, ačkoliv neplatí.

Příklad: Soubor {Xi, 1 ≤ i ≤ n} je náhodným výběrem z normál-ního rozdělení N(µ1;σ2

1) a soubor {Yi, 1 ≤ i ≤ m} je náhodným výběremz normálního rozdělení N(µ2;σ2

2).

a) VH-1: X − n = 35, X = 75, 4, S2X = 110, 78;

VH-2: Y − n = 30, Y = 77, 4, S2Y = 102, 59.

Testujeme hypotézu H0 : σ21 = σ2

2, proti alternativě H1 : σ21 6= σ2.

Potom je

F =110, 78102, 59

= 1, 09798.

Kritické hodnotyα = 0, 1 : 1, 79; α = 0, 05 : 2, 01.Protože je F /∈ Wα pro všechny hladiny, přijmeme nulovou hypotézu

H0. Pro test dostaneme p−hodnotu p = 0, 8, tedy odmítnutí alternativníhypotézy je oprávněné.

b) VH-3: X − n = 30, X = 77, 53, S2X = 134, 62;

VH-4: Y − n = 27, Y = 76, 74, S2Y = 59, 74.

Testujeme hypotézu H0 : σ21 = σ2

2, proti alternativě H1 : σ21 6= σ2.

Potom je

F =134, 6259, 74

= 2, 25351.

Kritické hodnoty

94

α = 0, 1 : 1, 89; α = 0, 05 : 2, 14.Protože je F ∈ Wα pro všechny hladiny, zamítneme nulovou hypotézu

H0 a přijmeme hypotézu H1. Pro test dostaneme p−hodnotu rovnu p =0, 04, což potvrzuje odmítnutí nulové hypotézy.

Neparametrické testyV neparametrických testech má hypotéza charakter tvrzení o vlast-

nostech rozdělení, které nejsou odvozeny od hodnot parametrů. Testu-jeme hodnotu mediánu, symetrii rozdělení, shodu dvou a více rozdělení,či typ rozdělení a to nejčastěji normalitu. Uvedeme některé z nejčastějipoužívaných testů.

15.6. Znaménkový test je testem o mediánu rozdělení. Používámejej jako velice jednoduchou variantu testu na symetrii rozdělení, kdy byse měl medián rovnat střední hodnotě. Test má velmi malou vypovídacíhodnotu, uvádíme jej jako příklad neparametrického testu. na kterémukážeme principy testování tohoto druhu.

Předpokládáme, že X1, X2, . . . , Xn je náhodný výběr ze spojitého roz-dělení jehož medián je x0,5 = x̃. Testujeme nulovou hypotézuH0 : x̃ = x0, proti alternativě H1 : x̃ 6= x0.

Označme si Yi = Xi−x0. Pokud je nulová hypotéza platná, pak by mělbýt počet kladných a záporných hodnot souboru Yi stejný. Označíme-li Y počet kladných hodnot v souboru Yi, je pak Y realizací náhodnéveličiny, která má binomické rozdělení Bi(n, 1

2). Ta nabývá hodnot zmnožiny {0, 1, 2, . . . , n} a hodnoty blízké nule a n se vyskytují s velmimalou pravděpodobností.

Kritický obor testu je

Wα = {Y ; Y ≤ k1 nebo Y ≥ k2},

kde hodnoty k1 a k2 nalezneme v tabulkách. Pro zvolenou hladinu testuje nalezneme tak, že je k1 největší z hodnot a k2 je nejmenší z hodnot,pro které platí

P (Y ≤ k1) ≤α

2, P (Y ≥ k2) ≤

α

2,

jestliže má Y zmiňované binomické rozdělení Bi(n, 12).

Pokud má výběr větší rozsah, n > 36, můžeme nahradit binomickérozdělení Bi(n, 1

2) normálním rozdělením N(n2 ,n4 ). Obě rozdělení mají

95

shodné střední hodnoty n2 a shodné rozptyly n

4 . Potom má normalizovanánáhodná veličina

U =Y − n

2√n

2

=2Y − n√

n

normované normální rozdělení N(0; 1). Kritický obor je roven

Wα = {U ; |U | ≥ u(α), }

kde u(α) je kritická hodnota pro normální rozdělení, kterou nalezneme ztabulek. Poznamenejme, že je tato kritická hodnota u(α) = u1−α2 rovna1 − α

2 kvantilu normovaného normálního rozdělení. Snadno odvodíme ijednostranné varianty testu. Test má poměrně malou sílu a k věrohod-notnějšímu výsledku je potřeba poměrně velký rozsah náhodného vý-běru, v řádu n > 500..

Příklad: Soubor dat {Xi; 1 ≤ i ≤ 6} je počet, kolikrát padne číslo{i; 1 ≤ i ≤ 6} při 150 hodech hrací kostkou. JeXi ∈ {24, 22, 25, 22, 28, 29}. Testujeme nulovou hypotézuH0 : x̃ = x0,5 = 25proti alternativní hypotézeH1 : x̃ 6= 25.Pro uvedená dat je Yi ∈ {−1,−3, 0,−3, 3, 4}. Počet kladných hod-

not je Y = 2. Z tabulek dostaneme kritické hodnoty testu na hladiněvýznamnosti α = 0, 05 a z nich kritický obor

W = {Y ; Y ≤ k1 = 0, nebo Y ≥ k2 = 6}.

Protože je Y /∈ W nezámítáme nulovou hypotézu H0.Příklad: Soubor dat {Xi; 1 ≤ i ≤ 6} je počet, kolikrát padne číslo

{i; 1 ≤ i ≤ 6} při 300 hodech hrací kostkou.Je Xi ∈ {48, 52, 51, 40, 51, 48}. Testujeme nulovou hypotézuH0 : x̃ = x0,5 = 50proti alternativní hypotézeH1 : x̃ 6= 50.Pro uvedená dat je Yi ∈ {−2, 2, 1,−10, 1,−2}. Počet kladných hod-

not je Y = 3. Z tabulek dostaneme kritické hodnoty testu na hladiněvýznamnosti α = 0, 05 a z nich kritický obor

W = {Y ; Y ≤ k1 = 0, nebo Y ≥ k2 = 6}.

96

Protože je Y /∈ W nezámítáme nulovou hypotézu H0.Jeste jeden p5iklad

6.7. Jednovýběrový Wilcoxonův test je testem symetrie rozdě-lení. Testujeme symetrii rozdělení vzhledem k hodnotě x0, za kterou ob-vykle volime odhad mediánu či střední hodnoty. Testujeme skutečnost,že pro hustotu či pravděpodobnostní funkci platí f(x− x0) = f(x+ x0).Nulovou hypotézu zapisujeme ve tvaru podmínky pro medián x0,5 = x̃ :H0 : x̃ = x0, proti alternativě H1 : x̃ 6= x0.

Pro náhodný výběr X1, X2, . . . , Xn utvoříme soubor Yi = Xi − x0, vekterém vypustíme případné nulové hodnoty. Hodnoty |Yi| uspořádámepodle velikosti a označíme R+

i jejich pořadí. Nyní je

S+ =∑Yi>0

R+i , S− =

∑Yi<0

R+i .

Poznamenejme, že S+ + S− = 12n(n+ 1).

Pokud je rozdělení symetrické, budou se vyskytovat kladné a zápornéhodnoty souměrně kolem hodnoty x0, tedy součty pořadí kladných azáporných hodnot se od sebe budou málo lišit. Kritický obor testu jestanoven jako

Wα : min(S+, S−) < w(α),

kde w(α) je kritická hodnota testu, kterou nalezneme v tabulkách. Je-lisplněna podmínka pro kritický obor zamítneme nulovou hypotézu, žerozdělení je symetrické.

Poznamenejme, že pro náhodné veličiny S+ a S− je

E(S+) = E(S−) =14n(n+ 1), a D(S+) = D(S−) =

124n(n+ 1)(2n+ 1).

Pro větší hodnoty rozsahu výběru nahradíme rozdělení rozdělenímnormálním, tedy skutečností, že má náhodná veličina

U =S+ − 1

4n(n+ 1)√124n(n+ 1)(2n+ 1)

normované normální rozdělení N(0; 1). Kritický obor testu je pak

Wα = {U ; |U | > u(α), }

97

kde uα je kritická hodnota testu pro normální rozdělení, která je rovnau(α) = u1−α2 , tedy (1 − α/2−kvantilu normovaného normálního rozdě-lení.

Příklad: Budeme testovat symetrii souboru dat, která jsou počtemstudentů, kteří získali u testu stejného bodového ohodnocení. Datovýsoubor je Xi ∈ {2, 3, 2, 8, 5, 6, 7, 6, 4, 3, 4}. Jestliže spočteme aritmetickýprůměr, dostaneme x = 50

11 = 4, 55. Budeme testovat symetrii rozděleníkolem této hodnoty, tedy nulovou hypotézuH0 : x̃ = 4, 55proti alternativní hypotézeH1 : x̃ 6= 4, 55.Pro hodnotyXi−x̃ určíme součet pořadí kladných a záporných hodnot

a dostaneme, že

S+ = 29, S− = 37. (S+ + S− = 66)

Odtud je min{S+, S−} = 29. Pro kritické hodnoty w(α) testu dostanemez tabulek hodnotyw(0, 05) = 10, w(0, 01) = 5.Pro obě hladiny významnosti je min{S+, S−} > w(α), tedy nulovou

hypotézu nezamítáme. Rozdělení je symetrické kolem hodnoty x̃ = 4, 55.

6.8. Dvouvýběrový Wilcoxonův test slouží k porovnání výběrů,kdy testujeme hypotézu, že jsou oba výběry ze stejného rozdělení.

Předpokládáme, že náhodný výběr {X1, X2, . . . , Xn} je výběrem zrozdělení s distribuční funkcí F a náhodný výběr {Y1, Y2, . . . , Ym} je vý-běrem z rozdělení s distribuční funkcí G. Testujeme hypotézuH0 : F = G proti alternativě H1 : F 6= G.

Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná,pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti vestejném počtu. Uvedený algoritmus je známý jako test.

Algoritmus testu:1. Vytvoříme sdružený soubor

{Z1, Z2, . . . , Zn+m} = {X1, X2, . . . , Xn} ∪ {Y1, Y2, . . . , Ym}.2. Stanovíme pořadí prvků souboru, který uspořádáme podle velikosti,

přičemž prvkům, které mají stejnou velikost přiřadíme průměr jejichpořadí. Označme

98

T1 − je součet pořadí prvků z prvního souboru; T2 − je součet pořadíprvků z druhého souboru.

Poznamenejme, že T1 + T2 = 12(n+m)(n+m+ 1).

3. Položme

U1 = nm+12n(n+ 1)− T1 a U2 = nm+

12m(m+ 1)− T2.

Poznamenejme pro kontrolu, že U1 + U2 = nm.Testovací kritérium: Kritický obor

Wα : min{U1, U2} ≤ w(α),

kde kritickou hodnotu w(α) testu nalezneme v tabulkách.Poznámka: Pořadí souborů volíme tak, aby n ≥ m, tabulky bývají

pro rozsahy 2 ≤ m ≤ 20, 5 ≤ n ≤ 30.Pro větší rozsahy výběrů využíváme skutečnosti, že za platnosti hy-

potézy H0 je

E(U1) = E(U2) =12nm a D(U1) = D(U2) =

112nm(n+m+ 1).

Rozdělení obou veličin můžeme pak považovat za normální a tedynáhodná veličina

U =U1,2 − 1

2nm√112nm(n+m)(n+m+ 1)

má normované normální rozdělení N(0; 1).Kritický obor testu je

Wα = {U ; |U | > u(α)},

kde u(α) je kritická hodnota pro normální rozdělení, tedy u1−α2 kvantilnormálního rozdělení.

Příklad: Budeme testovat shodu rozdělení pro datové soubory{Xi; 1 ≤ i ≤ 10} a {Yi; 1 ≤ i ≤ 10}, které jsou počty výskytů 1, resp.6 v seriích po 30 hodech hrací kostkou. DostanemeXi ∈ {4, 3, 3, 7, 7, 7, 2, 6, 1, 7} a Yi ∈ {6, 6, 4, 5, 8, 5, 1, 4, 4, 5}.

Pro sdružené pořadí dostaneme T1 = T2 = 105, tedy U1 = U2 = 50.Kritické hodnoty w(α) testu nalezneme v tabulkách. Z nich dostaneme,

99

že w(0, 05) = 23 a w(0, 01) = 16. Protože min{U1;U2} = 50 > w(α),tedy hodnota statistiky nepatří do kritického oboru, nezamítáme nulovouhypotézu H0 na obou hladinách významnosti.

Poznámka. Test je citlivý na posun, tedy na situaci, kdy je F (x) =G(x − ∆). Pořadí jednotlivých dat souborů jsou vůči sobě posunuta av součtu je pak jejich rozdíl velký. Dochází tak k zamítnutí hypotézy oshodě. Pro tyto situace a případy, kdy se soubory liší spíše rozptylem čitvarem je doporučován Kolmogorovův-Smirnovův test.

6.9. Kruskalův-Wallisův test je neparametrickou obdobou analýzyrozptylu a je rozšířením Wilcoxonova testu na větší počet výběrů. Mámek, k ≥ 3 nezávislých výběrů Xi1, Xi2, . . . , Xini, 1 ≤ i ≤ k. Označmen = n1 + n2 + . . .+ nk počet všech prvků ve výběrech. Předpokládáme,že výběry jsou po řadě z rozdělení se spojitými distribučními funkcemiF1, F2, . . . , Fk. Testujeme nulovou hypotézu

H0 : F1 = F2 = . . . = Fk

proti alternativěH1 : H0 neplatí.

Algoritmus testu:1. Srovnáme všechny prvky výběrů podle velikosti a určíme pořadí

Rij, 1 ≤ j ≤ ni, 1 ≤ i ≤ k každého z nich.2. Určíme součet pořadí

Ti =ni∑j=1

Rij, 1 ≤ i ≤ k

prvků z každého z výběrů. Pro kontrolu je T1 +T2 + . . .+Tk = 12n(n+1).

3. Vypočteme hodnotu testovací statistiky

Q =12

n(n+ 1)

k∑i=1

T 2i

ni− 3(n+ 1).

4. Kritický obor testu je

Wα = {Q; Q > hk−1(α)},

kde kritické hodnoty hk−1(α) nalezneme pro menší rozsahy výběrů vestatistických tabulkách. Při větších rozsazích využíváme skutečnosti, že

100

pro ni →∞ má statistika Q v limitě rozdělení χ2(k−1). Použijeme tedyaproximace hk−1(α) .= χ2

α(k − 1). Jedná se o (1 − α)−kvantil rozděleníχ2(k − 1).

Test je citlivý na posun, podobně jako při porovnávání dvou výběrů.V takovém případě volíme porovnávání metodou analýzy rozptylu.

V případě zamítnutí nás zajímá, pro které z dvojic je rozdíl mezi Fia Fj signifikantní. Pokud jsou rozsahy výběrů různé pak je podstatnýrozdíl pro dvojice i a j, pro které je

|ti − tj| >

√√√√√ 112

1ni

+1nj

n(n+ 1)hk−1(α),

kde ti = Tini, 1 ≤ i ≤ k a hk−1(α) je kritická hodnota testu. Šetření je

nutné provést pro všech 12k(k − 1) dvojic výběrů.

V případě stejného rozsahu výběrů používáme citlivější Neményiovymetody, která je obdobou Tukeyovy metody z analýzy rozptylu pro vy-vážená třídění. Položme m = n1 = n2 = . . . = nk a n = mk. Rozdílnéjsou dvojice, pro které je rozdíl |Ti − Tj| větší než kritická hodnota ztabulek. Ty uvadí hodnoty pro m ≤ 25 a k ≤ 10. Pro větší rozsahyvýběrů používáme kritické hodnoty pro rozpětí. Je-li Y1, Y2, . . . , Yk ná-hodný výběr z rozdělení N(0; 1) a Y(1) ≤ Y(2) ≤ . . . ≤ Y(k) je uspořádanývýběr, pak náhodná veličina R = Y(k)−Y(1) je rozpětí. Kritická hodnotaqk,∞(α) je definována jako

P (R ≥ qk,∞(α)) = α.

Rozdíl je signifikantní pro dvojice, pro které je

|ti − tj| > qk,∞(α)

√√√√ 112k(mk + 1).

Příklad:

6.10. Kolmogorovův-Smirnovův test.Test je založen na porovnávání maximální odchylky distribučních

funkcí. Porovnáváme empirickou distribuční funkci, kterou získáme zdatového souboru s teoretickou distribuční funkcí předpokládaného roz-dělení. Nebo při porovnávání dvou výběrů srovnáváme obě empirické

101

distribuční funkce. Test je odvozen za předpokladu, že se jedná o výběryz normálního rozdělení. Pro jiná rozdělení, která se výrazně od něj odli-šují (exponenciální) jsou v literatuře uvedeny modifikace testu. Nejprvepopíšeme empirickou distribuční funkci, která se v testu používá.

Je-li {X1, X2, . . . , Xn} náhodný výběr z rozdělení, které má distri-buční funkci F, pak empirickou distribuční funkcí nazýváme funkciFn, která je definována předpisem:

Fn(x) =1n

n∑i=1

ξi(x), kde ξi(x) =⟨

0, x < Xi,1, x ≥ Xi.

Potom jelimn→∞Fn(x) = F (x), x ∈ R.

Poznámka. Empirická distribuční funkce je po úsecích konstantní amá skoky velikosti 1 v bodech x = Xi, 1 ≤ i ≤ n. Znázorníme siprůběh empirické distribuční funkce pro náhodný výběr, pro který platí:X1 < X2 < X3 = X4 < X5.

1 −

15 −

25 −

45 −

X1 X2 X3 = X4 X5x

F5(x)y

••

••

c c cc

Obr. 12.1.

Jednovýběrový testPředpokládáme, že náhodný výběr Xi, 1 ≤ i ≤ n je výběrem z roz-

dělení s distribuční funkcí F. Testujeme hypotézu:H0 : výběr je z rozdělení s distribuční funkcí Fproti alternativní hypotézeH1 : výběr není z rozdělení s distribuční funkcí F.Algoritmus testu:1. Vypočteme empirickou distribuční funkce Fn a teoretickou dostri-

buční funkce F.2. Určíme maximální rozdíl těchto funkcí,

Dn = sup{|Fn(x)− F (x)|; x ∈ R}.

102

Platí-li hypotéza H0 je limn,m→∞Dn = 0.

3. Určíme testovací statistiku√nDn,

která má rozdělení určené distribuční funkcí K(λ), kde

K(λ) = 1− 2∞∑k=1

(−1)k+1e−2k2λ2,

tj.lim

n,m→∞ P(√nDn < λ

)= K(λ), λ > 0.

4. Kritický obor testu je

Wα :√nDn ≥ λα ⇔ Dn ≥

λα√n,

kde kritickou hodnotu testu D∗n = λα√n

nalezneme v tabulkách pro hod-noty 2 ≤ n ≤ 20. Pro větší rozsahy výběrů použijeme aproximace

K(λ) .= 1− 2e−2λ2

a kritickou hodnotu λα určíme z podmínky:

P

Dn <λα√n

= K(λ) = 1−α⇒ 1−α = 1−2e−2λ2α ⇒ λα =

√√√√−12

ln2α.

Pro kritický obor dostaneme

Wα : Dn ≥ D∗n =

√√√√ 12n

ln2α.

Příklad: Pro soubor dat{−2, −1, 5, −1, −0, 7, −0, 1, 0, 5, 1, 1, 1, 6, 2, 3}testujeme hypotézu H0 : výběr je z rovnoměrného rozdělení v inter-

valu (−2, 3). Podle algoritmu testu dostaneme:max{|Fn(x)− F (x)|; x ∈ 〈−2, 3〉} .= 0, 1667;hodnota statistiky Dn

.= 0, 577;kritická hodnota Dn(0, 05) = 1, 358.Protože je Dn < Dn(0, 05) nezamítáme hypotézu H0 na hladině vý-

znamnosti α = 0, 05. Pro p−hodnotu testu dostaneme p .= 0, 879.

103

Dvouvýběrový testPředpokládáme, že náhodný výběr {X1, X2, . . . , Xn} je výběrem z

rozdělení s distribuční funkcí F a náhodný výběr {Y1, Y2, . . . , Ym} je vý-běrem z rozdělení s distribuční funkcí G. Testujeme hypotézuH0 : F = G proti alternativě H1 : F 6= G.

Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná,pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti vestejném počtu.

Algoritmus testu:1. Vypočteme empirické distribuční funkce Fn a Gm.2. Určíme maximální rozdíl těchto funkcí,

Dn,m = sup{|Fn(x)−Gm(x)|; x ∈ R}.

Platí-li hypotéza H0 je limn,m→∞Dn,m = 0.

3. Určíme testovací statistiku√MDn,m, M =

nm

n+m,

která má rozdělení určené distribuční funkcí K(λ), kde

K(λ) = 1− 2∞∑k=1

(−1)k+1e−2k2λ2,

tj.lim

n,m→∞ P(√

MDn,m < λ)

= K(λ), λ > 0.

4. Kritický obor testu je

Wα :√MDn,m ≥ λα ⇔ Dn,m ≥

λα√M,

kde kritickou hodnotu testu D∗n,m = λα√M

nalezneme v tabulkách prohodnoty 2 ≤ n ≤ 20, 4 ≤ m ≤ 20, n+m ≥ 8. Pro větší rozsahy výběrůpoužijeme aproximace

K(λ) .= 1− 2e−2λ2

a kritickou hodnotu λα určíme z podmínky:

P

(Dn,m <

λα√M

)= K(λ) = 1− α⇒ 1− α = 1− 2e−2λ2α ⇒

104

λα =

√√√√−12

ln2α.

Pro kritický obor dostaneme

Wα : Dn,m ≥ D∗n,m =

√√√√ 12M

ln2α.

Příklad: Porovnáme shodu rozdělení, ze kterého pocházejí datovésoubory, které jsou počtem 6, resp. 1 v seriích po 30 hodech hrací kostkou.JeXi ∈ {1, 4, 4, 4, 5, 5, 5, 6, 6, 8} a Yi ∈ {1, 2, 3, 3, 4, 6, 7, 7, 7, 7}.Pro empirické distribuční funkce dostaneme:

x 1 2 3 4 5 6 7 8F10

110

110

110

410

710

910

910

1010

G10110

210

410

510

510

610

1010

1010

Odtud dostaneme, že hodnota testovací statistiky je

D10,10 =310.

Kritické hodnoty nalezneme v tabulkách, kde jeD∗10,10(0, 05) = 0, 7 a D∗10,10(0, 01) = 0, 8.Protože je D∗10,10 < D10,10, tedy hodnota D10,10 /∈ Wα pro obě hod-

noty hladiny významnosti, nezamítáme nulovou hypotézu H0 na žádnéz hladin.

Pro výpočet přibližné kritické hodnoty dostaneme, že M = 10020 = 5 a

D ≈√

12M ln 2

α : D ≈ 0, 607, α = 0, 05; D ≈ 0, 728, α = 0, 01.

6.11. Test shody pro binomické rozdělení. Máme dány hodnotynezávislých náhodných veličin X ∼ Bi(n, p1) a Y ∼ Bi(m, p2). Testu-jeme nulovou hypotézu

H0 : p1 = p2

proti alternativěH1 : p1 6= p2.

Algoritmus testu.1. Vypočteme hodnoty x = X

n a y = Ym , které jsou odhady parametrů

p1 ≈ x a p2 ≈ y.

105

2. Má-li výběr dostatečně velký rozsah, pak mají náhodné veličiny xa y po řadě normální rozdělení

x ∼ N

p1;p1(1− p1)

n

a y ∼ N

p2;p2(1− p2)

m

.3. Protože jsou náhodné veličiny x a y nezávislé má náhodná veličina

U =(x− y)− (p1 − p2)√

p1(1−p1)n + p2(1−p2)

m

normované normální rozdělení N(0; 1).4. Pokud platí nulová hypotéza H0, je p1−p2 = 0 a jestliže použijeme

aproximacíp1 = x, p2 = y, má náhodná veličina

Ua =x− y√

x(1−x)n + y(1−y)

m

normované normální rozdělení N(0; 1).5. Kritický obor testu je pak

Wα = {Ua; |Ua| ≥ u(α

2)},

kde kritická hodnota u(α2 ) je rovna 1− α2−kvantilu normálního rozdělení

N(0; 1).Alternativní varianta testu je založena na skutečnosti, že společnou

hodnotu p1 = p2 odhadujeme pomocí hodnoty z = X+Yn+m = nx+my

n+m . Potommá náhodná veličina

Ub =x− y√

z(1− z)(

1n + 1

m

)normované normální rozdělení N(0; 1).

Kritický obor testu je pak

Wα = {Ub; |Ub| ≥ u(α

2)}.

Protože je pro n = m hodnota |Ub| ≤ |Ua| dává tato varianta častějijako výsledek testu přijetí nulové hypotézy H0.

106

Příklad: Budeme testovat shodu parametru v binomickém rozdělenípro soubory, které jsou počtem hodů s předepsaným počtem bodů v serii300 hodů hrací kostkou. Je n = m = 300 a počet hodů je

1 2 3 4 5 647 53 51 40 61 48

Největší rozdíl dostaneme pro 1 a 5. Volíme tedy X = 47 a Y = 61.Potom jex = 0, 15666, y = 0, 2033 a z = 0, 18. Je tedy

Ua = −1, 491, Ub = −1, 4878.

Kritické hodnoty u(α) najdeme v tabulkách kvantilů normovaného nor-málního rozdělení. Jeu(0, 1) = 1, 645 a u(0, 05) = 1, 96.Protože je

|Ua| < u(α), resp. |Ub| < u(α)

pro obě hodnoty α nezamítáme nulovou hypotézu H0 na obou hladináchvýznamnosti.

6.12. Multinomické rozdělení.Rozdělení je zobecněním binomického rozdělení, kde uvažujeme více

alternativních výsledků náhodného pokusu. Jako možné výsledky uvažu-jeme náhodné jevy Ai, 1 ≤ i ≤ k, které jsou po dvou disjunktní, P (Ai) =pi, A1∪A2∪ . . .∪Ak = U, tedy p1 +p2 + . . .+pk = 1. Opakujeme n−krátpokus, který jako výsledek dává posloupnost jevů Ai nebo Ai a sledujemekolikrát se na i− tém místě objeví jev Ai, 1 ≤ i ≤ k, přičemž jsou jed-notlivá opakování na sobě nezávislá. Je-li Yi počet výskytů náhodnéhojevu Ai, 1 ≤ i ≤ k, pak říkáme,že náhodný vektor (Y1, Y2, . . . , Yk) mámultinomické rozdělení s parametry n a (p1, p2, . . . , pk). Náhodnývektor má diskrétní rozdělení a pro jeho sdruženou pravděpodobnostnífunkci p dostaneme vzorec

p(i1, i2, . . . , ik) = P (Y1 = i1, Y2 = i2, . . . , Yk = ik) =

=n!

i1!.i2! . . . ik!pi11 p

i22 . . . p

ikk ,

0 ≤ ij, 1 ≤ j ≤ k, i1 + i2 + . . . ik = n.

107

Marginální rozdělení každé z náhodných veličin Yj je binomické roz-dělení Bi(n, pj) a E(Yj) = npj, D(Yj) = npj(1− pj), 1 ≤ j ≤ k. Dále jekoeficient korelace cov(Yi, Yj) = −npipj, i 6= j, 1 ≤ i, j ≤ k.

Takové rozdělení dostaneme, jestliže pro náhodný výběr provedemediskretizaci jeho hodnot pomocí zvolené škály. Parametry pi rozdělenípak odpovídají pravděpodobnostem výskytu hodnoty náhodné veličinyv příslušném intervalu škály. Nechť je X náhodná veličina, jejíž rozděleníje určeno distribuční funkcí F a X1, X2, . . . Xn je náhodný výběr z roz-dělení s danou distribuční funkcí. Rozdělíme interval, ve kterém se můžedaná náhodná veličina X vyskytovat na systém k disjunktních intervalů(škálu) tvaru

(a0, a1〉, (a1, a2〉, . . . (ak−1, ak).

Dále označme pi = P (ai−1 < X ≤ ai) = F (ai) − F (ai−1), 1 ≤ i ≤ k

pravděpodobnosti výskytu náhodné veličiny X v i−tém intervalu škály.Potom je npi teoretická četnost výskytu hodnot náhodného výběru vi−tém intervalu škály. Jestliže si označíme ni, 1 ≤ i ≤ k empirickoučetnost výskytu, t.j. počet hodnot Xj z náhodného výběru, které leží vi−tém intervalu škály, pak platí tvrzení:

Věta: Náhodná veličina

(♠) χ2 =k∑i=1

(ni − npi)2

npi

má přibližně rozdělení χ2(k − 1).Poznámka: Hodnota χ2 je vlastně vážený součet čtverců odchylek

empirické a teoretické četnosti, kdy je každá odchylka vážena proti svéteoretické hodnotě. Pokud je náhodný výběr z rozdělení se zadanou dis-tribuční funkcí F, pak se má tato hodnota, náhodná veličina, řídit uvede-ným zákonem rozdělení. Na této skutečnosti je založen test dobré shodyo druhu rozdělení, tedy o typu distribuční funkce.

Uvedeme vzorec, který se někdy lépe hodí k výpočtu hodnoty χ2. Jetotiž

χ2 =k∑i=1

(ni − npi)2

npi=

k∑i=1

n2i − 2ninpi + (npi)2

npi=

=k∑i=1

n2i

npi− 2

k∑i=1

ni +k∑i=1

npi =k∑i=1

n2i

npi− n.

108

6.13. Test dobré shody, test χ2 (chí kvadrát). Testujeme, že danýnáhodný výběr je výběrem ze známého rozdělení. Pokud jsou parametryrozdělení (hustoty či pravděpodobnostní funkce) známy, počítáme uve-dené veličiny z rozdělení, které je určeno jejich hodnotami. Pokud tytoparametry neznáme, použijeme pro ně odhady získané některou z metodhledání bodových odhadů (metoda maximální věrohodnosti či metodamomentů).

Máme dán náhodný výběr X1, X2, . . . , Xn z rozdělení se známým ty-pem distribuční funkce (hustoty). Testujeme nulovou hypotézuH0 : náhodný výběr je výběrem s daným rozdělením

proti alternativěH1 : náhodný výběr je výběrem z jiného rozdělení.

Algoritmus testu.1. Definiční obor náhodné veličiny X rozdělíme pomocí dělících bodů

na škálu k intervalů tvaru(−∞, a1〉, (a1, a2〉, . . . (ak−2, ak−1〉, (ak−1, ak =∞).2. Vypočteme teoretické četnosti

pi = P (ai−1 < X ≤ ai), 1 ≤ i ≤ k

a ověříme podmínku použitelnosti testu:

npi ≥ 5, 1 ≤ i ≤ k, nebo npi ≥ 5q,

kde q je podíl tříd, pro které je npi < 5, v případech kdy k ≥ 3.3. Určíme empirické četnosti ni jako počty hodnot Xj z náhodného

výběru, které leží v intervalu (ai−1, ai〉, 1 ≤ i ≤ k a vypočteme hodnotustatistiky

χ2 =k∑i=1

(ni − npi)2

npi.

4. Pro zvolenou hladinu významnosti testu stanovíme kritický obortestu

Wα = {χ2; χ2 ≤ χ2k−1(α)},

kde χ2k−1(α) je kritická hodnota testu, která je rovna 1 − α−kvantilu

rozdělení χ2(k − 1).5. Je-li hodnota χ2 ∈ Wα zamítneme nulovou hypotézuH0 ve prospěch

alternativní hypotézy H1. V opačném případě, kdy je χ2 < χ2k−1(α)

nulovou hypotézu H0 přijmeme.

109

Poznámka: Pokud použijeme místo skutečných hodnot parametrůrozdělení jejich odhadů, pak místo k − 1 stupňů volnosti rozdělení χ2

volíme rozdělení s k−m− 1 stupni volnosti, kde m je počet neznámýchparametrů rozdělení.

Poznámka: Metoda minimálního χ2 se používá k zpřesnění vý-sledku v případě, kdy parametry roazdělení odhadujeme. Její princip jezaložen na tom, že hledáme hodnoty neznámých parametrů tak, aby hod-nota náhodné veličiny χ2 ze vzorce (♠) byla minimální. Pravděpodob-nosti pi jsou funkcemi parametrů rozdělení. Hodnota náhodné veličinyχ2 také. Hledáme, podobně jako při metodě maximální věrohodnosti,jejich hodnoty tak, aby měla funkce χ2 minimum. Řešení této úlohy jepoměrně komplikované, zájemce odkazujeme na podrobnější učebnicematematické statistiky.

Příklad: Budeme testovat hypotézu, že soubor dat pochází z rovno-měrného rozdělení. Datový soubor má hodnoty a je to počet studentů,kteří získali stejné bodové ohodnocení ve škále (0, 1, . . . , 12) :

158, 76, 106, 130, 135, 120, 108, 138, 124, 142, 111, 121 114,tedy 13 dat a v případě rovnoměrného rozdělení je

pi = 113 = 0, 076923 a npi = 1583

13 = 121, 77.Pro hodnotu statistiky χ2 dostaneme χ2 = 36, 38. Pro kritické hod-

noty testu z tabulek odečteme: χ2(0, 05) = 21, 03, χ2(0, 025) = 23, 34,χ2(0, 01) = 26, 22. Pro všechny hladiny významnosti je hodnota testo-vací statistiky větší než kritická hodnota, patří tedy do kritického oborua tudíž nulovou hypotézu H0 zamítáme na všech hladinách.

Jestliže uvažujeme podobný soubor106, 130, 135, 120, 108, 138, 124, 142, 111, 121 114,

pak máme skupinu 11 dat. Pro ně je pi = 111 = 0, 090909 a npi = 1349

11 =122, 64. V tomto případě dostaneme χ2 = 8, 68. Kritické hodnoty testuz tabulek jsou: χ2(0, 05) = 18, 31, atd.

Protože je hodnota testovací statistiky χ2 menší než kritická hodnotatestu nezamítáme hypotézu H0 na žádné z hladin.

Příklad: Testujeme pomocí testu dobré shody hypotézuH0 : výběr je z normálního rozdělení proti alternativěH1 : výběr není z normálního rozdělenípro soubor dat

110

X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 182, 200, 179, 182,178, 175, 176, 176, 185, 185, 178, 183, 181, 175};Pro výpočet teoretických četností použijeme odhady parametrůµ = X = 181, 64 a σ = s = 9, 766. Jako odhad pro interval hodnot

dostaneme (147, 46; 215, 82). Pro počet dat n = 24 dostaneme pro počettříd k = 6. Testovací statistika a kritická hodnota mají hodnoty:χ2 = 0, 835 a kr = χ2

3(0, 05) = 7, 8147.Protože je χ2 < kr, hypotézu H0 nezamítáme. Pro test dostaneme

p−hodnotu p = 0, 3179.

6.14. Test závislosti a nezávislosti. Pro náhodné veličiny X a Yse nejčastěji k popisu závislosti používá koeficient korelace ρ(X, Y ),který je definován vztahem

ρ(X, Y ) =E((X − E(X))(Y − E(Y )))√

D(X)D(Y )=E(XY )− E(X)E(Y )√

D(X)D(Y ).

Koeficient je roven nule pro nezávislé náhodné veličiny a je roven ±1 vpřípadě lineární závislosti Y = aX+ b. Pro normální rozdělení je úplnoucharakteristikou závislosti náhodných veličin. Platí totiž: Jestliže má ná-hodný vektor (X, Y ) normální rozdělení, pak je jeho sdružená hustotadána vzorcem

f(x, y) =1

2πσ1σ2√

1− ρ2exp

−(x−µ1)2σ21

+ (y−µ2)2σ22− 2ρ(x−µ1)(y−µ2)

σ1σ2

2(1− ρ2)

,kde náhodná veličina X má marginální rozdělení N(µ1;σ2

1) a Y má mar-ginální rozděleníN(µ1;σ2

2) a ρ je koeficient korelace meziX a Y. Náhodnéveličiny X a Y jsou nezávislé právě když je ρ = 0.

Podmíněné náhodné veličiny X|y, resp.Y |x mají také normální roz-dělení se středními hodnotami

E(X|y) = µ1 + β1,2(y − µ2), β12 = ρσ1

σ2

resp.E(Y |x) = µ2 + β21(x− µ1), β21 = ρ

σ2

σ1

a rozptyly

D(X|y) = σ21(1− ρ2), resp. D(Y |x) = σ2

2(1− ρ2).

111

Podmíněná střední hodnota je lineární funkcí y, resp. x, a její směrniceβ12, resp. β21, je regresní koeficinet. Podmíněný rozptyl je konstantní.

Odhad závislosti či nezávislosti pro náhodné výběry provádíme po-mocí výběrového koeficientu korelace, který je obdobou výběrových mo-mentů.

Výběrový koeficient korelace je definován pro dvourozměrný ná-hodný výběr (Xi, Yi), 1 ≤ i ≤ n jako

r(X, Y ) =SXYSXSY

,

kdeS2X =

1n− 1

n∑i=1

(Xi −X)2, S2Y =

1n− 1

n∑i=1

(Yi − Y )2,

SXY =1

n− 1

n∑i=1

(Xi −X)(Yi − Y ).

Vztah lze úpravami, kterými jsme odvodili vyjádření pro výběrový roz-ptyl upravit na tvar

r(X, Y ) =

n∑i=1

(XiYi)− nXY√√√√( n∑i=1

X2i − n(X)2

) (n∑i=1

Y 2i − n(Y )2

)

Test závislosti či nezávislosti je založen na tomto tvrzení:Je-li (Xi, Yi), 1 ≤ i ≤ n náhodný výběr z dvourozměrného normálníhorozdělení, pak má náhodná veličina (statistika)

T =r√

1− r2

√n− 2 ∼ t(n− 2)

t−rozdělení s n− 2 stupni volnosti.Algoritmus testuTestovaná hypotéza:H0 : ρ = 0 nezávislost; H1 : ρ 6= 0 závislost.Kritický obor Wα = {T ; |T | > tn−2(α)}, kde tn−2(α) je kritická hod-

nota t−testu, tedy 1−α2−kvantil Studentova t−rozdělení o n−2 stupních

volnosti.Existují tabulky, které uvadějí kritické hodnoty rn(α) přímo pro hod-

noty statistiky r. Kritický obor je pak

112

Wα = {r; |r| > rn(α)}.

Příklad: Pro soubory X výšek a Y vah testujme lineární závislost,jestliže:X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 182, 200, 179, 182,178, 175, 176, 176, 185, 185, 178, 183, 181, 175};Y = {72, 60, 65, 75, 92, 72, 73, 65, 70, 83, 85, 93, 70, 80, 68, 75, 78, 63, 75,87, 61, 74, 69, 75};Podle algoritmu testu dostaneme:koeficient korelace rXY = 0, 6883;hodnota testovací statistiky T = 4, 4499;kritická hodnota t(0, 05) = 2, 073, p−hodnota testu p = 2.10−4.Protože je |T | > t(0, 05) hypotézu o nezávislosti zamítáme a přijí-

máme očekávanou hypotézu, že jsou náhodné veličiny závislé.

6.15. Testy normality Náhodný výběr {Xi; 1 ≤ i ≤ n} je vý-běrem z normálního rozdělení. Uvedeme test normality rozdělení, kterýje založen na výběrové šikmosti a špičatosti, nebo na jejich kombinaci.Vycházíme z porovnání odhadů koeficientů šikmosti a špičatosti s jejichteoretickou hodnotou.

Připomeneme:

Mk =1n

n∑i=1

(Xi −X)k, 1 ≤ k je k−tý výběrový moment.

A3 =M3

(M2)3/2− je výběrová šikmost;

A∗4 =M4

M 22, resp. A4 =

M4

M 22− 3 − je výběrová špičatost.

Pro ně platí:

E(A3) = 0, D(A3) =6(n− 2)

(n+ 1)(n+ 3)

aE(A∗4) = 3− 6

n+ 1, resp. E(A4) = − 6

n+ 1,

D(A4) =24n(n− 2)(n− 3)

(n+ 1)2(n+ 3)(n+ 5).

Pro menší rozsahy výběru jsou kritické hodnoty pro statistiky A3 aA4 uvedeny v tabulkách. Pro větší rozsahy výběrů, n > 200 pro A3 a

113

n > 500 pro A4, lze použít aproximace normálním rozdělením, kterévychází z centrální limitní věty. Počítáme s tím, že náhodné veličiny

U3 =A3√D(A3

a U4 =A4 − E(A4)D(A4)

mají normované normální rozdělení. Kritické hodnoty testu naleznemepomocí kvantilů normálního rozdělení. Kritickým oborem testů je

Wα = {U3; |U3| > uα/2},

neboWα − {U4; |U4| > uα/2,

kde uα je α−kvantil nornálního rozdělení N(0; 1).Existuje podstatné vylepšení postupu, které se dá použít v případě

výběrů menšího rozsahu.

Test založený na šikmosti:Postupně vypočteme

b =3(n2 + 27n− 70)(n+ 1)(n+ 3)

(n− 2)(n+ 5)(n+ 7)(n+ 9), W 2 =

√2(b− 1)− 1, δ =

1√ln W

a =

√√√√ 2W 2 − 1

, Z3 = δ ln

U3

a+

√√√√(U3

a

)2

+ 1

.Potom má náhodná veličina Z3 přibližně normální rozdělení N(0; 1) ahypotézu o normalitě rozdělení zamítáme v případě, že |Z3| ≥ uα/2. Testse dá použít pro n > 8.

Test založený na špičatosti:Postupně vypočteme

B =6(n2 − 5n+ 2)(n+ 7)(n+ 9)

√√√√√ 6(n+ 3)(n+ 5)n(n− 2)(n− 3)

, A = 6+8B

2B

+

√√√√1 +4B2

,

Z4 =1− 2

9A − 3

√1− 2A

1+U4√

2A−4√

29A

.

Náhodná veličina Z4 má přibližně normální rozdělení N(0; 1) a hypotézuo normalitě zamítáme, pokud je |Z4| ≥ uα/2. Aproximace je použitelnápro n ≥ 20.

114

Testy založené současně na šikmosti a špičatosti:Pro výběry kde je rozsah n > 200 můžeme použít skutečnosti, že

náhodná veličinaU 2

3 + U 24 ∼ χ2

2

má rozdělení χ2 o dvou stupních volnosti. Hypotézu o normalitě zamí-táme, pokud je

U 23 + U 2

4 ≥ χ22(α).

Pro menší rozsahy, kde n ≥ 20 lze použít skutečnosti, že má náhodnáveličina

Z23 + Z2

4 ∼ χ22

přibližně rozdělení χ22 o dvou stupních volnosti. Hypotézu o normalitě

zamítáme, pokud jeZ2

3 + Z24 ≥ χ2

2(α).

Příklad: Testujeme pomocí popsaných algoritmů normalitu rozdělení

pro náhodný výběr X výšek skupiny studentu. JeTestujeme nulovou hypotézuH0 : výběr je z normálního rozdělení proti alternativě

H − 1 : výběr není z normálního rozdělení.Pomocí algoritmů dostaneme:n = 24- počet dat;Pro test založený na koeficientu šikmosti:U3 = 1, 547, Z3 = 1, 5663, kritická hodnota u(0, 05) = 1, 96.Je |U3| < u(0, 05) a |Z3| < u(0, 05), tedy v obou případech hypotézu

H0 nezamítáme.Pro test založený na koeficientu špičatosti:U4 = 2, 535 Z4 = 1, 973, kritická hodnota u(0, 05) = 1, 96.V obou případech jsou hodnoty v kritickém oboru, tedy hypotézu H0

zamítáme. V prvním případě máme příliš málo hodnot, pro druhou vari-antu vidíme, že je hodnota testovací statistiky těsně u kritické hodnoty.

Pro test založený na kombinaci obou hodnot dostaneme:U 2

3 +U 24 = 8, 81, Z2

3 +Z24 = 6, 345 a kritická hodnota χ2

2(0, 05) = 5, 99.Obě hodnoty přesahují kritickou hodnotu, hypotézu H0 zamítáme.

115


Recommended