Část III. – Náhodný vektor
1doc. Ing. Michal Dorda, Ph.D.
Náhodný vektor
• Náhodným vektorem budeme rozumět sloupcový vektor složený z náhodných veličin
.
• Pro jednoduchost se omezíme pouze na dvousložkový náhodný vektor.
• Např. u osobních automobilů můžeme sledovat dvě proměnné – výkon motoru a maximální rychlost.
( )TnXXXX ,...,, 21=
2doc. Ing. Michal Dorda, Ph.D.
Náhodný vektor
3doc. Ing. Michal Dorda, Ph.D.
Hodnocení ceny jízdného Hodnocení kvality cestování
1 1
1 2
1 3
2 2
2 3
2 3
3 2
3 2
3 3
3 3
3 3
3 3
3 3
3 4
3 4
4 3
4 3
4 4
4 4
4 4
Průzkum spokojenosti cestujících s MHD
1 Velmi nespokojen
2 Nespokojen
3 Spokojen
4 Velmi spokojen
Legenda
Ukázka diskrétního náhodného vektoru – při průzkumu spokojenosti cestujících se systémem MHD nás zajímá více údajů, např. viz tabulka.
Náhodný vektor
• Sdružená (simultánní) distribuční funkce náhodných veličin X a Y je definována vztahem:
.
• Vlastnosti sdružené distribuční funkce:
1.
2.
doc. Ing. Michal Dorda, Ph.D. 4
( ) ( )yYxXPyxF = ;,
( ) ( ) ( ) ( ) .1,;0,,, ==−−=−=− FFyFxF
( ) .1,0 yxF
Náhodný vektor
3. Funkce F(x,y) je neklesající v každé proměnné.
4. Funkce F(x,y) je zleva spojitá v každé proměnné.
5.
doc. Ing. Michal Dorda, Ph.D. 5
( ) ( ) ( )
( ) ( ).;;
;;;
2121
21212211
aaFbaF
abFbbFbYabXaP
+−
−−=
x
y
a1 b1
a2
b2
Náhodný vektor• Podle oboru hodnot, kterých můžou
proměnné X a Y nabývat, rozeznáváme:
– Náhodný vektor s diskrétním rozdělením.
– Náhodný vektor se spojitým rozdělením.
doc. Ing. Michal Dorda, Ph.D. 6
( ) ( )
===xx yy
ji
i j
yYxXPyxF ;,
( ) ( ) − −
=
x y
dsdrsrfyxF ,,
Sdružená pravděpodobnostní funkce
Sdružená hustota pravděpodobnosti
Náhodný vektor
• Pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru dále platí:
1.
2.
doc. Ing. Michal Dorda, Ph.D. 7
( ) .1, ===i j
ji yYxXP
( ) .1,0 == ji yYxXP
Náhodný vektor
• Pro sdruženou hustotu pravděpodobnosti spojitého náhodného vektoru dále platí:
1.
2.
3.
doc. Ing. Michal Dorda, Ph.D. 8
( ) .1, yxf
( ) .1, =
−
−
dxdyyxf
( ) ( ) .,;1
1
2
2
2211 =
b
a
b
a
dxdyyxfbYabXaP
Náhodný vektor
• Marginální distribuční funkcí rozumíme distribuční funkci složky X nebo Y.
• Pro diskrétní náhodný vektor potom platí:
doc. Ing. Michal Dorda, Ph.D. 9
( ) ( ) ( )
( ) ( ) ( )yxFyYPyF
yxFxXPxF
xY
yX
,lim
,lim
→
→
==
==
( ) ( )
( ) ( ).;
,;
===
===
i
j
x
iY
y
jX
yYxXPYP
yYxXPxP Marginální pravděpodobnostní funkce
Náhodný vektor
• Pro spojitý náhodný vektor potom platí:
doc. Ing. Michal Dorda, Ph.D. 10
( ) ( )
( ) ( ) .,
,,
dxyxfyf
dyyxfxf
Y
X
−
−
=
=Marginální hustoty pravděpodobnosti
Náhodný vektor
• Nezávislost složek náhodného vektoru:
– Složky X a Y náhodného vektoru jsou navzájem nezávislé, jsou-li nezávislé náhodné proměnné X a Y, tedy:
.
– Náhodný vektor s diskrétním rozdělením:
.
– Náhodný vektor se spojitým rozdělením:
.
doc. Ing. Michal Dorda, Ph.D. 11
( ) ( ) ( )yFxFyxF YX =,
( ) ( ) ( )jYiXji yYPxXPyYxXP ===== ,
( ) ( ) ( )yfxfyxf YX =,
Náhodný vektor
• Sdružená pravděpodobnostní funkce diskrétního dvousložkové náhodného vektoru se často zobrazuje v podobě korelační tabulky.
doc. Ing. Michal Dorda, Ph.D. 12
Náhodný vektor
doc. Ing. Michal Dorda, Ph.D. 13
X / Y1y 2y
1x
2x
mx
ny
( )11; yYxXP ==
( )21; yYxXP ==( )nyYxXP == ;1
( )12; yYxXP ==
( )1; yYxXP m ==
( )22; yYxXP ==
( )nyYxXP == ;2
( )2; yYxXP m ==
( )nm yYxXP == ;
( )=
==m
i
ji yYxXP1
; ( )1yPY ( )2yPY ( )nY yP
( )=
==n
j
ji yYxXP1
;
( )1xPx
( )2xPx
( )mx xP
( ) ( ) 111
====
n
j
jY
m
i
iX yPxP
Náhodný vektor• Podmíněné rozdělení pravděpodobnosti:
– Pro náhodný vektor s diskrétním rozdělením je definována podmíněná pravděpodobnostní funkce ve tvaru:
doc. Ing. Michal Dorda, Ph.D. 14
( ) ( )( )
( )
( ) ( )( )
( ) .0 pro ,
,0 pro ,
==
=====
==
=====
xXPxXP
yYxXPxXyYP
yYPyYP
yYxXPyYxXP
X
X
Y
Y
Náhodný vektor• Podmíněné rozdělení pravděpodobnosti:
– Pro náhodný vektor se spojitým rozdělením je definována podmíněná hustota pravděpodobnosti:
doc. Ing. Michal Dorda, Ph.D. 15
( ) ( )( )
( )
( ) ( )( )
( ) .0 pro ,
,0 pro ,
=
=
xfxf
yxfxyf
yfyf
yxfyxf
X
X
Y
Y
Náhodný vektor
• Číselné charakteristiky náhodného vektoru:
– Smíšený počáteční (obecný) moment řádu k,n:
.
– Pro diskrétní náhodný vektor potom platí:
– Pro spojitý náhodný vektor platí:
doc. Ing. Michal Dorda, Ph.D. 16
( )nk
nk YXE =,
( )= =
===m
i
n
j
ji
n
j
k
ink yYxXPyx1 1
, .;
( ) .,,
−
−
= dydxyxfyx nk
nk
Náhodný vektor
– Smíšený centrální moment řádu k,n:
.
– Pro diskrétní náhodný vektor potom platí:
– Pro spojitý náhodný vektor platí:
doc. Ing. Michal Dorda, Ph.D. 17
( ) ( ) nk
nk EYYEXXE −−=,
( ) ( ) ( ).,1 1
, = =
==−−=m
i
n
j
ji
n
j
k
ink yYxXPEYyEXx
( ) ( ) ( ) .,,
−
−
−−= dydxyxfEYyEXxnk
nk
Náhodný vektor
• Marginální číselné charakteristiky složek náhodného vektoru:
– Střední hodnota proměnné X:
– pro diskrétní proměnnou.
– pro spojitou proměnnou.
• Obdobně bychom definovali vztahy pro proměnnou Y.
doc. Ing. Michal Dorda, Ph.D. 18
( )=
==m
i
iXi xPxEX1
0,1
( )dxxfxEX X
−
== 0,1
Náhodný vektor
– Rozptyl proměnné X:
– pro diskrétní
proměnnou.
– pro spojitou
proměnnou.
• Obdobně bychom definovali vztahy pro proměnnou Y.
doc. Ing. Michal Dorda, Ph.D. 19
( ) ( )=
−==m
i
iXi xPEXxDX1
2
0,2
( ) ( )dxxfEXxDX X
−
−==2
0,2
Náhodný vektor
• Nejdůležitější číselnou charakteristikou náhodného vektoru je kovariance – smíšený centrální moment řádu 1,1:
.
– Pro diskrétní náhodný vektor platí:
– Pro spojitý náhodný vektor platí:
doc. Ing. Michal Dorda, Ph.D. 20
( ) ( ) ( ) EYYEXXEYXCov −−== 1,1,
( ) ( ) ( ) ( ).,,1 1
= =
==−−=m
i
n
j
jiji yYxXPEYyEXxYXCov
( ) ( ) ( ) .,),(
−
−
−−= dydxyxfEYyEXxYXCov
Náhodný vektor
• Vlastnosti kovariance náhodného vektoru:1.
2.
3.
4. Jsou-li složky X a Y náhodného vektoru nezávislé, potom platí:
doc. Ing. Michal Dorda, Ph.D. 21
( ) ( ) ,, EYEXYXEYXCov −=
( ) ( ) ,,,, DYYYCovDXXXCov ==
( ) ( ),,, XYCovYXCov =
( ) .0, =YXCov
Náhodný vektor
• Kovariance představuje nejjednodušší ukazatel souvislosti dvou náhodných veličin.
• Kladná hodnota kovariance znamená, že s rostoucí proměnnou X roste i proměnná Y.
• Záporná hodnota kovariance znamená, že s rostoucím X klesá Y.
• Kovarianční matice – .
doc. Ing. Michal Dorda, Ph.D. 22
( )
( ) DYYXCov
YXCovDX
,
,
Náhodný vektor
• Jednoduchý korelační koeficient – vyjadřuje míru lineární závislosti (korelaci) mezi složkami X a Y náhodného vektoru, je definován:
.
Pro jednoduchý korelační koeficient platí:
1.
2.
doc. Ing. Michal Dorda, Ph.D. 23
( )0, pro
,,
= DYDX
DYDX
YXCovYX
.1;1, −YX
.,, XYYX =
Náhodný vektor
• Pokud , proměnné X a Y náhodného vektoru jsou nekorelované (lineárně nezávislé).
• Pokud , proměnné X a Y náhodného vektoru jsou pozitivně korelované.
• Pokud , proměnné X a Y náhodného vektoru jsou negativně korelované.
doc. Ing. Michal Dorda, Ph.D. 24
0, =YX
0, YX
0, YX
Náhodný vektor
• Je-li potřeba testovat vzájemnou nezávislost složek náhodného vektoru X a Y, kde X a Y jsou kategoriální proměnné, můžeme použít χ2 test nezávislosti v kombinační (kontingenční) tabulce.
• Kategoriální proměnná je proměnná, kterou nemůžeme měřit, ale pouze zařadit do tříd (např. známka ve škole apod.). Nechť složka X nabývá krůzných variant, složka Y m různých variant.
• Kombinační tabulka je v podstatě tabulka sdružených a marginálních četností.
doc. Ing. Michal Dorda, Ph.D. 25
Náhodný vektor
doc. Ing. Michal Dorda, Ph.D. 26
X / Y y1 y2. . . ym ∑
x1 n11 n12 n1m n1•
x2 n21 n22 n2m n2•
.
.
.
xk nk1 nk2 nkm nk•
∑ n•1 n•2 n•m n
Náhodný vektor
• Test je založen na porovnání empirických (pozorovaných) četností s četnostmi teoretickými.
• V případě nezávislosti platí:
,
kde je příslušná teoretická četnost.
doc. Ing. Michal Dorda, Ph.D. 27
n
nnn
n
n
n
nn
jijiij
••••
=
=*
*
ijn
Náhodný vektor
1. Volba nulové a alternativní hypotézy:
H0 – Náhodné veličiny (znaky) X a Y v kombinační tabulce jsou nezávislé.
H1 – Náhodné veličiny (složky náhodného vektoru) X a Y v kombinační tabulce jsou závislé.
doc. Ing. Michal Dorda, Ph.D. 28
Náhodný vektor
2. Volba testového kritéria a jeho nulového rozdělení (za předpokladu platnosti nulové hypotézy):
.
• S rostoucí hodnotou testové statistiky K roste rozpor naměřených dat s nulovou hypotézou.
doc. Ing. Michal Dorda, Ph.D. 29
( )( ) ( )2
11
1 1*
2*
−−
= =
→−
= mk
k
i
m
j ij
ijij
n
nnK
Náhodný vektor
• Předpoklad testu:
– Žádná teoretická četnost nesmí být menší než 2
– Alespoň 80% teoretických četností musí být větší než 5.
3. Sestavení oboru přijetí a kritického oboru:
.
doc. Ing. Michal Dorda, Ph.D. 30
( ) ( ) ( ) ( ) ( ) 11;2
11;1 −−== −−− mkCHIINVx mkkrit
Náhodný vektor
doc. Ing. Michal Dorda, Ph.D. 31
x
f(x)
xkrit
α1-α
Obor přijetí - Oblast nezamítnutí H0
Kritický obor - Oblast zamítnutí H0
Náhodný vektor
4. Výpočet pozorované hodnoty testové statistiky xobs (za předpokladu platnosti nulové hypotézy).
5. Formulace závěru testu:
– – nezamítáme nulovou hypotézu o nezávislosti náhodných proměnných.
– – zamítáme nulovou hypotézu ve prospěch alternativní hypotézy.
doc. Ing. Michal Dorda, Ph.D. 32
kritobs xx
kritobs xx
Náhodný vektor
• V případě, že není splněn předpoklad výše uvedeného testu, lze použít tzv. Yatesovukorekci, která snižuje hodnotu testového kritéria, je tedy obtížnější zamítnout nulovou hypotézu. Testová statistika je v tomto případě ve tvaru:
doc. Ing. Michal Dorda, Ph.D. 33
( )( ) ( )2
11
1 1*
2* 5,0−−
= =
→−−
= mk
k
i
m
j ij
ijij
Yatesn
nnK
Náhodný vektor
• Uvedený test pouze slouží k rozhodnutí o tom, zda jsou znaky X a Y závislé či nezávislé, ale již nestanovuje, o jak silnou závislost se jedná.
• Pro stanovení síly závislosti zavádíme různé koeficienty, jež jsou obdobou korelačního koeficientu.
doc. Ing. Michal Dorda, Ph.D. 34
Náhodný vektor
• Zavádíme koeficient kontingence definovaný:
kde K je hodnota testového kritéria a n rozsah výběru. Pro čtvercovou kombinační tabulku (k=m) nabývá hodnot .
doc. Ing. Michal Dorda, Ph.D. 35
,nK
KCC
+=
1;0
Náhodný vektor• Pro obdélníkovou kombinační tabulku je
ovšem maximální hodnota koeficientu kontingence rovna:
proto zavádíme korigovaný koeficient kontingence ve tvaru:
který je už v intervalu .
doc. Ing. Michal Dorda, Ph.D. 36
( )( )
,,min
1,minmax
mk
mkCC
−=
,maxCC
CCCCcor =
1;0
Náhodný vektor
• Jako další míra síly závislosti se používá Cramerův koeficient definovaný ve tvaru:
jež nabývá hodnot z intervalu .
doc. Ing. Michal Dorda, Ph.D. 37
( ) ,
1,min −=
mkn
KV
1;0