Část III. –Náhodný vektorhomel.vsb.cz/~dor028/Nahodny_vektor.pdfNáhodný vektor doc. Ing....

Část III. – Náhodný vektor

1doc. Ing. Michal Dorda, Ph.D.

Náhodný vektor

• Náhodným vektorem budeme rozumět sloupcový vektor složený z náhodných veličin

.

• Pro jednoduchost se omezíme pouze na dvousložkový náhodný vektor.

• Např. u osobních automobilů můžeme sledovat dvě proměnné – výkon motoru a maximální rychlost.

( )TnXXXX ,...,, 21=


Náhodný vektor


Hodnocení ceny jízdného Hodnocení kvality cestování

1 1

1 2

1 3

2 2

2 3

2 3

3 2

3 2

3 3

3 3

3 3

3 3

3 3

3 4

3 4

4 3

4 3

4 4

4 4

4 4

Průzkum spokojenosti cestujících s MHD

1 Velmi nespokojen

2 Nespokojen

3 Spokojen

4 Velmi spokojen

Legenda

Ukázka diskrétního náhodného vektoru – při průzkumu spokojenosti cestujících se systémem MHD nás zajímá více údajů, např. viz tabulka.

Náhodný vektor

• Sdružená (simultánní) distribuční funkce náhodných veličin X a Y je definována vztahem:

.

• Vlastnosti sdružené distribuční funkce:

1.

2.

doc. Ing. Michal Dorda, Ph.D. 4

( ) ( )yYxXPyxF = ;,

( ) ( ) ( ) ( ) .1,;0,,, ==−−=−=− FFyFxF

( ) .1,0 yxF

Náhodný vektor

3. Funkce F(x,y) je neklesající v každé proměnné.

4. Funkce F(x,y) je zleva spojitá v každé proměnné.

5.


( ) ( ) ( )

( ) ( ).;;

;;;

2121

21212211

aaFbaF

abFbbFbYabXaP

+−

−−=

x

y

a1 b1

a2

b2

Náhodný vektor• Podle oboru hodnot, kterých můžou

proměnné X a Y nabývat, rozeznáváme:

– Náhodný vektor s diskrétním rozdělením.

– Náhodný vektor se spojitým rozdělením.


( ) ( )

===xx yy

ji

i j

yYxXPyxF ;,

( ) ( ) − −

=

x y

dsdrsrfyxF ,,

Sdružená pravděpodobnostní funkce

Sdružená hustota pravděpodobnosti

Náhodný vektor

• Pro sdruženou pravděpodobnostní funkci diskrétního náhodného vektoru dále platí:

1.

2.


( ) .1, ===i j

ji yYxXP

( ) .1,0 == ji yYxXP

Náhodný vektor

• Pro sdruženou hustotu pravděpodobnosti spojitého náhodného vektoru dále platí:

1.

2.

3.


( ) .1, yxf

( ) .1, =

−

−

dxdyyxf

( ) ( ) .,;1

1

2

2

2211 =

b

a

b

a

dxdyyxfbYabXaP

Náhodný vektor

• Marginální distribuční funkcí rozumíme distribuční funkci složky X nebo Y.

• Pro diskrétní náhodný vektor potom platí:


( ) ( ) ( )

( ) ( ) ( )yxFyYPyF

yxFxXPxF

xY

yX

,lim

,lim

→

→

==

==

( ) ( )

( ) ( ).;

,;

===

===

i

j

x

iY

y

jX

yYxXPYP

yYxXPxP Marginální pravděpodobnostní funkce

Náhodný vektor

• Pro spojitý náhodný vektor potom platí:


( ) ( )

( ) ( ) .,

,,

dxyxfyf

dyyxfxf

Y

X

−

−

=

=Marginální hustoty pravděpodobnosti

Náhodný vektor

• Nezávislost složek náhodného vektoru:

– Složky X a Y náhodného vektoru jsou navzájem nezávislé, jsou-li nezávislé náhodné proměnné X a Y, tedy:

.

– Náhodný vektor s diskrétním rozdělením:

.

– Náhodný vektor se spojitým rozdělením:

.


( ) ( ) ( )yFxFyxF YX =,

( ) ( ) ( )jYiXji yYPxXPyYxXP ===== ,

( ) ( ) ( )yfxfyxf YX =,

Náhodný vektor

• Sdružená pravděpodobnostní funkce diskrétního dvousložkové náhodného vektoru se často zobrazuje v podobě korelační tabulky.


Náhodný vektor


X / Y1y 2y

1x

2x

mx

ny

( )11; yYxXP ==

( )21; yYxXP ==( )nyYxXP == ;1

( )12; yYxXP ==

( )1; yYxXP m ==

( )22; yYxXP ==

( )nyYxXP == ;2

( )2; yYxXP m ==

( )nm yYxXP == ;

( )=

==m

i

ji yYxXP1

; ( )1yPY ( )2yPY ( )nY yP

( )=

==n

j

ji yYxXP1

;

( )1xPx

( )2xPx

( )mx xP

( ) ( ) 111

====

n

j

jY

m

i

iX yPxP

Náhodný vektor• Podmíněné rozdělení pravděpodobnosti:

– Pro náhodný vektor s diskrétním rozdělením je definována podmíněná pravděpodobnostní funkce ve tvaru:


( ) ( )( )

( )

( ) ( )( )

( ) .0 pro ,

,0 pro ,

==

=====

==

=====

xXPxXP

yYxXPxXyYP

yYPyYP

yYxXPyYxXP

X

X

Y

Y

Náhodný vektor• Podmíněné rozdělení pravděpodobnosti:

– Pro náhodný vektor se spojitým rozdělením je definována podmíněná hustota pravděpodobnosti:


( ) ( )( )

( )

( ) ( )( )

( ) .0 pro ,

,0 pro ,

=

=

xfxf

yxfxyf

yfyf

yxfyxf

X

X

Y

Y

Náhodný vektor

• Číselné charakteristiky náhodného vektoru:

– Smíšený počáteční (obecný) moment řádu k,n:

.

– Pro diskrétní náhodný vektor potom platí:

– Pro spojitý náhodný vektor platí:


( )nk

nk YXE =,

( )= =

===m

i

n

j

ji

n

j

k

ink yYxXPyx1 1

, .;

( ) .,,

−

−

= dydxyxfyx nk

nk

Náhodný vektor

– Smíšený centrální moment řádu k,n:

.

– Pro diskrétní náhodný vektor potom platí:



( ) ( ) nk

nk EYYEXXE −−=,

( ) ( ) ( ).,1 1

, = =

==−−=m

i

n

j

ji

n

j

k

ink yYxXPEYyEXx

( ) ( ) ( ) .,,

−

−

−−= dydxyxfEYyEXxnk

nk

Náhodný vektor

• Marginální číselné charakteristiky složek náhodného vektoru:

– Střední hodnota proměnné X:

– pro diskrétní proměnnou.

– pro spojitou proměnnou.

• Obdobně bychom definovali vztahy pro proměnnou Y.


( )=

==m

i

iXi xPxEX1

0,1

( )dxxfxEX X

−

== 0,1

Náhodný vektor

– Rozptyl proměnné X:

– pro diskrétní

proměnnou.

– pro spojitou

proměnnou.

• Obdobně bychom definovali vztahy pro proměnnou Y.


( ) ( )=

−==m

i

iXi xPEXxDX1

2

0,2

( ) ( )dxxfEXxDX X

−

−==2

0,2

Náhodný vektor

• Nejdůležitější číselnou charakteristikou náhodného vektoru je kovariance – smíšený centrální moment řádu 1,1:

.

– Pro diskrétní náhodný vektor platí:



( ) ( ) ( ) EYYEXXEYXCov −−== 1,1,

( ) ( ) ( ) ( ).,,1 1

= =

==−−=m

i

n

j

jiji yYxXPEYyEXxYXCov

( ) ( ) ( ) .,),(

−

−

−−= dydxyxfEYyEXxYXCov

Náhodný vektor

• Vlastnosti kovariance náhodného vektoru:1.

2.

3.

4. Jsou-li složky X a Y náhodného vektoru nezávislé, potom platí:


( ) ( ) ,, EYEXYXEYXCov −=

( ) ( ) ,,,, DYYYCovDXXXCov ==

( ) ( ),,, XYCovYXCov =

( ) .0, =YXCov

Náhodný vektor

• Kovariance představuje nejjednodušší ukazatel souvislosti dvou náhodných veličin.

• Kladná hodnota kovariance znamená, že s rostoucí proměnnou X roste i proměnná Y.

• Záporná hodnota kovariance znamená, že s rostoucím X klesá Y.

• Kovarianční matice – .


( )

( ) DYYXCov

YXCovDX

,

,

Náhodný vektor

• Jednoduchý korelační koeficient – vyjadřuje míru lineární závislosti (korelaci) mezi složkami X a Y náhodného vektoru, je definován:

.

Pro jednoduchý korelační koeficient platí:

1.

2.


( )0, pro

,,

= DYDX

DYDX

YXCovYX

.1;1, −YX

.,, XYYX =

Náhodný vektor

• Pokud , proměnné X a Y náhodného vektoru jsou nekorelované (lineárně nezávislé).

• Pokud , proměnné X a Y náhodného vektoru jsou pozitivně korelované.

• Pokud , proměnné X a Y náhodného vektoru jsou negativně korelované.


0, =YX

0, YX

0, YX

Náhodný vektor

• Je-li potřeba testovat vzájemnou nezávislost složek náhodného vektoru X a Y, kde X a Y jsou kategoriální proměnné, můžeme použít χ2 test nezávislosti v kombinační (kontingenční) tabulce.

• Kategoriální proměnná je proměnná, kterou nemůžeme měřit, ale pouze zařadit do tříd (např. známka ve škole apod.). Nechť složka X nabývá krůzných variant, složka Y m různých variant.

• Kombinační tabulka je v podstatě tabulka sdružených a marginálních četností.


Náhodný vektor


X / Y y1 y2. . . ym ∑

x1 n11 n12 n1m n1•

x2 n21 n22 n2m n2•

.

.

.

xk nk1 nk2 nkm nk•

∑ n•1 n•2 n•m n

Náhodný vektor

• Test je založen na porovnání empirických (pozorovaných) četností s četnostmi teoretickými.

• V případě nezávislosti platí:

,

kde je příslušná teoretická četnost.


n

nnn

n

n

n

nn

jijiij

••••

=

=*

*

ijn

Náhodný vektor

1. Volba nulové a alternativní hypotézy:

H0 – Náhodné veličiny (znaky) X a Y v kombinační tabulce jsou nezávislé.

H1 – Náhodné veličiny (složky náhodného vektoru) X a Y v kombinační tabulce jsou závislé.


Náhodný vektor

2. Volba testového kritéria a jeho nulového rozdělení (za předpokladu platnosti nulové hypotézy):

.

• S rostoucí hodnotou testové statistiky K roste rozpor naměřených dat s nulovou hypotézou.


( )( ) ( )2

11

1 1*

2*

−−

= =

→−

= mk

k

i

m

j ij

ijij

n

nnK

Náhodný vektor

• Předpoklad testu:

– Žádná teoretická četnost nesmí být menší než 2

– Alespoň 80% teoretických četností musí být větší než 5.

3. Sestavení oboru přijetí a kritického oboru:

.


( ) ( ) ( ) ( ) ( ) 11;2

11;1 −−== −−− mkCHIINVx mkkrit

Náhodný vektor


x

f(x)

xkrit

α1-α

Obor přijetí - Oblast nezamítnutí H0

Kritický obor - Oblast zamítnutí H0

Náhodný vektor

4. Výpočet pozorované hodnoty testové statistiky xobs (za předpokladu platnosti nulové hypotézy).

5. Formulace závěru testu:

– – nezamítáme nulovou hypotézu o nezávislosti náhodných proměnných.

– – zamítáme nulovou hypotézu ve prospěch alternativní hypotézy.


kritobs xx

kritobs xx

Náhodný vektor

• V případě, že není splněn předpoklad výše uvedeného testu, lze použít tzv. Yatesovukorekci, která snižuje hodnotu testového kritéria, je tedy obtížnější zamítnout nulovou hypotézu. Testová statistika je v tomto případě ve tvaru:


( )( ) ( )2

11

1 1*

2* 5,0−−

= =

→−−

= mk

k

i

m

j ij

ijij

Yatesn

nnK

Náhodný vektor

• Uvedený test pouze slouží k rozhodnutí o tom, zda jsou znaky X a Y závislé či nezávislé, ale již nestanovuje, o jak silnou závislost se jedná.

• Pro stanovení síly závislosti zavádíme různé koeficienty, jež jsou obdobou korelačního koeficientu.


Náhodný vektor

• Zavádíme koeficient kontingence definovaný:

kde K je hodnota testového kritéria a n rozsah výběru. Pro čtvercovou kombinační tabulku (k=m) nabývá hodnot .


,nK

KCC

+=

1;0

Náhodný vektor• Pro obdélníkovou kombinační tabulku je

ovšem maximální hodnota koeficientu kontingence rovna:

proto zavádíme korigovaný koeficient kontingence ve tvaru:

který je už v intervalu .


( )( )

,,min

1,minmax

mk

mkCC

−=

,maxCC

CCCCcor =

1;0

Náhodný vektor

• Jako další míra síly závislosti se používá Cramerův koeficient definovaný ve tvaru:

jež nabývá hodnot z intervalu .


( ) ,

1,min −=

mkn

KV

1;0

Date post:	22-Nov-2020
Category:	Documents
Upload:	others
View:	3 times
Download:	0 times

Část III. –Náhodný vektorhomel.vsb.cz/~dor028/Nahodny_vektor.pdfNáhodný vektor doc. Ing....

Documents