Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. ·...

Post on 17-Aug-2020

0 views 0 download

transcript

Úvod do analýzy závislosti dvou kvantitativních znaků

Martina Litschmannová

martina.litschmannova@vsb.cz

Jak popsat a vizualizovat závislost mezi výškou a hmotností respondentů?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 2 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

▪ Bodový graf

▪ Korelační koeficient

Jak popsat a vizualizovat závislost mezi výškou a hmotností respondentů?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 3 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

▪ Pearsonův korelační koeficient

▪ Spearmanův korelační koeficient

▪ Koeficient mnohonásobné korelace (Index determinace)

▪ Parciální korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 4 / 49

Korelační koeficient

▪ Pearsonův korelační koeficient je mírou lineární závislosti mezi 𝑋 a 𝑌 pokud 𝑋1; 𝑌1 , … , 𝑋𝑛; 𝑌𝑛 je

výběr z dvourozměrného normálního rozdělení.

▪ Zjistíme-li, že výběrový korelační koeficient 𝑟 ≠ 0, zpravidla nás zajímá, zda je indikovaná korelace

statisticky významná, tj. velmi zjednodušeně řečeno, zda se korelační koeficient příslušných populačních

dat statisticky významně liší od nuly.

𝑟 𝑋, 𝑌 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌,

kde

𝑛 … rozsah výběru,

𝑥𝑖 … 𝑖-tá hodnota znaku 𝑥 (vysvětlující proměnná),

𝑦𝑖 … 𝑖-tá hodnota znaku 𝑦 (vysvětlovaná proměnná),

ҧ𝑥 (ത𝑦) … průměr znaku 𝑥 (𝑦),

𝑠𝑋 (𝑠𝑌) … výběrová směrodatná odchylka znaku 𝑥 (𝑦)

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 5 / 49

Pearsonův korelační koeficient

▪ Hodnota Pearsonova korelačního koeficientu se pohybuje od -1 do 1.

▪ Hodnoty ±1 nabývá tehdy, pokud všechny body [xi, yi] leží na přímce.

▪ Nule je roven v případě, že veličiny jsou lineárně nezávislé.

▪ Při měření lineární závislosti je znaménko korelačního koeficientu kladné, když obě veličiny X a Yzároveň rostou nebo obě zároveň klesají, a záporné, když jedna z veličin roste, zatímco druhá klesá.

▪ Při užití Pearsonova korelačního koeficientu je vždy třeba posoudit, zda je jeho aplikace vhodná.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 6 / 49

Pearsonův korelační koeficient

▪ Vizualizace – bodový graf

Když chceme graficky prezentovat závislost dvou kvantitativních znaků, je pro snadnou interpretaci důležité rozhodnout, který ze znaků je vysvětlující (osa 𝑥) a který je vysvětlovaný (osa 𝑦).

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 7 / 49

Analýza závislosti dvou kvantitativních znaků

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 8 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Nabývají-li pro danou statistickou jednotku oba znaky nadprůměrných hodnot, kor. koeficient se zvyšuje.

▪ Nabývají-li pro danou statistickou jednotku oba znaky podprůměrných hodnot, kor. koeficient se zvyšuje.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 9 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ҧ𝑥

ത𝑦

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Nabývají-li pro danou statistickou jednotku oba znaky nadprůměrných (resp. podprůměrných) hodnot, korelační koeficient se zvyšuje.

▪ Nabývá-li pro danou statistickou jednotku jeden znak nadprůměrné hodnoty a druhý znak podprůměrné hodnoty, korelační koeficient se snižuje.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 10 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ത𝑦

ҧ𝑥

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Lze ukázat, že korelační koeficient může nabývat hodnot z intervalu −1; 1 .

▪ 𝑟 = 1 ⇔ ∀𝑖 ∈ 1, 2, … , 𝑛 : 𝑦𝑖 = 𝑎𝑥𝑖 + 𝑏, 𝑘𝑑𝑒 𝑎, 𝑏 ∈ ℝ (mezi proměnnými je lineární závislost)

▪ Korelační koeficient (Pearsonův) je mírou lineární závislosti!!!

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 11 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ത𝑦

ҧ𝑥

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 12 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

▪ −1 ≤ 𝑟 𝑋, 𝑌 ≤ 1,

▪ 𝑟 𝑋, 𝑌 = 𝑟 𝑌, 𝑋 ,

▪ 𝑟 𝑋, 𝑋 = 1,

▪ je-li 𝑟 𝑋, 𝑌 = 0, říkáme, že 𝑋, 𝑌 jsou nekorelované znaky,

▪ je-li 𝑟 𝑋, 𝑌 > 0, říkáme, že 𝑋, 𝑌 jsou pozitivně korelované

(s rostoucím 𝑋 roste 𝑌),

▪ je-li 𝑟 𝑋, 𝑌 < 0, říkáme, že 𝑋, 𝑌 jsou negativně korelované

(s rostoucím 𝑋 klesá 𝑌),

▪ je-li 𝑟 𝑋, 𝑌 = 1, pak je mezi 𝑋 a 𝑌 lineární závislost.

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 13 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 14 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 15 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 16 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 17 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 18 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 19 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 20 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 21 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 22 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 23 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 24 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 25 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 26 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 27 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 28 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 29 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 30 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 31 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 32 / 49

Pearsonův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 33 / 49

Pearsonův korelační koeficient - hra

Guess the Correlation Gamehttp://guessthecorrelation.com/

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 34 / 49

Pearsonův korelační koeficient - hra

Guess the Correlation Gamehttp://guessthecorrelation.com/

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 35 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

𝒓 = 𝟎, 𝟔𝟏𝟒𝟔

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Tipněte si, které dva znaky jsou negativně korelovány.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 36 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Tipněte si, které dva znaky jsou negativně korelovány.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 37 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 38 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

𝒓 = −𝟎, 𝟏𝟑𝟕𝟎

0

5

10

15

20

25

30

35

40

45

50

0 10 20 30 40 50 60

čas

věn

ova

stu

diu

(h

/týd

en)

čas věnovaný brigádě (h/týden)

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem.

To samotná korelovanost nedovoluje rozhodnout.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 39 / 49

Pozor na falešnou (zdánlivou) korelaci!

Silná korelace

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem.

To samotná korelovanost nedovoluje rozhodnout.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 40 / 49

Pozor na falešnou (zdánlivou) korelaci!

0

5

10

15

20

25

30

35

0

1

2

3

4

5

6

7

8

9

10

1998 2000 2002 2004 2006 2008 2010

Am

eric

ké v

ýdaj

e n

a vě

du

, ves

mír

výzk

um

a

tech

no

logi

e (m

iliar

dy

do

larů

)

Seb

evra

ždy

ob

ěšen

ím a

ušk

rcen

ím (

po

čet

mer

tvýc

h

v U

SA)

tisí

ce

Sebevraždy oběšením a uškrcením (počet mertvých v USA)

Americké výdaje na vědu, vesmírná výzkum a technologie (miliardy dolarů)

𝑟=0,99

Zdroj: http://zpravy.aktualne.cz/zahranici/k-nobelove-cene-dopomaha-cokolada-naznacuje-studie/r~i:article:760147/

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 41 / 49

Pozor na falešnou (zdánlivou) korelaci!

V praxi se zpravidla hodnota koeficientu korelace interpretuje takto:

▪ Mezi proudem a napětím na odporu byl zjištěn korelační koeficient 0,6.

▪ Mezi školním prospěchem a pocitem deprese u dětí byl zjištěn korelační koeficient 0,6.

Výsledky interpretujte!

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 42 / 49

Pozor na hodnocení „síly“ korelace!

Korelační koeficient Typ lineární závislosti

𝑟 = 0,0 neexistující

𝑟 ∈ ሺ0,0; ۧ0,3 velmi slabá

𝑟 ∈ ሺ0,3; ۧ0,7 středně silná

𝑟 ∈ ሺ0,7; ሻ1,0 těsná

𝑟 = 1,0 funkční

▪ Neparametrický korelační koeficient, který je robustní vůči odlehlým hodnotám a obecně odchylkám od

normality.

▪ Spearmanův korelační koeficient je mírou monotónní závislosti mezi 𝑋 a 𝑌 (nemusí jít o závislost

lineární).

▪ Zjistíme-li, že výběrový korelační koeficient 𝑟𝑆𝑃 ≠ 0, zpravidla nás zajímá, zda je indikovaná korelace

statisticky významná, tj. velmi zjednodušeně řečeno, zda se korelační koeficient příslušných populačních

dat statisticky významně liší od nuly.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 43 / 49

Spearmanův korelační koeficient

Mějme náhodný výběr 𝑋1; 𝑌1 , … , 𝑋𝑛; 𝑌𝑛 z dvourozměrného rozdělení. Nechť 𝑅𝑋1 , … , 𝑅𝑋𝑛 jsou pořadí

veličin 𝑋1, … , 𝑋𝑛 a nechť 𝑅𝑌1 , … , 𝑅𝑌𝑛 jsou pořadí veličin 𝑌1, … , 𝑌𝑛.

𝑟𝑆 = 1 −6

𝑛 𝑛2−1σ𝑖=1𝑛 𝑅𝑋1 − 𝑅𝑌1

2

Pokud se v náhodných výběrech, z nichž je 𝑟𝑆 počítán, vyskytuje mnoho shod (tj. stejně velkýchpozorování), doporučuje se používat korigovaný Spearmanův korelační koeficient 𝑟𝑆𝑘𝑜𝑟𝑖𝑔.

𝑟𝑆𝑘𝑜𝑟𝑖𝑔 = 1 −6

𝑛3 − 𝑛 − 𝑇𝑋 − 𝑇𝑌

𝑖=1

𝑛

𝑅𝑋1 − 𝑅𝑌12

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 44 / 49

Spearmanův korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 45 / 49

Srovnání Pearsonova a Spearmanova korel. koeficientu

𝜌 𝑋, 𝑌 = 1,000 𝜌 𝑋, 𝑌 = -1,000 𝜌 𝑋, 𝑌 = 0,000 𝜌 𝑋, 𝑌 = 0,934

𝜌 𝑋, 𝑌 = 0,967 𝜌 𝑋, 𝑌 = 0,857 𝜌 𝑋, 𝑌 = -0,143 𝜌 𝑋, 𝑌 = 0,608

𝜌𝑆 𝑋, 𝑌 = 1,000 𝜌𝑆 𝑋, 𝑌 = -1,000 𝜌𝑆 𝑋, 𝑌 = 0,000 𝜌𝑆 𝑋, 𝑌 = 1,000

𝜌𝑆 𝑋, 𝑌 = 0,981 𝜌𝑆 𝑋, 𝑌 = 0,893 𝜌𝑆 𝑋, 𝑌 = -0,178 𝜌𝑆 𝑋, 𝑌 = 0,911

Nechť 𝑿 = 𝑋1, … , 𝑋𝑘𝑇 je náhodný vektor, potom matici

𝑅 𝑿 =𝑟 𝑋1, 𝑋1 ⋯ 𝑟 𝑋1, 𝑋𝑘

⋮ ⋱ ⋮𝑟 𝑋𝑘, 𝑋1 ⋯ 𝑟 𝑋𝑘, 𝑋𝑘

nazýváme korelační matici náhodného vektoru 𝑿.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 46 / 49

Korelační matice

Nechť 𝒁 = 𝑌, 𝑋1, … , 𝑋𝑘𝑇. Označme 𝑿 = 𝑋1, … , 𝑋𝑘

𝑇. Pak koeficient mnohonásobné korelace 𝑟 𝑌 ∙ 𝑿

mezi náhodnou veličinou 𝑌 a náhodným vektorem 𝑿 vypočteme dle

𝑟 𝑌 ∙ 𝑿 = 1 −detሺ𝑅ሺ𝒁ሻሻ

detሺ𝑅ሺ𝑿ሻሻ

▪ Druhou mocninu 𝑟 𝑌 ∙ 𝑿 nazýváme index determinace a značíme ji 𝑅2.

▪ Index determinace je standardním výstupem lineární regrese.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 47 / 49

Koeficient mnohonásobné korelace

▪ Korelační koeficient 𝑟ሺ𝑋, 𝑌ሻ mezi náhodnými veličinami 𝑋 a 𝑌 může být vysoký proto, že obě náhodné

veličiny jsou silně závislé na náhodném vektoru 𝒁 = 𝑍1, … , 𝑍𝑛𝑇.

▪ Proto nás mnohdy zajímá, jaká je korelace mezi 𝑋 a 𝑌 při vyloučení vlivu, který je způsoben vlivem

náhodného vektoru 𝒁, tj. parciální korelační koeficient 𝑟 𝑋, 𝑌 ∙ 𝒁 .

𝑟 𝑋, 𝑌 ∙ 𝒁 =𝑟 𝑋, 𝑌 − 𝑟 𝑋 ∙ 𝒁 ∙ 𝑟 𝑌 ∙ 𝒁

1 − 𝑟2 𝑋 ∙ 𝒁 ∙ 1 − 𝑟2 𝑌 ∙ 𝒁

Příklad:

H … tělesná hmotnost, V … tělesná výška, S … výkon ve skoku vysokém (dle M. Sebery)

𝑟 𝐻, 𝑉 = 0,91𝑟 𝑉, 𝑆 = 0,86𝑟 𝐻, 𝑆 = 0,69

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 48 / 49

Parciální korelační koeficient

𝑟 𝐻, 𝑆 ∙ 𝑉 =0,69−0,91∙0,86

1−0,912 1−0,862= −0,44

Děkuji za pozornost!martina.litschmannova@vsb.cz