+ All Categories
Home > Documents > Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. ·...

Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. ·...

Date post: 17-Aug-2020
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
49
Úvod do analýzy závislosti dvou kvantitativních znaků Martina Litschmannová martina.litschmannova @vsb.cz
Transcript
Page 1: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Úvod do analýzy závislosti dvou kvantitativních znaků

Martina Litschmannová

[email protected]

Page 2: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Jak popsat a vizualizovat závislost mezi výškou a hmotností respondentů?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 2 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 3: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Bodový graf

▪ Korelační koeficient

Jak popsat a vizualizovat závislost mezi výškou a hmotností respondentů?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 3 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 4: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Pearsonův korelační koeficient

▪ Spearmanův korelační koeficient

▪ Koeficient mnohonásobné korelace (Index determinace)

▪ Parciální korelační koeficient

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 4 / 49

Korelační koeficient

Page 5: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Pearsonův korelační koeficient je mírou lineární závislosti mezi 𝑋 a 𝑌 pokud 𝑋1; 𝑌1 , … , 𝑋𝑛; 𝑌𝑛 je

výběr z dvourozměrného normálního rozdělení.

▪ Zjistíme-li, že výběrový korelační koeficient 𝑟 ≠ 0, zpravidla nás zajímá, zda je indikovaná korelace

statisticky významná, tj. velmi zjednodušeně řečeno, zda se korelační koeficient příslušných populačních

dat statisticky významně liší od nuly.

𝑟 𝑋, 𝑌 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌,

kde

𝑛 … rozsah výběru,

𝑥𝑖 … 𝑖-tá hodnota znaku 𝑥 (vysvětlující proměnná),

𝑦𝑖 … 𝑖-tá hodnota znaku 𝑦 (vysvětlovaná proměnná),

ҧ𝑥 (ത𝑦) … průměr znaku 𝑥 (𝑦),

𝑠𝑋 (𝑠𝑌) … výběrová směrodatná odchylka znaku 𝑥 (𝑦)

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 5 / 49

Pearsonův korelační koeficient

Page 6: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Hodnota Pearsonova korelačního koeficientu se pohybuje od -1 do 1.

▪ Hodnoty ±1 nabývá tehdy, pokud všechny body [xi, yi] leží na přímce.

▪ Nule je roven v případě, že veličiny jsou lineárně nezávislé.

▪ Při měření lineární závislosti je znaménko korelačního koeficientu kladné, když obě veličiny X a Yzároveň rostou nebo obě zároveň klesají, a záporné, když jedna z veličin roste, zatímco druhá klesá.

▪ Při užití Pearsonova korelačního koeficientu je vždy třeba posoudit, zda je jeho aplikace vhodná.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 6 / 49

Pearsonův korelační koeficient

Page 7: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Když chceme graficky prezentovat závislost dvou kvantitativních znaků, je pro snadnou interpretaci důležité rozhodnout, který ze znaků je vysvětlující (osa 𝑥) a který je vysvětlovaný (osa 𝑦).

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 7 / 49

Analýza závislosti dvou kvantitativních znaků

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Page 8: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 8 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Page 9: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Nabývají-li pro danou statistickou jednotku oba znaky nadprůměrných hodnot, kor. koeficient se zvyšuje.

▪ Nabývají-li pro danou statistickou jednotku oba znaky podprůměrných hodnot, kor. koeficient se zvyšuje.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 9 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ҧ𝑥

ത𝑦

Page 10: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Nabývají-li pro danou statistickou jednotku oba znaky nadprůměrných (resp. podprůměrných) hodnot, korelační koeficient se zvyšuje.

▪ Nabývá-li pro danou statistickou jednotku jeden znak nadprůměrné hodnoty a druhý znak podprůměrné hodnoty, korelační koeficient se snižuje.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 10 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ത𝑦

ҧ𝑥

Page 11: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Jak „funguje“ Pearsonův korelační koeficient?

▪ Lze ukázat, že korelační koeficient může nabývat hodnot z intervalu −1; 1 .

▪ 𝑟 = 1 ⇔ ∀𝑖 ∈ 1, 2, … , 𝑛 : 𝑦𝑖 = 𝑎𝑥𝑖 + 𝑏, 𝑘𝑑𝑒 𝑎, 𝑏 ∈ ℝ (mezi proměnnými je lineární závislost)

▪ Korelační koeficient (Pearsonův) je mírou lineární závislosti!!!

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 11 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

40

50

60

70

80

90

100

110

160 170 180 190 200

váh

a (k

g)

výška (cm)

ത𝑦

ҧ𝑥

Page 12: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 12 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

▪ −1 ≤ 𝑟 𝑋, 𝑌 ≤ 1,

▪ 𝑟 𝑋, 𝑌 = 𝑟 𝑌, 𝑋 ,

▪ 𝑟 𝑋, 𝑋 = 1,

▪ je-li 𝑟 𝑋, 𝑌 = 0, říkáme, že 𝑋, 𝑌 jsou nekorelované znaky,

▪ je-li 𝑟 𝑋, 𝑌 > 0, říkáme, že 𝑋, 𝑌 jsou pozitivně korelované

(s rostoucím 𝑋 roste 𝑌),

▪ je-li 𝑟 𝑋, 𝑌 < 0, říkáme, že 𝑋, 𝑌 jsou negativně korelované

(s rostoucím 𝑋 klesá 𝑌),

▪ je-li 𝑟 𝑋, 𝑌 = 1, pak je mezi 𝑋 a 𝑌 lineární závislost.

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Page 13: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 13 / 49

Pearsonův korelační koeficient

Page 14: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 14 / 49

Pearsonův korelační koeficient

Page 15: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 15 / 49

Pearsonův korelační koeficient

Page 16: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 16 / 49

Pearsonův korelační koeficient

Page 17: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 17 / 49

Pearsonův korelační koeficient

Page 18: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 18 / 49

Pearsonův korelační koeficient

Page 19: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 19 / 49

Pearsonův korelační koeficient

Page 20: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 20 / 49

Pearsonův korelační koeficient

Page 21: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 21 / 49

Pearsonův korelační koeficient

Page 22: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 22 / 49

Pearsonův korelační koeficient

Page 23: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 23 / 49

Pearsonův korelační koeficient

Page 24: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 24 / 49

Pearsonův korelační koeficient

Page 25: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 25 / 49

Pearsonův korelační koeficient

Page 26: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 26 / 49

Pearsonův korelační koeficient

Page 27: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 27 / 49

Pearsonův korelační koeficient

Page 28: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 28 / 49

Pearsonův korelační koeficient

Page 29: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 29 / 49

Pearsonův korelační koeficient

Page 30: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 30 / 49

Pearsonův korelační koeficient

Page 31: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 31 / 49

Pearsonův korelační koeficient

Page 32: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 32 / 49

Pearsonův korelační koeficient

Page 33: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 33 / 49

Pearsonův korelační koeficient - hra

Guess the Correlation Gamehttp://guessthecorrelation.com/

Page 34: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 34 / 49

Pearsonův korelační koeficient - hra

Guess the Correlation Gamehttp://guessthecorrelation.com/

Page 35: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 35 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

𝒓 = 𝟎, 𝟔𝟏𝟒𝟔

40

50

60

70

80

90

100

110

160 170 180 190 200

hm

otn

ost

(kg)

výška (cm)

Page 36: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Tipněte si, které dva znaky jsou negativně korelovány.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 36 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 37: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Tipněte si, které dva znaky jsou negativně korelovány.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 37 / 49

Analýza závislosti dvou kvantitativních znaků

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 38: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Vizualizace – bodový graf

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 38 / 49

Analýza závislosti dvou kvantitativních znaků

▪ Pearsonův výběrový korelační koeficient

𝑟 =1

𝑛−1∙σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 𝑦𝑖−ത𝑦

𝑠𝑋∙𝑠𝑌

𝒓 = −𝟎, 𝟏𝟑𝟕𝟎

0

5

10

15

20

25

30

35

40

45

50

0 10 20 30 40 50 60

čas

věn

ova

stu

diu

(h

/týd

en)

čas věnovaný brigádě (h/týden)

Page 39: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem.

To samotná korelovanost nedovoluje rozhodnout.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 39 / 49

Pozor na falešnou (zdánlivou) korelaci!

Silná korelace

Page 40: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem.

To samotná korelovanost nedovoluje rozhodnout.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 40 / 49

Pozor na falešnou (zdánlivou) korelaci!

0

5

10

15

20

25

30

35

0

1

2

3

4

5

6

7

8

9

10

1998 2000 2002 2004 2006 2008 2010

Am

eric

ké v

ýdaj

e n

a vě

du

, ves

mír

výzk

um

a

tech

no

logi

e (m

iliar

dy

do

larů

)

Seb

evra

ždy

ob

ěšen

ím a

ušk

rcen

ím (

po

čet

mer

tvýc

h

v U

SA)

tisí

ce

Sebevraždy oběšením a uškrcením (počet mertvých v USA)

Americké výdaje na vědu, vesmírná výzkum a technologie (miliardy dolarů)

𝑟=0,99

Page 41: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Zdroj: http://zpravy.aktualne.cz/zahranici/k-nobelove-cene-dopomaha-cokolada-naznacuje-studie/r~i:article:760147/

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 41 / 49

Pozor na falešnou (zdánlivou) korelaci!

Page 42: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

V praxi se zpravidla hodnota koeficientu korelace interpretuje takto:

▪ Mezi proudem a napětím na odporu byl zjištěn korelační koeficient 0,6.

▪ Mezi školním prospěchem a pocitem deprese u dětí byl zjištěn korelační koeficient 0,6.

Výsledky interpretujte!

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 42 / 49

Pozor na hodnocení „síly“ korelace!

Korelační koeficient Typ lineární závislosti

𝑟 = 0,0 neexistující

𝑟 ∈ ሺ0,0; ۧ0,3 velmi slabá

𝑟 ∈ ሺ0,3; ۧ0,7 středně silná

𝑟 ∈ ሺ0,7; ሻ1,0 těsná

𝑟 = 1,0 funkční

Page 43: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Neparametrický korelační koeficient, který je robustní vůči odlehlým hodnotám a obecně odchylkám od

normality.

▪ Spearmanův korelační koeficient je mírou monotónní závislosti mezi 𝑋 a 𝑌 (nemusí jít o závislost

lineární).

▪ Zjistíme-li, že výběrový korelační koeficient 𝑟𝑆𝑃 ≠ 0, zpravidla nás zajímá, zda je indikovaná korelace

statisticky významná, tj. velmi zjednodušeně řečeno, zda se korelační koeficient příslušných populačních

dat statisticky významně liší od nuly.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 43 / 49

Spearmanův korelační koeficient

Page 44: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Mějme náhodný výběr 𝑋1; 𝑌1 , … , 𝑋𝑛; 𝑌𝑛 z dvourozměrného rozdělení. Nechť 𝑅𝑋1 , … , 𝑅𝑋𝑛 jsou pořadí

veličin 𝑋1, … , 𝑋𝑛 a nechť 𝑅𝑌1 , … , 𝑅𝑌𝑛 jsou pořadí veličin 𝑌1, … , 𝑌𝑛.

𝑟𝑆 = 1 −6

𝑛 𝑛2−1σ𝑖=1𝑛 𝑅𝑋1 − 𝑅𝑌1

2

Pokud se v náhodných výběrech, z nichž je 𝑟𝑆 počítán, vyskytuje mnoho shod (tj. stejně velkýchpozorování), doporučuje se používat korigovaný Spearmanův korelační koeficient 𝑟𝑆𝑘𝑜𝑟𝑖𝑔.

𝑟𝑆𝑘𝑜𝑟𝑖𝑔 = 1 −6

𝑛3 − 𝑛 − 𝑇𝑋 − 𝑇𝑌

𝑖=1

𝑛

𝑅𝑋1 − 𝑅𝑌12

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 44 / 49

Spearmanův korelační koeficient

Page 45: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 45 / 49

Srovnání Pearsonova a Spearmanova korel. koeficientu

𝜌 𝑋, 𝑌 = 1,000 𝜌 𝑋, 𝑌 = -1,000 𝜌 𝑋, 𝑌 = 0,000 𝜌 𝑋, 𝑌 = 0,934

𝜌 𝑋, 𝑌 = 0,967 𝜌 𝑋, 𝑌 = 0,857 𝜌 𝑋, 𝑌 = -0,143 𝜌 𝑋, 𝑌 = 0,608

𝜌𝑆 𝑋, 𝑌 = 1,000 𝜌𝑆 𝑋, 𝑌 = -1,000 𝜌𝑆 𝑋, 𝑌 = 0,000 𝜌𝑆 𝑋, 𝑌 = 1,000

𝜌𝑆 𝑋, 𝑌 = 0,981 𝜌𝑆 𝑋, 𝑌 = 0,893 𝜌𝑆 𝑋, 𝑌 = -0,178 𝜌𝑆 𝑋, 𝑌 = 0,911

Page 46: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Nechť 𝑿 = 𝑋1, … , 𝑋𝑘𝑇 je náhodný vektor, potom matici

𝑅 𝑿 =𝑟 𝑋1, 𝑋1 ⋯ 𝑟 𝑋1, 𝑋𝑘

⋮ ⋱ ⋮𝑟 𝑋𝑘, 𝑋1 ⋯ 𝑟 𝑋𝑘, 𝑋𝑘

nazýváme korelační matici náhodného vektoru 𝑿.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 46 / 49

Korelační matice

Page 47: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

Nechť 𝒁 = 𝑌, 𝑋1, … , 𝑋𝑘𝑇. Označme 𝑿 = 𝑋1, … , 𝑋𝑘

𝑇. Pak koeficient mnohonásobné korelace 𝑟 𝑌 ∙ 𝑿

mezi náhodnou veličinou 𝑌 a náhodným vektorem 𝑿 vypočteme dle

𝑟 𝑌 ∙ 𝑿 = 1 −detሺ𝑅ሺ𝒁ሻሻ

detሺ𝑅ሺ𝑿ሻሻ

▪ Druhou mocninu 𝑟 𝑌 ∙ 𝑿 nazýváme index determinace a značíme ji 𝑅2.

▪ Index determinace je standardním výstupem lineární regrese.

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 47 / 49

Koeficient mnohonásobné korelace

Page 48: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/ZS/Prezentace/korelace.pdf · 2020. 1. 31. · Pearsonůvkorelační koeficient je mírou lineární závislosti mezi a pokud 1;

▪ Korelační koeficient 𝑟ሺ𝑋, 𝑌ሻ mezi náhodnými veličinami 𝑋 a 𝑌 může být vysoký proto, že obě náhodné

veličiny jsou silně závislé na náhodném vektoru 𝒁 = 𝑍1, … , 𝑍𝑛𝑇.

▪ Proto nás mnohdy zajímá, jaká je korelace mezi 𝑋 a 𝑌 při vyloučení vlivu, který je způsoben vlivem

náhodného vektoru 𝒁, tj. parciální korelační koeficient 𝑟 𝑋, 𝑌 ∙ 𝒁 .

𝑟 𝑋, 𝑌 ∙ 𝒁 =𝑟 𝑋, 𝑌 − 𝑟 𝑋 ∙ 𝒁 ∙ 𝑟 𝑌 ∙ 𝒁

1 − 𝑟2 𝑋 ∙ 𝒁 ∙ 1 − 𝑟2 𝑌 ∙ 𝒁

Příklad:

H … tělesná hmotnost, V … tělesná výška, S … výkon ve skoku vysokém (dle M. Sebery)

𝑟 𝐻, 𝑉 = 0,91𝑟 𝑉, 𝑆 = 0,86𝑟 𝐻, 𝑆 = 0,69

Litschmannová Martina, 2020 Analýza závislosti dvou kvantitativních znaků 48 / 49

Parciální korelační koeficient

𝑟 𝐻, 𝑆 ∙ 𝑉 =0,69−0,91∙0,86

1−0,912 1−0,862= −0,44


Recommended