+ All Categories
Home > Documents > EXPLORATORNÍ STATISTIKA

EXPLORATORNÍ STATISTIKA

Date post: 11-Jan-2016
Category:
Upload: lowell
View: 35 times
Download: 1 times
Share this document with a friend
Description:
EXPLORATORNÍ STATISTIKA. Co je to statistika?. Číselné údaje o hromadných jevech . Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy. Základní pojmy. - PowerPoint PPT Presentation
54
EXPLORATORNÍ STATISTIKA
Transcript
Page 1: EXPLORATORNÍ STATISTIKA

EXPLORATORNÍ STATISTIKA

Page 2: EXPLORATORNÍ STATISTIKA

Co je to statistika?

• Číselné údaje o hromadných jevech.

• Sběr, zpracování a vyhodnocování stat. údajů.

• Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy.

2

Page 3: EXPLORATORNÍ STATISTIKA

Základní pojmy

Hromadný jev - jev vyskytující se v masovém měřítku u velkého počtu prvků (statistických jednotek).

Vlastnosti statistických jednotek vyjadřují statistické znaky (proměnné).

3

Page 4: EXPLORATORNÍ STATISTIKA

Typy proměnných

4

Page 5: EXPLORATORNÍ STATISTIKA

Kategoriální proměnná nominální (nemá smysl uspořádání)

5

Page 6: EXPLORATORNÍ STATISTIKA

Číselné charakteristiky

TABULKA ROZDĚLENÍ ČETNOSTI

Hodnotyxi

Absolutní četnostini

Relativní četnostipi

x1 n1

x2 n2

xk nk

Celkem: 1

+ Modus

6

Page 7: EXPLORATORNÍ STATISTIKA

7

Grafické znázornění

A) Histogram – sloupcový graf (bar chart)

Page 8: EXPLORATORNÍ STATISTIKA

Co lze vyčíst z histogramu

Doc. Ing. Milan Hutyra, CSc. : Managment jakosti

(CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

8

Page 9: EXPLORATORNÍ STATISTIKA

9

Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart)

Page 10: EXPLORATORNÍ STATISTIKA

10

PříkladMinulý týden jsme zpracovali anketu týkající se názoru na

zavedení školného na vysokých školách.

Výsledky prezentuje následující graf:

Page 11: EXPLORATORNÍ STATISTIKA

11

Příklad

Níže uvedená data představují částečný výsledek zaznamenaný při průzkumu zatížení jedné z ostravských křižovatek, a to barvu projíždějících automobilů. Data vyhodnoťte a graficky znázorněte.

Page 12: EXPLORATORNÍ STATISTIKA

12

Řešení

Page 13: EXPLORATORNÍ STATISTIKA

13

Kategoriální proměnná ordinální (má smysl uspořádání)

Page 14: EXPLORATORNÍ STATISTIKA

14

Číselné charakteristikyTABULKA ROZDĚLENÍ ČETNOSTI

Hodnotyxi

Absolutní četnostini

Relativní četnostipi

Kumulativní četnostimi

Kumulativní relativní četnosti

Fi

x1 n1

x2 n2

xk nk

Celkem: 1

+ Modus

Page 15: EXPLORATORNÍ STATISTIKA

15

Grafické znázornění

A) Histogram – sloupcový graf (bar chart)

Page 16: EXPLORATORNÍ STATISTIKA

16

Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart)

Page 17: EXPLORATORNÍ STATISTIKA

17

Grafické znázornění

C) Polygon kumulativních četností

(Galtonova ogiva, S-křivka)

Page 18: EXPLORATORNÍ STATISTIKA

18

Grafické znázornění

D) Paretův graf

Page 19: EXPLORATORNÍ STATISTIKA

Paretův graf

Doc. Ing. Milan Hutyra, CSc. : Managment jakosti

(CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

19

Page 20: EXPLORATORNÍ STATISTIKA

20

Příklad

Následující data představují velikosti triček prodaných při výprodeji firmy TRIKO.

 

S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M

a) Data vyhodnoťte a graficky znázorněte.

b) Určete kolik procent lidí si koupilo tričko velikosti nejvýše L.

Page 21: EXPLORATORNÍ STATISTIKA

21

Řešení

Page 22: EXPLORATORNÍ STATISTIKA

Kvantitativní (numerická) proměnná

22

Page 23: EXPLORATORNÍ STATISTIKA

23

Číselné charakteristiky

A) Míry polohy

B) Míry variability

Page 24: EXPLORATORNÍ STATISTIKA

24

Míry polohy

Page 25: EXPLORATORNÍ STATISTIKA

25

Aritmetický průměr

n

xx

n

ii

1

Page 26: EXPLORATORNÍ STATISTIKA

26

Vlastnosti aritmet. průměru

1.

neboli: Součet odchylek od průměru je 0.

2.

neboli: Přičteme-li ke každé hodnotě dat. souboru konstantu, průměr se o tuto konstantu změní.

3.

neboli: Vynásobíme-li každou hodnotu dat. souboru konstantou, průměr se změní také s násobkem této konstanty.

01

n

ii xx

xan

xa

n

xxa

n

ii

n

ii

!!:

xbn

bx

n

xxb

n

ii

n

ii

!!:

Page 27: EXPLORATORNÍ STATISTIKA

27

Průměr není rezistentní vůči

odlehlým pozorováním

!!!!

Page 28: EXPLORATORNÍ STATISTIKA

28

Kvantily

100p %-ní kvantil xp

odděluje 100p% menších hodnot od zbytku souboru

(100p% hodnot datového souboru je menších než toto číslo.)

Page 29: EXPLORATORNÍ STATISTIKA

29

Jak se kvantily určují

• Výběrový soubor uspořádáme podle velikosti• Jednotlivým hodnotám proměnné přiřadíme

pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru)

• 100p%- ní kvantil je roven hodnotě proměnné s pořadím zp, kde: , přičemž zp zaokrouhlujeme na celá čísla !!!!!

5,0npz p

Page 30: EXPLORATORNÍ STATISTIKA

30

Význačné kvantily

• KvartilyDolní kvartil x0,25

Medián x0,5 Horní kvartil x0,75

• Decily – x0,1; x0,2; ... ; x0,9

• Percentily – x0,01; x0,02; …; x0,99

• Minimum xmin a Maximum xmax

Page 31: EXPLORATORNÍ STATISTIKA

31

PříkladNásledující data představují věk hudebníků vystupujících na přehlídce dechových orchestrů. Proměnnou věk považujte za spojitou. Určete:

a)Mediánb)Dolní kvartilc)Horní kvartild)První decil

Page 32: EXPLORATORNÍ STATISTIKA

32

Interkvartilové rozpětí

25,075,0 xxIQR

Užití: např. při identifikaci odlehlých pozorování

Page 33: EXPLORATORNÍ STATISTIKA

33

MAD

• Medián absolutních odchylek od mediánu

• Pomocná proměnná sloužící k identifikaci odlehlých pozorování

Page 34: EXPLORATORNÍ STATISTIKA

34

PříkladPro data z předcházejícího příkladu určete MAD.

355,0 x MAD = 8

Page 35: EXPLORATORNÍ STATISTIKA

35

Identifikace odlehlých pozorování• 1,5 násobek IQR

• Z-souřadnice

• Mediánová souřadnice

mpozorováníodlehlýmjexIQRxxIQRxx iii 5,15,1 75,025,0

s

xxsouřz i

i

.

mpozorováníodlehlýmjexsouřz ii 3.

MAD

xxsouřmediánová i

i .483,1. 5,0

mpozorováníodlehlýmjexsouřmediánová ii 3.

Page 36: EXPLORATORNÍ STATISTIKA

36

PříkladV datech z předcházejícího příkladu identifikujte odlehlá pozorování:

a) Pomocí IQR

Odlehlé pozorování: 82

Vnitřní hradby

Page 37: EXPLORATORNÍ STATISTIKA

37

b) Pomocí z-souřadnice, resp. med.-souřadnice

PříkladV datech z předcházejícího příkladu identifikujte odlehlá pozorování:

Page 38: EXPLORATORNÍ STATISTIKA

38

Shorth

nejkratší interval,

v němž leží alespoň 50% hodnot proměnné

Page 39: EXPLORATORNÍ STATISTIKA

39

PříkladPro data z předcházejícího příkladu určete shorth.

Shorth = 43;34

Page 40: EXPLORATORNÍ STATISTIKA

40

Modus

střed shorthu

Page 41: EXPLORATORNÍ STATISTIKA

41

Příklad:Pro data z předcházejícího příkladu určete modus.

Shorth =

Modus:

43;34

5,382

4334ˆ

x

Modus = 38,5 let, tj. typický věk hudebníka vystupujícího na přehlídce dech. orchestrů je 38,5 let.

Page 42: EXPLORATORNÍ STATISTIKA

42

Míry variability

Page 43: EXPLORATORNÍ STATISTIKA

43

Výběrový rozptyl

1

1

2

2

n

xxs

n

ii

Page 44: EXPLORATORNÍ STATISTIKA

44

Vlastnosti výběrového rozptylu

1. Výběrový rozptyl konstanty je roven 0,neboli: jsou-li všechny hodnoty proměnné stejné, soubor má nulovou rozptýlenost.

2.

neboli: přičteme-li ke všem hodnotám proměnné konstantu, výběrový rozptyl se nezmění.

3.

neboli: vynásobíme-li všechny hodnoty proměnné konstantou, výběrový rozptyl se zvětší kvadrátem této konstanty (b2 krát)

21

2

1

2

21

2

2

111: x

n

ii

n

ii

yii

n

ii

x sn

xx

n

xaxasxay

n

xxsRa

221

22

1

22

1

2

21

2

2

1111: x

n

ii

n

ii

n

ii

yii

n

ii

x sbn

xxb

n

xxb

n

xbbxsbxy

n

xxsRb

Page 45: EXPLORATORNÍ STATISTIKA

45

Nevýhoda výběrového rozptylu

Rozměr rozptylu charakteristiky je

druhou mocninou rozměru proměnné.

Page 46: EXPLORATORNÍ STATISTIKA

46

Výběrová směrodatná odchylka

1

1

2

2

n

xxss

n

ii

Page 47: EXPLORATORNÍ STATISTIKA

47

Nevýhody výb. směr. odchylky a výb. rozptylu

Neumožňují srovnání rozptylu proměnných, které mají různé rozměry (jednotky).

Page 48: EXPLORATORNÍ STATISTIKA

48

Variační koeficient

%100x

sVx

(Směrodatná odchylka v procentech aritmetického průměru)

- Čím nižší var. koeficient, tím homogennější soubor.

- Vx>50% značí silně rozptýlený soubor.

Page 49: EXPLORATORNÍ STATISTIKA

49

Výběrová šikmost

3

1

3

21 s

xx

nn

na

n

ii

0

10

20

30

40

50

60

1 2 3 4 5 6 7

0

10

20

30

40

50

60

1 2 3 4 5 6 7

0

10

20

30

40

50

60

1 2 3 4 5 6 7

a=0 a>0 a<0

Page 50: EXPLORATORNÍ STATISTIKA

Jaký je vztah mezi šikmostí, mediánem a průměrem?

Úkoly:

V appletu generujte histogram odpovídající dat. souboru symetrickému (b=0), pozitivně zešikmenému (b>0) a negativně zešikmenému (b<0) a sledujte:

1. Průměrnou odchylku od průměru a průměrnou odchylku

od mediánu.

1. Vztah mezi průměrem a mediánem.

David M. Lane – Rice Virtual Lab in Statistics, Mean and Median

50

Page 51: EXPLORATORNÍ STATISTIKA

Jaký je vztah mezi šikmostí, mediánem a průměrem?

51

Symetrická data Pozitivně zešikmená data

Negativně zešikmená data

0

10

20

30

40

50

60

1 2 3 4 5 6 7

0

10

20

30

40

50

60

1 2 3 4 5 6 7

0

10

20

30

40

50

60

1 2 3 4 5 6 7

Průměr = medián

Polovina dat.souboru je menší než průměr

Průměr > medián Průměr < medián

Nadpoloviční většina dat.souboru je menší než průměr

Nadpoloviční většina dat.souboru je větší než průměr

Page 52: EXPLORATORNÍ STATISTIKA

52

Výběrová špičatost (normovaná)

32

13

321

1 2

41

4

nn

n

s

xx

nnn

nnb

n

ii

0

10

20

30

40

50

60

70

1 2 3 4 5 6 7

0

20

40

60

80

100

1 2 3 4 5 6 7

0

5

10

15

20

25

30

1 2 3 4 5 6 7

b=0 b>0 b<0

Page 53: EXPLORATORNÍ STATISTIKA

53

Grafické znázornění num. proměnné

A.) Krabicový graf (Box plot)

Odlehlé pozorováníMin(po odstranění odlehlých pozorování)

Max(po odstranění odlehlých pozorování)

X0,25 X0,75

X0,5

průměr

Page 54: EXPLORATORNÍ STATISTIKA

54

Grafické znázornění num. proměnnéB.) Číslicový histogram (Stem and leaf)


Recommended