Prezentace aplikace PowerPointfch.upol.cz/skripta/zzd/chemo/prednasky/prezentace1.pdfPrezentace...

Post on 12-Aug-2020

8 views 0 download

transcript

Základy zpracování dat

chemometrie, statistika

Doporučená literatura

• Pytela O., Chemometrie pro organické chemiky (prodejna skript)

• Hendl J., Přehled statistických metod zpracování dat, Portál, Praha 2004

• Otyepka (web: fch.upol.cz; chemie.upol.cz)

Pravděpodobnostelementární základy

Náhodné jevy

• statistická definice pravděpodobnosti• náhodný pokus

– různé možné výsledky– nelze určit, který v daném pokusu získáme– pokusy lze opakovat a jednotlivá opakování se

neovlivňují

• všechny možné výsledky = prostor náhodných výsledků– př. mince „orel“, „panna“

• množina výsledků = náhodný jev• náhodný jev – jeden výsledek = elementární jev

– př. kostka „sudá“ – náhodný jev; padnutí dvou ok –elementární jev

• jev jistý = všechny možné výsledky náhodného pokusu

• jev nemožný• sjednocení jevů (padne 2 nebo 3)• současný výskyt (padne sudá a 2)• vylučující-se jevy, disjunktní jevy

BA∪BA∩

prázdná =∩ BA

Pravděpodobnost

• pravděpodobnost náh. jevu A je číslo P(A) ~relativní četnost jevu A

( )

( )( )( )( ) ( )APAPAPAPAP

APn

mAn

−===

=∞→

101

1,0

lim

Náhodná proměnná

• výsledku náh. pokusu přiřadíme číslo →náh. proměnná

prostor náhodných

výsledků

reálná čísla

náhodnáproměnná

Rozdělení náhodné proměnné

• pravděpodobnost, kterých náhodná proměnná nabývá (nebo interval) –pravděpodobnostní rozdělení (rozdělení) náhodné proměnné

• náhodná proměnná– diskrétní (házení kostkou, ruleta ...)– spojitá (měření délek, apod.)

př. rozdělení

• kostka – diskrétní rozdělení

xi 1 2 3 4 5 6

pi 1/6 1/6 1/6 1/6 1/6 1/6

• náh. proměnná se řídí daným zákonem rozdělení

Distribuční funkce

• F(x), nejúplnější popis pravd. chování náh. proměnné X

( ) ( ) ( )∞∞−∈≤= , , xxXPxF( )

1)(lim

0)(lim1 ,0

=

=

∞→

−∞→

xF

xFxF

x

x

neklesající, nemusí být spojitá

Hustota pravděpodobnostifrekvenční funkce

• má-li F(x), pro všechna x derivaci, nazýváme derivaci F(x) podle x hustotou pravděpodobnosti f(x); rozdělení s hustotou jsou vždy spojitá!

( ) ( )∫∞−

=x

xxfxF d

Distribuční funkce frekvenční funkce

Kvantil

1−= FQ

kvantilová funkce

5.0xmedián

25.0x 75.0x

dolní kvartil

horní kvartil

Normální rozdělení

• též Gaussovo rozdělení

( )

( )( )

( )2

2

2

,~

21

,

2

2

σμ

πσ

σμ

σ

μ

NX

exf

Nx−

=

Normální rozdělení

Nor. roz a EXCEL

• cvičení – EXCEL• pomocí EXCELu vytvořte graf frekvenční a

distribuční funkce normálního rozdělení• nápověda: funkce statistické, NORMDIST

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-10 -8 -6 -4 -2 0 2 4 6 8 10

Obecné a centrální momenty

• střední hodnota = 1. ob. moment( ) ( ) ( )

( )( ) ( )( )

( )( )kk

kk

x

XEXE

XEXEX

XE

xxxfxFxXE

−=

−=

=′

== ∫∫∞

∞−

∞−

μ

μ2var

dd

( )( )( ) 2

2

var

,

σ

μ

σμ

=

=

xxE

N

Důležité vlastnosti

výběr 1

Výběrové rozdělení stř. hod.

populace výběr 2náhodný výběr2,σμ

náhodný výběr⎟⎟⎠

⎞⎜⎜⎝

nN

2

μ

Centrální limitní teorém• významné postavení norm. rozdělení

Normování

( ) ( )

σμ

σμ

−=

Xz

NN 1 ,0, 2

Výběrové rozdělení stř. hod.neznáme σ

populace výběr 2náhodný výběr

σσ

σμ

ˆ?

, 2

=

( )( )

( ) ( )1~/

−=−

=− nvt

nsXE

sXE

XE

μμ

Studentovo rozděleníStudent = W. S. Gosset

(sládek u Guinesse)

Výběrové rozdělení rozptylu

• chí-kvadrát (chi-square) • EXCEL = CHIDIST, CHIINV

Výběrové rozdělení poměrů rozptylů

• F-rozdělení (Fisherovo)• EXCEL = FDIST, FINV

vyžaduje se normalita dat

Kovariance, korelacekovariance

korelace