+ All Categories
Home > Documents > analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní...

analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní...

Date post: 21-Dec-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
61
Základy analýzy hlavních komponent a multivariačních regresních metod pro spektrální analýzu
Transcript
Page 1: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Základy

analýzy hlavních komponent

a

multivariačních regresních

metod

pro spektrální analýzu

Page 2: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Multivariační analýza dat

použití mnoha proměnných zároveň

základem tabulka - matice dat

řádky - vzorky

sloupce - proměnné

proměnné - závislé - např. koncentrace

proměnné - nezávislé - spektrální data

proměnné - klasifikační („category“) - třídění vzorků do skupin

Page 3: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 4: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 5: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 6: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Označení metod

CLS - classical least squares

ILS - inverse least squares

MLR - multiple linear regression

PCA - principal component analysis

PCR - principal component regression

PLS1 - partial least squares 1

PLS2 - partial least squares 2

Page 7: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 8: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese CLS

klasická metoda nejmenších čtverců - „K-matrix“

předpoklad platnosti Lambertova-Beerova zákona při všech frekvencích - absorbance je funkcí koncentrace

chyby modelu jsou přiřazeny chybám v určení absorbancí

použitelná i pro celá spektra

všechny komponenty musí být

známy a zahrnuty do kalibrace

Page 9: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese ILS inverzní metoda nejmenších

čtverců - „P-matrix“

předpoklad platnosti inverzního Lambertova- Beerova zákona pro všechny koncentrace - koncentrace je funkcí absorbance

chyby modelu jsou přiřazeny chybám v určení koncentrací

použitelná pro omezený počet frekvencí - obtíže jejich výběru

komponenty nezávislé, postačuje

znalost jedné složky v kalibračních směsích

Page 10: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese MLR - vychází z ILS

vícenásobná lineární regrese

modely pro nekorelované spektrální proměnné

NELZE JEDNODUŠE

POUŽÍT

PRO SPEKTRÁLNÍ INTERVALY

separátní modely pro jednotlivé komponenty

nemusí být známy všechny komponenty

Page 11: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

reorganizace informace v souboru dat – hledání struktury dat – NIKOLI REGRESE, NIKOLI KVANTITA

analýza samotných spektrálních dat

analýza souboru dat s velkým počtem proměnných

redukce počtu proměnných na relevantní proměnné popisující variabilitu dat, zachování informačního obsahu

Page 12: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Analýza dat s mnoha proměnnými

určení hlavních komponent PC’s - transformace spekter do jiného systému souřadnic

uspořádání dat podél PC’s - SCORES

hledání spektrálních intervalů významně přispívajících k distribuci dat - ZÁTĚŽE - loadings

Page 13: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Analýza dat s mnoha proměnnými

První hlavní komponenta má směr největší variability dat

Druhá a každá následující hlavní komponenta je ortogonální (kolmá na všechny předcházející) a popisuje maximální množství zbývající variability

Page 14: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

VÝPOČET HLAVNÍCH KOMPONENT

nelineární iterační algoritmy

příklad - NIPALS

„nonlinear iterative partial least squares method“

* postupný výpočet jednotlivých hlavních komponent

* vhodný algoritmus pro „malé počítače“

Page 15: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD

Page 16: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD

Page 17: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD

Page 18: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD

Page 19: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD

Page 20: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD – zátěže, váhy, loadings

–Velikost absolutní hodnoty

– Znaménko

– Příspěvek dané proměnné k jednotlivým hlavním komponentám

Page 21: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

PŘÍKLAD – zátěže, váhy, loadings

–Pro více proměnných

Page 22: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Data pro tři složky o různých koncentracích

Page 23: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Data pro tři složky o různých koncentracích – průměr a popis variability

Page 24: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 25: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Ca Mg Na Cl- SO42-

Page 26: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 27: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 28: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Ca

Mg

Na

Cl- SO4

2-

Page 29: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 30: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 31: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Analýza hlavních komponent

Příklad – složení vody

Page 32: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese PCR

regrese hlavních komponent PCA + regresní krok ILS

modely pro více sledovaných analytů zároveň - multikomponentní

separátní modely pro jednotlivé komponenty (počítány zároveň) nemusí být známy všechny komponenty

modely pro celá spektra či široké spektrální intervaly

Page 33: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese PLS ortogonální transformace dat do

systému souřadnic označovaného jako

hlavní komponenty - PC - redukce počtu potřebných proměnných

Page 34: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese PLS 1

modely vždy pro jeden sledovaný analyt - 1 komponenta

modely pro celá spektra či široké spektrální intervaly

kalibrace - validace

hledání optimálního počtu PC’s

Page 35: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese PLS 2

modely pro více sledovaných analytů zároveň -multikomponentní

nemusí být známy všechny komponenty

společný model pro všechny komponenty

modely pro celá spektra či široké spektrální intervaly

kalibrace - validace

hledání optimálního počtu PC’s

Page 36: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Hledání optimálního počtu hlavních komponent

VYHODNOCENÍ „PRESS“

prediction error sum of squares

počítáno pro všechny zvažované počty hlavních komponent

nalezení minima na křivce závislosti „PRESS“ na počtu hlavních komponent

Page 37: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 38: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové
Page 39: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr metody kvantitativní analýzy

či klasifikace

Page 40: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Popis sledovaných analytů – složek směsi

Page 41: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr a popis kalibračních a validačních

standardů

Page 42: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr proměnných z kalibračních měření

např. výběr spektrálního intervalu

Page 43: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr

proměnných z

kalibračních

měření

např. výběr

spektrálního

intervalu

- využití

korelačních

záznamů pro

optimální

volbu oblasti

Page 44: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr

proměnných z

kalibračních

měření

např. výběr

spektrálního

intervalu

- využití

spočítaných

(předpovídaných)

spekter čistých

složek

Page 45: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Nastavení dalších parametrů

Page 46: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výsledky kalibrace

- predikované vs. zadané hodnoty

- diference

Page 47: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výsledky kalibrace

- tabulková forma

Page 48: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

DIAGNOSTIKA

- rezidua pro jednotlivé komponenty

Page 49: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

DIAGNOSTIKA

- rezidua pro jednotlivé

komponenty

Predicted Residual Error

Sum of Squares

(PRESS)

Root Mean Square Error

of Cross Validation

(RMSECV)

•odmocnina střední

kvadratické chyby

křížové validace

•střední kvadratická

chyba predikce

RMSECV value for a given

component and factor or shape

is equal to the square root of the

quotient of the PRESS value and

the number of calibration standards.

Page 50: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Tabulka dat – kalibračních, validačních,

(neznámých)

- Naměřená data, údaje o složení

Page 51: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr metody kvantitativní analýzy

Page 52: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr kalibračních vzorků

Page 53: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr naměřených proměnných

Page 54: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr stanovovaných proměnných –

„koncentrací“

Page 55: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr validační metody

Page 56: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Výběr velikosti modelu – počtu PC,

centrování dat

Page 57: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Přehled výsledků kalibrace včetně základní

diagnostiky

Page 58: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Přehled další diagnostiky

Page 59: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

- sada validačních standardů, které nebyly

použity při kalibraci

- matematické postupy

- metoda „jeden vynech“ („leave-one-out“)

- úplná „křížová validace“ („cross-

validation“)

- další cross-validace - náhodná,

systematická (po segmentech)…

VALIDACE kalibračních

modelů - postupy

Page 60: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

VALIDACE kalibračních

modelů

Page 61: analýzy hlavních komponent · 2012. 11. 16. · Druhá a každá následující hlavní komponenta je ortogonální (kolmá ... •odmocnina střední kvadratické chyby křížové

Regrese PLS pro MS spektra


Recommended