+ All Categories
Home > Documents > Slo žitější (mnohorozměrné) metody

Slo žitější (mnohorozměrné) metody

Date post: 13-Feb-2016
Category:
Upload: kinsey
View: 37 times
Download: 1 times
Share this document with a friend
Description:
Slo žitější (mnohorozměrné) metody. stručný nástin možností vybraných metod. Path analysis. přesný český překlad by byl něco jako analýza cestiček Viz též SEM (Structural Equation Modelling [třeba ve programu Statistica; je to o něco širší pojem]), případně causal modelling. - PowerPoint PPT Presentation
31
Složitější (mnohorozměrné) metody stručný nástin možností vybraných metod
Transcript
Page 1: Slo žitější (mnohorozměrné) metody

Složitější (mnohorozměrné) metody

stručný nástin možností vybraných metod

Page 2: Slo žitější (mnohorozměrné) metody

Path analysis

• přesný český překlad by byl něco jako analýza cestiček

• Viz též SEM (Structural Equation Modelling [třeba ve programu Statistica; je to o něco širší pojem]), případně causal modelling

Page 3: Slo žitější (mnohorozměrné) metody

Klasická (mnohonásobná) regrese

• Mnoho prediktorů, jedna odpověď

• Ve skutečnosti - dlouhé kauzální řetězce - v přírodě: mnohá proměnná je ovlivňovaná, a zároveň ovlivňuje - vede ke kauzálním sítím

Page 4: Slo žitější (mnohorozměrné) metody

Například typický hydrobiologický model

Dravé ryby

Planktonožravé ryby

Zooplankton

Fytoplankton

Ostatní náhodné vlivy (případně tady může být teplota, chemie vody etc.

Page 5: Slo žitější (mnohorozměrné) metody

Příklad ze skript

Obr. Obrázek vlevo: Diagram pro path-analýzu úspěšnosti druhu Oxalis acetosella. y1 je celková abundancebylin (s výjimkou Oxalis); y2 je abundance mechů; y3 je abundance Oxalis acetosella. x1 je poměr světlosti aúživnosti stanoviště (light/fertility ratio v původní práci). Obrázek vpravo: Řešení pro obrázek vlevo metodoupath analysis.

Page 6: Slo žitější (mnohorozměrné) metody

Mluvíme sice o kauzálním modelování

• Ale kauzalita je “vnesena” našimi představami o systému, nikoliv experimentální manipulací

• Přístupy použití se liší, podle toho jak moc dovolíme, aby náš iniciální model o kauzálních závislstech byl korigován na základě dat

Page 7: Slo žitější (mnohorozměrné) metody

Metoda je užitečná především tam,

• kde nemůžeme (alespoň některé) proměnné měnit experimentálně

• Oblíbená v evoluční biologii• Ale i v ekologii (zvlášt na úrovni

ekosystémů a společenstev ve větších prostorových škálách)

• Pozor při interpretaci kauzality

Page 8: Slo žitější (mnohorozměrné) metody

Popsáno + srozumitelně pro biology

• Bill Shipley 2004 Cause and Correlation in Biology: A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press.

• James B. Grace 2006 Structural Equation Modeling and Natural Systems. Cambridge University Press.

Page 9: Slo žitější (mnohorozměrné) metody

(Hierarchické) klasifikace

Děláme stromečky (ale nejen je)

Page 10: Slo žitější (mnohorozměrné) metody

Cíl klasifikace

• Vytvořit skupiny objektů, které jsou vnitřně homogenní, ale odlišné od ostatních

Page 11: Slo žitější (mnohorozměrné) metody

Typická data (matice)1 2 3 4 5 6 7

E1 95 90 99 85 80 80 97E0 25 4 2 2 25 60 0litter 7 30 15 40 35 15 25Agrostis canina 35Agrostis tenuis 2 1Anthoxanthum odora. 8 1 2 5 5Briza media 3 0.5 2 5Cynosurus cristatusDeschampsia cespit. 8 40Festuca ovina 1 4 2Festuca pratensis 1 2Festuca rubra 3 3 15 10 4 5 35Helictorichon pub.Holcus lanatus 35 1 5 5Molinia caerulea 2 40 10 2 10Nardus stricta 8 3 1 5

Snímek číslo

Page 12: Slo žitější (mnohorozměrné) metody

Mohu klasifikovat

• snímky, podle podobnosti druhového složení (dostanu skupiny podobných snímků - pak jim třeba můžu nějak říkat [Seslerietum])

• druhy, podle vzájemné podobnosti (korelace) rozšíření (dostanu skupiny druhů s podobnými ekologickými nároky)

Page 13: Slo žitější (mnohorozměrné) metody

Typická datadélka koruny [mm]

délka prašníků [mm]

počet tyčinek

šířka listu [cm]

váha semene [g]

indiv 1 5 1.5 6 3.5 0.15indiv 2 8 1.3 6 3.6 0.16indiv 3 7 1.2 6 4.2 0.19indiv 4 8 1.3 6 4.9 0.11indiv 5 5 1.6 5 4.9 0.12indiv 6 6 1.5 5 4.6 0.16indiv 7 8 1.1 6 4.8 0.18indiv 8 6 1.2 6 5.5 0.11

Chci získat skupiny podobných individuí - pozor, data jsou na různých stupnicích

Page 14: Slo žitější (mnohorozměrné) metody

Klasifikace

• Numerická taxonomie, numerická fenetika, kladistické metody

• Numerické taxonomie (dříve především fenetika), dnes podstatně širší pojetí

• Kladistika - fylogenetika - konstrukce fylogenetických stromů - dnes prakticky samostatné odvětví

Page 15: Slo žitější (mnohorozměrné) metody

Klasifikace

• S učením vs. bez učení• Hierarchické vs. nehierarchické• Hierarchické - divisivní vs. algomerativní

Page 16: Slo žitější (mnohorozměrné) metody

Shluková analýza• = Hierarchická,

aglomerativní metoda, výsledkem strom:

• Princip - nejprve spočtu matici podobností mezi všemi páry, pak konstruuju strom

Obr. Příklad zpracování téhož souboru dat dvěma různými metodami. Všechnypostupy jsou shodné, pouze nahoře byla užita metoda average linkage a dolemetoda Wardova.

Page 17: Slo žitější (mnohorozměrné) metody

Přži shlukové analýze pamatuj:

• Je zásadním způsobem ovlivněna tím, jakou mám míru podobnosti mezi objekty (tzv. (dis)similarity measure, příp. resemblance function). Pokud mám data měřená na různých škálách, musím standardizovat. Míry bývají často specifické pro různá odvětví

Page 18: Slo žitější (mnohorozměrné) metody

Při shlukové analýze pamatuj:

• Velmi důležitý je i shlukovací algoritmus

• Předvolby (default) v programu Statistica jsou v drtivé většině nevhodné pro biologické účely - je třeba je příslušně změnit

Page 19: Slo žitější (mnohorozměrné) metody

Shluková analýza mi udělá skupiny vždy

• ale já je nechci, chci vizualizovat podobnostní strukturu ve složení společenstev

Page 20: Slo žitější (mnohorozměrné) metody

Ordinace: chci dostat(pro složení společenstev)

odrinační diagram, kde podobné snímky budou blízko sebe, podobné druhy budou blízko sebe, a druhy budou mít optima v blízkosti snímků, kde se vyskytují

Page 21: Slo žitější (mnohorozměrné) metody

Cactus Nymphea

Urtica

Drosera

Menyanthes

Comarum

Chenopodium

Aira

Ordinační diagram

Blízkost značí podobnost

Page 22: Slo žitější (mnohorozměrné) metody

Cactus Nymphea

Urtica

Drosera

Menyanthes

Comarum

Chenopodium

Aira

Ordinační diagram

Nutrients

Water

Můžu mít i vysvětlující proměnné - buď je promítám ex post, nebo tzv. constrained ordinations.

Page 23: Slo žitější (mnohorozměrné) metody

Různé metody

• Correspondence analysis, Principal component analysis, factor analysis

• Oblíbené v ekologii, ale i v taxonomii (ukáže, zda jsou mezi druhy přechody), a také v psychologii

Page 24: Slo žitější (mnohorozměrné) metody

Constrained ordinations i pro hodnocení pokusů

Page 25: Slo žitější (mnohorozměrné) metody

Diskriminační analýza

• Příklad: Mám diploida a tetraploida - ale nemůžu pokaždé počítat chromozomy - ptám se - jsem schopen najít pravidlo na základě měřených morfologických znaků (jako jejich lineární kombinaci), které mi dvě ploidie od sebe odliší?

Page 26: Slo žitější (mnohorozměrné) metody
Page 27: Slo žitější (mnohorozměrné) metody

Při aplikaci

• pozor na důkaz kruhem (expert mi určil dva druhy [hlavně na základě délky prašníků, ale to já nevím] a já pak dokážu, že dva dané druhy existují, a perfektně se odlišují délkou prašníku).

Page 28: Slo žitější (mnohorozměrné) metody

Jiná úspěšná aplikace ve Škodovce (MB, už dávno)

• V rámci povinných prohlídek sledovali zaměstnance, a měli data o tlaku, cholesterolu, zda kouří, váhu, výšku etc.

• a zda do 10-ti let od prohlídky dostal či nedostal infarkt.

• Získali kombinaci znaků, která predikuje - chlapče, dej si pozor, spěješ k infarktu.

Page 29: Slo žitější (mnohorozměrné) metody

Podobnou věc udělají i klasifikační stromy

• Založeny na jiném principu (není zde aditivita efektů)

Page 30: Slo žitější (mnohorozměrné) metody

Co užitečného jsme neprobrali v celé Biostatistice (neúplný výběr)• Power analysis (jakou mám šanci zamítnout

H0)• Složitější modely ANOVA (a obecně GLM)• Zobecněné lineární modely• Prakticky nic z metod mnohorozměrných• Bayesovskou statistiku

Page 31: Slo žitější (mnohorozměrné) metody

Kde se můžu o statistických metodách dozvědět více

• Moderní regresní metody (Šmilauer)• Vizualizace dat (Šmilauer)• Plánování a hodnocení ekologických

experimentů (Lepš & Šmilauer)• Praktikum mnohorozměrných metod (Lepš

& Šmilauer)


Recommended