Monte Carlo permutaMonte Carlo permutačníční test testyy&&
Postupný výběrPostupný výběr
LineLineáárrníní rregresegresee: model: model
LineLineárníární regreseregrese: : kvalitakvalita
• Celková suma čtverců (TSS):
• Modelová suma čtverců (MSS):
• Residuální suma čtverců (RSS):
res
mod
dfRSSdfMSS
F
2)( YYi
2)ˆ( YYi
2)ˆ( ii YY
TSS
MSSR 2
Je ten vliv reálnýJe ten vliv reálný??
• Testování v lineární regresi: F statistika• Omezená ordinace: F-like statistic
MSS – suma kanonických charakteristických čísel;RSS – suma neomezených charakteristických čísel
• Jakou distribuci má tato statistika v nulovém modelu? Monte Carlo permutační test
can.axes-non
can.axesn
nRSS
MSS
F
Test nulové hypotézyTest nulové hypotézy
Máme-li jen jeden prediktor (jednu skupinu prediktorů):
• Obdobné jednocestné ANOVA nebo jednoduché regresi
• Permutujeme prediktor(y) ve vztahu k druhovým datům
• V každé permutaci vypočteme F statistiku vyjadřující “kvalitu” výsledné ordinace: vytváříme popis distribuce hodnot F
Permutace odvozené z Permutace odvozené z modelumodelu
Máme další proměnné ovlivňující vysvětlující proměnné:
• Y = b1*X + b2*Z + e H0: b1 = 0
X: vysvětlující proměnná(-é); Z: kovariáta(-y)
• nafitujeme Y = b2*Z+e, odhadneme e jako
• permutujeme e => e* a vypočteme nová data jako• pro každou permutaci vyhodnotíme kvalitu (F-statistika)
*ˆ eY YYe ˆ
Permutace odvozené z Permutace odvozené z designudesignu I I
• Permutace odvozené z modelu často fungují dobře, vedou k asymptoticky přesným odhadům chyby prvního druhu
• Ale pokud je to možné a praktické, používáme exaktní testy s permutací odvozenou z designu
• Příklad dvoucestné (dvoufaktorové) ANOVY: Y = + Ai + Bj +
• Efekt faktoru A testujeme náhodnými permutacemi uvnitř hladin faktoru B, a naopak.
Permutace odvozené z Permutace odvozené z designudesignu II II
• Při testu interakce (A x B) musíme obvykle provádět permutace odvozené z modelu
• Hierarchické uspořádání, včetně split-plot: permutace odvozené z modelu nefungují správně pro vnější (whole-plot) faktory; volba permutovatelných jednotek musí být založena na správném jmenovateli F statistiky v ANOVA
• Ještě složitější u opakovaných měření (závislost jednotek v čase)
Permutace odvozené z Permutace odvozené z designudesignu I IIIII
Volba správných Volba správných permutacípermutací
((podlepodle M. Anderson 2001) M. Anderson 2001)Krok 1:
Identifikuj permutované jednotky
Je MS ve jmenovateli F statistiky residuální mean square?
Permutovatelné jednotky jsou kategorie faktoru ze jmenovatele MS
Permutovatelnými jednotkami jsou pozorování
Jsou v modelu další členy, nezohledněné volbou
permutovatelných jednotek?
Krok 2:Zohledni další členy
modelu
Jako úroveň přesnosti testu potřebujeme?
Netřeba jiné faktoryzohledňovat
Permutace reziduálůredukovaného modelu:
permutovatelné jednotky
(asymptoticky přesné, někdyvyšší síla testu)
Omezené permutace permutovatelných jednotek
(přesný test, ale někdy s nižší sílou)
Permutace omez uvnitř kategoriídalších faktorů
Malý počet možných permutací?NEBO
Exaktní test nelze provést (např. test interakce)?
Neomezené permutace permutovatelných jednotek
(přesný test)
NE
NE
NE
ANO
ANO
ANO
asymptoticky přesný přesný
například MSA/MSblock
PostupnPostupný výběr (forward ý výběr (forward selection)selection)
• Obdobně jako v regresi: poznání relativního významu jednotlivých prediktorů, vytvoření "minimálního adekvátního modelu"
• CANOCO: automatic forward selection – nezávislé (marginal) a podmíněné (conditional) efekty
• CANOCO: manual forward selection