Date post: | 03-Jan-2016 |
Category: |
Documents |
Upload: | leila-houston |
View: | 61 times |
Download: | 2 times |
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekPozice statistick analzy ve vd a klinick praxiVznam statistickch vstupI. Statistika ve vdeck praxi
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotaceStatistick analza biologickch dat je jednm z nstroj, s jejich pomoc se sname zjistit odpovdi na nae otzky tkajc se pochopen iv prody. Jako kad nstroj je i statistickou analzu nezbytn na jedn stran korektn vyuvat a na druhou stranu nepeceovat jej monosti.Klovm faktem pi statistick analze dat je nahlen na realitu prostednictvm vzorku a pijmut toho, e vsledky na analzy jsou jen tak dobr, jak dobr je n vzorek. Reprezentativnost a nhodnost vzorku spolu s jeho velikost jsou dleit faktory ovlivujc vrohodnost naich zvr.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Vzkum, realita, statistika Vzkum je nam zpsobem porozumn realitAle jak pesn a pravdiv je nae porozumn? Statistika je jednm z nstroj vnejcch do naich vsledk uritou spolehlivost.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Vznam variabilityNae realita je variabiln a statistika je vdou zabvajc se variabilitou Korektn analza variabilita a jej pochopen pin uiten informace o na realitV ppad deterministickho svta by statistick analza nebyla potebn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Data2,1 2,8 3,2 1,2 5,2 2,9Variabilita opakovanch menrozptyl znaku, pirozen variabilita165 cm140 cm182 cm163 cmVariabilita znaku v populacichyba = nepesnost modeluVariabilita modelovanch datVariabilita asovch adVariabilita ve skladb biologickch spoleenstevDRUH 1 DRUH 2 DRUH 3 DRUH 415 30 40 14biodiverzitafluktuace, asov promnlivostchybayxyasBiostatistika - rzn pstupy k variabilit
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
. a ty uruj pstup k jejmu hodnocenMaskovn a minimalizace vlivuRespektovn a odhadovn vlivuPm vyuit k predikcm chovn systmuPojem VARIABILITA m mnoho vznam
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Statistika vznam a definiceWWW.WIKIPEDIA.ORG:Statistika je matematickou vdou zabvajc se shromdnm, analzou, interpretac, vysvtlenm a prezentac dat. Me bt aplikovna v irokm spektru vdeckch discipln od prodnch a po sociln vdy. Statistika je vyuvna i jako podklad pro rozhodovn, kdy nicmn me bt zmrn i nevdomky zneuita. Statistika vyuv matematick modely reality k zobecnn vsledk experiment a vzorkovn. Statistika funguje korektn pouze pokud jsou splnny pedpoklady jejch metod a model.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Co me statistika ci o na realit? MonostiRealitaVzorekDataInformaceZnalostPochopenStatistikaStatistika je nasazena v procesu zskn informac z vzorkovanch dat a je podporou v zskn na znalosti a pochopen problmu.Statistika nen schopna init zvry o jevech neobsaench v naem vzorku.Statistika nen nhradou na inteligence !!!
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Clov populaceClov populace klov pojem statistickho zpracovnSkupina objekt o nich se chceme nco dozvdt (nap. pacienti s danou diagnzou, vichni lid nad 60 let, men hemoglobinu v dan laboratoi)Mus bt definovna jet ped zahjenm sbru datNa clov populaci probh vzorkovn dat, kter mus clovou populaci dobe (reprezentativn) charakterizovatClov populaceKlov faktory clov populaceDesign experimentu a vzorkovac plnVzorkovn a analza dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Statistika a zobecnn vsledkClem analzy nen pouh popis a analza vzorku, ale zobecnn vsledk ze vzorku na jeho clovou populaci Pokud vzorek nereprezentuje clovou populaci, vede zobecnn k chybnm zvrmNeznm clov populaceX, Y, ZDky zobecnn vsledk znme vlastnosti clov populaceVzorekAnalza
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Vzorkovn a jeho vznam ve statisticeStatistika hovo o realit prostednictvm vzorku!!!Statistick pedpoklady korektnho vzorkovnRepresentativnost: struktura vzorku mus maximln reflektovat realituNezvislost: nkolikansobn vzorkovn tho objektu nepin ze statistickho hlediska dnou novou informaci
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Velikost vzorku a pesnost statistickch vstupExistuje skuten rozloen a skuten prmr men promnnZ jednoho men nezjistme nic Vzorek:?????Vzorek urit velikosti poskytuje odhad reln hodnoty s definovanou spolehlivostVzorek:Odhad prmru atd.Vzorkovn vech existujcch objekt poskytne skutenou hodnotu dan popisn statistiky, nicmn tento pstup je ve vtin ppadech nereln.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Mal dataVelk dataObrovsk dataUmn uchopitUmn prodatUmn pochopitRzn role statistiky pi rzn velkm vzorku
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
DataSchopnost: vidt data komunikovat interpretovat - prodvatPstup biostatistiky
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
VSLEDKYclov populacevbr dle optimlnho plnureprezentativn vzorek n jedinc (faktor F)men znakuvariabilita hodnot ve vbrovm souboru?el analzy: Popisn analyzovan znak clov populace (X)
jin vznamn faktor charakterizujc clovou populaci (F)ZVRY (reprezentativnost, spolehlivost)ReprezentativnostPesnostSpolehlivost? Experimentln design: nezbytn vbava biologa
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
VSLEDKYclov populacevbr subjekt pro vstup do hodnocen / studieRANDOMIZACE vzjemn srovnateln vzorky (faktor F)men znaku Xvariabilita hodnot X v rameni A?el analzy: Srovnvac (2 ramena) analyzovan znak clov populace (X)
jin vznamn faktor charakterizujc clovou populaci (F)ZVRY (rozliovac schopnost, rozdl ramen A x B, srovnatelnost ramen, reprezentativnost)variabilita hodnot X v rameni Brameno Arameno BSrovnatelnostPesnostSpolehlivost?Experimentln design: nezbytn vbava biologa
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Praktick a statistick vznamnostSamotn statistick vznamnost nem dn reln vznam, je pouze mtkem nhodnosti hodnocenho jevuPro vyhodnocen reln vznamnosti je nezbytn znt i reln vznamn hodnotyStatistick vznamnostPraktick vznamnost
ANONEANOOK, praktick i statistick vznamnost je ve shod, jednoznan zvrVznamn vsledek je statistick artefakt velkho vzorku, prakticky nevyuitelnNEVsledek me bt pouh nhoda, neprkazn vsledekOK, praktick i statistick vznamnost je ve shod, jednoznan zvr
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Obecn schma vyuit statistick analzyVzorkovnExperimentln designJak velk vzorek je nezbytn pro statisticky relevantn vsledky? Klov stratifikan kritria clov populace.Vzorkovac pln zabezpeujc nhodnost a reprezentativnost vzorku.Uloen a management datUloen dat ve vhodn form a jejich vyitn pedchzejc vlastn analze je klovm krokem statistick analzy.Vizualizace datGrafick inspekce dat je nezbytnm krokem analzy vzhledem ke schopnosti lidskho mozku primrn akceptovat obrazov data. Poskytne vhled do dat, pedstavu o jejich rozloen, vazbch promnnch apod.Popisn analzaPopisn analza umouje vyhodnotit srovnnm s existujc literaturou realistinost namench rozsah dat.Testovn hypotzTestovn vazeb mezi rznmi promnnmi s clem navzjem vysvtlit jejich variabilitu a tm pispt k pochopen eenho problmu.ModelovnMonm vyvrcholenm analzy je vyuit zskanch znalost a pochopen problmu k vytvoen prediktivnch model.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Prospektivn modelov - postihuje chovn jev pi respektovn variabilityStochastick modelovn: predikce neuritch jev
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Osa YPredikovanpravdpodobnostOsa XParametr nebo kombinace parametrData konkrtnch pacient (subjekt) k pmmu hodnocenStochastick modelovn: predikce neuritch jev
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Schopnost: vytvet prakticky vyuiteln nstroje Stochastick modelovn: predikce neuritch jev
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekKlov vznam korektnho uloen zskanch datPravidla pro ukldn datitn dat ped analzou
II. Pprava dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotaceSouasn statistick analza se neobejde bez zpracovn dat pomoc statistickch software. Pedpokladem spchu je sprvn uloen dat ve form databzov tabulky umoujc jejich zpracovn v libovoln aplikaci.Nemn dleit je vnovat pozornost itn dat pedchzejc vlastn analze. Kad chyba, kter vznikne nebo nen nalezeno ve fzi ppravy dat se promtne do vech dalch krok a me zapinit neplatnost vsledk a nutnost opakovn analzy.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Parametry (znaky)OpakovnDATA ukzka uspodn datovho souboru
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Sprvn a pehledn uloen dat je zkladem jejich pozdj analzyJe vhodn rozmyslet si pedem jak budou data ukldnaPro potaov zpracovn dat je nezbytn ukldat data v tabulrn formNejvhodnjm zpsobem je uloen dat ve form databzov tabulkyKad sloupec obsahuje pouze jedin typ dat, identifikovan hlavikou sloupceKad dek obsahuje minimln jednotku dat (nap. pacient, jedna nvtva pacienta apod.)Je neppustn kombinovat v jednom sloupci seln a textov hodnotyKomente jsou uloeny v samostatnch sloupcchU textovch dat nezbytn kontrolovat peklepy v nzvech kategoriSpecifickm typem dat jsou datumy u nich je nezbytn kontrolovat, zda jsou datumy uloeny v korektnm formtu
Takto uspodan data je v tabulkovch nebo databzovch programech mon pevst na libovolnou vstupn tabulkuPro zkladn uloen a itn dat menho rozsahu je mon vyut aplikac MS OfficeZsady pro ukldn dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Ukldn dat v MS OfficeMS ExcelKontingenn tabulky rychl sumarizace rozshlch tabulekMonost vpot a grafovch vstup pmo v aplikaciVisual Basic sloitj aplikaceOmezen tabulky na 256x65536 bunk (do verze 2003)Omezen kontrola chyb pi zadvn
MS AccessPlnohodnotn databze vhodn pro velk mnostv dat, dky omezeny v podstat jen dostupnou pamtKontrola typu datRelace tabulek omezen velikosti souboruVisual Basic a formule sloitj aplikaceOmezen tabulky na 255 sloupcVpoty a grafy jsou sloitj ne v Excelu
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Monosti MS Excel Sprva a prce s tabulrnmi daty azen dat, vbry z dat, pehledy dat Formtovn a pehledn zobrazen dat Zobrazen dat ve form graf Rzn druhy vpot pomoc zabudovanch funkc Tvorba tiskovch sestav Makra zautomatizovn astch innost Tvorba aplikac (Visual Basic for Aplications)
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Import a export datImport datManuln zadvn import podpora importu ze starch verz Excelu, textovch soubor, databz apod. koprovn pes schrnku Windows vkldn z nejrznjch aplikac MS Office, Statistica atd. vyuit textovch soubor jako kompatibilnho formtu pro penos dat mezi rznmi aplikacemi
Export datUkldnm soubor ve formtech podporovanch jinmi SW, ast jsou textov soubory, dbf soubory nebo star verze ExceluPm koprovn pes schrnku Windows
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Tipy a trikyVbr bunkCTRL+A vbr celho listuCTRL + klepnut my do buky vbr jednotlivch bunk SHIFT + klepnut my na jinou buku vbr bloku bunkSHIFT + ipky vbr sousednch bunk ve smru ipkySHIFT+CTRL+END (HOME) vbr do konce (zatku) oblasti dat v listuSHIFT+CTRL+ipky vbr souvislho dku nebo sloupce bunkSHIFT + klepnut na objekty vbr vce objekt Koprovn a vkldnCTRL+C zkoprovn oznaen oblasti bunkCTRL+V vloen obsahu schrnky oblast bunk, objekt, data z jin aplikaceMy a okraje bukyChycen my za okraj umouje pesun buky nebo bloku bunk
Pi chycen tvereku v pravm dolnm rohu vbru je taenm mono vyplnit vce bunk hodnotami pvodn buky (ve vzorcch se mn relativn odkazy, je tak mon vyplnn hodnotami ze seznamu nap. po sob jsouc nzvy msc.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Databzov struktura dat v ExceluJednotliv zznamy(taxon, lokalita atd.)Sloupce tabulky = parametry zznam, hlavika udv obsah sloupce stejn daj v celm sloupci
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Automatick zadvac formulSlou k usnadnn zadvn dat do databzovch tabulekNat automaticky hlaviky sloupc jako zadvan polokyNzvy sloupcObsah dan buky - editovatelnNov zznamVyhledvn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Automatick seznamyVytv se z hodnot bunk v danm sloupci a umouj vloit hodnotu vbrem ze seznamu ji zadanch hodnot usnadnn zadvn
Sloupec z nj je seznam vytvoen a pro kter platBuka, do n se vlo vybran hodnota
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Automatick kontrola datUmouje ovit typ, rozsah nebo povolit pouze urit seznam hodnot zadvanch do sloupce databzov tabulkyCo je povoleno definin obory sel, seznamy, vzorce atd.Rozsahy hodnot, naten seznam apod.komunikace s uivatelem
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
SeznamySkupiny hodnot zachovvajc logick poad, nkter jsou zabudovan (nap. dny v tdnu, msce v roce), dal je mon uivatelsky vytvoit, slou pro ely azen a automatickho vyplovn datVbr bunk pro nov seznamNaten novho seznamuExistujc seznamy
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
azen datazen dat je nejjednodum zpsobem jejich zpehlednn, uitenm hlavn u mench/vsledkovch tabulek
Zkontrolujte, zda seazen nezni vazby mezi bukami = kontrola oblasti, kterou adte.
Vyut prvn dek oblasti jako zhlavDal monosti azen dk, azen podle seznamuPodle eho aditSmr azen vzestupn, sestupn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
?
?
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Automatick filtrPomoc automatickho filtru je snadn vybrat seky dat pro dal zpracovn na zklad hodnot ve sloupcch databzov tabulky, vbr je mon i podle vce sloupc (nap. urit skupina pacient)Funkce automaticky rozezn hlaviky sloupc v souvisl oblasti bunkU sloupc pouitch pro filtraci jsou rozbalovac seznamy zbarveny modeVhodn pro itn dat (vyhledvn peklep, kombinace textu a sel)Vbr hodnot pro filtraciRozbalen seznamu hodnot nalezench ve sloupci
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekTypy grafick vizualizaceRizika desinterpretace grafickho zobrazen datIII. Vizualizace dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotacePrvnm krokem v analze dat je jejich vizualizace. Rzn typy dat nm umoujc zskn pedstavy o rozloen dat, zastoupen kategori i vztazch promnnch navzjem. Prostednictvm vizualizace zskvme vhled do dat a zanme vytvet hypotzy o zkonitostech panujcch mezi promnnmi v hodnocenm souboru dat.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
1. Vskyt kategori (1, 2, 3,)Kolov (vseov) grafAbsolutn poty 2. Vvoj hodnot (v ase) Y vs. X (t)% Y
Y Y Sloupcov grafBodov grafPlon graf30%40%30%12330%30%40%123Sloupcov grafadaGrafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
3. Vztahy mezi promnnmi - korelace015301231020X2ada2X1 015300510152025X2ada2X1 015301231020X2ada2X1 015301231020X2ada2X1 Bodov - korelan diagramBodov - korelan diagramGrafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
4. Kvantitativn hodnoty parametru() - X - v rmci kategori A, B, CSloupcov grafKrabicov grafX 02040ABCada2050100ABCada2X 050100ABCada2X 5. HistogramGrafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
6. Zviditelnn primrnch datnx1x2x3Grafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
7. Vztahy mezi promnnmi - interakce dvou parametr, reakn plochyGrafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
8. Grafick zviditelnn m nekonen mnoho monostGrafick prezentace dat - umn komunikace
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Nesprvn uit graf: problm rozsahu seln osy
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Nesprvn uit graf: problm standardizace hodnot
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Grafy zamen na vcerozmrn soubory dok zviditelnit i velik soubory dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekJak vznikaj informaceRozloen datIV. Teoretick pozad statistick analzy
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotaceZkladnm principem statistiky je pravdpodobnost vskytu njak udlosti. Prostednictvm vzorkovn se sname odhadnout skutenou pravdpodobnost udlost.Klovou otzkou je velikost vzorku, m vt vzorek, tm vt ance na projeven se skuten pravdpodobnosti vskytu jevu.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
JAK vznikaj informace ? zkladn pojmySkutenostNhoda (vybere jednu z monost pokusu)Jevpodmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo nePozorovatelRozli, co nastaloa) podle monostb) podle toho, jak potebujeJevov poletda vech jev, kter jsme se rozhodli nebo jsme schopni sledovatSkutenost + Jevov pole = Miteln prostorExperimentln jednotka -objekt, na kterm se provd etenSledovan veliina -seln hodnota vyjadujc vsledek nhodnho experimentuZnak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboruVbr - vbrov populace - clov populaceNhodn vbrReprezentativnost
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
JAK vznikaj informace ? Empirical approachClassical approachEmpirick postupmon jevy: sla 1 6n poet hod (opakovn) f nn = 10 f nn = 50 f nn = U sloitch stochastickch systm se pravda zsk a po odveden znanho mnostv experimentln prce: musme dt systmu anci se projevit
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
JAK vznikaj informace ? Empirick postupmon jevy: sla 1 6n poet hod (opakovn) f nn = 10 f nn = 50 f nn = Pi realizaci nhodnho experimentu roste se zvyujcm se potem opakovn pravdiv znalost systmu (vsledky se stvaj stabilnj) . diskutabiln je ale ovem mra zobecnn konkrtnho experimentu
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Empirick zkon velkch selPi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.Pravdpodobnost je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1..A.B.C.DAP(A)01Z praktickho hlediska je pravdpodobnostidealizovan relativn etnost P (A) = 1 jev jistP (A) = 0 jev nemonP (A B) = P (A) . P (B/A) ..zvisl jevyP (A B) = P (A) . P (B). nezvisl jevyP (A / B) = P (A B) / P (B) .podmnn pravdpodobnost
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Pravdpodobnost vskytu jevu rozloen datve je mon: pouze jev s pravdpodobnost 0 nikdy nenastaneexistuje pravdpodobnost vskytu jev (nedeterministick zvry)0pravdpodobnost vskytux1poet chlapc v rodin s X dtmi2345j(x)xvka postavyplocha = pravdpodobnost vskytupravdpodobnost lze zkoumat retrospektivn i prospektivn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekSpojit a kategoriln dataZkladn popisn statistikyGrafick popis datV. Zkladn typy dat
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotaceRealitu meme popisovat rznmi typy dat, kad z nich se specifickmi vlastnostmi, vhodami, nevhodami a vlastn sadou vyuitelnch statistickch metod - od binrnch pes kategoriln, ordinln a po spojit data roste mra informace v nich obsaen.Zkladnm pstupem k popisn analze dat je tvorba frekvennch tabulek a jejich grafickch reprezentac histogram.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ? rzn typy dat znamenaj rznou informaciKolikrt ? Podl hodnot vt/men ne specifikovan hodnota ? O kolik ?Vt, men ?Rovn se ?Procenta odvozen hodnotyData pomrov
Data intervalov
Data ordinln
Data nominlnSpojit dataDiskrtn dataKategoriln otzky
Otzky Ano/NeSamotn znalost typu dat ale na dosaen informace nesta .
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ? rzn typy dat znamenaj rznou informaciPRMRMEDINMODUSData pomrov
Data intervalov
Data ordinln
Data nominlnSpojit dataDiskrtn dataStatistika steduXY = f
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
JAK vznikaj informace ?- opakovan men informuj rozloenm hodnotKOLIK se namiloCO se namiloDiskrtn dataSpojit datayxyxX: men znakY: frekvence - absolutn / relativn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
X: Prmrn poet vrobk v prodejnY: Odhad prostoru prmrn nabzenho k vystaven vrobkuX: 1,2 : (1,15 - 1,24)
Y: 1,8 : (1,75 - 1,84)X/Y = 0,667 : 1,151,841,241,75()Odvozen data: Pozor na odvozen indexyZnak X: HmotnostZnak Y: PlochaPklad I:Pklad II:+ / - 3,8 %+ / - 2,5 %+ / - 6,2 %prmr(min - max):-Nov veliina m jinou ku rozpt ne ty, ze kterch je odvozen
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
N: 100 dt (hemofilik) x: znak: poet krvcivch epizod za msc
n(x) absolutn etnost x p(x) relativn etnost; p(x) = n(x) / n N(x) kumulativn etnost hodnot nepevyujcch x;N(x) = S n(t) F(x) kumulativn relativn etnost hodnot nepevyujcch x; F(x) = N(x) / nJak vznikaj informace ?- frekvenn tabulka jako zkladn nstroj popisuPrimrn dataFrekvenn sumarizace0012113112......n = 100Poty epizod pro n = 100 hemofilikt xDISKRTN DATA
xn(x)p(x)N(x)F(x)0200,2200,21100,1300,32300,3600,63400,41001,0
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ? Grafick vstupy z frekvenn tabulkyn(x)xp(x)xN(x)xF(x)x3210012301230123
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ? - frekvenn tabulka jako zkladn nstroj popisuPklad:x: koncentrace ltky v krvi n = 100 pacientPrimrn dataFrekvenn sumarizacen = 100 opakovanch men (100 pacient) x: koncentrace sledovan ltky v krvi (20 100 jednotek)
d(l) ka intervalu n(l) absolutn etnost n(l) / n intervalov relativn etnost N(x) intervalov kumulativn etnost do horn hranice X F(x) intervalov relativn kumulativn etnost do horn hranice X 1,211,481,560,311,211,330,33...n = 100Hodnoty pro n = 100 osobSPOJIT DATA
intervd(l)n(l)n(l)/nN(x)F(x)
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ? - frekvenn sumarizace spojitch datxx
F(x)
Intervalov relativn kumulativn etnostHistogramVbrov distribun funkce
f(x)=
Intervalov hustota etnosti20406080100Plocha: n(l) / nn(l) / n d(l)
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Poet zvolench td a velikost souboru uruj kvalitu vstupuk = 10 tdk = 5 td 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 1 2 3 4 5k = 20 td 1,0 2,0 3,0 4,0 5,0
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Graf16
0
1
5
2
3
3
1
3
0
01
VOD
Zkladn zpracovn dat
Analza klinickch dat
1
BIOSTATISTIKA - BIOMETRIKA
Vda zabvajc se hodnocenm biologickch dat
Popisn analza dat
"Data mining"
Experimentln design
Stochastick modelovn
Predikce a hodnocen neuritosti prognz
Analza asovch ad
Vcerozmrn analza
Analza biodiverzity
QA/QC
Vda zabvajc se variabilitou
Analza klinickch dat
2
Ukzka uspodanho datovho souboru
Pacient
Clovek
aLeu
aTy%
aSe%
aNeu%
aTy
aSe
aNeu
aLy
aHtc
aCLsk
aCLNeus
aCLOZ
aLy%
cell.106/
%
%
%
cell.106/
cell.106/
cell.106/
cell.106/
%
mV.s.103
mV.s.103
mV.s.103
%
3
1
4
33
72
32
4
2
7,6
8
58
66
0,6
4,4
5,0
1,8
33
95
19
48
24
8
3
4
3
52
55
0,1
2,1
2,2
1,6
22
77
35
33
40
11
4
6,1
5
59
64
0,3
3,6
3,9
2,1
33
103
26
49
35
12
5
6,9
3
85
88
0,2
5,9
6,1
0,6
37
81
13
45
9
14
6
5,9
15
55
70
0,9
3,3
4,1
1,1
32
137
33
61
19
16
7
8
18
75
93
1,4
6,0
7,4
0,6
34
151
20
59
7
20
8
9,6
3
72
75
0,3
6,9
7,2
2,2
40
77
11
38
23
21
9
6
10
67
77
0,6
4,0
4,6
1,1
32
120
26
52
19
22
10
3,3
4
55
59
0,1
1,8
2,0
1,3
28
81
42
24
39
37
11
3,8
10
60
70
0,4
2,3
2,7
1,1
32
111
42
29
30
38
12
6,4
2
76
78
0,1
4,9
5,0
1,1
25
366
73
115
17
39
13
6,8
1
57
58
0,1
3,9
3,9
2,7
20
234
59
71
39
49
14
8,5
7
67
74
0,6
5,7
6,3
2,2
30
156
25
108
26
51
15
9,3
7
57
64
0,7
5,3
6,0
3,3
35
129
21
23
35
52
16
2,2
10
56
66
0,2
1,2
1,5
0,7
33
46
30
12
34
55
17
9,9
3
78
81
0,3
7,7
8,0
0,1
30
189
24
140
10
56
18
5
2
80
82
0,1
4,0
4,1
0,7
26
101
25
54
13
6
1
8,8
11
72
83
1,0
6,3
7,3
1,1
44
268
36,6
145
12
9
2
9,2
2
66
68
0,2
6,1
6,3
2,6
42
168
26,9
76
28
13
3
10,0
7
83
90
0,7
8,3
9,0
0,8
54
181
20,1
81
8
15
4
9,6
1
75
76
0,1
7,2
7,3
2,2
45
343
47
124
23
17
5
6,0
45
40
21
19
6
7,2
2
78
80
0,1
5,6
5,8
1,3
44
103
17,8
63
18
24
7
8,2
1
72
73
0,1
5,9
6,0
2,1
41
209
34,9
57
25
26
8
10,3
1
85
86
0,1
8,8
8,9
0,3
41
364
41,1
112
3
29
9
5,0
1
74
75
0,1
3,7
3,8
1,1
39
83
22,1
32
21
30
10
11,9
1
51
52
0,1
6,1
6,2
5,6
33
83
13,4
52
47
31
11
7,2
3
53
56
0,2
3,8
4,0
2,1
28
109
27,1
63
29
32
12
10,8
36
50
76
3,9
5,4
9,3
0,9
27
146
15,7
106
8
33
13
11,8
22
54
76
2,6
6,4
9,0
1,9
45
246
27,4
63
16
34
14
17,0
1
82
83
0,2
13,9
14,1
2,7
34
440
31,2
119
16
40
15
10,0
8
72
80
0,8
7,2
8,0
0,4
37
176
22,0
52
4
41
42
43
47
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
4
72
32
7,6
95
19
48
4
77
35
33
6,1
103
26
49
6,9
81
13
45
5,9
137
33
61
8
151
20
59
9,6
77
11
38
6
120
26
52
3,3
81
42
24
3,8
111
42
29
6,4
366
73
115
6,8
234
59
71
8,5
156
25
108
9,3
129
21
23
2,2
46
30
12
9,9
189
24
140
5
101
25
54
8,8
268
36,6
145
9,2
168
26,9
76
10,0
181
20,1
81
9,6
343
47
124
6,0
40
21
7,2
103
17,8
63
8,2
209
34,9
57
10,3
364
41,1
112
5,0
83
22,1
32
11,9
83
13,4
52
7,2
109
27,1
63
10,8
146
15,7
106
11,8
246
27,4
63
17,0
440
31,2
119
3
4
8
11
12
14
16
20
21
22
37
38
39
49
51
52
55
56
6
9
13
15
17
19
24
26
29
30
31
32
33
34
40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10,0
8
3
5
3
15
18
3
10
4
10
2
1
7
7
10
3
2
11
2
7
1
2
1
1
1
1
3
36
22
1
8
58
52
59
85
55
75
72
67
55
60
76
57
67
57
56
78
80
72
66
83
75
78
72
85
74
51
53
50
54
82
72
66
55
64
88
70
93
75
77
59
70
78
58
74
64
66
81
82
83
68
90
76
80
73
86
75
52
56
76
76
83
80
0,6
4,4
5,0
1,8
0,1
2,1
2,2
1,6
0,3
3,6
3,9
2,1
0,2
5,9
6,1
0,6
0,9
3,3
4,1
1,1
1,4
6,0
7,4
0,6
0,3
6,9
7,2
2,2
0,6
4,0
4,6
1,1
0,1
1,8
2,0
1,3
0,4
2,3
2,7
1,1
0,1
4,9
5,0
1,1
0,1
3,9
3,9
2,7
0,6
5,7
6,3
2,2
0,7
5,3
6,0
3,3
0,2
1,2
1,5
0,7
0,3
7,7
8,0
0,1
0,1
4,0
4,1
0,7
1,0
6,3
7,3
1,1
0,2
6,1
6,3
2,6
0,7
8,3
9,0
0,8
0,1
7,2
7,3
2,2
0,1
5,6
5,8
1,3
0,1
5,9
6,0
2,1
0,1
8,8
8,9
0,3
0,1
3,7
3,8
1,1
0,1
6,1
6,2
5,6
0,2
3,8
4,0
2,1
3,9
5,4
9,3
0,9
2,6
6,4
9,0
1,9
0,2
13,9
14,1
2,7
0,8
7,2
8,0
0,4
33
33
22
33
37
32
34
40
32
28
32
25
20
30
35
33
30
26
44
42
54
45
45
44
41
41
39
33
28
27
45
34
37
176
22,0
52
24
40
35
9
19
7
23
19
39
30
17
39
26
35
34
10
13
12
28
8
23
18
25
3
21
47
29
8
16
16
4
aLeu
aCLsk
aCLNeus
aCLOZ
cell.106/
mV.s.103
mV.s.103
mV.s.103
Pacient
Clovek
aTy%
%
aSe%
%
aNeu%
%
aTy
aSe
aNeu
aLy
cell.106/
cell.106/
cell.106/
cell.106/
aHtc
%
aLy%
%
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
3
Analza klinickch dat
Pojem VARIABILITA m mnoho vznam
Variabilita opakovanch men
CHYBA
Data2,12,83,15,42,1
Variabilita znaku v populaci
ROZPTYL ZNAKU,PIROZEN VARIABILITA
165cm 140cm 182cm 163cm
Promnlivost biologickch spoleenstev
BIODIVERZITA
DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14
Variabilita modelovanch dat
FLUKTUACE, ASOV PROMNLIVOST
Y
as
Variabilita modelovanch dat
CHYBA = NEPESNOST MODELU
Y
X
3b
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
Analza klinickch dat
Vybran zkladn pojmy
Skutenost
Nhoda (vybere jednu z monost pokusu)
Jev
podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne
Pozorovatel
Rozli, co nastaloa) podle monostb) podle toho, jak potebuje
Jevov pole
tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat
Skutenost + Jevov pole = Miteln prostor
Experimentln jednotka -
objekt, na kterm se provd eten
Populace -
soubor experimentlnch jednotek
Znak -
vlastnost sledovan na objektu
Sledovan veliina -
seln hodnota vyjadujc vsledek nhodnho experimentu
Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru
Vbr - vbrov populace - clov populace
Nhodn vbr
Reprezentativnost
4
EMPIRICK ZKON VELKCH SEL
Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.
Pravdpodobnost
je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.
.A
.B
.C
.D
A
P(A)
0
1
Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost
P (A) = 1 jev jist
P (A) = 0 jev nemon
P (A B) = P (A) . P (B/A) zvisl jevy
P (A B) = P (A) . P (B) nezvisl jevy
P (A / B) = P (A B) / P (A) podmnn pravdpodobnost
Analza klinickch dat
5
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
5
00.18
00.18
00.18
00.18
00.18
00.18
6
fn
Analza klinickch dat
Pravdpodobnost je "idealizovan relativn etnost"
a) Empirick postup
b) Klasick postup
0
0
0
0
0
0
0
0.1
0
0.0001
0
0.1
0
0.2
0
0.3
0
0.3
Mon nastl jevy - sla 1 - 6
0
0
0
0
0
0
0
0.21
0
0.11
0
0.12
0
0.12
0
0.12
0
0.22
fn
fn
n = 10
n = 50
n =
n - poet bod
Empirick postup u "normln" kostky
Informan hodnota sla m velk vznam
Datapomrov
Dataintervalov
Dataordinln
Datanominln
Kolikrt?
O kolik?
Vt, men?
Rovn se?
Spojitdata
Diskrtndata
Podlhodnot vt/men ne specifikovan hodnota
?
Procenta (odvozen hodnoty)
Analza klinickch dat
7
217
429
733
444
255
1.5411
132
0.524
0.510
0.25
5
7.5
8
4.5
8.5
4
Spojit a diskrtn data - zkladn pohled
X
X
Pvodn dataX
14,2.....18,8Spojit
1234513Diskrtn
Analza klinickch dat
FREKVENN TABULKY
Uspodan data
7
0
0
0
0
0
0
8
0
0
0
0
0
0
9
013
118
219
312
421
510
611
77
88
914
10
ROZLOEN HODNOT X
Diskrtn data - prvn nhled
Promnn X
01234...10
Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.
Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X
9
0
0
0
0
0
0
0
0
0
0
X
Poty (absolutn frekvence)
10
Analza klinickch dat
Pklad: Zkladn uspodn souboru diskrtnch dat
n = 100 dnx znak : poet nik nebezpen ltky
n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n
x
0
1
2
3
n (x)
20
10
30
40
p (x)
0,2
0,1
0,3
0,4
N (x)
20
30
60
100
F (x)
0,2
0,3
0,6
1,0
FREKVENN TABULKA jako zkladn nstroj popisu
Analza klinickch dat
11
2020
1030
3060
40100
Grafick vstupy z frekvenn tabulky - diskrtn data
X
Analza klinickch dat
11
0
0
0
0
12
126
236
338
424
541
620
722
X
p(x)
0 1 2 3
0
0
0
0
n(x)
0 1 2 3
0
0
0
0
X
F(x)
0 1 2 3
0
0
0
0
X
N(x)
0 1 2 3
0
1
Spojit data - prvn nhled
Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn
Aktivita enzymu: X
I. Utdit podle velikosti
II. Rozdlit do interval o rozumn ce
III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti
IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech
V. Grafick znzornn - histogram
12
0
0
0
0
0
0
0
Aktivita
13
0
f(x)
Analza klinickch dat
FREKVENN TABULKA u spojitch dat
n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)
d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"
Interval
60
f
28465820114316103
Analza klinickch dat
Sprvn histogram ?
Sprvn histogram ?
Graf18
0
0
1
1
4
0
2
0
1
2
0
3
0
0
1
1
1
1
0
01
VOD
Zkladn zpracovn dat
Analza klinickch dat
1
BIOSTATISTIKA - BIOMETRIKA
Vda zabvajc se hodnocenm biologickch dat
Popisn analza dat
"Data mining"
Experimentln design
Stochastick modelovn
Predikce a hodnocen neuritosti prognz
Analza asovch ad
Vcerozmrn analza
Analza biodiverzity
QA/QC
Vda zabvajc se variabilitou
Analza klinickch dat
2
Ukzka uspodanho datovho souboru
Pacient
Clovek
aLeu
aTy%
aSe%
aNeu%
aTy
aSe
aNeu
aLy
aHtc
aCLsk
aCLNeus
aCLOZ
aLy%
cell.106/
%
%
%
cell.106/
cell.106/
cell.106/
cell.106/
%
mV.s.103
mV.s.103
mV.s.103
%
3
1
4
33
72
32
4
2
7,6
8
58
66
0,6
4,4
5,0
1,8
33
95
19
48
24
8
3
4
3
52
55
0,1
2,1
2,2
1,6
22
77
35
33
40
11
4
6,1
5
59
64
0,3
3,6
3,9
2,1
33
103
26
49
35
12
5
6,9
3
85
88
0,2
5,9
6,1
0,6
37
81
13
45
9
14
6
5,9
15
55
70
0,9
3,3
4,1
1,1
32
137
33
61
19
16
7
8
18
75
93
1,4
6,0
7,4
0,6
34
151
20
59
7
20
8
9,6
3
72
75
0,3
6,9
7,2
2,2
40
77
11
38
23
21
9
6
10
67
77
0,6
4,0
4,6
1,1
32
120
26
52
19
22
10
3,3
4
55
59
0,1
1,8
2,0
1,3
28
81
42
24
39
37
11
3,8
10
60
70
0,4
2,3
2,7
1,1
32
111
42
29
30
38
12
6,4
2
76
78
0,1
4,9
5,0
1,1
25
366
73
115
17
39
13
6,8
1
57
58
0,1
3,9
3,9
2,7
20
234
59
71
39
49
14
8,5
7
67
74
0,6
5,7
6,3
2,2
30
156
25
108
26
51
15
9,3
7
57
64
0,7
5,3
6,0
3,3
35
129
21
23
35
52
16
2,2
10
56
66
0,2
1,2
1,5
0,7
33
46
30
12
34
55
17
9,9
3
78
81
0,3
7,7
8,0
0,1
30
189
24
140
10
56
18
5
2
80
82
0,1
4,0
4,1
0,7
26
101
25
54
13
6
1
8,8
11
72
83
1,0
6,3
7,3
1,1
44
268
36,6
145
12
9
2
9,2
2
66
68
0,2
6,1
6,3
2,6
42
168
26,9
76
28
13
3
10,0
7
83
90
0,7
8,3
9,0
0,8
54
181
20,1
81
8
15
4
9,6
1
75
76
0,1
7,2
7,3
2,2
45
343
47
124
23
17
5
6,0
45
40
21
19
6
7,2
2
78
80
0,1
5,6
5,8
1,3
44
103
17,8
63
18
24
7
8,2
1
72
73
0,1
5,9
6,0
2,1
41
209
34,9
57
25
26
8
10,3
1
85
86
0,1
8,8
8,9
0,3
41
364
41,1
112
3
29
9
5,0
1
74
75
0,1
3,7
3,8
1,1
39
83
22,1
32
21
30
10
11,9
1
51
52
0,1
6,1
6,2
5,6
33
83
13,4
52
47
31
11
7,2
3
53
56
0,2
3,8
4,0
2,1
28
109
27,1
63
29
32
12
10,8
36
50
76
3,9
5,4
9,3
0,9
27
146
15,7
106
8
33
13
11,8
22
54
76
2,6
6,4
9,0
1,9
45
246
27,4
63
16
34
14
17,0
1
82
83
0,2
13,9
14,1
2,7
34
440
31,2
119
16
40
15
10,0
8
72
80
0,8
7,2
8,0
0,4
37
176
22,0
52
4
41
42
43
47
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
4
72
32
7,6
95
19
48
4
77
35
33
6,1
103
26
49
6,9
81
13
45
5,9
137
33
61
8
151
20
59
9,6
77
11
38
6
120
26
52
3,3
81
42
24
3,8
111
42
29
6,4
366
73
115
6,8
234
59
71
8,5
156
25
108
9,3
129
21
23
2,2
46
30
12
9,9
189
24
140
5
101
25
54
8,8
268
36,6
145
9,2
168
26,9
76
10,0
181
20,1
81
9,6
343
47
124
6,0
40
21
7,2
103
17,8
63
8,2
209
34,9
57
10,3
364
41,1
112
5,0
83
22,1
32
11,9
83
13,4
52
7,2
109
27,1
63
10,8
146
15,7
106
11,8
246
27,4
63
17,0
440
31,2
119
3
4
8
11
12
14
16
20
21
22
37
38
39
49
51
52
55
56
6
9
13
15
17
19
24
26
29
30
31
32
33
34
40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10,0
8
3
5
3
15
18
3
10
4
10
2
1
7
7
10
3
2
11
2
7
1
2
1
1
1
1
3
36
22
1
8
58
52
59
85
55
75
72
67
55
60
76
57
67
57
56
78
80
72
66
83
75
78
72
85
74
51
53
50
54
82
72
66
55
64
88
70
93
75
77
59
70
78
58
74
64
66
81
82
83
68
90
76
80
73
86
75
52
56
76
76
83
80
0,6
4,4
5,0
1,8
0,1
2,1
2,2
1,6
0,3
3,6
3,9
2,1
0,2
5,9
6,1
0,6
0,9
3,3
4,1
1,1
1,4
6,0
7,4
0,6
0,3
6,9
7,2
2,2
0,6
4,0
4,6
1,1
0,1
1,8
2,0
1,3
0,4
2,3
2,7
1,1
0,1
4,9
5,0
1,1
0,1
3,9
3,9
2,7
0,6
5,7
6,3
2,2
0,7
5,3
6,0
3,3
0,2
1,2
1,5
0,7
0,3
7,7
8,0
0,1
0,1
4,0
4,1
0,7
1,0
6,3
7,3
1,1
0,2
6,1
6,3
2,6
0,7
8,3
9,0
0,8
0,1
7,2
7,3
2,2
0,1
5,6
5,8
1,3
0,1
5,9
6,0
2,1
0,1
8,8
8,9
0,3
0,1
3,7
3,8
1,1
0,1
6,1
6,2
5,6
0,2
3,8
4,0
2,1
3,9
5,4
9,3
0,9
2,6
6,4
9,0
1,9
0,2
13,9
14,1
2,7
0,8
7,2
8,0
0,4
33
33
22
33
37
32
34
40
32
28
32
25
20
30
35
33
30
26
44
42
54
45
45
44
41
41
39
33
28
27
45
34
37
176
22,0
52
24
40
35
9
19
7
23
19
39
30
17
39
26
35
34
10
13
12
28
8
23
18
25
3
21
47
29
8
16
16
4
aLeu
aCLsk
aCLNeus
aCLOZ
cell.106/
mV.s.103
mV.s.103
mV.s.103
Pacient
Clovek
aTy%
%
aSe%
%
aNeu%
%
aTy
aSe
aNeu
aLy
cell.106/
cell.106/
cell.106/
cell.106/
aHtc
%
aLy%
%
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
3
Analza klinickch dat
Pojem VARIABILITA m mnoho vznam
Variabilita opakovanch men
CHYBA
Data2,12,83,15,42,1
Variabilita znaku v populaci
ROZPTYL ZNAKU,PIROZEN VARIABILITA
165cm 140cm 182cm 163cm
Promnlivost biologickch spoleenstev
BIODIVERZITA
DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14
Variabilita modelovanch dat
FLUKTUACE, ASOV PROMNLIVOST
Y
as
Variabilita modelovanch dat
CHYBA = NEPESNOST MODELU
Y
X
3b
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
Analza klinickch dat
Vybran zkladn pojmy
Skutenost
Nhoda (vybere jednu z monost pokusu)
Jev
podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne
Pozorovatel
Rozli, co nastaloa) podle monostb) podle toho, jak potebuje
Jevov pole
tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat
Skutenost + Jevov pole = Miteln prostor
Experimentln jednotka -
objekt, na kterm se provd eten
Populace -
soubor experimentlnch jednotek
Znak -
vlastnost sledovan na objektu
Sledovan veliina -
seln hodnota vyjadujc vsledek nhodnho experimentu
Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru
Vbr - vbrov populace - clov populace
Nhodn vbr
Reprezentativnost
4
EMPIRICK ZKON VELKCH SEL
Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.
Pravdpodobnost
je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.
.A
.B
.C
.D
A
P(A)
0
1
Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost
P (A) = 1 jev jist
P (A) = 0 jev nemon
P (A B) = P (A) . P (B/A) zvisl jevy
P (A B) = P (A) . P (B) nezvisl jevy
P (A / B) = P (A B) / P (A) podmnn pravdpodobnost
Analza klinickch dat
5
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
5
00.18
00.18
00.18
00.18
00.18
00.18
6
fn
Analza klinickch dat
Pravdpodobnost je "idealizovan relativn etnost"
a) Empirick postup
b) Klasick postup
0
0
0
0
0
0
0
0.1
0
0.0001
0
0.1
0
0.2
0
0.3
0
0.3
Mon nastl jevy - sla 1 - 6
0
0
0
0
0
0
0
0.21
0
0.11
0
0.12
0
0.12
0
0.12
0
0.22
fn
fn
n = 10
n = 50
n =
n - poet bod
Empirick postup u "normln" kostky
Informan hodnota sla m velk vznam
Datapomrov
Dataintervalov
Dataordinln
Datanominln
Kolikrt?
O kolik?
Vt, men?
Rovn se?
Spojitdata
Diskrtndata
Podlhodnot vt/men ne specifikovan hodnota
?
Procenta (odvozen hodnoty)
Analza klinickch dat
7
217
429
733
444
255
1.5411
132
0.524
0.510
0.25
5
7.5
8
4.5
8.5
4
Spojit a diskrtn data - zkladn pohled
X
X
Pvodn dataX
14,2.....18,8Spojit
1234513Diskrtn
Analza klinickch dat
FREKVENN TABULKY
Uspodan data
7
0
0
0
0
0
0
8
0
0
0
0
0
0
9
013
118
219
312
421
510
611
77
88
914
10
ROZLOEN HODNOT X
Diskrtn data - prvn nhled
Promnn X
01234...10
Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.
Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X
9
0
0
0
0
0
0
0
0
0
0
X
Poty (absolutn frekvence)
10
Analza klinickch dat
Pklad: Zkladn uspodn souboru diskrtnch dat
n = 100 dnx znak : poet nik nebezpen ltky
n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n
x
0
1
2
3
n (x)
20
10
30
40
p (x)
0,2
0,1
0,3
0,4
N (x)
20
30
60
100
F (x)
0,2
0,3
0,6
1,0
FREKVENN TABULKA jako zkladn nstroj popisu
Analza klinickch dat
11
2020
1030
3060
40100
Grafick vstupy z frekvenn tabulky - diskrtn data
X
Analza klinickch dat
11
0
0
0
0
12
126
236
338
424
541
620
722
X
p(x)
0 1 2 3
0
0
0
0
n(x)
0 1 2 3
0
0
0
0
X
F(x)
0 1 2 3
0
0
0
0
X
N(x)
0 1 2 3
0
1
Spojit data - prvn nhled
Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn
Aktivita enzymu: X
I. Utdit podle velikosti
II. Rozdlit do interval o rozumn ce
III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti
IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech
V. Grafick znzornn - histogram
12
0
0
0
0
0
0
0
Aktivita
13
0
f(x)
Analza klinickch dat
FREKVENN TABULKA u spojitch dat
n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)
d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"
Interval
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Histogram vyjaduje tvar vbrovho rozloenxxxxxf(x)f(x)f(x)f(x)f(x)
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Pklad: vk astnk vnch dopravnch nehodVk (roky)Vk (roky)FrekvenceFrekvence po roce vkuSprvn histogram ?Sprvn histogram ? Vk
0 - 4 5 - 910 - 1516 - 1920 - 2425 - 59 > 60f
28465820114316103
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Graf36
0
30
50
60
20
30
70
150
320
100
01
VOD
Zkladn zpracovn dat
Analza klinickch dat
1
BIOSTATISTIKA - BIOMETRIKA
Vda zabvajc se hodnocenm biologickch dat
Popisn analza dat
"Data mining"
Experimentln design
Stochastick modelovn
Predikce a hodnocen neuritosti prognz
Analza asovch ad
Vcerozmrn analza
Analza biodiverzity
QA/QC
Vda zabvajc se variabilitou
Analza klinickch dat
2
Ukzka uspodanho datovho souboru
Pacient
Clovek
aLeu
aTy%
aSe%
aNeu%
aTy
aSe
aNeu
aLy
aHtc
aCLsk
aCLNeus
aCLOZ
aLy%
cell.106/
%
%
%
cell.106/
cell.106/
cell.106/
cell.106/
%
mV.s.103
mV.s.103
mV.s.103
%
3
1
4
33
72
32
4
2
7,6
8
58
66
0,6
4,4
5,0
1,8
33
95
19
48
24
8
3
4
3
52
55
0,1
2,1
2,2
1,6
22
77
35
33
40
11
4
6,1
5
59
64
0,3
3,6
3,9
2,1
33
103
26
49
35
12
5
6,9
3
85
88
0,2
5,9
6,1
0,6
37
81
13
45
9
14
6
5,9
15
55
70
0,9
3,3
4,1
1,1
32
137
33
61
19
16
7
8
18
75
93
1,4
6,0
7,4
0,6
34
151
20
59
7
20
8
9,6
3
72
75
0,3
6,9
7,2
2,2
40
77
11
38
23
21
9
6
10
67
77
0,6
4,0
4,6
1,1
32
120
26
52
19
22
10
3,3
4
55
59
0,1
1,8
2,0
1,3
28
81
42
24
39
37
11
3,8
10
60
70
0,4
2,3
2,7
1,1
32
111
42
29
30
38
12
6,4
2
76
78
0,1
4,9
5,0
1,1
25
366
73
115
17
39
13
6,8
1
57
58
0,1
3,9
3,9
2,7
20
234
59
71
39
49
14
8,5
7
67
74
0,6
5,7
6,3
2,2
30
156
25
108
26
51
15
9,3
7
57
64
0,7
5,3
6,0
3,3
35
129
21
23
35
52
16
2,2
10
56
66
0,2
1,2
1,5
0,7
33
46
30
12
34
55
17
9,9
3
78
81
0,3
7,7
8,0
0,1
30
189
24
140
10
56
18
5
2
80
82
0,1
4,0
4,1
0,7
26
101
25
54
13
6
1
8,8
11
72
83
1,0
6,3
7,3
1,1
44
268
36,6
145
12
9
2
9,2
2
66
68
0,2
6,1
6,3
2,6
42
168
26,9
76
28
13
3
10,0
7
83
90
0,7
8,3
9,0
0,8
54
181
20,1
81
8
15
4
9,6
1
75
76
0,1
7,2
7,3
2,2
45
343
47
124
23
17
5
6,0
45
40
21
19
6
7,2
2
78
80
0,1
5,6
5,8
1,3
44
103
17,8
63
18
24
7
8,2
1
72
73
0,1
5,9
6,0
2,1
41
209
34,9
57
25
26
8
10,3
1
85
86
0,1
8,8
8,9
0,3
41
364
41,1
112
3
29
9
5,0
1
74
75
0,1
3,7
3,8
1,1
39
83
22,1
32
21
30
10
11,9
1
51
52
0,1
6,1
6,2
5,6
33
83
13,4
52
47
31
11
7,2
3
53
56
0,2
3,8
4,0
2,1
28
109
27,1
63
29
32
12
10,8
36
50
76
3,9
5,4
9,3
0,9
27
146
15,7
106
8
33
13
11,8
22
54
76
2,6
6,4
9,0
1,9
45
246
27,4
63
16
34
14
17,0
1
82
83
0,2
13,9
14,1
2,7
34
440
31,2
119
16
40
15
10,0
8
72
80
0,8
7,2
8,0
0,4
37
176
22,0
52
4
41
42
43
47
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
4
72
32
7,6
95
19
48
4
77
35
33
6,1
103
26
49
6,9
81
13
45
5,9
137
33
61
8
151
20
59
9,6
77
11
38
6
120
26
52
3,3
81
42
24
3,8
111
42
29
6,4
366
73
115
6,8
234
59
71
8,5
156
25
108
9,3
129
21
23
2,2
46
30
12
9,9
189
24
140
5
101
25
54
8,8
268
36,6
145
9,2
168
26,9
76
10,0
181
20,1
81
9,6
343
47
124
6,0
40
21
7,2
103
17,8
63
8,2
209
34,9
57
10,3
364
41,1
112
5,0
83
22,1
32
11,9
83
13,4
52
7,2
109
27,1
63
10,8
146
15,7
106
11,8
246
27,4
63
17,0
440
31,2
119
3
4
8
11
12
14
16
20
21
22
37
38
39
49
51
52
55
56
6
9
13
15
17
19
24
26
29
30
31
32
33
34
40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10,0
8
3
5
3
15
18
3
10
4
10
2
1
7
7
10
3
2
11
2
7
1
2
1
1
1
1
3
36
22
1
8
58
52
59
85
55
75
72
67
55
60
76
57
67
57
56
78
80
72
66
83
75
78
72
85
74
51
53
50
54
82
72
66
55
64
88
70
93
75
77
59
70
78
58
74
64
66
81
82
83
68
90
76
80
73
86
75
52
56
76
76
83
80
0,6
4,4
5,0
1,8
0,1
2,1
2,2
1,6
0,3
3,6
3,9
2,1
0,2
5,9
6,1
0,6
0,9
3,3
4,1
1,1
1,4
6,0
7,4
0,6
0,3
6,9
7,2
2,2
0,6
4,0
4,6
1,1
0,1
1,8
2,0
1,3
0,4
2,3
2,7
1,1
0,1
4,9
5,0
1,1
0,1
3,9
3,9
2,7
0,6
5,7
6,3
2,2
0,7
5,3
6,0
3,3
0,2
1,2
1,5
0,7
0,3
7,7
8,0
0,1
0,1
4,0
4,1
0,7
1,0
6,3
7,3
1,1
0,2
6,1
6,3
2,6
0,7
8,3
9,0
0,8
0,1
7,2
7,3
2,2
0,1
5,6
5,8
1,3
0,1
5,9
6,0
2,1
0,1
8,8
8,9
0,3
0,1
3,7
3,8
1,1
0,1
6,1
6,2
5,6
0,2
3,8
4,0
2,1
3,9
5,4
9,3
0,9
2,6
6,4
9,0
1,9
0,2
13,9
14,1
2,7
0,8
7,2
8,0
0,4
33
33
22
33
37
32
34
40
32
28
32
25
20
30
35
33
30
26
44
42
54
45
45
44
41
41
39
33
28
27
45
34
37
176
22,0
52
24
40
35
9
19
7
23
19
39
30
17
39
26
35
34
10
13
12
28
8
23
18
25
3
21
47
29
8
16
16
4
aLeu
aCLsk
aCLNeus
aCLOZ
cell.106/
mV.s.103
mV.s.103
mV.s.103
Pacient
Clovek
aTy%
%
aSe%
%
aNeu%
%
aTy
aSe
aNeu
aLy
cell.106/
cell.106/
cell.106/
cell.106/
aHtc
%
aLy%
%
aCLNeuO
mV.s.103
10
15
13
7
15
8
5
11
12
11
23
18
17
4
8
18
13
19,9
12,2
9
16,9
10,9
9,6
12,6
8,5
8,4
15,5
11,4
7
8,4
6,5
3
Analza klinickch dat
Pojem VARIABILITA m mnoho vznam
Variabilita opakovanch men
CHYBA
Data2,12,83,15,42,1
Variabilita znaku v populaci
ROZPTYL ZNAKU,PIROZEN VARIABILITA
165cm 140cm 182cm 163cm
Promnlivost biologickch spoleenstev
BIODIVERZITA
DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14
Variabilita modelovanch dat
FLUKTUACE, ASOV PROMNLIVOST
Y
as
Variabilita modelovanch dat
CHYBA = NEPESNOST MODELU
Y
X
3b
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
Analza klinickch dat
Vybran zkladn pojmy
Skutenost
Nhoda (vybere jednu z monost pokusu)
Jev
podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne
Pozorovatel
Rozli, co nastaloa) podle monostb) podle toho, jak potebuje
Jevov pole
tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat
Skutenost + Jevov pole = Miteln prostor
Experimentln jednotka -
objekt, na kterm se provd eten
Populace -
soubor experimentlnch jednotek
Znak -
vlastnost sledovan na objektu
Sledovan veliina -
seln hodnota vyjadujc vsledek nhodnho experimentu
Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru
Vbr - vbrov populace - clov populace
Nhodn vbr
Reprezentativnost
4
EMPIRICK ZKON VELKCH SEL
Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.
Pravdpodobnost
je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.
.A
.B
.C
.D
A
P(A)
0
1
Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost
P (A) = 1 jev jist
P (A) = 0 jev nemon
P (A B) = P (A) . P (B/A) zvisl jevy
P (A B) = P (A) . P (B) nezvisl jevy
P (A / B) = P (A B) / P (A) podmnn pravdpodobnost
Analza klinickch dat
5
10.10.210.18
20.00010.110.18
30.10.120.18
40.20.120.18
50.30.120.18
60.30.220.18
5
00.18
00.18
00.18
00.18
00.18
00.18
6
fn
Analza klinickch dat
Pravdpodobnost je "idealizovan relativn etnost"
a) Empirick postup
b) Klasick postup
0
0
0
0
0
0
0
0.1
0
0.0001
0
0.1
0
0.2
0
0.3
0
0.3
Mon nastl jevy - sla 1 - 6
0
0
0
0
0
0
0
0.21
0
0.11
0
0.12
0
0.12
0
0.12
0
0.22
fn
fn
n = 10
n = 50
n =
n - poet bod
Empirick postup u "normln" kostky
Informan hodnota sla m velk vznam
Datapomrov
Dataintervalov
Dataordinln
Datanominln
Kolikrt?
O kolik?
Vt, men?
Rovn se?
Spojitdata
Diskrtndata
Podlhodnot vt/men ne specifikovan hodnota
?
Procenta (odvozen hodnoty)
Analza klinickch dat
7
217
429
733
444
255
1.5411
132
0.524
0.510
0.25
5
7.5
8
4.5
8.5
4
Spojit a diskrtn data - zkladn pohled
X
X
Pvodn dataX
14,2.....18,8Spojit
1234513Diskrtn
Analza klinickch dat
FREKVENN TABULKY
Uspodan data
7
0
0
0
0
0
0
8
0
0
0
0
0
0
9
013
118
219
312
421
510
611
77
88
914
10
ROZLOEN HODNOT X
Diskrtn data - prvn nhled
Promnn X
01234...10
Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.
Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X
9
0
0
0
0
0
0
0
0
0
0
X
Poty (absolutn frekvence)
10
Analza klinickch dat
Pklad: Zkladn uspodn souboru diskrtnch dat
n = 100 dnx znak : poet nik nebezpen ltky
n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n
x
0
1
2
3
n (x)
20
10
30
40
p (x)
0,2
0,1
0,3
0,4
N (x)
20
30
60
100
F (x)
0,2
0,3
0,6
1,0
FREKVENN TABULKA jako zkladn nstroj popisu
Analza klinickch dat
11
2020
1030
3060
40100
Grafick vstupy z frekvenn tabulky - diskrtn data
X
Analza klinickch dat
11
0
0
0
0
12
126
236
338
424
541
620
722
X
p(x)
0 1 2 3
0
0
0
0
n(x)
0 1 2 3
0
0
0
0
X
F(x)
0 1 2 3
0
0
0
0
X
N(x)
0 1 2 3
0
1
Spojit data - prvn nhled
Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn
Aktivita enzymu: X
I. Utdit podle velikosti
II. Rozdlit do interval o rozumn ce
III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti
IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech
V. Grafick znzornn - histogram
12
0
0
0
0
0
0
0
Aktivita
13
0
f(x)
Analza klinickch dat
FREKVENN TABULKA u spojitch dat
n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)
d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"
Interval
60
f
28465820114316103
Analza klinickch dat
Sprvn histogram ?
Sprvn histogram ?
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Pojem ROZLOEN - pklad spojitch datj(x)0F(x)Rozloenx Distribun funkce0Je - li dna distribun funkce, je dno rozloenx
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Vbrov rozloen hodnot lze modelov popsat a definovat tak pravdpodobnost vskytu Xf(x)xf(x)xf(x)xj(x)j(x)j(x)
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Distribun funkce jako uiten nstroj pro prci s rozloenmx
j(x)1,00F(x)P(X x) = F(x) = F(x")F(x) distribun funkceP(X x) = j(x) d(x) Mj(x) d(x) = 1- F(x): Pravdpodobnost, e se X vyskytujev intervalu MMZnme-li distribun funkci, pak znme rozloen sledovan veliiny.
Pro jakoukoli mnoinu hodnot (M) lze urit P, e X do tto mnoiny pat.Plocha = relativn etnostx
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Jak vznikaj informace ?- frekvenn sumarizace spojitch datGrafick vstupy z frekvenn tabulky spojit dataf(x)xF(x)xKVANTIL20406080100Uspodn sel podle velikosti a konstrukce rozloen umouje pravdpodobnostn zaazen kad jednotliv hodnotyX0.1; X0.9; X0.5; Xq
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Otzka: Jak velk mus bt X, aby 5 % vech hodnot bylo nad nm?X0,95 xj(x)0,95F(x)Hledme: P(X xq) = 0,95 = qxq = (x0,95) = ?q = 0,95 PravdpodobnostJakkoliv slo na ose x je kvantilem5 %F (xq ) = qKvantil je slo, jeho hodnota distribun funkce je rovna P,pro kterou je kvantil definovn
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekNormln rozloen jako statistick modelAplikace modelovch rozloenPehled modelovch rozloenVI. Modelov rozloen
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
AnotaceKlasickm postupem statistick analzy je na zklad vzorku clov populace identifikovat typ a charakteristiky modelovho rozloen dat, vyut jeho matematickho modelu k popisu reality a zskan vsledky zobecnit na hodnocenou clovou populaci.Vyuit tohoto pstupu je mon pouze v ppad shody relnch dat s modelovm rozloenm, v opanm ppad hroz zskn zavdjcch vsledk.Nejklasitjm modelovm rozloenm, od nho je odvozena cel ada statistickch analz je tzv. normln rozloen, znm t jako Gaussova kivka.
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Rozloen hodnot jako model: Normln rozloenN (m,s)j(x)mN (0,1)j(z)0TabelovanpodobaStandardizovan formaxzz = x - ms
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek
Parametry charakterizujc normln rozloen a jejich vznamj(x)xmedinprmrm ~ xprmr - ukazatel stedus2 ~ s2rozptylxixa)b)ms ~ s smrodatn odchylkaPravidlo 3skoeficient variance
c) d)E (x) ~ x ~ mD (x) ~ s2 ~ s2
Vytvoil Institut biostatistiky a analz, Masarykova univerzita
Graf5
0
0.2
0.5
1
2.1
4
6.5
7.2
6.5
4
2.1
1
0.5
0.2
0
24
00.02
200.02
400.02
600.02
800.02
1000.02
01
201
401
601
801
1001
Otzka: Jak velk mus bt X, aby 5 % vech hodnot bylo nad nm?
x0,95 x
j(x)
0,95
F(x)
Hledme: P(X xq) = 0,95 = q = (x0,95) xq = ?
q = 0,95 Pravdpodobnost
Jakkoliv slo na ose x je kvantilem
5 %
F (xq ) = q
Kvantil je slo, jeho hodnota distribun funkce je rovna P,pro kterou je kvantil definovn
Analza klinickch dat
25
372
464
555
234
423
612
310
210
1
0
1
Formln popis tvaru rozloen
25
0
0
0
0
0
0
0
0
26
0
0
0
0
0
0
0
0
27
0
0
0
0
0
0
0
0
0
0
0
28
372
464
555
234
423
612
310
210
1
0
1
x
MIN Medin MAX
f(x)
f(x)
f(x)
x
x
MIN Medin MAX
MIN Medin MAX
Z%kvantil
Y%kvantil
Medin
Z%kvantil
Y%kvantil
Medin
Z%kvantil
Y%kvantil
Medin
Medin = 50 % kvantil = frekvenn sted
MAX - MIN = rozsah (range)
Modus = nejastj hodnota
Analza klinickch dat
Vpoet medinu z primrnch dat
A. Lich poet (n)
B. Sud poet (n)
Vzorek:
5; 1; 8; 3; 4
Vzorek:
1; 3; 4; 5; 7; 8
Medin - poad:
(n + 1) / 2 = 3. slo = 4
Medin - poad:
(n / 2) ; [(n + 2) / 2] = (4 + 5)/2 = 4.5
Analza klinickch dat
29
372
464
555
234
423
612
310
210
1
0
1
Rozloen hodnot jako model: pklad - Normln rozloen
Analza klinickch dat
N (m,s)
E (x) ~`x ~ mD (x) ~ s2 ~ s2
j(x)
m
j (x) = .
1
s . 2.p
. e -
(x - m)2
2s2
N (0,1)
j(z)
0
j (z) = .
1
2.p
. e -
z2
2
Tabelovanpodoba
Standardizovan forma
x
z
z =
x - m
s
3 0
372
464
555
234
423
612
310
210
1
0
1
Parametry charakterizujc normln rozloen a jejich vznam
Analza klinickch dat
j(x)
x
medin
prmr
m ~`xprmr - ukazatel stedu
s2 ~ s2rozptyl
s2=
S(xi-x)2
n-1
xi
x
s ~