+ All Categories
Home > Documents > I. Statistika ve vědecké praxi

I. Statistika ve vědecké praxi

Date post: 03-Jan-2016
Category:
Upload: leila-houston
View: 61 times
Download: 2 times
Share this document with a friend
Description:
Pozice statistické analýzy ve vědě a klinické praxi Význam statistických výstupů. I. Statistika ve vědecké praxi. Anotace. - PowerPoint PPT Presentation
281
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Pozice statistické analýzy ve vědě a klinické praxi Význam statistických výstupů I. Statistika ve vědecké praxi
Transcript
  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekPozice statistick analzy ve vd a klinick praxiVznam statistickch vstupI. Statistika ve vdeck praxi

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotaceStatistick analza biologickch dat je jednm z nstroj, s jejich pomoc se sname zjistit odpovdi na nae otzky tkajc se pochopen iv prody. Jako kad nstroj je i statistickou analzu nezbytn na jedn stran korektn vyuvat a na druhou stranu nepeceovat jej monosti.Klovm faktem pi statistick analze dat je nahlen na realitu prostednictvm vzorku a pijmut toho, e vsledky na analzy jsou jen tak dobr, jak dobr je n vzorek. Reprezentativnost a nhodnost vzorku spolu s jeho velikost jsou dleit faktory ovlivujc vrohodnost naich zvr.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Vzkum, realita, statistika Vzkum je nam zpsobem porozumn realitAle jak pesn a pravdiv je nae porozumn? Statistika je jednm z nstroj vnejcch do naich vsledk uritou spolehlivost.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Vznam variabilityNae realita je variabiln a statistika je vdou zabvajc se variabilitou Korektn analza variabilita a jej pochopen pin uiten informace o na realitV ppad deterministickho svta by statistick analza nebyla potebn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Data2,1 2,8 3,2 1,2 5,2 2,9Variabilita opakovanch menrozptyl znaku, pirozen variabilita165 cm140 cm182 cm163 cmVariabilita znaku v populacichyba = nepesnost modeluVariabilita modelovanch datVariabilita asovch adVariabilita ve skladb biologickch spoleenstevDRUH 1 DRUH 2 DRUH 3 DRUH 415 30 40 14biodiverzitafluktuace, asov promnlivostchybayxyasBiostatistika - rzn pstupy k variabilit

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    . a ty uruj pstup k jejmu hodnocenMaskovn a minimalizace vlivuRespektovn a odhadovn vlivuPm vyuit k predikcm chovn systmuPojem VARIABILITA m mnoho vznam

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Statistika vznam a definiceWWW.WIKIPEDIA.ORG:Statistika je matematickou vdou zabvajc se shromdnm, analzou, interpretac, vysvtlenm a prezentac dat. Me bt aplikovna v irokm spektru vdeckch discipln od prodnch a po sociln vdy. Statistika je vyuvna i jako podklad pro rozhodovn, kdy nicmn me bt zmrn i nevdomky zneuita. Statistika vyuv matematick modely reality k zobecnn vsledk experiment a vzorkovn. Statistika funguje korektn pouze pokud jsou splnny pedpoklady jejch metod a model.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Co me statistika ci o na realit? MonostiRealitaVzorekDataInformaceZnalostPochopenStatistikaStatistika je nasazena v procesu zskn informac z vzorkovanch dat a je podporou v zskn na znalosti a pochopen problmu.Statistika nen schopna init zvry o jevech neobsaench v naem vzorku.Statistika nen nhradou na inteligence !!!

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Clov populaceClov populace klov pojem statistickho zpracovnSkupina objekt o nich se chceme nco dozvdt (nap. pacienti s danou diagnzou, vichni lid nad 60 let, men hemoglobinu v dan laboratoi)Mus bt definovna jet ped zahjenm sbru datNa clov populaci probh vzorkovn dat, kter mus clovou populaci dobe (reprezentativn) charakterizovatClov populaceKlov faktory clov populaceDesign experimentu a vzorkovac plnVzorkovn a analza dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Statistika a zobecnn vsledkClem analzy nen pouh popis a analza vzorku, ale zobecnn vsledk ze vzorku na jeho clovou populaci Pokud vzorek nereprezentuje clovou populaci, vede zobecnn k chybnm zvrmNeznm clov populaceX, Y, ZDky zobecnn vsledk znme vlastnosti clov populaceVzorekAnalza

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Vzorkovn a jeho vznam ve statisticeStatistika hovo o realit prostednictvm vzorku!!!Statistick pedpoklady korektnho vzorkovnRepresentativnost: struktura vzorku mus maximln reflektovat realituNezvislost: nkolikansobn vzorkovn tho objektu nepin ze statistickho hlediska dnou novou informaci

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Velikost vzorku a pesnost statistickch vstupExistuje skuten rozloen a skuten prmr men promnnZ jednoho men nezjistme nic Vzorek:?????Vzorek urit velikosti poskytuje odhad reln hodnoty s definovanou spolehlivostVzorek:Odhad prmru atd.Vzorkovn vech existujcch objekt poskytne skutenou hodnotu dan popisn statistiky, nicmn tento pstup je ve vtin ppadech nereln.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Mal dataVelk dataObrovsk dataUmn uchopitUmn prodatUmn pochopitRzn role statistiky pi rzn velkm vzorku

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    DataSchopnost: vidt data komunikovat interpretovat - prodvatPstup biostatistiky

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    VSLEDKYclov populacevbr dle optimlnho plnureprezentativn vzorek n jedinc (faktor F)men znakuvariabilita hodnot ve vbrovm souboru?el analzy: Popisn analyzovan znak clov populace (X)

    jin vznamn faktor charakterizujc clovou populaci (F)ZVRY (reprezentativnost, spolehlivost)ReprezentativnostPesnostSpolehlivost? Experimentln design: nezbytn vbava biologa

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    VSLEDKYclov populacevbr subjekt pro vstup do hodnocen / studieRANDOMIZACE vzjemn srovnateln vzorky (faktor F)men znaku Xvariabilita hodnot X v rameni A?el analzy: Srovnvac (2 ramena) analyzovan znak clov populace (X)

    jin vznamn faktor charakterizujc clovou populaci (F)ZVRY (rozliovac schopnost, rozdl ramen A x B, srovnatelnost ramen, reprezentativnost)variabilita hodnot X v rameni Brameno Arameno BSrovnatelnostPesnostSpolehlivost?Experimentln design: nezbytn vbava biologa

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Praktick a statistick vznamnostSamotn statistick vznamnost nem dn reln vznam, je pouze mtkem nhodnosti hodnocenho jevuPro vyhodnocen reln vznamnosti je nezbytn znt i reln vznamn hodnotyStatistick vznamnostPraktick vznamnost

    ANONEANOOK, praktick i statistick vznamnost je ve shod, jednoznan zvrVznamn vsledek je statistick artefakt velkho vzorku, prakticky nevyuitelnNEVsledek me bt pouh nhoda, neprkazn vsledekOK, praktick i statistick vznamnost je ve shod, jednoznan zvr

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Obecn schma vyuit statistick analzyVzorkovnExperimentln designJak velk vzorek je nezbytn pro statisticky relevantn vsledky? Klov stratifikan kritria clov populace.Vzorkovac pln zabezpeujc nhodnost a reprezentativnost vzorku.Uloen a management datUloen dat ve vhodn form a jejich vyitn pedchzejc vlastn analze je klovm krokem statistick analzy.Vizualizace datGrafick inspekce dat je nezbytnm krokem analzy vzhledem ke schopnosti lidskho mozku primrn akceptovat obrazov data. Poskytne vhled do dat, pedstavu o jejich rozloen, vazbch promnnch apod.Popisn analzaPopisn analza umouje vyhodnotit srovnnm s existujc literaturou realistinost namench rozsah dat.Testovn hypotzTestovn vazeb mezi rznmi promnnmi s clem navzjem vysvtlit jejich variabilitu a tm pispt k pochopen eenho problmu.ModelovnMonm vyvrcholenm analzy je vyuit zskanch znalost a pochopen problmu k vytvoen prediktivnch model.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Prospektivn modelov - postihuje chovn jev pi respektovn variabilityStochastick modelovn: predikce neuritch jev

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Osa YPredikovanpravdpodobnostOsa XParametr nebo kombinace parametrData konkrtnch pacient (subjekt) k pmmu hodnocenStochastick modelovn: predikce neuritch jev

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Schopnost: vytvet prakticky vyuiteln nstroje Stochastick modelovn: predikce neuritch jev

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekKlov vznam korektnho uloen zskanch datPravidla pro ukldn datitn dat ped analzou

    II. Pprava dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotaceSouasn statistick analza se neobejde bez zpracovn dat pomoc statistickch software. Pedpokladem spchu je sprvn uloen dat ve form databzov tabulky umoujc jejich zpracovn v libovoln aplikaci.Nemn dleit je vnovat pozornost itn dat pedchzejc vlastn analze. Kad chyba, kter vznikne nebo nen nalezeno ve fzi ppravy dat se promtne do vech dalch krok a me zapinit neplatnost vsledk a nutnost opakovn analzy.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Parametry (znaky)OpakovnDATA ukzka uspodn datovho souboru

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Sprvn a pehledn uloen dat je zkladem jejich pozdj analzyJe vhodn rozmyslet si pedem jak budou data ukldnaPro potaov zpracovn dat je nezbytn ukldat data v tabulrn formNejvhodnjm zpsobem je uloen dat ve form databzov tabulkyKad sloupec obsahuje pouze jedin typ dat, identifikovan hlavikou sloupceKad dek obsahuje minimln jednotku dat (nap. pacient, jedna nvtva pacienta apod.)Je neppustn kombinovat v jednom sloupci seln a textov hodnotyKomente jsou uloeny v samostatnch sloupcchU textovch dat nezbytn kontrolovat peklepy v nzvech kategoriSpecifickm typem dat jsou datumy u nich je nezbytn kontrolovat, zda jsou datumy uloeny v korektnm formtu

    Takto uspodan data je v tabulkovch nebo databzovch programech mon pevst na libovolnou vstupn tabulkuPro zkladn uloen a itn dat menho rozsahu je mon vyut aplikac MS OfficeZsady pro ukldn dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Ukldn dat v MS OfficeMS ExcelKontingenn tabulky rychl sumarizace rozshlch tabulekMonost vpot a grafovch vstup pmo v aplikaciVisual Basic sloitj aplikaceOmezen tabulky na 256x65536 bunk (do verze 2003)Omezen kontrola chyb pi zadvn

    MS AccessPlnohodnotn databze vhodn pro velk mnostv dat, dky omezeny v podstat jen dostupnou pamtKontrola typu datRelace tabulek omezen velikosti souboruVisual Basic a formule sloitj aplikaceOmezen tabulky na 255 sloupcVpoty a grafy jsou sloitj ne v Excelu

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Monosti MS Excel Sprva a prce s tabulrnmi daty azen dat, vbry z dat, pehledy dat Formtovn a pehledn zobrazen dat Zobrazen dat ve form graf Rzn druhy vpot pomoc zabudovanch funkc Tvorba tiskovch sestav Makra zautomatizovn astch innost Tvorba aplikac (Visual Basic for Aplications)

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Import a export datImport datManuln zadvn import podpora importu ze starch verz Excelu, textovch soubor, databz apod. koprovn pes schrnku Windows vkldn z nejrznjch aplikac MS Office, Statistica atd. vyuit textovch soubor jako kompatibilnho formtu pro penos dat mezi rznmi aplikacemi

    Export datUkldnm soubor ve formtech podporovanch jinmi SW, ast jsou textov soubory, dbf soubory nebo star verze ExceluPm koprovn pes schrnku Windows

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Tipy a trikyVbr bunkCTRL+A vbr celho listuCTRL + klepnut my do buky vbr jednotlivch bunk SHIFT + klepnut my na jinou buku vbr bloku bunkSHIFT + ipky vbr sousednch bunk ve smru ipkySHIFT+CTRL+END (HOME) vbr do konce (zatku) oblasti dat v listuSHIFT+CTRL+ipky vbr souvislho dku nebo sloupce bunkSHIFT + klepnut na objekty vbr vce objekt Koprovn a vkldnCTRL+C zkoprovn oznaen oblasti bunkCTRL+V vloen obsahu schrnky oblast bunk, objekt, data z jin aplikaceMy a okraje bukyChycen my za okraj umouje pesun buky nebo bloku bunk

    Pi chycen tvereku v pravm dolnm rohu vbru je taenm mono vyplnit vce bunk hodnotami pvodn buky (ve vzorcch se mn relativn odkazy, je tak mon vyplnn hodnotami ze seznamu nap. po sob jsouc nzvy msc.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Databzov struktura dat v ExceluJednotliv zznamy(taxon, lokalita atd.)Sloupce tabulky = parametry zznam, hlavika udv obsah sloupce stejn daj v celm sloupci

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Automatick zadvac formulSlou k usnadnn zadvn dat do databzovch tabulekNat automaticky hlaviky sloupc jako zadvan polokyNzvy sloupcObsah dan buky - editovatelnNov zznamVyhledvn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Automatick seznamyVytv se z hodnot bunk v danm sloupci a umouj vloit hodnotu vbrem ze seznamu ji zadanch hodnot usnadnn zadvn

    Sloupec z nj je seznam vytvoen a pro kter platBuka, do n se vlo vybran hodnota

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Automatick kontrola datUmouje ovit typ, rozsah nebo povolit pouze urit seznam hodnot zadvanch do sloupce databzov tabulkyCo je povoleno definin obory sel, seznamy, vzorce atd.Rozsahy hodnot, naten seznam apod.komunikace s uivatelem

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    SeznamySkupiny hodnot zachovvajc logick poad, nkter jsou zabudovan (nap. dny v tdnu, msce v roce), dal je mon uivatelsky vytvoit, slou pro ely azen a automatickho vyplovn datVbr bunk pro nov seznamNaten novho seznamuExistujc seznamy

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    azen datazen dat je nejjednodum zpsobem jejich zpehlednn, uitenm hlavn u mench/vsledkovch tabulek

    Zkontrolujte, zda seazen nezni vazby mezi bukami = kontrola oblasti, kterou adte.

    Vyut prvn dek oblasti jako zhlavDal monosti azen dk, azen podle seznamuPodle eho aditSmr azen vzestupn, sestupn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

    ?

    ?

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Automatick filtrPomoc automatickho filtru je snadn vybrat seky dat pro dal zpracovn na zklad hodnot ve sloupcch databzov tabulky, vbr je mon i podle vce sloupc (nap. urit skupina pacient)Funkce automaticky rozezn hlaviky sloupc v souvisl oblasti bunkU sloupc pouitch pro filtraci jsou rozbalovac seznamy zbarveny modeVhodn pro itn dat (vyhledvn peklep, kombinace textu a sel)Vbr hodnot pro filtraciRozbalen seznamu hodnot nalezench ve sloupci

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekTypy grafick vizualizaceRizika desinterpretace grafickho zobrazen datIII. Vizualizace dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotacePrvnm krokem v analze dat je jejich vizualizace. Rzn typy dat nm umoujc zskn pedstavy o rozloen dat, zastoupen kategori i vztazch promnnch navzjem. Prostednictvm vizualizace zskvme vhled do dat a zanme vytvet hypotzy o zkonitostech panujcch mezi promnnmi v hodnocenm souboru dat.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    1. Vskyt kategori (1, 2, 3,)Kolov (vseov) grafAbsolutn poty 2. Vvoj hodnot (v ase) Y vs. X (t)% Y

    Y Y Sloupcov grafBodov grafPlon graf30%40%30%12330%30%40%123Sloupcov grafadaGrafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    3. Vztahy mezi promnnmi - korelace015301231020X2ada2X1 015300510152025X2ada2X1 015301231020X2ada2X1 015301231020X2ada2X1 Bodov - korelan diagramBodov - korelan diagramGrafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    4. Kvantitativn hodnoty parametru() - X - v rmci kategori A, B, CSloupcov grafKrabicov grafX 02040ABCada2050100ABCada2X 050100ABCada2X 5. HistogramGrafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    6. Zviditelnn primrnch datnx1x2x3Grafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    7. Vztahy mezi promnnmi - interakce dvou parametr, reakn plochyGrafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    8. Grafick zviditelnn m nekonen mnoho monostGrafick prezentace dat - umn komunikace

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Nesprvn uit graf: problm rozsahu seln osy

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Nesprvn uit graf: problm standardizace hodnot

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Grafy zamen na vcerozmrn soubory dok zviditelnit i velik soubory dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekJak vznikaj informaceRozloen datIV. Teoretick pozad statistick analzy

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotaceZkladnm principem statistiky je pravdpodobnost vskytu njak udlosti. Prostednictvm vzorkovn se sname odhadnout skutenou pravdpodobnost udlost.Klovou otzkou je velikost vzorku, m vt vzorek, tm vt ance na projeven se skuten pravdpodobnosti vskytu jevu.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    JAK vznikaj informace ? zkladn pojmySkutenostNhoda (vybere jednu z monost pokusu)Jevpodmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo nePozorovatelRozli, co nastaloa) podle monostb) podle toho, jak potebujeJevov poletda vech jev, kter jsme se rozhodli nebo jsme schopni sledovatSkutenost + Jevov pole = Miteln prostorExperimentln jednotka -objekt, na kterm se provd etenSledovan veliina -seln hodnota vyjadujc vsledek nhodnho experimentuZnak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboruVbr - vbrov populace - clov populaceNhodn vbrReprezentativnost

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    JAK vznikaj informace ? Empirical approachClassical approachEmpirick postupmon jevy: sla 1 6n poet hod (opakovn) f nn = 10 f nn = 50 f nn = U sloitch stochastickch systm se pravda zsk a po odveden znanho mnostv experimentln prce: musme dt systmu anci se projevit

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    JAK vznikaj informace ? Empirick postupmon jevy: sla 1 6n poet hod (opakovn) f nn = 10 f nn = 50 f nn = Pi realizaci nhodnho experimentu roste se zvyujcm se potem opakovn pravdiv znalost systmu (vsledky se stvaj stabilnj) . diskutabiln je ale ovem mra zobecnn konkrtnho experimentu

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Empirick zkon velkch selPi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.Pravdpodobnost je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1..A.B.C.DAP(A)01Z praktickho hlediska je pravdpodobnostidealizovan relativn etnost P (A) = 1 jev jistP (A) = 0 jev nemonP (A B) = P (A) . P (B/A) ..zvisl jevyP (A B) = P (A) . P (B). nezvisl jevyP (A / B) = P (A B) / P (B) .podmnn pravdpodobnost

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Pravdpodobnost vskytu jevu rozloen datve je mon: pouze jev s pravdpodobnost 0 nikdy nenastaneexistuje pravdpodobnost vskytu jev (nedeterministick zvry)0pravdpodobnost vskytux1poet chlapc v rodin s X dtmi2345j(x)xvka postavyplocha = pravdpodobnost vskytupravdpodobnost lze zkoumat retrospektivn i prospektivn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekSpojit a kategoriln dataZkladn popisn statistikyGrafick popis datV. Zkladn typy dat

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotaceRealitu meme popisovat rznmi typy dat, kad z nich se specifickmi vlastnostmi, vhodami, nevhodami a vlastn sadou vyuitelnch statistickch metod - od binrnch pes kategoriln, ordinln a po spojit data roste mra informace v nich obsaen.Zkladnm pstupem k popisn analze dat je tvorba frekvennch tabulek a jejich grafickch reprezentac histogram.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ? rzn typy dat znamenaj rznou informaciKolikrt ? Podl hodnot vt/men ne specifikovan hodnota ? O kolik ?Vt, men ?Rovn se ?Procenta odvozen hodnotyData pomrov

    Data intervalov

    Data ordinln

    Data nominlnSpojit dataDiskrtn dataKategoriln otzky

    Otzky Ano/NeSamotn znalost typu dat ale na dosaen informace nesta .

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ? rzn typy dat znamenaj rznou informaciPRMRMEDINMODUSData pomrov

    Data intervalov

    Data ordinln

    Data nominlnSpojit dataDiskrtn dataStatistika steduXY = f

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    JAK vznikaj informace ?- opakovan men informuj rozloenm hodnotKOLIK se namiloCO se namiloDiskrtn dataSpojit datayxyxX: men znakY: frekvence - absolutn / relativn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    X: Prmrn poet vrobk v prodejnY: Odhad prostoru prmrn nabzenho k vystaven vrobkuX: 1,2 : (1,15 - 1,24)

    Y: 1,8 : (1,75 - 1,84)X/Y = 0,667 : 1,151,841,241,75()Odvozen data: Pozor na odvozen indexyZnak X: HmotnostZnak Y: PlochaPklad I:Pklad II:+ / - 3,8 %+ / - 2,5 %+ / - 6,2 %prmr(min - max):-Nov veliina m jinou ku rozpt ne ty, ze kterch je odvozen

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    N: 100 dt (hemofilik) x: znak: poet krvcivch epizod za msc

    n(x) absolutn etnost x p(x) relativn etnost; p(x) = n(x) / n N(x) kumulativn etnost hodnot nepevyujcch x;N(x) = S n(t) F(x) kumulativn relativn etnost hodnot nepevyujcch x; F(x) = N(x) / nJak vznikaj informace ?- frekvenn tabulka jako zkladn nstroj popisuPrimrn dataFrekvenn sumarizace0012113112......n = 100Poty epizod pro n = 100 hemofilikt xDISKRTN DATA

    xn(x)p(x)N(x)F(x)0200,2200,21100,1300,32300,3600,63400,41001,0

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ? Grafick vstupy z frekvenn tabulkyn(x)xp(x)xN(x)xF(x)x3210012301230123

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ? - frekvenn tabulka jako zkladn nstroj popisuPklad:x: koncentrace ltky v krvi n = 100 pacientPrimrn dataFrekvenn sumarizacen = 100 opakovanch men (100 pacient) x: koncentrace sledovan ltky v krvi (20 100 jednotek)

    d(l) ka intervalu n(l) absolutn etnost n(l) / n intervalov relativn etnost N(x) intervalov kumulativn etnost do horn hranice X F(x) intervalov relativn kumulativn etnost do horn hranice X 1,211,481,560,311,211,330,33...n = 100Hodnoty pro n = 100 osobSPOJIT DATA

    intervd(l)n(l)n(l)/nN(x)F(x)

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ? - frekvenn sumarizace spojitch datxx

    F(x)

    Intervalov relativn kumulativn etnostHistogramVbrov distribun funkce

    f(x)=

    Intervalov hustota etnosti20406080100Plocha: n(l) / nn(l) / n d(l)

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Poet zvolench td a velikost souboru uruj kvalitu vstupuk = 10 tdk = 5 td 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 1 2 3 4 5k = 20 td 1,0 2,0 3,0 4,0 5,0

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

    Graf16

    0

    1

    5

    2

    3

    3

    1

    3

    0

    01

    VOD

    Zkladn zpracovn dat

    Analza klinickch dat

    1

    BIOSTATISTIKA - BIOMETRIKA

    Vda zabvajc se hodnocenm biologickch dat

    Popisn analza dat

    "Data mining"

    Experimentln design

    Stochastick modelovn

    Predikce a hodnocen neuritosti prognz

    Analza asovch ad

    Vcerozmrn analza

    Analza biodiverzity

    QA/QC

    Vda zabvajc se variabilitou

    Analza klinickch dat

    2

    Ukzka uspodanho datovho souboru

    Pacient

    Clovek

    aLeu

    aTy%

    aSe%

    aNeu%

    aTy

    aSe

    aNeu

    aLy

    aHtc

    aCLsk

    aCLNeus

    aCLOZ

    aLy%

    cell.106/

    %

    %

    %

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    %

    mV.s.103

    mV.s.103

    mV.s.103

    %

    3

    1

    4

    33

    72

    32

    4

    2

    7,6

    8

    58

    66

    0,6

    4,4

    5,0

    1,8

    33

    95

    19

    48

    24

    8

    3

    4

    3

    52

    55

    0,1

    2,1

    2,2

    1,6

    22

    77

    35

    33

    40

    11

    4

    6,1

    5

    59

    64

    0,3

    3,6

    3,9

    2,1

    33

    103

    26

    49

    35

    12

    5

    6,9

    3

    85

    88

    0,2

    5,9

    6,1

    0,6

    37

    81

    13

    45

    9

    14

    6

    5,9

    15

    55

    70

    0,9

    3,3

    4,1

    1,1

    32

    137

    33

    61

    19

    16

    7

    8

    18

    75

    93

    1,4

    6,0

    7,4

    0,6

    34

    151

    20

    59

    7

    20

    8

    9,6

    3

    72

    75

    0,3

    6,9

    7,2

    2,2

    40

    77

    11

    38

    23

    21

    9

    6

    10

    67

    77

    0,6

    4,0

    4,6

    1,1

    32

    120

    26

    52

    19

    22

    10

    3,3

    4

    55

    59

    0,1

    1,8

    2,0

    1,3

    28

    81

    42

    24

    39

    37

    11

    3,8

    10

    60

    70

    0,4

    2,3

    2,7

    1,1

    32

    111

    42

    29

    30

    38

    12

    6,4

    2

    76

    78

    0,1

    4,9

    5,0

    1,1

    25

    366

    73

    115

    17

    39

    13

    6,8

    1

    57

    58

    0,1

    3,9

    3,9

    2,7

    20

    234

    59

    71

    39

    49

    14

    8,5

    7

    67

    74

    0,6

    5,7

    6,3

    2,2

    30

    156

    25

    108

    26

    51

    15

    9,3

    7

    57

    64

    0,7

    5,3

    6,0

    3,3

    35

    129

    21

    23

    35

    52

    16

    2,2

    10

    56

    66

    0,2

    1,2

    1,5

    0,7

    33

    46

    30

    12

    34

    55

    17

    9,9

    3

    78

    81

    0,3

    7,7

    8,0

    0,1

    30

    189

    24

    140

    10

    56

    18

    5

    2

    80

    82

    0,1

    4,0

    4,1

    0,7

    26

    101

    25

    54

    13

    6

    1

    8,8

    11

    72

    83

    1,0

    6,3

    7,3

    1,1

    44

    268

    36,6

    145

    12

    9

    2

    9,2

    2

    66

    68

    0,2

    6,1

    6,3

    2,6

    42

    168

    26,9

    76

    28

    13

    3

    10,0

    7

    83

    90

    0,7

    8,3

    9,0

    0,8

    54

    181

    20,1

    81

    8

    15

    4

    9,6

    1

    75

    76

    0,1

    7,2

    7,3

    2,2

    45

    343

    47

    124

    23

    17

    5

    6,0

    45

    40

    21

    19

    6

    7,2

    2

    78

    80

    0,1

    5,6

    5,8

    1,3

    44

    103

    17,8

    63

    18

    24

    7

    8,2

    1

    72

    73

    0,1

    5,9

    6,0

    2,1

    41

    209

    34,9

    57

    25

    26

    8

    10,3

    1

    85

    86

    0,1

    8,8

    8,9

    0,3

    41

    364

    41,1

    112

    3

    29

    9

    5,0

    1

    74

    75

    0,1

    3,7

    3,8

    1,1

    39

    83

    22,1

    32

    21

    30

    10

    11,9

    1

    51

    52

    0,1

    6,1

    6,2

    5,6

    33

    83

    13,4

    52

    47

    31

    11

    7,2

    3

    53

    56

    0,2

    3,8

    4,0

    2,1

    28

    109

    27,1

    63

    29

    32

    12

    10,8

    36

    50

    76

    3,9

    5,4

    9,3

    0,9

    27

    146

    15,7

    106

    8

    33

    13

    11,8

    22

    54

    76

    2,6

    6,4

    9,0

    1,9

    45

    246

    27,4

    63

    16

    34

    14

    17,0

    1

    82

    83

    0,2

    13,9

    14,1

    2,7

    34

    440

    31,2

    119

    16

    40

    15

    10,0

    8

    72

    80

    0,8

    7,2

    8,0

    0,4

    37

    176

    22,0

    52

    4

    41

    42

    43

    47

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    4

    72

    32

    7,6

    95

    19

    48

    4

    77

    35

    33

    6,1

    103

    26

    49

    6,9

    81

    13

    45

    5,9

    137

    33

    61

    8

    151

    20

    59

    9,6

    77

    11

    38

    6

    120

    26

    52

    3,3

    81

    42

    24

    3,8

    111

    42

    29

    6,4

    366

    73

    115

    6,8

    234

    59

    71

    8,5

    156

    25

    108

    9,3

    129

    21

    23

    2,2

    46

    30

    12

    9,9

    189

    24

    140

    5

    101

    25

    54

    8,8

    268

    36,6

    145

    9,2

    168

    26,9

    76

    10,0

    181

    20,1

    81

    9,6

    343

    47

    124

    6,0

    40

    21

    7,2

    103

    17,8

    63

    8,2

    209

    34,9

    57

    10,3

    364

    41,1

    112

    5,0

    83

    22,1

    32

    11,9

    83

    13,4

    52

    7,2

    109

    27,1

    63

    10,8

    146

    15,7

    106

    11,8

    246

    27,4

    63

    17,0

    440

    31,2

    119

    3

    4

    8

    11

    12

    14

    16

    20

    21

    22

    37

    38

    39

    49

    51

    52

    55

    56

    6

    9

    13

    15

    17

    19

    24

    26

    29

    30

    31

    32

    33

    34

    40

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    10,0

    8

    3

    5

    3

    15

    18

    3

    10

    4

    10

    2

    1

    7

    7

    10

    3

    2

    11

    2

    7

    1

    2

    1

    1

    1

    1

    3

    36

    22

    1

    8

    58

    52

    59

    85

    55

    75

    72

    67

    55

    60

    76

    57

    67

    57

    56

    78

    80

    72

    66

    83

    75

    78

    72

    85

    74

    51

    53

    50

    54

    82

    72

    66

    55

    64

    88

    70

    93

    75

    77

    59

    70

    78

    58

    74

    64

    66

    81

    82

    83

    68

    90

    76

    80

    73

    86

    75

    52

    56

    76

    76

    83

    80

    0,6

    4,4

    5,0

    1,8

    0,1

    2,1

    2,2

    1,6

    0,3

    3,6

    3,9

    2,1

    0,2

    5,9

    6,1

    0,6

    0,9

    3,3

    4,1

    1,1

    1,4

    6,0

    7,4

    0,6

    0,3

    6,9

    7,2

    2,2

    0,6

    4,0

    4,6

    1,1

    0,1

    1,8

    2,0

    1,3

    0,4

    2,3

    2,7

    1,1

    0,1

    4,9

    5,0

    1,1

    0,1

    3,9

    3,9

    2,7

    0,6

    5,7

    6,3

    2,2

    0,7

    5,3

    6,0

    3,3

    0,2

    1,2

    1,5

    0,7

    0,3

    7,7

    8,0

    0,1

    0,1

    4,0

    4,1

    0,7

    1,0

    6,3

    7,3

    1,1

    0,2

    6,1

    6,3

    2,6

    0,7

    8,3

    9,0

    0,8

    0,1

    7,2

    7,3

    2,2

    0,1

    5,6

    5,8

    1,3

    0,1

    5,9

    6,0

    2,1

    0,1

    8,8

    8,9

    0,3

    0,1

    3,7

    3,8

    1,1

    0,1

    6,1

    6,2

    5,6

    0,2

    3,8

    4,0

    2,1

    3,9

    5,4

    9,3

    0,9

    2,6

    6,4

    9,0

    1,9

    0,2

    13,9

    14,1

    2,7

    0,8

    7,2

    8,0

    0,4

    33

    33

    22

    33

    37

    32

    34

    40

    32

    28

    32

    25

    20

    30

    35

    33

    30

    26

    44

    42

    54

    45

    45

    44

    41

    41

    39

    33

    28

    27

    45

    34

    37

    176

    22,0

    52

    24

    40

    35

    9

    19

    7

    23

    19

    39

    30

    17

    39

    26

    35

    34

    10

    13

    12

    28

    8

    23

    18

    25

    3

    21

    47

    29

    8

    16

    16

    4

    aLeu

    aCLsk

    aCLNeus

    aCLOZ

    cell.106/

    mV.s.103

    mV.s.103

    mV.s.103

    Pacient

    Clovek

    aTy%

    %

    aSe%

    %

    aNeu%

    %

    aTy

    aSe

    aNeu

    aLy

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    aHtc

    %

    aLy%

    %

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    3

    Analza klinickch dat

    Pojem VARIABILITA m mnoho vznam

    Variabilita opakovanch men

    CHYBA

    Data2,12,83,15,42,1

    Variabilita znaku v populaci

    ROZPTYL ZNAKU,PIROZEN VARIABILITA

    165cm 140cm 182cm 163cm

    Promnlivost biologickch spoleenstev

    BIODIVERZITA

    DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14

    Variabilita modelovanch dat

    FLUKTUACE, ASOV PROMNLIVOST

    Y

    as

    Variabilita modelovanch dat

    CHYBA = NEPESNOST MODELU

    Y

    X

    3b

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    Analza klinickch dat

    Vybran zkladn pojmy

    Skutenost

    Nhoda (vybere jednu z monost pokusu)

    Jev

    podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne

    Pozorovatel

    Rozli, co nastaloa) podle monostb) podle toho, jak potebuje

    Jevov pole

    tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat

    Skutenost + Jevov pole = Miteln prostor

    Experimentln jednotka -

    objekt, na kterm se provd eten

    Populace -

    soubor experimentlnch jednotek

    Znak -

    vlastnost sledovan na objektu

    Sledovan veliina -

    seln hodnota vyjadujc vsledek nhodnho experimentu

    Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru

    Vbr - vbrov populace - clov populace

    Nhodn vbr

    Reprezentativnost

    4

    EMPIRICK ZKON VELKCH SEL

    Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.

    Pravdpodobnost

    je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.

    .A

    .B

    .C

    .D

    A

    P(A)

    0

    1

    Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost

    P (A) = 1 jev jist

    P (A) = 0 jev nemon

    P (A B) = P (A) . P (B/A) zvisl jevy

    P (A B) = P (A) . P (B) nezvisl jevy

    P (A / B) = P (A B) / P (A) podmnn pravdpodobnost

    Analza klinickch dat

    5

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    5

    00.18

    00.18

    00.18

    00.18

    00.18

    00.18

    6

    fn

    Analza klinickch dat

    Pravdpodobnost je "idealizovan relativn etnost"

    a) Empirick postup

    b) Klasick postup

    0

    0

    0

    0

    0

    0

    0

    0.1

    0

    0.0001

    0

    0.1

    0

    0.2

    0

    0.3

    0

    0.3

    Mon nastl jevy - sla 1 - 6

    0

    0

    0

    0

    0

    0

    0

    0.21

    0

    0.11

    0

    0.12

    0

    0.12

    0

    0.12

    0

    0.22

    fn

    fn

    n = 10

    n = 50

    n =

    n - poet bod

    Empirick postup u "normln" kostky

    Informan hodnota sla m velk vznam

    Datapomrov

    Dataintervalov

    Dataordinln

    Datanominln

    Kolikrt?

    O kolik?

    Vt, men?

    Rovn se?

    Spojitdata

    Diskrtndata

    Podlhodnot vt/men ne specifikovan hodnota

    ?

    Procenta (odvozen hodnoty)

    Analza klinickch dat

    7

    217

    429

    733

    444

    255

    1.5411

    132

    0.524

    0.510

    0.25

    5

    7.5

    8

    4.5

    8.5

    4

    Spojit a diskrtn data - zkladn pohled

    X

    X

    Pvodn dataX

    14,2.....18,8Spojit

    1234513Diskrtn

    Analza klinickch dat

    FREKVENN TABULKY

    Uspodan data

    7

    0

    0

    0

    0

    0

    0

    8

    0

    0

    0

    0

    0

    0

    9

    013

    118

    219

    312

    421

    510

    611

    77

    88

    914

    10

    ROZLOEN HODNOT X

    Diskrtn data - prvn nhled

    Promnn X

    01234...10

    Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.

    Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X

    9

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    X

    Poty (absolutn frekvence)

    10

    Analza klinickch dat

    Pklad: Zkladn uspodn souboru diskrtnch dat

    n = 100 dnx znak : poet nik nebezpen ltky

    n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n

    x

    0

    1

    2

    3

    n (x)

    20

    10

    30

    40

    p (x)

    0,2

    0,1

    0,3

    0,4

    N (x)

    20

    30

    60

    100

    F (x)

    0,2

    0,3

    0,6

    1,0

    FREKVENN TABULKA jako zkladn nstroj popisu

    Analza klinickch dat

    11

    2020

    1030

    3060

    40100

    Grafick vstupy z frekvenn tabulky - diskrtn data

    X

    Analza klinickch dat

    11

    0

    0

    0

    0

    12

    126

    236

    338

    424

    541

    620

    722

    X

    p(x)

    0 1 2 3

    0

    0

    0

    0

    n(x)

    0 1 2 3

    0

    0

    0

    0

    X

    F(x)

    0 1 2 3

    0

    0

    0

    0

    X

    N(x)

    0 1 2 3

    0

    1

    Spojit data - prvn nhled

    Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn

    Aktivita enzymu: X

    I. Utdit podle velikosti

    II. Rozdlit do interval o rozumn ce

    III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti

    IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech

    V. Grafick znzornn - histogram

    12

    0

    0

    0

    0

    0

    0

    0

    Aktivita

    13

    0

    f(x)

    Analza klinickch dat

    FREKVENN TABULKA u spojitch dat

    n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)

    d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"

    Interval

    60

    f

    28465820114316103

    Analza klinickch dat

    Sprvn histogram ?

    Sprvn histogram ?

    Graf18

    0

    0

    1

    1

    4

    0

    2

    0

    1

    2

    0

    3

    0

    0

    1

    1

    1

    1

    0

    01

    VOD

    Zkladn zpracovn dat

    Analza klinickch dat

    1

    BIOSTATISTIKA - BIOMETRIKA

    Vda zabvajc se hodnocenm biologickch dat

    Popisn analza dat

    "Data mining"

    Experimentln design

    Stochastick modelovn

    Predikce a hodnocen neuritosti prognz

    Analza asovch ad

    Vcerozmrn analza

    Analza biodiverzity

    QA/QC

    Vda zabvajc se variabilitou

    Analza klinickch dat

    2

    Ukzka uspodanho datovho souboru

    Pacient

    Clovek

    aLeu

    aTy%

    aSe%

    aNeu%

    aTy

    aSe

    aNeu

    aLy

    aHtc

    aCLsk

    aCLNeus

    aCLOZ

    aLy%

    cell.106/

    %

    %

    %

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    %

    mV.s.103

    mV.s.103

    mV.s.103

    %

    3

    1

    4

    33

    72

    32

    4

    2

    7,6

    8

    58

    66

    0,6

    4,4

    5,0

    1,8

    33

    95

    19

    48

    24

    8

    3

    4

    3

    52

    55

    0,1

    2,1

    2,2

    1,6

    22

    77

    35

    33

    40

    11

    4

    6,1

    5

    59

    64

    0,3

    3,6

    3,9

    2,1

    33

    103

    26

    49

    35

    12

    5

    6,9

    3

    85

    88

    0,2

    5,9

    6,1

    0,6

    37

    81

    13

    45

    9

    14

    6

    5,9

    15

    55

    70

    0,9

    3,3

    4,1

    1,1

    32

    137

    33

    61

    19

    16

    7

    8

    18

    75

    93

    1,4

    6,0

    7,4

    0,6

    34

    151

    20

    59

    7

    20

    8

    9,6

    3

    72

    75

    0,3

    6,9

    7,2

    2,2

    40

    77

    11

    38

    23

    21

    9

    6

    10

    67

    77

    0,6

    4,0

    4,6

    1,1

    32

    120

    26

    52

    19

    22

    10

    3,3

    4

    55

    59

    0,1

    1,8

    2,0

    1,3

    28

    81

    42

    24

    39

    37

    11

    3,8

    10

    60

    70

    0,4

    2,3

    2,7

    1,1

    32

    111

    42

    29

    30

    38

    12

    6,4

    2

    76

    78

    0,1

    4,9

    5,0

    1,1

    25

    366

    73

    115

    17

    39

    13

    6,8

    1

    57

    58

    0,1

    3,9

    3,9

    2,7

    20

    234

    59

    71

    39

    49

    14

    8,5

    7

    67

    74

    0,6

    5,7

    6,3

    2,2

    30

    156

    25

    108

    26

    51

    15

    9,3

    7

    57

    64

    0,7

    5,3

    6,0

    3,3

    35

    129

    21

    23

    35

    52

    16

    2,2

    10

    56

    66

    0,2

    1,2

    1,5

    0,7

    33

    46

    30

    12

    34

    55

    17

    9,9

    3

    78

    81

    0,3

    7,7

    8,0

    0,1

    30

    189

    24

    140

    10

    56

    18

    5

    2

    80

    82

    0,1

    4,0

    4,1

    0,7

    26

    101

    25

    54

    13

    6

    1

    8,8

    11

    72

    83

    1,0

    6,3

    7,3

    1,1

    44

    268

    36,6

    145

    12

    9

    2

    9,2

    2

    66

    68

    0,2

    6,1

    6,3

    2,6

    42

    168

    26,9

    76

    28

    13

    3

    10,0

    7

    83

    90

    0,7

    8,3

    9,0

    0,8

    54

    181

    20,1

    81

    8

    15

    4

    9,6

    1

    75

    76

    0,1

    7,2

    7,3

    2,2

    45

    343

    47

    124

    23

    17

    5

    6,0

    45

    40

    21

    19

    6

    7,2

    2

    78

    80

    0,1

    5,6

    5,8

    1,3

    44

    103

    17,8

    63

    18

    24

    7

    8,2

    1

    72

    73

    0,1

    5,9

    6,0

    2,1

    41

    209

    34,9

    57

    25

    26

    8

    10,3

    1

    85

    86

    0,1

    8,8

    8,9

    0,3

    41

    364

    41,1

    112

    3

    29

    9

    5,0

    1

    74

    75

    0,1

    3,7

    3,8

    1,1

    39

    83

    22,1

    32

    21

    30

    10

    11,9

    1

    51

    52

    0,1

    6,1

    6,2

    5,6

    33

    83

    13,4

    52

    47

    31

    11

    7,2

    3

    53

    56

    0,2

    3,8

    4,0

    2,1

    28

    109

    27,1

    63

    29

    32

    12

    10,8

    36

    50

    76

    3,9

    5,4

    9,3

    0,9

    27

    146

    15,7

    106

    8

    33

    13

    11,8

    22

    54

    76

    2,6

    6,4

    9,0

    1,9

    45

    246

    27,4

    63

    16

    34

    14

    17,0

    1

    82

    83

    0,2

    13,9

    14,1

    2,7

    34

    440

    31,2

    119

    16

    40

    15

    10,0

    8

    72

    80

    0,8

    7,2

    8,0

    0,4

    37

    176

    22,0

    52

    4

    41

    42

    43

    47

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    4

    72

    32

    7,6

    95

    19

    48

    4

    77

    35

    33

    6,1

    103

    26

    49

    6,9

    81

    13

    45

    5,9

    137

    33

    61

    8

    151

    20

    59

    9,6

    77

    11

    38

    6

    120

    26

    52

    3,3

    81

    42

    24

    3,8

    111

    42

    29

    6,4

    366

    73

    115

    6,8

    234

    59

    71

    8,5

    156

    25

    108

    9,3

    129

    21

    23

    2,2

    46

    30

    12

    9,9

    189

    24

    140

    5

    101

    25

    54

    8,8

    268

    36,6

    145

    9,2

    168

    26,9

    76

    10,0

    181

    20,1

    81

    9,6

    343

    47

    124

    6,0

    40

    21

    7,2

    103

    17,8

    63

    8,2

    209

    34,9

    57

    10,3

    364

    41,1

    112

    5,0

    83

    22,1

    32

    11,9

    83

    13,4

    52

    7,2

    109

    27,1

    63

    10,8

    146

    15,7

    106

    11,8

    246

    27,4

    63

    17,0

    440

    31,2

    119

    3

    4

    8

    11

    12

    14

    16

    20

    21

    22

    37

    38

    39

    49

    51

    52

    55

    56

    6

    9

    13

    15

    17

    19

    24

    26

    29

    30

    31

    32

    33

    34

    40

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    10,0

    8

    3

    5

    3

    15

    18

    3

    10

    4

    10

    2

    1

    7

    7

    10

    3

    2

    11

    2

    7

    1

    2

    1

    1

    1

    1

    3

    36

    22

    1

    8

    58

    52

    59

    85

    55

    75

    72

    67

    55

    60

    76

    57

    67

    57

    56

    78

    80

    72

    66

    83

    75

    78

    72

    85

    74

    51

    53

    50

    54

    82

    72

    66

    55

    64

    88

    70

    93

    75

    77

    59

    70

    78

    58

    74

    64

    66

    81

    82

    83

    68

    90

    76

    80

    73

    86

    75

    52

    56

    76

    76

    83

    80

    0,6

    4,4

    5,0

    1,8

    0,1

    2,1

    2,2

    1,6

    0,3

    3,6

    3,9

    2,1

    0,2

    5,9

    6,1

    0,6

    0,9

    3,3

    4,1

    1,1

    1,4

    6,0

    7,4

    0,6

    0,3

    6,9

    7,2

    2,2

    0,6

    4,0

    4,6

    1,1

    0,1

    1,8

    2,0

    1,3

    0,4

    2,3

    2,7

    1,1

    0,1

    4,9

    5,0

    1,1

    0,1

    3,9

    3,9

    2,7

    0,6

    5,7

    6,3

    2,2

    0,7

    5,3

    6,0

    3,3

    0,2

    1,2

    1,5

    0,7

    0,3

    7,7

    8,0

    0,1

    0,1

    4,0

    4,1

    0,7

    1,0

    6,3

    7,3

    1,1

    0,2

    6,1

    6,3

    2,6

    0,7

    8,3

    9,0

    0,8

    0,1

    7,2

    7,3

    2,2

    0,1

    5,6

    5,8

    1,3

    0,1

    5,9

    6,0

    2,1

    0,1

    8,8

    8,9

    0,3

    0,1

    3,7

    3,8

    1,1

    0,1

    6,1

    6,2

    5,6

    0,2

    3,8

    4,0

    2,1

    3,9

    5,4

    9,3

    0,9

    2,6

    6,4

    9,0

    1,9

    0,2

    13,9

    14,1

    2,7

    0,8

    7,2

    8,0

    0,4

    33

    33

    22

    33

    37

    32

    34

    40

    32

    28

    32

    25

    20

    30

    35

    33

    30

    26

    44

    42

    54

    45

    45

    44

    41

    41

    39

    33

    28

    27

    45

    34

    37

    176

    22,0

    52

    24

    40

    35

    9

    19

    7

    23

    19

    39

    30

    17

    39

    26

    35

    34

    10

    13

    12

    28

    8

    23

    18

    25

    3

    21

    47

    29

    8

    16

    16

    4

    aLeu

    aCLsk

    aCLNeus

    aCLOZ

    cell.106/

    mV.s.103

    mV.s.103

    mV.s.103

    Pacient

    Clovek

    aTy%

    %

    aSe%

    %

    aNeu%

    %

    aTy

    aSe

    aNeu

    aLy

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    aHtc

    %

    aLy%

    %

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    3

    Analza klinickch dat

    Pojem VARIABILITA m mnoho vznam

    Variabilita opakovanch men

    CHYBA

    Data2,12,83,15,42,1

    Variabilita znaku v populaci

    ROZPTYL ZNAKU,PIROZEN VARIABILITA

    165cm 140cm 182cm 163cm

    Promnlivost biologickch spoleenstev

    BIODIVERZITA

    DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14

    Variabilita modelovanch dat

    FLUKTUACE, ASOV PROMNLIVOST

    Y

    as

    Variabilita modelovanch dat

    CHYBA = NEPESNOST MODELU

    Y

    X

    3b

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    Analza klinickch dat

    Vybran zkladn pojmy

    Skutenost

    Nhoda (vybere jednu z monost pokusu)

    Jev

    podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne

    Pozorovatel

    Rozli, co nastaloa) podle monostb) podle toho, jak potebuje

    Jevov pole

    tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat

    Skutenost + Jevov pole = Miteln prostor

    Experimentln jednotka -

    objekt, na kterm se provd eten

    Populace -

    soubor experimentlnch jednotek

    Znak -

    vlastnost sledovan na objektu

    Sledovan veliina -

    seln hodnota vyjadujc vsledek nhodnho experimentu

    Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru

    Vbr - vbrov populace - clov populace

    Nhodn vbr

    Reprezentativnost

    4

    EMPIRICK ZKON VELKCH SEL

    Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.

    Pravdpodobnost

    je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.

    .A

    .B

    .C

    .D

    A

    P(A)

    0

    1

    Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost

    P (A) = 1 jev jist

    P (A) = 0 jev nemon

    P (A B) = P (A) . P (B/A) zvisl jevy

    P (A B) = P (A) . P (B) nezvisl jevy

    P (A / B) = P (A B) / P (A) podmnn pravdpodobnost

    Analza klinickch dat

    5

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    5

    00.18

    00.18

    00.18

    00.18

    00.18

    00.18

    6

    fn

    Analza klinickch dat

    Pravdpodobnost je "idealizovan relativn etnost"

    a) Empirick postup

    b) Klasick postup

    0

    0

    0

    0

    0

    0

    0

    0.1

    0

    0.0001

    0

    0.1

    0

    0.2

    0

    0.3

    0

    0.3

    Mon nastl jevy - sla 1 - 6

    0

    0

    0

    0

    0

    0

    0

    0.21

    0

    0.11

    0

    0.12

    0

    0.12

    0

    0.12

    0

    0.22

    fn

    fn

    n = 10

    n = 50

    n =

    n - poet bod

    Empirick postup u "normln" kostky

    Informan hodnota sla m velk vznam

    Datapomrov

    Dataintervalov

    Dataordinln

    Datanominln

    Kolikrt?

    O kolik?

    Vt, men?

    Rovn se?

    Spojitdata

    Diskrtndata

    Podlhodnot vt/men ne specifikovan hodnota

    ?

    Procenta (odvozen hodnoty)

    Analza klinickch dat

    7

    217

    429

    733

    444

    255

    1.5411

    132

    0.524

    0.510

    0.25

    5

    7.5

    8

    4.5

    8.5

    4

    Spojit a diskrtn data - zkladn pohled

    X

    X

    Pvodn dataX

    14,2.....18,8Spojit

    1234513Diskrtn

    Analza klinickch dat

    FREKVENN TABULKY

    Uspodan data

    7

    0

    0

    0

    0

    0

    0

    8

    0

    0

    0

    0

    0

    0

    9

    013

    118

    219

    312

    421

    510

    611

    77

    88

    914

    10

    ROZLOEN HODNOT X

    Diskrtn data - prvn nhled

    Promnn X

    01234...10

    Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.

    Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X

    9

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    X

    Poty (absolutn frekvence)

    10

    Analza klinickch dat

    Pklad: Zkladn uspodn souboru diskrtnch dat

    n = 100 dnx znak : poet nik nebezpen ltky

    n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n

    x

    0

    1

    2

    3

    n (x)

    20

    10

    30

    40

    p (x)

    0,2

    0,1

    0,3

    0,4

    N (x)

    20

    30

    60

    100

    F (x)

    0,2

    0,3

    0,6

    1,0

    FREKVENN TABULKA jako zkladn nstroj popisu

    Analza klinickch dat

    11

    2020

    1030

    3060

    40100

    Grafick vstupy z frekvenn tabulky - diskrtn data

    X

    Analza klinickch dat

    11

    0

    0

    0

    0

    12

    126

    236

    338

    424

    541

    620

    722

    X

    p(x)

    0 1 2 3

    0

    0

    0

    0

    n(x)

    0 1 2 3

    0

    0

    0

    0

    X

    F(x)

    0 1 2 3

    0

    0

    0

    0

    X

    N(x)

    0 1 2 3

    0

    1

    Spojit data - prvn nhled

    Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn

    Aktivita enzymu: X

    I. Utdit podle velikosti

    II. Rozdlit do interval o rozumn ce

    III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti

    IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech

    V. Grafick znzornn - histogram

    12

    0

    0

    0

    0

    0

    0

    0

    Aktivita

    13

    0

    f(x)

    Analza klinickch dat

    FREKVENN TABULKA u spojitch dat

    n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)

    d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"

    Interval

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Histogram vyjaduje tvar vbrovho rozloenxxxxxf(x)f(x)f(x)f(x)f(x)

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Pklad: vk astnk vnch dopravnch nehodVk (roky)Vk (roky)FrekvenceFrekvence po roce vkuSprvn histogram ?Sprvn histogram ? Vk

    0 - 4 5 - 910 - 1516 - 1920 - 2425 - 59 > 60f

    28465820114316103

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

    Graf36

    0

    30

    50

    60

    20

    30

    70

    150

    320

    100

    01

    VOD

    Zkladn zpracovn dat

    Analza klinickch dat

    1

    BIOSTATISTIKA - BIOMETRIKA

    Vda zabvajc se hodnocenm biologickch dat

    Popisn analza dat

    "Data mining"

    Experimentln design

    Stochastick modelovn

    Predikce a hodnocen neuritosti prognz

    Analza asovch ad

    Vcerozmrn analza

    Analza biodiverzity

    QA/QC

    Vda zabvajc se variabilitou

    Analza klinickch dat

    2

    Ukzka uspodanho datovho souboru

    Pacient

    Clovek

    aLeu

    aTy%

    aSe%

    aNeu%

    aTy

    aSe

    aNeu

    aLy

    aHtc

    aCLsk

    aCLNeus

    aCLOZ

    aLy%

    cell.106/

    %

    %

    %

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    %

    mV.s.103

    mV.s.103

    mV.s.103

    %

    3

    1

    4

    33

    72

    32

    4

    2

    7,6

    8

    58

    66

    0,6

    4,4

    5,0

    1,8

    33

    95

    19

    48

    24

    8

    3

    4

    3

    52

    55

    0,1

    2,1

    2,2

    1,6

    22

    77

    35

    33

    40

    11

    4

    6,1

    5

    59

    64

    0,3

    3,6

    3,9

    2,1

    33

    103

    26

    49

    35

    12

    5

    6,9

    3

    85

    88

    0,2

    5,9

    6,1

    0,6

    37

    81

    13

    45

    9

    14

    6

    5,9

    15

    55

    70

    0,9

    3,3

    4,1

    1,1

    32

    137

    33

    61

    19

    16

    7

    8

    18

    75

    93

    1,4

    6,0

    7,4

    0,6

    34

    151

    20

    59

    7

    20

    8

    9,6

    3

    72

    75

    0,3

    6,9

    7,2

    2,2

    40

    77

    11

    38

    23

    21

    9

    6

    10

    67

    77

    0,6

    4,0

    4,6

    1,1

    32

    120

    26

    52

    19

    22

    10

    3,3

    4

    55

    59

    0,1

    1,8

    2,0

    1,3

    28

    81

    42

    24

    39

    37

    11

    3,8

    10

    60

    70

    0,4

    2,3

    2,7

    1,1

    32

    111

    42

    29

    30

    38

    12

    6,4

    2

    76

    78

    0,1

    4,9

    5,0

    1,1

    25

    366

    73

    115

    17

    39

    13

    6,8

    1

    57

    58

    0,1

    3,9

    3,9

    2,7

    20

    234

    59

    71

    39

    49

    14

    8,5

    7

    67

    74

    0,6

    5,7

    6,3

    2,2

    30

    156

    25

    108

    26

    51

    15

    9,3

    7

    57

    64

    0,7

    5,3

    6,0

    3,3

    35

    129

    21

    23

    35

    52

    16

    2,2

    10

    56

    66

    0,2

    1,2

    1,5

    0,7

    33

    46

    30

    12

    34

    55

    17

    9,9

    3

    78

    81

    0,3

    7,7

    8,0

    0,1

    30

    189

    24

    140

    10

    56

    18

    5

    2

    80

    82

    0,1

    4,0

    4,1

    0,7

    26

    101

    25

    54

    13

    6

    1

    8,8

    11

    72

    83

    1,0

    6,3

    7,3

    1,1

    44

    268

    36,6

    145

    12

    9

    2

    9,2

    2

    66

    68

    0,2

    6,1

    6,3

    2,6

    42

    168

    26,9

    76

    28

    13

    3

    10,0

    7

    83

    90

    0,7

    8,3

    9,0

    0,8

    54

    181

    20,1

    81

    8

    15

    4

    9,6

    1

    75

    76

    0,1

    7,2

    7,3

    2,2

    45

    343

    47

    124

    23

    17

    5

    6,0

    45

    40

    21

    19

    6

    7,2

    2

    78

    80

    0,1

    5,6

    5,8

    1,3

    44

    103

    17,8

    63

    18

    24

    7

    8,2

    1

    72

    73

    0,1

    5,9

    6,0

    2,1

    41

    209

    34,9

    57

    25

    26

    8

    10,3

    1

    85

    86

    0,1

    8,8

    8,9

    0,3

    41

    364

    41,1

    112

    3

    29

    9

    5,0

    1

    74

    75

    0,1

    3,7

    3,8

    1,1

    39

    83

    22,1

    32

    21

    30

    10

    11,9

    1

    51

    52

    0,1

    6,1

    6,2

    5,6

    33

    83

    13,4

    52

    47

    31

    11

    7,2

    3

    53

    56

    0,2

    3,8

    4,0

    2,1

    28

    109

    27,1

    63

    29

    32

    12

    10,8

    36

    50

    76

    3,9

    5,4

    9,3

    0,9

    27

    146

    15,7

    106

    8

    33

    13

    11,8

    22

    54

    76

    2,6

    6,4

    9,0

    1,9

    45

    246

    27,4

    63

    16

    34

    14

    17,0

    1

    82

    83

    0,2

    13,9

    14,1

    2,7

    34

    440

    31,2

    119

    16

    40

    15

    10,0

    8

    72

    80

    0,8

    7,2

    8,0

    0,4

    37

    176

    22,0

    52

    4

    41

    42

    43

    47

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    4

    72

    32

    7,6

    95

    19

    48

    4

    77

    35

    33

    6,1

    103

    26

    49

    6,9

    81

    13

    45

    5,9

    137

    33

    61

    8

    151

    20

    59

    9,6

    77

    11

    38

    6

    120

    26

    52

    3,3

    81

    42

    24

    3,8

    111

    42

    29

    6,4

    366

    73

    115

    6,8

    234

    59

    71

    8,5

    156

    25

    108

    9,3

    129

    21

    23

    2,2

    46

    30

    12

    9,9

    189

    24

    140

    5

    101

    25

    54

    8,8

    268

    36,6

    145

    9,2

    168

    26,9

    76

    10,0

    181

    20,1

    81

    9,6

    343

    47

    124

    6,0

    40

    21

    7,2

    103

    17,8

    63

    8,2

    209

    34,9

    57

    10,3

    364

    41,1

    112

    5,0

    83

    22,1

    32

    11,9

    83

    13,4

    52

    7,2

    109

    27,1

    63

    10,8

    146

    15,7

    106

    11,8

    246

    27,4

    63

    17,0

    440

    31,2

    119

    3

    4

    8

    11

    12

    14

    16

    20

    21

    22

    37

    38

    39

    49

    51

    52

    55

    56

    6

    9

    13

    15

    17

    19

    24

    26

    29

    30

    31

    32

    33

    34

    40

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    10,0

    8

    3

    5

    3

    15

    18

    3

    10

    4

    10

    2

    1

    7

    7

    10

    3

    2

    11

    2

    7

    1

    2

    1

    1

    1

    1

    3

    36

    22

    1

    8

    58

    52

    59

    85

    55

    75

    72

    67

    55

    60

    76

    57

    67

    57

    56

    78

    80

    72

    66

    83

    75

    78

    72

    85

    74

    51

    53

    50

    54

    82

    72

    66

    55

    64

    88

    70

    93

    75

    77

    59

    70

    78

    58

    74

    64

    66

    81

    82

    83

    68

    90

    76

    80

    73

    86

    75

    52

    56

    76

    76

    83

    80

    0,6

    4,4

    5,0

    1,8

    0,1

    2,1

    2,2

    1,6

    0,3

    3,6

    3,9

    2,1

    0,2

    5,9

    6,1

    0,6

    0,9

    3,3

    4,1

    1,1

    1,4

    6,0

    7,4

    0,6

    0,3

    6,9

    7,2

    2,2

    0,6

    4,0

    4,6

    1,1

    0,1

    1,8

    2,0

    1,3

    0,4

    2,3

    2,7

    1,1

    0,1

    4,9

    5,0

    1,1

    0,1

    3,9

    3,9

    2,7

    0,6

    5,7

    6,3

    2,2

    0,7

    5,3

    6,0

    3,3

    0,2

    1,2

    1,5

    0,7

    0,3

    7,7

    8,0

    0,1

    0,1

    4,0

    4,1

    0,7

    1,0

    6,3

    7,3

    1,1

    0,2

    6,1

    6,3

    2,6

    0,7

    8,3

    9,0

    0,8

    0,1

    7,2

    7,3

    2,2

    0,1

    5,6

    5,8

    1,3

    0,1

    5,9

    6,0

    2,1

    0,1

    8,8

    8,9

    0,3

    0,1

    3,7

    3,8

    1,1

    0,1

    6,1

    6,2

    5,6

    0,2

    3,8

    4,0

    2,1

    3,9

    5,4

    9,3

    0,9

    2,6

    6,4

    9,0

    1,9

    0,2

    13,9

    14,1

    2,7

    0,8

    7,2

    8,0

    0,4

    33

    33

    22

    33

    37

    32

    34

    40

    32

    28

    32

    25

    20

    30

    35

    33

    30

    26

    44

    42

    54

    45

    45

    44

    41

    41

    39

    33

    28

    27

    45

    34

    37

    176

    22,0

    52

    24

    40

    35

    9

    19

    7

    23

    19

    39

    30

    17

    39

    26

    35

    34

    10

    13

    12

    28

    8

    23

    18

    25

    3

    21

    47

    29

    8

    16

    16

    4

    aLeu

    aCLsk

    aCLNeus

    aCLOZ

    cell.106/

    mV.s.103

    mV.s.103

    mV.s.103

    Pacient

    Clovek

    aTy%

    %

    aSe%

    %

    aNeu%

    %

    aTy

    aSe

    aNeu

    aLy

    cell.106/

    cell.106/

    cell.106/

    cell.106/

    aHtc

    %

    aLy%

    %

    aCLNeuO

    mV.s.103

    10

    15

    13

    7

    15

    8

    5

    11

    12

    11

    23

    18

    17

    4

    8

    18

    13

    19,9

    12,2

    9

    16,9

    10,9

    9,6

    12,6

    8,5

    8,4

    15,5

    11,4

    7

    8,4

    6,5

    3

    Analza klinickch dat

    Pojem VARIABILITA m mnoho vznam

    Variabilita opakovanch men

    CHYBA

    Data2,12,83,15,42,1

    Variabilita znaku v populaci

    ROZPTYL ZNAKU,PIROZEN VARIABILITA

    165cm 140cm 182cm 163cm

    Promnlivost biologickch spoleenstev

    BIODIVERZITA

    DRUH 1 15DRUH 2 30DRUH 3 40DRUH 4 14

    Variabilita modelovanch dat

    FLUKTUACE, ASOV PROMNLIVOST

    Y

    as

    Variabilita modelovanch dat

    CHYBA = NEPESNOST MODELU

    Y

    X

    3b

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    Analza klinickch dat

    Vybran zkladn pojmy

    Skutenost

    Nhoda (vybere jednu z monost pokusu)

    Jev

    podmnoina vech monch vsledk pokusu/dje, o kter lze ct, zda nastala nebo ne

    Pozorovatel

    Rozli, co nastaloa) podle monostb) podle toho, jak potebuje

    Jevov pole

    tda vech jev, kter jsme se rozhodli nebo jsme schopni sledovat

    Skutenost + Jevov pole = Miteln prostor

    Experimentln jednotka -

    objekt, na kterm se provd eten

    Populace -

    soubor experimentlnch jednotek

    Znak -

    vlastnost sledovan na objektu

    Sledovan veliina -

    seln hodnota vyjadujc vsledek nhodnho experimentu

    Znak se stv nhodnou veliinou, pokud se jeho hodnota zjiuje vylosovnm objektu ze zkladnho souboru

    Vbr - vbrov populace - clov populace

    Nhodn vbr

    Reprezentativnost

    4

    EMPIRICK ZKON VELKCH SEL

    Pi optovn nezvisl realizaci tho nhodnho experimentu se podl vskyt sledovanho jevu mezi vemi dosud provedenmi realizacemi zpravidla ustaluje kolem konstanty.

    Pravdpodobnost

    je libovoln reln funkce definovan na jevovm poli A, kter kadmu jevu A piad nezporn reln slo P(A) z intervalu 0 - 1.

    .A

    .B

    .C

    .D

    A

    P(A)

    0

    1

    Z praktickho hlediska je pravdpodobnost idealizovan relativn etnost

    P (A) = 1 jev jist

    P (A) = 0 jev nemon

    P (A B) = P (A) . P (B/A) zvisl jevy

    P (A B) = P (A) . P (B) nezvisl jevy

    P (A / B) = P (A B) / P (A) podmnn pravdpodobnost

    Analza klinickch dat

    5

    10.10.210.18

    20.00010.110.18

    30.10.120.18

    40.20.120.18

    50.30.120.18

    60.30.220.18

    5

    00.18

    00.18

    00.18

    00.18

    00.18

    00.18

    6

    fn

    Analza klinickch dat

    Pravdpodobnost je "idealizovan relativn etnost"

    a) Empirick postup

    b) Klasick postup

    0

    0

    0

    0

    0

    0

    0

    0.1

    0

    0.0001

    0

    0.1

    0

    0.2

    0

    0.3

    0

    0.3

    Mon nastl jevy - sla 1 - 6

    0

    0

    0

    0

    0

    0

    0

    0.21

    0

    0.11

    0

    0.12

    0

    0.12

    0

    0.12

    0

    0.22

    fn

    fn

    n = 10

    n = 50

    n =

    n - poet bod

    Empirick postup u "normln" kostky

    Informan hodnota sla m velk vznam

    Datapomrov

    Dataintervalov

    Dataordinln

    Datanominln

    Kolikrt?

    O kolik?

    Vt, men?

    Rovn se?

    Spojitdata

    Diskrtndata

    Podlhodnot vt/men ne specifikovan hodnota

    ?

    Procenta (odvozen hodnoty)

    Analza klinickch dat

    7

    217

    429

    733

    444

    255

    1.5411

    132

    0.524

    0.510

    0.25

    5

    7.5

    8

    4.5

    8.5

    4

    Spojit a diskrtn data - zkladn pohled

    X

    X

    Pvodn dataX

    14,2.....18,8Spojit

    1234513Diskrtn

    Analza klinickch dat

    FREKVENN TABULKY

    Uspodan data

    7

    0

    0

    0

    0

    0

    0

    8

    0

    0

    0

    0

    0

    0

    9

    013

    118

    219

    312

    421

    510

    611

    77

    88

    914

    10

    ROZLOEN HODNOT X

    Diskrtn data - prvn nhled

    Promnn X

    01234...10

    Hodnoty X pedstavuj diskrtn kategorie, ke kterm lze piaditpoty nastlch jev.

    Obdobn lze sledovat i relativn frekvence Kategorie X dny realitou - hodnotami znaku X

    9

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    X

    Poty (absolutn frekvence)

    10

    Analza klinickch dat

    Pklad: Zkladn uspodn souboru diskrtnch dat

    n = 100 dnx znak : poet nik nebezpen ltky

    n (x) - absolutn etnost xp (n) - relativn etnost x; p(x) = n(x) / nN (x) - kumulativn etnost hodnot nepevyujcch x; N (x) = S n(t) t xF (x) - kumulativn relativn etnost hodnot nepevyujcch x; F (x) = N(x) / n

    x

    0

    1

    2

    3

    n (x)

    20

    10

    30

    40

    p (x)

    0,2

    0,1

    0,3

    0,4

    N (x)

    20

    30

    60

    100

    F (x)

    0,2

    0,3

    0,6

    1,0

    FREKVENN TABULKA jako zkladn nstroj popisu

    Analza klinickch dat

    11

    2020

    1030

    3060

    40100

    Grafick vstupy z frekvenn tabulky - diskrtn data

    X

    Analza klinickch dat

    11

    0

    0

    0

    0

    12

    126

    236

    338

    424

    541

    620

    722

    X

    p(x)

    0 1 2 3

    0

    0

    0

    0

    n(x)

    0 1 2 3

    0

    0

    0

    0

    X

    F(x)

    0 1 2 3

    0

    0

    0

    0

    X

    N(x)

    0 1 2 3

    0

    1

    Spojit data - prvn nhled

    Poet interval X: dn daty a hodnotitelemka interval: pokud mono stejn

    Aktivita enzymu: X

    I. Utdit podle velikosti

    II. Rozdlit do interval o rozumn ce

    III. Vyhodnotit poty hodnot v jednotlivch intervalech - absolutn etnosti

    IV. Vyhodnotit podly (relativn etnosti) hodnot v jednotlivch intervalech

    V. Grafick znzornn - histogram

    12

    0

    0

    0

    0

    0

    0

    0

    Aktivita

    13

    0

    f(x)

    Analza klinickch dat

    FREKVENN TABULKA u spojitch dat

    n = 100 opakovanch men (100 dn)X: aktivita enzymu (20 - 100 jednotek)

    d (I) - ka intervalun (I) - absolutn etnostn (I) / n - intervalov relativn etnostN (x") - intervalov kumulativn etnost do horn hranice X"F (x") - intervalov relativn kumulativn etnost do horn hranice X"

    Interval

    60

    f

    28465820114316103

    Analza klinickch dat

    Sprvn histogram ?

    Sprvn histogram ?

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Pojem ROZLOEN - pklad spojitch datj(x)0F(x)Rozloenx Distribun funkce0Je - li dna distribun funkce, je dno rozloenx

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Vbrov rozloen hodnot lze modelov popsat a definovat tak pravdpodobnost vskytu Xf(x)xf(x)xf(x)xj(x)j(x)j(x)

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Distribun funkce jako uiten nstroj pro prci s rozloenmx

    j(x)1,00F(x)P(X x) = F(x) = F(x")F(x) distribun funkceP(X x) = j(x) d(x) Mj(x) d(x) = 1- F(x): Pravdpodobnost, e se X vyskytujev intervalu MMZnme-li distribun funkci, pak znme rozloen sledovan veliiny.

    Pro jakoukoli mnoinu hodnot (M) lze urit P, e X do tto mnoiny pat.Plocha = relativn etnostx

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Jak vznikaj informace ?- frekvenn sumarizace spojitch datGrafick vstupy z frekvenn tabulky spojit dataf(x)xF(x)xKVANTIL20406080100Uspodn sel podle velikosti a konstrukce rozloen umouje pravdpodobnostn zaazen kad jednotliv hodnotyX0.1; X0.9; X0.5; Xq

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Otzka: Jak velk mus bt X, aby 5 % vech hodnot bylo nad nm?X0,95 xj(x)0,95F(x)Hledme: P(X xq) = 0,95 = qxq = (x0,95) = ?q = 0,95 PravdpodobnostJakkoliv slo na ose x je kvantilem5 %F (xq ) = qKvantil je slo, jeho hodnota distribun funkce je rovna P,pro kterou je kvantil definovn

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. DuekNormln rozloen jako statistick modelAplikace modelovch rozloenPehled modelovch rozloenVI. Modelov rozloen

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    AnotaceKlasickm postupem statistick analzy je na zklad vzorku clov populace identifikovat typ a charakteristiky modelovho rozloen dat, vyut jeho matematickho modelu k popisu reality a zskan vsledky zobecnit na hodnocenou clovou populaci.Vyuit tohoto pstupu je mon pouze v ppad shody relnch dat s modelovm rozloenm, v opanm ppad hroz zskn zavdjcch vsledk.Nejklasitjm modelovm rozloenm, od nho je odvozena cel ada statistickch analz je tzv. normln rozloen, znm t jako Gaussova kivka.

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Rozloen hodnot jako model: Normln rozloenN (m,s)j(x)mN (0,1)j(z)0TabelovanpodobaStandardizovan formaxzz = x - ms

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

  • Vytvoil Institut biostatistiky a analz, Masarykova univerzita J. Jarkovsk, L. Duek

    Parametry charakterizujc normln rozloen a jejich vznamj(x)xmedinprmrm ~ xprmr - ukazatel stedus2 ~ s2rozptylxixa)b)ms ~ s smrodatn odchylkaPravidlo 3skoeficient variance

    c) d)E (x) ~ x ~ mD (x) ~ s2 ~ s2

    Vytvoil Institut biostatistiky a analz, Masarykova univerzita

    Graf5

    0

    0.2

    0.5

    1

    2.1

    4

    6.5

    7.2

    6.5

    4

    2.1

    1

    0.5

    0.2

    0

    24

    00.02

    200.02

    400.02

    600.02

    800.02

    1000.02

    01

    201

    401

    601

    801

    1001

    Otzka: Jak velk mus bt X, aby 5 % vech hodnot bylo nad nm?

    x0,95 x

    j(x)

    0,95

    F(x)

    Hledme: P(X xq) = 0,95 = q = (x0,95) xq = ?

    q = 0,95 Pravdpodobnost

    Jakkoliv slo na ose x je kvantilem

    5 %

    F (xq ) = q

    Kvantil je slo, jeho hodnota distribun funkce je rovna P,pro kterou je kvantil definovn

    Analza klinickch dat

    25

    372

    464

    555

    234

    423

    612

    310

    210

    1

    0

    1

    Formln popis tvaru rozloen

    25

    0

    0

    0

    0

    0

    0

    0

    0

    26

    0

    0

    0

    0

    0

    0

    0

    0

    27

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    28

    372

    464

    555

    234

    423

    612

    310

    210

    1

    0

    1

    x

    MIN Medin MAX

    f(x)

    f(x)

    f(x)

    x

    x

    MIN Medin MAX

    MIN Medin MAX

    Z%kvantil

    Y%kvantil

    Medin

    Z%kvantil

    Y%kvantil

    Medin

    Z%kvantil

    Y%kvantil

    Medin

    Medin = 50 % kvantil = frekvenn sted

    MAX - MIN = rozsah (range)

    Modus = nejastj hodnota

    Analza klinickch dat

    Vpoet medinu z primrnch dat

    A. Lich poet (n)

    B. Sud poet (n)

    Vzorek:

    5; 1; 8; 3; 4

    Vzorek:

    1; 3; 4; 5; 7; 8

    Medin - poad:

    (n + 1) / 2 = 3. slo = 4

    Medin - poad:

    (n / 2) ; [(n + 2) / 2] = (4 + 5)/2 = 4.5

    Analza klinickch dat

    29

    372

    464

    555

    234

    423

    612

    310

    210

    1

    0

    1

    Rozloen hodnot jako model: pklad - Normln rozloen

    Analza klinickch dat

    N (m,s)

    E (x) ~`x ~ mD (x) ~ s2 ~ s2

    j(x)

    m

    j (x) = .

    1

    s . 2.p

    . e -

    (x - m)2

    2s2

    N (0,1)

    j(z)

    0

    j (z) = .

    1

    2.p

    . e -

    z2

    2

    Tabelovanpodoba

    Standardizovan forma

    x

    z

    z =

    x - m

    s

    3 0

    372

    464

    555

    234

    423

    612

    310

    210

    1

    0

    1

    Parametry charakterizujc normln rozloen a jejich vznam

    Analza klinickch dat

    j(x)

    x

    medin

    prmr

    m ~`xprmr - ukazatel stedu

    s2 ~ s2rozptyl

    s2=

    S(xi-x)2

    n-1

    xi

    x

    s ~


Recommended