MManagement znalostí v anagement znalostí v medicíněmedicíně
„Datamining“„Datamining“
Professor R. HankaProfessor R. HankaDirector, Medical Informatics Unit,University of Director, Medical Informatics Unit,University of
CambridgeCambridge
Visiting Profesor, Fakulta Managementu, VŠEVisiting Profesor, Fakulta Managementu, VŠE
MManagementanagement znalostí znalostí-v--v-
‘data mining’‘data mining’ Data mining
– Těžení informací z velmi rozsáhlých souborů electronických dat
Znalost– Vytvořená z informací využitím
interpretace a důležitosti Management znalostí
– zpřístupňování interpretovaných nebo interpretovatelných informací.
PProblrobléémm
Rozdílný nárůst:
Intelektuálních schopností
Znalostí
LidskéLidské iintelentelekktutuální ální schopnostischopnosti
Nemožné měřit objektivně
Za minulých 5 millionů let objem mozku
vzrostl ze 400cm3 na 1,400cm3
Obsahuje asi 1011 neuronů a 1014 synapsí
Mezi n a n.(n-1)/2 spojů.
Zdvojnásobuje za 1.5 až 3 miliony roků
Kapacita mozkuKapacita mozku
Full connectivity
Limited connectivity
Lidské znalostiLidské znalosti
Nemožné měřit objektivně
Počet knih v knihovně Cambridge
University.
Knihy v knihovnKnihy v knihovněě Cambridg Cambridgee University University
Zdvojnásobují se každých 33 let !
Nárůst znalostí a intelektuNárůst znalostí a intelektu
time
intelekt
znalosti
Nárůst znalostí a intelektuNárůst znalostí a intelektu
time
intelekt
znalostiInformační přetížení
InformaInformační přetíženíční přetížení
15.století - polymath
18. století - lékař znal vše co
se dalo znát
20. století - specializace
21. století - úzká specializace.
Šířka znalosti
Hlo
ub
ka
znal
ostí
Velikost problémuVelikost problému
InformaInformační přetíženíční přetížení
Zahlceni informacemi
Obtížné najít požadované informace
Obtížné posoudit kvalitu nalezených informací.
Vannevar BushVannevar Bush “As We May Think” “As We May Think” (1945)(1945)
Osobní knihovnaOsobní knihovna (vertical (vertical
books)books)
StezkyStezky (horizontal hypertext) (horizontal hypertext)
MěnitelnéMěnitelné
AnAnotace.otace.
MemexMemex
Rozhodnutí lékaře hledat informaci záleží na
– Urgency
– Očekávání že definitvní závěr bude nalezen.
(Gorman & Helfand 1995)
InformaInformacece
Lokální Globální
Všeobecné
Specifické
Individual Practice Guidelines Clinical pathways
Medical knowledge baseLocal hospital prescribing guidelines
InformaInformační potřebyční potřeby ((clinické školení)
Lokální Globální
Všeobecné
Specifické
Individual Practice
Guidelines
Clinical pathways
Medical knowledge baseLocal
hospital prescribing guidelines
InformaInformační potřebyční potřeby ((lékař v praxilékař v praxi))
Lokální Globální
Všeobecné
Specifické
Individual Practice GuidelinesClinical
pathways
Medical knowledge
base
Local hospital prescribing guidelines
InformaInformační přetíženíční přetížení
Zahlceni informacemi
Obtížné najít požadované informace
Obtížné posoudit kvalitu nalezených informací
Internet ?
InternetInternet
Haphazardní sbírka informací
Navigace bez struktury
Výsledky hledání často obsahují ‘64,000 hits ‘
Informační ‘zamoření’.
Základní elementy Základní elementy managementu znalostímanagementu znalostí
‘Rozumět’ textu
Kategorizace slov, vět,paragrafů a celých dokumentů
Knihovny elektronických dokumentů.
Digitální knihovnyDigitální knihovny
Většinou zatím obsahují elektronické kopie papírových dokumentů
Podpora kompletního cyklu managementu znalostí
Záruka kvalityVybrané vnější zdrojeArchivování.
DigitDigitální knihovny ální knihovny výhodyvýhody//nevýhodynevýhody
Výhody– Založeny na informačních vědách– Dosažitelné odevšud– Kvalita managementu– Archivní role
Nevýhody– “knihy” často nejsou svázány nebo
neexistují– Žádná pomoc od professionálních
knihovníků.
Nástroje managementu Nástroje managementu znalostíznalostíManuální
– Proces je explicitní (vs. tacit knowledge) – Zvyšuje hodnotu
(Semi)automatické– Umělá inteligence (AI)– Rozpoznávání obrazců (pattern
recognition).
AutomaticAutomatická klasifikace ká klasifikace dokumentůdokumentů
Příklady tříd– Kardiovaskulární nemoce,
chirurické techniky…– oficiální guidelines, guidelines
pro zájmové skupiny, charity …‘Učení s učitelem‘
– Příklady ze všech možných tříd– starý AI problém.
Příznaky, charakteristiky Příznaky, charakteristiky ((featuresfeatures))
Příznaky– Základní termíny (slova)– Kontextuální charakteristiky– Charakteristiky struktůry dokumentů
Angličtina 500,000 slovBěžný soubor 30,000 slovKletba DimensionalityNutnost snížit počet
characteristik.
KKlasifilasifikace s omezeným kace s omezeným počtem příznakůpočtem příznaků
Original Set of 3822 Features
30.00%
40.00%
50.00%
60.00%
70.00%
80.00%
90.00%
100.00%
6 12 25 50 100 200 400 600 800
number of features
ac
cu
rac
y
SOM clustering
chi-square
hierarchical clustering
hierarchical clustering- after removal of themost frequent clusterPCA
Další nástrojeDalší nástroje
Produkce hyperlinků
Summarizace
‘Vázání’ knih
Inteligentní hledáníCíl je naučit počítač ’číst’.
Dvě revoluceDvě revoluce
Parní stroj
začal průmyslovou revoluci Železnice, poštovní služba, telegraf
skutečný průmyslový rozvoj Vynález počítače
začal informační revoluci Internet (packet switching)
začátek rozvoje informační revoluce.
OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??