+ All Categories
Home > Documents > Metadata a Jejich Hlavní Schémata

Metadata a Jejich Hlavní Schémata

Date post: 18-Aug-2015
Category:
Upload: jiri-kudela
View: 270 times
Download: 5 times
Share this document with a friend
Description:
Schémata metadat a jejich využití
60
Ústav informačních studií a knihovnictví FF UK V PRAZE Metadata a jejich hlavní schémata Učební materiál pro posluchače ÚISK Zpracovala Eva BRATKOVÁ Verze 1.0 Praha 2012
Transcript

s st ta av v i in nf fo or rm ma a n n c ch h s st tu ud di i a a k kn ni ih ho ov vn ni ic ct tv v F FF F U UK K V V P PR RA AZ ZE E M Me et ta ad da at ta a a a j je ej ji ic ch h h hl la av vn n s sc ch h m ma at ta a U U e eb bn n m ma at te er ri i l l p pr ro o p po os sl lu uc ch ha a e e I IS SK K Z Zp pr ra ac co ov va al la a E Ev va a B BR RA AT TK KO OV V V Ve er rz ze e 1 1. .0 0 P Pr ra ah ha a 2 20 01 12 2 2 OBSAH 1 Terminologie oblasti ........................................................................................................... 31.1Zdroje k tmatu metadata v souasnm internetu .......................................................... 3 1.2Kdy vznikl termn metadata? ............................................................................................ 4 1.3Knihovnick katalogizace versus metadata ......................................................................... 9 1.4Metadata v ivotnm cyklu informanch objekt............................................................. 13 1.5Definice termnu metadata a jejich typologie ................................................................ 15 1.6Termn metadatov schma ............................................................................................. 16 2 Vznamn metadatov schmata (vbr) ......................................................................... 172.1Metadatov schma Dublin Core (DC) ............................................................................... 17 2.1.1Vznik schmatu Dublin Core......................................................................................................... 17 2.1.2Dal rozvjen DC ......................................................................................................................... 19 2.1.3Aktuln stav schmatu DC ........................................................................................................... 26 2.2Metadatov schma nezvislch hlaviek TEI ................................................................... 31 2.3Metadatov schma MARCXML ........................................................................................ 34 2.4Metadatov schma MODS ................................................................................................. 38 2.5Metadatov schma MADS .................................................................................................. 41 3 Rmce pro komunikaci metadat (vbr) .......................................................................... 443.1Struktura RDF (Rmec pro popis zdroj) ......................................................................... 44 3.2Struktura METS (Rmec pro komunikaci a archivaci metadat a zdroj) ..................... 49 Bibliografick reference .................................................................................................................. 55 Eva Bratkov, 2011- Vechna prva vyhrazena podlezkona o prvu autorskm. 121/2000 Sb. a novely AZ . 216/2006 Sb. Text je urenpouzeproindividulnstudijnpotebuposluchav rmciportluuebnchtext,nenmonho jakoukoliv formou dle rozmnoovat, zveejovat i dle roziovat bez souhlasu autora a vydavatele. 3 1Terminologie oblasti 1.1Zdroje k tmatu metadata v souasnm internetu Termnmetadatajevelmifrekventovanmtermnemv souasnodbornliteratuevce vdnchobor,jakbudedoloenomaloustatistikoudlev textu(sti2.2).S termnemse v prostedinternetusetkvdnesbntaklaickveejnost.Malstatistikaz poslednch pti let dokld kadoron velk narst webovch dokument vnovanch tomuto tmatu. Obr. . 1: vodn st obrazovky se zobrazenm nalezench obrzk k termnu metadata v systmu Google v lednu 2012 V ervenci 2008 registroval systm Google piblin 14 700 000 webovch dokument, kter zahrnovaly termn metadata1. Okdlenou anglickou frzi Metadata is data about data2 obsahovalovestejndobpiblin18 600webovchdokument.V dubnu2010systm registroval ji 25 800 000 dokument s termnem metadata (skoro dvojnsobek oproti roku 2008)a 55 400dokumentsveuvedenouanglickoufrz(skorotrojnsobekoprotiroku 2008).V prosincistejnhorokuvzrostlpoetdokuments termnemmetadatana 28 500 000 (nrst za 8 msc inil asi 3 miliony dokument) a poet dokument s anglickou frz na 70 800 webovch dokument (nrst za 8 msc inil asi 15 400 dokument).

1Pi zjiovn statistickch hodnot v systmu Google byl vzat v potaz pouze termn metadata, kter uv vce jazyk (anglitina, etina aj.), nikoliv ekvivalenty v jinch jazycch (nap. fr. termn mtadonnes aj.) 2V eskm pekladu doslovn: Metadata jsou data o datech. 4 V lednu2012systmGooglejiregistrovalpiblin127 000 000dokumentstermnem metadata(poetsetedypojednomcelmrocetmzdvojnsobil).Anglickoufrzi obsahovalopiblin146 000webovchdokument(takdvojnsobnnrst).Obrzk k termnumetadatazaregistrovalsystmGooglevestejndob10 400 000(vizobr.. 1). Dopopedvslednchobrzkse(typicky)dostalaschmataznzorujcsubjekty komunikujcmetadata(napkladv rmciprotokolu OAI-PMH), vcensobn schmata tok metadatv rznorodchpotaovchsystmech,schmataznzorujcpodstatutermnu metadata, pehledov tabulky s daji o vyuvn metadat aj. 1.2Kdy vznikl termn metadata? Nkteautoisobliboutvrd,emetadataexistujodchvle,kdylidzaaliorganizovat informace (tedy nkdy od starovku), a e minimln poslednch 500 let byla tvorba a sprva metadatprimrnzajiovna informanmiprofesionly v rmci informanch proces, jako jsoukatalogizace,klasifikacea indexaceinformanchobjekt[GILLILAND,2008].S tmto sdlenmbybylomonsouhlasit,pokudbytermnmetadatamlv souasnchvliroli naprosto obecnho (stenho) termnu, pod kter by spadal popis, lokalizace a zpstupovn jakhokolivobjektusvta(hmotnhonebonehmotnho,ivhoneboneivho,fyzickho neboelektronickho).K tomuvaklzevznsturitnmitky.Jediskutabilnoznaitdaje (data)o ijcfyzickosobv registranpotaovdatabzizametadatavkontextujejich zkladn,veuveden,definice(metadatajsoudataodatech).Fyzickouosobulzest chpat jako data3, popisn data o n se v minulosti i v souasnosti oznauj bn termnem faktografickdata.Podobnlzepochybovat,jestlimajzznamyvlastnnchvozidel v jejichcentrlnmpotaovmregistrupovahumetadatovchzznam(lzeoznait automobil s uritm vrobnm slem, vlastnn uritou osobou apod. za data?). Popisy informanch objekt, kter maj jasnou povahu dat, lze bez diskus, oznait jako metadatov(vtomtoppadjdeodataodatech).Mejtoklasickdokumenty/zdroje (knihy,asopisy,lnky,mapy,obrazy,zvukovzznamyaj.),nebodokumenty/zdroje elektronick.MejtdokonceidlbibliografickentitydanmodelemFRBR,tj.dla4, vyjdendl,publikaceneboexemplepublikac[FunctionalRequirements,1998].Pro prostedonlinedostupnchzdroj(digitlnchidigitalizovanch)asystm,kterje komplexn komunikuj, je pak termn metadata stoprocentn relevantn. VeuvedensdlenA.J.Gillilandovnenzcelakorektnvtom,esamotntermn metadataneexistujenasvtdlouho,zrodilseavedruhpolovin20.stoletv kontextu potaov komunikace informac. Do t doby bylo, a stle jet je, popisovn a lokalizovn informanchobjektnazvnojinmitermny,jakopopisinformac,bibliografick popis, katalogizace, faktografick popis aj.

3I podle Arlene G. Taylorov definice, e metadata jsou data o datech pedpokld, e balek informac (webov strnka, zvukov zznam ve formtu MP3, kniha aj.) jsou data a e popis atribut a obsahu tohoto balku znamen, e jde o data o datech [TAYLOR, 2004, s. 139]. 4Ji publikovan mezinrodn standardy pro identifikaci dl ve svch plohch bn oznauj daje k popisu abstraktnch dl termnem metadata (jde o standardy ISWC pro hudebn dla, ISAN pro audiovizuln dla a ISTC pro textov dla). Zvltnost je, e v ppad dl jako abstrakc primrn data vlastn tak neexistuj. 5 Vzniktermnumetadatalzeobjektivnmzpsobemdoloitinarovnisekundrnch bibliografickchdatabz5,jakojenapkladdatabzecitanchrejstkspolenosti ThomsonReuterszpstupovanv systmuWOS(WebOfScience),nebobibliografick databze vybranch obor (viz dle v textu). Obr. . 2: statistika a graf potu zznam zdrojovch lnk (zahrnujcch termn metadata) v databzi systmu Web Of Science (WOS) publikovanch v jednotlivch letech 1982-2011 [zskno v modulu bibliometrick systmu WOS Analza vsledk, v lednu 2012] V rmcipolytematickdatabzesystmuWOS(vechjejchstsretrospektivou1900-2011)bylo20. ledna2012nalezeno8 282zznamzdrojovchlnkz vdeckch asopis6,kterzahrnovaly(jednounebovcekrt)termnmetadatas vtimenmrou obsahov relevance k tmatu metadata. Termn metadata se poprv objevil v roce 1982, jak dokumentujepslunzznamlnkuz asopisu7.Nzevlnkuprozrazuje,etermn

5Optimln by byl svtov digitln plnotextov informan fond, takov vak zatm nen pro poteby analzy k dispozici. 6Vyhledvn probhlo pomoc (umlho) seleknho pole TS (TOPIC), kter zahrnuje termny z pole nzev lnku, pop., existuj-li, z pol autorsk abstrakt, autorsk klov slova nebo klov slova plus. Je jist, e do vsledku reere se nedostaly vechny zznamy dokument, kter se tmatu metadat njak dotkaj (napklad urit nebyl zahrnut zznam, kter v databzi WOS uloen sice je [WIEDERKEHR, Robert R. V. Methodology for representing data element tracings and transformations in a numeric datasystems. Drexel Library quarterly. Summer Fall 1982, vol. 18, issue 3-4, s. 161-176. ISSN 0012-6160], postrd vak abstrakt, kter slovo metadata zahrnuje, a tak ho systm nevyhledal (abstrakt je uveden v databzi LISA). 7lnek ze zdrojovho aspisu: LISTON, David M. a James L. DOLBY. Metadata systems for integrated access to numeric data files. Drexel Library quarterly. Summer Fall 1982, vol. 18, issue 3-4, s. 147-160. ISSN 0012-6160. Dan asopis je v systmu WOS zaazen do kategorie Information Science & Library Science. 6 metadata byl uit pravdpodobn autory z oboru potaov vdy, kte eili otzku popisu potaovho datovho souboru s sly pro poteby jejich vyhledvn. Vsledekreerez ledna2012bylnslednbibliometrickyzpracovnv moduluAnalza vsledksystmuWOS(AnalyzeResults).Zskanstatistikaprozrazujepotyzznam zdrojovchlnk,kterzahrnujtermnmetadata,publikovanchv jednotlivchletech 1982-2011 viz obr. . 2. Z danho statistickho pehledu (obr. . 2) vyplv, e problematika metadat byla v 80. letech 20. stolet eena v relativn mal me, a to pedevm z pohledu potaov vdy, vpoetn technikya softwarovhozabezpeeninformanchsystmajejichdatabz(zznamymaj vtinoupiazenkategorieComputerScience,Hardware&Architecturea Computer Science,SoftwareEngineering,ComputerScience,ArtificialIntelligence,Computer Science, Information Systems v rmci kategorizace vdeckch asopis systmu WOS). Obr. . 3: statistika a graf potu zznam zdrojovch lnk (zahrnujcch termn metadata) v databzi systmu Web Of Science (WOS) publikovanch v rmci rznch vdnch obor (letech 1982-2011) [zskno v bibliometrickm modulu systmu WOS Analza vsledk, v lednu 2012] 90.lta20.stoletznamenaj,jakdokldstatistikanaobr.2,postupnnrstdokument vnovanchproblematicemetadat.Prvnvlnavthorstudokuments touto problematikounastalav celosvtovmmtkuporoce1995,zejmnav kontexturozvoje metadatovhostandarduDublinCore,aleidalch.Otzkymetadatbylyjitakeeny odbornkyz jinchobornepotaovvdy,vevtmpotusezapojujiprofesionlov z oblasti informan vdy a knihovnictv. Druh vlna rstu dokument nastv po roce 2000, zejmna v souvislosti s rozvojem a implementac novch informanch technologi (napklad protokolu OAI-PMH) a s budovnm velkho potu digitlnch knihoven a digitlnch archiv 7 pocelmsvtataks intenzivnmeenmotzkydlouhodobarchivacedigitlnch dokument,kterjes metadatyspojenapodstatn.Nejvtmnostvdokumentbylo publikovno k danm otzkm v letech 2007-2009, od roku 2010 je zaznamenvn (prozatm) pokles publikovanch lnk k tmatu metadat. Jinmvstupemveuvedenbibliometrickanalzyjestatistikapotuzznamlnk s tematikoumetadatzpracovanchodbornkyz rznchobor8.Z pehledunaobr.. 3 vyplv,eotzkymetadatjsouv rmcinalezenchzznamlnkdanretrospektivy eenydominantnv oborupotaovvdy(a68,2 %).Nsledujinenrskobory (Engineering)(19,2 %),tetpozicialezaujmoborinformanvdyaknihovnvdy (Information science, Library science) (14,1 %). Nsleduje obor telekomunikac (8,2 %), vda oobrazechatechnologichfotografovn(4,1 %),optika(3,4 %),vchovaapedagogick vzkum (3,1 %) a dal. Vsledn poty zznam lnk (z let 1980-2011) k tmatu metadat zskan ze systmu WOS bylypromtnutytakdotab..1(vprvnmsloupci).V dalchsloupcchjepedstavenapro srovnnstatistikapotuzznamdokument(pedevmlnkz periodik)v hlavnch mezinrodnchbibliografickchdatabzchoboruinformanvdaaknihovnictv.Jde o databziLISA(LibraryandInformationScienceAbstracts)spolenostiProQuest,pvodn databzi ISTA (Information Science and Technology Abstracts) a jej pokraovatelku (po roce 2005)databziLISTA(Library,InformationScienceandTechnologyAbstracts)spolenosti EBSCOadatabziLLIS(LibraryLiteratureandInformationScience)spolenosti H. W. Wilson. Hodnoty potu zznam u databze ISTA jsu vedeny do roku 2007 (ukonen provozu),stejntakudatabzeLLIS(ukonenlicenceprozpstupovn).Zkladnsla reprezentujabsolutnpoetzznam,kterobsahujtermnmetadata(jednouivcekrt) kdekoliv(vetnabstraktu,existuje-li).V kulatzvorcejsouuvedenypotyzznam,kter obsahujtentotermnv polideskriptortezauru(DE)anebovpolizenhopedmtovho termnu (SU) jde o zznamy dokument, u kterch lze pedpokldat vy i vysokou mru obsahov relevance z hlediska sledovn tmatu metadat. Ze statistickho pehledu vyplvaj nsledujc zvry: potyzznamjsou,jaklzepedpokldat,udatabzoboruinformanvdy a knihovnictvoprotipolytematickdatabzisystmuWOS,zpravidlavdyni,nkdy vraznni(napkladv letech2006-2009,kdybylak tmatumetadatpublikovna velik masa dokument zejmna voblasti potaov vdy) v oborovchdatabzchjsoupotyzznams vymrouobsahovrelevance(ktmatu metadat,v kulatzvorce),jaklzetakpedpokldat,vdyninejecelkovpoet zznams termnemmetadatakdekoliv,atozpravidlao50 %,nkdyivce(do poloviny90.let20.stoletvtmruobsahovrelevancenevykazoval,anamal vjimky, dn dokument) oborov databze postupn zahrnuly po roce 1995 do tezaur nebo pedmtovch hesl termn metadata

8Vstup je pipraven na zklad pedmtov kategorizace vdeckch asopis pouvan systmem WOS. 8 vlny rstu dokument k tmatu metadat (po roce 1995 a po roce 2000) jsou jasn patrn, stejn jako u databzi systmu WOS, tak u zahrnutch oborovch databz poroce2009(lta2010-2011)dochz(prozatm)k tlumupublikovndokument k tmatumetadat,codokladujenejenomdatabzesystmuWOS,aletakzahrnut oborov databze WOSLISA (DE)ISTA (SU)LISTA (SUDE)LLIS (SU) 198000 (0)1 (0)1 (00)0 (0) 198100 (0)0 (0)0 (00)0 (0) 198212 (0)4 (0)4 (00)0 (0) 198300 (0)2 (0)2 (00)0 (0) 198400 (0)0 (0)0 (00)0 (0) 198500 (0)0 (0)0 (00)0 (0) 198610 (0)1 (0)1 (00)0 (0) 198700 (0)0 (0)0 (00)0 (0) 198820 (0)1 (0)1 (00)0 (0) 198900 (0)0 (0)0 (00)2 (2) 199021 (0)0 (0)0 (00)0 (0) 199150 (0)1 (0)1 (00)1 (1) 199282 (0)0 (0)0 (00)1 (1) 1993143 (0)3 (0)3 (00)1 (1) 19941410 (2)4 (0)4 (00)5 (5) 19952116 (5)10 (0)10 (00)9 (8) 19964430 (14)18 (1)21 (33)8 (6) 199710480 (42)66 (7)70 (1111)24 (16) 1998128104 (49)82 (13)82 (1616)38 (31) 1999175198 (83)116 (21)128 (3636)74 (53) 2000257217 (85)142 (17)165 (3339)59 (37) 2001257242 (106)188 (57)220 (8383)97 (78) 2002322209 (99)213 (108)243 (127129)105 (81) 2003548216 (116)136 (73)213 (119127)107 (75) 2004684245 (119)189 (97)342 (184196)134 (95) 2005756275 (112)158 (99)363 (233238)105 (66) 2006831277 (117)172 (119)427 (281290)159 (103) 2007923214 (86)128 (87)415 (269268)132 (93) 20081101233 (83)450 (298295) 20091061257 (95)421 (308269) 2010729243 (92)389 (269242) 2011394131 (64)349 (236-229) Tab. . 1: statistika potu zznam dokument (zahrnujcch termn metadata, za lta 1980-2011 v hlavnch bibliografickch databzch oboru informan vda a knihovnictv ve srovnn s poty zznam dokument v databzi systmu WOS 9 databzeISTA/LISTAzahrnujjedenzznamdokumentu(technickzprvy)k tmatu metadat ji z roku 19809 (databze systmu WOS zznam tohoto dokumentu nem), kter jevnovnkomplexnmupopisuNrodnhoenergetickhoinformanhosystmu(USA) NEIS(NationalEnergyInformationSystem)av jehormcitakpopisudatametadat (adrese, dokumentace) nejvtpotyzznamz oborovchdatabzvykazujedatabzeLISTA,atozejmnaza lta2006-2009,colzevysvtlittaktm,ejejproducentzvtilodroku2006poet excerpovanchperiodikovybranperiodikaz oblastipotaovvdyatakz oblasti knihovnictv (kter do t doby byla zastoupena minimln) 1.3Knihovnick katalogizace versus metadata astodiskutovanmtmatemnejenompotaovchodbornk,aleiinformanch pracovnka knihovnkbylaazstvproblematikakatalogizanhoversusmetadatovho popisuataknslednhouchovna zpstupovndigitlnchzdroj,zejmnasov dostupnch.Jdeotma,ktersepvodnobjevilojivpolovin80.let20.stolet v souvislostis budovnmkolekciarchivdigitalizovanchtext.V nslednch90.letech na n pak navzalo budovn komplexnjch digitlnch knihoven, kter vak ji obshly tak jin typy digitlnch zdroj. Problematika metadat se vak stala atraktivn, a to pro podstatn vtokruhodbornki uivatelinformac,av moment,kdyzaalybtdigitlnzdroje dostupn pes s Internet. Metadata hluboce souvisej se vznikem a rozvojem tto st a jejch slueb,zejmnaslubyWWW.Prvv sovmprostedvznammetadatnabralzcela novch rozmr. Knihovnickpracovnky,zejmnapakkatalogiztory,problematikametadatzajmalaproto, e sov dostupn elektronick dokumenty byly a jsou tak pedmtem jejich zpracovatelsk innosti. Lze dodat, e v klasickm zpracovatelskm procesu se zznamy o dokumentech, je jsouoddlenodnichsamch,nahromadilyvdnesjirozshlchbzchkatalog10aslou koncovmuivatelmprovyhledvntchtodokument.Pslunstikatalogizanch pedpisvetnformtprostrojovzpracovnzahrnujkapitoly,ktertakovinformace a instrukcebnobsahuj.Zkladnmodbornmtermnem,kterdoposudprooznaen zpracovndokumentuvaliastleuvaj,jekatalogizanpopisizznam,resp. bibliografickpopisizznam.Lzepodotknout,ejdeovrazyuvanvmodern katalogizacinejmn150let[CHAPMAN,1998,Introduction].Protomnohpekvapilo,e sezaalov 90.letechivodbornchknihovnickchkruzchhovoita psto metadatech, jakotonstrojchiprostedcchpopisuelektronickchdokument,pedevmpaksov dostupnch.Tmi,kdosetakovmiproblmyprioritnzabvali,vaknebyliknihovnci, nbrpotaovodbornci,kterozvjelidaltechnologieicelkovounovouarchitekturu komunikaceinformacnaWWWpro21.stolet.Intenzivnsebudujesmantickweb (SemanticWeb)[BERNERS-LEE,1998a].Dooblastiknihovnictvvnesliuvedenvraz prv potaov odbornci v tto oblasti psobc.

9Jde o zznam technick zprvy: National energy information system basic concepts. By Department of Energy, Washington, DC, Energy Information Administration. July 1980. 10Nejvt katalogizan databz je dnes mezinrodn souborn katalog WorldCat st OCLC, kter zahrnuje vce ne 260 000 000 zznam bibliografickch jednotek a tm 2 miliardy lokalizac exempl 10 Zhrubavpolovin90.letsezaalymeziknihovnkyobjevovatprvndefiniceavklady metadat,kterbylyvelmijednoduchanepostihovalyzcelapodstatu,funkceavznam metadatzejmnavsovmprosted.Vcitacchse asto opakoval vklad, e metadata jsou data o datech (viz tak ve v textu), z eho bylo usuzovno, e katalogizan zznamy jsou vlastn tak metadata. V ad studi, pipravench v rmci vznamnch vzkumnch projekt vzmoivEvrop,sedokoncevpehledech,analzchahodnocenchmetadatobjevilo zaazentradinchbibliografickchformttypuMARC(USMARC,UKMARC, UNIMARC,PICAaj.)jakojednohoztypmetadat[DEMPSEY,1997,Content].Nkte odbornci navrhli i zkladn kategorie (skupiny) metadat, napklad z hlediska typ organizac, ktermetadatapouvaj.VjednzestudibvalhoevropskhoprojektuBIBLINK, vnovanhoproblematicepropojovnsfryvydavatelanrodnchknihovenvprosted potaovch st, jsou zmnn formty zaazeny ve skupin 4.2.2 [HEERY, 1996, kap. 4.2]. Mnohknihovnickodbornkyzvryvzkumpekvapily,nktejenechpaliaptalise, proemajknihovncisvbibliografickformtynazvatmetadatyimetadatovmi schmaty a vsledek sv katalogizan innosti metadatovmi zznamy [HOPKINSON, 1999, st1].Nktesevakv diskuschkproblmuzamyslelihloubjinadzvryvzkum a jejichprezentacapovyhodnoceninformacpichzejcchtakzoblastiinformanch sluebprovozovanchnaInternetuhopochopilitakjakovzvukzamylensenad pradvnouapalivouotzkouvztahumezipopisnmiaseleknmi(soupisnmi)daji v popisudokument[GRADMANN,1999].Objevilyseotzky,jestlimajinformace o webovch zdrojch, kter jsou dnes peneny na webu souasn se zdroji, stejn charakter a podstatu jako zznamy o dokumentech ukldanch do katalog i bibliografickch databz. Proleppochopenproblematikysouasnchmetadatjenutnvyjtzahranicepoznatk a zkuenostzskanchvevlastndlspecializacioborutradinhoknihovnictvi bibliografieasnaitseanalyzovatavyhodnocovatnovcestyaprocesykomunikace informac,oktersestarajdnestakjinodbornci.Komunikaceinformacjidvnonen domnoujenomknihovnk.Svtwebujesvteminformacanovparadigmakomunikace informac(vetninformacoinformacch)jerealitou.Pokudbychomzstalivzajet tradinho modelu zpracovn dokument, by elektronickch, budou nm pojmy metadata a katalogizan/bibliografick zznam pipadat stejn. Jejich vznamy vak stejn nejsou. AutorvecitovanprceStefanGradmannsepokusilporovnata odhalitpodstatnrozdly meziobmapojmy.Poukazujenafakt[GRADMANN,1999],etvrcidnesjedn z nejznmjchspecifikac(smantiky)metadatDublinCore(DC,viz dle v textu) pi jeho navrhovn jednodue nepevzali a neupravili existujc formt MARC, ale navrhli zcela nov soubordajkpopisudigitlnchzdroj.Pravdoubylo,eprosouasnoualezejmna budoucarchitekturukomunikaceinformacnawebuseformttypuMARCukzaljako nevhodncodostruktury(syntaxe)icodoobsahu(smantiky).Autorzdraznil,epi porovnvnoboutermn(metadataakatalogizan/bibliografickzznam)nejde v dnm ppadjenorozdlvpotudajobsaenchvzznamech[GRADMANN,1999, Introduction].Podstatnrozdlyjsoufunknistrukturnpovahy,vzvcelmkontextu produkcea uitmetadatvrmcisovdigitlnkomunikaceinformac[GRADMANN, 1999, Who does it, and How is it done?]. Konkrtnji autor poukzal na: 11 otzku pedmtu zpracovn a popisu (v rmci komunikace na webu me bt popisovn jakkolivdigitlnobjekt;kaddigitlnobjekt,kterjepenenst,musbtopaten jistm minimem informac o sob) otzkuelutvorbydajozdrojch(umetadatsepodtrhujeelzjiovn a vyhledvnzdrojvsovmprosted,ubibliografickchikatalogizanchzznam hrajepodstatnourolistrnkapopis(deskripce);popisnkatalogizacedokevylouit i dleitdajprovyhledvnjenomproto,enenobsaennatitulnstrnce,pestoe dokument takov znak m) otzkutvrczznam(umetadatnawebusepedpokldprimrntvorbazestrany autor, editor i vydavatel, katalogizan zznamy zajiuj profesionlov) otzkunezvislostiisamostatnostijednotlivchmetadatajejichelnho shromaovn,peskupovn,propojovnazejmnazpracovnanovuitpro nejrznj formy vstup a slueb vetn slueb v oblasti znalostnch systm otzkuuitmetadat,kterjeklov:vrmciwebujsouprimrnmiuivatelimetadat speciln inteligentn programy zvan agenti; bibliografick/katalogizan zznamy jsou ureny koncovm uivatelm PiodhalovnrozdlseS.Gradmanodvolvnavrokyautorityvttooblastinanejve povolan Tima Berners-Leea, zakladatele webu (svho asu editele Konsorcia World Wide Web, dle jen W3C) a jednoho z tvrc souasn architektury WWW. T. Berners-Lee ve sv prciArchitekturametadat[BERNERS-LEE,2009]podalnkolikzkladnchpregnantn vyjdenchaxim(pedpoklad)adefinicskomenti,ktersetkajmetadatjakoto podstatn, imanentn sousti celho prostoru WWW. Zkladn charakteristikou webu je fakt, e[informan]zdroje(vpojetautorajevrazzdrojzkladnmformlnm pojmem, pod njspadtermndokumentjakotozdrojtextovpovahy),poppadobecnjiobjekty, o kterpiwebovkomunikacivreimuklient-serverdmeakterdostvme,jsouvdy v rmcikomplexuprotokolTCP/IPdoprovzenyuritmmnostvminformaconich samotnch,anijeuivatelvnmivid(datumposlednmanipulacesesouborem,majitel zdroje, typ formtu aj.). Svou povahou vak jde o informace o informacch, kter potaov odbornci bn nazvaj metadata [BERNERS-LEE, 2009, Documents, Metadata ]. Na obrazovkchnejsounaprvnpohledvidt,protoejsousousttzv.hlaviek(headers) penenchdokument(informac)nebojedoprovzejpipenosuposti.Jicitovan T. Berners-Leevesvmvkladurovnneinpodstatnjrozliovnoboupojm [BERNERS-LEE,2009].Volnlzedleparafrzovat:metadatasevprocesuuitstvaj metainformacemi.Protoevrazuitjevztahovnvprvninstancinainteligentn programy-agenty,budevhodnvrmcizcelaautomatizovanchsloitchcestaproces zpracovnavyuvndajozdrojch,kterv prostoruwebovchtechnologijiexistuj a dle se rozvjej, preferovat pojem metadata. TimBerners-Leeuvdvevecitovanprcizkladndefiniciprometadata:jdeostroji srozumitelninformaceowebovchzdrojchnebodalchvcech[BERNERS-LEE, 2009,Documents,Metadata,Definition].Lzezdraznit,evdefiniciseskuten nevyskytujefrzestrojemitelninformace,nakterjsmebylizvyklubibliografickch formttypuMARC,nbrfrzestrojisrozumitelninformace(angl.machine understandableinformation).Jdeozsadnrozdloboufrz.Definicevypadnaprvn 12 pohled velmi jednodue, ale skrv v sob adu podstatnch moment, kter byly ji zmnny vevtextuvrmcicharakteristikymetadatS.Gradmana.Zdraznnajeklov charakteristikametadat,toti,ejdeostrojisrozumitelninformace.Pedpokldsejejich zpracovnv/pronejrznjaplikacepomocinteligentnchprogramoznaovanch termnemagenti.Znamento,einformanjazykuloenchmetadatmusbtnaprosto formln logicky sprvn a jednoznan. A se poda zdokonalit informan jazyky metadat i programy,kterjebudouzpracovvata vyuvat,vytvosezkladnaprowebstrojm srozumitelnchinformacoemkoliv:o lidech,vcech,pojmech,faktech,mylenkchatd. Pedpoklademovemjevdanmokamikuvybudovnsystmuproinformace o informacch(informanchobjektech,zdrojchientitch)[BERNERS-LEE,2009, Documents, Metadata , Definition]. PrometadataplatpodleT.Berners-Leeankolikpedpoklad,okterchnennutn diskutovat.Pednplat,emetadatajsoudata.Obecnjdeoinformaceoinformacch, a proto musej bt metadata povaovna za informace ve vech jejich aspektech [BERNERS-LEE,2009,Documents,Metadata,Definition].Metadatamohoubtuloenajakokad jindatavnjakmzdroji,toznamen,enjakzdrojmeobsahovatinformaciosob sammneboojinchzdrojch.Vsouasnpraxiwebutedyexistujtizpsobyexistence a cest komunikace metadat: 1)daje o webovm zdroji jsou obsaen v nm samotnm v hlavice v tagu ; jde o zpsob zkladn existence a pedpokldalo se, e bude uplatnn v ad aplikac metadat (vttochvlisevyuvomezenchmonostjazykaHTMLneboXHTML);pkladem mohoubtvsouasndobaplikacemetadatDublinCorevdokumentechHTMLi XHTML,v budoucmprovozusepotsjazykemXML(metadatavestruktueXML jsou lokalizovna mimo vlastn zdroj) 2)dajeowebovmzdroji,kterdoprovzejkomunikacitypuklient-server;popenosu zdrojejemondajepomocpslunfunkceprohleezskat;tentozpsobje pedmtem znanho zjmu potaovch odbornk 3)dajeonjakmwebovmdokumentujemonzskatzjinhowebovhodokumentu (jsou jeho soust); tato cesta je perspektivn pro budouc efektivn komunikaci na webu (konkrtn pjde ji ale zejmna o dokumenty ve struktue XML) Metadata jako takov mohou bt sama pedmtem popisu jako svbytn digitln objekty. Pak bysedalohovoitometa-metadatech.Z praktickch dvod se vak tento termn pouv mlo11 a o takovch datech se tak hovo jako o metadatech. Pokudjdeoformumetadat,jetvoenamnoinounezvislchvrok,kterreprezentuj dajeozdroji.Vpotaovmsystmunabvajvrokyformujmnaitypuvroku a souboru dalch parametr. Napklad: Jmno vrokuAutor zdroje Parametr 1Jmno autora zdroje

11Termn Meta-Metadata zahrnula jako jeden z typ metadat do sv monografie napklad i Arlene G. Taylorov [TAYLOR, 2004, s. 150] 13 Parametr 2Afiliace autora zdroje Parametr 3E-mail autora zdroje Odvouvrocchtkajcchsestejnhozdrojeplat,ejsounezvislamohouexistovat samostatn. Jde o vznamnou a pro komunikaci na webu dleitou vlastnost metadat. Pokud sevyskytujdohromadynajednommst,oznaujemejejakokombinovanvrok. Mnoiny vrok jsou povaovny za neuspodan seznamy. Vrokyozdrojchkorespondujsjejichpslunmivlastnostmi(atributyiznaky).To znamen, e typ vroku je vrokem o tom, e zdroj m pojmenovanou vlastnost (nap. autor, nzev,datumapod.).Parametremserozumbudltypvlastnosti(nap.autor-fyzick osoba, autor-korporace apod.) nebo dl vlastnost (nap. jmno autora, afiliace autora, e-mail autora apod.). Napklad: Autor zdroje Jmno autora zdroje Tim Berners-Lee Afiliace autora zdrojeWorld Wide Web Consortium E-mail autora [email protected] Ke kad vlastnosti nle konkrtn hodnota, obecn pak hovome o modelu dvojice (pru) vlastnost/hodnota. Na obecn rovni je vrok o zdroji celkov tvoen nsledujcmi komponentami: URI (Uniform Resource Identifier) zdroje Identifiktorem typu vroku Dalmi parametry k typu vroku Implicitn nebo explicitn mus bt dle soust vroku: Strana, kter ho uinila Datum a as uinnho vroku Abybylatvorbametadatnawebudvryhodnaspolehliv,budouvcelkovbudouc architektuehrtvznamnourolijmennprostory(zdrojespslunmURI),kterbudou obsahovatslovnkysejmnyitypyvlastnost,jejsoudefinovnypodlestanoven metodikyvrmcipslunchspecifikacmetadat.Pedpokldsejejichhypertextov propojenstvoenmizznamymetadatjednotlivchwebovchzdroj.Vtomtoppad pjdeospecifickvrokytypuvztahumezidvmazdroji,kterbudourealizovnypes hypertextovodkazy.Celtakovvrokbudetvoentypemvrokuadvmaidentifiktory URI. 1.4Metadata v ivotnm cyklu informanch objekt Termnmetadatajespojovnzejmnas procesypopisovninformanchobjekt (informanch zdroj, informanch entit). Popisn funkce nebo role metadat vak dnes nen 14 jedin.Zejmnavprostedzdokonalujcchsesystmdigitlnchinformacjsouijintypy metadatpostupnvytveny,doplovnya rznorodkomunikovnyv rmcinsledujcch zkladnch etap ivotnho cyklu digitlnch nebo digitalizovanch informanch objekt12: Tvorba, vcensobn verze a nov uit informanch objekt. Objekty, kter vstupuj dodigitlnhoinformanhosystmujakopmodigitlnnebodigitalizovan,bymli jejich tvrci nebo sprvci opatovat alespo zkladnmi popisnmi a t administrativnmi metadaty,atozejmnav ppadech,kdysepepokldjejichnovuit(mejt napklado pmoutvorbumetadatautoryobjektv archivechvdyavzkumuv rmci auto-archivanchprocesaj.)Metadatamohoubtvytvenatakv prbhutvorby vcensobnchverzstejnhoinformanhoobjektu(verzeprobnzpstupovn koncovmuivatelm,verzeprodlouhodobouarchivaciaj.)metadatamohoubt vytvenacestouautomatickhogenerovnpidigitalizacipaprovhodokumentu (napklad technick metadata). Popisaorganizovninformanchobjekt.Objekty,ktermajbtuloeny v digitlnchrepozitch,musejbtopatenypotebnmmnostvmpopisnchmetadat vetnmetadatvcnhocharakteruatakmetadatouloenvestruktuedigitlnho informanhosystmu.Tatometadatamohoubtvytvenabuautomaticky(napklad pomocextrakcepopisnchdajzestrukturovanhlavikyplnhotextu)neborun cestouprofesionlyv rmciregistranch,katalogizanchaindexanchproces. Pdavnmetadatamohoubtv souasnostipozveejnndokumenttakvytvena koncovmi uivateli v rmci specifickch webovch rozhran (folksonomie). Validaceinformanchobjekt.Uivatelpelivzkoumajmetadataijinaspekty nalezench informanch zdroj, aby zjistili jejich autenticitu a dvryhodnost. Vyhledvn informanch objekt. Sprvn vytvoen popisn metadata jsou podstatn k tomu, aby byli uivatel schopni tato metadataa pslun informan objekty snadno a efektivn vyhledat. Informan systmy zrove automaticky vytvej a udruj specifick metadata(logy),ktersledujkrokyipostupyuivatelpivyhledvn,a tak efektivnost vyhledvacho procesu. Vyuvn,ochranaadlouhodobarchivaceinformanchobjekt.V digitlnm prostedmohoubtinformanobjektyvyuvnynejrznjmzpsobem,mohoubt reprodukovny,upravovnyaj.V rmcitchtoprocesmohoubtvytvena a komunikovnametadatavztahujcsek uivatelskmanotacm,kesledovnprv,ke kontrole verz apod. Digitln objekty, zejmna ty vytvoen pmo jako digitln, je nutn dlouhodobarchivovat(aktualizovat,migrovataj.),abybylazajitnajejichneustl dostupnostdnesiv budoucnosti.Archivanprocespedpokldvytvoenspecifickch archivanch metadat (napklad v souladu se standardem OAIS [ISO 14721:2003]). Dispoziceinformanchobjekt.Metadatahrajvznamnouroliv dokumentovn zpstupovn informanch objekt z digitlnch repozit

12Pipraveno voln podle publikace Anne J. Gillilandov [GILLILAND, 2008, Primary Functions of Metadata] 15 1.5Definice termnu metadata a jejich typologie Zcelaobecnoudefinicimetadat,kterbylauvedenav voduttostitextu(metadatajsou dataodatech),lze,tv kontextujejichveuvedenchrolifunkcv ivotnmcyklu informanchobjekt,zpesnitarozit.Vtinaodbornkzezainteresovanchobori oblastdefinujemetadatajakostrukturovaninformace,kterpopisuj,osvtluj, lokalizuja rznmizpsobyusnadujvyhledvnavyuvninformanhozdroje [WISSER, 2007]. Odborncisev zsadshodujtakvevymezovnzkladnchtypmetadatv souasn praxi digitlnch informanch systm a jejich slueb. Liit se mohou v jejich uspodanosti [GILLILAND,2008,CategorizingMetadata;TAYLOR,2004,s.147-152].Jdeo nsledujc zkladn typy, resp. podtypy metadat: Popisn metadata (angl. Descriptive metadata) Popisnmetadatareprezentujvnitnvlastnosti(atributyicharakteristiky)informanch objekt (zdroj). Jde napklad o daje o tvrci zdroje, jeho nzvu, vydavateli, roku vydn, o daje tkajc se obsahu zdroje aj. Popisn metadata pomhaj tyto objekty identifikovat, odliovatjejichjednotlivverze,vyhledvata vybrat.Vznikajzejmnapiprofesionln tvorbbibliografickchdatabz,katalog,archivnchinventadigitlnchfond.Tak je ale mohou dnes vytvet sami tvrci informanch objekt v digitlnch archivech anebo iuivatelpijejichvyhledvn(folksonomie).K vznamnmmetadatovmschmatm popisnchmetadatpatnapkladschmataDublinCore,MARCXML,MODS,hlaviky TEI, EAD aj. Administrativn metadata (angl. Administrative metadata) Administrativnmetadatajsouvyuvnakzenasprvdigitlnchobjektv rmci jejichdigitlnchfond(digitlnchloi,digitlnchrepozit).Slouspe profesionlm,nikolivkoncovmuivatelm.Nkteodborncizaazuj k administrativnmmetadatmtakmetadataarchivan/ochrann,technickaprvn (vizdaltitypy,resp.podtypymetadatv rmcitohotobloku).Administrativnmetadata pomhajuritlokalizovatinformanobjekty,poskytujinformaceo dobvzniku a poslednmodifikacidigitlnhoobjektu,ookolnostechdigitalizace,o vstupuobjektudo repozite, o elektronickm podpisu, o prvnch aspektech pstupu k objektu aj. Archivan/Ochrann metadata (angl. Preservation metadata) Archivan/Ochrann metadata podporuj procesy souvisejc s dlouhodobou archivac a ochranoudigitlnchinformanchzdroj.Archivanmetadatabymlazajistit trvalouintegrituakontextdokumentujakopodmnkuprojehozpstupnn v budoucnosti.K typickmarchivanmmetadatmpatpvodahistorieobjektu, vztahk dalminformanmobjektm,dajeohardwaruasoftwaruprozobrazovn informanho objektu aj. Pedpokld se, e jsou vytvena (generovna) automatickou cestou. Archivan/Ochrann metadata jsou poadovna tak mezinrodn normou ISO ReferennmmodelemOAIS[ISO14721:2003].Reprezentantem archivanch/ochrannch metadat je napklad znm standard PREMIS. 16 Technick metadata (angl. Technical metadata) Technickmetadatareprezentujtechnickcharakteristikydigitlnch(potaovch) soubor,napkladdajodatovmformtuzdroje,velikostipotaovhosouboru, komunikanmprotokolu,kompresi,kontrolnmsoutuaj.).Mohoubtvytvena potaovmprogramemajsouzpravidlaurenaprodalzpracovnuritm potaovmsystmemiautomatickouslubou.Dleitjsouprozajitn dlouhodobarchivaceaochranudigitlnchobjekt.Keznmmschmatm technickchmetadatpatnapkladmetadatovschmaMIXprostatickdigitln obrazy, hlaviky TEI pro textov zdroje aj. Prvn metadata a metadata o pstupu (angl. Rights metadata and Access metadata) Prvnmetadataametadataopstupuposkytujinformaceoprvechtvrcna duevnvlastnictv(napkladautorskprvo,patentovprvoaj.)a prvnch dohodch(licencch),kterumoujuivatelmpstupk informanmobjektm (nap. oprvnn koprovat, reprodukovat nebo it informan objekt). Strukturln metadata (angl. Structural metadata) Strukturlnmetadataposkytujinformaceovnitnorganizaciistruktuedigitlnho objektu.Mohoureprezentovatstrukturuavztahydlchdigitlnchobjekt,ktertvo komplexndigitlninformanobjekt(napkladjednotlivdigitalizovanstrnkysel asopis celho ronku, kapitoly jedn knihy a pipojen obrzky, svazky vcesvazkovho souboruaj.).Jsounezbytnprozpstupnnobjektukoncovmuivatelm,projeho sprvnzobrazenanavigacidigitlnhoobjektu.Vznamnjsouiprodlouhodobou archivaci.Prostrukturlnmetadatajevhodnvyutdlst() metadatovho standardu METS. 1.6Termn metadatov schma Dalmfrekventovanmtermnemv oblastimetadatjetermnmetadatovschma(angl. metadatascheme).Termnbyldefinovnv addokument,rozumsejmsoubor metadatovchprvk(angl.elements)a pravidelk jejichpouvn,kterbyldefinovn pro njak specifick cl [WISSER, 2007]. K souasndobbylonasvtvytvoenovelkmnostvmetadatovchschmat.Kad metadatovschmadefinujeuritou,vtnebomen,mnoinuprvk,ktersebudou pouvat pro tvorbu metadat (metadatovch zznam), dle jejich obsah (smantiku) vetn ppadnchpravidelproplnnhodnotjednotlivchprvka strukturu(syntax)propotebu komunikacemetadat,zejmnav elektronickmasovmprosted.Nktermetadatov schmatamohoumtspecifikovnujenomsmantiku(napkladDublinCore)s tm,epro poteby komunikace (vmny) metadat mezi systmy se dodaten me stanovit vce struktur (napklad XHTML, RDF, XML aj.). Hodnotyprvksemohouvytvetvolnjednoduchmzpsobem(mebturennapklad autorm,ktemetadatamusejsamitvoit),anebozen(urenzejmnakolenm profesionlm).V rmcizenhozpsobusevyuvrznchpravidelpopisu(nap. katalogizan pravidla, jako je AACR2 aj.) a tak zench slovnk (selnk) menho nebo vthorozsahu(typdatovchformt,typinformanchzdroj,kdyjazyk,kdyzem 17 aj.),klasifikanchsoustav,souborautoritnchdat(jmennch,pedmtovch).Specifickm prvkemmetadatjsouv souasnostitak(optimln)trvalidentifiktory,kterjednoznan identifikujdaninformanzdroj.K vznamnmidentifiktormprodigitlnzdrojednes pat identifiktory DOI, HDL, ARK, URN, PURL aj. Trendemsouasnostijevyuvnznmchmetadatovchschmatmajcchpovahu mezinrodnho standardu (napklad Dublin Core, MODS, MADS, METS, hlaviky TEI aj.). Jejich vhodou je bezproblmov vmna metadat mezi systmy v celosvtovm zbru. 2Vznamn metadatov schmata (vbr) Tatosttextuzahrnuje(vttoverzi)pehledvybranchmetadatovchschmat,ktermaj povahumezinrodnchstandardakterjsounejvcevyuvanv praxisouasnch digitlnchknihovenadigitlncharchivprokomunikacimetadat.Vybranpklady nejznmjchmetadatovchschmatzahrnujjejichstrunoucharakteristikus ppadnm vvojem, specifika jejich smantik a pklady metadatovch zznam. 2.1Metadatov schma Dublin Core (DC) MetadatovschmaDublinCorejejednouz nejznmjchspecifikacmetadat.Byla pvodnnavrenapropopiswebovchinformanchzdroj,dnesjevyuvnavevelkm potu systm digitlnch knihoven, digitlnch archiv a nadstavbovch slueb metadatovch databz.Jdevesvpodstatospecifikaci(smantiku),kterjejivcene16letstle stedem pozornosti v celosvtovm mtku. Specifikace m univerzln zbr a je jednou ze zkladnchspecifikac,kterpisplykvytvensyntaktickstrukturymetadatv projektu Rmce pro popis zdroj (RDF). 2.1.1Vznik schmatu Dublin Core IniciativaDublinCore(jejpesnjmnojeDublinCoreMetadataInitiative,dletak jakoDCMI,http://dublincore.org/)[DublinCoreMetadataInitiative,2012]sezkonit zrodila v technologicky pznivch podmnkch rozvoje internetu a jeho informanch slueb. Postupn nrst sov dostupnch zdroj (v letech 1991-1995) na jedn stran, ale jejich jen velmiobtnzjiovnivyhledvnnastrandruh,zejmnapokudjdeoobsah poskytovanch informac, pimlo adu odbornk z oblasti potaov vdy, informan vdy, knihovnictvadalchpbuznchoblastkintenzivnmvahmakrokmkeentohoto vnhoproblmu.Napoaddnese,vedlejinch,dostalavhistorickmkontextuasto opakovanotzkainnkontroly,aleinovchzpsobkomunikaceinformanchzdroj tentokrt sov dostupnch pomoc informace oznaovan termnem metadata. ZaoficilniniciativyDublinCorejepokldnojednnpracovnhosemine,kterse uskutenilo v beznu 1995 v americkm Dublinu (Ohio). Nen nhodou, e loprvo totomsto.Jakznmo,jesdlemcentranejvtamerick i svtov st knihoven OCLC a hlavn akti semine i cel iniciativy byli v tdobzamstnancijejhovzkumnhooddlen(zejmnaStuart L. WeibelaEricMiller).Sponzorskysenaseminipodleloi Nrodn centrumpropotaovaplikaceNCSA(NationalCentrefor SupercomputingApplications).Clemseminebylospolenposouzen 18 poteb,pednost,nedostatka stvajccheendanhoproblmuzestranymajiteli provozovatelinformanchfondnaWWWazejmnadosaenshodypivytven zkladnho souboru metadatovch prvk k popisu zdroj. Kritriem vbru jednotlivch prvkbylypodstatnvlastnosti(znaky)sovchdigitlnchzdrojzhlediskajejich vyhledvn,vylouenybylyvdanchvlivechnydalvlastnosti(znaky),ktersmovaly k plnnjinchfunkcprcestmitozdroji(technick,technologick.archivan,obchodn aj.).Zaelemrychlhodosaenpozitivnchvsledkbylyvvahuvprvnmokamiku vzaty pouze digitln zdroje textov povahy. Pinavrhovnzkladnmnoinymetadatovchprvkkpopisuzdrojsezajistnabzela i cestaodvoditjinap.zeznmchstvajcchmodelknihovnickchkatalogizac(formt typuMARCspslunmipravidly).Kderivancestvaknemohlodojt.Profesionln a sloittvorbazznaminformanchzdrojaplikovanvoblastiknihovenbylavylouena z nkolikadvod.FormtytypuMARCjsoujenomstrojemiteln,nikolivvakstroji srozumiteln (formt MARCXML v t dob jet neexistoval), tj. jejich struktura i smantika nevyhovovaly poadavkm na budouc architekturu komunikace informac vetn informac o informacch(metadat)naWWW.Podstatnmdvodembyliohlednabudouctvrce zznam,jimimohliimlibtisamotnautoi(tvrci)nebovydavatel (zpstupovatel)zdroj.Zmrembylo,jakdeklarujmaterilyzesemine[WEIBEL, 1995, st 1.3], vytvoen zcela jednoduchho strukturovanho zznamu (popisu) novho typu,kterbybyldoplkemjednakkpopismknihovnickchkatalogizactypuMARC apod.,resp.popismtypumetadatsloitjhoobsahu(nap.formtTEI),jednakkzatm nevyhovujcminedostatenmpopismrealizovanmvrmcizcelaautomatizovan indexaceplnchtextwebovchdokumentpesinternetovsystmytypusearchengine. Pivytypovvnjednotlivchdajnicmnprofesionlnkatalogizanpopissehrljistou pozitivnlohutak,atopedevmproto,epedmtembylytextovdigitlndokumenty, jejichvlastnosti(znaky)sevadppadshodujstradinmi.Nebylotedynutnpi zjiovnapoznvnpodstatnchvlastnostzanatodstavunula,alemohlyseuplatnit jidvjznalostiazkuenosti.Naseminibyldeklarovntakpoadaveknatzv. promtn(mapping)metadatdoprofesionlnchstrukturtypuMARC,ktervaknarazilo nankterproblmy,vjejichpozadjsouformykatalogizanchdaj,aletaknov specifickvlastnostidynamickchdigitlnchzdroj.Pozitivnmmomentemtvorbynovho typu popisu informanch zdroj byloz jistho aspektu tak zintenzivnn jejich poznvn s clem pispt k rozvoji teorie spoleensk informan komunikace. Navrenmnoinadajpropopisdigitlnchdokument,oznaentermnenSoubor prvkmetadatDublinCore(DublinCoreMetadataElementSet,vezkratceDC), zahrnovalavdobsvhovznikucelkem13prvk.Jepotebauvst,eneloodefinici komplexnhoformtu,jakjsmezvyklvdatuformttypuMARC,zdrazovnabyla v prvnfzipouzestrnkasmantiky(obsahu).Syntax(struktura)potebnzejmnake komunikacimetadatvrelnchstch,stejnjakojejichblispecifikaceveformrznch prvodc, byly ponechny stranou. Z pozdjho vtu zkladnch 15 daj (viz dle v textu) chybldajproanotanpopis(Description),kterbylzavedenapozdjizejmnapro potebyzpracovnobrazovchzdroj,adlespecilndajproochranuautorskchprv (Rights), jeho poteba se ukzala pozdji rovn jako dleit. 19 Jakohlavnavpodstatjedindajvcnpovahy,pokudseneberevpotazdajonzvu digitlnhodokumentuiobjektuaspecifickdajogeografickmaasovmpokryt (Coverage)dokumentu/objektu,bylvsouboruuvedendajopedmtu/tmatu(Subject), a tovpoadjakoprvnzdvodujehonejdleitjhopostavenzhlediskavyhledvn. Nsledovalydajedobeznmzoblastitradinhopopisudokument:nzev(Title),dle trojice tzv. initel, resp. agent (z angl. Agents) procesu informan, resp. dokumentov komunikace,tedyautor(Author),nakladatel/vydavatel(Publisher),unhoseovem v krtk definici zdrazovala novodob funkce instituce, kter dokument v sti zpstupuje, asekundrndalinitel(OtherAgents)zhlediskaknihovnickkatalogizacebysedalo uvst, e lo o tzv. dal pvodce. V kontextu komunikace digitlnch zdroj jim vak mohly bt pisuzovny dal role, resp. jejich role se i mnla. K dalm vytypovanm dajm patily datum(Date),jehouplatovnvpopisudynamickchdigitlnchzdrojjedodnesznan komplikovanastlediskutovan,typobjektu(ObjectType),kterpatcododlch hodnotkjednmznejsloitjch[BRATKOV,2005],forma(Form),pedstavujc reprezentaci(uspodn)datnapotaovmmdiu,specifickidentifiktor(Identifier), ktermjeprowebovzdrojepedevmjejichadresauloen(URI,URN,URL),daje o vztahu/vazbkjinmzdrojm(Relation),dajopvodnmzdroji(Source) digitalizovanho dokumentu a konen jazyk (Language) zdroje. SpecifickouastlediskutovanouotzkoubylodeklarovanzamenspecifikaceDCna autoryavydavateledokument.lotehdyovelmizajmavmomentvrmcispoleensk dlbyprcevinformankomunikaci.Pedpoklademvak bylo, a ji prvn semin tuto vizi nastnil [WEIBEL, 1995, st 3.0], vytven innch interaktivnch pracovnch formul adalchnstrojdostupnchnaWWWavjejichrmcizejmnaautomatickvyuvn profesionlnchsoubormetadattypuselnk,zenchhesl,tezaur,identifiktor apod., kter u existuj. Akti prvnho semine se rovn shodli na zsadch dalho rozvjen formtu. Zdraznno bylo zejmna: zahrnut pouze podstatnch daj v popisu, a to s ohledem na vyhledvn dat na webu roziitelnost formtu v konkrtnch loklnch aplikacch i systmech v mezch stanoven vzjemn budouc souinnosti (interoperability) volitelnost a opakovatelnost vech daj modifikovatelnost vybranch daj zejmna pro poteby specilnch systm pes tehdej tzv. kvalifiktory (schmata/modely hodnot daj a typy daj) 2.1.2Dal rozvjen DC VsledkyprvnhosemineiniciativyDublinCoreuvtalaadainstitucvUSAale i v zahrani,kterserozhodlypipravitprvnprojektyzpracovnwebovchdokumentve svch automatizovanch provozech. Patily k nim napklad kdysi vznamn Seversk projekt metadat(TheNordicMetadataProject)zajiovanazeninformanstNORDINFO [TheNordicMetadata,2000],v jehormcibylpipravennaWWWdostupngenertor unifikovanchjmenzdrojURN(UniformResourceNames)proastnkyzeSkandinvie, dlepohodlninteraktivnformulktvorbmetadatpodleDublinCore(v souasnostiji 20 nendostupn)atakexperimentlnkonvertorpropevodmetadatdoformttypuMARC (nenjirovnk dispozici).Provovnmonostpevodu(mapovn)metadatDublin CoredotehdejhoknihovnickhoformtuUSMARCv rmcivzkumnchaktivitzahjila takKongresovknihovnaveWashingtonu.Jivevtextuzmiovanproblmy,kterz toho vzely, byly pedevm povahy smantick. V zjmu realizace konverze bylo dokonce v roce1996doformtuUSMARCdoplnnonovpole720pronekontrolovanjmnopro potebupevodudajeoautorech/tvrcchdigitlnchzdrojDC,kternejsouzenypes soubory autorit [DEMPSEY, 1996, st 2.3]. V prbhu pprav na realizaci prvnch projekt vyuvajcch specifikace daj DC vyvstala ped zpracovateli ada problm. Po zhruba ron elektronick diskusi byly jednotliv sporn aotevenotzkypedloenyastnkm2.pracovnhosemineDC,ktersekonaljiza poetn asti odbornk z dalch zem ve Velk Britnii na Warwicksk univerzit v dubnu 1996 [DEMPSEY, 1996]. Semin m v historii iniciativy DC mimodn vznam, protoe na nmbyl pedloen k posouzen vznamn nvrh modelu komunikace metadat v sti Internet, kterdostaljmnoWarwickFramework(WarwickskRmec).Jednnkonkrtn projednalo nsledujc okruhy problm: SpecifikacesyntaxemetadatpropotebyjejichpenosuvprostoruWWW.Ukzalose toti,epirealizacchprojektzpracovnavyuvninformacodigitlnchzdrojch tvrcizaalinavrhovatauplatovatrznounavzjemnesluitelnousyntaxastrukturn vazby k penosu metadat v prostoru WWW. Chybl definovan spolen model takovho penosu.Pslunpracovnskupinaprotopipravilanvrhyk vytvoenjednoduchho nstrojenavnoenmetadatpmododokument.VrmcijazykaSGMLbylapro metadatanavrenaspecilntabulkaprodefinicidokumentuDTD,kterbylapromtnuta doformtuHTML(vroce1996veverzi2.0),atovrmcijehohlaviky,tj.tagu .Zrovebylpipravennvrhnapropojenmetadatnaexternzdroj,kter obsahuje jejich specifikaci (definici). Shodou okolnost byl v kvtnu 1996 konn i semin PracovnskupinyprodistribuovanouindexaciavyhledvnkonsorciaW3Czaasti pedstavitel vech vznamnch vyhledvacch systm a slueb na WWW, na kterm byl pijatkonsensus,v jehormcibylyjakodoasneennvrhyiniciativyDC(v rmci WF - viz dle v textu) pijaty. Ppravapracovnchmanulainteraktivnchformulktvorbmetadat.Tvorba takovchpomceksestalavrmcirealizovanchprojektvelminalhavou,protoeje mlivytvetautoidokumentnebovydavatel.Pkladdobefungujcch interaktivnchformulktvorbmetadatvetndoplkovchelektronickchprvodc bylomononajtnaWWWmnoho(vebylv textuzmnnformulSeverskho projektu metadat, kter byl v eskm pekladu implementovn tak v R (na serveru NK R) a kter v nov verzi sou stle na webu Webarchivu. Zpsoby rozen zkladn skupiny metadat Dublin Core pedstavovaly velmi paliv problm. ada systm apelovala na doplnn rznch dalch daj, kter by zajiovaly dal potebn funkce pi vyuvn zdroj. Velk tlak byl vyvjen ze strany pedstavitel uvajcchformtytypuMARC.ZkladnmylenkoutvrcDCovembylo,edaje potebn pro zajiovn loklnch a specializovanch funkc pro prci s digitlnmi zdroji jsouvkompetencijejichsystm.SpecifikaceDCpedstavujeskutenjenomzkladn spolenjdropropopiszdrojvrmciWWWmlaplnitzkladnfunkcipoznvac 21 (nstrojpopisu/zobrazenzdroje)akomunikativn(nstrojuloen,penosuavyuit obsahu popisovanho zdroje). Specifikace rmce (architektury) pro vzjemnou komunikaci metadat v prostoru WWW. Tmamerickchodbornknavrhlanajednnseminepedloilkposouzennvrh modeluprokomunikacimetadatpochzejcchzrznchsystm,kterdostaljmno Warwick Framework (dle t jako WF). Pro jeho ppravu byly do vahy krom Dublin Core vzaty jet formt RFC 1807 a formty (formule) IAFA. Warwicksk rmec se stal vedlejinchpedchdcemtzv.Rmcepropopiszdroj(RDF,ResourceDescription Framework), kter byl do roku 2004 rozvjen konsorciem W3C. Warwickskrmecbylnvrhemarchitektury,ktermlvyhovovatjednotlivmmodelm metadat v prostoru WWW a navzjem je spojovat. lo o architekturu pro vzjemnou vmnu jednotlivchsoubor(balk)metadatnejrznjpovahy:zznamyzdroj(DC,IAFA apod.),souborydefinic,strukturasmantikjednotlivchmetadat,rznselnky,tezaury apod. I proto dleit msto ve WF hrla navren typologie jednotlivch objekt metadat. Bylynavrenytizkladntypy:jednoduchsoubormetadat(nap.zznamjednohozdroje), nepmsoubormetadat(tj.odkaznaexternjinzdroj,kterjeobsahuje)akolekcevce objektmetadatnajednou(tzv.kontejner)[LAGOZE,1996,TheWarwickFramework architecture].Vrelnmprovozusepakpedpokldalzcelaautomatizovansbrasmna metadatvkonzistentnform,seskupovnjednotlivchtypmetadatnebojejichvyuvn pro specifick skupiny uivatel (agenti/klienti). Extenz nvrhu WF byla i jeho konkrtn, by limitovan, implementace pro HTML, verzi 2.0 s podmnkou, e bude transparentn pro existujc prohlee WWW, indexan a vyhledvac slubyadalHTMLnstroje.Implementacebyladleitprorealizaciadyprojekt. Konkrtn byla pro HTML realizovna nsledujc syntax: METAtagprouloenvnoenchmetadatvrmcihlavikyHTMLdokumentu. V kadmMETAtagubylaspecifikovnadvojicejmno/hodnota,kterbylakdovna pomocatributuNAMEaatributuCONTENT.Vhlavicemohlybtobsaeny vcensobn daje. Jednoduch pklad jednoho daje: ProhodnotuatributuNAMEbylanavrenazvltntekovacnotace,pomocnse udvalojmnosouborumetadata(potece)jmnodaje.Pozdjisetekyuplatnilyipro vyjdentypologiejmendaj.Dnesjetentosystmoznaovntermnempseudo-hierarchicktekovacnotace[DublinCoreMetadataInitiative,1999b,st3.1](dnesji nen vyuvn). Metadata Dublin Core obdrela jmno DC. Konkrtn pklad dvou daj: LINKtagbylnavrenpropotebyuvedenodkazunawebovzdroj,vnmsenachz specifikace(definice)danhopouithosouborumetadat.Syntaxobsahovalatypschmatu souborumetadat(atributREL)aURLzdrojenaWWW(atributHREF).Napkladdefinice daje nzev ve specifikaci DC byla odkazovna nsledujcm zpsobem: 22 Vt zsah do souboru (mnoiny) Dublin Core byl proveden po konn v poad 3. semine Dublinsk iniciativy (opt v Dublinu) v z 1996 [WEIBEL, 1997a]. Jeho stednm tmatem bylyobrazovinformanzdrojezpstupovanvprostedInternetuaWWW.Diskuse bylazamenanaaduaspekttchtozdrojvevztahukjejichpopisuvrmcispecifikace DC.Metadataprotentotypwebovchzdroj,ktermlajintypformtuneHTML, vyadovalajinprostor,nejesamotnobrazovzdroj.Zznamyseukldalyzpravidlado interaktivnchdatabzovchsouborbudovanchjakosoustdigitlnchknihoven,kter mohou bt pes pslun rozhran na WWW propojeny. Jedenzezvrseminebylpodstatn:13dosavadnchprvknepostaovalokpopisu obrazovchzdroj.Podstatndaj,kterpodiskusipibyldosestavy,byldajpopis (Description), kter je nutn k vyjden jeho obsahu pro poteby vyhledvn. Posledn daj dnesznmpatnctkyDublinCore,kterpibyltaktvsouvislostisobrazovmizdroji, byldajprva(Rights),tkajcseinformacoautorskchprvecharznchomezench vyuvn zdroje. CelzkladnmnoinametadatDublinCorebylapodoplnndvounovchdajinov uspodna.NeslaoznaenDC,verze1.0abylapublikovnanaWWWvprosinci1996. Bhem dalho roku byly provedeny dl zmny (soubor byl aktualizovn). V z 1998 byla tato verze pijata jako internetov standard RFC 2413, je je nyn u jako neplatn verze stle k dispozici na WWW [RFC 2413, 1998]. tvrtpracovnsemininiciativyDCsekonalvAustrlii(Canberra)vbeznu1997.Zcela naplnosenatomtoseminiprojevilydv tendence formovn DC. Zastnci prvn tendence, oznaovanjakominimalist,prosazovalizachovnstvajcmnoinydefinovanch prvk.Jejichpoadavkembylozachovnmaximlnjednoduchostiformtu,tj.minimln poetprvkbezdalchdlchspecifikac(kvalifiktor),protoejentaklzevyhovt principm tvorby a uit metadat v prostoru WWW. Zastnci druh tendence, oznaovan jako strukturalist,naopak,svdommkomplikac,ktermohounastatpitvorbauit metadatvprovozunaWWWvetnvelkchnklad,poadovalirozendefinovan mnoinyDCjednakcodopotuprvk,jednakcodokvalifiktor.eendansituace nebylo a nen jednoduch a bude dno a v budoucnu po zskn dalch zkuenost z provozu prvnch systm [WEIBEL, 1997b]. Nicmn,canberrskseminprojednalnvrhnapodrobnjspecifikaciDCpomoctzv. kvalifiktor (parametr ble urujcch definovan prvky). lo konkrtn o kvalifiktory: Jazyk(Language),vektermbylahodnotadajezapsnaauloena.loovznamn parametr vzhledem k mezinrodnmu charakteru budovn webovch systm a slueb. Schma(Scheme),kterudvalmodelizpsobzpisuneboitvorbydaje.Uvn tohotoparametrubylozpravidlavznonarznnormy(nap.ISO8601proformudat jakoasovchdaj,ISO639prokdovnjazyk,internetovounormuMIMEpro formtysouborpenenchvrmciInternetuaj.)neboznmzenpedmtov hesle, tezaury i klasifikan schmata). V rmci komunikace metadat se pedpokldalo odkazovntakovchexternchzdrojmetadat,pokudbylydostupnnaWWW,pomoc pslun syntaxe formtu. 23 Typ(Type),kterudvalbudalparametrdaje(e-mailautoraapod.)nebodltyp daje(autor-fyzicksoba,autor-korporaceaj.).Propotebysystmuvajcch specifikaciDCbylanavrenaprovizornpseudo-hierarchicktekovacnotace,pomoc nbylyoddlovnydldaje(vdokumentaciDCjsouoznaovnytakanglickm vrazem subelement). Napklad: Jak je vidt z pedchozho textu a ukzek pklad, zabval se australsk semin podrobnji i syntaxzpisukvalifiktor.Kveuvedenmukomentilzepipojitjetmalouukzku jednoho daje zahrnujcho najednou vechny 3 typy kvalifiktor: Problematika ze semine v Austrlii byla dle rozvedena na 5. semini konanm ve stejnm roce (v jnu 1997) v Helsinkch. astnci hodnotili ji poetn vsledky z provozu aplikac DCvprostoruWWW(nap.vizvekomentovanspnSeverskprojektmetadat). Diskutovnybylyoptotzkykvalifiktorazvltnmstozaujalydlspecifikacedaj datum, pokryt a vztah [WEIBEL, 1998]. Problematika dat jako asovch daj (nap. jejich typologie,formazpisuapod.)bylasohledemnadynamickcharakterwebovchzdroj velmiobtn.Specilndajo prostorovmaasovmpokrytzdrojetakdoznalmnoho zmn,vsouasn chvli jsou navrhovny dal dl specifikace. V rmci daje o vazbch se eilakomplikovanotzkavztahudigitlnchzdrojmezisebounavzjem.Jakznmo, identifikace vztah je nesmrn nron i pro profesionla, nato pro bnho uivatele, kter m potebu teba jen citovat urit dokument nebo jenom dl strnku. Jinak lo samozejm tako otzkupopisnjednotky.VterminologiiDCseobjeviltentoproblmpodvrazem princip1:1.Konkrtnseproblmtkalzejmnapopisukolekcwebovchstrnek sdruenchvrmciwebovchsdel,verzdynamickchdigitlnchdokument, multimedilnchzdrojapod.VrmciseminevHelsinkchbylynavrenyzkladntypy dlch vztah (relac). Vsledkemhelsinskhosemineansledndiskusepslunpracovnskupinybylo publikovn materilu ke kvalifiktorm jednotlivch prvk DC (materil ji nen k dispozici naWWW).NovbylanavrenadokonceformalizovandefinicekvalifiktorDCpro poteby tvorby metadat DC v rmci schmatu RDF [Dublin Core Metadata Initiative, 1997b, Appendix 2]. Jednou z dleitch otzek diskutovanch na 6. semini DC, kter se konal v listopadu 1998 ve Washingtonu, byla formalizace proces, organizace a zen Dublinsk iniciativy (DCMI). DCMIsestalavznamnmmezinrodnmvirtulnmspoleenstvm,jejmposlnmsestal rozvoj,standardizaceapodporasouboruprvkDC.Odpotkuroku1999byloproto zahjenopostupnformovnorganizanstruktury,ktermlobtpotvrzenona7. semini v jnu 1999 ve Frankfurtu nad Mohanem. Podle nvrhu je DCMI celkov zeno editelstvm DCMI (DCMI Directorate), kter sdlilo v rmci pvodn hostitelsk organizace OCLC (nyn jev rolihostitelskorganizaceKorejsknrodnknihovna).Kromjinhozajiujetak webovouprezentaci(http://dublincore.org).zena koordinacinormalizanchprac zajiujeVkonnskupinaDC(DCExecutiveGroup,DC-EG).Poradnvboreditelstv DCMI(DCAdvisoryCommittee,DC-AC),kterjetvoenzreprezentantrznchsystm a slueb z celho svta, d prci tematickch pracovnch skupin DC, schvaluje jejich nvrhy 24 a spolupracujesjinmimezinrodnmiaktivitamiaorganizacemi(W3C,IETFaj.).Dleit innostseodehrvvrmciadypracovnchskupin(DCWorkingGroups,DC-WG),kter projednvajdlproblmyrozvojeDCvrmcielektronickchdiskusnchskupinina seminch.Zkladnmproduktemskupinjsoupracovnnvrhy(WorkingDraft),je mohoupodalmprojednvnvcelkovdiskusnskupin(DCGeneralmail)aschvlenv Poradnmvborunabtpovahynvrhudoporuen(ProposedRecommendation) a konenho doporuen (Recommendation). Vervenciroku1999pedloilaDCMIodbornveejnostijakonvrhdoporuen revidovanouverzizkladnhosouboruprvkDublinCore,kterneslaoznaenverze1.1 (Version 1.1) [Dublin Core Metadata Initiative, 1999a]. Nelo o verzi vyho du, ale pouze o podstatnou formln pravu, v rmci n dolo ke zlepen a zpesnn definic jednotlivch prvk(daj).Pedloenverzebylaodnadonovhokabtu-celsouborjedefinovn podlespolenmezinrodnnormyISO/IEC11179Specifikaceastandardizacedatovch prvk.FormalizacetohototypubylavelicedleitprobudoucvyuvnmetadatDC v relnmautomatizovanmprovozunaWWW.Nvrhdefiniczkladnchprvkbylv t chvlikdispozicinaWWWvrmcinvrhuzkladnhomodeluDC-RDF[DublinCore MetadataInitiative,Guidance,1999b,Appendix1].Definiceprvkmuselypodlezmnn normy obsahovat celkem 10 poloek: 1.Jmno daje 2.Identifiktor daje jako jeho jedinen kd pro automatizovan zpracovvn 3.Verze definice daje 4.ad pro registraci daje 5.Jazyk, v nm je daj vyjden 6.Vlastn definice daje 7.Povinnost uvdn daje 8.Typ daje 9.Maximln poet vskyt daje 10. Koment k vyuit daje Akolivodkonn6.semineDublinCorevprosinci1998bylavedenaadadiskus k monostemrozennebopeuspodndosavadnsestavydajDublinCore,odpovdn pracovnci v prbhu jara ujistili, e se dn zmny v tomto smru konat nebudou [WEIBEL, 1999].Codopotudefinovanchdajbylsoubortotonsverz1.0.Zmnynastalyv definicch.Okterpodstatnjzmnylo?Vnsledujcmpehledujsouuvedenyv rmci komentk jednotlivmdajm(prvkm).Jakoprvnjeuvedenvdyeskpekladjmna daje,v kulatzvorcejejmnovanglickmoriginlu(podleverze1.1zervence1999); frzeuvedenvuvozovkchvkulatchzvorkchjsouplnminebodlmicittyze zveejnnho dokumentu [Dublin Core Metadata Initiative, 1999a]: 1.Nzev (Title) Tatonovdefinicejeoprotipvodnzkrcen(jmnodanzdroji);stanoveninitele (pvodnautoravydavatel)procesupidlovnjmna,tj.nzvuzdroje,bylozrueno, nevyskytuje se ani v komenti. 25 2.Tvrce (Creator) Vrmcitohotodajedolopedevmkezmnjmnadaje(pvodnAutornebo tvrce); po diskusch byl vraz autor vylouen t s ohledem na adu novch aspekt, kterautorskroleudigitlnchinformanchzdrojnabr(platzejmnapronov vznikltypy);nov-avelmiprogresivnjeinovdefinicedaje(entitaprimrn odpovdnzaprovedenobsahuzdroje);zpvodndefinicebylovylouenoslovo intelektuln,kterbylopevzatozkatalogizanchinstrukc,ktervakdnesjine zcelakorespondujesnovousituac;vkomentipibvvevtutvrc,vedlefyzick osoby a organizace, zcela nov poloka sluba (sluby, systmy apod.); kdo zn tehdej web,jistocenilzaazenttopotebnpoloky;vkomentiseobjevujenov obecnj charakteristikatvrcjakotoentit,ovlivnntsouasnminovminhledyna autorstv v materilech IFLA [Functional, 1999]. 3.Pedmt (Subject) Pvodndefinicebylapeformulovnaapodstatnzpesnna(tmaobsahuzdroje),tj. pibylo velmi potebn slovo obsahu, kter tam pvodn nebylo. 4.Popis (Description) Novdefinicebylavcezobecnna(vetobsahuzdroje)akomentpodvvce pklad k uit tohoto daje. 5.Vydavatel (Publisher) Novdefinicejeoprotipvodnzkrcena(entitaodpovdnzazpstupnnzdroje); komentopt,jakovppaddajetvrce,novupesuje,evydavatelemmebt vedle fyzick osoby a organizace tak sluba (sluby, systmy apod.). 6.Pispvatel (Contributor) Stejn jako v ppad daje tvrce, dolo i u tohoto daje ke zmn jmna, i kdy jenom formln-bylvyputnzbytenvrazdal;definicedajejevakpepracovna podstatn(entitaodpovdnzaprovedenpspvkukobsahuzdroje);vraz o vznamnmintelektulnmpspvkupispvatelebylzruen;komentkdefinici rovn dopluje ve vtu pklad slubu (sluby, systm), kter tak me bt v tto roli. 7.Datum (Date) Pvodndefinicejezcelapepracovna,atonazkladrozshldiskusevpracovnch skupinch(datumspojensnjakouudlostvivotnmcykluzdroje);vdefinicise odrcharakteristickrysdigitlnchzdroj,kterjsouuadytypvelmidynamick (vetnpsemnchdokument);doporuenprouvnnormyISO8601zstalo nezmnno. 8.Typ (Type) Definice v nov verzi doshla sice jistho pokroku - je vce zobecnn (povaha nebo nr obsahuzdroje),jevakstlediskutabiln;uritbymohlabtdlezpesovna;jak napovd elektronick diskuse v pslun pracovn skupin, dolo bhem poslednho roku k dalm zmnm ve vtu jednotlivch typ (stav z roku 1998 byl komentovn v asopise Nrodn knihovna [BRATKOV, 2005, st 4]. 26 9.Formt (Format) Rovnvppadformtudigitlnchzdrojdolokupesnndefinice(fyzicknebo digitlnmanifestacezdroje);formulacedefiniceje,kromjinho, ovlivnna souasnmi nhledy a zvry IFLA k problematice informanch zdroj a dokument, kter byly asto vdiskuschbrnyvpotaz;komentkdefinicidoplujenkterdaldaje,jakojsou nap.rozmry,potebnpropopisnkterchtypinformanchzdroj(obrazov, trojrozmrn apod.). 10. Identifiktor (Identifier) Vdefinicitohotodaje,kterhrajevrmciarchitekturysouasnibudoucwebov komunikacevelkoulohu,dolokezpesnndefinice(jednoznanodkaznazdroj v rmcidanhokontextu);komentdoplujepkladyoidentifiktorDOI(Digital Object Indentifier). 11. Zdroj (Source) Akolivsekolemtohotodajevposledndobrozproudilavelkdiskuse(zdlose,e dajbudeslouensdajemvztah),nakonecktomunedoloazstvinadlevcel sestav.Jehodefinicebylamrnupravena(odkaznazdroj,zekterhobylpopisovan zdroj odvozen). 12. Jazyk (Language) Definicedajejenezmnna,komentovemupesujeodkazynanormy,kterjsou doporueny k vyuvn; zpesnny jsou dl instrukce. 13. Vztah (Relation) Definicetohotodajejeupesnna(odkaznapbuznzdroje),tj.pvodntermn souvislost s dalmi zdroji byl nahrazen pesnjm termnem odkaz na zdroje. 14. Pokryt (Coverage) Definice tohoto specilnho daje byla zobecnna (rozsah nebo zbr zdroje), rovn tak koment obsahuje pesnj specifikaci a pklady. 15. Prva (Rights) Zkladndefinicetohotoposlednhodajebylatakupesnna(informaceoprvech udrovan ve zdroji nebo mimo nj). PracovnnvrhnovverzespecifikaceDublinCore(verze1.1)bylpodiskusi9.z1999 ustanovenjakodefinitivndoporuen.Plnznntohototextujekdispozicinaadrese: .2.1.3Aktuln stav schmatu DC Nejnovj verze Dublin Core (stle ale verze 1.1) pochz z 14. ervna 2012 jako doporuen DCMI(DCMIRecommendation).Jek dispozicijednakjakosamostatnmetadatov specifikace(zkrcenDCES,http://dublincore.org/documents/2012/06/14/dces/nebo http://dublincore.org/documents/dces/),jednakjakosoustirhoslovnkutermn (zkrcen DCTERMS, http://dublincore.org/dc/terms/)27 SpecifikaceDublinCorejekodifikovnavaktulnverzieRFC5013,kterpochzz roku 2007[RFC5013,2007].MetadataDCjsouv souasndobtak kodifikovnajakotechnickamericknormaANSI/NISOZ39.85 [ANSI/NISOZ39.85:2007].NamezinrodnrovnibylaspecifikaceDublinCorepublikovnajakonomaISO15836:v prvnmvydnv roce2003 [ISO 15836:2003]avedruhmvydnv roce2009[ISO 15836:2009]vetndodaten opravy 1 [ISO 15836/Cor 1:2009]. Aktuln verze pin opraven definice, vykazuj zestrunn. Pehled identifiktor URI jednotlivch prvk specifikace DC: URI: http://purl.org/dc/elements/1.1/title URI: http://purl.org/dc/elements/1.1/creator URI: http://purl.org/dc/elements/1.1/subject URI: http://purl.org/dc/elements/1.1/description URI: http://purl.org/dc/elements/1.1/publisher URI: http://purl.org/dc/elements/1.1/contributor URI: http://purl.org/dc/elements/1.1/date URI: http://purl.org/dc/elements/1.1/type URI: http://purl.org/dc/elements/1.1/format URI: http://purl.org/dc/elements/1.1/identifier URI: http://purl.org/dc/elements/1.1/source URI: http://purl.org/dc/elements/1.1/language URI: http://purl.org/dc/elements/1.1/relation URI: http://purl.org/dc/elements/1.1/coverage URI: http://purl.org/dc/elements/1.1/rights Aktuln platn definice jednotlivch prvk dc:title (nzev), URI: http://purl.org/dc/elements/1.1/title Aktuln definice: jmno dan zdroji (v komenti: me jt napklad o jmno, pod kterm je zdroj formln znm). dc:creator (tvrce), URI: http://purl.org/dc/elements/1.1/creator Aktuln definice:entita primrn odpovdn za proveden zdroje (v komenti: njak fyzick osoba, organizace nebo sluba (sluba, systm apod.)). dc:subject (pedmt), URI: http://purl.org/dc/elements/1.1/subject Aktuln definice: tma zdroje (v komenti: tma me bt reprezentovno pomoc klovch slov, klovch frz, klasifikanch kd aj.; doporueno je uvn zench slovnk). 28 dc:description (popis), URI: http://purl.org/dc/elements/1.1/description Aktuln definice: osvtlen zdroje (v komenti: popis me zahrnovat abstrakt, obsah, grafickou reprezentaci, anebo osvtlen zdroje pomoc volnho textu). dc:publisher(vydavatel), URI: http://purl.org/dc/elements/1.1/publisher Aktuln definice: entita odpovdn za zpstupnn zdroje (v komenti: njak fyzick osoba, organizace nebo sluba (sluba, systm apod.)). dc:contributor (pispvatel), URI: http://purl.org/dc/elements/1.1/contributor Aktuln definice: entita odpovdn za proveden pspvku do zdroje (v komenti njak fyzick osoba, organizace nebo sluba (sluba, systm apod.)). dc:date (datum), URI: http://purl.org/dc/elements/1.1/date Aktuln definice: urit doba nebo asov obdob spojen s njakou udlost v ivotnm cyklu zdroje (v komenti: datum me bt uit k vyjden asov informace na jakkoliv rovni granularity, doporuen pro uvn normy ISO 8601, tj. profilu W3CDTF, [W3CDTF] http://www.w3.org/TR/NOTE-datetime). dc:type (typ), URI: http://purl.org/dc/elements/1.1/type Aktuln definice: povaha nebo nr zdroje (v komenti: doporueno je vyuvn zenho slovnku DCMI (Type Vocabulary, DCMITYPE), http://dublincore.org/documents/dcmi-type-vocabulary/. dc:format (formt), URI: http://purl.org/dc/elements/1.1/format Aktuln definice: formt souboru, fyzick mdium nebo rozmr zdroje (v komeni: pkladem rozmru zdroje me bt velikost souboru, doba trvn nahrvky apod.; doporueno je uvn zench slovnk, zejmna typologie MIME, http://www.iana.org/assignments/media-types/index.html). dc:identifier (identifiktor), URI: http://purl.org/dc/elements/1.1/identifier Aktuln definice: jednoznan odkaz na zdroj v rmci danho kontextu (v komenti doporueno uvn nkterho z identifikanch systm). dc:source (pvodn zdroj), URI: http://purl.org/dc/elements/1.1/source Aktuln definice: njak souvisejc zdroj, ze kterho byl popisovan zdroj odvozen (v komenti: doporueno uvn nkterho z identifikanch systm). dc:language (jazyk), URI: http://purl.org/dc/elements/1.1/language Aktuln definice: jazyk zdroje (v komenti: doporueno je vyuvn zenho slovnku [RFC4646] http://www.ietf.org/rfc/rfc4646.txt) dc:relation (vztah), URI: http://purl.org/dc/elements/1.1/relation Aktuln definice: pbuzn zdroj (v komenti: doporueno uvn nkterho z identifikanch systm). dc:coverage (pokryt), URI: http://purl.org/dc/elements/1.1/coverage 29 Aktuln definice: prostorov nebo asov tma zdroje, prostorov aplikovatelnost zdroje nebo jurisdikce, ke kter zdroj nle (v komenti: prostorov tma a prostorov aplikovatelnost mohou bt njakm pojmenovanm mstem nebo lokalitou, kter je specifikovna svmi souadnicemi; asov tma me bt pojmenovanou dobou, datem nebo intervalem dat. Jurisdikce me bt pojmenovanou administrativn entitou nebo zempisnm mstem, ke ktermu se zdroj ve; doporuenm zpsobem je vyuit zench slovnk, jako je napklad Tezaurus geografickch jmen (Thesaurus of Geographic Names [TGN], http://www.getty.edu/research/tools/vocabulary/tgn/index.html). Tam kde je to vhodn, mohou bt pojmenovan msta a asov obdob uita prioritn ped selnmi identifiktory, jak napklad soubory souadnic nebo adou dat. dc:rights (prva), URI: http://purl.org/dc/elements/1.1/rights Aktuln definice: informace o prvech udrovan ve zdroji nebo mimo nj (v komenti: rznorod systmy prv spojen se zdrojem). NaObr..4jezznamdisertanprcevespecifikacinekvalifikovanDublinCore.Byl zskn z institucionlnho archivu Massachusettskho technologickho institutu (MIT) pomoc protokolu OAI-PMH (formt: oai_dc; pkaz Get record): http://dspace.mit.edu/oai/request?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai%3Adspace.mit.edu%3A1721.1%2F43074

- 2012-07-13T09:48:20Zhttp://dspace.mit.edu/oai/request- - - oai:dspace.mit.edu:1721.1/430742012-06-15T15:36:54Zhdl_1721.1_7663hdl_1721.1_7817 - - A context-sensitive meta-classifier for color-namingKubat, Rony DanielElectrical Engineering and Computer Science.Humans are sensitive to situational and semantic context when applying labels to colors. This is especially challenging for algorithms which 30 attempt to replicate human categorization for communicative tasks. Additionally, mismatched color models between dialog partners can lead to a back-and-forth negotiation of terms to find common ground. This thesis presents a color-classification algorithm that takes advantage of a dialog-like interaction model to provide fast-adaptation for a specific exchange. The model learned in each exchange is then integrated into the system as a whole. This algorithm is an incremental meta-learner, leveraging a generic online-learner and adding context-sensitivity. A human study is presented, assessing the extent of semantic contextual effects on color naming. An evaluation of the algorithm based on the corpus gathered in this experiment is then tendered.by Rony Daniel Kubat.Thesis (S.M.)--Massachusetts Institute of Technology, Dept. of Electrical Engineering and Computer Science, 2008.Includes bibliographical references (p. 93-97).Massachusetts Institute of TechnologyMassachusetts Institute of Technology. Dept. of Electrical Engineering and Computer Science.Deb K. Roy.2008-11-07T18:59:12Z2008-11-07T18:59:12Z20082008Thesis97 p.http://hdl.handle.net/1721.1/43074244251133engM.I.T. theses are protected by copyright. They may be viewed from this source for any purpose, but reproduction or distribution in any format is prohibited without written permission. See provided URL for inquiries about permission.http://dspace.mit.edu/handle/1721.1/7582 Obr. . 4: metadatov zznam disertace z institucionlnho archivu DSpace at MIT ve formtu oai_dc (DCES, version 1.1) [zskno pomoc protokolu OAI-PMH, pkazem GetRecord, 2012] SlovnkmetadatovchtermnDCMI(DCMIMetadataTerms,DCTERMS, http://purl.org/dc/terms/, http://dublincore.org/schemas/xmls/qdc/dcterms.xsd) zahrnuje, vedle zkladnch15prvk(jsouoznaenylutmfixem)sadyDublinCore,dalch40jemnjch prvk: abstract , accessRights , accrualMethod , accrualPeriodicity , accrualPolicy , alternative , audience , available , bibliographicCitation , conformsTo , contributor , coverage , created , 31 creator , date , dateAccepted , dateCopyrighted , dateSubmitted , description , educationLevel , extent , format , hasFormat , hasPart , hasVersion , identifier , instructionalMethod , isFormatOf , isPartOf , isReferencedBy , isReplacedBy , isRequiredBy , issued , isVersionOf , language , license , mediator , medium , modified , provenance , publisher , references , relation , replaces , requires , rights , rightsHolder , source , spatial , subject , tableOfContents , temporal , title , type , valid 2.2Metadatov schma nezvislch hlaviek TEI Tvrcemvznamnspecifikaceprokdovnplnchelektronickchtextvechtypse zamenmnadetailntextovrozborTEI(TextEncodingInitiative)vetnmetadatovho schmatutzv.nezvislchhlaviekTEI(TEIIndependentHeaders,)je v souasndobKonsorciumTEI(TEIConsortium,http://www.tei-c.org/index.xml)se sdlemv Charlottesvillev americkVirginii[TEIConsortium,2012a].Jdeoneziskovou organizaci, jejmi leny jsou vznamn akademick instituce, ale tak jednotlivci. lenov se podlejnachoduKonsorciafinannamajprvovolitsvzstupcedo sprvnrady Konsorcia.Radamvznamnoupravomocpischvalovnnovchadaverzznm specifikaceTEIGuidelines,kterjesouboremobecnchzsadkterspecifikujmetody kdovnelektronickhotextuzejmnavoblastihumanitnchaspoleenskchvdvetn lingvistiky. Specifikace TEI vznikla v rmci vzkumnho projektu v letech 1987-1994 ve Virginii (USA). Dokumentacek celspecifikacitv jejposlednverzize17.ervna2012TEIP5: Guidelines for Electronic Text Encoding and Interchange vce ne 1550 stran textu [TEI Consortium,2012b].PovinnousoustcelspecifikacejsouvakhlavikyTEI(TEI Headers),kterjsouv souasnostimetadatovmschmatemvestruktueXML,urenm k popisu digitalizovanch text. Specifikace pedpokld, e hlaviky TEI s metadaty mohou bt bu soust textu samotnho (proto ho me tvoit i autor nebo vydavatel), mohou vak btvytvenyaukldnyoddlendodatabzzznamv rmcibudovanchdigitlnch archivneboknihovendigitalizovanchtext,jakojenapkladbritskarchivOTA(OTA Archive,http://www.ota.ox.ac.uk/),zekterhopochzivolndostupnmetadatovzznam hlavikyTEIzobrazennaobr..6(http://www.ota.ox.ac.uk/text/3010.xml).HlavikyTEI lze vyut i pro popis sov dostupnch zdroj. ZkladnspecifikacemetadathlaviekTEIpopisutextovchzdrojjecodomnostvdaj velmibohat(vchozzkladnoujsouamerickkatalogizanpravidlaAACR2),jevak ppustn definovat i mnoinu men (podle poteb dan aplikace). ZkladnspecifikacemetadathlaviekTEIpopisutextovchzdrojjecodomnostvdaj velmibohat(vchozzkladnoujsouamerickkatalogizanpravidlaAACR2),jevak ppustn definovat i mnoinu men (podle poteb dan aplikace). 32 Obr. . 5: zkrcen metadatov zznam esk elektronick knihy ve schmatu TEI Headers (XML)se tymi zkladnmi stmi [pevzat printscreenem z archivu OTA v lednu 2012] Struktura hlaviky TEI me mt celkov 4 sti (viz Obr. . 5 a Obr. . 6): 1.Popis celho souboru (file description, ) 2.Popis kdovn (encoding description), ) 3.Popis profilu textu (text profile, ) 4.Popis o vvoji revize (revision history, .

- - - - Osudy dobrho vojka Svejka za svetov vlkyThe Good Soldier SchweikHaek, Jaroslav, 1883-192333 - creation of machine-readable versionKucera, Karel - - deposited byKucera, KarelCzech National Corpus InstituteCharles University. Faculty of ArtsPraha- Czech National Corpus InstituteCharles University. Faculty of ArtsNamesti Palacha 211638 Praha 1, Czech Republic

[email protected]@ff.cuni.cz2002-01-28 - University of Oxford Text Archive- Oxford University Computing Services13 Banbury RoadOxfordOX2 6NN [email protected] http://ota.ox.ac.uk/id/301011060000999781106000095- Distributed by the University of Oxford under a Creative Commons Attribution-ShareAlike 3.0 Unported License - - Revised version of

- - Osudy dobrho vojka Svejka za svetov vlkyThe Good Soldier SchweikThe good soldier SvejkHaek, Jaroslav, 1883-1923 34 - BaronetPraha19968085890593 - - - University of Oxford Text Archive Subject Headings - Library of Congress Subject Headings - -

- Czech - - Czech fiction -- 20th century - Header normalisedObr. . 6: pln metadatov zznam esk elektronick knihy ve schmatu TEI Headers (XML) [pevzat z archivu OTA v lednu 2012, http://www.ota.ox.ac.uk/text/3010.xml] 2.3Metadatov schma MARCXML Vmnn(komunikativn)formtMARC 21,13kterjevyuvnprovmnu bibliografickchzznamtradinchielektronickchdokument(tzznamautoritnch) v knihovnickmsektorupocelmsvtnaelesKongresovouknihovnouveWashingtonu (LC, udruje ho na svm serveru, http://www.loc.gov/marc/) [Library of Congress, 2012b], je oznaovnpvlastkemharmonizanformt.Vzniklv roce2000nazkladdohody Kongresovknihovnya Kanadsknrodnknihovnyoslouenbvalchnrodnchformt USMARCa CAN/MARC[TAYLOR,2004,s.76-77].V roce2001pistoupilanatento

13Komunikativn formt MARC vznikal postupn v rmci pilotnch projekt MARC I (1965) a MARC II (1968 v Kongresov knihovn ve Washingtonu. O ppravu tohoto slavnho formtu se zaslouila Henriette D. Avramov. Prvn reln formt dostal jmno LC MARC a byl v roce 1971 kodifikovn jako americk technick norma ANSI/NISO Z39.2. Zrove se zaal it do celho svta. 35 formt i Britsk knihovna (uvala do t doby svj formt UKMARC) a po n dal knihovny (takNrodnknihovnaR).FormtMARC 21jezaloennastruktuekodifikovan americkoutechnickounormouANSI/NISOZ39.2(AmericanNationalStandardfor BibliographicInformationInterchange,1971,rev.1985)atakmezinrodnnormou ISO 2709:1996 (Information and Documentation Format for Information Exchange, 3rd ed.). Jiv polovin90.letaleKongresovknihovnapodvlivemnovhorozvojeinformanch technologipipraviladefinintabulkuMARC-SGML DTD(DocumentTypeDefinitions) k podpoeoboustrannkonverzezznamuzformtuMARCdomodernstrukturySGML (StandardGgeneralizedMarkupLanguage).Clembylamonostautomatickypevdt a komunikovatbibliografickikatalogizanajinzznamyv rmcimodernch informanch systm v prosted webu. Pozdji vznikla jednodu varianta definin tabulky MARC-XML DTD[TAYLOR,2004,s. 85-89].Jejpepracovan(aupraven)verzebyla jakoinovovanmetadatovschmaMARCXMLpoppravchzveejnnav roce2003 [Library of Congress, 2012c]. Struktura schmatu MARCXML je definovna pomoc souboru XSD (http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd). Definovnybylypesnjidvtabulky,jednaprobibliografickzznamy(atakzznamy vlastnictva komunit),druhprozznamyautoritn(atakzznamyklasifikanchsoustav). Sousttabulekjsouvechnydaje(prvky)formtuMARCs pesnouspecifikacjejich kdovn ve znakch jazyka XML. Kad znaka zznamu XML obsahuje pslun nvt pole (tag) formtu MARC, indiktory i kdy podpol, jsou-li definovny. Definovan metadatov schma MARCXML zahrnuje ti typy prvk: PrvekNvtzznamuzahrnuje,stejnjakoformtMARC 21,pesn24znak (pevndlka)s kdovanmidaji,ktersetkajcsecelhozznamu(mrn informace, strukturn informace a vbr uritch bibliografickch informac) Prvek Kontroln pole je uren pro adu pol formtu MARC 21 s nvtm pole 00X. Jde o kdovan informace tkajc se popisovanho dokumentu vetn identifikanch sel a datac. Prvek nezahrnuje dn podpole. slo konkrtnho pole (jako hodnota) je uvedeno v rmci jedinho definovanho atributu tag. PrvekDatovpolejeurenprovechnadalpoleformtuMARC 21.Jde o podrobnpopisnajindajetkajcsepopisovanhodokumentu.slo konkrtnhopole(jakohodnota)jeuvedenov rmcidefinovanhoatribututag a hodnoty atribut v atributech ind1 a ind2. daje podpol formtu MARC 21 jsou zahrnutyvevnoovanmprvku,hodnotakdupodpolejeuvedena v atributu code. 36 Obr. . 7: zznam knihy v dkovm formtu MARC 21 [pevzat z katalogu Kongresov knihovny v lednu 2012] Zznamy vytvoen ve schmatu MARCXML je mon stoprocentn konvertovat do formtu MODS, zznamy vytvoen pmo ve schmatu MODS je ale mon konvertovat do schmatu MARCXML u se ztrtami uritch informac. Kongresov knihovna pipravila pro uivatele celho svta automatick konverze zznam z formtu MARC 21 do schmatu MARCXML, MODSaDublinCorev rmcisvhokatalogu.KadzznammsvojitrvalouURLadresu (Permalink), take je mon tyto zznamy bezproblmov hyperlinkovat odkudkoliv z webu. Pkladovzznamz kataloguLC(Permalink:http://lccn.loc.gov/99014773)znmknihy W. YArmseodigitlnchknihovnchjeveformtuMARC 21(dkovprezentace)na obr. . 7.JehoreprezentacevestruktueMARCXML(Permalink: http://lccn.loc.gov/99014773/marcxml) je na obr. . 8.

- 01198cam a2200301 a 4500452068920050818172955.0cr |||||||||||990310s2000 maua b 001 0 eng- (DLC) 99014773 - 737 cbcorignew1ocip19y-gencatlg - pc03 to ja00 03-10-99; lj11 to subj. 03-11-99; lj07 03-16-99; lk02 03-17-99; AA3d lk25 received for CIP verification Jul 6, 2000; lk18 07-07-00; to BCCD 07-07-00 - 99014773 - 0262011808 (alk. paper) - DLCDLCDLC - n-us--- - Z692.C65A76 2000 - 025/.0028521 - Arms, William Y. - Digital libraries /William Y. Arms. - Cambridge, Mass. :MIT Press,c2000. - x, 287 p. :ill. ;24 cm.38 - Digital libraries and electronic publishing - Includes bibliographical references and index. - Also available in electronic form on the author's Web site. - LibrariesUnited StatesSpecial collectionsElectronic information resources. - Digital librariesUnited States. - http://www.cs.cornell.edu/wya/DigLib/ Obr. . 8: zznam knihy ve struktue MARCXML [pevzat z katalogu Kongresov knihovny v lednu 2012] 2.4Metadatov schma MODS Metadatov schma pro popis objekt MODS (angl. Metadata Object Description Schema) je schmatem,kterbylovytvoenoajeudrovno,stejnjakometadatovschma MARCXML,KongresovouknihovnouveWashingtonunajejmserveru (http://www.loc.gov/standards/mods/)[LibraryofCongress,2012e].Jdeoderivtznmho formtuMARC 21[Understandingmetadata,2004],jehospecifickouvlastnostje,e definovanprvky,jichjepodstatnmnvesrovnns formtemMARC,majslovn pojmenovn.SchmaMODSjeprimrnurenopropotebyklasickchknihoven,jevak irocevyuvnotakv oblastidigitlnchknihovenvetnelektronickcharchivv oblasti vdya vzkumu.MetadatovschmaMODSzahrnujemnoinuprvk,pomockterchlze popsatjakkolivinformanobjekt(knihu,videozznam,onlinewebovzdrojapod.).Pro potebysnadnkomunikacemetadatv potaovchsystmecha stchjeschmaMODS, stejnjakoschmaMARCXMLneboschmaMETS,vyjdenopomocjazykaXML. Realizacekonverzz formtuMARCneboschmatuDublinCoredoschmatuMODSje bezproblmovmon(naserveruKongresovknihovnyjsouk dispozicipevodnky). Pevod ze schmatu MODS do formtu MARC znamen uritou ztrtu dat. PrvnverzemetadatovhoschmatuMODS(2.0)bylazpstupnnanazatkuroku2002 [TAYLOR,2004,s.87-89].V prbhudalchletbyloschmarozvjeno,pibylypostupn 39 nkternovprvky(elements),jejichpodprvky(subelements)druhitetrovna tak atributy(attributes)vetnseznamautorizovanchhodnotpronkterprvky.V roce2003 vzniklaverze3.0,v roce2005verze3.1,v roce2006verze3.2,v roce2008verze3.3(viz pkladnaobr..9),v souasndobjek dispoziciverzenejnovj3.4z 10.6.2010. Struktura zznamu MODS (XML), kter stanovuje, jak prvky zznam me mt, jak mohou mt vskyt, jak se mohou vnoovat do jinch prvk a poppad stanovuje tak obsahy hodnot prvk,jedefinovnapomocsouboruXSD(http://www.loc.gov/standards/mods/mods.xsd) nebo pesnji pro verzi 3.4 (http://www.loc.gov/standards/mods/v3/mods-3-4.xsd). Smantika definovanch prvk me bt podle poteb producenta dat zajiovna na zklad libovolnchpravidelpopisu,alev profesionlnrovin(iz dvoduppadnchkonverzdo jinchformtischmat)sedoporuujezsadnvyuitstandarduAACR2(Anglo-AmericanCatalogingRules).Potebninterpunkcejezajiovnaautomatickm generovnm. Metadatov zznam MODS je uveden koenovm prvkem (viz pklad na obr. . 9), pop.prvkem(prosouborzznamMODS,z nichkadjeuzaven v koenovm prvku ). V rmci koenovho prvku jsou v atributu xmlns specifikovan adresyURLvechschmat,podlekterchjecelmetadatovzznamvytvoen.Uvedenje takdajopouitverzischmatu.Metadatovschmazahrnujeiveverzi3.4stle20 hlavnch prvk (prvn rovn): 40 Pkladyzrelnpraxeobsahujzpravidlamnprvk(vizobr.. 9).Vechnyprvkyprvn rovn schmatu MODS i jejich atributy jsou voliteln, jeden prvek ale mus vdy existovat. Podprvkyjsouvoliteln.Prvkyjsouv zsadopakovateln.Podprvkysemusaditv danm poad, atributy nikoliv a jsou navc neopakovateln. Pkladovzznamz kataloguLC(Permalink:http://lccn.loc.gov/99014773)znmknihy W. YArmseodigitlnchknihovnchvestruktueMODS(Permalink: http://lccn.loc.gov/99014773/mods) je na obr. . 9. - - Digital libraries - Arms, William Y. - creator text bibliography - - mau - Cambridge, Mass MIT Press c2000 2000 monographic - eng - print x, 287 p. : ill. ; 24 cm. William Y. Arms. Includes bibliographical references and index. Also available in electronic form on the author's Web site. - n-us--- 41 - Libraries United States Special collections Electronic information resources - Digital libraries United States Z692.C65 A76 2000 025/.00285 - - Digital libraries and electronic publishing 0262011808 (alk. paper) 99014773 - http://www.cs.cornell.edu/wya/DigLib/ - aacr2 DLC 990310 20050818172955.0 4520689 Converted from MARCXML to MODS version 3.3 using MARC21slim2MODS3-3.xsl (Revision 1.51) Obr. . 9: metadatovzznam knihy ve struktue MODS [pevzat z katalogu Kongresov knihovny v lednu 2012] 2.5Metadatov schma MADS MetadatovschmapropopisautoritnchdatMADS(angl.MetadataAuthorityDescription Schema) je schmatem, kter bylo tak vytvoeno a je stle udrovno, stejn jako metadatov schmaMODS,KongresovouknihovnouveWashingtonunajejmserveru (http://www.loc.gov/standards/mads/)[LibraryofCongress,2012a].Jdeo schma,kter korespondujesformtemMARC 21proautoritndata.Jemetadatovmschmatemve struktueXMLproautoritndata(autoritnzznamy)jmenna vcnpovahyvetn unifikovanchnzvdl.StejnjakoschmaMODS,ischma MADS definuje prvky, jich jemnvesrovnns klasickmformtemMARC 21proautoritndata.Jednotlivprvky maj slovn pojmenovn. Schma MADS je pidruenm schmatem ke schmatu MODS, je takurenopropotebyknihoven,zejmnaprobudovnsouborautoritnchdat,jeho aplikacenejsoualevesvtovmmtkuatakpoetn.JistvyuitschmatuMADSje 42 monvidti v oblastisoudobchdigitlnchknihovenaarchivzezamenmnavdu a vzkum,ktervevedlejchaplikacchvedouautoritndataoautorechdokument(viz pklad zznamu fyzick osoby na obr. . 10). PrvnverzemetadatovhoschmatuMADS(1.0)bylazpstupnna21. 4. 2005[Libraryof Congress,2012a].Nejnovjverze2.0pochzz2. 6.2011.StrukturazznamuMADS (XML)jedefinovnapomocsouboruXSD:http://www.loc.gov/standards/mads/mads.xsd. PehledplnsmantikymetadatovhoschmatuMADSjek dispozicinaURL: http://www.loc.gov/standards/mads/mads-outline.html. Smantika definovanch prvk me bt podle poteb producenta dat zajiovna na zklad vlastnchpravideltvorbyautoritnchdat,alev profesionlnrovin(iz dvoduppadnch konverzdojinchformtischmat)sedoporuujevyuitstandarduAACR2(Anglo-AmericanCatalogingRules)v stechprotvorbuzhlav(vppadjmennchautoritnch dat).Propedmtovaklasifikanautoritndajejemonvyutpravidlaspecifick pravidla. MetadatovzznamMADSjeuvedenkoenovmprvkem(prosoubor zznamMADS,z nichkadjeuzavenv hlavnmkoenovmprvku).Mebt uvedeni slovmprvkem,kterjejinakv rolijedinhoprvkuprvnrovn(viz pklad na obr. . 10). V rmci koenovho prvku jsou v atributu xmlns specifikovan adresy URLvechschmat,podlekterchjecelmetadatovautoritnzznamvytvoen.Uveden me bt tak daj o pouit verzi schmatu.

- - - Subirats-CollImma - - Subirats CollImma Obr. . 10:autoritn zznam fyzick osoby ve struktue MADS [pevzat ze systmu IRALIS v lednu 2012] 43 V rmcijednohometadatovhozznamujepovinnjenomjedinprvek , kter je opakovateln. Dal doplkov hlavn prvky, jako jsou prvek (provylouentvaryjmen)a/nebo(prosouvisejctvaryjmen),jsouvolitelna mohoubtopakovateln.Prvekmusobsahovatalespojedenpodprvek (napkladaneboaapodobn.).Definovan atributyschmatuMADSsenemusaditvestanovenmpoadajsouneopakovateln [Library of Congress, 2012a]. Pkladovzznamna obr. .10 pochz ze systmu autoritnch dat IRALIS, kter registruje autory(fyzickosoby)publikujcv oboruinformanvdyaknihovnictvv elektronickch archivech.Metadatovzznamysystmujsoupropojenys mezinrodnmelektronickm archivemE-LIS(http://eprints.rclis.org/),kdenapomhajkidentifikaciautor a pi pprav bibliografickch metadatovch zznam. Pkladov zznam na obr. . 11 je del, pochz ze souboruautoritnchdatKongresovknihovny(http://lccn.loc.gov/n89658825/mads) a reprezentujeznmouosobnostoblastidigitlnchknihovenprof.E.Foxez Virginsk polytechniky.

- - - Fox, Edward A. (Edward Alan)1950- - - Fox, E. A. (Edward Alan)1950- - - Fox, E. (Edward)1950- nuc89-48425: Salton, G. A comparison of two methods for Boolean ... 1983 (hdg. on NjR rept.: Fox, E. A. (Edward A.); usage: E.A. Fox)LC database, Oct. 24, 1996 (hdg.: Fox, Edward A.; usage: Edward A. Fox)OCLC database, Oct. 24, 1996 (usage: Edward A. Fox, E.A. Fox, E. Fox, Edward Alan Fox)44 AMWS, 1995/96 (Fox Edward A.; b. May 14, 1950; Dept. of Computer Science, Va. Tech)n 89658825- Converted from MARCXML to MADS version 2.0 (Revision 2.10)DLC19961024085419.0n 89658825aacr2 Obr. . 11:autoritn zznam fyzick osoby ve struktue MADS [pevzat z databz eautoritnch dat Kongresov knihovny v lednu 2012] 3Rmce pro komunikaci metadat (vbr) 3.1Struktura RDF (Rmec pro popis zdroj) Specifikace schmatu-smantiky Dublin Core byla jednou z mnoha, kter v 90. letech vznikly a stle se rozvjely. Jednou z nejvtch pekek, kter stly ped systmy a slubami, je se zabvalypopisemazpracovnmdigitlnchzdroj,bylamultiplicitanavzjem nekompatibilnchnoremismrnicprosyntaxmetadatijazykydefinicschmat.Bylotak praktickyznemonnovzjemnvyuvnmetadatvrznchaplikacchvcelosvtovm mtku.Situacieilvedruhpolovin90.let20.stoletitzv.Rmecpropopiszdroj (Resource Description Framework, dle tak jako RDF), kter je dlem spolenho sil ady odbornkzrznchorganizaccelhosvta.PrcenastruktueRDFbylyvedeny a koordinovny Konsorciem W3C a jeho vsledkybyly a stle jsou pro veejnost k dispozici nahostitelskmserveruMassachusettskhotechnologickhoinstitutuUSA (http://www.w3.org/RDF/). StrukturaRDFbylazaloenanawebovtechnologiiabylanavrenjakoaplikacenovho jazyka XML (eXtensible Markup Language) [World Wide Web Consortium, 2008], jen je derivtemzkladnhoznakovachojazykaSGML.JazykXMLsestalnstupcemjazyka HTML,kterbylpouvnvminulostijakohlavnformtwebovchdokument.Pekonal adujeholimitastalseihlavnmpenosovmformtemmezirznmiaplikacemi.XML pielsadouvynikajcchvlastnost(nap.autoimohoudefinovatvlastntagy),textov dokumenty v tomto formtu jsou snadno iteln, srozumiteln, zpracovateln a konvertibiln. Zobrazovndatjerealizovnopouzepesstyly.Podstatnzmnybylypipravenyvoblasti propojovnXMLdokumentpomocspecilnchjazykXlinkaXpointer.Umonily nejentvorbuodkaznastistrnek,kternebylypedemoznaeny,neboobousmrn odkazy i odkazy na nkolik zdroj najednou, ale i odkazy uloen mimo samotn dokument. StrukturaRDFjakoaplikaceXMLmdefinovanou(naposledyv roce2004)svojivlastn standardnDTD(DocumentTypeDefinition).Jevznamnouobecnouspecifikacmodelu a syntaxe [World Wide Web Consortium, 2004d] a specifikac schmatu [World Wide Web 45 Consortium,2004b]metadatjakhokolivzamenacharakteru.Clemspecifikacebylo zajitnvzjemnsouinnosti(interoperability)jednotlivchimplementacmetadatna mezinrodnrovni,kterzahrnovalajakpopiswebovchdigitlnchobjektatvorbu metadat,takjejichvmnuazejmnauitrealizovanvprvnfzipomocinteligentnch program-agent.Jednouzoblast,ktermohlabohatvyuvatmetadatkplnnsvch kol, byly i knihovny vetn knihoven nrodnch. Je to vak i ada dalch specializovanch instituc,dcchorgnsttnchsprvapod.KonenmclemspecifikceRDFbyla automatickkontrolaakomunikacewebovchzdrojvcelosvtovmmtku,kterbyla pedpokladem k budovn webovch informanch systm a slueb vyho du. RDFnezahrnujespecifikacismantikpropopiszdrojjednotlivchmetadat.Jehozkladn modeljezaloennakoncepcipopisuzdrojprostednictvmsouborujejichvlastnost zvanhopopisRDF.ZkladnmodelRDFzahrnujensledujctitypyobjekt[World Wide Web Consortium, 2004d]: 1)zdroje(webovstrnka,ststrnky,kolekcestrneknebocelwebovsdlo) identifikovan jednoznanm identifiktorem zdroje URI (URL, URN aj.); zdrojem podle RDF ale me bt i tradin dokument. 2)vlastnostizdroj(specifickaspekt,atributnebovztahuvankjejichpopisu),kter maj specifick vznamy a v rmci kterch jsou definovny jejich ppustn hodnoty i typy zdroj, je jsou popisovny. 3)RDFdaje(vroky),kterjsoutvoenytemikomponentami(srovnejtaksvodnm vkladem v sti tohoto textu): Zdrojem (ve specifikaci syntaxe RDF oznaovan jako subjekt vroku) Pojmenovanou vlastnost (oznaovan jako predikt vroku) Hodnotou pojmenovan vlastnosti (oznaovan jako objekt vroku); hodnotou me btjednoduchetzecznak(vizObr..12),pop.jednoduchdajdefinovan v rmcispecifikacejazykaXML, nebo j me bt jin zdroj (entita), kter me bt rovn popsn svmi vlastnmi vlastnostmi (viz obrzek 7). Pklad: Vrok v pirozenm jazyce: Tim Berners-Lee je autorem zdroje s adresou http://www.w3.org/DesignIssues/Metadata je mon vyjdit pomoc jednoduchho diagramu tak, jak je uvedeno na obrzku 5 (zdroj je vdyuvedenvelipse,ipkaprezentujcvlastnost,mussmovatzezdrojenahodnotu pojmenovan vlastnosti, je je v tomto ppad v rmeku). http://www.w3.org/DesignIssues/Metadata --- autor --- > Tim Berners-Lee Obr. . 12: daj RDF (vrok) 46 PrezentacevztahuzobrazenhonaObr..12budeprostedkyjazykaXML/RDFvypadat nsledujcm zpsobem (Obr. . 13): Tim Berners-Lee Obr. . 13: zznam ve struktue XML/RDF Je-lihodnotouvlastnostivchozhozdrojejinwebovzdroj,budedajRDFvyjden pomocdiagramutak,jakjeuvedenonaObr..14.Takovzdrojmemtsmosobsv vlastn vlastnosti (daje) s pslunmi hodnotami. Obr. . 14: grafick prezentace daj RDF (vrok) RDF je jednou z aplikac jazyka XML, a proto vychz z jeho modelu i syntaxe a nabz tak velmi vznamn prostedek k zajitn vzjemn souinnosti rznch aplikac metadat, kter sevanglickterminologiioznaujetermnemnamespace(jmennprostor).Jmenn prostorvXMLjevzkladndokumentacidefinovnjakokolekcejmenidentifikovanch URI, je jsou uvna v dokumentech XML jako typy prvk a jmna vlastnost [World Wide WebConsortium,2009].Jednotlivmsystmmseumouje,abypipopisuzdroj deklarovalysvvlastnzpsobyvyjadovnpopisuzdroj.Pipopisuzdrojevjednom systmujemonvyutnkterprvkyjinhosystmu.Jmennprostorypedstavujvlastn specifickwebovdokumentyobsahujc


Recommended