Standardy digitálních knihoven – nové zkratky
Martin VojnarVědecká knihovna v Olomouci
Standardy digitálních knihoven – nové zkratky 2
... zkratky
Standardy digitálních knihoven – nové zkratky 3
Digitální knihovny
• výzkum a vývoj (a také rozmach a rozvoj)
• týká se všech paměťových institucí a druhů sbírek (různé role – budovatel, přispěvatel, správce, aj. – často spolupráce institucí)
• daleko překračuje rámec tradičních dokumentů, předmětů a listin
• objekty vznikají digitálně i digitalizovaně
• objekty jednoduché a souborné
Standardy digitálních knihoven – nové zkratky 4
Souborné objekty• odpovídají okolní realitě a vnímání• v digitálních knihovnách se často
podle potřeby rozkládají na jednoduché objekty, např.:– digitalizovaná strana (obrázek) knihy– digitální článek (html stránka) časopisu– reklamní klip (video) jako část pořadu
• musí být ale uchovávány a prezentovány pohromadě
Standardy digitálních knihoven – nové zkratky 5
Co potřebujeme
• nástroj pro uchopení a popis objektů• nástroj pro přenos objektů• nástroj pro „užívání“ objektů
jinak řečeno: metadata, protokoly a formáty(a identifikátory ?)
Standardy digitálních knihoven – nové zkratky 6
Standardy
• návrh, implementace a realizace digitální knihovny vyžaduje zdroje (čas,
peníze, lidé), kterých není nikdy dost• digitální knihovny více než jiné služby
mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně...
• standardní metadata, protokoly, formáty(a identifikátory?)
Standardy digitálních knihoven – nové zkratky 7
Metadata
– popisná metadata (abychom mohli objekt nalézt)
– technická metadata (abychom mohli vyjádřit vlastnosti objektu – obrázek, text, audio, ...)
– strukturální metadata (abychom mohli propojit objekty a metadata mezi sebou)
– administrativní metadata (abychom mohli objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)
Standardy digitálních knihoven – nové zkratky 8
Příklad metadat
PŘÍKLAD – periodikum 19./20. století:– vícenásobná struktura (roky, ročníky,
svazky, čísla, strany, články)• metadata titulu vs. metadata čísla vs.
metadata článku• metadata pro vyhledávání (např. získaná
OCR)• metadata o umístění objektů pro
zobrazování a o službách pro dodávání (např. konverze do djvu/pdf formátu)
Standardy digitálních knihoven – nové zkratky 9
Standardy digitálních knihoven – nové zkratky 10
Popisná metadata
– MARC XML (MAchine-Readable Cataloging)http://www.loc.gov/standards/marcxml/
– DC (Dublin Core)http://dublincore.org/
– TEI P4 / P5 (Text Encoding Initiative)http://www.tei-c.org/
– EAD (Encoded Archival Description)http://www.loc.gov/ead/
Standardy digitálních knihoven – nové zkratky 11
Další metadata
– NISO Z39.87 (Technical Metadata for Digital Still Images) http://www.niso.org/
– JHOVE (JSTOR/Harvard Object Validation Environment) http://hul.harvard.edu/jhove/
– PREMIS (PREservation Metadata Implementation Strategies)http://www.loc.gov/standards/premis/
– proces standardizace není zdaleka hotov!
Standardy digitálních knihoven – nové zkratky 12
Tolik metadat?
Standardy digitálních knihoven – nové zkratky 13
Do kontejneru s nimi!
Standardy digitálních knihoven – nové zkratky 14
METS – příklad kontejneru• METS = standard pro zachycení a výměnu
metadat v prostředí digitálních a digitalizovaných objektů
• METS = schéma založené na XML• z iniciativy Digital Library Federation (DLF,
http://www.diglib.org/)• správcem je Kongresová knihovna (viz
www http://www.loc.gov/standards/mets/), elektronická konference na [email protected]
• od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)
Standardy digitálních knihoven – nové zkratky 15
METS – příklad
Standardy digitálních knihoven – nové zkratky 16
METS – základní částiMETS obsahuje (ale nedefinuje)
následujích 6 sekcí metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu
<behaviourSec>
Standardy digitálních knihoven – nové zkratky 17
METS – základní části
METS Header
Administrativemetadata
FileInventory
Structuremap
Descriptivemetadata
Behavioralmetadata
optional
optional
optional required
optional optional
převzato z prezentace Smith MacKenzie (MIT, 2003)
Standardy digitálních knihoven – nové zkratky 18
• lze je zpracovat dvojím způsobem:– odkazem <mdRef>
– druh odkazu: URN, URL, PURL, DOI ...– druh metadat: MARC, EAD, DC, TEI, ...– popisek
METS – <dmdSec> odkazem
Standardy digitálních knihoven – nové zkratky 19
METS – <dmdSec> přímo– přímo v METS dokumentu
<mdWrap>:
Standardy digitálních knihoven – nové zkratky 20
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
Standardy digitálních knihoven – nové zkratky 21
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
e tc ., e tc ., e tc.
F ile G ro up F ile
F ile G ro up F ile
F ile In ve n to ry(F ile G ro u p)
převzato z prezentace Smith MacKenzie (MIT, 2003)
Standardy digitálních knihoven – nové zkratky 22
METS – <structMap>• jádro METS dokumentu, které spojuje
jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů
• vazba je realizována prostřednictvím:– <fptr> ... ukazatel na fyzický soubor v
rámci aktuálního METS dokumentu– <mptr> ... ukazatel na jiný METS
dokument, který obsahuje požadovanou informaci
Standardy digitálních knihoven – nové zkratky 23
METS – praktické dopady• poměrně náročná datová struktura, kterou
nelze pohodlně vytvářet s běžným editorem• vyžaduje koordinaci při implementaci:
– existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat
– existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
Standardy digitálních knihoven – nové zkratky 24
METS – přehled implementacíhttp://sunsite.berkeley.edu/mets/registry/
– UC, Berkeley (EAD<>METS)– National Library of Portugal (eContent editor)– California Digital Library (TEI, EAD<>METS)– Culturnet Cymru (TEI<>METS)– FCLA (conversion ETD<>METS)– Harvard, Göttingen, Library of Congress,
Oxford, MIT, OCLC, RLG, Stanford, Graz aj.
implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
Standardy digitálních knihoven – nové zkratky 25
METS – současný stav• z amerického standardu se stává
světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005)
• rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí)
• předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
Standardy digitálních knihoven – nové zkratky 26
METS pro uživatele
Standardy digitálních knihoven – nové zkratky 27
METS záznamu strany
Standardy digitálních knihoven – nové zkratky 28
METS záznamu svazku
Standardy digitálních knihoven – nové zkratky 30
Standardy
• návrh, implementace a realizace digitální knihovny vyžaduje zdroje (čas,
peníze, lidé), kterých není nikdy dost• digitální knihovny více než jiné služby
mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně...
• standardní metadata, protokoly, formáty(a identifikátory?)
Standardy digitálních knihoven – nové zkratky 31
Protokoly
• OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)http://www.openarchives.org/
• OpenURL Z39.88 (OpenURL Framework for Context-Sensitive Services)http://library.caltech.edu/openurl/
• jejich implementace by měla být samozřejmým požadavkem dnešních digitálních knihoven!
Standardy digitálních knihoven – nové zkratky 32
Formáty
• volba podle potřeby (pluginy)• čitelnost a velikost (různé techniky, pluginy)• možnost dodání podle přání (pluginy)• s vědomím, že konverze/migrace na horizontu
• MIME (Multipurpose Internet Mail Extensions)http://www.iana.org/assignments/media-types/
• projekt JHOVE (validace a popis)
Standardy digitálních knihoven – nové zkratky 33
Identifikátory
• na úrovni popisných metadat– sbírky národního významu; pro
digitalizované/digitální varianty nelze využít identifikátor tištěné podoby (viz např. ISSN vs. e-ISSN)
– lokální sbírky, ideálně jednoznačné identifikátory (instituce – sbírka – záznam)
• obvykle lze přidělování kontrolovat (např. sigla pouze pro knihovny)
Standardy digitálních knihoven – nové zkratky 34
Identifikátory• na úrovni ostatních metadat a objektů
– jednoznačnost identifikátoru v rámci repozitáře– jednoznačnost identifikátoru v národním rámci– délka identifikátoru (CRC32 vs. MD5)– identifikátor coby validace objektu (použití
kontrolních součtů, nikoliv číslic!)– identifikátor objektu musí být součástí metadat– zajištění linkování (i při změně identifikátoru)– identifikátor by měl být uložen mimo objekt
• obvykle nelze přidělování kontrolovat
Standardy digitálních knihoven – nové zkratky 35
Shrnutí• standardní metadata, protokoly, formáty
(a identifikátory?):– existují metadata + kontejner– existují protokoly– existují formáty– neexistují identifikátory (instituce, sbírky, ...)
• vyžadujme je v aktuálním/plánovaném software• je třeba národní koordinace zvláště mezi
paměťovými institucemi• je třeba koordinace s vazbou na světové standardy• jedná se o dlouhodobý úkol a vybudování rámce,
který musí mít patřičné zdroje