Petr Žabička Moravská zemská knihovna v Brně zabak@mzk.cz

Post on 14-Jan-2016

48 views 0 download

description

Petr Žabička Moravská zemská knihovna v Brně zabak@mzk.cz. Návrh HW a SW vybavení krajského digitalizačního centra. Podklady k rozhodnutí. Druh dokumentů určený k digitalizaci noviny staré tisky 19./20. století mapy, grafiky, atlasy... Množství dokumentů k digitalizaci - PowerPoint PPT Presentation

transcript

Petr ŽabičkaMoravská zemská knihovna v Brně

zabak@mzk.cz

Návrh HW a SW vybavení krajského digitalizačního centra

Podklady k rozhodnutí

• Druh dokumentů určený k digitalizaci– noviny – staré tisky– 19./20. století– mapy, grafiky, atlasy...

• Množství dokumentů k digitalizaci• Fyzický stav dokumentů

– nutný restaurátorský zásah?– pevnost papíru, pevnost vazby

• Typ vazby– nakolik lze svazek rozevřít?– jak daleko od vazby začíná text?

Scannery• Pravděpodobné vybavení pracoviště

– 1x robotický scanner– 1-2x ruční knižní scanner

• Vhodné koordinovat mezi kraji, např.– 1x robotický A2, 1x ruční A4– 1x robotický A4, 1x ruční A3– 1x ruční 2A0 (mapy), 2x ruční A3– ... apod.

• Vhodné prostory – eliminace negativních vlivů vnějšího světla– hlučnost

4DigitalBooks

• Pro dokumenty max. formátu A2• Nutnost rozevření dokumentu do roviny• Přítlak zespodu na sklo• Vyšší cena (cca 7 mil. Kč)• Velká hmotnost a rozměry• 1 pracovník obslouží cca 2 scannery

Treventus

• Unikátní konstrukce skenovacího mechanismu– Svislý pohyb

• Skenované listy drženy podtlakem• Skenují se obě strany zároveň• Obálku a přídeští je nutné skenovat na ručním

skeneru zvlášť• Nepříjemné blikání při digitalizaci (zátěž)• Doporučuje se aby 1 pracovník obsluhoval 1

scanner

Kirtas

• Snímání jedním nebo dvěma digitálními fotoaparáty

• Obracení stran mechanickým ramenem s využitím podtlaku

• Nasazeno zejména v USA, ale např. i BL• 1 pracovník obslouží více než 1 scanner

Velkoformátový scanner - Metis 2xA0

• Pravděpodobně nejpřesnější scanner pro staré mapy

• Maximální velikost 2xA0• cca 4 mil. Kč• Metis vyrábí i další knižní

scannery

Workflow

• Koordinace digitalizace rámcovou dohodou• Přesněji prostřednictvím RD CZ• Analogické toky dokumentů na obou pracovištích

– bibliografický záznam -> digitalizace -> metadata– využití komerčních nebo open source nástrojů– snaha o minimum ruční práce, maximální automatizaci workflow,

vysoký výkon

• Ochrana digitalizovaných dokumentů (omezení výpůjček, restaurování, ochranné obaly)

Požadavky na SW pro workflow 1

• vazba na existující systémy (Aleph a další - Z39.50 nebo XML/HTTP; RD.CZ)

• nezávislý na jednom modelu/výrobci HW (zejm. scannerů)

• minimalizace lidské práce, maximální automatizace procesů

• automatické OCR, generování OCRtextu v podobě XML včetně souřadnic slov (např. Finereader)

• tvorba požadovaných metadat (METS)

• sledování toku dokumentů linkou

• rozhodnutí zda výpočetní výkon centralizovat na serverové farmy nebo na velký počet PC

Požadavky na SW pro workflow 2

• Proces končí vložením balíčku dat a metadat do systému pro digital preservation (SIP v terminologii OAIS) - jeho případnou absenci nutno zohlednit

– zvětšení objemů dat spravovaných tímto SW– dočasně supluje jeho roli?

• Zkušenosti z fungujících digitalizačních center:– důraz na kontrolu kvality ihned po digitalizaci– možnost opravit chyby před vrácením svazku do skladu

=> úspora– větší chybovost při digitalizaci na manuálních

scannerech

• Testy různých SW pro workflow nedávno provedla ÖNB

Potenciální dodavatelé SW pro

workflow• 4DigitalBooks

– každý pracovník obsluhuje 2-3 počítače

• CCS– centrální serverová farma– využívá se levná práce Rumunů

• Treventus– připravuje se

• Goobi– open source systém, 2 firmy zajišťují podporu

Děkuji za pozornost!

Petr Žabička <zabak@mzk.cz>

Moravská zemská knihovna v Brně

www.mzk.cz