Miroslav Kunt: Projekt Národního digitálního archivu

Post on 24-Jan-2017

26 views 2 download

transcript

Národní digitální archivNárodní digitální archiv

Národní archivArchivní 4149 01 Praha 4http://www.nacr.cz

kunt@nacr.cz

Archivnictví...

• vybrané právnické osoby mají povinnost navrhovat archivům dokumenty ze své činnosti k výběru archiválií

• archivy nepřejímají dokumenty všechny, ale pouze výběr z nich prováděný ve skartačním nebo mimo skartační řízení

• klíčovým je provenienční princip - organizace archivních fondů dle původců

• kompetence archivů (jejich oblast působnosti) stejně jako soustava archivů dána zákonem

Zákon č. 499/2004 Sb.

• Právní úprava platná od 1.1.2005.

• Podrobnosti stanovují prováděcí vyhlášky č. 645/2004 Sb., kterou se provádějí některá ustanovení archivního zákona a 646/2004 Sb., o podrobnostech výkonu spisové služby.

• I stará legislativa (zákon 94/1974 Sb. s prováděcími vyhláškami) umožňovala pracovat s elektronickými dokumenty - viz „a jiné záznamy“ (§ 2 odst. 1 cit. zák.)

• Povinnosti vykonávat spisovou službu a provádět výběr archiválií – odlišné pro různé subjekty: stanovuje zejména § 3 a § 63 zákona

• Ze strany archivů možnost uložení sankcí ve správním řízení a/nebo dle zákona o přestupcích, uplatňování státní kontroly

Definice dokumentu (§ 2 archivního zákona)

• dokumentem je každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce

• archiválií je takový záznam, který byl vzhledem k době vzniku, obsahu, původu, vnějším znakům a trvalé hodnotě dané politickým, hospodářským, právním, historickým, kulturním, vědeckým nebo informačním významem vybrán ve veřejném zájmu k trvalému uchování a byl vzat do evidence archiválií; archiváliemi jsou i pečetidla, razítka a jiné hmotné předměty související s archivním fondem či s archivní sbírkou (…) vybrány a vzaty do evidence,

Vyhláška 646/2004 Sb. a elektronické dokumenty

• Vyhlášku tvoří ustanovení skartačního a spisového řádu, základních norem spisové služby v instituci

• Začleněna je legislativa k elektronickým podatelnám (Vyhláška 496/2004 Sb.) a elektronickém podpisu (zákon 227/2000 Sb. a nařízení vlády č. 495/2004 Sb.)

• Umožňuje vedení podacího deníku v elektronické podobě, ovšem hovoří o „knize z předem svázaných a očíslovaných tiskopisů“ a dodává „s možností tisku pro trvalé uložení“ (§ 2 odst. 3); obdobně tzv. rejstříky (§ 2 odst. 8)

Vyhláška 646/2004 Sb. a elektronické dokumenty

• „Písemné vyhotovení vyřízení dokumentu může být v digitální podobě na technických nosičích dat. Tyto jsou součástí spisu“ (§ 4 odst. 5) = zcela nevhodné, nelze udržovat

• Skartační návrh lze archivu zaslat elektronicky, se zaručeným elektronickým podpisem (§ 9 odst. 7)

• ohledně ukládání elektronických (resp. digitálních) dokumentů je odkázáno na § 3 vyhlášky o elektronických podatelnách (§ 8 odst. 1) = zcela nedostatečné, ve skutečnosti vůbec neřeší

• Dokument, jemuž podle spisového a skartačního plánu bude přidělen skartační znak "A", vyhotovuje určený původce na trvanlivém papíru určeném pro dokumenty.

Vyhláška 646/2004 Sb. a elektronické dokumenty

„Dokument v digitální podobě se skartačními znaky "A" a "V" vzniklý z činnosti určeného původce musí být zapsán ve formátu, který zaručí jeho neměnnost a umožní jeho následné čtení. Pokud tuto podmínku nemůže určený původce zabezpečit, převede takové dokumenty do analogové formy odpovídající době jejich vyřízení a opatří je náležitostmi originálu, a to nejpozději před jejich zařazením do skartačního řízení; obdobně postupuje při vyřizování dokumentů přijatých určeným původcem v digitální podobě včetně potvrzení o platnosti elektronického podpisu v době přijetí dokumentu.“ (§ 8 odst. 9) = základní problém dlouhodobého uložení (SW nezávislost a otevřenost ukládaných dat) se neřeší.

Elektronické dokumenty (ED)Elektronickým dokumentem

rozumíme soubory digitálních záznamů, které zprostředkují informace. Tyto informace mohou být jak alfanumerické (textové), obrazové nebo zvukové a vytvářejí se, využívají i ukládají prostřednictvím výpočetní techniky. Pro účely trvalého ukládání elektronických dokumentů mezi ně nezahrnujeme počítačové programy.

Vlastnosti elektronických dokumentů

• Není je možné bez zvláštního zařízení využívat (číst)• Neplatí předpoklad, že dokument = nosič, tj. médium k přenosu informací v prostoru a čase. Je to způsobeno možností bezeztrátového přenosu informace z jednoho média na druhé. Neexistuje tedy pojem „originál“ a „kopie“.

Definování problémůNelze uchovávat výpočetní techniku (HW) - stárnutí elektronických součástek není možné zastavit, mikroprocesorovou techniku nelze „postavit nově“.=> Muzeum výpočetní techniky udržované za účelem uchování dat je nesmyslem

Na HW je přímo závislý operační systém počítače a na něm zase aplikační programy zpracovávající data=> Nejsložitější problém

Média, na nichž jsou elektronické záznamy uchovávány lze zařadit k HW, problémy s jejich čtením v nových zařízeních se musí řešit migrací na média morálně novější.

Principy elektronické archivace

Migrace. Periodický přenos digitální informace z jedné HW/SW konfigurace na jinou (především na novou generaci výpočetní techniky). Průvodním jevem migrace je zajištění uchování a využívání elektronických dokumentů bez původního SW

Upřednostňována migrace - perspektivy emulace nejisté (nelze předvídat vývoj principů výpočetní techniky)

Emulace. Vývoj emulátorů starších systémů (HW/SW konfigurací) na systémech nových generací tak, aby byl starý SW spustitelný. Předpokládá archivaci původního software. I při tomto řešení je potřeba migrovat elektronická data na nová používaná média.

Virtualizace. Řešení spojující prvky migrace i emulace pro vybrané datové formáty (JPEG, PDF): vytvoření interpretační struktury, UVC - Universal Virtual Computer. Použití Královská knihovna a Národní archiv Haag.

Digitální archiv - tři studie• Dlouhodobé uchovávání elektronických dokumentů se zaručeným elektronickým podpisem (projekt výzkumu a vývoje býv. MIČR, řeší firma CEAG - dokončeno)

• Projekt pracoviště pro dlouhodobé ukládání a zpřístupňování dokumentů v digitální podobě (zadáno Národním archivem na základě usn.vl. 11 z r. 2004, dokončení v únoru, řeší ICZ, a.s.)

• Péče o dlouhodobě uchovávané digitální archiválie (projekt výzkumu a vývoje MVČR 2007-2008, řeší Odbor archivní správy a spisové služby MV)

Projekt digitálního archivu I• Zadáno veřejnou soutěží, celé zadání ke stažení na stránkách NA: http://www.nacr.cz/Z-Files/zadavaci_dokumentace2.zip

• Zadání vycházelo ze zahraničních zkušeností, klasické předarchivní péče, výzkumu MV (Archivní správy) a průzkumu elektronických dokumentů u původců

Projekt digitálního archivu II Základní principy zadání:• model OAIS• Jako součást digitálního archivu „chráněné úložiště/spisovna“• Podpora širokého spektra dokumentů (ze systémů spisové

služby EDMS/ERMS, audio, video, databáze, rastrová a vektorová grafika)

• Testovací pracoviště jako součást projektu• DC a MoReq jako základ metadatového modelu SIP/AIP

• Přírůstek 10-15 TB ročně ve střednědobém horizontu

• Paralelní umístění na dvou místech vzdálených od sebe

• Dvě technologie pro ukládací médium

• Zadání obecnou formou, ale s komentáři (např. upřednostňujícími migraci před emulací a virtualizací, ale s možností tyto metody navrhnout)

Projekt digitálního archivu III

Požadované části projektu:• Životní cyklus digitálního dokumentu• Metadata• Uchovávací metoda• Správa dat• Zpřístupnění• Způsob uložení dat• HW a SW specifikace• Bezpečnost dat• Zabezpečení provozu• Legislativní změny• Autenticita digitálních záznamů • Testovací pracoviště • Finanční a časové parametry realizace projektu

Projekt digitálního archivu IV

Projekt digitálního archivu V

Projekt digitálního archivu VI

Projekt digitálního archivu - metadata

Informace o obsahu - vlastního obsah (datový objekt, elektronický dokument) a související informace pro interpretaci uloženého objektu.Informace uchovávací (konzervační, technické) - nezbytné pro řízení uložení obsahu. Jedná se především o referenční informace (popis a identifikace obsahu), informace o původu (vzniku archivního obsahu), kontextové informace (vztahy obsahu k prostředí a jinému obsahu) a informace o neměnnosti (autenticita obsahu).Informace o balíku - spojení digitálního obsahu a souvisejících metadat do jednoho celku (balíku). Jednoznačně identifikují tento celek a jeho součásti.Popisné informace - obvykle vstup pro hledání v archivu (vyhledávání informačních balíků), odvozeny z informací o obsahu a o uložení. Metadatové standardy DC, PREMIS (PREservation Metadata: Implementation Strategies) a METS (The Metadata Encoding and Transmission Standard)

Rozborem navrženy následující:

• UDO (Ultra Density Optical) disk s kapacitou média 60 GB - provozně nejvýhodnější, kapacitní

• Primární médium: disková pole

Projekt digitálního archivu -média

MoReq

Modelové požadavky na Modelové požadavky na správu elektronických správu elektronických dokumentůdokumentů

MoReq• Evropské doporučení pro fungování systémů elektronické spisové služby

(správy dokumentů).

• Řada termínů a postupů shodná s ISO 15489:2001 (terminologické problémy document/record)

• Český překlad - na Odboru archivní správy a spisové služby MV (120,- Kč) nebo http://www.cornwell.co.uk/moreq/.

• Připravovaný MoReq 2 (jaro 2008) bude zahrnovat metodiku certifikace systémů, integraci elektronických postupů (EP), definice procesů při správě dokumentů; náhrada národních norem (např. DOMEA v Německu)

=> rozvíjí původní MoReq

Funkční digitální archiv - VERS

Funkční digitální archiv - VERS

Národní digitální archiv versusNárodní digitální knihovna?

• Není důvod konkurovat -> rozdílná úloha archivů a knihoven (jiná „sběrná oblast“)

• Důraz na jiné problémy dlouhodobého ukládání: Archiv Knihovna

Ochrana datOchrana dat

Právní relevance

ZpřístupněníBezpečnost

Autorskoprávní problematika

Rozdílná metadata

Automatizované akvizice, všechno

Přejímání od původce, výběr

Děkuji za pozornost, dotazy...?Děkuji za pozornost, dotazy...?

Národní archivArchivní 4149 01 Praha 4http://www.nacr.cz

kunt@nacr.cz