+ All Categories
Home > Technology > LTP Pilot - Archivematica Projekt v CR

LTP Pilot - Archivematica Projekt v CR

Date post: 14-Jun-2015
Category:
Upload: dp-blog-cz
View: 713 times
Download: 5 times
Share this document with a friend
Description:
Prezentace k projektu LTP Pilot, který má v ČR otestovat systém Archivematica. Projekt pořádá knihovna MUNI, MZK, a spolupracuje na něm i DU CESNET a možná i knihovna AV CR. Cílem prezentace bylo podat přehledovou informaci o oblasti Digital preservation
64
Digital preservation kontext LTP Pilot Marek Melichar Brno, 6.3.2014 Setkání k projektu LTP pilot
Transcript
Page 1: LTP Pilot - Archivematica Projekt v CR

Digital preservation kontext LTP Pilot

Marek Melichar Brno, 6.3.2014

Setkání k projektu LTP pilot

Page 2: LTP Pilot - Archivematica Projekt v CR

Úvod - definice, cíle a terminologie „DP“ Kořeny „Digital preservation“ a první

projekty Standardy, komunita, periodika, akce Současné možnosti, projekty, technologie Co si z toho vybrat? - Pragmatický přístup Důraz pro projekt LTP Pilot

Obsah

Page 3: LTP Pilot - Archivematica Projekt v CR

Funkční kontext (alternativy k tomu, jak DP dělá Archivematica)

Časový kontext (Co předcházelo a kam to směřuje)

Projekt LTP pilot v kontextu aktivit v ČR

Kontexty?

Page 4: LTP Pilot - Archivematica Projekt v CR

Digital preservation Long-term (digital) preservation Long-term archiving Long-term Preservation of Digital Information

V češtině dlouhodobá ochrana, archivace, uchovávání, ukládání, preservace

Terminologii by měl zavést český překlad norem OAIS (ISO 14721:2012) a ISO 16363:2012

Termíny a definice

Page 5: LTP Pilot - Archivematica Projekt v CR

Short DefinitionDigital preservation combines policies, strategies and actions that ensure access to digital content over time.

Medium DefinitionDigital preservation combines policies, strategies and actions to ensure access to reformatted and born digital content regardless of the challenges of media failure and technological change. The goal of digital preservation is the accurate rendering of authenticated content over time.

http://www.ala.org/alcts/resources/preserv/defdigpres0408

Termíny a definice (ALA)

Page 6: LTP Pilot - Archivematica Projekt v CR

Long DefinitionDigital preservation combines policies, strategies and actions to ensure the accurate rendering of authenticated content over time, regardless of the challenges of media failure and technological change. Digital preservation applies to both born digital and reformatted content.

Digital preservation policies document an organization’s commitment to preserve digital content for future use; specify file formats to be preserved and the level of preservation to be provided; and ensure compliance with standards and best practices for responsible stewardship of digital information.

Digital preservation strategies and actions address content creation, integrity and maintenance.

Termíny a definice (ALA)

Page 7: LTP Pilot - Archivematica Projekt v CR

Digital Preservation Refers to the series of managed activities necessary to ensure continued access to digital materials for as long as necessary

http://www.dpconline.org/advice/preservationhandbook/introduction/definitions-and-concepts

Termíny a definice

Page 8: LTP Pilot - Archivematica Projekt v CR

Technologie: HW, SW, sítě, technické dovednosti

Organizace: Mandát, strategie, plány ochrany, sbírkové plány, bezpečnost

Zdroje: Zaměstnanci a jejich kvalifikace, prostor, financování

Termíny a definice

Page 9: LTP Pilot - Archivematica Projekt v CR

Digital curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle

DCC curation model a další modely, mapování na konkrétní infrastrukturu

Conceptualize Create Access and Use Appraise and Select Destroy Ingest Preservation Action Reappraise Store Access and Reuse Transform

Termíny a definice (DCC)

Page 10: LTP Pilot - Archivematica Projekt v CR

Co je vlastně problém? HW – zastarávání SW – zastarávání a s ním spojené zastarání

formátů Běžné procesy

Rizika přenosu dat Integrita dat Autenticita obsahu Mis-management, chyba

Page 11: LTP Pilot - Archivematica Projekt v CR

Aktivní a pasivní DP? Pasivní DP

◦ Integrita souborů – uchování a dost◦ zálohy◦ Neřeší zpřístupnění v budoucnu

Aktivní DP◦ Pasivní je jejím předpokladem◦ Identifikace formátů◦ Validace formátů◦ Extrakce metadat◦ Identifikace rizik etc.

Page 12: LTP Pilot - Archivematica Projekt v CR

Technocentrický

Uchování původního HW a SWObnova médií

Inkrementální Migrace (souborů, metadat, dat, kontextu)Emulace (SW, platformy)

AnalytickýDigitální archeologieDigitální forenzní věda

Trvalé digitální objekty

Různé přístupy k DP

Page 13: LTP Pilot - Archivematica Projekt v CR

HW muzeum bohužel nestačí SW preservation:

◦ Když nelze oddělit SW od dat◦ Pokud je SW výstupem výzkumné aktivity◦ Pokud má SW historickou hodnotu

◦ Viz současný projekt Preserving.exe

http://www.fit.vutbr.cz/FIT/museum/

Technocentrický přístup

Page 14: LTP Pilot - Archivematica Projekt v CR

Emulace ◦ Od začátku DP jedna z voleb◦ IBM koncept UVC ◦ Projekt CAMiLEON◦ Rothenberg, Jeff 1995◦ EU Projekt KEEP http://www.keep-project.eu/

Motivovalo Berlínské muzeum počítačových her 4 miliony euro, konec v roce 2012 Problémy s licencemi a ovladači, větší problémy právní Obtížné bez zapojení firem a uvolnění licencí starého SW Emulation framework: http://emuframework.sourceforge.net/

Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation , Rothenberg, Jeff ISBN 1-887334-63-7, 1999

Inkrementální přístup k DP

Page 15: LTP Pilot - Archivematica Projekt v CR

J.R. van der Hoeven – UVC 2009 – přednáška pro NDK v IBM.CZ Souvisí s IBM Dias a výzkumem pro KB.NL 2005 – funkční prototyp UVC pro still images Koncept popsán na http://

citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.179.494&rep=rep1&type=pdf

DIAS? – KB.NL má novou verzi svého e-depotu. DNB.de údajně dále DIAS používá (v kombinaci s dalšími moduly, které si sama vyvinula) – ovšem jako „věčný“ pilot

Inkrementální přístup k DP

Page 16: LTP Pilot - Archivematica Projekt v CR

Migrace◦ Dominantní paradigma v oblasti systémů typu repozitář◦ Migrace – OAIS zná víc typů: refreshment, replication vs

repackaging, transformation◦ Nejčastěji se mluví o migraci formátů a migraci z HW

na HW

Všechny současné LTP systémy jsou zaměřeny na migraci jako metodu ochrany.Digital Migration is defined to be the transfer of digital information, while intending to preserve it, within the OAIS.OAIS ISO 14721:2012 str. 5-2

Inkrementální přístup k DP

Page 17: LTP Pilot - Archivematica Projekt v CR

Dnes především forenzní analýza Mají obvykle jiné cíle než zachování dostupností dat

◦ Stejné nástroje a postupy pro analýzu digitálních formátů (NZME, Jhove, Unix File, file signatures) jako DP

◦ Užitečné nástroje pro zpracování velkých transferů celých disků, sítí – bitcurator etc.

◦ Nástroje pro analýzu provenience, autenticity, odhalování metadat, verzí souborů, dočasných a smazaných souborů, skrytých souborů, detekci obfuskace apod.

◦ Nástroje pro analýzu a zpracování e-mailů, analýzu chování na webu a historie

http://www.forensicswiki.org/wiki/Main_Page Directory Snoop: http://www.briggsoft.com/dsnoop.htmForemost  http://foremost.sourceforge.net/Web Historian apod.

Analytický přístup

Page 18: LTP Pilot - Archivematica Projekt v CR

H.M. Gladney 2004- Řada článků a monografie Praktické aplikace?

SNIA a jejich „SIRF“ –Self-contained Information Retention Format

Trvalé digitální objekty

Page 19: LTP Pilot - Archivematica Projekt v CR

Procesy

Software

Context (PDI)

Obsah

Soubory Datasety

Co je předmětem ochrany?Bit level preservation – ochrana bitů (zálohování, bitová replikace, atd.)- Pasivní ochrana (TNA - supports digital preservation but does not engage with the digital records directly)

Information preservation – ochrana informačního obsahu(OAIS) - Aktivní ochrana (TNA - Active preservation is any proactive action taken in the preservation of digital records)

Page 20: LTP Pilot - Archivematica Projekt v CR

Více kopií, více technologií, replikace k partnerům, udržování inventáře AIPů

Transfer dat do archivu jako kritické místo Komprese, kryptování, zálohování, fixity Převádění dat z lokace na lokaci

Projekty z poslední doby: http://www.bitcurator.net/ BagIt, Bagger – právě pro transfer do loc.gov (využívá

Archivematica)

Ochrana bitů

Page 21: LTP Pilot - Archivematica Projekt v CR

Situace v knihovnách (příklad – VISK): ◦ Kopie AIP v NK ◦ Kopie AIP lokálně (někdy, některé AIPy)◦ Rozpracované AIP (bez OCR, neúplné tituly apod.)◦ Kopie u externího dodavatele digitalizace (neoficiálně, časově

omezené◦ Kopie na off-line nosičích (CD, DVD, UDO, Disky)◦ AIPy jsou „zmrazené“ – nejsou updatovány, vytvoření a dost

Neexistuje inventář všech instancí AIPůNeexistuje poskytovatel „třetí lokace“

Řešení: Replikace/zálohování do DÚ CESNETU• Nějaká obecná dohoda mezi UKR a CESNETEM? • Manuál pro knihovny??• Co data pro zpřístupnění????

Ochrana bitů

Page 22: LTP Pilot - Archivematica Projekt v CR

OAIS: ISO 14721, Paimas: ISO 20652 Důvěryhodný dlouhodobý digitální repozitář

(ISO 16363) ISO 27001, ISO 9001

Problém vyhovění OAIS (co je a co není compliant?) > selfaudit a certifikace

DRAMBORA, DSA, TRAC, ISO 16363

Ochrana informací – Certifikace a audit

Page 23: LTP Pilot - Archivematica Projekt v CR

Deskriptivní MD (MODS, EAD, DC, atd.)

Ochranná MD (PREMIS)

Technická MD (MIX, TextMD, atd.)

Strukturální (METS)

Ochrana informací - OAIS

Page 24: LTP Pilot - Archivematica Projekt v CR

Ochrana informací – OAISInformační model • AIP, SIP, DIP• Typy informací

Standardy pro balení: METS, MPEG-21 DIDLXFDU?

Ochranná md: PREMIS(XIP, DNX,…)

Page 25: LTP Pilot - Archivematica Projekt v CR

Funkční entity: ◦ Ingest◦ Archival storage◦ Data Management◦ Administration ◦ Preservation Planning◦ Access◦ Common Services

Ochrana informací – OAIS

Page 26: LTP Pilot - Archivematica Projekt v CR

Možnost rozložení odpovědnosti◦ AIP může být pouze logický celek (jiné nakládání s

MD a soubory s obsahem)◦ OAIS také může být pouze logický celek (oddělení

funkčního modulu)◦ Outsoursování „archival storage“ funkcí,

hostování celého systému – při auditu je ale třeba mít dost dokumentace od všech zúčastněných organizací a o všech systémech

◦ Část informací vyžadovaných OAIS nemusí být v archivu přímo, stačí na ně odkazovat do jiného systému (deskriptivní MD)

Ochrana informací – OAIS

Page 27: LTP Pilot - Archivematica Projekt v CR

Předmětem ochrany je: Informační obsah (data z měření, skenovaná data) Další informace nutná k porozumění, použití a uchování

informačního obsahu◦ Informace o způsobu vytvoření ◦ Informace o nastavení zařízení, osobách, předlohách, ◦ Informace o zpracování dat (kódování, komprese, způsob zpracování

vědeckých dat, filtrování, převážení atd.)◦ kompletní informace o procesu, ve kterém data vznikla◦ Informace o procesech a sw◦ Interpretace, OCR, překlad….

Rozsah dalších informací, které je nutné uchovat, závisí na znalostech/možnostech uživatelů a jejich technických možnostech – a v čase se mění…

Ochrana informací – OAIS

Page 28: LTP Pilot - Archivematica Projekt v CR

Maximální přístup: ◦ http://www.jisc.ac.uk/uploaded_documents/oaismets.pdf◦ TRAC, ISO 16363, NESTOR KK◦ Převod OAIS na funkční požadavky ◦ Jak informační model tak funkce◦ Snaha o maximální automatizaci procesů správy dat◦ Reorganizace procesů instituce

Minimální přístup◦ Naplnit 6 OAIS „mandatory requirements“◦ Informační model a funkce v podstatě formálně◦ Omezené možnosti automatizace procesů správy dat

Ochrana informací – vyhovění OAIS

Page 29: LTP Pilot - Archivematica Projekt v CR

3.1 Závazné povinnosti OAIS (podle překladu NK 2014)

Vyjednávat s producenty informací a přijímat od nich příslušné informace. Získat dostatečná práva k nakládání s poskytnutými informacemi tak, aby bylo

možné zajistit dlouhodobé uchování. Určovat (ať již samostatně nebo ve spolupráci s ostatními  stranami), které komunity

by se měly stát cílovými komunitami, a tudíž by měly být schopny porozumět poskytovaným informacím. Tím je definována znalostní základna dané komunity, 

Zajišťovat, aby informace určené k uchovávání byly pro cílovou komunitu nezávisle srozumitelné. Cílová komunita by měla být schopna informacím porozumět bez potřeby využití speciálních zdrojů , například bez rady expertů, kteří informace vytvořili.

Dodržovat dokumentovaná pravidla a postupy, které zajistí, že informace budou chráněny před všemi reálně myslitelnými nepředvídatelnými událostmi  (včetně zániku archivu), a zajistit, že informace nebudou nikdy smazány (s výjimkou případu, kdy jejich smazání bude součástí schválené strategie). Nemělo by docházet k žádnému jednorázovému smazávání dat.

Zpřístupňovat uchovávané informace cílové komunitě a umožnit distribuci informací v podobě kopií původních dodaných datových objektů s dokumentací podporující jejich autenticitu nebo v takové podobě, aby bylo možné zjistit, ke kterým původním dodaným datovým objektům se vztahují.

Ochrana informací – vyhovění OAIS

Page 30: LTP Pilot - Archivematica Projekt v CR

Udržení dlouhodobé srozumitelnosti, použitelnosti informace bude vyžadovat změny!

Informace musí zůstat srozumitelná, autentická a musí mít prokazatelný původ tj.

Cílem je ochrana informace, nikoli konkrétního bitstreamu

Interní datový model a způsob fungování archivu musí umožnit záznam změn dat i metadat

Ochrana informací – vyhovění OAIS

Page 31: LTP Pilot - Archivematica Projekt v CR

Mapování DP problematiky na risk management přístupy Risk Management – Principles and GuideIines: ISO

31000 Information Assurance Maturity Model IAMM

Identifikace oblastí, typů rizik, dopadů rizik,…

Nástroje: DRAMBORA (The Digital Repository Audit Method Based

On Risk Assessment) TIMBUS project: ERM (Enterprise Risk Management)

nástroje rozšířeny do oblasti DP TRAC

DP jako risk management

Page 32: LTP Pilot - Archivematica Projekt v CR
Page 33: LTP Pilot - Archivematica Projekt v CR

POWRR (Preserving digital Object with Restricted Resources) http://digitalpowrr.niu.edu/digital-preservation-101/

Digital Preservation Handbook http://www.dpconline.org/advice/preservationhandbook

Digital preservation management tutorial http://www.dpworkshop.org/dpm-eng/eng_index.html

ROSENTHAL, Colin a kol. Průvodce plánem důvěryhodného digitálního repozitáře (PLATTER). 1. vyd. Praha: Národní knihovna České republiky, 2009. 51 s. ISBN 978-80-7050-569-4. Online zde: http://www.ndk.cz/platter-cz

CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha : Národní knihovna České republiky, 2010. 154 s. ISBN 978-80-7050-588-5.

BROWN, Adrian. Strategie digitálního archivování. Praha : Odbor archivní správy MV ČR v Tiskárně Ministerstva vnitra, 2003. 64 s. ; 24 cm. (Překlad a předmluva Wanner, Macek)

Online dostupné úvody

Page 34: LTP Pilot - Archivematica Projekt v CR

Ca. od roku 1960 data centra Ca. od 1990 - digital preservation jako

reformátování do digitální podoby 1994-1996: CPA/RLG Task Force on

Archiving of Digital Information 2000 – NDIIPP (National Digital Information

Infrastructure and Preservation Program) 1995 – první verze OAIS 2002 – ISO 14721:2003

První projekty a kořeny DP

Page 35: LTP Pilot - Archivematica Projekt v CR

NDIIPP – 150 milionů USD (soukromé a veřejné finance) Loc.gov, NARA, NLM, NAL, RLG, CLIR a další nefederální 2010  National Digital Stewardship Alliance (NDSA) – další růst

komunity 300 projektů, NDIIPP spolufinancoval vývoj desítek konkrétní nástrojů Nastartoval DP aktivity v archivech, muzeích, státní správě po celých

Spojených státech Podrobný přehled činnosti (do roku 2012)http://www.digitalpreservation.gov/multimedia/documents/ndiipp-states-report032612_final.pdf

RLG 1998: Digital Preservation Needs and Requirements in RLG MemberInstitutions: http://www.webjunction.org/content/dam/research/activities/digpresneeds/digpres.pdf

IMAP 2001: http://www.imappreserve.org/

První projekty a kořeny DP

Page 36: LTP Pilot - Archivematica Projekt v CR

NL Austrálie: 1996: Web PANDORA (Preserving and Accessing Networked

Documentary Resources of Australia) 1997: Statement of Principles for the Preservation of and Long-

Term Access to Australian Digital Objects 1998: Preserving Access to Digital Information (PADI) 

Další projekty do roku 2000: TNA UK (1998 – Preservation policy) BL – 1998 - Výzkumný projekt na téma náklady na DP (http://

www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html)

http://www.interpares.org/ (archivy) NESTOR E-depot KB NL – OAIS LTP DIAS od 2003 (vývoj od 1999) UNESCO 2003 Charter on the Preservation of Digital Heritage

První projekty a kořeny DP

Hedstrom, Margaret; (1997). "Digital Preservation: A Time Bomb for Digital Libraries." Computers and the Humanities 31 (3): 189-202. <http://hdl.handle.net/2027.42/42573>

Page 37: LTP Pilot - Archivematica Projekt v CR

Projekty finacované EU v posledních 15 letech http://www.erpanet.org http://www.delos.info Minerva (digitalizace) CASPAR, PLANETS, WEPRESERVE, DPE WF4Ever, TIMBUS, SHAMAN, SCAPE, PROTAGE,

PrestoPRIME, KEEP, LiWA, ENSURE, BlogForever, ARCOMEN, APARSEN etc etc

Role DPE v ČR byla velmi významná

První projekty a kořeny DP

Page 38: LTP Pilot - Archivematica Projekt v CR

Open source◦ Archivematica◦ RODA◦ Hoppla◦ Mopseus◦ DAITSS◦ ….

Komerční◦ Rosetta◦ SDB◦ …..

LTP systémy v současnosti

Page 39: LTP Pilot - Archivematica Projekt v CR

4C project http://www.4cproject.eu/ Life I-III starší aktivity BL, Dánské NK, NA.NL http://

www.nationaalarchief.nl/sites/default/files/docs/kennisbank/codpv1.pdf

Financování a náklady

Page 40: LTP Pilot - Archivematica Projekt v CR

Jak přesvědčit stakeholdery, že to má smysl?

Advokacie jako součást řízení DP projektů Trvalá ochrana = trvalé financování

Paradoxy financování LTP projektů: ◦ Velké finance na krátkou dobu◦ Problematická udržitelnost infrastruktury◦ Příklad cda.kultury.sk◦ Nepochopení nutnosti ochrany na manažerské

úrovni

Outreach a advocacy

Page 41: LTP Pilot - Archivematica Projekt v CR

Rozdílné chápání konceptu důvěryhodnosti(Viz konference CNZ 2013 – střed dvou světů)

TRAC: “A trusted digital repository is one whose mission is to provide reliable, long-term access to managed digital resources to its designated community, now and in the future“

vs„bezpečný identifikátor“, časová razítka, elektronické podpisy a certifikáty, SSL

K prokázání autenticity nejsou v paměťových institucích nutné elekt. podpisy, postačí i metadata (eventy)

Důvěryhodný digitální archiv

Page 42: LTP Pilot - Archivematica Projekt v CR

Tyllor and Cox v ČR- Certifikace „SW“ podle ISO 16363:2012???

IBM Filenet, Datera…◦ http://

www.cnz.cz/ke-stazeni/2013/konference-2013/CNZ%202013-IBM%20prezentace.pdf

EasyPLM – TD-IS s.r.o.◦ http://www.td-is.cz/doc/certification/td-is_certificate

_iso16363-12.pdf

ISO 16363:2012: „An archive that conforms to this Recommended Practice shall have satisfied the auditor on each of the requirements.“

Důvěryhodný digitální archiv

Page 43: LTP Pilot - Archivematica Projekt v CR

Základní certifikace (Basic certification) –Data Seal of Approval (DSA).

Rozšířená certifikace (Extended certification) - Základní certifikace + , externě posouzený a strukturovaný veřejně dostupný selfaudit podle ISO 16363 nebo DIN 31644.

Formální certifikace (Formal certification)  –plně externí, nezávislý audit a certifikaci dle ISO 16363 nebo DIN 31644.

Důvěryhodný digitální archiv

Page 44: LTP Pilot - Archivematica Projekt v CR

Veřejně dostupná dokumentace k certifikace podle TRAC HathiTrust Portico Chronopolis Scholars Portal  CDA kultury

DSA: 23 institucí http://datasealofapproval.org/en/assessment/ Nestror sealhttp://files.d-nb.de/nestor/materialien/nestor_mat_17_eng.pdf

Důvěryhodný digitální archiv

Page 45: LTP Pilot - Archivematica Projekt v CR

Australský NA (Digital Preservation Software Platform)http://www.aa.gov.au/collection/preserving/digital-records/index.aspx

Manifest Maker supports the transfer of digital records from agencies to the National Archives. It produces a list

of all digital records being transferred, their checksum, and the relationship between the digital records and their related item numbers in RecordSearch, our archive management system

Xena (XML Electronic Normalising for Archives) – determines the file format of a digital record and

converts it to an appropriate preservation file format based on open standards. Xena can also be used to view and/or export Xena files

Digital Preservation Recorder (DPR) – manages the digital preservation workflow, recording audit information about each

transfer in to the digital archive. DPR uses Xena to perform digital record conversions

Checksum Checker monitors the contents of the National Archives' digital archive for data loss or corruption.

Praktické projekty

Page 46: LTP Pilot - Archivematica Projekt v CR

DNB.de ◦ velmi záhy DIAS, pak „přešlapuje“ ◦ NESTOR, řada EU projektů ◦ Kolibri http://kopal.langzeitarchivierung.de/index_koLibRI◦ DP4LIB http://dp4lib.langzeitarchivierung.de /

KB NL – Dias 2003, nový LTP 2012 – centrum výzkumu BL

◦ Aktivní v řadě EU projektů (SCAPE, APARSEN, SPRUCE, LIFE, PLANETS, preserv.)

◦ Národní britské aktivity (DCC, DPC, v rámci JISC) NL NZ – Rosetta (Kronos) – 2008 1. verze Norská NK (masová digitalizace) Dánská NK (archivace broadcastingu atd.) BNF.fr (SPAR – Fedora Commons + iRods + Athos Origin) Německé knihovny (SLUB, TIB, ETH, BSB) Rosetta

Praktické projekty

Page 47: LTP Pilot - Archivematica Projekt v CR

Open Planets Foundation http://www.openplanetsfoundation.org/

Planets suite ◦ Preservation Planning Tool, Plato (http://

www.ifs.tuwien.ac.at/dp/plato/intro.html )◦ Planets Testbed◦ Interoperability Framework

Ohniska výzkumu

Page 48: LTP Pilot - Archivematica Projekt v CR

SCAPE

◦ Repository API Report API Management API Data connector API (search,

access, modify files) Platform

◦ Preservation WATCH Scout

◦ PLATO – preservation planning Definovat požadavky,

zhodnotit alternativy a výsledky, definovat preservation plan

Ohniska výzkumu

Page 50: LTP Pilot - Archivematica Projekt v CR

SNIA – SIRF: Self-contained Information Retention Format

◦Logical container of „storage container“◦Logical and physical storage considered as a unit

CDMI –◦ standard interoperabílniho formátu pro přesun dat a metadat mezi poskytovateli cloudu

Ohniska výzkumu - IBM Haifa

SIRF obsahuje:

•Magic object – identifikace a verzovani•Preservation objects (to co se nemění a je předmětem ochrany)•Catalog (průběžně se upravují, obsahuje metadata, která mají zajistit budoucí přenositelnost preservation objects bez potřeby vnějších funkcí)

Page 51: LTP Pilot - Archivematica Projekt v CR

Archivace průmyslových informací (Product and Manufacturing Information (PMI) Working Group)◦ http://www.lotar-international.org/◦ ISO 10303 (automotive, 3d modeling, CAD)

Archivace DICOM/PACs z oblasti medical imagining

Právní data, geologická data, nuclear waste

LTP v průmyslu, medicíně a jinde

Page 52: LTP Pilot - Archivematica Projekt v CR

iPres (2004-), Archiving, ANADP, PASIG (http://www.preservationandarchivingsig.org)

APA, Personal digital archiving, akce IIPC Časopisy (IJDC, d-lib, Code4lib, Ariadne…) Školení

◦ http://www.dptp.org/◦ TIMBUS Digital Preservation Advanced Practitioner

Training

Informační zdroje

Page 53: LTP Pilot - Archivematica Projekt v CR

Formátové knihovny (PRONOM, UDFR, Loc.gov) Seznamy nástrojů

◦ Library of Congress http://www.loc.gov/standards/mets/mets-tools.htmlhttp://www.loc.gov/standards/premis/tools.htmlOrbeon: http://www.orbeon.com/OPF Knowledge Base:http://wiki.opf-labs.org/display/KB/HomeOPF Tools registry: http://wiki.opf-labs.org/display/TR/Digital+Preservation+Tool+RegistryPresto Prime, Tools: https://prestocentre.org/library/toolsLibrary of Congress Tool Registry: http://www.digitalpreservation.gov/tools/FileFormat.Info Registry: http://www.fileformat.info/index.htmCOPTR: http://coptr.digipres.org/Main_PageDCH-RP project registry (planned) - see report pages 30-42 http://www.dch-rp.eu/getFile.php?id=166

Příklady policies atd.

Nástroje a globální infrastruktura

Page 54: LTP Pilot - Archivematica Projekt v CR

„Digitální dokumenty je na rozdíl od mikrofilmu, mnohem obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové perspektivě, což je dáno vývojem v oblasti výpočetní techniky a … inovačními cykly přinášejícími zásadní změny v technické podpoře platforem, formátů…“

POLIŠENSKÝ, Jiří. 2002. Konsorcium pro zpřístupňování a archivaci dokumentů pro výzkum a vývoj v České republice. In: CASLIN 2002. Ochrana a sprístupňovanie dokumentov: nové trendy: Zborník z konferencie, konanej 23.- 27. júna 2000 v Pribyline. Martin: Slovenská národná knižnica, 2002, s. 57-63.

VISK – Mikrofilmování do roku 2012 Data archivuje NK – do roku 2012

Jan Hutař, Marek Melichar: České paměřové instituce a digitální data - historický exkurz, současný stav a předpokládaný vývoj 

České knihovny a DP

Page 55: LTP Pilot - Archivematica Projekt v CR

DPE LiWA CASPAR (Langweilův model) IIPC SCAPE (VUT) NDK NDA CDK

České knihovny a DP

Page 56: LTP Pilot - Archivematica Projekt v CR

Nové role vědeckých knihoven

2011: REPORT ON INTEGRATION OF DATA AND PUBLICATIONS (KB.NL, BL, DNB, LIBER, STM Publishers)

http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODE-ReportOnIntegrationOfDataAndPublications-1_1.pdf

2013: LERU Roadmap for science datahttp://www.leru.org/files/publications/AP14_LERU_Roadmap_for_Research_data_final.pdf

Horizon 2020 – větší zapojení vědeckých knihoven do výzkumné infrastruktury, posílení dostupnosti dat paměťových institucí

http://ec.europa.eu/research/horizon2020/pdf/proposals/com%282011%29_811_final.pdfhttp://ec.europa.eu/dgs/connect/en/content/mission-and-prioritieshttp://ec.europa.eu/dgs/connect/en/content/online-accessibility-and-digital-preservation-europes-cultural-heritage

Trendy – Vědecká data

Page 57: LTP Pilot - Archivematica Projekt v CR

Availability Findability Interpretability Re-usability Citability Curation Preservation

Trendy – Vědecká data

ODE REPORT ON INTEGRATION OF DATA AND PUBLICATIONS - http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODE-ReportOnIntegrationOfDataAndPublications-1_1.pdf

Page 58: LTP Pilot - Archivematica Projekt v CR

Small sciences vs Big sciences

Liší se v typech dat, způsobech zpracování dat, rychlosti publikačního cyklu, rychlosti citování atd.

Big sciences – APARSEN, společně s EUDAT, SCIDIP-ES, DPHEP

Trendy – Vědecká data

Page 59: LTP Pilot - Archivematica Projekt v CR

Data z online vzdělávacích systémů – trendy:

3D Printing MOOCs Big Data Digital Textbooks Gamification The Flipped Classroom Mobile Learning

◦ Co z toho archivovat?

Trendy – Vzdělávací data

Page 60: LTP Pilot - Archivematica Projekt v CR

Galleries, Libraries, Archives, Muzeums◦ Větší integrace knihoven do heritages◦ Jednotné systémy pro správu metadat a autorit◦ Co všechno ještě bude v knihovním katalogu? ◦ Co všechno bude muset ještě knihovna

archivovat?

Příklad využítí Archivematiky v muzeu v Berlíně: urn:nbn:de:0297-zib-43020

Trendy – větší integrace GLAM

Page 61: LTP Pilot - Archivematica Projekt v CR

Řeší tu jednodušší třetinu (technologie) – nikoli organizaci a zdroje!

„Důvěryhodná“ ve smyslu ISO norem nemůže být žádná demo instalace – důvěryhodnost se posuzuje v kontextu konkrétní organizace

Normy připouští outrsourcování části činnosti jiné organizaci (CESNET jako poskytovatel OAIS funkcí „archival storage“ musí poskytnout dokumentaci)

LTP Pilot

Page 62: LTP Pilot - Archivematica Projekt v CR

Nezapomenout na potřebu bit replikace

Význam projektu pro MUNI – další krok by mělo být větší zapojení knihovny do archivace vědeckých dat (využít eu programů?)

LTP Pilot

Page 63: LTP Pilot - Archivematica Projekt v CR

Nezapomenout na řízení a strategické dokumenty - instituce, která není strategicky řízená nemůže provozovat LTP systém

V našich podmínkách se obvykle velmi podceňuje plánování - Instituce nemají: Mission statement Plány rozvoje Plány financování Plán řízení lidských zdrojů Ani collection plan apod.

LTP Pilot


Recommended