Date post: | 05-Apr-2017 |
Category: |
Technology |
Upload: | dp-blog-cz |
View: | 319 times |
Download: | 2 times |
DIGITÁLNÍ SBÍRKY A JEJICH DLOUHODOBÉ UCHOVÁVÁNÍ V NÁRODNÍ KNIHOVNĚ AUSTRÁLIE
LIBOR COUFAL
Digitální uchovávání „vzhůru nohama“
Průkopnická léta• 80. léta – „elektronické“ materiály na PN• 1994 – pozice pro „elektronické uchovávání“• 1996 – Pandora • 1997/98 – IT projekt „Digital Services“– digitální úložiště (DOSS)– DCM
Průkopnická léta• 2006/7 – Australian Partnership for
Sustainable repositories– Automated Obsolescence Notification System
(AONS)• 2007/8 – interní projekty– Mediapedia, Prometheus, Configulator
Průkopnická léta• 2008 – interní hodnocení (DRAMBORA, TRAC)• 2009 – profilace digitálních fondů• 2010/11 – „preservation intents“• 2012 – DLIR• 2016 – Preservica v provozu
Strategický plán 2015 - 19• Strategické cíle, priority a implementační rámec• Typy digitálních materiálů:
– Původní digitální• Publikovaný• Nepublikovaný
– Digitalizovaný• Interně• Externě
– Původní digitální vytvořený• Interně/na zakázku
– Sklizený webový materiál
Hodnocení rizik• Faktory– Jedinečnost • Existuje ve fyzické podobě?
– Charakteristiky• Jak/kým vytvořen?• Standardy, kontrola kvality?• Uniformita
TYPECHARACTERISTICS
Input – source item Output – digital item Preservation risk
Born-digital –
Internally-created or
commissioned
No physical equivalent Created to a defined standard
Agreed preservation format
Uniform format(s)
Quality assurance/control in place
Low – based on homogeneity and
control over creation
Born-digital – Published No physical equivalent (often)
Creation outside NLA control
Various file formats (not necessarily
‘well-formed’)
Some container formats
Possibly complex objects
Quality assurance/control uncertain
Content may exist in multiple
operating system versions
Prone to Technological Protection
Measures (TPMs) such as encryption
or password protection to inhibit
access and copying
Preservation may be mandated by
legislation (e.g. legal deposit) or
there may be a reputational risk if
we do not fulfil our preservation
commitment
Possibly high - based on
heterogeneity and lack of control
over creation
Expected or known issues with
specific file formats (e.g.
RealMedia)
Preservation action likely to be
required sooner in the lifecycle. No
business decision has been taken
on ‘normalising’ formats on ingest
(i.e. ‘format shift’).
Hodnocení rizikRiziko pro digitální uchování Typ materiálu
Vysoké Původní digitální – publikovanýPůvodní digitální – nepublikovanýPůvodní digitální – webový materiál
Nízké Původní digitální – vytvořený interně/na zakázkuDigitalizovaný – interněDigitalizovaný - externě
Strategický cíl 1• Uložit na řízeném úložišti a zajistit uchování na
úrovni bitů– Všechny digitální objekty uloženy na úložišti– Mnohonásobné kopie– Řízení úložiště pro případ havárie– Pravidelná migrace úložných médií– Zabezpečení úložiště– Procesy pro pravidelnou verifikaci kontrolních součtů
Strategický cíl 2• Správa digitálních objektů v LTP systému– „Ingest“ do produkční verze LTP– Pravidelná analýza a vykazování složení a stavu
digitálních sbírek– Monitorování rizik pro dlouhodobé uchovávání– Logická ochrana sbírek (např. formátová migrace)
podle potřeby
Strategický cíl 3• Digitální uchovávání je robustní, spolehlivé a
škálovatelné– Integrace LTP s ostatními knihovními systémy– Digitální uchovávání jako součást běžných business
procesů, po boku ostatních funkcí pro správu fondů
Strategická priorita 1• Původní digitální materiál– Publikovaný– Nepublikovaný– Pandora
• Plně implementovat strategické cíle 1 (bitová ochrana) + 2 (logická ochrana)
Strategická priorita 2• Zvukový materiál– Digitalizovaný (interně + externě)– Původní digitální
• Plná implementace strategického cíle 1 (bitová ochrana)
• Ingest do LTP, zbytek logické ochrany po roce 2019
Strategická priorita 3• Digitalizovaný materiál, původní digitální
vytvořený interně, webový materiál (mimo Pandory)
• Plná bitová ochrana (Priorita 1)• Správa v DCM• Logická ochrana mimo LTP (pokud potřeba)– Přehodnocení po 2019
Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2
Ebooks and E-serialsMusic ScoresMapsPhysical CarriersPANDORASimple UnpublishedComplex Unpublished
Monthly Activity ReportsAnnual QA AuditAnnual Report
Monitor Level of SupportMonitor Preservation RisksFormat Obsolescence WatchCollection Health ReportsPreservation Treatments
Not Started In Progress Delayed BAU
Bit-level Preservation
Maintain Long-term Usability
Digital Preservation Road Map 2016 - 2019
2016/17 2017/18 2018/19
Ingest into Preservica
Bitová ochrana
Policy on bit-level preservation of digital collection material • Redundance a diverzifikace– Nejméně 3 kopie– Nejméně 2 typy úložných médií– Nejméně jedna kopie v jiné lokalitě
Bitová ochrana• Kontrola integrity– Všechny soubory musí mít
• Kontrolní součet• Časové razítko vytvoření součtu
– Kontrolní součty musí být chráněny proti• Ztrátě• Poškození• Úmyslné změně
– Integrita všech souborů musí být pravidelně kontrolována
Bitová ochrana• Audit– Měsíční výkazy o aktivitě (IT, kontola DiP)
• Počet nových souborů a kontrolních součtů• Počet zkontrolovaných souborů a výsledky• Podniklé kroky v případě nesrovnalostí
– Roční audit na reprezentativním vzorku (DiP za asistence IT)– Roční zpráva (DiP, pro CSG)
• Souhrn aktivit v průběhu roku• Výsledky ročního audit
Preservica• Integrace se systémem eDeposit• Ingest plně automatizován
– Extrakce metadat a souborů přes API– Vytvoření SIP
• Hierarchie• Mapování metadat do XIP + DC• Použití původního kontrolního součtu
– Vyexportování SIP na síťový disk monitorovaný Preservicou• 1x týdně, zpoždění 3 měsíce• Flexibilní, konfigurovatelný rámec
Preservica• Funkční
– e-knihy, e-seriály, e-hudebniny• Připravuje se
– Synchronizace po ingestu (duben/květen 2017)– e-mapy (květen/červen 2017)– Digitální archivy (květen/červen 2017)
• Integrace s ArchivesSpace– Publikace na pevných nosičích (červenec 2017)– Pandora (červen 2018)
• Integrace s Pandas
Logická ochrana• Neidentifikované formáty– Vysoké riziko akce
• Nejednoznačně/nesprávně identifikované formáty– Potenciálně vysoké riziko akce
• (Interní) podpora pro souborové formáty– Schopnost „zobrazit“ soubory v daném formátu
Podpora souborových formátů• Světově unikátní empirický výzkum
– Mapování podpory formátů v SW aplikacích– Empirické testování kvality
• Hlavní součást znalostní báze NLA • Od 2012/13, 1 pracovník (60 – 70 % úvazku)• > 12 tis. Záznamů• Implementace
– Pracovní verze Excel– Import dat do graph DB
Podpora souborových formátů• Proces– Prioritizace formátů podle typu• (Pravděpodobnost) zastoupení ve fondu
– Výzkum a dokumentace formátu– Výběr a dokumentace aplikací– Mapování podpory formátů v dané aplikaci– Testování kvality podpory
Podpora souborových formátů• Využití– Obsolescence Watch– Collection Health Report– Indikace migračních možností
• Data budou zveřejněna
Certifikace# Rok Proces
1 2018/19 Samo-hodnocení podle Data Seal of Approval
2 2018/19 Získání Data Seal of Approval
3 2022/23 Samo-hodnocení podle ISO 16363
4 2023/24 Úpravy na základě samo-hodnocení
5 2025/26 Akreditace