Kurz webové archivace II.

Post on 14-Feb-2017

231 views 0 download

transcript

Kurz webové archivace - archivace a zdroje

Barbora Rudišinová3. 3. 2016

Webarchiv

• http://webarchiv.cz

Autorský zákon

• archivace povolena tzv. “knihovní licencí” § 37 AZ:

„Do práva autorského nezasahuje knihovna, archiv, muzeum, galerie, škola, vysoká škola a jiné nevýdělečné školské a vzdělávací zařízení,

a) zhotoví-li rozmnoženinu díla, která neslouží k přímému nebo nepřímému hospodářskému nebo obchodnímu účelu, pro své archivní a konzervační potřeby“

Autorský zákon - zpřístupnění

• zpřístupnění archivních kopií je ale knihovní licencí limitováno:

“zpřístupňuje-li dílo, včetně zhotovení jeho rozmnoženiny nezbytné pro takové zpřístupnění, které je součástí jeho sbírek a jehož užití není předmětem prodejních nebo licenčních podmínek, ... , jednotlivcům ze strany veřejnosti prostřednictvím k tomu určených technických zařízení umístěných v jeho objektech, a to výhradně pro účely výzkumu nebo soukromého studia takových osob, a zamezí-li takovým osobám zhotovit rozmnoženinu díla”

Autorský zákon

Co z toho vyplývá?• můžeme vytvářet archivní kopie webových stránek

• nesmíme je zpřístupňovat mimo terminály v budově NK

Řešení

• povinný výtisk el. dokumentů - v ČR není (zahraniční, ale liší se, záleží na znění)

• spolupráce s vydavateli elektronických zdrojů (ČR, VB atd.) - získání souhlasu se zpřístupněním

Archivace v českém Webarchivu

3 typy sklizní:1.celoplošné sklizně2.tematické sbírky3.výběrová sbírka

Celoplošné sklizně

• cílem je vytvořit obraz “českého webu” v určitém čase• zdrojem je seznam webových adres s národní doménou .cz od CZ.NIC

• automatizované sklízení• alespoň 1x ročně• zabírají nejvíce místa• není sklizeno kompletně vše - omezení (5000 dotazů na doménu)

• přístupné pouze na terminálech v NK

Tematické sbírky

• k aktuálním událostem• např. volby, úmrtí Václava Havla, stavba nové budovy NTK

• manuální výběr zrojů kurátory• kompletní přístup jen na terminálech v NK

Výběrová sbírka

• výběrový vzorek webů s určitou hodnotou (historickou, kulturní, vědeckou atd.)

• zdroje manuálně vybírány kurátory nebo návrhy z ISSN a od uživatelů (formulář http://webarchiv.cz/cs/pridat-web) a poté hodnoceny

• snaha o zpřístupnění online - získání souhlasu s archivací od vydavatele

• rozdělení do předmětových kategorií dle metody konspektu

Přehled kategorií výběrové sbírky

Tvorba priorit pro předmětové kategorie

Příklad priorit

Příklad zdroje ve WA Adminu

Způsoby souhlasu se zpřístupněním

1.Smlouva• výhradní udělení souhlasu pouze NK• založená na Obč. zákonníku• za obsah webu a aut. práva k němu odpovídá vydavatel

2.Licence Creative Commons• soubor licencí legálně upravující sdílení děl veřejností• možnost nastavit podmínky (vždy nutnost citace, možnost zákazu komerčního využití atd.)

• prakticky jen logo licence odkazující na plný text

Vyhledávání ve Webarchivu

Pomocí vyhledávacího pole:• URL adresa (jakýkoliv platný tvar nkp.cz, www.nkp.cz atd.)

• klíčová slova (hledá v názvech a anotacích)

Katalog stránek

Zobrazení v katalogu

Wayback

Kritéria zdrojů

• bohemikální dokument:• v českém jazyce• vydaný na území ČR• vydaný českým autorem• obsahově o ČR nebo Češích

• volně přístupné zdroje• převážně nekomerční povaha• unikátnost informací• aktuálnost a (dlouhodobá) informační hodnota• technické hledisko

Technické hledisko

• preferovány zdroje v běžných formátech• problematická archivace sociálních sítí, externích doplňků a aplikací (např. Google mapy), animace vytvořené programem Flash, vyhledávací pole, rozbalovací (drop-down) nabídky, některé prvky vytvořené v Javascriptu

• při podezření na problém - vhodná kontrola na https://archive.org/

Technické problémy

Kde hledat zdroje?

• Google

• Wikipedia

• stránky zastřešujících institucí a organizací

• registry a rejstříky státních nebo jiných subjektů

• odkazy na podobných stránkách

Jak ověřit téma zdroje?

Otázky?

barbora.rudisinova@nkp.cz