Projekt OBÁLKYKNIH.cz
Jiří Nechvátal
Jihočeská vědecká knihovna v Českých Budějovicích
O projektu
Projekt Obálky knih.cz slouží k obohacení knihovních katalogů o další obsah, zejména náhledové obrázky obálek knih, skenované obsahy, anotace a hodnocení.
API služby využívá aktivně přes 160 registrovaných knihoven a stovky neregistrovaných uživatelů
O projektu
databáze aktuálně obsahuje
790 298 obálek
86 680 obsahů
českých a zahraničních publikací.
Technické řešení – stávající stav
Technické řešení – vývoj v JVKČB
Technické řešení – cílový stav
CBVK
MZK
CBVK
Změny ve fungování projektu nasazení tzv. frontend serverů tvořících redundantní
vrstvu, umístění v různých lokalitách
změny v samotném dotazovacím API – povinný parametr keywords
zrušení dříve povinného parametru permalinku
řízení přístupu - přístup k metadatům budou mít pouze registrované knihovny a knihovní systémy (na základě IP adresy či URL katalogu)
Aktuální změny 2014
vývoj a nasazení procesu aktualizace změn provedených na backendu směrem na všechny instance frontendu.
optimalizace procesu ukládání obálek skenovacím klientem, které v současnosti zabírají 80% velikosti databáze, ale nejsou poskytované veřejnosti.
úprava vyhledávaní na webu a API Obálkyknih.cz tak, aby to bylo umožněno i pomocí identifikátorů ČNB, OCLC, vlastního identifikátoru.
sběr a prezentace statistik skenovacího klienta
podpora skenovacího klienta - FAQ, konference
Plány 2014 nasazení nového řešení do ostrého provozu ve dvou různých
lokalitách (JVK a MZK), které zajistí dostupnost služby v případě výpadku jedné z lokalit.
replikace obsahů děl směrem z backendu na všechny instance frontendu
příprava metodických pokynů / manuálu pro knihovny a knihovní systémy
vynucení práva přístupu na frontendy – přebírání informací o registraci knihoven z backendu a nastavení procesu řízení práva přístupu
jednotné shromažďování logů návštěvnosti webu a API realizace API pro vkládání komentářů a hodnocení rozvoj dalších druhů služeb (plné texty z SK,K4, ukázky)
Projekt NKP 2014 ???
rozšíření o podporu obálek a obsahů vícesvazkových děl a periodik včetně rozšíření vkládacího a dotazovacího API
podpora a rozvoj skenovacího klienta - pokračování vývoje, zapracování podpory rozšířeného API pro identifikaci svazků a periodik, možnost vyhledání metadat podle dalších nastavitelných identifikátorů
OCR zpracování obsahů - obálkový server bude přes API poskytovat OCR-kované obsahy knihovním katalogům pro fulltextové zaindexování (momentálně je pouze ve formě exportu 1 velkého xml souboru). API varianta by měla obsahovat příkazy pro získání obsahu 1 záznamu, všech nových obsahů přidaných v období od-do
Stránky projektu
https://github.com/cbvk/obalkyknih/wiki
Vlastní skenování
Skenovací klient
http://obalkyknih.cz/obalkyknih-scanner/
Instalace
Administrátorská verze
Uživatelské verze
Registrace
http://obalkyknih.cz/signup
Nastavení
Pracujeme …
Pomožme si sami …
!!! Výsledky práce využijí všichni !!!
Statistiky skenování
http://servis.obalkyknih.cz/stat/
Statistiky využití serveru
Statistiky skenovacího klienta
Počet odeslaných dokumentů 22 367
Počet uložených obálek (COVER) 18 403
Počet uložených stran obsahu (TOC) 24 354
15. 09. 2013 758.496 obálek22. 04. 2014 790.298 obálek
Nárůst 31 802 obálek - 77% přes skenovacího klienta
Statistiky skenovacího klienta
6 198 ABA001 Národní knihovna4 476 OLA001 Vědecká knihovna v Olomouci4 004 BOA001 Moravská zemská knihovnaXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX2 597 CBA001 Jihočeská vědecká knihovna1 366 ABA004 Slovanská knihovna1 087 CBD005 Teologická fakulta JCU 661 ABA007 Knihovna Akademie věd ČR 437 ABA008 Národní lékařská knihovna 364 LIA001 Krajská vědecká knihovna Liberec 221 ABA006 Vysoká škola ekonomická 180 KLG001 Středočeská vědecká knihovna v Kladně 171 OSA001 Moravskoslezská vědecká knihovna v Ostravě 84 ZLG001 Krajská knihovna Františka Bartoše, Zlín 74 HBG001 Krajská knihovna Vysočiny, Havlíčkův Brod 36 ABA010 Národní muzeum 32 BOD018 Masarykova univerzita - Fakulta informatiky, Brno 10 ULD001 Univerzita J.E.Purkyně - Pedagogická fakulta, Ústí nad Labem 5 HKA001 Studijní a vědecká knihovna v Hradci Králové 4 ABG521 Všenorská knihovna a Informační centrum Berounka 4 TAG001 Městská knihovna Tábor 1 BOD004 Masarykova univerzita - Přírodovědecká fakulta, Brno
Statistiky skenovacího klienta 03-2014
Počet odeslaných dokumentů 4 671
Počet uložených obálek (COVER) 4 048
Počet uložených stran obsahu (TOC) 6 139
Statistiky skenovacího klienta 03-2014 1 255 CBA001 Jihočeská vědecká knihovna
681 ABA001 Národní knihovna 617 OLA001 Vědecká knihovna v OlomouciXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 473 BOA001 Moravská zemská knihovna 467 ABA004 Slovanská knihovna 315 CBD005 Teologická fakulta JCU 107 ABA007 Knihovna Akademie věd ČR 106 LIA001 Krajská vědecká knihovna v Liberci 92 KLG001 Středočeská vědecká knihovna v Kladně 56 ABA008 Národní lékařská knihovna 24 OSA001 Moravskoslezská vědecká knihovna v Ostravě 23 ZLG001 Krajská knihovna Františka Bartoše, Zlín 21 BOD018 Masarykova univerzita - Fakulta informatiky, Brno 19 ABA010 Národní muzeum 16 ABA006 Vysoká škola ekonomická 9 HBG001 Krajská knihovna Vysočiny, Havlíčkův Brod 2 TAG001 Městská knihovna Tábor
Statistiky využití serveru
52 000 000 požadavků/měsíc
ve špičce 45 požadavků/vteřinu
200-250 nahraných titulů /den
3 Mbit/s datový tok
4 GB dat obálek/den
FAQ – skenovací klient
Jak funguje skenovací klient? Mám skenovat ke každé knize i obsah? Jaké identifikátory skenovací klient používá? Co je to vlastní identifikátor Kdy použít vlastní identifikátor? Mohu zjistit, kolik naše knihovna naskenovala
dokumentů?
…připravuje se – do 1.5. 2014
Dotazy ???
Děkuji za pozornost
Projekt OBÁLKYKNIH.cz
Jiří Nechvátal
Jihočeská vědecká knihovna v Českých Budějovicích