Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty na Cenu PARTSIP)

Post on 08-Jun-2015

909 views 1 download

description

Konference PARTSIP 2011

transcript

Česká digitální matematická knihovna

Miroslav Bartošek

Masarykova univerzitaÚstav výpočetní techniky

M.Bartošek, 2011 DML-CZ 2

Kdyby se někomu podařilo zničit knihovny a všechny knihy, o třicet let později by žádný zámečník neuměl ani utáhnout šroub.

Thomas Alva Edison

Hromada knih ještě není knihovna, disk plný digitálních dokumentů ještě není digitální knihovna.

Anonym

Motivace

M.Bartošek, 2011 DML-CZ 5

Co je DML-CZ

M.Bartošek, 2011 DML-CZ 6

Co je DML-CZ

1. Projekt pokročilá digitalizace

grant - Informační společnost, AV ČR

2005-2009

2. Digitální knihovna špičková česká matematická literatura

fulltexty+metadata - volně dostupné

30.000 článků, 320.000 stran

2010-trvale

M.Bartošek, 2011 DML-CZ 7

1.1 Projekt: cíle

1. zkoumání/vývoj technologií OCR matematiky nástroje pro tvorbu metadat – metadatový editor

2. digitalizace časopisy, monografie, sborníky článkově orientovaná národní DML

3. začlenění do světové WDML mezinárodní standardy interoperabilita

http://project.dml.cz

M.Bartošek, 2011 DML-CZ 8

1.2 Projekt: partneři

AV – Matematický ústav vedení, autorsko-právní, uživatelské požadavky

MFF UK matematika, metadata

AV – Knihovna digitalizace

MU – FI OCR + vyhledávání matematiky, podobnost

MU – ÚVT integrace, implementace digitální knihovny provoz a rozšiřování

M.Bartošek, 2011 DML-CZ 9

2.1 Knihovna: obsah

časopisy 12 titulů (11 českých, 1 slovenský) od počátku do současnosti moving wall (0-24 měsícu) 27.000 článků, 276.000 stran, 2.443 čísel

sborníky 6 vybraných konferenčních řad (Equadiff, …) 2.390 článků, 19.000 stran, 100 svazků

monografie kolekce prací Bernarda Bolzana vybrané monografie předních matematiků 653 článků/kapitol, 10.000 stran, 44 monografií

http://dml.cz- osobnosti

M.Bartošek, 2011 DML-CZ 11

2.2 Knihovna: materiály

tištěné dokumenty 19.století – 1990 předlohy pouze v tištěné podobě klasická digitalizace

retro-born-digital 1991 – 2007 předlohy v (částečně) digitální formě různé formáty - konverze

digital-online 2008 – automatizované přebírání nových čísel do DML-CZ

M.Bartošek, 2011 DML-CZ 12

2.3 Knihovna: nabízí

320.000 stran odborných textů od 10.000 autorů plné texty článků a kapitol ve formátu PDF metadata včetně bibliografických referencí propojení článků i referencí do recenzních DB

MathSciNet + Zentralblatt MATH

procházení podle rejstříků kolekce, názvy, autoři, MSC

jednoduché i pokročilé vyhledávání v metadatech / v plných textech

podobné články

DML-CZ workflow

stránky.tiff

skenování

EuDMLMR/Zbl

Tištěnýdokument

stránková MD

1

10

příprava

2sken

časopis.xml

stránky.tiff

úpravy obrázků

stránky.pdf

stránky.txt

popis

OCR3

ocr

digitalizov.dokument(stránky)

ArchivčasopisuTeX, ps

RedakcečasopisuTeX, pdf

5born-digital

6aktuální

číslo

Metadatovýeditor

konverze články.pdf

metadata

retro-born-digital číslo

články.pdf

metadata

export DMLCZ

born-digital číslo

MR/ZBL

metadataMR/Zbl

sklízenínormalizace

4

prolinkování

editormetadat

editorreferencí

mathcorpus

DSpaceDML-CZ

NUMDAM

JSTOR

články.pdf

metadata

struktura

digitální dokument

similarities

výpočet podobností

7

8

rozšířenímetadat

archiv

9

digitálníknihovna

archivace

export MD

end-users

11

statistiky

12

http://dml.cz

integrace

metadata MR/Zbl

články

editace

© DML-CZ, 2009

M.Bartošek, 2011 DML-CZ 14

3. DML-CZ workflow

1. Příprava materiálů2. Digitalizace3. OCR4. Referenční metadata (MathSciNet, Zbl MATH)

5. Retro-born-digital6. Aktuální čísla7. Integrace, tvorba metadat8. Podobné články9. Digitální knihovna10. Archivace11. Exporty metadat do EuDML, MR/ZBL12. Statistiky využívání (Google Analytics, log DSpace)

M.Bartošek, 2011 DML-CZ 15

4. Hlavní výstupy

digitální knihovna DML-CZ

nástroje použitelné v dalších projektech Metadatový editor nadstavba DSpace/Manakin

projekt FFdigi

M.Bartošek, 2011 DML-CZ 16

Digitální knihovna

ukázky

Děkuji za pozornost