Elektronické publikováníwiki.cs.vsb.cz/images/d/d4/Elpub.pdf · Formátování textu Dnes asi...

Post on 21-Jun-2020

9 views 0 download

transcript

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Elektronické publikování

Mgr. Jiří Dvorský, Ph.D.

Katedra informatikyFEI VŠB-TU Ostrava

30. listopadu 2006

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Formátování textu

Dnes asi nejběžnější počítačová aplikace.1 text se zadá do počítače,2 vstupní text se zformátuje,3 naformátovaný text se zobrazí na monitoru,4 naformátovaný text se vytiskne.

Dva přístupy:

WYSIWYG editory – fáze splývají dohromady,

formátovací programy – fáze odděleny, značkovací jazyk.

Otázka znovupoužití a více cílových formátů.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Publikační nástroje

Proprietární formátyMS WordMS PowerPoint

Nezávislé/rozšířené standardyTEX / LATEX / pdfTEXXML - XHTML, DocBookPDFPostScript

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Proprietární nástroje

Výhodyobvykle s uživatelsky přívětivým prostředím,integrace s operačním systémem.

Nevýhodynekompatibilita s jinými nástroji,problémy s přenositelnostmi mezi verzemi,závislost na operačním systému.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Microsoft Word

de facto standard,

aktuální verze označována jako 2003,

je již hotova verze 2007,

běžná kancelářská práce,

vkládání obrázků – většinou rastrové formáty (jpg, bmp atd.),

propojení s dalšími kancelářskými aplikacemi – Excel, Access,

makra.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Problémy s Wordem – nekancelářské použití

nekompatibilita s dávnými verzemi (čitelnost diplomkynapsané ve Wordu 6????),

kódování češtiny (dnes již vyřešeno),

vložené objekty, např. Equation,

údržba automaticky vkládaných částí textu.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Nezávislé standardy

Nevýhodyproti komerčním systémům vyžadují znalosti a určitou přípravu„navícÿ.

Výhodynení nutná investice do nástrojů,obvykle přenositelnost mezi verzemi,nezávislost na operačním systému.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

(X)HTML

značkovací jazyk,

vhodný pro tvorbu prezentací na WWW, podpora kaskádovýchstylů, hypertextu,

občasná nekompatibilita mezi prohlížeči,

obtížná konverze do knižní podoby (např. neexistencestránek).

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

PostScript – PS

standardní formát pro tisk,

nezávislost na operačním systému,

komunikační jazyk pro tiskárny,

vektorová grafika, RIP,

vhodný pro složitou grafiku,

prostorově náročný

prohlížeč – GhostView (zdarma)

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Portable Document Format – PDF

prezentační formát,

vychází z PS,

komprese dat, ochrana proti modifikaci, tisku, kopírování,

hypertext,

formuláře,

prohlížeč – Adobe Acrobat Viewer (zdarma)

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

TEX/LATEX/pdfTEX

TEX značkovaní jazyk, Donald E. Knuth, 1984

LATEX značkovaní jazyk vyšší úrovně, Leslie Lamport, 1985

pdfTEX/pdfLATEX, výstup přímo do PDF

vhodný pro komplikovanou sazbu, včetně matematiky

výstup do PS, PDF

možnost konverze do HTML,

pdfTEX– možnost sazby hypertextových dokumentů

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Výhody LATEXu – sazba knihy

perfektní sazba, plus neschopnost amatérů měnit parametry,

nezávislost na platformě,

výstup PS či PDF,

možnost použití vlastních maker.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

DocBook

vydavatelství O’Reily pro dokumentaci k programům,

jazyk pro sazbu dokumentů založený na XML,

podpora generování výstupu do HTML, PS i PDF,

možnost rozšiřování,

obtížná sazba matematiky,

výstup není zcela perfektní.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Použití v akademickém prostředí

odborné publikace,

bakalářské, diplomové a disertační práce,

skripta,

studijní opory,

tištěná i elektronická podoba,

dlouhá doba využití.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Speciální požadavky – sazba skript

sazba matematiky,

import zdrojových textů např. v Javě,

množství odkazů mezi částmi textu,

rejstřík,

citace na seznam literatury,

výstup pro osvit,

hypertextová verze

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Matematická sazba

© Petr Šaloun, ZPP-Elektronické publikování

Matematická sazba

© Petr Šaloun, ZPP-Elektronické publikování

Speciální požadavky(výuková opora programování)

• Rozvržení stránky,• naviga ní ikony a nové pojmy,• zvýrazn ní syntaxe a aktuálnost obsahu

výpis zdrojových kód ,• rejst ík,• výstup pro osvit.

© Petr Šaloun, ZPP-Elektronické publikování

Papírová kniha

© Petr Šaloun, ZPP-Elektronické publikování

Zrcadlový výstup

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Zrcadlový výstup

1 Úvod

Již několik let si stěžujeme na informační explozi, ale neuvědomujeme si, že sto-jíme teprve na jejím počátku. Odhad říká, že do roku 1975 bylo na světě publi-kováno asi padesát milionů knih. Problém, ale spočívá v rychlosti růstu: podleodhadu se množství informací na světě zdvojnásobuje každých dvacet měsíců.Tento zarážející údaj nemusí být zcela přesný, může však sloužit pro zdůraz-nění závažnosti situace, kterou všichni cítíme: informace se začínají vymykatkontrole. Z globálního hlediska může být zajímavé podívat se, jak množstvíinformací rostlo v minulosti a porovnat tento růst s dnešní situací. Dále mů-žeme zkoumat, jak se lidé vyrovnávají s informační explozí. Dokumentografickéinformační systémy (DIS) se zdají být velmi důležitou a obecně použitelnoustrategií k udržení orientace v éře informací.

2 Dokumentografické informační systémy

Dokumentografické informační systémy (DIS) [1, 17] představují třídu progra-mových nástrojů, určených pro zpracování, úschovu a výběr dat, kterými jsoutexty1. K DIS přistupuje uživatel, který má potřebu získat z tohoto systémuinformaci nutnou pro řešení jeho problému. Takovou informaci nazýváme re-levantní. Pochopitelně, různé dokumenty mohou uživatele uspokojit v různémíře. Proto mluvíme také o míře relevance dokumentu.Při vyhledávání informace v DIS uživatel systému zadává svůj požadavek,

dotaz, a očekává výsledek ve formě množiny dokumentů, které systém vybírájako odpovídající požadavku uživatele, jako splňující jeho dotaz. Uživatel kladedotazy pomocí nějakého dotazovacího jazyka, přičemž je podstatná nejen lo-gická struktura dotazu, ale i termy, které uživatel při formulaci svého dotazupoužije. Pod pojmem term budeme chápat jistý vzorek textu, nejčastěji jednoslovo. Problémem, typickým pro tento druh úloh, je, že uživatel často nevíjak vhodně formalizovat svůj – více či méně neurčitý – požadavek (a to i přiznalosti daného problému).Obecným požadavkem, kladeným na DIS, je poskytnout uživateli systému

relevantní dokumenty (tj. ty, které ho zajímají), a to pokud možno všechny(které jsou v systému k dispozici), a právě jen ty (relevantní). Algoritmusrealizující výběr relevantních dokumentů předpokládá vhodné předzpracovánívstupních informací o dokumentech a uložení do vhodných datových struktur.Základní otázky předzpracování a výběru informace lze formulovat takto:

1. Jak z dokumentů vybrat „to podstatnéÿ pro jejich identifikaci?

2. Jaké datové struktury zvolit pro reprezentaci dokumentů?1V anglicky psané literatuře se tyto systémy nazývají fulltext systems, fulltextové nebo plnotextové systémy.

1

1Úvod

Jižněkolikletsistěžujemenainformačníexplozi,aleneuvědomujemesi,žesto-jímeteprvenajejímpočátku.Odhadříká,žedoroku1975bylonasvětěpubli-kovánoasipadesátmilionůknih.Problém,alespočívávrychlostirůstu:podleodhadusemnožstvíinformacínasvětězdvojnásobujekaždýchdvacetměsíců.Tentozarážejícíúdajnemusíbýtzcelapřesný,můževšaksloužitprozdůraz-něnízávažnostisituace,kterouvšichnicítíme:informacesezačínajívymykatkontrole.Zglobálníhohlediskamůžebýtzajímavépodívatse,jakmnožstvíinformacírostlovminulostiaporovnattentorůstsdnešnísituací.Dálemů-žemezkoumat,jakselidévyrovnávajísinformačníexplozí.Dokumentografickéinformačnísystémy(DIS)sezdajíbýtvelmidůležitouaobecněpoužitelnoustrategiíkudrženíorientacevéřeinformací.

2Dokumentografickéinformačnísystémy

Dokumentografickéinformačnísystémy(DIS)[1,17]představujítříduprogra-movýchnástrojů,určenýchprozpracování,úschovuavýběrdat,kterýmijsoutexty1.KDISpřistupujeuživatel,kterýmápotřebuzískatztohotosystémuinformacinutnouprořešeníjehoproblému.Takovouinformacinazývámere-levantní.Pochopitelně,různédokumentymohouuživateleuspokojitvrůznémíře.Protomluvímetakéomířerelevancedokumentu.

PřivyhledáváníinformacevDISuživatelsystémuzadávásvůjpožadavek,dotaz,aočekávávýsledekveforměmnožinydokumentů,kterésystémvybírájakoodpovídajícípožadavkuuživatele,jakosplňujícíjehodotaz.Uživatelkladedotazypomocínějakéhodotazovacíhojazyka,přičemžjepodstatnánejenlo-gickástrukturadotazu,aleitermy,kteréuživatelpřiformulacisvéhodotazupoužije.Podpojmemtermbudemechápatjistývzorektextu,nejčastějijednoslovo.Problémem,typickýmprotentodruhúloh,je,žeuživatelčastonevíjakvhodněformalizovatsvůj–vícečiméněneurčitý–požadavek(atoipřiznalostidanéhoproblému).

Obecnýmpožadavkem,kladenýmnaDIS,jeposkytnoutuživatelisystémurelevantnídokumenty(tj.ty,kteréhozajímají),atopokudmožnovšechny(kteréjsouvsystémukdispozici),aprávějenty(relevantní).Algoritmusrealizujícívýběrrelevantníchdokumentůpředpokládávhodnépředzpracovánívstupníchinformacíodokumentechauloženídovhodnýchdatovýchstruktur.Základníotázkypředzpracováníavýběruinformacelzeformulovattakto:

1.Jakzdokumentůvybrat„topodstatnéÿprojejichidentifikaci?

2.Jakédatovéstrukturyzvolitproreprezentacidokumentů?1Vanglickypsanéliteratuřesetytosystémynazývajífulltextsystems,fulltextovéneboplnotextovésystémy.

1

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Sazba zdrojových kódů

načtení přímo z kompilovaných souborů,

oddělení formy od obsahu,

zvýraznění syntaxe.

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Sazba zdrojových kódů – ukázka

public class Hello{// tohle je fakt mainpublic static void main(String [] args){System.out. println (”Hello world”);

}}

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Software pro LATEX

distribuce TeXLive 2005http://ftp.cstug.cz/pub/tex/./CTAN/systems/

texlive/Images/texlive2005-inst-20051102.iso.zip

popis instalace a další informace na www.cs.vsb.cz/dvorsky

archiv CTAN a CSTUGwww.cstug.cz

editor TeXnicCenterwww.toolscenter.org

prohlížeč PostScriptu GhostViewsoftwarový RIP GhostScripthttp://www.cs.wisc.edu/~ghost/

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Literatura k LATEXu

Helmut Kopka: Patrick W. Daly: LaTeX kompletní průvodce,Computer Press, Brno 2004, ISBN 80-722-6973-9

Jiří Rybička: LATEX pro začátečníky, 2. vydání, Konvoj, Brno1998, ISBN 80-85615-77-0

doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun

Elektronické publikování

© Petr Šaloun, ZPP-Elektronické publikování

Základní pojmy

• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.

• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.

• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.

© Petr Šaloun, ZPP-Elektronické publikování

B žné systémy

• Snaha o strukturní zna ky – obsahuje každý systém.

• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady

sou ástí distribucí.• Word – využití znakových a

odstavcových styl .

© Petr Šaloun, ZPP-Elektronické publikování

Publika ní nástroje

• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu

• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript

Závěr

Oddělit obsah od formy.

Dodržovat jednotný styl v rámci publikace.

V jednoduchosti je síla.