Komprese obrazu

Post on 06-Jan-2016

60 views 0 download

description

Komprese obrazu. Adolf Knoll Národní knihovna České republiky. Obecná schémata pro aplikaci komprese. Schémata jsou přizpůsobena charakteru reprezentovaných objektů: Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obraz Smíšený dokument (obě výše uvedené komponenty). Trendy. - PowerPoint PPT Presentation

transcript

Komprese obrazuKomprese obrazuAdolf KnollAdolf Knoll

Národní knihovna České republikyNárodní knihovna České republiky

Obecná schémata pro aplikaci Obecná schémata pro aplikaci kompresekomprese

Schémata jsou přizpůsobena charakteru Schémata jsou přizpůsobena charakteru reprezentovaných objektů:reprezentovaných objektů:

Bitonální obraz (1-bit, černobílý)Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obrazBarevný fotorealistický obraz Smíšený dokument (obě výše uvedené Smíšený dokument (obě výše uvedené

komponenty)komponenty)

TrendyTrendy

BitonálníBitonální od CCITT Fax Gr. 3 a 4 k variantám JBIG od CCITT Fax Gr. 3 a 4 k variantám JBIG

FotorealistickýFotorealistický Bezeztrátová komprese: PNG, TIFF/LZWBezeztrátová komprese: PNG, TIFF/LZW Ztrátová: od JPEG DCT k Ztrátová: od JPEG DCT k waveletwavelet

Smíšený dokumentSmíšený dokument Aplikace obého (Mixed Raster Content – Aplikace obého (Mixed Raster Content –

Smíšený rastrový obsah – obvykle vertikálně)Smíšený rastrový obsah – obvykle vertikálně)

Jak jsou kompresní schémata Jak jsou kompresní schémata zabudována do formátů?zabudována do formátů?

Snahou je obvykle ISO TIFF (v něm jsou možné Snahou je obvykle ISO TIFF (v něm jsou možné dokonce JPEG, LZW nebo PNG) – ale to dokonce JPEG, LZW nebo PNG) – ale to nestačí, protože mohou chybět nástroje na nestačí, protože mohou chybět nástroje na konverze a zobrazeníkonverze a zobrazení

Proto jsou používány jiné vhodnější formáty, Proto jsou používány jiné vhodnější formáty, například JPEG nebo PNGnapříklad JPEG nebo PNG

Z tohoto důvodu jsme též svědky velkého Z tohoto důvodu jsme též svědky velkého rozvoje v oblasti smíšených formátů, přestože rozvoje v oblasti smíšených formátů, přestože tyto si nekladou za cíl bát normou ISOtyto si nekladou za cíl bát normou ISO

Relevantní směryRelevantní směry

Bitonální obrazBitonální obraz JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech;

existují i odvozené aktivity (například bitonální kompresor v existují i odvozené aktivity (například bitonální kompresor v DjVu)DjVu)

Fotorealistický obrazFotorealistický obraz wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF, wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF,

IW44, SID, Imagepower IW, …)IW44, SID, Imagepower IW, …)

Smíšený obsahSmíšený obsah DjVu, LDF a další řešení LuraTech, v minulosti Imagepower DjVu, LDF a další řešení LuraTech, v minulosti Imagepower

MRCMRC

CíleCíle

Archivace obrazuArchivace obrazu

standardizovaný standardizovaný archivní formát (TIFF, archivní formát (TIFF, JPEG, PNG, …)JPEG, PNG, …)

Dodávání obrazůDodávání obrazů

Účinnější moderní Účinnější moderní formát (JB2, MrSID, formát (JB2, MrSID, DjVu, LDF, …)DjVu, LDF, …)

Jak se vyrovnat s těmito dvěma cíli?Klíč je v zaměření projektu.

Komprese…Komprese…

Předzpracování obrazuPředzpracování obrazu KompreseKomprese Zakódování do obrazového formátuZakódování do obrazového formátu Dekódování z formátuDekódování z formátu DekompreseDekomprese Zobrazení - TiskZobrazení - Tisk

Předzpracování bitonálního obrazu - IPředzpracování bitonálního obrazu - I

Účinná schémata jsou stavěna na možnostech aplikace Účinná schémata jsou stavěna na možnostech aplikace slovníků pixelových shlukůslovníků pixelových shluků::

NNaapř.př. t teext xt jjee obr obraaz, který můžz, který můžee být int být inteerprrpreetován jtován jaako vko veelké množství lké množství obrázků jednotlivých písmobrázků jednotlivých písmeen, zn, zaatím co optím co opaakovkovaaný výskyt kný výskyt kaaždého ždého písmpísmeennee můž můžee být vyjádř být vyjádřeen souřn souřaadnicdniceemimi (x,y) (x,y) aa odk odkaazzeem nm naa slovník, vslovník, vee kt kteerém jrém jee pouz pouzee j jeedndnaa r reeprpreezzeentntaaccee podobných písm podobných písmeenn (digit(digitaalizovánlizovánaa j jeen jn jeednou jdnou jaako bitmko bitmaappaa))

Tato metoda se nazývá Tato metoda se nazývá PATTERN MATCHINGPATTERN MATCHING (porovnávání se (porovnávání se vzorem), ale…vzorem), ale…

Předzpracování bitonálního obrazu - IIPředzpracování bitonálního obrazu - II

Naskenované texty obsahují však spoustu Naskenované texty obsahují však spoustu informačního šumu ve shlucích pixelů, informačního šumu ve shlucích pixelů, představujících jedno písmeno v textu, i mimo představujících jedno písmeno v textu, i mimo něně

Proto je vhodné omezit odchylky mezi identicky Proto je vhodné omezit odchylky mezi identicky identifikovatelnými shlukyidentifikovatelnými shluky vyhlazovánívyhlazování obracení pixelůobracení pixelů odstranění šumuodstranění šumu

Vyhlazování a obracení pixelůVyhlazování a obracení pixelů

Problémy v pattern matchingProblémy v pattern matching

Česká republika

Originál nebo sken nízké kvality + špatné zpracování

Soft pattern matchingSoft pattern matching

Lepší práce se slovníky; náhrada jen tam, kde je Lepší práce se slovníky; náhrada jen tam, kde je jistota, že nebude překročen kritický práh jistota, že nebude překročen kritický práh vedoucí k nežádoucí záměně shlukůvedoucí k nežádoucí záměně shluků

Kdyby to hrozilo, je uložena další malá bitmapaKdyby to hrozilo, je uložena další malá bitmapa

Vyladění těchto mechanismů je klíčem k Vyladění těchto mechanismů je klíčem k úspěšné aplikaci ztrátové komprese bitonálního úspěšné aplikaci ztrátové komprese bitonálního obrazu.obrazu.

Jak to zjistit…Jak to zjistit…

Knihovny mají dokumenty různé kvality vč. Knihovny mají dokumenty různé kvality vč. té velmi špatnété velmi špatné

Tyto dokumenty se obtížněji zpracovávají Tyto dokumenty se obtížněji zpracovávají než kvalitní vzorky prezentované než kvalitní vzorky prezentované softwarovými firmamisoftwarovými firmami

Je třeba testovat na typických materiálech, Je třeba testovat na typických materiálech, které chceme digitalizovat v knihovnáchkteré chceme digitalizovat v knihovnách

Bitonální kompreseBitonální komprese

BezeztrátováBezeztrátová (LZW, PNG, …, CCITT Fax (LZW, PNG, …, CCITT Fax Group 3 and 4, JB2, JBIG, JBIG2, Algo Group 3 and 4, JB2, JBIG, JBIG2, Algo Vision/Luratech Vision/Luratech

Moderní ztrátová schémataModerní ztrátová schémata:: ATAT&&T (Lizardtech) (JB2) – soft pattern T (Lizardtech) (JB2) – soft pattern

matchingmatching ImagePower Inc. JBIG2 (JB2) – v minulosti - ImagePower Inc. JBIG2 (JB2) – v minulosti -

pouze pattern matchingpouze pattern matching Summus Inc. (Lightning Strike), ... Summus Inc. (Lightning Strike), ...

GIF by byl mírněhorší než PNG

Květy české – 19. stoletíKvěty české – 19. století

Vliv kvality digitalizovaných originálů na Vliv kvality digitalizovaných originálů na výkonnost kompresních schématvýkonnost kompresních schémat

JB2JB2

Nejvýkonnějším kompresním schémat je Nejvýkonnějším kompresním schémat je JB2 z formátu DjVu (ATJB2 z formátu DjVu (AT&&T/Lizardtech). T/Lizardtech).

Umožňuje kompresi:Umožňuje kompresi: bezeztrátovoubezeztrátovou ztrátovouztrátovou agresivní – nastavitelná; zachovává vysokou agresivní – nastavitelná; zachovává vysokou

čitelnost originálučitelnost originálu Zkuste si komprimovat do DjVu on-line: Zkuste si komprimovat do DjVu on-line:

http://any2djvu.djvuzone.org/http://any2djvu.djvuzone.org/

JB2 jako komponenta formátu JB2 jako komponenta formátu DjVuDjVu

Více souborů může být sloučeno a uloženo v jednom (jako Více souborů může být sloučeno a uloženo v jednom (jako v PDF) – mají společný slovník, takže jejich celkový objem v PDF) – mají společný slovník, takže jejich celkový objem bude menší než součet objemů individuálních souborůbude menší než součet objemů individuálních souborů

Více souborů může být sloučeno virtuálně (na webu jsou Více souborů může být sloučeno virtuálně (na webu jsou volány dle potřeb uživatele)volány dle potřeb uživatele)

Více výhod: display, odkazy, OCR, … (DjVu plug-in)Více výhod: display, odkazy, OCR, … (DjVu plug-in)

Drahý kódující software + řada řešení zdarmaDrahý kódující software + řada řešení zdarma

Vzorky a résuméVzorky a résumé

Je třeba monitorovat a testovat nové Je třeba monitorovat a testovat nové způsoby zpracování obrazuzpůsoby zpracování obrazu

Nové přístupy mohou být velmi vhodné Nové přístupy mohou být velmi vhodné pro systémy dodávání dokumentůpro systémy dodávání dokumentů Obrazové serveryObrazové servery Naskenovaný obsahNaskenovaný obsah KlikněteKlikněte, pokud máte zájem si přečíst , pokud máte zájem si přečíst

speciální studiispeciální studii

Které formáty jsou vhodné pro bitonální Které formáty jsou vhodné pro bitonální obraz?obraz?

Jestliže chcete nejjednodušší řešení:Jestliže chcete nejjednodušší řešení: GIFGIF Jestliže chcete menší soubory, používejte PNGJestliže chcete menší soubory, používejte PNG Oba formáty jsou doporučeny pro webOba formáty jsou doporučeny pro web

Úspornějším řešením je však TIFF/CCITT Fax Úspornějším řešením je však TIFF/CCITT Fax Gr. 4Gr. 4

Používejte DjVu/JB2, pokud chcete velmi malé Používejte DjVu/JB2, pokud chcete velmi malé souborysoubory

ProblémyProblémy

Zavedený software pro práci s obrazem obvykle Zavedený software pro práci s obrazem obvykle neobsahuje podporu pro TIFF s kódováním neobsahuje podporu pro TIFF s kódováním CCITT Fax Gr. 4CCITT Fax Gr. 4

Na druhé straně je uvedený TIFF dobře Na druhé straně je uvedený TIFF dobře zobrazitelný elementárními nástroji Windowszobrazitelný elementárními nástroji Windows

GIF a PNG podporují též větší barevnou hloubku GIF a PNG podporují též větší barevnou hloubku (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se ukládání bitonálního obrazu ve větší barevné ukládání bitonálního obrazu ve větší barevné hloubcehloubce

DjVu – je vždy nezbytné mít na paměti výrobu a DjVu – je vždy nezbytné mít na paměti výrobu a příjem obrazu v tomto formátupříjem obrazu v tomto formátu

Ztrátová komprese – Ztrátová komprese – bitonální obrazbitonální obraz

Komprese barevného Komprese barevného obrazuobrazu

BezeztrátováBezeztrátová LZWLZW

GIF (pouze 8 bitů)GIF (pouze 8 bitů) TIFF (od verze 5.0)TIFF (od verze 5.0)

PNGPNG WaveletWavelet

JPEG2000 (JP2)JPEG2000 (JP2)

……

ZtrátováZtrátová DCT (JPEG) DCT (JPEG) Fraktální kompreseFraktální komprese WaveletWavelet

IW44IW44 LWF, WILWF, WI JPEG2000 (JP2)JPEG2000 (JP2) MrSID, …MrSID, …

V podstatě ale jde o střet klasických přístupů s technologií wavelet.

Barevný obrazBarevný obraz

DCT

wavelet

Účinnost komprese – bitonální obrazÚčinnost komprese – bitonální obraz

Účinnost komprese – barevný Účinnost komprese – barevný obrazobraz

Referenční vzorek

Jak aplikovat kompresiJak aplikovat kompresi??

Záleží na charakteru objektů v obraze:Záleží na charakteru objektů v obraze: Fotorealistický obrazFotorealistický obraz (JPEG, wavelet) (JPEG, wavelet) TText aext a jednoduchá černobílá grafika jednoduchá černobílá grafika (Fax (Fax

Group 4, JB2, …)Group 4, JB2, …) Barevná grafikyBarevná grafiky (probl (problém ztrátové komprese; ém ztrátové komprese;

je lépe bezeztrátově vje lépe bezeztrátově v PNG PNG nebonebo GIF – GIF – aplikační oblast vektorové grafikyaplikační oblast vektorové grafiky - SVG) - SVG)

Smíšený obsahSmíšený obsah ( (složená řešenísložená řešení: DjVu, LDF, : DjVu, LDF, …)…)

Nejúčinnější řešeníNejúčinnější řešení

Segmentace obrazu do dvou nebo více Segmentace obrazu do dvou nebo více skupin objektů:skupin objektů:

1.1. Objekty vhodné pro bitonální konverziObjekty vhodné pro bitonální konverzi

2.2. Objekty vhodné pro barevnou reprezentaciObjekty vhodné pro barevnou reprezentaci

Komprimovat každou skupinu zvlášť a Komprimovat každou skupinu zvlášť a potom je sloučit v jednom formátu.potom je sloučit v jednom formátu.

Horizontální segmentace/zónováníHorizontální segmentace/zónování

- TextText

- GrafikaGrafika

- FotografieFotografie

Imagepower Inc.Imagepower Inc.

Vertikální Vertikální segmentace/zónovánísegmentace/zónování

popředí popředí pozadípozadí

Lizardtech Inc. (ATLizardtech Inc. (AT&&TT))Luratech GmBHLuratech GmBH

DjVu, LDFDjVu, LDF

Bitonální versus složený obrazBitonální versus složený obraz

Šedá škálaŠedá škála

Další vlastnosti DjVuDalší vlastnosti DjVu

Více obrazů v jednom souboru:Více obrazů v jednom souboru:

jako TIFF, PDF, LDF, …, s použitím jako TIFF, PDF, LDF, …, s použitím společného slovníku pixelových shlukůspolečného slovníku pixelových shluků

virtuálně: stránky zůstanou na serveru a virtuálně: stránky zůstanou na serveru a dodána je jen ta strana, která je volánadodána je jen ta strana, která je volána

Příklad virtuálního DjVu

Obrazový soubor s několika Obrazový soubor s několika rozlišenímirozlišeními

MrSIDMrSID

V jednom souboru je (až 9) obrazů v V jednom souboru je (až 9) obrazů v různých rozlišeníchrůzných rozlišeních

Účinné ve spojení s obrazovým serveremÚčinné ve spojení s obrazovým serverem

Příklad MrSID (bez obrazového serveru)