komprese obrazu

40
Komprese obrazu Komprese obrazu Adolf Knoll Adolf Knoll Národní knihovna České Národní knihovna České republiky republiky

Upload: najwa

Post on 06-Jan-2016

64 views

Category:

Documents


0 download

DESCRIPTION

Komprese obrazu. Adolf Knoll Národní knihovna České republiky. Obecná schémata pro aplikaci komprese. Schémata jsou přizpůsobena charakteru reprezentovaných objektů: Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obraz Smíšený dokument (obě výše uvedené komponenty). Trendy. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Komprese obrazu

Komprese obrazuKomprese obrazuAdolf KnollAdolf Knoll

Národní knihovna České republikyNárodní knihovna České republiky

Page 2: Komprese obrazu

Obecná schémata pro aplikaci Obecná schémata pro aplikaci kompresekomprese

Schémata jsou přizpůsobena charakteru Schémata jsou přizpůsobena charakteru reprezentovaných objektů:reprezentovaných objektů:

Bitonální obraz (1-bit, černobílý)Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obrazBarevný fotorealistický obraz Smíšený dokument (obě výše uvedené Smíšený dokument (obě výše uvedené

komponenty)komponenty)

Page 3: Komprese obrazu
Page 4: Komprese obrazu
Page 5: Komprese obrazu
Page 6: Komprese obrazu

TrendyTrendy

BitonálníBitonální od CCITT Fax Gr. 3 a 4 k variantám JBIG od CCITT Fax Gr. 3 a 4 k variantám JBIG

FotorealistickýFotorealistický Bezeztrátová komprese: PNG, TIFF/LZWBezeztrátová komprese: PNG, TIFF/LZW Ztrátová: od JPEG DCT k Ztrátová: od JPEG DCT k waveletwavelet

Smíšený dokumentSmíšený dokument Aplikace obého (Mixed Raster Content – Aplikace obého (Mixed Raster Content –

Smíšený rastrový obsah – obvykle vertikálně)Smíšený rastrový obsah – obvykle vertikálně)

Page 7: Komprese obrazu

Jak jsou kompresní schémata Jak jsou kompresní schémata zabudována do formátů?zabudována do formátů?

Snahou je obvykle ISO TIFF (v něm jsou možné Snahou je obvykle ISO TIFF (v něm jsou možné dokonce JPEG, LZW nebo PNG) – ale to dokonce JPEG, LZW nebo PNG) – ale to nestačí, protože mohou chybět nástroje na nestačí, protože mohou chybět nástroje na konverze a zobrazeníkonverze a zobrazení

Proto jsou používány jiné vhodnější formáty, Proto jsou používány jiné vhodnější formáty, například JPEG nebo PNGnapříklad JPEG nebo PNG

Z tohoto důvodu jsme též svědky velkého Z tohoto důvodu jsme též svědky velkého rozvoje v oblasti smíšených formátů, přestože rozvoje v oblasti smíšených formátů, přestože tyto si nekladou za cíl bát normou ISOtyto si nekladou za cíl bát normou ISO

Page 8: Komprese obrazu

Relevantní směryRelevantní směry

Bitonální obrazBitonální obraz JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech;

existují i odvozené aktivity (například bitonální kompresor v existují i odvozené aktivity (například bitonální kompresor v DjVu)DjVu)

Fotorealistický obrazFotorealistický obraz wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF, wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF,

IW44, SID, Imagepower IW, …)IW44, SID, Imagepower IW, …)

Smíšený obsahSmíšený obsah DjVu, LDF a další řešení LuraTech, v minulosti Imagepower DjVu, LDF a další řešení LuraTech, v minulosti Imagepower

MRCMRC

Page 9: Komprese obrazu

CíleCíle

Archivace obrazuArchivace obrazu

standardizovaný standardizovaný archivní formát (TIFF, archivní formát (TIFF, JPEG, PNG, …)JPEG, PNG, …)

Dodávání obrazůDodávání obrazů

Účinnější moderní Účinnější moderní formát (JB2, MrSID, formát (JB2, MrSID, DjVu, LDF, …)DjVu, LDF, …)

Jak se vyrovnat s těmito dvěma cíli?Klíč je v zaměření projektu.

Page 10: Komprese obrazu

Komprese…Komprese…

Předzpracování obrazuPředzpracování obrazu KompreseKomprese Zakódování do obrazového formátuZakódování do obrazového formátu Dekódování z formátuDekódování z formátu DekompreseDekomprese Zobrazení - TiskZobrazení - Tisk

Page 11: Komprese obrazu

Předzpracování bitonálního obrazu - IPředzpracování bitonálního obrazu - I

Účinná schémata jsou stavěna na možnostech aplikace Účinná schémata jsou stavěna na možnostech aplikace slovníků pixelových shlukůslovníků pixelových shluků::

NNaapř.př. t teext xt jjee obr obraaz, který můžz, který můžee být int být inteerprrpreetován jtován jaako vko veelké množství lké množství obrázků jednotlivých písmobrázků jednotlivých písmeen, zn, zaatím co optím co opaakovkovaaný výskyt kný výskyt kaaždého ždého písmpísmeennee můž můžee být vyjádř být vyjádřeen souřn souřaadnicdniceemimi (x,y) (x,y) aa odk odkaazzeem nm naa slovník, vslovník, vee kt kteerém jrém jee pouz pouzee j jeedndnaa r reeprpreezzeentntaaccee podobných písm podobných písmeenn (digit(digitaalizovánlizovánaa j jeen jn jeednou jdnou jaako bitmko bitmaappaa))

Tato metoda se nazývá Tato metoda se nazývá PATTERN MATCHINGPATTERN MATCHING (porovnávání se (porovnávání se vzorem), ale…vzorem), ale…

Page 12: Komprese obrazu

Předzpracování bitonálního obrazu - IIPředzpracování bitonálního obrazu - II

Naskenované texty obsahují však spoustu Naskenované texty obsahují však spoustu informačního šumu ve shlucích pixelů, informačního šumu ve shlucích pixelů, představujících jedno písmeno v textu, i mimo představujících jedno písmeno v textu, i mimo něně

Proto je vhodné omezit odchylky mezi identicky Proto je vhodné omezit odchylky mezi identicky identifikovatelnými shlukyidentifikovatelnými shluky vyhlazovánívyhlazování obracení pixelůobracení pixelů odstranění šumuodstranění šumu

Page 13: Komprese obrazu

Vyhlazování a obracení pixelůVyhlazování a obracení pixelů

Page 14: Komprese obrazu

Problémy v pattern matchingProblémy v pattern matching

Česká republika

Originál nebo sken nízké kvality + špatné zpracování

Page 15: Komprese obrazu

Soft pattern matchingSoft pattern matching

Lepší práce se slovníky; náhrada jen tam, kde je Lepší práce se slovníky; náhrada jen tam, kde je jistota, že nebude překročen kritický práh jistota, že nebude překročen kritický práh vedoucí k nežádoucí záměně shlukůvedoucí k nežádoucí záměně shluků

Kdyby to hrozilo, je uložena další malá bitmapaKdyby to hrozilo, je uložena další malá bitmapa

Vyladění těchto mechanismů je klíčem k Vyladění těchto mechanismů je klíčem k úspěšné aplikaci ztrátové komprese bitonálního úspěšné aplikaci ztrátové komprese bitonálního obrazu.obrazu.

Page 16: Komprese obrazu

Jak to zjistit…Jak to zjistit…

Knihovny mají dokumenty různé kvality vč. Knihovny mají dokumenty různé kvality vč. té velmi špatnété velmi špatné

Tyto dokumenty se obtížněji zpracovávají Tyto dokumenty se obtížněji zpracovávají než kvalitní vzorky prezentované než kvalitní vzorky prezentované softwarovými firmamisoftwarovými firmami

Je třeba testovat na typických materiálech, Je třeba testovat na typických materiálech, které chceme digitalizovat v knihovnáchkteré chceme digitalizovat v knihovnách

Page 17: Komprese obrazu

Bitonální kompreseBitonální komprese

BezeztrátováBezeztrátová (LZW, PNG, …, CCITT Fax (LZW, PNG, …, CCITT Fax Group 3 and 4, JB2, JBIG, JBIG2, Algo Group 3 and 4, JB2, JBIG, JBIG2, Algo Vision/Luratech Vision/Luratech

Moderní ztrátová schémataModerní ztrátová schémata:: ATAT&&T (Lizardtech) (JB2) – soft pattern T (Lizardtech) (JB2) – soft pattern

matchingmatching ImagePower Inc. JBIG2 (JB2) – v minulosti - ImagePower Inc. JBIG2 (JB2) – v minulosti -

pouze pattern matchingpouze pattern matching Summus Inc. (Lightning Strike), ... Summus Inc. (Lightning Strike), ...

Page 18: Komprese obrazu

GIF by byl mírněhorší než PNG

Page 19: Komprese obrazu

Květy české – 19. stoletíKvěty české – 19. století

Page 20: Komprese obrazu
Page 21: Komprese obrazu

Vliv kvality digitalizovaných originálů na Vliv kvality digitalizovaných originálů na výkonnost kompresních schématvýkonnost kompresních schémat

Page 22: Komprese obrazu

JB2JB2

Nejvýkonnějším kompresním schémat je Nejvýkonnějším kompresním schémat je JB2 z formátu DjVu (ATJB2 z formátu DjVu (AT&&T/Lizardtech). T/Lizardtech).

Umožňuje kompresi:Umožňuje kompresi: bezeztrátovoubezeztrátovou ztrátovouztrátovou agresivní – nastavitelná; zachovává vysokou agresivní – nastavitelná; zachovává vysokou

čitelnost originálučitelnost originálu Zkuste si komprimovat do DjVu on-line: Zkuste si komprimovat do DjVu on-line:

http://any2djvu.djvuzone.org/http://any2djvu.djvuzone.org/

Page 23: Komprese obrazu

JB2 jako komponenta formátu JB2 jako komponenta formátu DjVuDjVu

Více souborů může být sloučeno a uloženo v jednom (jako Více souborů může být sloučeno a uloženo v jednom (jako v PDF) – mají společný slovník, takže jejich celkový objem v PDF) – mají společný slovník, takže jejich celkový objem bude menší než součet objemů individuálních souborůbude menší než součet objemů individuálních souborů

Více souborů může být sloučeno virtuálně (na webu jsou Více souborů může být sloučeno virtuálně (na webu jsou volány dle potřeb uživatele)volány dle potřeb uživatele)

Více výhod: display, odkazy, OCR, … (DjVu plug-in)Více výhod: display, odkazy, OCR, … (DjVu plug-in)

Drahý kódující software + řada řešení zdarmaDrahý kódující software + řada řešení zdarma

Page 24: Komprese obrazu

Vzorky a résuméVzorky a résumé

Je třeba monitorovat a testovat nové Je třeba monitorovat a testovat nové způsoby zpracování obrazuzpůsoby zpracování obrazu

Nové přístupy mohou být velmi vhodné Nové přístupy mohou být velmi vhodné pro systémy dodávání dokumentůpro systémy dodávání dokumentů Obrazové serveryObrazové servery Naskenovaný obsahNaskenovaný obsah KlikněteKlikněte, pokud máte zájem si přečíst , pokud máte zájem si přečíst

speciální studiispeciální studii

Page 25: Komprese obrazu

Které formáty jsou vhodné pro bitonální Které formáty jsou vhodné pro bitonální obraz?obraz?

Jestliže chcete nejjednodušší řešení:Jestliže chcete nejjednodušší řešení: GIFGIF Jestliže chcete menší soubory, používejte PNGJestliže chcete menší soubory, používejte PNG Oba formáty jsou doporučeny pro webOba formáty jsou doporučeny pro web

Úspornějším řešením je však TIFF/CCITT Fax Úspornějším řešením je však TIFF/CCITT Fax Gr. 4Gr. 4

Používejte DjVu/JB2, pokud chcete velmi malé Používejte DjVu/JB2, pokud chcete velmi malé souborysoubory

Page 26: Komprese obrazu

ProblémyProblémy

Zavedený software pro práci s obrazem obvykle Zavedený software pro práci s obrazem obvykle neobsahuje podporu pro TIFF s kódováním neobsahuje podporu pro TIFF s kódováním CCITT Fax Gr. 4CCITT Fax Gr. 4

Na druhé straně je uvedený TIFF dobře Na druhé straně je uvedený TIFF dobře zobrazitelný elementárními nástroji Windowszobrazitelný elementárními nástroji Windows

GIF a PNG podporují též větší barevnou hloubku GIF a PNG podporují též větší barevnou hloubku (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se ukládání bitonálního obrazu ve větší barevné ukládání bitonálního obrazu ve větší barevné hloubcehloubce

DjVu – je vždy nezbytné mít na paměti výrobu a DjVu – je vždy nezbytné mít na paměti výrobu a příjem obrazu v tomto formátupříjem obrazu v tomto formátu

Page 27: Komprese obrazu

Ztrátová komprese – Ztrátová komprese – bitonální obrazbitonální obraz

Page 28: Komprese obrazu

Komprese barevného Komprese barevného obrazuobrazu

BezeztrátováBezeztrátová LZWLZW

GIF (pouze 8 bitů)GIF (pouze 8 bitů) TIFF (od verze 5.0)TIFF (od verze 5.0)

PNGPNG WaveletWavelet

JPEG2000 (JP2)JPEG2000 (JP2)

……

ZtrátováZtrátová DCT (JPEG) DCT (JPEG) Fraktální kompreseFraktální komprese WaveletWavelet

IW44IW44 LWF, WILWF, WI JPEG2000 (JP2)JPEG2000 (JP2) MrSID, …MrSID, …

V podstatě ale jde o střet klasických přístupů s technologií wavelet.

Page 29: Komprese obrazu
Page 30: Komprese obrazu

Barevný obrazBarevný obraz

DCT

wavelet

Page 31: Komprese obrazu

Účinnost komprese – bitonální obrazÚčinnost komprese – bitonální obraz

Page 32: Komprese obrazu

Účinnost komprese – barevný Účinnost komprese – barevný obrazobraz

Referenční vzorek

Page 33: Komprese obrazu

Jak aplikovat kompresiJak aplikovat kompresi??

Záleží na charakteru objektů v obraze:Záleží na charakteru objektů v obraze: Fotorealistický obrazFotorealistický obraz (JPEG, wavelet) (JPEG, wavelet) TText aext a jednoduchá černobílá grafika jednoduchá černobílá grafika (Fax (Fax

Group 4, JB2, …)Group 4, JB2, …) Barevná grafikyBarevná grafiky (probl (problém ztrátové komprese; ém ztrátové komprese;

je lépe bezeztrátově vje lépe bezeztrátově v PNG PNG nebonebo GIF – GIF – aplikační oblast vektorové grafikyaplikační oblast vektorové grafiky - SVG) - SVG)

Smíšený obsahSmíšený obsah ( (složená řešenísložená řešení: DjVu, LDF, : DjVu, LDF, …)…)

Page 34: Komprese obrazu

Nejúčinnější řešeníNejúčinnější řešení

Segmentace obrazu do dvou nebo více Segmentace obrazu do dvou nebo více skupin objektů:skupin objektů:

1.1. Objekty vhodné pro bitonální konverziObjekty vhodné pro bitonální konverzi

2.2. Objekty vhodné pro barevnou reprezentaciObjekty vhodné pro barevnou reprezentaci

Komprimovat každou skupinu zvlášť a Komprimovat každou skupinu zvlášť a potom je sloučit v jednom formátu.potom je sloučit v jednom formátu.

Page 35: Komprese obrazu

Horizontální segmentace/zónováníHorizontální segmentace/zónování

- TextText

- GrafikaGrafika

- FotografieFotografie

Imagepower Inc.Imagepower Inc.

Page 36: Komprese obrazu

Vertikální Vertikální segmentace/zónovánísegmentace/zónování

popředí popředí pozadípozadí

Lizardtech Inc. (ATLizardtech Inc. (AT&&TT))Luratech GmBHLuratech GmBH

DjVu, LDFDjVu, LDF

Page 37: Komprese obrazu

Bitonální versus složený obrazBitonální versus složený obraz

Page 38: Komprese obrazu

Šedá škálaŠedá škála

Page 39: Komprese obrazu

Další vlastnosti DjVuDalší vlastnosti DjVu

Více obrazů v jednom souboru:Více obrazů v jednom souboru:

jako TIFF, PDF, LDF, …, s použitím jako TIFF, PDF, LDF, …, s použitím společného slovníku pixelových shlukůspolečného slovníku pixelových shluků

virtuálně: stránky zůstanou na serveru a virtuálně: stránky zůstanou na serveru a dodána je jen ta strana, která je volánadodána je jen ta strana, která je volána

Příklad virtuálního DjVu

Page 40: Komprese obrazu

Obrazový soubor s několika Obrazový soubor s několika rozlišenímirozlišeními

MrSIDMrSID

V jednom souboru je (až 9) obrazů v V jednom souboru je (až 9) obrazů v různých rozlišeníchrůzných rozlišeních

Účinné ve spojení s obrazovým serveremÚčinné ve spojení s obrazovým serverem

Příklad MrSID (bez obrazového serveru)