Paperplane - Logo Opendoc

Risorse: approfondimenti

Cos'è DjVu

Vale più di mille parole, ma certo non mille kilobyte!

Icona file DjVuNel mondo la maggior parte delle informazioni è ancora conservata su carta: libri, quotidiani, riviste, cataloghi, manuali e documenti antichi costituiscono un patrimonio per gli istituti e le società che li hanno prodotti o li conservano. Solo una minima parte è disponibile in rete.

Digitalizzare e pubblicare documenti ad alta qualità sul Web, è stata da sempre considerata una sfida complessa. Questo perché le immagini, alla risoluzione necessaria per assicurare la massima leggibilità, hanno una dimensione tale da comportare tempi di accesso non accettabili. Abbassare la risoluzione per ridurre i tempi di scaricamento significa compromettere la qualità.

Vai alla pagina di download del plug-in DjVu BrowserI formati immagine standard quali JPEG, GIF e PNG producono file eccessivamente pesanti se salvati alla risoluzione necessaria.

Vai alla galleria di immagini in DjVuDjVu® (si pronuncia "déjà vu") è una tecnologia sviluppata alla fine degli anni '90 da un gruppo di ricercatori dei laboratori della AT&T con l'obiettivo di rendere possibile la realizzazione di raccolte digitali di documenti ad alta qualità a colori.

Una tecnologia di nuova generazione

DjVu è una tecnologia di compressione d'immagine, un formato file e una piattaforma per la distribuzione via rete di documenti. Si fonda sul modello DjVu Info MRC, uno standard promosso dall'ITU (T.44, ISO/IEC 16485), che propone la segmentazione dell'immagine in livelli (maschera del testo, colore del testo e sfondo), ciascuno dei quali viene compresso con algoritmi specifici.

Grazie a questa tecnica Djvu può garantire un elevato dettaglio degli elementi testuali ottenenendo file molto "leggeri", veloci da visualizzare anche su computer di vecchia generazione.

Le informazioni, fino ad oggi legate ai supporti cartacei, possono ora essere rese disponibili ad un pubblico molto più ampio. Istituiti di ricerca, biblioteche ed archivi, agenzie governative, società possono rendere accessibili via rete i loro fondi documentali senza più preoccuparsi dei limiti di banda e di storage.

Le prestazioni

Grafico performance DjVuIl formato DjVu è in grado di ottenere fattori di compressione, su documenti a colori, dalle cinque alle dieci volte migliori rispetto ad altri formati concorrenti quali JPEG e GIF e, su documenti in bianco e nero, fattori dalle tre alle otto volte migliori rispetto al formato TIFF G4. Documenti digitalizzati a 400 ppi in full-color, dalla dimensione originale di 36 Mb, possono essere compressi in file dal peso compreso tra i 30 e i 100 Kb (rapporti tra 1:300 e 1:1000). Questi elevati fattori di compressione rendono i documenti DjVu realmente utilizzabili sul Web rispettando la dimensione di una tipica pagina HTML (circa 50 Kb).

La compressione DjVu può essere anche applicata ai documenti nati in digitale come quelli nei formati Postscript (.ps) o PDF. In questo caso la dimensione dei file è compresa tra i 15 e i 20 Kb per pagina A4 alla risoluzione di 300 ppi.

Un sistema di visualizzazione efficiente

Per visualizzare i documenti DjVu è disponibile un'efficiente applicazione di tipo plug-in. Il modulo, disponibile per i principali browser (MS Explorer, Netscape, Mozilla, ecc.) e piattaforme (Windows, Macintosh, Unix-Linux), mette a disposizione strumenti evoluti di gestione dell'immagine come il panning, lo zoom, la rotazione, la visualizzazione del livello del testo separato dallo sfondo, ecc.

Un sistema di decompressione "al volo" permette di visualizzare con solo 2 Mb di RAM immagini che normalmente richiederebbero 25 Mb di memoria. Il formato consente inoltre la visione progressiva del documento: l'utente ottiene subito una prima versione, la cui qualità migliora progressivamente al caricamento di successivi blocchi di dati. A titolo di esempio il testo di una pagina di una rivista compare a video in solo tre secondi con connessione via modem a 56 Kbps. Nei successivi sei secondi compaiono le fotografie e la texture di sfondo e infine vengono scaricati i dati che completano la versione ad alta qualità della pagina.

È stato sviluppato, nell'ambito di un progetto open source ufficiale, un applet Java per accedere ai file in formato DjVu senza installare sul PC alcuna applicazione.

Sono inoltre disponibili diverse applicazioni prodotte da terze parti quasi tutte gratuite.

Un formato aperto e standard

DjVuLibre LogoDjVu è un formato aperto. Le specifiche, così come il codice sorgente del sistema di visualizzazione (decoder) e parte del codice del sistema di compressione (encoder), sono liberamente disponibili per gli sviluppatori grazie al progetto DjVuLibre.

DjVu è inoltre un formato standard: è stato infatti inserito ufficialmente tra i formati descritti dalla nuova versione del set di metadati dello standard Z39.87 detto anche "Data Dictionary-Technical Metadata for Digital Still Images", promosso dal NISO e dall'ANSI. Lo standard Z39.87 è richiamato ed utilizzato da diversi framework di metadati come il METS, attraverso lo schema di estensione MIX.

In Italia lo schema di metadati MAG 2.0, in attesa di recepire la nuova versione dello schema NISO-Data Dictionary, ha già inserito il formato djvu tra i tipi di formati immagine standard utilizzabili nei progetti di digitalizzazione.

Commercializzazione

Caminova LogoDal 2009 Celertem, Inc, la società che detiene i diritti del marchio DjVu ha nominato la società Caminova come responsabile dello sviluppo e della distribuzione nel mondo dei prodotti commerciali basati sulla tecnologia DjVu.

Opendoc Srl è rivenditrice e system integrator per l'Italia dei prodotti basati su tecnologia DjVu.

 

 

In rete

Prova subito la versione demo di Document Express with DjVuApplicazioni di compressione

Applicazioni di visualizzazione

Strumenti di indicizzazione e ricerca

Servizi di conversione on-line

Comunità di sviluppatori e utenti

Parte delle informazioni contenute in questo articolo provengono da documentazione disponibile presso i siti del progetto DjVuLibre e di Caminova. La traduzione e l'adattamento sono a cura di Opendoc.
I logo DjVu e Celartem sono marchi registrati di Celartem Inc. Tutti gli altri marchi sono dei rispettivi proprietari.
Ultimo aggiornamento: 2016/10/17