Un nuovo formato chiamato EPUB comincia a far parlare di sè ed un lettore che si rispetti deve sapere di cosa si tratta.
Negli ultimi anni il settore dell’editoria elettronica ha avuto una forte accelerazione sia sul fronte dei supporti (vedi i dispositivi e-ink, ma anche supporti più eterodossi per la lettura, come i PDA, gli smartphone o i netbook), sia sul fronte dei formati, con il prevalere del formato PDF, ormai uno standard.
In generale però il pdf è una delle strade più sbagliate per rendere i propri contenuti fruibili al più ampio pubblico possibile, perchè è un formato non reimpaginabile. Il pdf è perfetto per la stampa, ma questa sua rigidità strutturale è limitante nel momento in cui diventa necessario leggere i contenuti su supporti (visori) di differenti dimensioni.
Pubblicando un titolo digitale, infatti, occorre tener presente le esigenze più disparate dei lettori, che vanno dagli schermi a 6″, 8″ o 10″ dei dispositivi a inchiostro elettronico, ai circa 3-4 pollici di un cellulare, fino ai 20″ o più di un monitor.
Per i dispositivi più piccoli leggere un file, anche in formato A5, significa dover lavorare con lo zoom sulle singole pagine e trascinare il foglio a seconda della parte di pagina che si sta leggendo, ovvero costringere il lettore a varie scomodità fino a sconfinare nell’illeggibilità.
Per questo motivo con lo sviluppo dei più disparati dispositivi di lettura, si sono parallelamente diffusi formati cosiddetti reimpaginabili (reflowable), il cui contenuto si adatta allo schermo, mostrando più o meno righe in ogni pagina a seconda del dispositivo che li visualizza.
Può così capitare che lo stesso file, visualizzato su un telefonino abbia 450 pagine, su un ebook reader ne abbia 210 e sul monitor di un PC 100.
Il punto di arrivo dei formati reflowable (lit, mobipocket, lrf), è lo standard EPUB, le cui specifiche sono determinate dal consorzio idpf e basate su una serie di standard consolidati nell’ambito dell’editoria digitale e delle tecnologie web (ad es. Dublin Core per i metadati, XHTML per i contenuti, CSS per gli stili).
L’EPUB è uno standard aperto e dà all’editore molteplici vantaggi, i principali dei quali sono:
- la produzione di un singolo file che risulta ugualmente leggibile su tutte le piattaforme di lettura: dai cellulari, agli ebook reader, ai monitor dei computer
- la disponibilità di un formato digitale aperto, e quindi accessibile anche a posteriori, da utilizzare come archiviazione digitale del proprio catalogo. All’interno di ogni epub, infatti, è possibile definire i metadati secondo gli standard Dublin Core e avere quindi un “oggetto†contenente tutte le informazioni relative al titolo, dai contenuti ai metacontenuti
- la possibilità di intervenire sullo stile delle proprie collane cambiando un unico file di “stile†e applicandolo a tutti gli epub della collana
- la possibilità di passare, con strumenti automatici progettati ad hoc, dal formato epub a formati differenti come il mobipocket, l’html o lo stesso pdf
- la migrazione “indoloreâ€, proprio in quanto formato aperto e reversibile, verso eventuali nuovi standard che dovessero proporsi e affermarsi negli anni a venire
L’alternativa a tutto ciò è produrre un pdf ottimizzato come dimensioni per ogni dispositivo sul mercato, con spese e lavoro associati sproporzionati rispetto all’utilità marginale ottenibile, e da cui a posteriori non è possibile, o è possibile solo in modo molto complesso, estrapolare informazioni semantiche sui contenuti.
Ma cos’è esattamente il formato EPUB ?
E’ un formato standard per eBook raccomandato da The International Digital Publishing Forum, ma è essenzialmente un formato ZIP. Se infatti si cambia l’estensione “.epub” in “.zip”, il file EPUB si può decomprimere come ogni ZIP.
I file decompressi ricadono in tre categorie: documenti XHTML, file di trasporto e file contenitori.
Documenti XHTML. XHTML è una versione più stringente di HTML. La sintassi più rigida consente ai navigatori e visualizzatori di rendere il documento in modo più facile. Questo è rilevante sui dispositivi con meno risorse, come i cellulari. In un libro EPUB book, il contenuto principale è in questi documenti XHTML.
File di trasporto. Includono due file, uno con estensione .opf ed uno con estensione .ncx. Il file .opf contiene informazioni sul libro (autore, editore, ecc.) ed una lista di tutti i file del pacchetto. Il file .ncx dice la sequenza ed organizzazione (parti, capitoli o sezioni) dei documenti XHTML del libro.
Contenitori. Devono essere contenuti in una cartella chiamata “META-INF”. Questi file sono usati per il crittaggio e la gestione dei diritti digitali (DRM). Se l’eBook non ha DRM, il contenitore ha solo poche righe standard.
Attualmente il formato the EPUB si può leggere con Calibre, Adobe Digital Editions (ADE), FBReader e Stanza. Oltre che sui notebooks e desktop, ADE gira sui Reader Sony, e Stanza è orientato all’iPhone Apple, mentre FBReader è mirato all’Android di Google.
Calibre rende il CSS e la tabella dei contenuti molto bene, ma non può evidenziare nè annotare.
ADE ha ambedue queste possibilità ma lo scorrimento non è soddisfacente quando ci sono molte immagini e tabelle. Altro problema è che la tabella non può essere centrata, che può essere rilevante.
Sia ADE che Calibre non girano ancora sugli smartphone. ADE richiede il Flash Player, che sarà forse disponibile su quelle piattaforme nel 2010.
FBReader è nelle fasi iniziali di sviluppo ma sembra promettente.
I documenti XHTML possono avere estensione .html, .xhtml o .xml. Si preferisce l’estensione .html perchè è visibile sulla maggioranza dei dispositivi.