N.2 2016 - L'ambiente digitale e le biblioteche

Navigazione dei contenuti del fascicolo

Chi siamo? La descrizione fisica e logica del documento

Federica Viazzi

Fondazione BEIC; federica.biazzi@beic.it

Chiara Consonni

Fondazione BEIC; chiara.consonni@beic.it

Valeria De Francesca

Fondazione BEIC; valeria.defrancesca@beic.it

Danilo Deana

Fondazione BEIC; danilo.deana@beic.it

Lisa Longhi

Fondazione BEIC; lisa.longhi@beic.it

Marcella Medici

Fondazione BEIC; marcella.medici@beic.it

Katia Toia

Fondazione BEIC; katia.toia@beic.it

Per tutti i siti web l’ultima consultazione è stata effettuata il 30 novembre 2016.

Abstract

Le possibilità di ricerca e recupero dell’informazione offerte dalla rete Internet hanno portato a una progressiva perdita di importanza dei cataloghi delle biblioteche come punti di accesso privilegiato all’informazione. Al contempo le biblioteche digitali, spesso modellate sulla base di quelle fisiche, non riescono a sfruttare le enormi potenzialità offerte dalle stesse tecnologie con le quali sono elaborate, senza oltretutto riuscire a offrire un servizio pari a quello della loro controparte “analogica”. Gli oggetti digitali, inoltre, necessitano di un trattamento e di una manutenzione di gran lunga maggiori rispetto ai documenti cartacei, pena la loro perdita irreversibile.

Partendo dall’esperienza della Biblioteca digitale BEIC, il contributo mostra la fondamentale importanza dell’adozione di standard di metadatazione riconosciuti a livello internazionale nella progettazione di una biblioteca digitale, al fine di realizzare uno strumento – nonché un ambiente – di lavoro in grado di soddisfare le esigenze dei diversi tipi di utenti. La cooperazione con altri soggetti dediti all’accesso e alla diffusione della conoscenza – in questo caso la Fondazione Wikimedia Italia e il Museo Galileo di Firenze – permette inoltre di accrescere considerevolmente la visibilità della biblioteca digitale, producendo al contempo un potenziamento delle altre risorse, le quali a loro volta traggono beneficio dall’alto grado di strutturazione e controllo offerto dagli strumenti bibliografici e catalografici.

English abstract

Today library catalogues have lost their leadership as primary access points to information in favour of the web. At the same time, digital libraries often fail to exploit the enormous potential offered by digital technologies, without being able to offer a service equivalent to that of their “analog” counterparts. Furthermore, digital objects need a greater maintenance compared to printed documents in order to avoid their irreversible loss.

Starting from the experience of the BEIC Digital Library, this paper shows the fundamental importance of the adoption of recognized international metadata standards in the design of a digital library, in order to achieve a tool – as well as a work environment – able to satisfy the needs of different types of users.

Cooperating with other institutions dedicated to knowledge access and dissemination – in this case, Italian Wikimedia Foundation and Museo Galileo in Florence – allows toincrease the visibility of digital libraries; at the same time it could also strengthen other resources through the high structured bibliographic and cataloguing tools.

Le biblioteche digitali sono spesso progettate a imma­gine di quelle fisiche senza tener conto che negli ultimi anni i bisogni informativi dei lettori sono radicalmente cambiati: se fino a vent’anni fa il catalogo di una biblio­teca era il punto di partenza per una ricerca, ora quasi sempre è il punto di arrivo. La diffusione del world wide web ha fatto sì che l’interlocutore privilegiato al quale ci si rivolge per avviare una ricerca non sia più il bibliotecario ma un motore di ricerca o Wikipedia. Una biblioteca digitale non può però paragonarsi ai motori di ricerca, che raggiungono un pubblico molto più ampio e diversificato per quanto riguarda la visi­bilità dei contenuti: i suoi punti di forza sono altro­ve. Quanto si interroga un motore di ricerca spesso è necessario scorrere a lungo i risultati per ottenere informazioni pertinenti e soddisfacenti; interrogan­do una biblioteca digitale ci si aspetta una maggiore efficienza ed efficacia delle risposte. Inoltre i risultati ottenuti da una ricerca effettuata con linguaggio na­turale in un motore di ricerca, nonostante gli algoritmi di restituzione stiano raggiungendo ottimi livelli, non eguagliano ancora la pertinenza di quelli ottenuti con una ricerca nel catalogo di una biblioteca in cui i meta­dati che corredano i documenti digitali sono controllati e organizzati.

La mole sempre crescente di documenti completa­mente smaterializzati richiede che questi siano accu­ratamente descritti, altrimenti si concretizza il rischio che diventino difficilmente reperibili e consultabili, con il risultato di acutizzare un circolo vizioso che porta all’oblio virtuale del documento stesso.

Le biblioteche cui siamo abituati e delle quali la mag­gior parte di noi normalmente usufruisce hanno una loro materialità e la descrizione degli oggetti fisici è un’attività che ha una lunga tradizione e pratiche ormai consolidate; quando ci si trova davanti a un oggetto digitale, al contrario, la necessità di procedere tramite vari livelli di astrazione complica le cose.

Una raccolta di oggetti o documenti digitali, che per comodità continueremo a chiamare biblioteca, ne­cessita di un trattamento e una manutenzione diversi, maggiori rispetto al suo corrispondente fisico. Se la biblioteca che conserva un libro dovesse perderne la scheda, il libro non si smembrerebbe in una serie di pagine slegate e sconnesse. Se invece dovessero an­dare persi i metadati descrittivi relativi a un documen­to digitale, non ci sarebbe più alcuna garanzia della corrispondenza con la versione originale; perdendo i metadati tecnici verrebbero a mancare le informazioni per la conservazione a lungo termine e quindi anche la possibilità di rendere accessibile la risorsa nel tempo; se infine dovessero sparire completamente i metada­ti, il documento digitale smette­rebbe di far parte della raccolta e non potrebbe più essere in alcun modo recuperato.

Non è questa la sede per una ras­segna degli schemi di metadati di­sponibili per descrivere gli oggetti digitali. L’attenzione sarà quindi focalizzata esclusivamente sullo schema METS (Metadata enco­ding and transmission standard), progettato e manutenuto dal Net­work Development and MARC Standards Office della Library of Congress di Washington per codificare, tramite un lin­guaggio di marcatura XML, i metadati descrittivi, am­ministrativi e strutturali delle risorse digitali all’interno delle biblioteche digitali.

La Biblioteca digitale BEIC utilizza lo schema METS per la descrizione dei suoi documenti digitali. Si è scel­to di adottare questo schema, perché si tratta dello strumento più avanzato per questo scopo, indipen­dente dalle regole di descrizione delle risorse e flessi­bile nella gestione degli elementi. Esso è largamente utilizzato dalla comunità bibliotecaria internazionale ed è impiegato dalle due più diffuse applicazioni per la gestione di biblioteche digitali: ContendDM (OCLC) e Rosetta (Ex Libris).

I metadati strutturali occupano una posizione centra­le tra i metadati previsti dallo schema, necessari per una descrizione e quindi anche una rappresentazio­ne corretta dei documenti; essi infatti descrivono lo scheletro degli oggetti digitali, collegano tra loro i vari componenti che costituiscono la versione elettronica del documento (i file di contenuto, ovvero le singole immagini delle pagine e relativi metadati) e tutti gli altri metadati appartenenti a ogni elemento.

I metadati strutturali servono per creare una vera e propria mappa degli oggetti digitali, chiamata ap­punto “mappa strutturale”. Questa serve a sopperire all’assenza di concretezza del documento che si sta consultando e permette all’utente di visualizzare im­mediatamente in maniera chiara e gerarchica l’orga­nizzazione fisica del volume e quella logica del testo.

L’utente avrà così la possibilità di orientarsi all’interno dell’opera, sia che si tratti di semplici capitoli o para­grafi di libri moderni, sia che si trovi davanti un com­plesso testo di teologia medievale strutturato per virtù teologali e cardinali.

Ma per restituire tridimensionalità a un oggetto digitale non basta rappresentarne i contenuti: occorre anche riportarne, complementare alla rappresentazione lo­gica, la descrizione fisica e paratestuale. Così, man­tenendo sempre il libro come esemplificazione con­creta, si può informare l’utente se ciò che vede sul suo monitor è un volume paginato, cartulato o ancora se è presente un apparato illustrativo. Associare agli oggetti la loro mappa strutturale permette di ottenere quindi un doppio risultato: da un lato si mette il lettore nella condizione di capire immediatamente davanti a quale testo si trova, se è pertinente con le sue esigen­ze informative e – valore aggiunto degli oggetti digitali strutturati – di raggiungere immediatamente il punto del testo che interessa; dall’altro si rispettano le linee guida IFLA relative alla digitalizzazione del­le collezioni di libri rari delle quali si parlerà tra poco.

Figura 1
Figura 2
Figura 3

I metadati strutturali della Biblioteca digitale BEIC, o come sfondare la quarta parete

La Fondazione BEIC è nata a Milano nel 2003 con lo scopo di offrire alla comunità una struttura all’avanguardia pensata come sistema di accesso universale all’informazione attraverso il ricorso estensi­vo alle tecnologie più avanzate. Le sue due compo­nenti principali sono attualmente la biblioteca digitale (Biblioteca digitale BEIC) e l’Archivio della produzione editoriale lombarda (APE) che la Regione Lombardia ha affidato in gestione alla Fondazione dal 2008.

La Biblioteca digitale BEIC si contraddistingue per il carattere selettivo e multidisciplinare delle sue colle­zioni. Sono stati identificati autori e opere in edizioni di pregio a cura di specialisti dei singoli settori discipli­nari, attingendo per le digitalizzazioni a fondi di grandi biblioteche e a raccolte italiane e straniere. In questo modo la biblioteca si propone di rendere liberamente accessibile un vasto complesso di opere tra le più im­portanti della cultura umanistica e scientifica, lungo un arco temporale che va dal mondo antico all’età con­temporanea. A oggi sono stati pubblicati più di 31.000 oggetti digitali per un totale di 88.739 registrazioni bi­bliografiche e 3.830 autori.

Le mappe strutturali della Biblioteca digitale BEIC ri­spettano standard qualitativamente elevati per confe­rire alla biblioteca una fisionomia che la distingua e la renda riconoscibile rispetto alle altre biblioteche digitali. Il protocollo per la compilazione dei metadati strut­turali è stato elaborato con un duplice obiettivo: dietro le quinte, oggetti digitali solidi e coerenti con le pre­scrizioni legate all’interoperabilità e alla conservazione a lungo termine; sul palcoscenico, la volontà di offrire ai lettori un approccio il più possibile naturale alla fru­izione del documento digitale. Il risultato è una mappa strutturale con una organizzazione “ad albero” che per­mette di avere una panoramica del testo e delle parti di cui è composto e quindi di raggiungere direttamente il punto di interesse. Chi ha un approccio più tradizionale alla consultazio­ne dei testi non viene penalizzato: accanto alle immagini e alla mappa struttu­rale viene infatti offerta la possibi­lità di visualizzare (ed eventualmente scaricare) il documento in formato pdf. La peculiarità delle mappe strutturali BEIC sta nell’ac­curatezza con la quale sono indi­cate le varie parti che compongo­no l’esemplare del quale è stata effettuata la digitalizzazione; per esempio per tutti gli esemplari, non necessariamente antichi, si eviden­ziano la presenza di eventuali ex libris o note di possesso, particolarità sulle quali si focalizza ormai da tempo l’attenzione della comunità scientifica.

L’IFLA ha redatto ed emanato nel settembre 2014 un documento ufficiale relativo ai proget­ti di digitalizzazione dei materiali antichi e rari, le Linee guida per pianificare la digitalizzazione di collezioni di libri rari e manoscritti, specificamente pensate per i conservatori di fondi anti­chi o preziosi e redatte nell’ottica di fornire un punto di riferimento per chi si trova a dover pianificare una campagna di digitalizzazione. Nel testo, aggiornato nel gennaio 2015, si afferma che «l’utente dovrebbe essere in grado di ricreare o ricostruire l’esemplare fisico dalle singole immagini delle pagine digitali che sta consultando» e le mappe strutturali associate ai documenti pubblicati nella Biblioteca digitale BEIC, progettate prima della pubblicazione di queste linee guida, soddisfano questi requisiti.

Per la stesura del protocollo di metadatazione degli oggetti digitali e di compilazione delle mappe strut­turali, non essendo disponibili standard internazionali, sono state utilizzate le Regole italiane per la cataloga­zione (REICAT) e la Guida alla catalogazione in SBN del materiale antico, rielaborate e adattate in funzio­ne della rappresentazione della struttura logica e fisi­ca dei documenti. Nelle mappe strutturali compaiono, per esempio, la segnatura di fascicolo e le pagine non numerate per i libri antichi. Il formato dei numeri di pa­gina viene visualizzato nella forma in cui compare nel testo senza alcuna standardizzazione o adattamento al linguaggio contemporaneo; nell’eventualità in cui l’opera non presenti una numerazione, si procede all’indicazione della segnatura, o come extrema ratio, all’attribuzione dell’intera sequenza numerica.

Se la mancanza di standard può essere stata uno svantaggio e aver creato una certa disomogeneità, in particolar modo durante la fase di avvio, una volta presa confidenza con gli strumenti, si è rivelata invece un grosso punto di forza perché l’ela­sticità delle regole ha permesso un mag­gior rispetto del testo originale (si pensi per esempio agli incipit degli incunaboli o alla trascrizione dei nu­merali).

Queste procedure di metadatazione pre­suppongono che le immagini siano con­trollate una per una, così da assicurare la congruenza e l’alline­amento della mappa strutturale con la de­scrizione bibliografi­ca e poter segnalare eventuali mutili dell’esemplare fisico. Il protocollo di costruzione della mappa strutturale svolge così una doppia funzione: la principale è quella di fornire informazioni il più possibile esaustive e accurate al lettore, ma nello stesso tempo di­venta un’ulteriore forma di controllo interno e “incrociato” relativamente alla completezza delle digitalizza­zioni, alla qualità delle immagini e alla descrizione bibliografica; non è raro infatti che da questi con­trolli emergano particolarità legate agli esemplari fisici non evidenzia­te nella scheda di catalogo, come per esempio gli errori o i “salti” dei compositori nelle sequenze di nu­merazione delle pagine poi corret­ti, quindi difficilmente rilevabili dal controllo della segnatura in fase di catalogazione.

Una mappa strutturale solida aiu­ta anche lo studio delle peculiari­tà relative ai singoli esemplari, per esempio riguardo agli errori di legatura dei fascicoli, l'assenza di una marca tipografica dove dovrebbe esserci, i cambi di dedicatario o le eventuali censure. Progetti dedicati ai dati materiali come il Material evidence in incunabula (MEI) hanno ormai da tem­po eco internaziona­le e sono sintomatici della consapevolez­za che lo studio del­le collezioni ha su­perato la fase in cui la via della tutela e valorizzazione era la catalogazione. Questa è ormai data per imprescindibile e si ambisce a progetti di più ampio respiro. Sempre sulle linee guida dell’IFLA si legge che «l’utente dovrebbe sempre essere informato nei casi in cui i formati di presen­tazione siano stati modificati in qualsiasi modo (per esem­pio mediante rifilatura). [...] Gli utenti dovrebbero poter stabi­lire facilmente in che punto del documento o della collezione si trovano e dovrebbero essere in grado di tornare altrettanto facilmente ai punti chiave del documento (frontespizio, inizio dei capitoli, colophon ecc.). Come minimo bisogna provare a ricreare l’esperienza della let­tura dell’originale e, se possibile, andare oltre con funzionalità ag­giuntive». Come è stato già det­to, tramite una metadatazione accurata si possono soddisfare a pieno i dettami delle linee gui­da, la mappa strutturale infatti diventa una sorta di fil rouge in grado di guidare l’utente – sia esperto, sia neofita – alla scoperta del documento digitale. 

Ma se una biblioteca digitale deve offrire funzionalità ed esperienze di lettura, di ricerca e di studio almeno di pari livello quando non migliori di quelle che si pos­sono ottenere in una sala di lettura, come superare lo studio del singolo esemplare? Sfruttando le poten­zialità che la tecnologia offre e creando strumenti ad hoc dedicati al pubblico più esigente o curioso. Un buon esempio di superamento della fisicità dei singoli volumi è la ricerca tramite algoritmi di somiglianza tra le immagini disponibili, offerta ad esempio nella biblio­teca digitale della Bayerische Staatsbibliothek di Monaco o il lavoro di confronto delle illustrazioni delle favole esopiche portato avanti da Matilde Malaspina all’interno del gruppo di lavoro 15cBOOKTRADE e presentato al convegno della Ligue des Bibliothèques Européennes de Recherche (LIBER) del 2015.

Nel concreto della Biblioteca digitale BEIC, i confini della sala di lettura vengono superati grazie alla possi­bilità di creare una libreria personalizzata e al modello FRBR con il quale vengono presentati i risultati delle ricerche. Tramite il catalogo si concretizza infatti la pos­sibilità di effettuare confronti tra diverse edizioni della stessa opera localizzate in biblioteche distanti tra loro. La visualizzazione in contemporanea di più esemplari e delle relative mappe strutturali permette di coglierne immediatamente le peculiarità e di evidenziare le differenze fra edizioni, ad esempio nell’impaginazione o nella tradizione degli scritti permettendo così di svol­gere studi filologici d’alto livello, sulle abitudini di scrit­tura o sulle censure dei testi. Tutte le ricerche possono comunque essere salvate in uno scaffale elettronico, riprese in un secondo momento e annotate tramite un sistema di blocco note dall’interfaccia.

Figura 4
Figura 5
Figura 6
Figura 7
Figura 8
Figura 9

Una discesa tutta dritta: gli spogli e i testi contenuti (guida Jules Verne)

Sino a ora abbiamo parlato di biblioteche digitali for­mate da documenti omogenei tra loro, sia come testi contenuti sia come responsabilità. Nella Biblioteca di­gitale BEIC i contributi pubblicati con altre opere e i fascicoli di periodici ricevono anch’essi un trattamento di metadatazione profonda.

Le registrazioni di spoglio sono registrazioni bibliogra­fiche che descrivono le opere pubblicate all’interno di altre opere. La loro finalità è permettere la ricerca e la fruizione di tutti i contenuti creativi dotati di una propria identità che altrimenti rimarrebbero nascosti e poco accessibili. Le registrazioni di spoglio godono di una propria autonomia rispetto alle altre schede del catalogo, ma possono essere consultate anche a partire dalla registrazione della monografia o del fasci­colo di periodico che ospita le opere descritte. Sono inoltre il punto di partenza di collegamenti che portano direttamente alla risorsa digitale, nel punto esatto in cui ha inizio l’opera descritta, creando così una cor­rispondenza con la mappa strutturale e permettendo all’utente di raggiungere il luogo del testo cercato sen­za ulteriori passaggi o mediazioni.

Arricchire il catalogo di informazioni di questo tipo si­gnifica permettere a chi cerca una determinata opera di ottenere l’elenco di tutte le edizioni, le traduzioni, le parti di quell’opera possedute dalla biblioteca, indi­pendentemente dal documento in cui sono pubblica­te. Si danno così più chiavi di ricerca e più punti di ac­cesso ai documenti, soddisfacendo una delle funzioni del catalogo previste nella Dichiarazione dei principi internazionali di catalogazione pubblicati da IFLA nel 2009. In fondo a questa pagina l’immagine esempli­ficativa di come L’immaterialité de l’âme demontrée contre m. Locke compaia sia come testo indipenden­te pubblicato nel 1747 sia all’interno di una raccolta di opere di Giacinto Sigismondo Gerdil.

La Biblioteca digitale BEIC considera la creazione delle registrazioni di spoglio uno degli aspetti più im­portanti del trattamento delle proprie risorse digitali, proprio perché costituiscono una risposta concreta alle esigenze degli utenti. Vengono infatti create regi­strazioni di spoglio per tutte le opere annunciate sul frontespizio; per i libri antichi, quando – con ancora maggiore frequenza rispetto ai libri moderni – si rin­tracciano contributi nascosti, affiancati o subordinati all’opera principale.

Tra le iniziative che hanno per prime sottolineato l’im­portanza di conoscere tutte le ripartizioni interne a un volume va citato Bod-Inc, un progetto di cataloga­zione degli incunaboli della Bodleian Library di Oxford iniziato nel 1955 e ora disponibile anche online, che oltre a una descrizione short title, fornisce un’analisi dettagliata dell’edizione inclusi tutti i testi contenuti e i loro autori.

La stessa attenzione dedicata alle opere contenute in monografie è dedicata alla mappatura dei periodici per i quali sono creati dei veri e propri indici dei fascicoli, con registrazioni e accessi controllati e indipendenti ai singoli articoli, collegati simbioticamente alla gerarchia della mappa strutturale. La mappatura analitica con­sente dunque di valorizzare il contenuto informativo delle risorse, allargando e approfondendo l’orizzonte di ricerca.

Figura 10
Figura 11
Figura 12

Chi trova un amico trova un tesoro: cooperazione e contaminazione

Una biblioteca digitale per poter sopravvivere non può chiudersi in un universo autoreferenziale: metadati precisi e ben documentati infatti non sono una con­dizione sufficiente per garantire che gli oggetti digita­li non scompaiano annegando nel web. Per questo motivo sono nati portali internazionali che permettono ricerche integrate su più biblioteche digitali contempo­raneamente, come è il caso di The European Library ed Europeana, che applicano la filosofia del metaopac alle biblioteche, archivi e musei digitali e di cui la Biblioteca digitale BEIC è entrata a far parte in una prospettiva di collaborazione e cooperazione tra isti­tuzioni europee.

Sempre nell’ottica della valorizzazione delle collezioni e della divulgazione della conoscenza è nata la colla­borazione della Fondazione BEIC con la Fondazione Wikimedia Italia. Dal 2014 infatti lo staff BEIC contri­buisce ai vari progetti sostenuti da Wikimedia, primo tra tutti quello dell’enciclopedia libera Wikipedia.

Nell’ambito di questa collaborazione, è stata messa a punto fra giugno e luglio 2016 una linea di intervento dedicata alle marche tipografiche e alle provenienze. L’obiettivo è valorizzare questi contenuti attraverso l’inserimento in Wikimedia Commons delle immagini reperite nella Biblioteca digitale BEIC, corredate da una categorizzazione dettagliata e successivamente utilizzarle all’interno di Wikipedia, sia nell’edizione ita­liana sia nelle altre lingue. Solo il rilievo dato a que­sti elementi all’interno della descrizione bibliografica e della mappa strutturale ha permesso di creare un sottoprogetto dedicato alla valorizzazione di ex libris, note di possesso e marche tipografiche. Le voci Wi­kipedia di importanti tipografi ora sono corredate con le immagini delle loro marche tipografiche che spesso erano reperibili solo nei repertori specialistici e personalità di rilievo del panorama culturale internazionale vedono arricchite le voci a loro dedicate di un’infor­mazione importante per lo studio della loro storia e personalità.

Sarà infine grazie alla collaborazione ormai consoli­data con il Museo Galileo che presto vedrà la luce un applicativo per la realizzazione di mappe struttu­rali che permetterà di poter effettuare con un unico software procedure ora separate, quali il trattamento delle immagini e la creazione della mappa struttura­le. La prestigiosa istituzione fiorentina, erede della collezione medicea di strumenti scientifici, stori­camente si dedica allo studio e la divulgazione con pubblicazioni, ricerche e attività didattiche. Dal 2004 è consultabile online una biblioteca digitale creata con l’intento di pubblicare collezioni tematiche di interesse storico scientifico.

Figura 13

Tirando le fila

In queste pagine abbiamo visto come dei metadati con­trollati costituiscano l’unica via perché le biblioteche digitali possano fare la differenza tra l’informazione generalista e quella di qualità; per produrre informazioni reperibili, affida­bili e riusabili queste devono essere corredate da metadati verificati e non prodotti esclusivamente con procedure au­tomatiche.

Le mappe strutturali si sono dimostrate essere parti fonda­mentali di un grande mosaico generato dai cambiamen­ti d’approccio all’informazione e con potenzialità ancora da scoprire. Proseguendo su questa strada in un’ottica di web semantico e Linked Open Data gli oggetti digitali saranno interconnessi con legami giustificati logicamente, creando così dei circoli virtuosi di relazioni e conoscenza frutto di «intenzionalità esplicita», come per esempio col­legamenti che permettano approfondimenti sull’argomen­to di un determinato capitolo o sulla biografia dell’autore.