Chi siamo? La descrizione fisica e logica del documento
Fondazione BEIC; federica.biazzi@beic.it
Fondazione BEIC; chiara.consonni@beic.it
Fondazione BEIC; valeria.defrancesca@beic.it
Fondazione BEIC; danilo.deana@beic.it
Fondazione BEIC; lisa.longhi@beic.it
Fondazione BEIC; marcella.medici@beic.it
Fondazione BEIC; katia.toia@beic.it
Per tutti i siti web l’ultima consultazione è stata effettuata il 30 novembre 2016.
Abstract
Le possibilità di ricerca e recupero dell’informazione offerte dalla rete Internet hanno portato a una progressiva perdita di importanza dei cataloghi delle biblioteche come punti di accesso privilegiato all’informazione. Al contempo le biblioteche digitali, spesso modellate sulla base di quelle fisiche, non riescono a sfruttare le enormi potenzialità offerte dalle stesse tecnologie con le quali sono elaborate, senza oltretutto riuscire a offrire un servizio pari a quello della loro controparte “analogica”. Gli oggetti digitali, inoltre, necessitano di un trattamento e di una manutenzione di gran lunga maggiori rispetto ai documenti cartacei, pena la loro perdita irreversibile.
Partendo dall’esperienza della Biblioteca digitale BEIC, il contributo mostra la fondamentale importanza dell’adozione di standard di metadatazione riconosciuti a livello internazionale nella progettazione di una biblioteca digitale, al fine di realizzare uno strumento – nonché un ambiente – di lavoro in grado di soddisfare le esigenze dei diversi tipi di utenti. La cooperazione con altri soggetti dediti all’accesso e alla diffusione della conoscenza – in questo caso la Fondazione Wikimedia Italia e il Museo Galileo di Firenze – permette inoltre di accrescere considerevolmente la visibilità della biblioteca digitale, producendo al contempo un potenziamento delle altre risorse, le quali a loro volta traggono beneficio dall’alto grado di strutturazione e controllo offerto dagli strumenti bibliografici e catalografici.
English abstract
Today library catalogues have lost their leadership as primary access points to information in favour of the web. At the same time, digital libraries often fail to exploit the enormous potential offered by digital technologies, without being able to offer a service equivalent to that of their “analog” counterparts. Furthermore, digital objects need a greater maintenance compared to printed documents in order to avoid their irreversible loss.
Starting from the experience of the BEIC Digital Library, this paper shows the fundamental importance of the adoption of recognized international metadata standards in the design of a digital library, in order to achieve a tool – as well as a work environment – able to satisfy the needs of different types of users.
Cooperating with other institutions dedicated to knowledge access and dissemination – in this case, Italian Wikimedia Foundation and Museo Galileo in Florence – allows toincrease the visibility of digital libraries; at the same time it could also strengthen other resources through the high structured bibliographic and cataloguing tools.
Le biblioteche digitali sono spesso progettate a immagine di quelle fisiche senza tener conto che negli ultimi anni i bisogni informativi dei lettori sono radicalmente cambiati: se fino a vent’anni fa il catalogo di una biblioteca era il punto di partenza per una ricerca, ora quasi sempre è il punto di arrivo. La diffusione del world wide web ha fatto sì che l’interlocutore privilegiato al quale ci si rivolge per avviare una ricerca non sia più il bibliotecario ma un motore di ricerca o Wikipedia. Una biblioteca digitale non può però paragonarsi ai motori di ricerca, che raggiungono un pubblico molto più ampio e diversificato per quanto riguarda la visibilità dei contenuti: i suoi punti di forza sono altrove. Quanto si interroga un motore di ricerca spesso è necessario scorrere a lungo i risultati per ottenere informazioni pertinenti e soddisfacenti; interrogando una biblioteca digitale ci si aspetta una maggiore efficienza ed efficacia delle risposte. Inoltre i risultati ottenuti da una ricerca effettuata con linguaggio naturale in un motore di ricerca, nonostante gli algoritmi di restituzione stiano raggiungendo ottimi livelli, non eguagliano ancora la pertinenza di quelli ottenuti con una ricerca nel catalogo di una biblioteca in cui i metadati che corredano i documenti digitali sono controllati e organizzati.
La mole sempre crescente di documenti completamente smaterializzati richiede che questi siano accuratamente descritti, altrimenti si concretizza il rischio che diventino difficilmente reperibili e consultabili, con il risultato di acutizzare un circolo vizioso che porta all’oblio virtuale del documento stesso.
Le biblioteche cui siamo abituati e delle quali la maggior parte di noi normalmente usufruisce hanno una loro materialità e la descrizione degli oggetti fisici è un’attività che ha una lunga tradizione e pratiche ormai consolidate; quando ci si trova davanti a un oggetto digitale, al contrario, la necessità di procedere tramite vari livelli di astrazione complica le cose.
Una raccolta di oggetti o documenti digitali, che per comodità continueremo a chiamare biblioteca, necessita di un trattamento e una manutenzione diversi, maggiori rispetto al suo corrispondente fisico. Se la biblioteca che conserva un libro dovesse perderne la scheda, il libro non si smembrerebbe in una serie di pagine slegate e sconnesse. Se invece dovessero andare persi i metadati descrittivi relativi a un documento digitale, non ci sarebbe più alcuna garanzia della corrispondenza con la versione originale; perdendo i metadati tecnici verrebbero a mancare le informazioni per la conservazione a lungo termine e quindi anche la possibilità di rendere accessibile la risorsa nel tempo; se infine dovessero sparire completamente i metadati, il documento digitale smetterebbe di far parte della raccolta e non potrebbe più essere in alcun modo recuperato.
Non è questa la sede per una rassegna degli schemi di metadati disponibili per descrivere gli oggetti digitali. L’attenzione sarà quindi focalizzata esclusivamente sullo schema METS (Metadata encoding and transmission standard), progettato e manutenuto dal Network Development and MARC Standards Office della Library of Congress di Washington per codificare, tramite un linguaggio di marcatura XML, i metadati descrittivi, amministrativi e strutturali delle risorse digitali all’interno delle biblioteche digitali.
La Biblioteca digitale BEIC utilizza lo schema METS per la descrizione dei suoi documenti digitali. Si è scelto di adottare questo schema, perché si tratta dello strumento più avanzato per questo scopo, indipendente dalle regole di descrizione delle risorse e flessibile nella gestione degli elementi. Esso è largamente utilizzato dalla comunità bibliotecaria internazionale ed è impiegato dalle due più diffuse applicazioni per la gestione di biblioteche digitali: ContendDM (OCLC) e Rosetta (Ex Libris).
I metadati strutturali occupano una posizione centrale tra i metadati previsti dallo schema, necessari per una descrizione e quindi anche una rappresentazione corretta dei documenti; essi infatti descrivono lo scheletro degli oggetti digitali, collegano tra loro i vari componenti che costituiscono la versione elettronica del documento (i file di contenuto, ovvero le singole immagini delle pagine e relativi metadati) e tutti gli altri metadati appartenenti a ogni elemento.
I metadati strutturali servono per creare una vera e propria mappa degli oggetti digitali, chiamata appunto “mappa strutturale”. Questa serve a sopperire all’assenza di concretezza del documento che si sta consultando e permette all’utente di visualizzare immediatamente in maniera chiara e gerarchica l’organizzazione fisica del volume e quella logica del testo.
L’utente avrà così la possibilità di orientarsi all’interno dell’opera, sia che si tratti di semplici capitoli o paragrafi di libri moderni, sia che si trovi davanti un complesso testo di teologia medievale strutturato per virtù teologali e cardinali.
Ma per restituire tridimensionalità a un oggetto digitale non basta rappresentarne i contenuti: occorre anche riportarne, complementare alla rappresentazione logica, la descrizione fisica e paratestuale. Così, mantenendo sempre il libro come esemplificazione concreta, si può informare l’utente se ciò che vede sul suo monitor è un volume paginato, cartulato o ancora se è presente un apparato illustrativo. Associare agli oggetti la loro mappa strutturale permette di ottenere quindi un doppio risultato: da un lato si mette il lettore nella condizione di capire immediatamente davanti a quale testo si trova, se è pertinente con le sue esigenze informative e – valore aggiunto degli oggetti digitali strutturati – di raggiungere immediatamente il punto del testo che interessa; dall’altro si rispettano le linee guida IFLA relative alla digitalizzazione delle collezioni di libri rari delle quali si parlerà tra poco.
I metadati strutturali della Biblioteca digitale BEIC, o come sfondare la quarta parete
La Fondazione BEIC è nata a Milano nel 2003 con lo scopo di offrire alla comunità una struttura all’avanguardia pensata come sistema di accesso universale all’informazione attraverso il ricorso estensivo alle tecnologie più avanzate. Le sue due componenti principali sono attualmente la biblioteca digitale (Biblioteca digitale BEIC) e l’Archivio della produzione editoriale lombarda (APE) che la Regione Lombardia ha affidato in gestione alla Fondazione dal 2008.
La Biblioteca digitale BEIC si contraddistingue per il carattere selettivo e multidisciplinare delle sue collezioni. Sono stati identificati autori e opere in edizioni di pregio a cura di specialisti dei singoli settori disciplinari, attingendo per le digitalizzazioni a fondi di grandi biblioteche e a raccolte italiane e straniere. In questo modo la biblioteca si propone di rendere liberamente accessibile un vasto complesso di opere tra le più importanti della cultura umanistica e scientifica, lungo un arco temporale che va dal mondo antico all’età contemporanea. A oggi sono stati pubblicati più di 31.000 oggetti digitali per un totale di 88.739 registrazioni bibliografiche e 3.830 autori.
Le mappe strutturali della Biblioteca digitale BEIC rispettano standard qualitativamente elevati per conferire alla biblioteca una fisionomia che la distingua e la renda riconoscibile rispetto alle altre biblioteche digitali. Il protocollo per la compilazione dei metadati strutturali è stato elaborato con un duplice obiettivo: dietro le quinte, oggetti digitali solidi e coerenti con le prescrizioni legate all’interoperabilità e alla conservazione a lungo termine; sul palcoscenico, la volontà di offrire ai lettori un approccio il più possibile naturale alla fruizione del documento digitale. Il risultato è una mappa strutturale con una organizzazione “ad albero” che permette di avere una panoramica del testo e delle parti di cui è composto e quindi di raggiungere direttamente il punto di interesse. Chi ha un approccio più tradizionale alla consultazione dei testi non viene penalizzato: accanto alle immagini e alla mappa strutturale viene infatti offerta la possibilità di visualizzare (ed eventualmente scaricare) il documento in formato pdf. La peculiarità delle mappe strutturali BEIC sta nell’accuratezza con la quale sono indicate le varie parti che compongono l’esemplare del quale è stata effettuata la digitalizzazione; per esempio per tutti gli esemplari, non necessariamente antichi, si evidenziano la presenza di eventuali ex libris o note di possesso, particolarità sulle quali si focalizza ormai da tempo l’attenzione della comunità scientifica.
L’IFLA ha redatto ed emanato nel settembre 2014 un documento ufficiale relativo ai progetti di digitalizzazione dei materiali antichi e rari, le Linee guida per pianificare la digitalizzazione di collezioni di libri rari e manoscritti, specificamente pensate per i conservatori di fondi antichi o preziosi e redatte nell’ottica di fornire un punto di riferimento per chi si trova a dover pianificare una campagna di digitalizzazione. Nel testo, aggiornato nel gennaio 2015, si afferma che «l’utente dovrebbe essere in grado di ricreare o ricostruire l’esemplare fisico dalle singole immagini delle pagine digitali che sta consultando» e le mappe strutturali associate ai documenti pubblicati nella Biblioteca digitale BEIC, progettate prima della pubblicazione di queste linee guida, soddisfano questi requisiti.
Per la stesura del protocollo di metadatazione degli oggetti digitali e di compilazione delle mappe strutturali, non essendo disponibili standard internazionali, sono state utilizzate le Regole italiane per la catalogazione (REICAT) e la Guida alla catalogazione in SBN del materiale antico, rielaborate e adattate in funzione della rappresentazione della struttura logica e fisica dei documenti. Nelle mappe strutturali compaiono, per esempio, la segnatura di fascicolo e le pagine non numerate per i libri antichi. Il formato dei numeri di pagina viene visualizzato nella forma in cui compare nel testo senza alcuna standardizzazione o adattamento al linguaggio contemporaneo; nell’eventualità in cui l’opera non presenti una numerazione, si procede all’indicazione della segnatura, o come extrema ratio, all’attribuzione dell’intera sequenza numerica.
Se la mancanza di standard può essere stata uno svantaggio e aver creato una certa disomogeneità, in particolar modo durante la fase di avvio, una volta presa confidenza con gli strumenti, si è rivelata invece un grosso punto di forza perché l’elasticità delle regole ha permesso un maggior rispetto del testo originale (si pensi per esempio agli incipit degli incunaboli o alla trascrizione dei numerali).
Queste procedure di metadatazione presuppongono che le immagini siano controllate una per una, così da assicurare la congruenza e l’allineamento della mappa strutturale con la descrizione bibliografica e poter segnalare eventuali mutili dell’esemplare fisico. Il protocollo di costruzione della mappa strutturale svolge così una doppia funzione: la principale è quella di fornire informazioni il più possibile esaustive e accurate al lettore, ma nello stesso tempo diventa un’ulteriore forma di controllo interno e “incrociato” relativamente alla completezza delle digitalizzazioni, alla qualità delle immagini e alla descrizione bibliografica; non è raro infatti che da questi controlli emergano particolarità legate agli esemplari fisici non evidenziate nella scheda di catalogo, come per esempio gli errori o i “salti” dei compositori nelle sequenze di numerazione delle pagine poi corretti, quindi difficilmente rilevabili dal controllo della segnatura in fase di catalogazione.
Una mappa strutturale solida aiuta anche lo studio delle peculiarità relative ai singoli esemplari, per esempio riguardo agli errori di legatura dei fascicoli, l'assenza di una marca tipografica dove dovrebbe esserci, i cambi di dedicatario o le eventuali censure. Progetti dedicati ai dati materiali come il Material evidence in incunabula (MEI) hanno ormai da tempo eco internazionale e sono sintomatici della consapevolezza che lo studio delle collezioni ha superato la fase in cui la via della tutela e valorizzazione era la catalogazione. Questa è ormai data per imprescindibile e si ambisce a progetti di più ampio respiro. Sempre sulle linee guida dell’IFLA si legge che «l’utente dovrebbe sempre essere informato nei casi in cui i formati di presentazione siano stati modificati in qualsiasi modo (per esempio mediante rifilatura). [...] Gli utenti dovrebbero poter stabilire facilmente in che punto del documento o della collezione si trovano e dovrebbero essere in grado di tornare altrettanto facilmente ai punti chiave del documento (frontespizio, inizio dei capitoli, colophon ecc.). Come minimo bisogna provare a ricreare l’esperienza della lettura dell’originale e, se possibile, andare oltre con funzionalità aggiuntive». Come è stato già detto, tramite una metadatazione accurata si possono soddisfare a pieno i dettami delle linee guida, la mappa strutturale infatti diventa una sorta di fil rouge in grado di guidare l’utente – sia esperto, sia neofita – alla scoperta del documento digitale.
Ma se una biblioteca digitale deve offrire funzionalità ed esperienze di lettura, di ricerca e di studio almeno di pari livello quando non migliori di quelle che si possono ottenere in una sala di lettura, come superare lo studio del singolo esemplare? Sfruttando le potenzialità che la tecnologia offre e creando strumenti ad hoc dedicati al pubblico più esigente o curioso. Un buon esempio di superamento della fisicità dei singoli volumi è la ricerca tramite algoritmi di somiglianza tra le immagini disponibili, offerta ad esempio nella biblioteca digitale della Bayerische Staatsbibliothek di Monaco o il lavoro di confronto delle illustrazioni delle favole esopiche portato avanti da Matilde Malaspina all’interno del gruppo di lavoro 15cBOOKTRADE e presentato al convegno della Ligue des Bibliothèques Européennes de Recherche (LIBER) del 2015.
Nel concreto della Biblioteca digitale BEIC, i confini della sala di lettura vengono superati grazie alla possibilità di creare una libreria personalizzata e al modello FRBR con il quale vengono presentati i risultati delle ricerche. Tramite il catalogo si concretizza infatti la possibilità di effettuare confronti tra diverse edizioni della stessa opera localizzate in biblioteche distanti tra loro. La visualizzazione in contemporanea di più esemplari e delle relative mappe strutturali permette di coglierne immediatamente le peculiarità e di evidenziare le differenze fra edizioni, ad esempio nell’impaginazione o nella tradizione degli scritti permettendo così di svolgere studi filologici d’alto livello, sulle abitudini di scrittura o sulle censure dei testi. Tutte le ricerche possono comunque essere salvate in uno scaffale elettronico, riprese in un secondo momento e annotate tramite un sistema di blocco note dall’interfaccia.
Una discesa tutta dritta: gli spogli e i testi contenuti (guida Jules Verne)
Sino a ora abbiamo parlato di biblioteche digitali formate da documenti omogenei tra loro, sia come testi contenuti sia come responsabilità. Nella Biblioteca digitale BEIC i contributi pubblicati con altre opere e i fascicoli di periodici ricevono anch’essi un trattamento di metadatazione profonda.
Le registrazioni di spoglio sono registrazioni bibliografiche che descrivono le opere pubblicate all’interno di altre opere. La loro finalità è permettere la ricerca e la fruizione di tutti i contenuti creativi dotati di una propria identità che altrimenti rimarrebbero nascosti e poco accessibili. Le registrazioni di spoglio godono di una propria autonomia rispetto alle altre schede del catalogo, ma possono essere consultate anche a partire dalla registrazione della monografia o del fascicolo di periodico che ospita le opere descritte. Sono inoltre il punto di partenza di collegamenti che portano direttamente alla risorsa digitale, nel punto esatto in cui ha inizio l’opera descritta, creando così una corrispondenza con la mappa strutturale e permettendo all’utente di raggiungere il luogo del testo cercato senza ulteriori passaggi o mediazioni.
Arricchire il catalogo di informazioni di questo tipo significa permettere a chi cerca una determinata opera di ottenere l’elenco di tutte le edizioni, le traduzioni, le parti di quell’opera possedute dalla biblioteca, indipendentemente dal documento in cui sono pubblicate. Si danno così più chiavi di ricerca e più punti di accesso ai documenti, soddisfacendo una delle funzioni del catalogo previste nella Dichiarazione dei principi internazionali di catalogazione pubblicati da IFLA nel 2009. In fondo a questa pagina l’immagine esemplificativa di come L’immaterialité de l’âme demontrée contre m. Locke compaia sia come testo indipendente pubblicato nel 1747 sia all’interno di una raccolta di opere di Giacinto Sigismondo Gerdil.
La Biblioteca digitale BEIC considera la creazione delle registrazioni di spoglio uno degli aspetti più importanti del trattamento delle proprie risorse digitali, proprio perché costituiscono una risposta concreta alle esigenze degli utenti. Vengono infatti create registrazioni di spoglio per tutte le opere annunciate sul frontespizio; per i libri antichi, quando – con ancora maggiore frequenza rispetto ai libri moderni – si rintracciano contributi nascosti, affiancati o subordinati all’opera principale.
Tra le iniziative che hanno per prime sottolineato l’importanza di conoscere tutte le ripartizioni interne a un volume va citato Bod-Inc, un progetto di catalogazione degli incunaboli della Bodleian Library di Oxford iniziato nel 1955 e ora disponibile anche online, che oltre a una descrizione short title, fornisce un’analisi dettagliata dell’edizione inclusi tutti i testi contenuti e i loro autori.
La stessa attenzione dedicata alle opere contenute in monografie è dedicata alla mappatura dei periodici per i quali sono creati dei veri e propri indici dei fascicoli, con registrazioni e accessi controllati e indipendenti ai singoli articoli, collegati simbioticamente alla gerarchia della mappa strutturale. La mappatura analitica consente dunque di valorizzare il contenuto informativo delle risorse, allargando e approfondendo l’orizzonte di ricerca.
Chi trova un amico trova un tesoro: cooperazione e contaminazione
Una biblioteca digitale per poter sopravvivere non può chiudersi in un universo autoreferenziale: metadati precisi e ben documentati infatti non sono una condizione sufficiente per garantire che gli oggetti digitali non scompaiano annegando nel web. Per questo motivo sono nati portali internazionali che permettono ricerche integrate su più biblioteche digitali contemporaneamente, come è il caso di The European Library ed Europeana, che applicano la filosofia del metaopac alle biblioteche, archivi e musei digitali e di cui la Biblioteca digitale BEIC è entrata a far parte in una prospettiva di collaborazione e cooperazione tra istituzioni europee.
Sempre nell’ottica della valorizzazione delle collezioni e della divulgazione della conoscenza è nata la collaborazione della Fondazione BEIC con la Fondazione Wikimedia Italia. Dal 2014 infatti lo staff BEIC contribuisce ai vari progetti sostenuti da Wikimedia, primo tra tutti quello dell’enciclopedia libera Wikipedia.
Nell’ambito di questa collaborazione, è stata messa a punto fra giugno e luglio 2016 una linea di intervento dedicata alle marche tipografiche e alle provenienze. L’obiettivo è valorizzare questi contenuti attraverso l’inserimento in Wikimedia Commons delle immagini reperite nella Biblioteca digitale BEIC, corredate da una categorizzazione dettagliata e successivamente utilizzarle all’interno di Wikipedia, sia nell’edizione italiana sia nelle altre lingue. Solo il rilievo dato a questi elementi all’interno della descrizione bibliografica e della mappa strutturale ha permesso di creare un sottoprogetto dedicato alla valorizzazione di ex libris, note di possesso e marche tipografiche. Le voci Wikipedia di importanti tipografi ora sono corredate con le immagini delle loro marche tipografiche che spesso erano reperibili solo nei repertori specialistici e personalità di rilievo del panorama culturale internazionale vedono arricchite le voci a loro dedicate di un’informazione importante per lo studio della loro storia e personalità.
Sarà infine grazie alla collaborazione ormai consolidata con il Museo Galileo che presto vedrà la luce un applicativo per la realizzazione di mappe strutturali che permetterà di poter effettuare con un unico software procedure ora separate, quali il trattamento delle immagini e la creazione della mappa strutturale. La prestigiosa istituzione fiorentina, erede della collezione medicea di strumenti scientifici, storicamente si dedica allo studio e la divulgazione con pubblicazioni, ricerche e attività didattiche. Dal 2004 è consultabile online una biblioteca digitale creata con l’intento di pubblicare collezioni tematiche di interesse storico scientifico.
Tirando le fila
In queste pagine abbiamo visto come dei metadati controllati costituiscano l’unica via perché le biblioteche digitali possano fare la differenza tra l’informazione generalista e quella di qualità; per produrre informazioni reperibili, affidabili e riusabili queste devono essere corredate da metadati verificati e non prodotti esclusivamente con procedure automatiche.
Le mappe strutturali si sono dimostrate essere parti fondamentali di un grande mosaico generato dai cambiamenti d’approccio all’informazione e con potenzialità ancora da scoprire. Proseguendo su questa strada in un’ottica di web semantico e Linked Open Data gli oggetti digitali saranno interconnessi con legami giustificati logicamente, creando così dei circoli virtuosi di relazioni e conoscenza frutto di «intenzionalità esplicita», come per esempio collegamenti che permettano approfondimenti sull’argomento di un determinato capitolo o sulla biografia dell’autore.