N.1 2021 - Biblioteca, storia, memoria

Navigazione dei contenuti del fascicolo

Il controllo bibliografico nell’era digitale: identificatori, metadati, punti d’accesso e rispetto del contesto culturale e linguistico

Mauro Guerrini

Dipartimento di Storia, archeologia, geografia, arte e spettacolo, Università degli studi di Firenze, mauro.guerrini@unifi.it

Il saggio riprende e sviluppa la relazione inaugurale presentata, in inglese, all’International Conference Bibliographic Control in the Digital Ecosystem, promossa dall’Università degli studi di Firenze, dall’IFLA Bibliography Section, dall’AIB, da Casalini Libri, ICCU, Biblioteca nazionale centrale di Firenze, Biblioteca nazionale centrale di Roma, European University Institute, Biblioteca apostolica vaticana, Biblioteca nazionale Svizzera, Wikipedia e da altri enti, che si è svolta in remoto dall’8 al 12 febbraio 2021 (). Gli atti usciranno, in inglese, su JLIS.it nel 2022. Ringrazio Tiziana Possemato, dottoranda di ricerca all’Università degli studi di Firenze, per i suoi preziosi suggerimenti.

Abstract

L’articolo riprende e sviluppa la relazione inaugurale tenuta dall’autore all’International Conference Bibliographic Control in the Digital Ecosystem (Firenze, 8-12 febbraio 2021).

L’idea del controllo bibliografico universale è presente da secoli nella storia della catalogazione e si basa sull’ideale umanistico della condivisione della conoscenza registrata prodotta in ogni parte del mondo. Nell’era contemporanea, l’IFLA ha svolto un ruolo centrale nell’universal bibliographic control (UBC), stimolando le agenzie bibliografiche nazionali e altre istituzioni a promuovere standard e collaborazioni che andassero oltre l’ambito nazionale, per arrivare a un controllo bibliografico multicentrico e ancor più cooperativo che in passato.

La tradizione della catalogazione cresce e si arricchisce, inoltre, nel dialogo con diverse comunità e gruppi di utenti. Il libero riutilizzo dei dati può avvenire in contesti molto diversi da quelli originari, moltiplicando per tutti le opportunità d’accesso universale e la produzione di nuova conoscenza: l’UBC, pertanto, deve oggi guardare all’interoperabilità e alla flessibilità nel dialogo con le varie comunità di stakeholder e con le istituzioni della memoria registrata.

English abstract

The paper takes up and develops the inaugural speech held the author at the International Conference Bibliographic Control in the Digital Ecosystem (Florence, 8th-12th February 2021).

The idea of universal bibliographic (UBC) control has been present for centuries in the history of cataloguing and is based on the humanistic ideal of sharing recorded knowledge produced anywhere in the world. In the contemporary era, IFLA has played a central role in universal bibliographic control, stimulating national bibliographic agencies and other institutions to promote standards and collaborations that go beyond the national sphere, leading to multicenter and even more cooperative bibliographic control.

The tradition of cataloguing also grows and is enriched by the dialogue with different communities and users’ groups. The free reuse of data can take place in contexts very different from the original ones, multiplying for all the opportunities for universal access and the production of new knowledge: the UBC, therefore, must now look at interoperability and flexibility in the dialogue with the various communities of stakeholders and with the cultural institutions.

Culture is the only asset of humanity that, when divided between us all, becomes greater rather than smaller.

Hans-Georg Gadamer

As a “non-commercial public space” (IFLA Global Vision) – not only in a literal sense – libraries play a fundamental role also in the digital ecosystem.

Conference BC2021

L’idea del controllo bibliografico universale è presente da secoli nella storia della catalogazione e si basa sull’ideale umanistico della condivisione della conoscenza registrata prodotta in ogni parte del mondo. Probabilmente iniziò con la Bibliotheca universalis (1545-1549) di Conrad Gesner, il catalogo di tutti i libri a stampa pubblicati fino a quel momento in latino, greco ed ebraico. Gesner definì universalis la sua opera, volendo perseguire l’obiettivo della massima copertura bibliografica in relazione alla realtà letteraria del tempo. Essa comprendeva un catalogo per i nomi degli autori e un catalogo per argomenti generali e specifici (loci). Egli stabilì le connotazioni del patrimonio scientifico e letterario e le caratteristiche della logica d’indicizzazione utilizzando quattro livelli categoriali: autore, opera, testo ed edizione [Sabba, 2012].

Nell’era contemporanea, l’IFLA ha svolto un ruolo centrale nell’universal bibliographic control (UBC), stimolando le agenzie bibliografiche nazionali e altre istituzioni a promuovere standard e collaborazioni, compresa la promozione di conferenze e la pubblicazione di testi e documenti [Anderson, 1974; Davinson, 1975; Solimine, 1995]. Dal 1990 al 1 marzo 2003, la Deutsche Bibliothek ha ospitato l’IFLA Universal Bibliographic Control and International MARC Core Activity (UBCIM), attestando il collegamento diretto tra UBC e le tecnologie contemporanee. Per anni l’IFLA ha curato l’IFLA Series on bibliographic control. In particolare, un libro di quella serie, intitolato National bibliographies in the digital age: guidance and new directions, edito da Maja Žumer [IFLA, 2009], continua a essere un testo di riferimento fondamentale. Una dichiarazione che riafferma l’impegno dell’IFLA per l’UBC è stata approvata dal Professional Committee nel dicembre 2012. Promossa dalla Bibliographic Section, la dichiarazione è stata supportata dalla Cataloguing Section e dalla Classification and Indexing Section. La WLIC di Lione nel 2014 ha incluso nel programma un seminario dal titolo “Universal bibliographic control in the digital age: golden opportunity or paradise lost?”, concepito dalla Cataloguing Section, con la Bibliography Section, la Classification Section e l’UNIMARC Strategic Programme.

Inoltre, nel 2001, la Library of Congress ha organizzato la Conference on “Bibliographic Control for the New Millennium”, celebrando l’importante anniversario proprio con questo tema e nel 2008 ha istituito un Working Group on the Future of Bibliographic Control che ha pubblicato il rapporto intitolato On the record.

Come possiamo vedere da questi eventi recenti, il controllo bibliografico è centrale per la storia della catalogazione e per la storia delle biblioteche stesse.

Il concetto di controllo bibliografico è cambiato e continua a cambiare radicalmente, perché l’universo bibliografico e le tecnologie sono cambiati radicalmente; è prevedibile che le risorse, gli attori, gli standard e le pratiche cambieranno ulteriormente. È, pertanto, necessario esplorare i nuovi confini del controllo bibliografico nell’ecosistema digitale.

Testo e metadati come paradigma del controllo bibliografico

Per secoli, un testo (manoscritto o stampato) è stato identificato dal volume fisico. Oggi, l’opera è al centro e sempre più il suo contenuto può essere presentato e goduto in molte forme. Un lettore può scegliere tra libri cartacei ed e-book in base alle sue preferenze di lettura. Il contenuto è ora accompagnato da un set di metadati che sono diventati protagonisti della comunicazione sul web; essi rappresentano oggi il paradigma del controllo bibliografico. Alcune conseguenze sono già evidenti, per esempio, i metadati di qualità di una risorsa contribuiscono alla sua conoscenza, al suo miglioramento e al suo successo [Guatelli, 2020].

Il processo di produzione dei metadati per le risorse bibliografiche inizia con i creatori di quelle risorse – che forniscono il contenuto – e, in epoca moderna, di solito assegnano il titolo e forniscono altri metadati; quindi, gli editori aggiungono i loro metadati, inclusi alcuni identificatori standard, un passo importante nel controllo bibliografico nell’ecosistema digitale. Il processo di creazione dei metadati continua con il contributo intellettuale dei catalogatori delle agenzie bibliografiche. Notevole è l’investimento iniziale nella creazione di metadati basati su fonti autorevoli.

Dal modello di controllo bibliografico universale basato sulla centralità ed esclusività delle agenzie bibliografiche nazionali si passa al controllo bibliografico dinamico e condiviso (o distribuito). Nel mondo digitale, esso si configura come un processo di riutilizzo e arricchimento dei dati, collegando singoli dataset. In un ecosistema in evoluzione, la dimensione internazionale è lo spazio virtuale in cui gli stakeholder si incontrano. In questo contesto, le biblioteche e, in particolare, le biblioteche nazionali, non hanno più il monopolio del controllo bibliografico. Ciò rappresenta una sfida intellettuale e operativa per le istituzioni bibliotecarie. Tuttavia, le biblioteche, le reti bibliotecarie e le agenzie bibliografiche svolgono ancora un ruolo importante grazie alla collaborazione tra di loro e grazie alla redazione di standard bibliografici tramite cui si realizza il controllo bibliografico; standard flessibili e allo stesso tempo vincolanti e affidabili. Le biblioteche rimangono, quindi, una parte essenziale dell’ecosistema digitale.

Quali sono le conseguenze della trasformazione digitale per i cataloghi delle biblioteche e i processi di lavoro nella creazione di metadati? Qual è la funzione dei cataloghi riposizionati e riconfigurati sul web?

Capire come i testi vengono oggi veicolati richiede consapevolezza culturale e formazione professionale: questa è la base del processo di analisi letteraria e concettuale della risorsa. Questi due aspetti – consapevolezza e formazione – dovrebbero essere comuni agli altri attori coinvolti nel processo, che fungono da mediatori del processo di conoscenza.

Oltre la tradizione

I modelli di dati e il paradigma del web semantico ci invitano ad andare oltre quell’aspetto della tradizione catalografica che affidava alle sole agenzie bibliografiche il ruolo di autorevoli produttrici di registrazione di qualità e che prevedeva descrizioni omogenee per tutte le biblioteche. La prospettiva contemporanea prevede la partecipazione di attori nuovi e diversi. Oltre alle biblioteche e ai bibliotecari, altre istituzioni (editori, distributori, agenzie private, università) e professionisti (archivisti, professionisti dei musei) stanno contribuendo alla registrazione e all’arricchimento dei metadati e degli authority file. In questo contesto, le biblioteche svolgono il ruolo di intermediari con gli altri principali produttori di metadati. La partecipazione di più attori è molto positiva e tutti sono invitati a trovare un nuovo equilibrio tra le diverse tradizioni metodologiche e culturali per perseguire un obiettivo comune: la redazione cooperativa di metadati di qualità, possibilmente in accesso aperto. È, pertanto, mantenuta e anzi è esaltata la migliore tradizione catalografica in un contesto collaborativo completamente nuovo.

Un’altra conseguenza è che il rapporto tra biblioteche, editori e distributori diventa ancor più strategico, perché gli editori sono i primi, dopo gli stessi creatori (in epoca moderna), a creare i metadati di una risorsa, metadati che, successivamente, sono acquisiti, fatti propri e valorizzati dalle biblioteche per la parte che interessa. Le biblioteche ribadiscono, con particolare responsabilità, il tema della costruzione condivisa di dati di qualità, in virtù dei principi di precisione, accuratezza e condivisione sociale del patrimonio culturale che ne hanno caratterizzato la storia e ne caratterizzano il servizio.

Il controllo bibliografico oggi è, quindi, multicentrico e ancor più cooperativo che in passato. Le agenzie bibliografiche nazionali mantengono e rafforzano il loro ruolo nel controllo della qualità dei metadati e dell’authority control, tramite l’uso e il mantenimento di strumenti fondamentali, come VIAF (Virtual international authority file) e tramite il supporto di identificatori internazionali come ISBN (International standard book number), ISSN (International standard serial number) e ISNI (International standard name identifier), che fanno parte di più ampi progetti di cooperazione internazionale e di controllo d’autorità.

VIAF e ISNI sono progetti diversi: VIAF è una collaborazione internazionale che supporta un authority file condiviso; ISNI è un identificatore di nome e un sistema per registrare i numeri che lo definiscono. VIAF, in particolare, fornisce servizi autorevoli che identificano in modo affidabile agenti, luoghi ecc. nonché le opere a essi associate nella rete di conoscenza registrata globale. La sua filosofia si ispira alla promozione, nella stessa misura, di tutte le prospettive culturali, comprese tutte le lingue e le scritture, nonché alla semplificazione del lavoro delle agenzie bibliografiche e delle biblioteche. Molte biblioteche e agenzie bibliografiche collaborano per mantenere queste risorse autorevoli a beneficio degli utenti di tutto il mondo. Maggiore è l’accuratezza dei dati, maggiori sono i vantaggi derivanti dall’utilizzo di tali fonti autorevoli. Aggregando e collegando i dati, queste fonti per l’authority control possono favorire una maggiore interoperabilità alle biblioteche, agli archivi e alla comunità dei musei (GLAM; MAB per l’Italia) e, inoltre, all’editoria e ai librai.

La forma del nome

La scelta della forma del nome associato a un’entità è sempre culturalmente fondata, ma la selezione della forma preferita è, in molti casi, complessa e dipende dal contesto culturale e linguistico in cui viene utilizzato quel nome. In passato erano privilegiate le tradizioni bibliografiche del mondo occidentale, ma ora la dimensione globale della comunicazione ha cambiato tutti i parametri. Nell’ambiente culturale globale (al contrario del catalogo di una singola biblioteca), è avvenuto l’importante riconoscimento che non esiste una singola forma del nome di un autore che dev’essere utilizzata da tutte le biblioteche. La scelta della forma di un nome da visualizzare è condizionata dal contesto culturale e linguistico all’interno del quale si colloca il dataset di quel nome. IFLA LRM ricorda che un’entità può avere nomi diversi, tutti validi (per esempio, Léonard de Vinci in Francia e Leonardo da Vinci in Italia; Cicero in una biblioteca specializzata in letteratura latina e Cicerone in una biblioteca pubblica). L’obiettivo è superare la geografia e la dominanza di un’area culturale e rispettare le tradizioni culturali e linguistiche di ogni Paese e di ogni singola comunità culturale nelle soluzioni adottate.

Il meccanismo di “riconciliazione” delle diverse forme con cui un’entità è conosciuta e identificata in un contesto globale (per esempio, il creatore di un’opera), riunite in un gruppo di forme varianti, tutte riconosciute, diventa il principio di novità nei modi di condividere le informazioni. Il processo produce un cluster, ossia un raggruppamento delle diverse forme varianti riferibili alla stessa entità, entità conosciuta con vari nomi in diversi contesti culturali, linguistici, geografici, di dominio; tutte varianti valide, utilizzabili e realmente utilizzate. Il collegamento dei vari identificatori è d’importanza decisiva. In tutti i progetti d’identificazione dell’entità che utilizzano il meccanismo di riconciliazione (o clustering) è consuetudine assegnare un identificatore all’entità riconosciuta; esso si collega ad altri identificatori assegnati alla stessa entità in contesti diversi e tutti ugualmente validi. Il meccanismo di clustering parte dall’importante presupposto che tutte le forme del nome utilizzate nel contesto globale abbiano pari dignità, senza preferenza particolare per l’una o l’altra forma. Il contesto d’appartenenza (la fonte da cui proviene quella forma variante del nome) e la necessità d’uso (il target che richiama quel nome) definiscono di volta in volta la scelta su quale considerare la forma “condizionata” (condizionata dal contesto) preferita del nome. Ciò è motivato dalla volontà di arricchire il dataset e di offrire al lettore quanti più canali possibili per raggiungere l’obiettivo; questo è lo scopo pragmatico e funzionale di poter identificare, selezionare e ottenere la risorsa. Gli identificatori consentono sia di esplicitare la funzione di equivalenza delle forme del cluster sia di collegare il cluster ad altri cluster relativi alla stessa entità. La scelta della forma preferita del nome, la strutturazione della stringa (secondo regole sintattiche note in passato solo ai catalogatori) perde importanza a fronte della necessità pratica di creare canali di reperimento multipli ed equivalenti per la stessa risorsa. Nel contesto del controllo bibliografico universale resta la necessità di offrire una forma come risultato di una scelta nazionale o culturale o linguistica; ciò si ottiene tramite meccanismi di presentazione delle informazioni legati al cluster; i dati sulla “provenienza” dell’informazione (relativi alla fonte che ha prodotto l’informazione) possono essere utilizzati in una doppia accezione:

  • la più tradizionale, ovvero come fonte che ha generato l’informazione e che definisce, all’interno di un cluster, la forma da presentare come preferita in un dato contesto;
  • quella del target richiedente (provenienza del richiedente) che, in base alla propria specifica esigenza di ricerca, guida la scelta della forma preferita (anche in questo caso, quindi, forma preferita nello specifico contesto della ricerca).

Il cluster di forme varianti è, pertanto, passaggio fondamentale dal controllo bibliografico inteso come controllo di stringhe e punti d’accesso al più complesso concetto d’identificazione di entità, tramite identità diverse e varianti con cui può esprimersi. La scelta della forma del nome e il collegamento delle varianti in cluster esalta il concetto di controllo bibliografico universale che rispetta le variazioni culturali per la visualizzazione dei nomi.

La tradizione della catalogazione cresce e si arricchisce nel dialogo con diverse comunità e gruppi di utenti. Il libero riutilizzo dei dati può avvenire in contesti molto diversi da quelli originari, moltiplicando per tutti le opportunità d’accesso universale e la produzione di nuova conoscenza. Il concetto di valori del patrimonio culturale è un’idea forte. I grandi cambiamenti introdotti dall’uso dei metadati hanno aperto nuove prospettive sul controllo bibliografico. L’UBC ora contempla l’interoperabilità e la flessibilità nel dialogo con le varie comunità e con le istituzioni della memoria registrata.

Cosa ci porterà il futuro? Forse siamo ancora all’inizio della rivoluzione digitale. Proprio nel campo dei metadati e dell’authority control potremmo aspettarci sviluppi e sorprese da tecnologie alternative sul machine learning o sull’intelligenza artificiale, uno strumento che si preannuncia molto utile; uno strumento che nulla toglie al giudizio del catalogatore, che resta un’attività intellettuale fondamentale.