L'indicizzazione semantica in automatico o semiautomatico nelle principali biblioteche europee
Università degli studi di Verona; laura.manzoni@univr.it
Per tutti i siti web la data di ultima consultazione è il 27/04/2023.
Abstract
Le biblioteche, dall’inizio degli anni Duemila, hanno cercato di adeguare gli strumenti catalografici tradizionali al crescente sviluppo dell’informazione attraverso la sperimentazione di automatismi finalizzati a ridurre gli interventi di tipo umano e intellettuale nei processi di indicizzazione semantica. L’indicizzazione automatica o semiautomatica consiste nell’impiego di algoritmi e tecniche basate sull’intelligenza artificiale che possono sostituire o integrare l’intervento umano nell’analisi e nell’indicizzazione di risorse espresse nel linguaggio naturale in un formato leggibile da una macchina, così che i termini d’indicizzazione estratti, sulla base della loro rilevanza semantica, siano associati al loro contenuto. L’articolo presenta un’analisi delle principali esperienze sviluppate in ambito europeo dalle Biblioteche nazionali soffermandosi sulle motivazioni che stanno alla base di questi progetti, gli strumenti e i software adottati, le metodologie e le procedure di estrazione di parole e frasi chiave e le tipologie di risorse su cui viene condotta la sperimentazione. In particolare, vengono prese in considerazione le esperienze della Deutsche Nationalbibliothek, che dal 2009 ha sviluppato e implementato procedure per l’assegnazione automatica di intestazioni di soggetto tratte dall’authority file Gemeinsame Normdatei (GND) e di classi di soggetto basate sulla DDC, della Nasjonalbiblioteket (Biblioteca nazionale della Norvegia), che ha condotto una serie di sperimentazioni per classificare articoli di riviste scientifiche in modalità automatica, e dalla Biblioteca nazionale finlandese, che nel 2017 ha sviluppato il software open source Annif e nel 2020 ha lanciato Finito AI, un servizio per l’indicizzazione semantica automatica. Altre biblioteche nazionali europee che hanno iniziato a riflettere sulle potenzialità dell’indicizzazione automatica sono la Bibliothéque nationale de France (BnF), la Kungliga biblioteket (Biblioteca nazionale svedese), la rete RERO a cui si collegano le biblioteche della Svizzera occidentale e la Biblioteca nazionale centrale di Firenze (BNCF).
English abstract
Libraries, since the beginning of the 2000s, tried to adapt traditional cataloguing tools to the growing development of information by experimenting automatisms aimed at reducing human and intellectual intervention in semantic indexing processes. Automatic or semi-automatic indexing consists of the use of algorithms and techniques based on artificial intelligence that can replace or supplement human intervention in the analysis and indexing of resources expressed in natural language in a machine-readable format, so that the extracted indexing terms, on the basis of their semantic relevance, are associated with their content. The paper presents an analysis of the main experiences developed in the Europe by National Libraries, focusing on the motivations behind these projects, the tools and software adopted, the methodologies and procedures for extracting key words and phrases, and the types of resources on which experimentation is conducted. In particular, it considers the experiences of the Deutsche Nationalbibliothek, which since 2009 has developed and implemented procedures for the automatic assignment of subject headings from the authority file Gemeinsame Normdatei (GND) and subject classes based on the DDC, of the Nasjonalbiblioteket (National Library of Norway) which has conducted a series of experiments to classify scientific journal articles in an automatic way, and by the National Library of Finland, which in 2017 developed the open source software Annif and in 2020 launched Finito AI, a service for automatic semantic indexing. Other European national libraries that have started to reflect on the potential of automatic indexing are the Bibliothéque nationale de France (BnF), the Kungliga biblioteket (Swedish National Library), the RERO network to which the libraries of Western Switzerland belong, and the Biblioteca nazionale centrale di Firenze (BNCF).