L’edizione delle carte degli scrittori: l’archivio letterario incontra il (nativo) digitale
Dipartimento di Filologia classica e italianistica, Alma mater studiorum Università degli studi di Bologna, francesca.tomasi@unibo.it
Per tutti i siti web la data di ultima consultazione è il 13 maggio 2021.
Abstract
L’edizione di fondi culturali fa emergere in modo evidente un’esigenza: dare valore ai legami. Legami che costringono a ripensare al concetto di edizione nei termini di uno strumento per raccontare la storia del soggetto produttore, che significa la storia delle sue relazioni. L’esperienza condotta sui fondi di studiosi e docenti presso l’Università degli studi di Bologna ci ha consentito di avviare una riflessione sul senso di costruire ambienti in cui dare testimonianza del profilo dell’intellettuale nel circuito delle relazioni che intrattiene con le sue carte, ma anche con altri archivi, con altre persone, con altre risorse e in particolare con i libri, non solo quelli di cui è autore o possessore, ma anche quelli di cui è oggetto o soggetto. Nell’alveo del delicato rapporto fra documento e libro, non si può ignorare poi il caso di quelle carte che nascono nativamente digitali e in cui il contesto di produzione determina nuovi modelli di organizzazione della conoscenza. Il progetto ALDiNa (Archivi letterari digitali nativi), patrocinato dall’AIUCD, mira a realizzare un censimento, e quindi creare un catalogo, del digitale nativo quando questa pratica di produzione delle carte qualifichi l’attività di scrittrici e scrittori. Il born-digital, in particolare, amplifica la complessità di gestire il tracciamento delle diverse versioni di un testo in ambienti potenzialmente a situazioni multiple e stratificate, lanciando al contempo la sfida della creazione di nuove forme di accesso al canonico rapporto testo stabilito/varianti, ma anche a tutte le componenti contestuali necessarie a garantire l’espressività del processo creativo. Si configura allora una nuova modalità di pensare all’edizione digitale come narrazione di un percorso di valorizzazione della memoria culturale, un racconto dell’autore e dei suoi testi.
English abstract
The edition of cultural collections clearly reveals a need: to give value to relationships. The experience on the funds of scholars and professors at the University of Bologna has allowed us to start a reflection on the meaning of building environments where the author’s profile is outlined in the set of relationships he maintains with his papers, but also with other archives, with other people, with other resources and in particular with books, not only those of which he is the author or owner, but also those of which he is the object or subject. In the context of the dialogue between document and book, we cannot ignore the case of those papers that are born natively digital and in which the production context determines new models of knowledge organization. The ALDiNa project, sponsored by the AIUCD, aims to carry out a census, and thus create a catalog, of native digital when this practice of producing papers qualifies the activity of writers. The born-digital, in particular, amplifies the complexity of managing different versions of a text in potentially multi-layered environments, while, at the same time, launching the challenge of creating new forms of access to the canonical relationship between established text/variants, but also to all the contextual components necessary to guarantee the expressiveness of the creative process. A new way of thinking about the digital edition is thus configured as the narration of a path to enhance cultural memory, a story about the author and his texts.
Gli archivi culturali come fondo complesso
L’edizione di fondi culturali, o anche di complessi documentari d’autore, è quel caso in cui si impone un’esigenza: dare valore alla necessaria relazione fra le carte, ovvero i documenti, e i libri (o anche fra archivio e biblioteca). Non solo perché il fondo culturale può raccogliere tanto l’archivio quanto la biblioteca del soggetto produttore, ma anche perché il legame fra le carte e i volumi può essere concepito, e quindi espresso, a vari e diversi livelli. Questo è idealmente il principio che guida il filologo nella rappresentazione della storia della tradizione, dove i documenti di mano dell’autore intrattengono varie tipologie di relazioni con i (suoi) libri. Ma non solo.
Gli archivi degli intellettuali, ovvero in particolare di scrittrici e scrittori, poeti e poetesse o, più in generale, autrici e autori o anche letterate e letterati, sono da sempre un terreno di studio affascinante.
Se gli archivi di persona canonicamente rappresentano il caso di quella che potremmo chiamare la “sedimentazione del molteplice”, tanto per categorie di supporto materiale (a solo titolo di esempio: quaderni, carte sciolte, album, manoscritti, dattiloscritti e documenti a stampa) quanto per tipologia documentaria (lettere, abbozzi, minute, articoli, fotografie, interventi in rivista o frammenti di giornale), l’archivio di personalità – in particolare quando quella personalità sia un letterato –, aggiunge alla complessità dell’eterogeneità di supporto e tipo, un aspetto particolarmente interessante: la rilevanza filologica dell’accesso al contenuto delle carte, soprattutto quando si voglia affrontare l’edizione di unità documentarie. In particolare, non si può non rilevare quanto l’edizione delle carte di un archivio non debba e non possa prescindere dai diversi contesti veicolati dalle carte stesse: il soggetto produttore da un lato e le risorse a vario titolo e livello ascrivibili a quel soggetto produttore dall’altro. Ma ragioniamo per gradi.
Nella creazione di uno strumento di corredo per un archivio di personalità, il livello dell’unità documentaria è fondamentale per valorizzare il rapporto che le carte archivistiche intrattengono con il resto della documentazione collegata a chi quelle carte ha prodotto, accumulato o conservato. Ed ecco che, come la disciplina archivistica ci insegna, il soggetto produttore diventa un punto di partenza necessario. In particolare, conformemente agli standard per la rappresentazione dei soggetti produttori (dallo standard metodologico ISAAR-CPF [ICA, 2003] a quello di struttura EAC-CPF [SAA, 2021] fino al modello concettuale RiC-CM [ICA, 2016] e la correlata ontologia RiC-O [ICA, 2021]), quando si proceda alla creazione di un record d’autorità bisognerà ragionare su almeno tre differenti livelli, necessari a dare consistenza alle relazioni:
- il legame fra il soggetto produttore e le carte che testimoniano la sua attività e documentano l’esercizio delle sue azioni/funzioni;
- la tipizzazione delle connessioni (gerarchiche, familiari, associative) fra soggetti produttori (o in generale fra persone);
- il collegamento, potenzialmente multiplo e diversificato, fra il soggetto produttore e la documentazione prodotta, ovvero quelle risorse culturali in qualche forma ascrivibili o correlabili al soggetto stesso (nei diversi ruoli che può ricoprire: autore, detentore, soggetto, o anche oggetto).
Più in generale infatti diremo che l’esperienza più affascinante dello studio di un fondo di personalità è la nozione di archivio culturale, che declineremo qui come l’espressione del legame trasversale e ramificato fra il soggetto e il patrimonio, che è sì archivistico, ma anche librario, e che talora sconfina nel museale. Se quindi i primi due livelli della creazione dell’authority sono necessari a delineare fisionomia e profilo dell’intellettuale, il terzo livello è quello che consente di raggiungere il grado di conoscenza più alto, ovvero di qualificare la figura del letterato nella sua complessità di produttore, ma anche detentore, o ancora soggetto o oggetto, di risorse informative eterogenee ma inevitabilmente e indissolubilmente correlate.
L’esperienza condotta sugli archivi di studiosi e docenti conservati presso il Dipartimento di Filologia classica e italianistica (FICLIT) dell’Università degli studi di Bologna, ci ha portato a ragionare sui fondi culturali come quel terreno di sperimentazione dei sistemi di descrizione di aggregati documentari eterogenei, in cui il rapporto fra il fondo archivistico, ovvero le carte che rappresentano il complesso documentario, e il fondo librario, ovvero la collezione dei volumi posseduti (e spesso postillati, annotati e commentati) e poi donati all’istituzione deputata alla conservazione, è legame necessario ad acquisire piena conoscenza dell’attività dell’intellettuale.
In particolare nella creazione della Digital library del FICLIT, realizzata dal centro /DH.ARC attraverso l’applicativo Omeka S (la versione di Omeka a base semantica), il primo sforzo è stato quello di elaborare un modello concettuale che desse il giusto spessore alle relazioni fra le unità documentarie e quelle librarie, guidando l’esperienza dell’utente attraverso una lettura trasversale dei complessi documentari. La scelta è caduta sull’ontologia CIDOC-CRM, e la sua estensione FRBRoo capaci tanto di permettere una descrizione a livelli gerarchici di entità come istanze di classi correlate attraverso proprietà semantiche, quanto di stabilire relazioni trasversali per la creazione del grafo della conoscenza, in cui correlare l’item alle sue diverse manifestazioni e queste alle relative espressioni. O anche un item a un altro item. E quindi in generale di passare dall’albero alla rete.
Ma c’è qualcosa di più. Se pensiamo in particolare agli archivi di scrittori non possiamo non riflettere sul processo di produzione delle carte come segno di un atto creativo, governato dal tema della trasformazione, tipicamente esemplificato dal rapporto che sussiste fra la fase degli abbozzi e quella della/e pubblicazione/i. Gli studi insomma di filologia d’autore e quindi la critica genetica.
Ecco di nuovo il vincolo che lega le carte ai volumi, e che si traduce in una nuova esperienza di accesso al sapere. Non si tratta solo di prendersi cura del legame fra l’archivio e la biblioteca, come espressione della dimensione culturale del soggetto produttore; quello che diventa determinante sono le implicazioni che derivano dall’edizione della documentazione, quelle implicazioni che costringono a ripensare al rapporto fra documento, come prodotto dell’attività dell’autore, e i libri, che con quel documento sono in relazione. Diremo, anche, che dobbiamo valorizzare quel legame speciale, che governa il rapporto fra il documento d’archivio e la/e sua/e pubblicazione/i, o meglio, la relazione fra il contenuto della carta d’archivio e le diverse pubblicazioni che quel contenuto tramandano.
Basterà un esempio. Prendiamo il Fondo Albini, conservato presso la Biblioteca di discipline umanistiche (BDU), ora accorpata alla biblioteca del FICLIT (e che rientra quindi nel novero degli archivi culturali del nostro dipartimento). Un fondo già descritto sommariamente fra il 1985 e il 1988 e inventariato, ma ancora tutto da studiare.
Per riassumere brevemente il profilo dell’intellettuale, diremo che Giuseppe Albini nato e morto a Bologna, è stato latinista, poeta, filologo e politico. Allievo del Carducci, è stato professore di grammatica greca e latina prima, e filologia latina poi, all’Università di Bologna (1898-1933), dove ha ricoperto anche la carica di Preside della Facoltà di Lettere e filosofia (1912-1917) e quindi di Rettore dello stesso ateneo (1927-1930). Amico di Pascoli, è ricordato in qualità di autore di poesie in italiano e in latino, curatore di testi classici (fra cui spiccano le Satire di Persio e le Eclogae di Dante) e traduttore di poeti latini (in particolare di Virgilio). Iscritto al Partito fascista (dal 1920), è stato nominato Senatore del Regno (1924). Ha donato il suo archivio e la sua biblioteca alla BDU dell’Università di Bologna.
Nel definire una potenziale scheda di autorità per Giuseppe Albini, dovremo prestare attenzione quindi a una serie di elementi importanti: le carte dell’archivio (dove spiccano il carteggio e soprattutto gli scritti e le traduzioni), che documentano importanti rapporti con intellettuali del suo tempo, e i volumi, accompagnati da note di possesso, talora annotati, e in potenza anche in stretta relazione con le carte, nel solco delle biblioteche d’autore. E dovremo considerare anche il legame dell’Albini con personalità rilevanti (ad esempio relazioni come ‘allievo_di’ Carducci o ‘amico_di’ Pascoli o ancora ‘corrispondente_di’ Panzacchi), ma anche con la documentazione che lo riguarda (valorizzando il ruolo dell’Albini nel tempo, ovvero role-in-time diremo): le carte dell’Archivio storico dell’università (fra cui il catalogo online dei Ritratti dei docenti), il dipinto che lo raffigura in Quadreria del Rettorato, la documentazione del periodo in cui è stato senatore del Regno presso l’Archivio del Senato della Repubblica, la statua che lo rappresenta presso la Certosa di Bologna dove è conservata la lapide. Senza dimenticare ovviamente che abbiamo anche i libri, pubblicati a stampa, delle sue opere, e in particolare delle sue traduzioni, le cui prime sperimentazioni sono probabilmente fra le carte del suo archivio (ancora tutto da studiare).
Infatti, oltre alle numerose relazioni fra risorse eterogenee, che ci hanno consentito di ragionare su un modello di rappresentazione del fondo che desse giusta espressività ai collegamenti fra unità informative diverse e conservate presso altrettanto differenti istituzioni culturali, un punto in particolare ci ha interessato: il legame fra abbozzi, appunti, prime stesure e minute conservati in archivio e le traduzioni edite. Collazionare le carte con le edizioni a stampa sarà un lavoro necessario a ricostruire l’evoluzione dell’atto creativo, ovvero a utilizzare la filologia d’autore come autentico e completo strumento di interpretazione [Italia, 2021]. E, come vuole la tradizione, a confrontare ulteriormente le traduzioni di Albini con le traduzioni di altri intellettuali e in generale interpreti coevi e successivi: il canonico approccio ecdotico alla storia della tradizione che si mette in atto in ogni nuova edizione, quando si voglia ripercorrere il vissuto editoriale dell’opera.
E fino a questo punto nulla di nuovo, se non l’esigenza di ripensare a questi processi, dove la filologia d’autore incontra la metodologia archivistica, in un’ottica che usi sistemi computazionali, prima che digitali, per rendere questa complessità manipolabile. Potremo allora definire l’edizione digitale come quel luogo in cui si potrà dare giusto spazio ai diversi contesti, archivisticamente rilevanti, dei documenti come strategia per accogliere tutte le risorse necessarie a configurare l’identità dell’autore valorizzandone i legami traversali. Ovvero, costruire la rete di conoscenza (knowledge graph).
Come da tradizione, nei sistemi di organizzazione della conoscenza l’aspetto computazionale è la modellazione, auspicabilmente a base ontologica, che governa l’intera procedura di rappresentazione del sapere latente, quello che le risorse informative raccontano e che deve essere formalizzato. Nel nostro caso la metodologia è il cuore del processo, che si sviluppa secondo una serie di passi, necessari alla descrizione dell’archivio culturale:
- identificazione degli esemplari, ovvero anche degli item: carte e volumi, ma anche oggetti culturali diversi;
- classificazione delle entità richiamate dagli item: persone, dotate di diverse tipologie di ruolo nel tempo, e cose, ovvero elementi intertestuali e intratestuali richiamati dall’item (sempre in relazione temporale);
- descrizione delle risorse, intese come item dotati di una manifestazione, che traduce un’espressione, che rappresenta un’opera (standard di metadazione ai diversi livelli della rappresentazione);
- definizione dei legami: tipizzazione delle relazioni fra esemplari, entità e risorse;
- formalizzazione della conoscenza: modellazione del dominio in termini di concettualizzazione.
Non si vuole in questa sede focalizzare sugli aspetti di workflow di un processo di organizzazione della conoscenza, ma solo ragionare sul concetto di conoscenza come dato arricchito, ovvero trasformato in informazione, e dotato di contesti plurimi e trasversali. Perché in fondo gestire le relazioni fra le carte come unità documentarie, le carte come contenuto, e le carte come edizione di quel contenuto è ragionare in termini di valorizzazione della stratificazione dell’atto creativo. O anche di applicazione di FRBR (ora diremo LRM) al mondo degli archivi in quella speciale prospettiva che è l’edizione. Il passaggio naturale è dunque dalla descrizione in termini paratestuali del fondo culturale (lo strumento di corredo) alla descrizione in termini di accesso al testo pieno delle opere.
L’edizione (digitale) delle carte di un autore non potrà allora prescindere dall’obbligo di documentare tutte le componenti necessarie a dare a quelle carte il giusto contesto (i diversi legami dello scrittore), ma anche a stabilire gli opportuni collegamenti fra il testo tramandato dal documento d’archivio e il/i testo/i pubblicato/i in diverse versioni, forme, supporti e manifestazioni. Fino al volume a stampa.
Ma cosa accade se ci spostiamo in un ambiente che è nativamente digitale e che intrattiene comunque inevitabili rapporti con il mondo analogico?
L’archivio letterario digitale nativo
Partiamo chiarendo cosa intendiamo con archivio digitale, per dare giusta voce alla ricaduta prismatica di un concetto dalle sfaccettature plurime. Se il termine archivio è per sua natura polisemico, ancora di più lo è il concetto di archivio digitale, in cui alla complessità di stabilire i confini dell’accezione di complesso documentario, si somma quella di dati espressi attraverso sequenze di bit, salvati in un certo formato (il digital asset) e accessibili da un’applicazione sviluppata attraverso un qualche linguaggio informatico (il management system).
Dobbiamo allora distinguere il concetto di archivio digitale come ambiente (principalmente web) di raccolta e rappresentazione, e quindi fruizione, di descrizioni archivistiche realizzate attraverso un certo applicativo software da archivio digitale come raccolta di documenti (o anche di edizioni diremo) che testimoniano un qualche prodotto analogico (una certa versione) di un intellettuale e che vengono trasformati in un qualche formato digitale per essere conservati e resi accessibili da quell’ambiente.
Ma c’è un terzo livello, quello che a noi interessa in questa riflessione: l’archivio che nasce digitalmente, ovvero quello in cui le carte sono nativamente scritte in un qualche formato digitale, conservate su supporti digitali e quindi accessibili attraverso un calcolatore, una macchina in qualità di lettore di formati e supporti che sono in grado di veicolare (e interpretare) sequenze di bit. Andiamo di nuovo per gradi.
Quando ragioniamo in un contesto nativamente digitale la questione naturalmente si complica rispetto a un dominio analogico (di cui conserviamo comunque il modello teorico descritto nel capitolo precedente): non solo si trasformano i concetti di supporto e tipo, ma si introduce anche quello di formato. E si complica il tema, fra gli altri, tanto dell’accesso alla risorsa, in qualità di oggetto digitale, quanto della conservazione di quello stesso oggetto. Ma soprattutto il digitale ci costringe a confrontarci con il tema della molteplicità delle versioni, dei supporti, dei formati e degli strumenti di lettura del documento, archivisticamente unico e testimonianza dell’azione condotta dal soggetto produttore nella creazione della risorsa, ovvero dell’autore nella produzione delle sue carte, e quindi con il problema dell’edizione di un documento che nasce digitalmente.
Un recente progetto avviato dall’Associazione italiana per l’informatica umanistica e la cultura digitale (AIUCD), ci ha permesso di avviare una riflessione sul tema di un particolare tipo di archivio letterario, ovvero quello digitale nativo.
L’iniziativa si chiama ALDiNa (Archivi letterari digitali nativi) e il suo scopo è quello di censire la realtà degli archivi letterari born-digital conservati presso istituzioni culturali, enti, fondazioni ed editori, per creare un catalogo del digitale nativo d’autore e contestualmente elaborare buone pratiche per la long term preservation di tale materiale, naturalmente fluido ed effimero.
Il progetto prende le mosse dal lavoro già condotto in seno a PAD (Pavia archivi digitali), avviato nel 2009 e «finalizzato a realizzare uno strumento per archiviare e rendere consultabili documenti in formato elettronico di personalità rappresentative della cultura e della società odierna, riconducibili a diverse generazioni e formazioni. Di questo materiale PAD intende garantire la conservazione nel tempo e favorire lo studio, nel rispetto della privacy e del diritto d’autore» [Weston, 2019].
L’esperienza di PAD è diventata argomento di una tavola rotonda, tenutasi durante il convegno annuale AIUCD di Bari 2018 [Feliciati et al., 2018], durante la quale si è avviata una prima riflessione circa l’idea di ragionare sugli archivi digitali nativi di personalità. Da lì, una seconda tavola rotonda, questa volta in remoto, ma sempre organizzata per AIUCD 2021 a Pisa, ha deciso di riprendere quel discorso che, nell’arco di un triennio, si era trasformato in un progetto: ALDiNa.
ALDiNa, il cui logo rielabora il celebre ex-libris di Aldo Manuzio, aggiungendo i simboli del network per enfatizzare le relazioni fra nodi o anche fra entità concettualmente correlate, parte esattamente dal problema della conservazione delle memorie. E in particolare delle memorie digitali la cui potenziale perdita, dovuta anche alla rapida obsolescenza di supporti e formati, sono i punti più dibattuti rispetto al tema più generale dei dati digitali. Se il dato è la base per la conoscenza, la memoria rappresenta l’esigenza di preservazione di quella conoscenza; ma quando la memoria è rappresentata da dati digitali, per loro stessa natura volatili, il rischio di perdita della conoscenza è elevato.
Leggiamo dalla news su AIUCD che annuncia l’avvio del progetto gli scopi e gli obiettivi di ALDiNa:
Il progetto di ricerca è nato per raccogliere informazioni dettagliate e garantire una documentazione e valorizzazione adeguata del nativo digitale d’autore − tema ancora poco affrontato nel panorama italiano − al fine di promuovere la condivisione di metodologie e buone pratiche che garantiscano la comprensione teorica del problema, e la preservazione, l’accesso e lo studio del patrimonio.
Molte sono infatti le istituzioni che conservano documenti digitali (e.g. testi, immagini, audio, video, email, post, etc.) su supporti diversi (magnetici, ottici, ma anche cloud) e/o in differenti formati, spesso proprietari e privi di adeguata documentazione. La mancanza di sensibilità e di cura filologica verso il digitale, la fragilità dei supporti e l’obsolescenza di hardware e di software aumentano il rischio di vuoti di memoria. Casi paradigmatici sono la riformattazione di molti personal computer di autrici e autori, la smagnetizzazione dei floppy disk (o altri tipi di supporto) o l’incompatibilità di vecchi formati di documento con i moderni word processors.
Il primo obiettivo di ALDiNa è quello di realizzare una mappatura dei materiali conservati presso centri di ricerca, fondazioni, università, biblioteche, archivi e musei, ed eventualmente, in futuro, presso case editrici e sedi di riviste, e altre realtà che conservano a vario titolo questa tipologia di materiale. Riteniamo infatti che un primo sondaggio sul territorio sia una condizione essenziale per aprire un dibattito sul tema, ormai urgente e non più rinviabile.
Il progetto partirà dunque da un questionario che coinvolgerà un ampio numero di soggetti conservatori; il lavoro sarà integrato da consultazioni e verifiche dirette presso archivi e istituzioni. Si realizzerà una base di dati, modellata sulla struttura del questionario e degli archivi di cui si ha già conoscenza. Si andrà quindi a creare un catalogo per la raccolta e la preservazione di metadati relativi a contenuti testuali e multimediali, dispositivi hardware eventualmente conservati (computer, floppy disk, hard disk ecc.) e stato di preservazione e funzionamento.
Ecco quindi che i documenti, prodotto dell’attività di un intellettuale, che definiamo born-digital, costringono chi quegli archivi deve studiare, ordinare, valorizzare e magari pubblicare, a porsi una serie di problemi che un archivio nativo analogico non pone. O meglio, diremo, il born-digital costringe a confrontarsi con problemi nuovi, e ripensare al tema dell’accesso alle carte in un’ottica diversa, che, a modi e forme dell’accesso all’archivio analogico, aggiunge quello dell’accesso a contenuti nativamente digitali.
Se dovessimo schematizzare il rapporto fra l’archivio tradizionale del mondo analogico – ovvero documentazione conservata in un archivio storico, filtrata da un professionista nel passaggio dal deposito – e quello digitale – dati di un archivio personale nativamente digitale, prodotti da un individuo e ceduti ad un’istituzione –, senz’altro individueremmo una serie di spunti di riflessione (Figura 1).
Fig. 1: Documenti analogici vs documenti digitali
Documento analogico | Documento digitale |
Unicità del documento rispetto al contesto di riferimento | Potenziale molteplicità delle versioni (molteplicità dei contesti per lo stesso documento) |
Accesso diretto alle carte (accesso umano) | Accesso mediato dal calcolatore (dipendenze da hardware e software e dalle versioni ed evoluzioni di HD e SW) e quindi accesso meccanico |
Supporto (la carta, al massimo papiro o pergamena) la cui durata è consolidata | Supporti fragili e volatili (il disco rigido del computer, i floppy, i CD-ROM, i DVD-ROM, le pendrive, il cloud) |
Strumento di lettura canonico (accesso diretto alle carte) | Device di lettura diversi (PC, Mac, smartphone, tablet, reader) |
Un formato (la componente materiale) | Formati potenzialmente eterogenei (a solo titolo di esempio: .jpg, .doc, .xml, .epub, .txt, .html) |
Tipologie canonizzate | Tipologie nuove come: file digitali, e-mail, post su blog, interventi diversi sui social |
Garanzia di autenticità e non modificabilità | Oggetti in cui la modificabilità e la mancanza di strumenti di verifica dell’autenticità sono una possibilità |
Conservazione della carta (conservazione del supporto) | Conservazione del digitale (problemi di: accesso, compreso lo strumento di lettura, supporto e formato) |
Non volendo soffermarci ora sulle soluzioni proposte per affrontare i problemi tecnici per la lettura e la conservazione (come la migrazione di supporto e formato e/o l’emulazione di ambienti hardware e software) o le problematiche legate ad autenticità e non modificabilità, il digitale introduce un tema significativo, che potremmo riassumere nell’incertezza di garantire l’accesso alla conoscenza nel tempo; la long term preservation diremo, che richiama la nozione di preservazione “ad perpetuam memoriam” usata per riferirsi alla documentazione che confluisce nell’archivio storico. In particolare, quello che qui ci interessa sottolineare è: quale conoscenza vogliamo preservare? Ovvero, al di là degli aspetti di conservazione fisica del dato digitale, a quale dimensione concettuale miriamo? Quale contenuto vogliamo rendere disponibile per il fruitore finale? Perché ogni processo di rappresentazione del digitale, anche partendo dal digitale, implica l’assunzione di un punto di vista, che è anche l’osservazione del dominio tradotta nella concettualizzazione necessaria a esprimere una speciale interpretazione.
Vorremmo allora qui ragionare sulla prima caratteristica riportata in tabella: il rapporto fra l’unicità del documento analogico, in quanto documento dotato di un contesto che lo identifica univocamente, versus la naturale molteplicità dei contesti dello stesso documento digitale, in qualità di prodotto in evoluzione e quindi potenzialmente fluido, o anche in trasformazione. La naturale, progressiva, modifica del testo del documento estende i contesti di riferimento per la non stabilità del livello del contenuto. Ed è quello che ci interessa affrontare.
In particolare, vogliamo riflettere sull’archivio degli autori contemporanei, e su una speciale “serie” di quell’archivio: la scrittura del romanzo, del racconto, della poesia, ovvero delle opere prodotte attraverso sistemi di word processing, salvate su disco locale o remoto attraverso file di vario formato, e date poi alle stampe per essere pubblicate da un editore. E l’edizione non potrà che essere digitale.
L’edizione dei documenti nativi digitali
Una frase semplice, come quella che chiude il paragrafo precedente porta con sé una serie di implicazioni. Mettiamoci nei panni dell’autore che scrive il suo romanzo e annotiamo le potenziali variabili di questo apparentemente innocuo atto, in un approccio canonico di critica delle varianti: la stesura è iniziata in digitale o su carta? Se in digitale, quale word processor è stato usato? In quale formato è stato salvato il file? Quanti file sono stati realizzati con lo stesso contenuto? È mai stato attivato il quadro revisioni durante la scrittura? Il salvataggio del o dei file su quali e quanti dispositivi è avvenuto? E il salvataggio su cloud è stato fatto? Il testo è stato stampato, ovvero fissato su carta, in una o più delle sue versioni? E poi pensiamo che il testo digitale venga dato alle stampe attraverso l’intermediazione di un editore. Quale formato è stato usato dall’editore per la conversione del file dell’autore? E il passaggio dalla bozza alle revisioni fatte dall’autore per la versione finale a stampa come sono state trasmesse e quindi acquisite nel testo finale? Sono state fatte edizioni della stessa opera da editori diversi?
Questi sono solo alcuni degli interrogativi che è necessario porsi quando si voglia fare l’edizione delle carte di uno scrittore contemporaneo. E in fondo è la filologia del testo digitale che stabilisce un modello di approccio al problema. Recensio, collazione e ricostruzione sono i passaggi consolidati dell’edizione scientifica di un’opera. E che ricorrere a strumenti informatici sia una soluzione lo impariamo fino dalle prime sperimentazioni di computing and the humanities.
Quello che la ricerca odierna nel campo delle edizioni digitali ci insegna è l’apertura all’atto ecdotico nella sua dimensione di processo e non solo di prodotto. Tradizionalmente la filologia teorizza come ricostruire il testo inteso come la presunta ultima volontà dell’autore. E le edizioni analogiche valorizzano il testo restituito mettendo le varianti in apparato. Il prodotto è l’edizione. Nel digitale questo cambia. Solo per fare qualche esempio, visualizzazioni sinottiche di versioni dei testi che rappresentano la storia della tradizione o viceversa ricostruzioni al volo di testimoni con semplice click dalla sigla, ma anche collazioni automatiche con evidenziazioni delle varianti o ancora merging delle varianti in un unico file con opportune evidenziazioni delle lezioni, assieme a strumenti di visualizzazione della storia della tradizione rappresentano lo stato dell’arte nelle edizioni digitali di testi.
Nel caso di un testo nativamente digitale avremo due forme di variantistica da considerare: le varianti del testo, documentate dal change tracking, ovvero il rilevamento delle modifiche prodotte all’atto della scrittura e riprodotte attraverso il quadro delle revisioni; le varianti acquisibili da collazione fra testi diversi, ovvero fra manifestazioni diverse della stessa opera (più copie del file con possibili modifiche). E poi avremo eventualmente le copie stampate del file, la versione in bozza con potenziali annotazioni riportate sul file digitale e quindi il testo per il tipografo e il testo per l’editore, quello destinato a documentare la (supposta) volontà ultima dell’autore. Una pluralità di documenti, dove la componente nativamente digitale incontra l’intervento (a mano) dello scrittore in un sistema inevitabilmente ibrido.
Il punto è sempre essere consapevoli di dover gestire questioni di versioning, buona pratica in uso in computer science per tenere traccia dello storico delle versioni di un testo. In particolare il versioning documenta i cambiamenti intercorsi nel percorso produttivo (creativo diremo), creando nuove versioni del documento per ogni modifica introdotta, corredando ogni versione degli opportuni metadati (l’autore, ovviamente, ma soprattutto la data di modifica) necessari a ricostruire il potenziale albero delle dipendenze. Supponendo di disporre di file XML, come formato di output del nostro word processor, in cui avremo la serie delle lezioni che documentano la storia delle revisioni, potremmo visualizzare ogni singolo stato del testo, ovvero anche ricostruire al volo ogni momento della fase redazionale, e avere un file con annotate le variazioni per ogni evento accaduto nel documento, oppure potremmo disporre di tanti file quante le versioni che riportano delle modifiche rispetto allo stadio precedente del testo. Con XML potremo cioè documentare le revisioni di ogni testo (revision history), quanto avere tanti file XML diversi, ciascuno per uno stadio del testo, da collazionare e confrontare (ad esempio a coppie con algoritmi di diff) o da far confluire in un unico file che tenga traccia delle versioni (merging). E la versione a stampa finale, il romanzo che leggiamo nella sua veste definitiva, sarà il risultato di questo progressivo processo di riformulazione del testo rappresentato dalle sue versioni.
Se dovessimo classificare gli interventi diremo che dobbiamo considerare una serie di fenomeni, ciascuno dei quali dovrà essere documentato nei file, come ad esempio: cancellazioni (eliminazione di stringhe di caratteri), aggiunte di parole o porzioni, riscritture (riformulazione) di singole parole o interi passi, cancellazioni e successive aggiunte, spostamento di porzioni di testo (cut & paste), cambiamenti di stile e formato, pattern strutturali diversi. Fenomeni della scrittura, la cui variabile sarà sempre la documentazione della temporalità delle azioni così come emerge dal versioning. Quello che ci permette di ricostruire un albero di dipendenze che inevitabilmente si trasforma in un grafo per inevitabili relazioni parallele o trasversali.
Tornando al modello teorico che abbiamo descritto all’inizio, è evidente che la relazione fra versioni del documento digitale, o il collegamento del testo a stampa con le versioni digitali, sono solo uno dei rapporti che nell’edizione digitale andranno contemplati: soggetto produttore, legami del soggetto produttore con altre persone, collegamenti fra il soggetto produttore e altri documenti o libri o risorse di cui può essere oggetto o soggetto devono necessariamente essere documentati in un’edizione digitale che per la sua naturale fluidità deve dire qualcosa di più di quanto non faccia una tradizionale edizione analogica.
E qui entra in ballo un tema: come rappresentare per l’utente finale questa complessità? Molto sforzo, in particolare in questi anni, è stato dedicato al tema della visualizzazione dell’informazione. Per tanti anni la stessa comunità di informatica umanistica ha ragionato sui sistemi formali di rappresentazione del sapere (un caso emblematico è XML/TEI), ma poco spazio è stato dedicato a come utilizzare l’annotazione embedded, atto dell’interpretazione dell’esegeta, in un servizio di fruizione da parte di un utente finale, che peraltro non è ormai più da molti anni un fruitore passivo, ma è un attivo, consapevole e partecipe autore/lettore.
E siccome la maggior parte di risorse digitale viene pubblicata sul web, è il web il luogo eletto alla visualizzazione dei contenuti.
Se i linguaggi sono standardizzati (HTML + CSS + Js), e i temi di user experience (UX), usability e user interface (UI) sono ampiamente discussi, quello che ancora manca è come utilizzare linguaggi e strumenti per fornire un servizio autentico di accesso alla conoscenza. Il tema della data visualization è estremamente interessante come strumento non solo per mostrare i dati attraverso un sistema “orientato all’utente” (user centered design), ma anche per interpretare fenomeni attraverso una resa che è il risultato dell’analisi dei dati, un interprete, diremo, fra il lettore e il significato sotteso. L’importante è disporre, appunto, di dati, ovvero, conformemente alle specifiche del web semantico, muoverci in un contesto che preveda l’impiego di linked open data come strumento di garanzia della FAIRness dei dati, in un percorso di produzione, pubblicazione, accesso, visualizzazione, uso e riuso di risorse, ma anche di entità e item.
Immaginiamoci allora la possibilità di costruire un virtual research environment come scrivania del lavoro del filologo e al contempo ambiente di fruizione che dota il lettore di una serie di strumenti che stabiliscono l’architettura di interfaccia. Ovviamente con la possibilità di stabilire tanto la provenance degli asserti, quanto l’attribuzione di paternità delle azioni, e ancora il grado di certezza delle affermazioni. Proviamo a classificare le componenti quindi e a stabilire alcuni servizi. Avremo:
Set di metadati descrittivi
- Profilo dell’intellettuale:
- elementi iconografici;
- controllo d’autorità;
- fonti.
- Legami tipizzati con altri intellettuali per condivisione di:
- luogo;
- soggetto;
- tema;
- data;
- relazioni familiari o gerarchiche.
- Collegamenti a:
- libri (scritti, posseduti, in cui l’intellettuale viene menzionato);
- complesso documentario;
- risorse in qualche forma correlate (artefatti culturali diversi);
- contenuti digitali vari: post su blog, ma anche lezioni, conferenze, progetti.
Accesso al testo pieno
- Visualizzazione di ogni documento digitale (con tanto di metadati descrittivi, tecnico-gestionali e strutturali della manifestazione digitale) che rappresenta un certo stadio del testo con le sue revisioni;
- Documento di merging dei diversi stati del documento con evidenziate le revisioni;
- Collegamento di ogni documento al testo stabilito con legami tipizzati (cancellazione, aggiunta, spostamento ecc.) per ogni variazione ritenuta rilevante.
Servizi di fruizione e lettura delle varianti (data visualization)
- timeline per visualizzare le lezioni nel tempo e ricostruire il processo di creazione lungo un arco temporale;
- mappa con geolocalizzate le versioni prodotte magari in luoghi diversi, per verificare come l’atto creativo possa essere influenzato dal territorio;
- mappe di calore (heat map) delle variazioni documentate sul testo stabilito per verificare dove è avvenuto il numero maggiore di interventi dell’autore;
- strumenti di visualizzazione come istogrammi o torte per fornire informazioni quantitative delle lezioni varianti (e magari sulle tipologie di modifiche) che si sono prodotte nel tempo;
- modelli di visualizzazione a base insiemistica per stabilire unioni, intersezioni o disgiunzioni fra documenti sulla base del numero di varianti;
- collegamenti fra documenti attraverso alberi (gerarchia modello treemap) e grafi (potenziali collegamenti trasversali);
- modelli per visualizzare vicinanza e lontananza di due versioni del testo come un grafico di dispersione (scatter plot).
Strumenti di arricchimento dell’architettura
- sistemi di annotazione o commento lato utente;
- strumenti di analisi customizzata dei dati, attraverso API pubbliche (ad esempio Voyant tools);
- supporti multimediali diversi (ad esempio video con l’autore che legge una sua poesia; messinscena teatrale di un romanzo contemporaneo).
Quello che si può immaginare è cioè un sistema di storytelling in un nuovo contesto, ovvero quello della filologia, che ci permette di passare dalla data visualization all’information visualization: la narrazione, il racconto della storia dell’autore e del testo attraverso i legami. Lo storytelling diventa una nuova metodologia del racconto filologico, uno strumento per dare al testo stabilito e alla storia della tradizione il ruolo di componenti di un percorso di lettura nuovo, multimediale, uno strumento per navigare quel processo che ha portato l’autore a realizzare la sua opera in un sistema di interconnessioni contestuali che arricchiscono l’esperienza di accesso all’edizione.
L’edizione digitale dunque si trasforma. È un territorio di nuove sperimentazioni, che vogliono accogliere la narrazione come strategia di trasmissione di un nuovo sapere determinato dallo spazio accogliente di un ambiente dematerializzato che permette in un’unica interfaccia di accesso di poter disporre di tutti gli strumenti necessari all’analisi dell’autore in tutta la sua complessità di intellettuale poliedrico.
Conclusioni
Dagli archivi degli intellettuali alla nozione di fondo culturale. Dal fondo all’edizione dei documenti che dia voce al tema del molteplice. Dai documenti analogici all’archivio nativo digitale. Dalle risorse che nascono digitali al tema del versioning. Diremo anche dal documento al libro passando per la filologia come cerniera di congiunzione in un contesto di edizione nuova in cui le varianti digitali siano lo strumento per la lettura dell’edizione a stampa e il mezzo necessario alla comprensione del processo che ha condotto alla produzione dei contenuti. Per arrivare al ruolo dell’utente finale, sempre più importante in tutti i progetti che prevedano l’uso di metodologie computazionali per usare il digitale come strumento di rappresentazione della conoscenza per un fruitore attivo e partecipe. Nuovi metodi di storytelling per raccontare nuove esperienze di lettura delle edizioni. Terreni nuovi da esplorare, temi su cui la comunità scientifica dovrà confrontarsi.