Sistemi conoscitivi per il Design: una proposta metodologica

Paolo Ciuccarelli; Perla Innocenti

Sistemi conoscitivi per il Design: una proposta metodologica

Paolo Ciuccarelli

Perla Innocenti

2006

visibility

…

description

244 pages

link

1 file

Abstract

Il volume descrive le orgini e gli obiettivi del progetto/programma di ricerca DesignNet, avviato dall’esigenza di mettere a disposizione di studenti e docenti della Facoltà del Design del Politecnico di Milano informazioni e documenti per alimentare la didattica progettuale, e affrontava il problema dei documenti per il design insieme a quello della raccolta, descrizione e trasmissione dei documenti del design. La ristampa coincide con uno degli obiettivi dichiarati: promuovere ed allargare la rete del design identificata nel progetto, offrendo alla comunità del design un’occasione di unificazione attraverso la condivisione di una metodologia e di alcuni strumenti per la gestione del proprio patrimonio informativo, documentale, e quindi culturale.

Paolo Ciuccarelli

sostenere quei comportamenti connettivi, esplorativi e conoscitivi, attinenti più al contesto che al testo, che ribadiscono l'azione culturale oltre che tecnica del design. Il rapporto del designer con le informazioni e i documenti non poteva dunque essere affrontato solo sul piano delle informazioni, dei documenti 'ufficiali', delle conoscenza codificate: bisognava necessariamente porsi il problema della gestione di quei frammenti documentali, quelle eccedenze cognitive 16 che il progettista riorganizza creativamente in forma nuova integrandoli alle informazioni e ai documenti più tecnici e verticali, generando innovazione (nuova conoscenza) non inventando ma, appunto, ricombinando. Un processo che va sostenuto fornendo strumenti e metodi per la ricombinazione, per la costruzione di relazioni significative tra i frammenti qualitativi, i documenti, le informazioni, e per argomentare quelle relazioni (Fig. 2).

Figure 2

Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 13 [ Fig. 2

] Relazioni multiple tra documenti nell'ambito del design (P. Ciuccarelli)

Note [ 1 ] L' avvio 'ufficiale' del progetto è sancito dal seminario internazionale organizzato per sancire la necessità di un percorso di ricerca che indagasse la relazione tra design, informazione e conoscenza con obiettivi strumentali. Il seminario, dal titolo DesignNet. Knowledge e Information Management per il design si è tenuto presso la Facoltà del Design l' 8 [ 2 ] Nel programma DesignNet l'accezione del termine documento è la più ampia possibile, così come indicata nel paragrafo 2.1 di questo volume. [ 3 ] Complessità del materiale informativo e documentale che è data dalla eterogeneità -per formato, tipologia, modalità di descrizione ecc. -dello stesso e dal potenziale (grande) numero di relazioni esistenti tra i documenti [ 4 ] C'è implicita in questo obiettivo l'ipotesi che, dal punto di vista dell'architettura dei flussi di utilizzo e produzione di informazioni e conoscenza, i processi progettuali condotti per scopi didattici all'interno dei laboratori e quelli dei professionisti del design siano assimilabili. Un'ipotesi avvalorata dalla scelta della Facoltà del Design di coinvolgere in modo diretto i professionisti nella didattica, con un apporto che sarà presumibilmente un trasferimento di esperienza progettuale. [ 5 ] La sigla INDACO sta per Industrial Design Arti, Comunicazione e Moda. [ 6 ] Quello indicato è il titolo di un saggio scritto da Paola Bertola, ricercatore del dipartimento INDACO, e contenuto in Didattica &Design. Processi e prodotti formativi nell'università che cambia, a cura di A. Penati e A. Seassaro, Edizioni POLI.Design, Milano, 2000. Altri lavori dello stesso autore sullo stesso tema: Design as a Knowledge Agent. Barcelona, 28-30 April 2003 <http://www.ub.edu/5ead/PDF/13/Bertola. pdf> [ 7 ] Si discute molto oggi sul fatto che in realtà quasi tutte le professioni contemporanee siano, ad un certo livello, knowledge intensive. Sicuramente il design lo è, con la ulteriore specifica derivante dal fatto che gran parte della conoscenza circolante è conoscenza tacita, non codificata. Si potrebbe quindi meglio definire il design come attività knowledge intensive. [ 8 ] Testimonianza di questo orientamento sono alcuni dei primi testi scritti nelle fasi di avvio del programma DesignNet: P. Ciuccarelli, Strumenti per il progetto tra formazione e gestione della conoscenza: ipotesi per un portale del design, in Didattica &Design. Processi e prodotti formativi nell'università che cambia, a cura di A. Penati e A. Seassaro, Edizioni POLI.Design, Milano 2000, pp. 236-262; DesignNet. Knowledge e Information Management per il design. Atti del seminario internazionale, cit. [ 9 ] Per gli architetti si diceva 'dal cucchiaio alla città'. Nel caso del design da una parte è vero che oggi, almeno guardando ai percorsi formativi, la situazione è cambiata, i rispettivi ambiti di pertinenza sono stati distinti, l'architettura e il design hanno trovato -come dimostra anche l'organizzazione didattica del Politecnico di Milanole loro strade. Ulteriori e forti distinzionie quindi riduzioni di campo -sono state operate anche nella Facoltà del Design, e hanno portato a definire Corsi di Laurea distinti per il progetto della comunicazione, della moda, degli interni ecc. Ed è anche vero che una porzione di informazioni e conoscenza -quella più tecnica, trasversale, o di metodo -acquisita nei progetti precedenti può essere accumulata e riutilizzata. Rimane però anche vero che all'interno dei diversi ambiti di progetto, settori merceologici, nelle macro aree del prodotto, della comunicazione, degli interni rimane comunque una grande varietà, soprattutto se si considerano gli scenari culturali e sociali da controllare, e le ibridazioni tra queste aree sono ancora molto frequenti. [ 10 ] Per questo motivo, tra gli altri, definiamo DesignNet un 'sistema conoscitivo', come recita anche il titolo di questo libro, e non solo un archivio o un 'sistema informativo'. [ 11 ] Traduzione non letterale di cultural seeds, espressione utilizzata nella presentazione del programma DesignNet, in occasione dell'incontro di lavoro Iniziative e progetti digitali del Politecnico, Politecnico di Milano, 1 ottobre 2004. La presentazione è visibile sul sito <http://www.biblio.polimi.it/progetti/ incontro_bibdig> [ 12 ] Non conosco l'esistenza di studi scientifici sull'argomento, ma sembra incredibile l'ipotesi che molti designer soffrano della sindrome del collezionismo, della raccolta di frammenti documentali che 'potrebbero essere utili' -se (ri)contestualizzati o (ri)combinati con altre risorse documentali -per generare nuove soluzioni. Si pensi all'armadietto nello studio Castiglioni, all'interno del quale si trovano oggetti e componenti della cui raccolta è difficile immaginare la ragione (sarebbe anche difficile dare un nome a quell'armadietto: archivio? di cosa?). Solo osservando gli oggetti progettati dal designer -creando quindi la connessione tra quell'oggetto, quel frammento, e il prodotto industrialesi può capirne (forse) il senso, capire cosa ha generato quel seme. [ 13 ] Sempre per restare nel campo dei materiali, si parla qui, ad esempio, delle caratteristiche estetico-sensoriali contrapposte a quelle tecnico-funzionali. [ 14 ] Insieme alla sindrome del collezionismo, c'è un altro atteggiamento che sembra tipico del designer, anche questo (ancora) non verificato scientificamente: l'uso della macchina fotografica digitale come bloccoappunti visuale (visual notebook) da portare sempre con sé. [ 15 ] K. Weick, The Social Psycology of Organizations, Random House, London 1969, citato da E. Rullani, Economia della conoscenza. Creatività e valore nel capitalismo delle reti, Carocci, Firenze 2004, p.p. 400. [ 16 ] «Le eccedenze cognitive -dice Rullaninon sono soltanto il sovrabbondante prodotto -senza costo e senza valore -che risulta dalle capacità moltiplicative della propagazione cognitiva. Non sono un 'di più', un superfluo di cui potremmo fare a meno, me che tolleriamo perché costano poco o perché non abbiamo il tempo e la voglia di scegliere tra i milioni di stimoli e di informazioni che ci bombardano. È vero, le eccedenze cognitive appaiono un ingombro senza valore in un quadro di scelte e di comportamenti dominato dalla razionalità strumentale. Ma sono invece il sale della ragione riflessiva. Per rendere solido -riflessivamente solido -il terreno in cui si vuole agire, serve, infatti, un lavoro di esplorazione della complessità che non produce vantaggi immediati ma può cambiare la posta in gioco» (pp. 395 ssg.). [ 17 ] Il 22 aprile 2004, con Decreto del Ministero per i Beni e le Attività Culturali -Soprintendenza Regionale per la Lombardia, la Collezione Storica Premio Compasso d'Oro ADI è diventata la prima collezione di Design riconosciuta 'patrimonio di eccezionale interesse artistico e storico'. Il decreto recita: (Omissis) «La serie di 651 oggetti di design costituenti la Collezione Storica Compasso d'Oro ADI individuata nelle premesse è dichiarata di eccezionale interesse artistico e storico ai sensi degli artt 2, 1° co., lett. C, e 6, 2° co., del D.L. 490/99 e, come tale, è sottoposta a tutte le disposizioni di tutela contenute nel citato Decreto Legislativo».

How design as a knowledge process is embedded into organizations to foster innovation

Evoluzione dei documenti e della biblioteca nell'era digitale

Perla Innocenti This is not the Library, the Library is within

Iscrizione nella Yale University Library Nel corso della loro storia le biblioteche 1 non sono certamente rimaste estranee ai cambiamenti: nuove tecnologie e nuovi tipi di utenti hanno richiesto nel tempo un ripensamento dei metodi e degli strumenti. La differenza, oggi, è nella scala e nella rapidità dei cambiamenti, nel passaggio dalle raccolte e dai cataloghi alle persone e ai processi di tipo proattivo ( Fig. 1) (cioè verso le attività necessarie alla trasformazione delle risorse disponibili in elementi di servizio), e nel rapporto con il sistema aperto della biblioteca 2 . Questi processi -basati su nuove forme di cooperazione, collaborazione, elaborazione e scambio delle conoscenze -sono sostenuti dall'uso delle nuove tecnologie digitali, che permettono possibilità senza precedenti: la multimedialità (con l'ingresso del digitale negli anni '70), la connettività (con la commutazione di pacchetto) e la mobilità (con l'avvento del wireless). Tuttavia, come ricorda Giovanni Di Domenico, «il problema rimane quello di elaborare e trasmettere le conoscenze necessarie alla organizzazione di realtà, strategie e attività di servizio non attorno ai documenti, neanche attorno alle tecnologie, ma attorno ai bisogni diversificati di apprendimento, di infor- A differenza di un passato in cui i documenti delle biblioteche erano eminentemente di carattere alfanumerico e cartaceo, oggi dunque i contenuti e i supporti materiali dei documenti sono incredibilmente eterogenei e diversificati, così come le tecniche e tecnologie necessarie per la loro produzione, distribuzione, conservazione, organizzazione e fruizione. La raccolta di una biblioteca odierna può consistere di una o più di queste tipologie: documenti analogici posseduti dalla biblioteca e aventi una precisa localizzazione fisica; documenti digitali posseduti dalla biblioteca e disponibili per l'uso locale; documenti analogici posseduti da altre biblioteche ma disponibili attraverso sistemi interbibliotecari di condivisione delle collezioni e cataloghi collettivi; documenti digitali ad accesso riservato, che la biblioteca non possiede ma cui fornisce accesso tramite contratti a pagamento. Prima dell'avvento del Web, la biblioteca tradizionale imponeva la fruizione on-site di documenti analogici di una collezione just-in-case. L'ambiente informativo era relativamente stabile e costituito per la maggior parte da materiali a stampa; le dimensioni delle collezioni erano un indicatore della qualità della biblioteca, che poteva così soddisfare in modo adeguato i bisogni informativi dei suoi utenti; gli acquisti erano predittivi. Il contenuto era mantenuto attraverso la conservazione dell'oggetto fisico, costituito da materiali organici, e la conservazione era distinta dalle questioni relative all'accesso, costituito da una serie di strumenti correlati ma non integrati. Gli utenti si recavano in una biblioteca per accedere e utilizzare specifiche informazioni e, per via delle limitazioni spazio-temporali delle tecniche utilizzate per la descrizione di documenti analogici (catalogo cartaceo per autore e per soggetto), era dato per scontato che l'utente avesse già abbastanza informazioni in anticipo, prima di andare in biblioteca, e che sapesse già cosa cercare. Nel nuovo ambiente digitale si presenta un diverso panorama: la biblioteca digitale va a completare ed integrare la biblioteca tradizionale, con una fruizione just-in-time delle risorse digitali native o digitalizzate, una nuova concezione dei cataloghi e degli accessi e l'utilizzo di tecnologie digitali. Le procedure interne sono state automatizzate per una gestione integrata del 'circuito del documento' e il catalogo 9 costituisce una base di dati unica e non sequenziale, indicizzato per autore, per soggetto, per classe, ma recuperabile da qualsiasi elemento e con varie modalità. E, aspetto determinante, è possibile accedere in remoto non più soltanto all'informazione sul documento, ma al documento stesso (digitale o digitalizzato), disponibile contemporaneamente a più persone grazie ad una sempre maggiore convergenza documentale, tecnologica, professionale 10 . Le novità, nello scenario sopra delineato, sono l'indipendenza dall'ubicazione e la centralità dell'utente 11 , in particolare in ambito universitario, dove le biblioteche sono il principale centro servizi. In questo contesto possono risultare preziose le teorie del Knowledge Management, che riguarda propriamente l'acquisizione, la creazione e il packaging (o l'applicazione o il riuso) della conoscenza servendosi dei vantaggi offerti dalle Information Communication Technologies e dalle sue estensioni Web-enabled: capacità di creazione, elaborazione, immagazzinamento e scambio in breve tempo di grandi quantità di informazioni in tutte le loro forme, nuovo tipo di interazione e di disponibilità dell'informazione tramite teletrasferibilità a distanza, supporto di quasi ogni tipo di informazione visuale, tramite i processi di vettorializzazione e/o discretizzazione che permettono di rendere l'informazione richiamabile non solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in base a caratteristiche visuali. Quando Jorge Louis Borges ne La biblioteca di Babele ipotizzò un sapere indefinito, ma infinitamente grande e infinitamente connesso, decretandone il senso nel contempo assoluto e surreale, per la prima volta ipotizzò, inconsapevolmente, ciò che la rivoluzione dell'era informatica dell'Internet Visual Computing avrebbe reso reale.

Le biblioteche universitarie dall'automazione alla trasformazione: il contesto internazionale

Peter Lyman ha evidenziato un processo a tre fasi degli effetti delle Information Communication Technology (ICT) sulle biblioteche 12 :

1. modernizzazione (fare ciò che si sta già facendo, ma in modo più efficiente servendosi dell'automazione per la gestione di collezioni di documenti, soprattutto cartacei); offerto dai cataloghi era ancora irrilevante per molti utenti, in particolare per quelli delle discipline scientifiche, poiché non permetteva di ricercare i singoli articoli dei periodici ma soltanto le testate e le annate delle stesse. Servizi di abstract e di indicizzazione degli articoli dei periodici come l'Index Medicus (l'attuale MEDLINE) cominciarono a dar vita a database specializzati, alcuni dei quali disponibili commercialmente anche online, molto costosi e progettati per essere utilizzati da utenti esperti. La possibilità di offrire ricerche su vasta scala a persone diverse dei ricercatori che lavoravano per l'industria era economicamente impensabile. Tra la fine degli anni '80 e gli inizi degli anni '90 questi database iniziarono però ad essere implementati per l'accesso pubblico interattivo, costituendo un impatto oggi forse non percepibile nell'ampliamento delle risorse disponibili per gli utenti e delle modalità di ricerca, sebbene i costi si siano mantenuti abbastanza elevati e le biblioteche non dispongano della proprietà dei database ma soltanto delle licenze d'uso. Il risultato di questo passaggio dei cataloghi della biblioteca alla dimensione del anytime, everywhere è stata la massiccia richiesta, da parte di un numero sempre maggiore di utenti, non più soltanto di servizi bibliografici online ma di contenuti disponibili sul Web. È importante rilevare anche il cambiamento della prospettiva: dai sistemi altamente ottimizzati ma chiusi, progettati per un utilizzo in loco su hardware speciale, a servizi online progettati per un utilizzo su computer di uso comune e basati su protocolli di rete standard utilizzati dall'industria. Lo stesso periodo ha visto notevoli investimenti nell'ambito delle risorse condivise: i grandi cataloghi nazionali come il nostro Servizio Bibliotecario Nazionale (SBN) e gli sviluppi del prestito interbibliotecario ne sono un esempio. Contestualmente sono emersi in modo sempre più critico le restrizioni e i problemi legati al copyright e al diritto d'autore, che costituiscono un limite significativo allo scambio regolare di risorse di qualità tra istituzioni. Così se la rete è diventata sempre più ubiqua con la crescente digitalizzazione delle risorse, è evidente che la condivisione delle stesse risorse è tecnicamente possibile ma giuridicamente complessa da attuare. Nell'ultimo periodo della modernizzazione, i cataloghi online hanno creato una forte richiesta di contenuti da poter accedere sul Web. Tra la fine degli anni '80 e l'inizio degli anni '90 il costo delle memoria e le tecnologie di visualizzazione con file bitmap di immagini o testi ASCII è notevolmente diminuito, e l'HTML ha offerto un'ulteriore alternativa a editori e società di database per offrire il proprio materiale alle biblioteche. La convenienza dei contenuti digitali era così impressionante che moltissimi utenti hanno cominciato ad ignorare il materiale disponibile solo su carta, anche se a volte più appropriato, e a considerare i motori di ricerca una fonte primaria di informazioni. A partire dalla fine degli anni '80-inizio anni 90, forzate a reagire all'impatto culturale ed economico delle ICT, il focus delle biblioteche si è progressivamente spostato dall'automazione alla definizione del loro ruolo e dei servizi nell'era digitale, in cui sono stati determinanti la progressiva importanza del World Wide Web alla metà degli anni '90 e l'ascesa della computer science e del nuovo ruolo dei database in tutti i campi dell'istruzione. I progressi delle ICT e la rivoluzione del Web hanno funzionato da catalizzatori per le innovazioni e le trasformazioni nel mondo della comunicazione, della didattica e della ricerca universitaria. Nella ricerca, ad esempio, i ricercatori sono oggi in grado di lavorare continuamente a contatto con colleghi in tutto il mondo, su progetti di ricerca e sviluppo collaborativi. Nell'insegnamento in aula vi sono nuove modalità di didattica esperienziale, hands-on, spesso focalizzati sull'interazione Web-based, che possono avvenire sia nelle aule che nel cyberspazio. L'esperienza del campus non è più totalizzante ma diventa il crocevia di una serie di attività ed esperienze interdisciplinari spesso o in parte svolte al suo esterno, il che riflette l'atteggiamento dell'università stessa. I cambiamenti che avvengono nell'università devono essere rispecchiati da quelli nella sua infrastruttura informativa, che ha il suo cuore nella biblioteca universitaria. Tra il fiorire di sperimentazioni innovative e creative, è emersa l'idea di un ambiente informativo in rete che si presenta come una vasta costellazione di contenuti e servizi digitali online, accessibili in ogni momento da qualsiasi connessione remota, da poter essere utilizzate più volte, navigate, manipolate, integrate, personalizzate per gli obiettivi e le esigenze di ogni utente. L'identificazione delle risorse più appropriate ha posto il problema di chi dovesse farsi carico della responsabilità dell'organizzazione di network di risorse e le relazioni tra information provider e information user sono diventate più complesse, ma la condivisione di risorse a livello internazionale è risultata certamente facilitata. L'utilizzo del Web è diventato critico in molte forme di comunicazione universitaria: i pre-print e i report tecnici sono diventati ampliamente disponibili online e attorno ad essi si è sviluppato il movimento dell'Open Access; monografie e testi di consultazione sono confluiti in database e siti Web e in particolare nel mondo scientifico, dalla fisica alle scienze naturali, dalla biologia alla genetica, ma anche nell'ambito delle scienze sociali e in parte degli studi umanistici. All'inizio degli anni '90 in ambito anglosassone l'idea della biblioteca digitale è diventata molto popolare, in parte grazie ai programmi di finanziamento ARPA/NSF/NASA. I contenuti digitali hanno anche facilitato la creazione di e-reserves e hanno supportato i progetti di Online Distance Learning. Nel frattempo le aspettative degli utenti hanno registrato una nuova svolta: per-sonalizzazione della visualizzazione delle risorse informative, current awareness, sistemi di rating o selezione collaborativa sono stati sviluppati per gli utenti del Web. Questa impressionante mole di cambiamenti (nelle collezioni, nelle modalità d'accesso, negli spazi fisici e virtuali della biblioteca, nella conservazione, nelle attività), insieme alla coesistenza di nuovi supporti e dei processi ad essi legati con i documenti di tipo tradizionale, ha sollevato questioni metodologiche e strumentali: una così alta percentuale di contenuti si trova al di fuori del perimetro (fisico e concettuale) della biblioteca e dell'intero sistema editoriale tradizionale che non è chiaro quanta responsabilità possano o debbano assumersi le biblioteche in merito, e in che modo. Un aspetto rilevante di tale problematica è costituito dalla qualità dei documenti, che fa la differenza tra le collezioni e i servizi della biblioteca e l'enorme e caotico oceano informativo disponibile sul Web. Vi sono inoltre vari problemi di carattere economico, a fronte di budget sempre più ridotti. Il costo e l'ingombro delle pubblicazione scientifiche universitarie continua a crescere senza controllo, i documenti stampati tra la fine del XIX e l'inizio del XX secolo, prevalentemente su carta acida, continuano a disintegrarsi e richiederebbero investimenti in conservazione e/o digitalizzazione. Le spese per nuovi servizi vanno poi ad aggiungersi a quelli già esistenti: dalla descrizione dei documenti digitali multimediali alla loro archiviazione, dalla questione dell'autenticità, dell'integrità e della provenienza dei documenti (e quindi del copyright e dei diritti intellettuali e di sfruttamento) alla creazione di strumenti che ne permettano la manipolazione sul proprio desktop. La rivoluzione dell'informazione in rete è solo all'inizio, e probabilmente occorrerà ancora qualche decennio per perfezionare la tecnologia e raggiungere masse di contenuto sempre più consistenti 14 .

Le biblioteche universitarie oggi sono delle organizzazioni in cui i professionisti dell'informazione (bibliotecari e documentalisti) lavorano per garantire accessi mirati e selettivi agli artefatti informativi con valore aggiunto che fanno parte delle collezioni della biblioteca, così come a informazioni, risorse e sistemi disponibili altrove, nella logica dell'accesso anytime-anywhere 15 . E non soltanto offrono servizi Web-based, ma sono anche progressivamente coinvolte nella gestione e nell'organizzazione di collaborazioni e consulenze su aspetti informativi dei contenuti didattici e di ricerca. L'utente e i suoi bisogni diventano il focus dei servizi informativi, il cui valore aggiunto è nella valutazione, nell'analisi, nel 'confezionamento' e nelle modalità di divulgazione e di fruizione attivamente operate dal bibliotecario/documentalista. Dunque non una strategia del libro o della digitalizzazione o della tecnologia, ma una strategia dell'informazione, creando valore aggiunto attraverso strumenti di accesso che collegano le risorse selezionate da fonti disparate, fornendo collegamenti tra diversi strumenti di accesso all'oggetto informativo nella sua interezza, favorendo l'integrazione e lo scambio dei documenti. Questo processo sarà al contempo molto più impegnativo, ma anche più stimolante dell'automazione, e sarà proattivo: i cambiamenti nella pratica dell'editoria e della comunicazione universitaria, le applicazione della tecnologia didattica e gli sviluppi delle leggi sulla proprietà intellettuale plasmeranno gran parte del futuro delle biblioteche universitarie.

La situazione in Italia

Nel panorama internazionale la posizione dell'Italia è parzialmente disallineata ma comunque attiva. Negli ultimi anni le caratteristiche nelle biblioteche delle università italiane hanno determinato un alto grado di frammentazione e dispersione dell'informazione scientifica 16 , parallelo ad un ampio uso dell'informatica e dei servizi di reti telematiche che attesta modalità e supporti del tutto differenti da quelli che hanno caratterizzato i primi secoli di vita della biblioteca moderna. Per fronteggiare questa situazione, i sistemi bibliotecari di ateneo hanno registrato un notevole incremento degli investimenti per lo sviluppo di servizi e di progetti sperimentali nell'ambito delle ICT anche d'avanguardia 17 , dimostrando un approccio dinamico ed una sempre maggiore consapevolezza dell'importanza della funzionalità e dell'efficienza. Sembra tuttavia ancora lunga la strada da percorrere, a livello locale e nazionale, per raggiungere gli esempi del mondo anglosassone. Eterogeneità e specificità dei sistemi bibliotecari delle singole università, elevato numero delle strutture e livello dei servizi spesso non adeguato, uniti alla sostanziale autonomia normativa rispetto allo Stato ma non amministrativa rispetto all'ateneo, alla frammentazione organizzativa ed economica, all'assenza o carenza di monitoraggio, evidenziano un quadro non ancora sistemico e organico rispetto ad altre realtà internazionali 18 . La cooperazione inter-universitaria, che contribuisce al superamento dei particolarismi spesso riscontrati in ambito bibliotecario, si è manifestata intorno ad obiettivi concreti e specifici: i consorzi per la condivisione delle risorse elettroniche (CILEA, CIPE e CIBER), metodi e attività di monitoraggio dei sistemi bibliotecari (GIM), la cooperazione e collaborazione tra biblioteche in vari settori di attività ed in progetti innovativi (DAFNE); i network disciplinari (CNBA, ESSPER Matematica). Con l'anno accademico 2001/2002 è inoltre entrata in vigore la riforma degli ordinamenti didattici con l'istituzione della laurea triennale, che ha determinato un ampliamento dell'offerta didattica, ma anche l'incremento delle spese per le retribuzioni (legato all'aumento degli insegnamenti attivati). Ciò sembra aver prodotto una generaliz-zata contrazione delle spese, tra cui quelle per l'acquisizione del materiale librario, rimarcando ancora una volta un forte sbilanciamento fra l'offerta didattica e l'offerta di servizi bibliotecari. Il rapporto con l'utenza primaria dei docenti e degli studenti è caratterizzato dall'assenza o dalla lentezza della cosiddetta 'fidelizzazione', che risulta in un'occasione mancata di fruizione della biblioteca come laboratorio didattico e scientifico e luogo di apprendimento interattivo e socializzato. Dal punto di vista informatico, i pacchetti software utilizzati negli atenei per la gestione del catalogo digitale sono eterogenei, spesso anche all'interno di una stessa università. Anche se la tendenza generale è quella di dotarsi di uno strumento di gestione unitario, sembra utopistica l'idea di un software unico per le biblioteche di tutte le università italiane, visto anche che l'adesione al Servizio Bibliotecario Nazionale (SBN) non è assolutamente generalizzata. Il MetaOPAC Azalai italiano (MAI), che al momento offre una copertura solo parziale dei cataloghi delle università, potrà forse in futuro rispondere alle principali esigenze degli utenti di un catalogo nazionale. Aspetti critici, oltre alla limitata capacità di sviluppo delle collezioni, risultano essere la mancanza di una politica accademica e nazionale a sostegno dei sistemi bibliotecario universitari, oltre all'esistenza di un doppio livello di biblioteche universitarie, divise tra quelle più antiche, che appartengono al Ministero per i Beni e le Attività Culturali e sono pertanto fuori dal controllo delle rispettive università, e quelle moderne nate come servizio a istituti e dipartimenti, che costituiscono oggi il fulcro dei servizi bibliotecari degli atenei.

Sfide e scenari prossimi venturi

Come ha rilevato il sociologo Manuel Castells 19 , il nuovo paradigma informativo della società in rete presenta cinque caratteristiche: 1. l'informazione è materiale grezzo sui cui agiscono le nuove tecnologie; 2. gli effetti delle nuove tecnologie sono pervasivi e stanno plasmando tutti i processi delle nostre esperienze individuali e collettive; 3. la logica di networking ben si adatta alla sempre crescente complessità dell'interazione e agli imprevedibili percorsi di sviluppo, e può essere implementata in tutti i tipi di processi e organizzazioni; 4. tutti i processi sono reversibili e possono essere riconfigurati, in una società sempre più caratterizzata dal costante cambiamento e dalla fluidità organizzativa; 5. è in atto una crescente convergenza di tecnologie specifiche in un unico sistema altamente integrato. Le ICT sono al tempo stesso un prodotto della Knowledge Economy e un catalizzatore dei cambiamenti da essa apportati. Se le informazioni e la cono-scenza sono il carburante di questa economia, le biblioteche possono e devono essere i carburatori e le pompe di iniezione che rendono le informazioni disponibili quando e dove esse sono richieste. Alcuni esperti del settore, tra cui Clifford Linch 20 , hanno identificato i seguenti elementi chiave per le biblioteche universitarie del XXI secolo:

-creazione di una nuova definizione del canone dell'editoria e della comunicazione universitaria e delle relazioni delle biblioteche universitarie in rapporto ad essa, in termini di acquisizione o selezione, organizzazione, gestione, accesso e conservazione; -problematiche legate all'acquisizione, alla gestione e alla conservazione di materiali 'grezzi' per la didattica e la ricerca, a mano a mano che questi materiali diventano digitali e si diversificano e lo sviluppo delle ICT prosegue a ritmi sostenuti; -identificazione di un nuovo equilibrio tra azioni collettive e centralizzate e attività locali: in un mondo di risorse condivise su rete, si tenderà a centralizzare ulteriormente la gestione, l'organizzazione e la descrizione e aumenteranno le convergenze tra biblioteche, centri informativi e dipartimenti di informatica 21 ; -progressivo sviluppo di applicazioni e sistemi in-house, in opposizione all'acquisto di software proprietari; -le biblioteche dovranno sempre più occuparsi di questioni contabili, finanziarie e legali (inerenti copyright e proprietà intellettuale), oltre che rivedere il loro status giuridico e sostenere il riconoscimento della biblioteca e dei bibliotecari universitari nella società; -risoluzione dei sistematici problemi di finanziamenti, tramite l'introduzione di alcuni servizi a pagamento e la ricerca di sponsor; -sviluppo di nuovi ruoli per le biblioteche nel contesto universitario, abbracciando campi e raggiungendo comunità di utenti sempre più ampie e diversificate, anche in relazione alla crescente competizione tra gli atenei: insegnamento dei principi di base dell'information retrieval e la valutazione delle risorse informative; progettazione e gestione di prodotti didattici multimediali; partnership in progetti di ricerca e programmi su temi specifici dell'informazione e della documentazione; supporto di programmi e prodotti per l'informazione a distanza; fornitura di materiali didattici, in particolare di learning object; gestione delle problematiche relative ai diritti e della proprietà intellettuale, anche in una prospettiva di e-commerce; tirocini e consulenze nell'ambito della strutturazione, rappresentazione, organizzazione e conservazione dei dati. A tali scopi aumenterà anche l'utilizzo di figure paraprofessionali esperte nelle ICT.

La cooperazione tra le biblioteche universitarie e la tendenza a creare a consorzi regionali o disciplinari sarà uno dei fattori che influenzeranno di più la visione della biblioteca universitaria, influenzando le politiche di gestione delle collezioni. A loro volta, i progressi delle ICT porteranno ad una sempre maggiore integrazione di diverse tipologie di supporti, e con la disponibilità futura di più potenti larghezze di banda e di oggetti informativi multimediali sarà possibile progettare, sviluppare e alimentare sistemi interattivi molto più sofisticati. I software si stanno già evolvendo da applicazioni sul desktop o client-server ad applicazioni online: La fase successiva di questa evoluzione consisterà nello sviluppo di sofisticati servizi Web, che facilitano un'interazione diretta tra i programmi senza bisogno dell'intervento dell'utente e costituiscono delle componenti funzionali che possono combinarsi dinamicamente con altri servizi, per creare applicazioni più potenti ed efficaci. 28 , sono emersi gli elementi che influenzeranno la progettazione della biblioteca universitaria del futuro. In primo luogo, le risorse a stampa saranno ancora necessarie e l'accesso al mondo delle risorse in rete aumenterà sempre di più. L'equilibrio tra documenti analogici e documenti digitali varierà a seconda delle discipline, ma certamente maggiore spazio sarà richiesto per la fruizione dei documenti digitali. Si continuerà a fare affidamento sulla possibilità di accedere e di usare l'informazione dal campus, da casa e dal proprio spazio di lavoro, tramite le postazioni della biblioteca o usando il proprio computer. Gli utenti continueranno a studiare e a lavorare in modi diversi, in un'ottica di life-long learning, richiederanno orari di apertura più lunghi, accesso 24 ore su 24 ai servizi di rete, sezioni di raccolte di documenti specializzate per gli studenti post-laurea, incremento di sezioni a scaffale aperto, diversificazione delle postazioni. Le modalità di lavoro saranno spesso collaborative e si serviranno di molteplici media, aspetti che influenzeranno lo spazio dello studio e il tipo di attrezzature necessarie. L'indipendenza tecnologica degli utenti e la domanda per servizi self-service aumenteranno, ma sarà comunque necessaria l'assistenza nella scelta dei servizi e dei documenti disponibili 29 . Gli spazi di apprendimento dovranno essere flessibili, equipaggiati con varie facility e network accessibili da gruppi di studio e di progetto, workstation diversificate dotate di software per l'accesso online ma anche per la creazione di risorse multimediali in una varietà di formati, e assistenza tecnica a portata di mano. L'isolamento acustico sarà fondamentale in presenza di tali dispositivi, così come sarà sempre più importante che l'ambiente fisico sia ergonomicamente favorevole, esteticamente piacevole e sicuro. Crescente enfasi dovrà essere posta sul potenziale sociale/di intrattenimento delle biblioteche universitarie con l'aggiunta di spazi espositivi e caffetterie. Sarà perciò necessario che l'edificio sia sufficientemente flessibile per accomodare modifiche future portate dalla trasformazione delle modalità di insegnamento e apprendimento, non sottodimensionando gli spazi in fase di progetto. La biblioteca universitaria assomiglierà sempre più di più ad un laboratorio, dove gli studenti e i ricercatori integrano le informazioni da un'ampia gamma di tipologie di media 30 . Le implicazioni di questo cambiamento nella progettazione degli edifici non sono ancora state pienamente esplorate, e sono perciò necessari ulteriori studi sui nuovi comportamento degli utenti nel cercare, selezionare e usare le informazioni, e su come questi potrebbero essere facilitati dalla progettazione e dalle attrezzature dello spazio fisico.

Gli Information Commons 31 sono un primo tentativo di rispondere a questo scenario, ponendosi come nuovo tipo di facility fisica specificatamente progettata per organizzare lo spazio di lavoro e i servizi in un ambiente digitale integrato: sono caratterizzati da aree di workstation per uso individuale e collaborativo, con accesso ad un'ampia gamma di software oltre che di risorse informative, assistenza da parte dello staff della biblioteca specializzato in alcuni settori (computer, reference e nuovi media) che forniscono un servizio senza soluzione di continuità, e spazi di lavoro di gruppo o individuali fisicamente vicini agli specialisti e alle tecnologie, secondo un approccio one-stop shop. L'Information Commons della University of Southern California è stato uno dei primissimi e più pubblicizzati tentativi di incorporare questo nuovo tipo di spazio e di servizi, per fronteggiare ai nuovi bisogni dell'ambiente digitale. L'esperienza ebbe un tale successo che raddoppiò gli spazi alla fine del 1998 e da allora molte biblioteche nordamericane hanno adottato questo modello 32 .

In questo nuovo contesto Leighton e Weber 33 descrivono le due configurazioni di quella che chiamano la 'meta-library': 1. Integrated Facility: comprende sia la fornitura sia l'accesso all'informazione. Il risultato è un nuovo amalgama di funzioni e di spazi, che riuniscono le risorse informative, le tecnologie, i servizi e professionisti dell'informazione di tutto il campus; 2. Learning Centre: si focalizza sul supporto alla didattica universitaria, raccogliendo e riunendo sotto un unico tetto documenti, tecnologia, studenti, docenti e professionisti dell'informazione. Gli studi universitari sono collegati ad altre attività educative e culturali ad hoc, in uno spazio intellettualmente e socialmente integrato. Questo modello di biblioteca universitaria, basato su una organizzazione decentralizzata, è focalizzato sull'accesso distribuito ai servizi e continua ad evolversi al di là delle sue mura. Anche in passato alcune collezioni della biblioteca erano dislocate all'esterno, ma le tecnologie oggi consentono servizi e consulenze ancora una volta distribuiti e riposizionati vicini agli utenti, nei loro uffici e laboratori. Quali che siano le declinazioni di questo modello, esso sarà guidato soprattutto dagli obiettivi didattici delle singole università, dalla loro struttura organizzativa e istituzionale e dall'evoluzione dei comportamenti e delle richieste di una comunità di utenti sempre più eterogenea.

Spazi virtuali: biblioteche digitali e repository

Nonostante le molteplici riflessioni e gli sviluppi dell'ultimo decennio, non vi è una definizione unica di biblioteca digitale e questo concetto viene inteso in modo diverso dalle differenti comunità.

In questo volume si è adottata la famosa definizione utilizzata nel Workshop on distributed knowledge environment di Santa Fé, secondo cui una biblioteca digitale «is not merely equivalent to a digitized collection with information management tools. It is rather an environment to bring together collections, services, and people in support of the full life cycle of creation, dissemination, use, and preservation of data, information, and knowledge» 34 . L'aspetto importante è che una biblioteca digitale possiede del materiale digitalizzato e/o digitale nativo 35 , conservato nel sistema di un computer in una forma tale da poter essere manipolato e reso accessibile all'utente in modi che non erano possibili con i materiali analogici. Una biblioteca automatizzata non è necessariamente una biblioteca digitale, poiché una biblioteca che consiste interamente di materiali analogici potrebbe anche essere altamente automatizzata, ma questa automatizzazione non la rende 'digitale' nel senso indicato nel paragrafo 1.1. Tuttavia, è vero che una biblioteca digitale deve essere automatizzata in alcune delle sue funzioni essenziali 36 . Da un punto di vista informatico, la biblioteca digitale viene costruita su semplici componenti detti 'oggetti digitali'. Un oggetto digitale è un modo di strutturare in forma digitale l'informazione, in parte costituita da metadati. Le informazioni digitali però sono tutt'altro che semplici: una singola opera potrebbe essere costituite da più parti parti, una struttura interna complessa e una o più relazioni arbitrarie con altri lavori. Tutti gli oggetti digitali hanno la stessa forma base, ma la struttura dell'insieme di oggetti digitali dipende dal tipo di informazioni che essa rappresenta. Da un punto di vista dell'utente, la biblioteca digitale è basata sul flusso informativo e sull'organizzazione delle informazioni, con un modello a tre livelli di distribuzione: fornitore dell'informazione (information provider), mediatore dell'informazione (information broker) e utente dell'informa-zione (information user). I fornitori dell'informazione tipicamente producono contenuti digitali o digitalizzati di vari media e li conservano in database con contenuti multimediali, oppure li acquistano da altri fornitori. Per facilitare il recupero dell'informazione da parte degli utenti, i fornitori organizzano l'infor-mazione attaccando delle parole chiave al contenuto (diverse tra fornitore e fornitore), mettendolo in sequenza e così via, secondo percorsi di recupero tipici. Il secondo livello consiste di mediatori dell'informazione, che creano dei database di link che puntano ai contenuti dei fornitori di informazioni 37 , secondo le modalità con cui si ritiene che gli utenti vogliano accedere all'informazione. Un mediatore d'informazione appare quindi agli utenti come un gigantesco fornitore di contenuti. I mediatori possono anche fornire altri e vari servizi tra cui, per esempio, filtro delle informazioni, mirroring dei database, gestione del copyright e collezioni a pagamento degli information provider. Infine, quando ci si riferisce alla biblioteca digitale in genere si maschera il fatto che le biblioteche digitali esistono in forme diverse e con differenti funzioni, priorità e obiettivi. I vari progetti sviluppati in tutto il mondo hanno ognuno la propria personalità e riflettono le circostanze della loro nascita, le persone che se ne sono occupate e i diversi responsabili. Le biblioteche digitali probabilmente manteranno le loro caratteristiche distintive anche quando diventeranno maggiormente integrate e costruite su collezioni e servizi user-oriented. Ma vale la pena di riflettere su dove porterà la traiettoria di sviluppo 38 , e come verrà descritto il patrimonio di documenti che viene progressivamente reso disponibile per la ricerca e la didattica attraverso l'impegno di istituzioni no-profit.

Le biblioteche digitali in ambito universitario

Il primo studio di quella che oggi sono definite 'biblioteche digitali automatizzate' venne effettuato al Massacchuttes Institute of Technology negli anni '60 del secolo scorso, sotto la guida di J.C.R. Licklider 39 . Negli anni dei primissimi esperimenti di intelligenza artificiale, che alimentarono grandi speranze per l'imitazione dei processi umani tramite sofisticati algoritmi, Licklider descrisse il progetto di quelli che chiamava 'sistemi procognitivi', prevedendo che per l'anno 2000 si sarebbero superati i limiti fisici dei libri e degli scaffali della biblioteca. Oggi molti dei risultati che egli aveva previsto sono diventati realtà, ma non tutti e non nei modi che egli si aspettava. Lo sviluppo di sofisticati processi di elaborazione del linguaggio naturale è stato più lento di quanto sperava, e i software di utilizzo generico sono ancora lontani. Licklider e i suoi contemporanei avevano sottovalutato quanto sarebbe stato possibile ottenere nella realizzazione delle biblioteche digitali dalla sola forza computazionale, sfruttando le capacità di elaborazione di numerosi computer servendosi di algoritmi semplici, come è accaduto in ambito universitario. Lo sviluppo delle biblioteche digitali universitarie deve essere considerato nel contesto complessivo delle iniziative volte a unificare le infrastrutture informatiche e tecnologiche nel campus e trasformare il processo di apprendimento attraverso tecnologie innovative. Negli ultimi anni la riduzione del costo dell'hardware e la disponibilità di network a banda larga hanno reso accessibili all'istruzione un mix di sofisticati servizi digitali e Web-based, che stanno rapidamente diffondendo contenuti digitali per il virtual learning environment di cui la biblioteca digitale è una delle componenti chiave. Con il Web e le tecnologie telematiche i servizi della biblioteca si estendono al di là del suo spazio fisico e si registra una sempre maggiore aspettativa per servizi informativi personalizzati, veloci e sempre disponibili su dispositivi fissi e mobili. Ma qual'è in generale il ruolo delle biblioteche universitarie nello sviluppo delle biblioteche digitali? Al tempo dei primi progetti 40 , si trattava di attività largamente sperimentali e sviluppate non dalle biblioteche (come è il caso di SFX), ma dai centri di computer science e robotica (Informedia), supercomputer (Internet Archive), laboratori di ricerca industriale (ResearchIndex), e si servono di staff altamente qualificato. Successivamente, gli esperti di computer science hanno cominciato a collaborare con le biblioteche e varie organizzazioni sono state coinvolte nell'implementazione delle tecnologie delle biblioteche digitali, inclusa la Comunità Europea, la Association for Computing Machinery (ACM), l'Institute of Electrical and Electronics Engineers (IEEE), la International Federation of Library Associations (IFLA), la American Library Association (ALA), the Coalition for Networked Information (CNI) e la Digital Library Federation (DLF). Anche le case produttrici di software per biblioteche hanno introdotto i primi prodotti commerciali, destinati alle istituzioni didattiche che cercavano semplici soluzioni facili da installare e da manutere. La maggior parte dei progetti di biblioteche digitali in ambito universitario derivano da idee innovative sul futuro ruolo delle biblioteche in un ambiente didattico in rete, e sono stati finanziati grazie ad un sostanziale impegno istituzionale. All'inizio degli anni '90 la biblioteca cerca di sfruttare Internet per svolgere dei ruoli tradizionali, come ad esempio dare accesso ai cataloghi della biblioteca, ad alcuni materiali di reference e a periodici scientifici. Con le successive sperimentazioni nella riformattazione digitale, accompagnate dalla retorica sull'accesso universale a tutta la conoscenza umana, alcune biblioteche si sono focalizzate sull'accesso online a risorse selezionate. Giudicati alla luce delle aspettative iniziali, le prime collezioni sul Web nella maggiore parte dei casi erano troppo piccole per supportare più di un browsing casuale, troppo idiosincratiche per essere integrate in modo significativo in collezioni virtuali più ampie e troppo passive per mantenere l'interesse dell'utente a lungo. L'ubiqua penetrazione delle tecnologie di rete oggi crea nuove opportunità per forme più strette di associazione e condivisione delle risorse e il focus è stato spostato sull'integrazione dei materiali digitali nella collezione della biblioteca. Le biblioteche digitali attuali sono più interessate ai sistemi di architetture modulari e sono concepite come un complesso ambiente di servizi online supportato da sistemi locali e globali, ognuno dei quali fornisce specifiche funzioni e si interrala con gli altri in un modo rappresentabile attraverso uno schema architettonico modulare. Questo modello non è solo sofisticato ma anche pratico ed economico, permette maggiore libertà nella selezione dei componenti di servizio e abilita la biblioteca a gestire e rispondere ai cambiamenti tecnici con maggiore facilità, senza re-ingegnerizzare l'intero ambiente di servizio.

Architettura, componenti e caratteristiche delle biblioteche digitali

Un ambiente completamente sviluppato di biblioteca digitale include le seguenti componenti funzionali (Fig. 5 Queste componenti potrebbero anche non far tutte parti di un sistema di biblioteca digitale, ma essere fornite da altri sistemi/ambienti correlati o multifunzionali. Di conseguenza, l'integrazione è un tema essenziale: per interoperare con l'infrastruttura bibliotecaria esistente, la biblioteca digitale deve essere progettata per lavorare con i cataloghi esistenti e per incorporare standard, formati e protocolli bibliotecari. Per sua natura, le collezioni digitali richiedono un uso intensivo delle tecnologie. Oggi i maggiori progetti di biblioteche digitali stanno mettendo online collezioni di notevoli dimensioni (a volte milioni di oggetti digitali), che richiederanno capacità di deposito misurate in Petabytes (1 Petabyte è l'equivalente di oltre 50.000 desktop computer con 20 Gigabytes di hard drive ciascuno).Poiché le biblioteche digitali variano in dimensioni e funzionalità, è essenziale che le piattaforme tecnologiche sottostanti offrano le performance e l'affidabilità richiesta. Inoltre gli utenti si aspettano servizi di alta qualità, il che significa che non sono tollerabili tempi di attesa lunghi e risposte incomplete. Infine, poiché i costi sono sempre un aspetto critico, la scalabilità, l'efficienza e un'architettura di sistema aperta costituiscono dei requisiti chiave. Anche le capacità di archiviazione devono essere scalabili per adattarsi alla rapida crescita della domanda, e devono adattarsi a varie tipologia di media che possono essere conservate in una biblioteca digitale: -file di testo (relativamente stabili e non richiedono grandi quantità di dati da archiviare); -file di grafica (possono essere dinamici e richiedere grandi quantità di dati da archiviare); -file audio (altamente dinamici); -file video (altamente dinamici e possono richiedere grandi quantità di dati da archiviare). L'uso di nuovi modelli computazionali, di Internet e dei portali, il crescente numero di studenti al di fuori dal campus e la necessità di gestire meglio risorse eterogenee in ambienti di rete hanno stimolato lo sviluppo di molte applicazioni bibliotecarie. Per ottenere benefici reali e un modello economico fattibile, le biblioteche digitali devono poter supportare la pratica non solo didattica ma anche professionale dei vari ambiti disciplinari, da un lato sviluppando sistemi innovativi e dall'altro educando gli utenti al loro utilizzo 41 . L'accesso all'informazione dovrebbe essere inserito senza soluzione di continuità in un sistema integrato che superi le limitazioni dei materiali cartacei e supporti il lavoro degli utenti, l'accesso alle informazioni e il loro utilizzo e applicazione. Alcuni esempi famosi in quest'ottica sono quelli dell'Art Museum Image Consortium (AMICO) 42 Gli applicativi realizzati in-house sono frequenti nei primi progetti di biblioteche digitali, principalmente perché le soluzioni commerciali adeguate hanno cominciato ad essere disponibili in tempi relativamente recenti. Questo approccio oggi presenta sia vantaggi che svantaggi. Tra i primi vi è la possibilità di modellare l'applicazione sui bisogni specifici dell'utente, e di spalmare il costo iniziale su un lungo periodo di utilizzo senza ulteriori spese di licenze o di manutenzione. Lo sviluppo futuro è controllabile e prevedibile, e non vi dovrebbero essere dubbi sulla costante disponibilità del sistema. Il costo dello sviluppo e del mantenimento di un ambiente complesso di gestione di multimedia è tuttavia alto, e non sempre è possibile disporre di un budget e di competenze tecniche adeguate. Varie aziende produttrici di sistemi di automazione per biblioteche e sistemi di ricerca cross-database (tra cui Endeavor Information Systems, Ex Libris e Millenium) offrono anche soluzioni per biblioteche digitali, e altre società di tecnologie di gestione di multimedia stanno cominciando ad orientarsi verso il mercato della didattica e delle biblioteche. In generale, la sfida è capire come passare dalle collezioni digitali isolate alle biblioteche digitali interoperabili, e come trasportare nelle biblioteche digitali i componenti della biblioteca tradizionale: infrastrutture, metadati robusti e strategie di conservazione efficaci 48 .

Figure 5

Il contesto in cui si muove MPEG-7 inD. Dale, R. Rog, 2002)

Table

Interoperabilità, standard, modelli organizzativi

Nei primi progetti di biblioteche digitali l'utente doveva interagire con ogni repository in modo indipendente, impararne la sintassi e installare sul proprio computer le applicazioni necessarie per visualizzare i documenti digitali di ciascuno. Gli utenti di oggi chiedono presentazioni senza soluzione di continuità delle collezioni e dei servizi, indipendentemente da dove, da chi e in quale formato esse sono gestite, cui accedere attraverso un'unica query (Fig. 6) e un ambiente di ricerca da personalizzare in base alle loro esigenze. Gli sviluppi degli OPAC sono stati un progresso in tal senso, i browser Web hanno dato un aspetto unitario alle interfacce dei differenti database e i protocolli Z39.50 hanno permesso agli utenti di impiegare una sintassi di ricerca familiare. Ma quando si lascia il mondo degli OPAC e si entra in quello dei repository digitali, l'interoperabilità è ancora lontana. Per ottenerla è necessario perfezionare la metrica per identificare e analizzare i bisogni degli utenti, e aderire a processi e codifiche standard, che permettano alla biblioteca digitale di fornire una vista consistente e coerente di quanti più repository possibili: dagli standard per vari tipi di metadati (amministrativi, strut-turali, di identificazione, di longevità) ai modi per rendere i metadati visibili a sistemi esterni (harvesting), alle architetture comuni per supportare l'interoperabilità (open archives). Questi due aspetti hanno implicazioni rivoluzionarie per la biblioteca. Da un lato l'integrazione in un network integrato di servizi informativi, sfidando la sua tradizionale insularità organizzativa; dall'altro, la collocazione di parte delle collezioni e dei servizi in nuovi contesti esterni alla biblioteca. La rapida penetrazione delle tecnologie di rete ha minato le fondamenta della forma fisica, culturale, organizzativa, finanziaria e professionale delle biblioteche universitarie. In un mondo interconnesso, in cui l'accesso ad una larga parte dell'informazione non richiede più la prossimità al medium fisico su cui essa è trasportata, si potrebbero ipotizzare la seguente articolazione dei servizi informativi:

Figure 6

-punti di servizio (biblioteche universitarie) che gestiscono l'accesso tramite la messa online, print-on-demand ecc.; -repository per la gestione dei documenti digitali e loro disponibilità ai diversi punti di servizio; repository per i documenti analogici, che li rendono disponibili a quegli studiosi le cui ricerche richiedono la manipolazione e l'osservazione diretta.

[ Fig. 6 Si può anche immaginare una gamma di servizi essenziali di supporto ai punti di servizio e ai repository, che includono cataloghi partecipati sul posseduto, e servizi per la denominazione e l'identificazione persistente dei file. Ma se le tecnologie di rete permettono agli utenti di accedere alle informazioni indipendentemente dalla localizzazione delle informazioni, vi sono ancora ostacoli significativi alla vera condivisione delle risorse, inclusi gli effetti della competizione tra università sulla cooperazione bibliotecaria. La fornitura coordinata di servizi informativi di rete è probabilmente la sfida maggiore che le biblioteche affrontano oggi. Senza un approccio e una collaborazione tecnologica di tutto il campus con la biblioteca, che includa anche le risorse digitali già disponibili, questi sistemi sono destinati ad essere ridondanti e con risultati limitati, a fronte di budget già ridotti.

Linee di sviluppo future

Tra le tendenze che stanno emergendo e che continueranno ad affermarsi nel contesto delle biblioteche digitali, è possibile identificare alcuni punti salienti 49 . In primis questioni relative alle architetture dei sistemi (query routing, interazione con il database e gestione della consistenza) e all'organizzazione dei network locali, così che questi possano cooperare e avvantaggiarsi del loro potenziale su una scala globale, dove i componenti sono gestiti da varie istituzioni indipendenti con scopi e priorità diverse. Molti aspetti della ricerca crossdatabase (sicurezza, privacy, servizi a pagamento) sono tecnicamente difficili, perchè i sistemi perdono la loro efficacia senza un sostanziale livello di standardizzazione e armonizzazione. Le attività relative ai metadati saranno sempre più finalizzate ad incrementare il livello di standardizzazione e conformità, permettendo al tempo stesso flessibilità per continuare a incoraggiare la creazione di contenuto. Assisteremo poi al progressivo passaggio dai sistemi testuali a quelli multimediali, grazie alla riduzione dei costi dei network a banda larga e ai miglioramenti delle tecnologie di streaming, ed emergeranno best practice comuni per la digitalizzazione, la gestione dei diritti, la conservazione, la codifica dei metadati e altri processi chiave della biblioteca digitale. Il mondo delle biblioteche lavorerà sempre più al fianco delle organizzazioni internazionali preposte alla creazione degli standard, che saranno recepiti nei prodotti commerciali, e la prossima fase dello sviluppo delle biblioteche digitali si focalizzerà sulla standardizzazione, sulla personalizzazione e lo user modeling, sull'usabilità, su spazi di lavoro collaborativi, fornendo maggiore interoperabilità tra le collezioni digitali e scelte cost-effective per le istituzioni che incominceranno a digitalizzare.

In questi ambiti nuovi servizi tecnologici potenzieranno il processo di comunicazione scientifica, insieme ai sistemi di rating e Web-feed, e l'accesso ai materiali sarà integrato con quello agli strumenti necessari per elaborare e presentare questi materiali: dalle strutture semantiche per supportare la ricerca e il recupero dei documenti, sia in modalità manuale che automatizzata, alle tecniche di Natural Language Processing (inclusi i riassunti, l'estrazione dell'informazione, traduzione e riconoscimento automatico del parlato) e alla modelizzazione statistica e scientifica, dai rendering grafici alla visualizzazione. Per effettuare query attraverso database multipli verranno implementati i sistemi di Multimedia Information Retrieval, ambito nel quale si cercheranno di risolvere le questioni relative a ranking unificato, eliminazione dei risultati doppione e delle inconsistenze, combinazione di dati strutturali, funzionali, sociali ed economici e utilizzo di tecniche di statistica e di sistemi di intelligenza artificiale. Per quanto riguarda le questioni economiche, la crescente dipendenza dalle risorse digitali determinerà la creazione di soluzioni cooperative per la conservazione nel lungo periodo a costi contenuti. L'accesso ad alcune informazioni potrebbe essere ristretto, ma anche quando l'informazione è gratuita, rimarrà il problema della gestione e della protezione dei diritti e delle informazioni personali. Inoltre il problema della digitalizzazione non è solo e tanto di carattere economico o tecnologico, ma piuttosto giuridico, dato che i diritti di riproduzione e di proprietà rimangono in vigore a lungo. Le biblioteche digitali avranno bisogno di modelli economici sostenibili, poiché come hanno già dimostrato molti progetti, l'eccellenza tecnica e intellettuale non garantiscono da sole il successo. In generale, è chiaro come la tecnologia della biblioteca digitale stia diventando un essenziale abilitatore dei servizi delle biblioteche. Il termine stesso sta già cominciando a diventare anacronistico, così come il termine electronic banking oggi viene indicato semplicemente come banking. È certo che tutte le biblioteche in futuro saranno caratterizzate da servizi informativi basati sulle ICT, che estenderanno e potenzieranno la tradizionale missione delle biblioteche nella nostra società.

2.7

Knowledge Management e sistemi di organizzazione della conoscenza La crescente concorrenza in un'economia globalizzata ha spinto le organizzazioni a un diverso genere di allocazione delle risorse e alla valorizzazione del capitale umano. Il Knowledge Management (KM) è un approccio strategico integrato, promosso principalmente attraverso la tecnologia (ma non esclusivamente attraverso di essa) e basato sulle attività di documentazione e di for-mazione. In sintesi esso tenta di teorizzare, acquisire, rielaborare, arricchire e trasmettere il capitale umano, per modificare il comportamento e la struttura dell'organizzazione e consentirle di capitalizzare e trasmettere conoscenza esplicitata, rendendo quindi più efficiente la sua produttività e innovazione. Ma i contenuti di valore di questo capitale per loro natura non sono direttamente percettibili, né operabili in un normale sistema informativo aziendale: la scommessa del KM consiste perciò nel rendere rielaborabile in modo il più possibile automatizzato questa conoscenza tacita e intangibile (Fig. 7). Poiché i progressi dell'ingegneria dell'intelligenza artificiale sono ancora lontani dall'eguagliare il sistema cognitivo umano, occorre elaborare quelli che Bogliolo definisce 'sistemi differenziali di significato', che costituiscono la base per un'integrazione dinamica di universi semantici diversi 50 e le pratiche organizzative. La trasformazione dei centri di documentazione aziendale è quindi riassumibile come l'evoluzione da un centro di costo ad un centro di valore aggiunto, che non si limita a offrire servizi ma incontra proattivamente i bisogni degli utenti, cambiando il proprio ruolo da distributore dell'informazione a partner di conoscenze, che supportano le attività di ricerca e sviluppo della organizzazione, definiscono un legame tra informazioni esterne ed interne e contribuiscono a creare contatti fra i diversi settori dell'azienda.. L'organizzazione knowledge managed diventa quindi learning -o learned -organization‚ similmente ad una università o ad un ente di ricerca. Dal punto di vista del KM, le similitudini tra il gruppo di lavoro di un'azienda e quello di un'università sono varie, dall'approccio collaborativi alla centralità dell'utente come esperto di un certo ambito. Se le biblioteche universitarie venissero percepite come un valido supporto all'attività di decision-making, i dipartimenti, le facoltà e le università nel loro insieme agirebbero come un'azienda e si potrebbero applicare i principi del KM. Una differenza si rileva invece nei servizi di reference, che in ambito universitario vengono offerti in modo generico a tutta la comunità come un insieme, mentre in un'azienda essi vengono personalizzati per piccoli gruppi che condividono gli stessi sistemi semantici e lavorano su progetti specifici. Poiché il KM lavora sulla condivisione della conoscenza tacita, questa attività potrebbe essere perseguita solo in gruppi omogenei e coesi all'interno dell'università. Bogliolo sostiene che esso possa essere adottato con successo in biblioteca solo se finalizzato al miglioramento della qualità dei servizi bibliotecari, cioè identificando la biblioteca come una struttura organizzativa che apprende in continuo divenire, il cui obiettivo è rendere più efficienti ed efficaci nei processi e nelle procedure. Quando si va ad applicare praticamente l'approccio knowledge-based, una delle trappole maggiori, come ricorda McDermott 51 , riguarda l'utilizzo nell'utilizzo degli strumenti e concetti di gestione dell'informazione per progettare sistemi di gestione della conoscenza: conoscere un ambito o una disciplina significa infatti essere in grado di pensare nel suo territorio, e per tale motivo le idee sono significative solo in relazione agli 'abiti mentali' di una comunità. Spesso chi implementa le tecnologie è talmente assorbito dall'aspetto gestionale che perde di vista gli obiettivi originali del loro utilizzo. In ambito biblioteconomico, si è cominciato ad affrontare la questione dell'organizzazione e della condivisione della conoscenza in termini di sistematizzazione e di trasposizione in un nuovo contesto di strumenti ben noti nel mondo delle biblioteche digitali, e durante la ACM Digital Libraries '98 Conference di Pittsburgh in Pennsylvania, è stato coniato il termine di Knowledge Organization System (KOS) 52 . I KOS includono tutti gli schemi per organizzare, gestire e recuperare l'informazione, con la funzione primaria di fornire accesso ai documenti per una specifica comunità secondo un approccio knowledge-managed: ad esempio schemi di classificazione e categorizzazione che organizzano i materiali ad un livello generale, soggettari che forniscono un accesso più dettagliato, e liste d'autorità che controllano le varianti di nomi geografici e nomi propri, ma anche vocabolari altamente strutturati come i thesauri, e schemi meno tradizionali come i network semantici e le ontologie (cfr. i paragrafi 2.2.5 e 2.2.7). Essi rivestono un ruolo importante nella costruzione delle collezioni, nella scoperta e nella ricerca, nella navigazione, valutazione e visualizzazione: perciò per il successo dell'implementazione e dell'utilizzo di qualsiasi biblioteca digitale, è essenziale che questa venga organizzata, direttamente o indirettamente, da uno o più sistemi di organizzazione della conoscenza, e si può affermare che l'architettura di una biblioteca digitale è costituita dalle sue collezioni, dai suoi KOS e dai servizi che essa mette a disposizione. Vi sono molteplici modi per organizzare la conoscenza. A seconda dei contesti, i KOS possono essere presi in prestito da una biblioteca nazionale, da un motore di ricerca, oppure sviluppati localmente; possono essere applicati ai record di metadati di ogni risorsa, inseriti nei metatag, oppure separati dalle risorse della biblioteca digitale come parte del meccanismo di accesso. A fronte di queste diversità i KOS condividono le seguenti caratteristiche, che influiscono profondamente sul modo in cui sono organizzate le biblioteche digitali:

Figure 7

-un KOS impone una particolare visione del mondo sulla collezione e sui documenti che ne fanno parte, poiché modella un dominio della conoscenza ed è progettato per un obiettivo specifico. Per tale motivo ogni KOS possiede una sua metastruttura, la cui comprensione è necessaria per l'interpretazione dei contenuti; -la stessa entità può essere caratterizzata in modi diversi, a seconda del KOS utilizzato; -il valore di un KOS deriva dal riconoscimento e dalla validazione della comunità di utenti (ad esempio organizzazioni di istruzione, associazioni commerciali o gruppi di standard); -vi deve essere sufficiente comunanza tra un concetto espresso in un KOS e l'oggetto del mondo reale cui si riferisce quel concetto, cosicché una persona sia in grado di applicare il sistema con ragionevole affidabilità. Nel più ampio contesto dell'Internet Commons, i KOS sono degli strumenti in grado di fornire chiavi di soggetto alternative, fornendo uno o più intestazioni aggiuntive che rendono i documenti della biblioteca digitale accessibili ad audience diverse, che non condividono una terminologia comune. Inoltre essi supportano un accesso multilingue, ad esempio tramite dizionari e thesauri quali il Generalized Multilingual Environmental Thesaurus (GEMET) della European Environment Agency (EEA), e forniscono termini per espandere le ricerche testuali, in ambiti poco noti all'utente o in settore interdisciplinari. Uno dei modi possibili per superare queste difficoltà terminologiche è quella di usare i KOS come supporti nella selezione di parole chiave a testo libero, come evidenziano i vocabolari del Getty Vocabulary Project (Art and Architecture Thesaurus, the Union List of Artists Names, and the Thesaurus of Geographic Names). Infine, l'utilizzo dei KOS favorisce l'analisi dei bisogni degli utenti, fondamentale in ogni progetto di biblioteca digitale. [ 1 ] Il termine 'biblioteca' viene qui utilizzato per indicare ogni organizzazione che fornisce servizi informativi, il cui scopo primario sia quello dell'acquisizione, organizzazione, preservazione e predisposizione dell'accesso all'informazione. Per 'bibliotecari' si intende chiunque svolga o diriga un lavoro direttamente correlato alla missione e ai servizi della biblioteca, come sopra definita. [ 2 ] Per il concetto di biblioteca come sistema aperto cfr. P. Traniello, La biblioteca tra istituzione e sistema comunicativo, Editrice Bibliografica, Milano 1986; G. Tirelli, Il 'sistema' biblioteca, Editrice Bibliografica, Milano 1990. [ 3 ] G [ 5 ] R. Ridi, Il mondo come volontà e documentazione. Definizione, selezione e accesso alle risorse elettroniche remote (RER), bozza dell'intervento in Risorse elettroniche, definizione, selezione e catalogazione, cit., <http://w3.uniroma1.it/ssab/er/relazioni/ridi_ita.pdf> [ 6 ] B. Tillett, Gli aggiornamenti delle AACR2 per le risorse elettroniche. La risposta di un codice di catalogazione multinazionale. Un approfondimento, traduzione provvisoria, in ibidem <http://w3.uniroma1.it/ssab/er/relazioni/ti llett_ita.pdf> [ 7 ] Regole tecniche per la riproduzione e conservazione di documenti su supporto ottico idoneo a garantire la conformità dei documenti agli originali -articolo 6, commi 1 e 2, del Testo unico delle disposizioni legislative e regolamentari in materia di documentazione amministrativa, di cui al decreto del Presidente della Repubblica 28 dicembre 2000, n. 445, consultabile a <http://www.interlex.it/testi/aipa0142.htm >. La deliberazione dell'Autorità per l'Informatica nella Pubblica Amministrazione (AIPA) sui supporti ottici, approvata il 17 ottobre 2001, intendeva risolvere i problemi di compatibilità tra la precedente deliberazione n. 24/1998, il DPCM 08/02/99 e il DPR 445/2000, che disciplinava la riproduzione e la conservazione dei documenti. [ 8 ] Con il termine 'audiovisuale', si intende ogni documento che presenta suoni registrati e immagini in movimento o ferme. Con il termine 'multimediale', si intende ogni medium che risiede in uno o più supporti fisici (ad es. un CD-ROM) oppure in network o sistemi di computer. I multimedia interattivi dovrebbero presentare le seguenti caratteristiche: essere controllati dall'utente, con una navigazione non lineare usando la tecnologia del computer; la combinazione di due o più media (suoni, testi, grafica, animazione e video) che l'utente manipola per controllare l'ordine e/o la natura della presentazione.

Note

[ 9 ]

Cfr. M. Guerrini, Il catalogo di qualità, presentazione di L. Crocetti, Giunta regionale, Firenze 2002.

[ 10 ]

Convergence in the digital age. Challenges for Libraries, Museums and Archives

Proceedings of the Seminar, CORDIS, 13 -14 August 1998, Amsterdam, <ftp://ftp.cordis.lu/pub/libraries/docs/proceedings.pdf> [ 11 ] Secondo la fortunata metafora di Weston e Pernigotti (P.G. Weston, A. Pernigotti, La biblioteca nel computer : come automatizzare?, con la collaborazione di M. Ghera, presentazione di L.E. Boyle, Biblioteca Apostolica Vaticana, Citta del Vaticano 1990), come nella rivoluzione copernicana non è più il lettore a girare intorno al catalogo, bensì è il catalogo a girare intorno al lettore. [ [ 15 ] Nelle Linee guida per la valutazione delle biblioteche universitarie (edizione italiana di Measuring quality, a cura della Commissione nazionale Università ricerca. Roma, Associazione Italiana Biblioteche, 1999) si afferma che il fine istituzionale di una biblioteca universitaria è quello di «scegliere, raccogliere, organizzare e consentire l'accesso all'informazione all'utenza, in particolare all'utenza primaria, rappresentata dai membri dell'istituzione». [ 16 ] Osservatorio per la valutazione del sistema universitario. Misurazione [ 17 ] Tra cui l'Università di Firenze per l'evoluzione dell'assetto organizzativo e per il progetto innovativo della University Press, il sistema bibliotecario dell'Università di Padova per il servizio Banche dati in rete, che viene erogato anche ad enti terzi con una originale formula di partnership pubblico-privato; l'Università di Bologna per il catalogo nazionale dei periodici ACNP. [ 18 ] Cfr. [ 21 ] L. Hardesty, Books Bytes and Bridges: Libraries and Computer Centers in Academic Institutions, American Library Association, Chicago 2000. [ 22 ] SGML è uno standard internazionale per i sistemi di markup testuali ampi e complessi, che descrive migliaia di differenti tipi di documenti. XML è uno standard per la descrizione di altri linguaggi, scritto in SGML, che permette la progettazione di linguaggi personalizzati di markup per tipi illimitati di documenti, fornendo un modo flessibile e semplici per scrivere applicazioni Web-based. I principali standard che alimentano i servizi Web sono basati XML e includono il Simple Object Access Protocol (SOAP), la Universal Description, Discovery and Integration (UDDI), il Web Services Description Language (WSDL), l'Electronic Business XML (ebXML). [ 23 ] L. Hardesty, Do we need academic libraries?, cit. [ 24 ] <http://www.eprints.org> [ 25 ] <http://web.mit.edu/dspace> [ 26 ] G. Solimine, Spazio e funzioni nell'evoluzione della biblioteca: una prospettiva storica, in La biblioteca tra spazio e progetto. Nuove frontiere dell'architettura e nuovi scenari tecnologici, V Conferenza Nazionale per i Beni Librari, 7-8 marzo 1996, Editrice Bibliografica, Milano 1998, p. 34. [ 27 ] M. Eisenberg et alii, Re-Envisioning the Library: The Intellectual Commons of the University, Washington University, 7 December 2000, <http://www.washington.edu/change/library/appb.pdf> [ 28 ] H.M. King [ 29 ] L. Hardesty, Do we need academic libraries?, cit. [ Nell'era digitale, l'informazione e il medium su cui essa è registrata può essere considerato in forma digitalizzata o meno. Naturalmente vi sono anche altri modi di categorizzare il materiale, ma la leggibilità al computer è un criterio importante.

[ 36 ] Cfr <www.amico.org> [ 43 ] <http://elib.cs.berkeley.edu> <http://sunsite.berkeley.edu> [ 44 ] <http://campusgw.library.cornell.edu> [ 45 ] <http://lib.harvard.edu> [ 46 ] <http://www.jstor.org> [ 47 ] <http://www-sul.stanford.edu> <http://highwire.stanford.edu> [ 48 ] H.

Organizzazione e restituzione della conoscenza in ambienti di rete

Perla Innocenti

The nice thing about standards is that you have so many to choose from.

Furthermore, if you do not like any of them, you can just wait for next year's model

Andrew Tanenbaum

In un sistema di organizzazione dei documenti, la caratteristica più importante dell'informazione è che può essere usata fuori dal contesto. La conoscenza riguarda invece la ricostruzione delle reti di relazioni, dei contesti. Nell'ambito di questo volume, per documento si intende qualcosa che può essere localizzato e manipolato sia attraverso l'attività umana che tramite un sistema automatico come un'entità discreta. In generale tutti i documenti, indipendentemente dalla forma fisica o intellettuale che essi assumono, possiedono tre caratteristiche: contenuto, contesto e struttura, le quali possono essere ricomposte attraverso i metadati. Il contenuto stabilisce un nesso tra ciò che il documento contiene in sé o nei suoi dintorni ed è intrinseco al documento stesso. Il contesto indica il chi, cosa, perché, dove: tutti aspetti associati con la creazione dell'oggetto e comunque estrinseci al documento stesso. La struttura si riferisce all'insieme formale di associazioni situate all'in-terno o tra documenti, che possono essere intrinseche o estrinseche. Un documento digitale, rispetto ad uno analogico, è un'entità complessa, multiparte, costituito da contenuti originariamente digitali oppure derivanti da riformattazione, codificati e integrati da metadati per supportare l'archiviazione, la scoperta e l'uso del documento 1 . In ambito biblioteconomico la sua natura pone una serie di questioni aggiuntive: ad esempio la questione delle unità bibliografiche nelle strutture multi-parte in un contesto digitale 2 porta a rivedere il concetto di unità bibliografica, la relazione tra record bibliografico e unità bibliografica e l'eventuale necessità di descrizioni ad un livello di granularità più approfondito. Da un punto di vista documentale, i problemi chiave riguardanti l'odierna sistematizzazione e fruibilità di documenti digitali in ambienti di rete sono sostanzialmente cinque, da affrontare in modo unitario: -gli standard di digitalizzazione: ovvero la qualità della trasposizione dell'informazione analogica in digitale, tipicamente per un'immagine esplicitabile in parametri come risoluzione, fedeltà del colore, capacità di cogliere le sfumature, consistenza della procedura attraverso tutte le sue fasi dall'acquisizione alla visualizzazione a schermo fino alla stampa; -gli standard di documentazione: ovvero come strutturiamo e contestualizziamo l'informazione per permettere la condivisione e l'utilizzo dei documenti in un ambiente informativo integrato; -le modalità di conservazione: ovvero i metodi con cui preserviamo i documenti digitali e affrontiamo il problema dell'obsolescenza tecnologica. Il rapido sviluppo delle tecnologie e il degrado dei mezzi di archiviazione digitale rende infatti questi dati inaccessibili molto più rapidamente dei dati su supporto cartaceo (Fig. 1); -le modalità di accesso: ovvero i metodi con cui si affrontano i problemi di diritto d'autore e copyright, la risposta ai bisogni dell'utente e i problemi tecnici di delivery. La loro risoluzione é essenziale laddove molti utenti devono poter accedere a risorse in un ambiente di rete come Internet; -gli standard tecnici: cioè i formati e i metodi di gestione dell'informazione. Il loro utilizzo implica lunga durata e interoperabilità. In un'accezione più ampia, interoperabilità significa efficace coesistenza su vari livelli (operativi, semantici e linguistici) di diverse risorse informative. È chiaro come l'approccio metodologico sia quello che presenta la necessità di maggiori riflessioni, perché rappresenta la base che consentirà di richiamare o individuare o meno una data informazione. La soluzione delle tematiche sopraelencate comporta infatti un lungo cammino, non risolvibile semplice-mente impostando una procedura unificata a-priori ma chiarendo, a mano a mano che il lavoro procede, singoli e specifici aspetti nell'ambito di un quadro unificante metodologico, basato sul riferimento agli standard. Non esiste infatti attività che noi svolgiamo quotidianamente che non sia o non possa essere regolamentata da uno standard 3 , elaborato attraverso il consenso professionale ed approvato da uno o più enti riconosciuti 4 . Poiché il progetto descritto nel volume si propone lo scopo di operare entro questo quadro, per cercare di definire una metodologia di base relativa al secondo dei cinque punti fissati, nei paragrafi successivi verranno analizzate in quest'ottica le tematiche relative all'organizzazione e alla gestione delle conoscenze in ambienti di rete.

Standard di digitalizzazione

Oggi, solitamente, a differenti tipologie di giacimenti documentali (che siano archivi di preziosi manoscritti o letteratura grigia) corrispondono anche differenti strutture di conservazione, ubicate a volte in luoghi diversi e spesso governate da sistemi, regole di conservazioni e gestori differenti. Dal punto di vista dell'utente, ciò che contraddistingue la ricerca è proprio la frammentazione ubicativa (se non addirittura sovente lo smembramento e la perdita) che deriva da questa diaspora gestionale, l'impossibilità di ricerca statistica e quantitativa, la difficoltà di analisi comparativa. Dal punto di vista del bibliotecario -o meglio del documentalista 5 -i problemi principali nella costruzione di un archivio, oltre alla già citata collocazione fisica, sono una classificazione del materiale che ne permette il ritrovamento e una modalità di conservazione che si proponga di limitare nel tempo il degrado dovuto alla manipolazione e a varie cause di deterioramento e degradazione. La creazione di archivi di giacimenti documentali analogici ha permesso, nel tempo, la possibilità di conservazione in forma semi-ordinata dei materiali accumulati, con forme di deterioramento più o meno controllate. Questi archivi, tuttavia, hanno mantenuto un livello di accesso alle fonti estremamente ridotto e parziale (se non altro per la trasportabilità limitata e la difficoltà di manipolazione), che sono rimaste, in ogni caso, di difficile recupero. Ciò è tanto più problematico per discipline come l'architettura e il design, in cui accanto a documenti testuali coesistono anche documenti visuali e materici come disegni e fotografie, che presentano proprietà quali il colore, le tessiture, le sfumature, le dimensioni fisiche, modelli e maquette, artefatti di vario tipo (prodotti, semilavorati, componenti ecc.). La formazione di un archivio digitale d'architettura e di design, oggi, è quindi al tempo stesso un tema e una problematica che si muove in questo contesto, cioè la necessità di fornire una proposta di soluzione ai tipici problemi che l'archiviazione fisica, per limiti intrinseci, non è riuscita a risolvere 6 . La replica di un oggetto fedelmente a se stesso -approccio che offre la possibilità di fruizione del documento digitale con tutti i suoi attributi cromatici, grafici, dimensionali -è un problema concettualmente semplice, che oggi può fruire di una tecnologia ormai avanzata ad un livello definibile come professionale e non più di laboratorio di ricerca (i tempi del progetto di digitalizzazione dei manoscritti della Biblioteca Vaticana da parte di IBM sembrano incredibilmente lontani, pur essendo passati meno di dieci anni). Tuttavia, l'attuale tecnologia presenta una serie di problematiche che non rendono immediata tale soluzione: -una sostanziale incapacità da parte degli addetti ai lavori (bibliotecari e archivisti in primis) a realizzare il lavoro di acquisizione in prima persona, e conseguenti forti limiti di base in ogni operazione non squisitamente catalografica o archivistica; -un conseguente livello dei costi di digitalizzazione estremamente elevato per la necessità di servirsi di specialisti, cosicché le uniche operazioni in pratica realizzabili (anche in presenza di meccanismi di sovvenzione rilevanti) sono quelle che riguardano opere d'arte ad elevato valore aggiunto; -una sovente considerevole eterogeneità dei materiali, che impedisce la definizione per ogni archivio di una singola metodologia, ma impone la pluralità di strumenti e metodiche;

-una sostanziale difficoltà a definire gli usi fondamentali di questi prodotti digitali, i caratteri della loro integrazione (essenziali, ad esempio, per definire le metodologie di profilatura del colore) e, infine, a gestire la loro fruizione in forma strutturata; -l'assenza di progettualità nel settore, perché da un lato rifiutata dai tecnici, interessati di solito esclusivamente allo sviluppo di algoritmi; e dall'altro dai fruitori, che non la ritengono necessaria (in ciò dimenticando la natura intrinsecamente progettuale di ogni costruzione che pure l'architettura tanto chiaramente insegna), confondendo l'automazione con il meccanicismo. Inoltre, poiché le tecnologie consentono ormai un tale tipo di conversione, è indispensabile definire di standard riferiti al materiale originale, e non autoreferenziali al sistema digitale o all'output previsto. Occorre anche definire la scelta dell'utilizzo delle tecnologie e dei dispositivi, scegliere la qualità migliore all'interno della gamma prefissata attraverso un benchmarking delle caratteristiche dei prodotti disponibili. I fattori che concorrono a formare i contenuti informativi digitalizzati includono principalmente:

1. conservazione: la salvaguardia dell'originale all'operazione di acquisizione; 2. fattori economici: maggiore risoluzione, profondità in bit, o elaborazioni possono causare maggiori costi di acquisizione e di archiviazione; 3. tecnologia: definizione del livello tecnologico di ogni singola operazione e globale dall'acquisizione alla visualizzazione. Livelli troppo alti possono semplicemente aumentare i costi, livelli troppo bassi possono causare perdita di informazione, incoerenze lungo tutto il processo possono causare colli di bottiglia che accoppiano alti costi a risultati marginali; 4. necessità degli utenti: i requisiti richiesti dagli utenti possono causare variazioni nel processo di acquisizione. I passaggi fondamentali nella progettazione di ogni operazione di acquisizione riguardano gli aspetti riportati di seguito.

Conservazione del dettaglio più fine

Viene realizzata attraverso un esame visuale di campioni rappresentativi. Se gli oggetti sono disegnati o dipinti, l'indagine deve includere misure dell'ampiezza delle linee più fini. Se gli oggetti sono stampe fotografiche o negativi l'indagine riguarderà la misura della grana del film. Quindi la frequenza di campionamento spaziale dovrà essere selezionata per preservare adeguatamente tutti i dettagli rilevanti nelle immagini destinate alla qualità più elevata; buona regola vuole che sia normalmente almeno il doppio dell'inverso dell'ampiezza del dettaglio più fine. Tuttavia, per motivi di spazio d'archiviazione e di tempi di acquisizione (proporzionali al quadrato della frequenza spaziale) occorre trovare un compromesso tra conservazione del livello di dettaglio e costi di archiviazione, trasmissione e acquisizione.

3.1.2 Definizione della qualità dell'immagine in funzione della finalità d'uso È ormai generalizzata la suddivisione delle immagini digitali secondo tre famiglie principali, soluzione che si adatta perfettamente anche al progetto descritto in questo volume: -l'immagine digitale è utilizzata soltanto come un riferimento visuale nel database elettronico. La qualità dell'immagine digitale richiesta è limitata sia in dimensioni che in risoluzione luminosa. La visualizzazione è di solito per uno schermo o ad una stampante a bassa risoluzione e la riproduzione esatta del colore non è fondamentale. Le immagini posso essere compresse per risparmiare spazio di archiviazione e tempo di visualizzazione; -l'immagine digitale è utilizzata per la riproduzione e la visualizzazione. I requisiti di qualità dipendono dalla definizione della riproduzione desiderata. Lo stesso vale per le tonalità di riproduzione. Attualmente, la maggior parte dei sistemi di digitalizzazione permette soltanto un output di colore a 8 bit per colore primario che, se mappato non correttamente, non consente una precisa riproduzione tonale e cromatica dell'originale; -l'immagine digitale rappresenta una 'sostituzione' dell'originale sia in termini spaziali che di contenuti di informazioni tonali. Questo obiettivo è il più impegnativo da raggiungere, poiché il contenuto di informazioni in termini di equivalenza di pixel varia da originale a originale.

Definizione del workflow, gestione delle caratteristiche dell'immagine

La produzione di un'immagine fedele all'originale richiede una gestione del colore end-to-end. Un fattore chiave è certamente definire se l'operazione di digitalizzazione può avvenire direttamente od occorra procedere tramite supporti intermediari. Le due pipeline di lavoro risultano infatti abbastanza differenti e necessitano di definizione di parametri qualitativi, modalità attuative e tecniche di controllo di qualità diversi. I passi fondamentali sono dati da: -acquisizione dell'immagine: occorre definire le caratteristiche fondamentali dello strumento di acquisizione, condizioni di illuminazio-ne, parametri di acquisizione (risoluzione, profondità di colore, parametri di camera, ecc.); -definizione del formato digitale e compressione dell'immagine: la definizione dei formati grafici deve essere tale da consentire la conservazione senza perdita di informazioni; la compressione deve rendere possibile la visualizzazione in condizioni di larghezza di banda e risorse computazionali limitate; -visualizzazione dell'immagine: la visualizzazione accurata di un'immagine sullo schermo di un computer richiede l'applicazione di procedure di calibrazione e profilatura per correggere le caratteristiche di dimensione, colore e luminosità dello specifico monitor, servendosi di vari parametri sul dispositivo; -stampa dell'immagine: così come è necessario conoscere le caratteristiche del monitor per la visualizzazione di un'immagine, la sua stampa fedele richiede la conoscenza delle caratteristiche della stampante e della sua calibrazione; watermarking e protezione dell'immagine: un watermark è un'immagine secondaria che viene sovrapposta sull'immagine primaria, per proteggere la proprietà intellettuale o per permettere l'autenticazione e la validazione delle immagini (cfr. La struttura dei dati è un contenitore in cui i valori dei dati (i termini) sono collocate in base al contenuto dei dati (le regole). L'utilizzo di questi strumenti, uniti a potenti capacità di elaborazione e di scambio delle informazioni, risulta in una documentazione e in un accesso migliore ai patrimoni informativi, in una maggiore qualità, consistenza delle informazioni e compatibilità delle strutture informative, anche tramite delle mappature tra standard diversi che favoriscono l'interoperabilità. Gli standard della documentazione esistono da molto prima dell'avvento dei computer e del Web: in un ambiente digitale, l'adozione di formati standard e di vocabolari assicura la conservazione dei dati per applicazioni future, facilita l'Information Retrieval, permette e favorisce l'interscambio delle informazioni. Ad esempio, la capacità di fornire accesso remoto ai record della biblioteca non sarebbe possibile senza l'adozione del formato MARC accettato come standard di comunicazione dei dati. Ma se gli standard sono la chiave per l'effettiva condivisione delle risorse e per l'interoperabilità dei sistemi, gli standard di ambito bibliotecario quali Z39.50 (lo standard internazionale per la ricerca e il recupero tra siti) non sono stati incorporati nei browser o nei motori di ricerca di Internet. Sebbene siano in corso ricerche per far sì che lo Z39.50 possa supportare la ricerca cross-database in sistemi Web-based, uno sviluppo sufficiente per supportare i sistemi bibliotecari è ancora al di là da venire. Al tempo stesso, sono in corso di implementazione standard tradizionali quali il MARC, e si stanno affermando il Dublin Core e l'Encoded Archival Description. A questa situazione in divenire vanno aggiunti i differenti approcci alla documentazione e le diverse tradizioni di gestione delle informazioni. Le metodologie e le pratiche della documentazione dipendono dalla natura, dal ruolo e dalle prospettive di chi possiede le informazioni. Vi sono in generale quattro approcci principali, che si sono evoluti nel tempo in seguito a nuove sfide e contesti: -approccio archivistico: implica l'organizzazione e la descrizione dei record, di carte personali e di manoscritti, enfatizzando la funzione e la provenienza dei materiali d'archivio. Si applica a documenti, immagini, artefatti, registrazioni sonore, immagini in movimento, record elettronici ed è basato sulla creazione di finding aid, ovvero di documenti che elencano o descrivono un insieme di record nell'archivio, fornendo accesso all'utente. Questo approccio descrive collezioni, serie e gruppi di materiali, invece di focalizzasi su item individuali; è basato su standard ben definiti, come il formato MARC, RAD, APPM e EAD e include metodologie per la creazione di record di catalogo, inventari e registri e l'uso di vocabolari controllati come LCSH e AAT. Il concetto di base è che la propria collezione sia costituita da materiale unico. Questo metodo non è ancora completamente informatizzato, ma è sempre più orientato verso iniziative di condivisione dei dati; -approccio biblioteconomico (anche noto come catalogazione e classificazione bibliografica): implica la catalogazione e la classificazione di libri e di altri materiali testuali pubblicati. È basato sul concetto che vi sono molteplici item per una stessa opera, e per questo motivo la condivisione dei dati è particolarmente vantaggiosa (ad esempio la catalogazione partecipata). È guidato da principi e da pratiche che hanno origine da istituzioni guida nazionali (Biblioteca Nazionale Centrale, Library of Congress) e viene insegnato nelle scuole di biblioteconomia e pone una grande importanza sull'accesso per soggetto. Questo metodo è facilitato da una lunga tradizione di condivisione dei dati, ora gestita da associazioni e consorzi nazionali, ed è basato su standard ben definiti, come il formato MARC e le RICA, e continua a sviluppare nuovi standard (Z39.50). Include metodologie per il lavoro d'autorità e l'uso di vocabolari controllati; la sua informatizzazione è cominciata negli anni '70 per fornire accesso pubblico ai materiali catalogati; è basato su una catalogazione a livello dell'item, ovvero viene creato un record catalografico per ogni item, invece che ogni collezione; è potenziato dall'utilizzo di servizi analitici di riassunti e indicizzazione (come Avery Index); -approccio museografico: implica la documentazione di oggetti museali (opere d'arte, artefatti, specimen). È un metodo complesso che incorpora diversi argomenti informativi sull'oggetto (ad es. la descrizione fisica, la provenienza, la conservazione, la documentazione fotografica, dati di ricerca) ed è basato sul concetto di esemplare unico. Negli ultimi ha visto un incremento delle iniziative di condivisione dei dati; vengono utilizzati schemi di classificazione spesso basati su divisioni disciplinari o su tassonomie e il controllo d'autorità sta diventando la pratica base. Questo approccio si è rivelato prezioso perché può essere riadattato per sistemi informativi pubblici, in particolare per presentare le informazioni sulle proprie collezioni attraverso Internet; -approccio delle risorse visuali: include la catalogazione, classificazione e indicizzazione di immagini; fornisce accesso a immagini che arricchiscono l'esperienza didattica e descrive sia i singoli esemplari che insiemi di immagini, con livelli di descrizione complessi che coinvolgono sia l'esemplare che il contenuto dell'immagine. È in corso l'adozione di standard come il MARC, e al momento si utilizzano sia vocabolari controllati istituzionali che liste locali, ponendo un grande importanza sull'accesso per soggetto. Questo approccio ha uno stretto collegamento con la tradizionale documentazione museale nella descrizione di immagini di oggetti museali, e usa sistemi di classificazione altamente sviluppati sebbene non standardizzati. Un esempio di rilievo è quello del database di risorse visuali SPIRO della University of California, Berkeley, degli Archivi Alinari di Firenze e del RomeDAI -Guide for the photographs degli archivi del Deutsches archäologisches Institute a Roma. In base all'approccio scelto tra quelli sopraelencati, l'interoperabilità può essere raggiunta a livello tecnico, contenutistico o organizzativo, oppure per una combinazione di questi. Questa situazione certamente rappresenta una sfida e un'opportunità, poiché l'interoperabilità è necessaria per poter garantire la compatibilità tra i diversi livelli che compongono la biblioteca digitale ma al tempo stesso la diversità del Web ha anche fornito un'occasione unica per la personalizzazione e la specializzazione.

Il mondo degli schemi di metadati: princìpi e questioni pratiche

Il termine metadati, letteralmente 'dati strutturati riguardo altri dati', é sempre più ubiquamente adottato, secondo modalità diverse, da differenti comunità professionali addette alla progettazione di sistemi documentali. Una definizione puntuale é quella di Anne J. Gilliland-Swetland del Getty Research Institute, secondo cui i metadati sono «the sum total of what one can say about any information object -at any level of aggregation» 9 (per information object si intende un'entità digitale, singola o aggregata, indipendentemente dal tipo e dal formato, che può essere identificata e manipolata dall'uomo o da un computer come un'entità discreta). I metadati sono cioè serie struttura-te di informazioni relative ad un documento costituito da un insieme di dati. Essi non soltanto identificano, descrivono e localizzano entità (digitali e analogiche) in un sistema distribuito di rete, ma ne documentano il comportamento, le funzioni e l'utilizzo, le relazioni con altre entità e le modalità di gestione e di accesso, facilitandone il recupero. Nell'era dell'ICT, queste caratteristiche rendono i metadati sempre più importanti nella messa a punto di sistemi efficaci, interoperabili, scalabili e longevi. È importante ricordare che l'idea dei metadati è nata da un nuovo concetto sorto al di fuori della tradizionale arena bibliografica: a mano a mano che venivano creati dati scientifici in forma digitale, in particolar modo dati geospaziali, divenne evidente la necessità di surrogati per fornire informazioni sui contenuti degli insiemi digitali. Un numero sempre maggiore di tipi e di quantità di oggetti divenne progressivamente disponibile in forma digitale, ma si capì che i dati grezzi non avevano valore senza informazioni sul modo e l'obiettivo in cui erano stati raccolti, sui formati, le piattaforme per visualizzarli e manipolarli, le restrizioni sulla riproduzione e sul riuso, oltre naturalmente ad informazioni per l'identificazione più convenzionali come l'autore o il produttore il titolo, il soggetto e l'abstract. Inoltre il valore dei metadati è limitato, se non vi è accordo comune su quali elementi o contenuti dovrebbero possedere: la loro affidabilità e la loro intelligibilità verrebbero meno senza una buona dose di standardizzazione. Tutte le ragioni per cui l'indicizzazione e la catalogazione sono necessarie per i documenti analogici si applicano in modo ancora maggiore ai metadati per i documenti digitali. E come nel mondo della catalogazione e indicizzazione tradizionale, servono diversi livelli di metadati, a seconda del tipo di documento e dell'utilizzo che se ne intende fare. Il concetto è determinante sia per gli autori di documenti che per chi cerca informazioni: usati in modo efficace, nel cyberspazio rendono l'informazione visibile e accessibile etichettando i suoi contenuti in modo consistente. Le risorse il cui valore è effimero potrebbero richiedere solo un livello minimo di descrizione, mentre i documenti con un valore di ricerca o commerciale più duraturo potrebbero avere descrizioni più complete. I bibliotecari e gli indicizzatori hanno prodotto e standardizzato metadati per secoli, ma è importante rilevare che al di fuori dell'ambito biblioteconomico il termine assume significati molto ampi. I computer, ad esempio, catalogano i loro dati interni per tenere traccia di differenti oggetti discreti e funzionare correttamente: questo tipo di catalogo di dati è conservato dal computer come una relazione ricorsiva che è stata definita 'metadati'. Nel mondo dei database il termine viene utilizzato per fare riferimento a informazioni strutturate che ne descrivono l'organizzazione: ad esempio il modo in cui i dati sono organizzati le tabelle e i campi di un database, inclusi i tipi di dati, la gamma di valori accettabili e il modo in cui questa viene trasformata. Inoltre vi sono alcune incomprensioni comuni sul termine. Ad esempio, si suppone che i metadati facciano riferimento ad informazioni codificate secondo uno schema specifico e non alla tecnologia che le gestisce, e nemmeno agli spazi concettuali che controllano il valore degli elementi dell'informazione. In questo senso MARCXML o DCMES non sono metadati, ma schemi di metadati, XML è solo uno strumento tecnologico e i linguaggi di indicizzazione, gli schemi di classificazione, ecc., non sono metadati in se stessi, ma valori o regole per trovare il giusto valore da dare a elementi di metadati.

Tipologie di metadati

Fino ad oggi i bibliotecari hanno focalizzato la loro attenzione su metadati in associazione ad attività di descrizione o catalogazione. Oltre alla funzione descrittiva, tuttavia, per essere efficace uno schema di metadati deve anche stabilire un struttura e una terminologia standard, in modo che i vari campi possano essere mappati ad un unico concetto e i termini inseriti abbiano una codifica chiara (in contrasto, la maggior parte dei contesti non catalografici affronta il problema della struttura dei dati piuttosto che dei loro contenuti). L'obiettivo di base è quello di cercare di comprendere e di affrontare l'universo documentale, semplificandolo attraverso la categorizzazione e la classificazione, che creano delle realtà artificialmente ordinate. Queste classificazioni servono ad ignorare le idiosincrasie delle entità individuali e a manipolarle attraverso le caratteristiche collettive più generali. L'emergenza del Web e la crescita esplosiva di contenuti online hanno ulteriormente stimolato questo compito ordinativo e l'interesse nei metadati si è evoluto in risposta alle sfide del nuovo contesto. Pur condividendo alcuni degli obiettivi delle biblioteche, i metadati svolgono tuttavia un ruolo in qualche modo diverso, dovuto al fatto che il Web si differenzia dalle modalità di catalogazione tradizionali 10 . L'ambiente in cui esiste il catalogo e i suoi standard è relativamente indipendente e controllato, la creazione e il mantenimento di un catalogo di record sono svolti da una comunità di esperti e l'interfaccia del catalogo è in genere ristretta ai sistemi bibliotecari integrati. Infine, lo scambio di record catalografici è regolamentato in forma di download di record in formato MARC da enti autorizzati come il nostro Servizio Bibliotecario Nazionale (SBN) o l'americano Online Computer Library Center (OCL). In contrasto, il Web assomiglia ad una specie di Far West informativo, in cui il mantenimento di informazioni è perseguito da diverse comunità con una grande varietà di standard descrittivi. I contenuti e i servizi forniti da queste comunità coesistono nello stesso spazio e il loro uso di frequente attraversa i confini delle diverse comunità, dando origine a quello che Stuart Weibel ha definito Internet Commons.

Ottenere il consenso sui metadati e su altri standard è importante per gestire e conservare i documenti digitali nel tempo, per permettere l'interoperabilità e la ricerca attraverso database multipli. Gli insiemi di metadati finora creati, conformi per quanto possibile agli standard nazionali e internazionali, sono diventati strumenti che i professionisti dell'informazione stanno usando per sfruttare queste opportunità, e affrontare numerose questioni relative alla gestione di grandi quantità di dati: l'aumentata accessibilità attraverso collezioni multiple o collezioni virtuali dai materiali che sono distribuiti attraverso numerosi repository; la contestualizzazione del documento; molteplici modi di ricercare le informazioni, presentare i risultati e manipolare gli oggetti informativi, senza compromettere l'integrità dei questi oggetti; la multiversionalità; questioni legali relative ai diritti di proprietà e di riproduzione di un documento e delle sue diverse versioni; la conservazione nel lungo periodo; modelli economici sostenibili per la loro creazione e gestione. I metadati possono essere distinti in base ai loro attributi, quali la fonte da cui provengono, i metodi di creazione (automatica, semiautomatica, manuale), i tempi di creazione (insieme al documento o aggiunti in seguito), la qualità (se creati o meno da esperti), la staticità, la struttura standard o meno, la conformità semantica e il livello di riferimento (collezioni o singola entità). Certamente sono entità mutevoli nel tempo e nello spazio e continuano ad accrescersi entro il sistema entro cui dimorano, durante il ciclo di vita del documento con il quale si relazionano. I metadati non possono essere considerati come 'definitivi', perché una volta creati non rimangono statici, ma vanno incontro a modifiche (a volte ad eliminazioni) e a localizzazioni diverse nel corso del tempo. Certo anche l'adozione dei metadati non è esente da problemi. Uno dei detrattori più noti, Michael Gorman, li ritiene «un tentativo sconsiderato di trovare una sorta di terza via tra il deserto dei motori di ricerca e della ricerca a testo libero e la grande architettura del controllo bibliografico che i bibliotecari hanno sviluppato negli ultimi centocinquant'anni», prodotti da «quelli che, senza alcuna conoscenza della catalogazione, né riguardo per essa, come alchimisti bibliografi, cercano la pietra filosofale che ci offrirà una catalogazione efficace senza spese e accesso efficace senza vocabolari controllati» 11 . Ma la realtà dei fatti ne sta dimostrando l'importanza e l'utilità, tanto che stanno avendo un ruolo sempre più importante nel mondo della catalogazione. Con la parcellizzazione delle conoscenze, anche le specificità degli stessi metadati sono andate via via differenziandosi a seconda delle condizioni in cui essi si muovono insieme agli oggetti cui si riferiscono. L'esistenza di una moltepli-cità tipologica di metadati sarà il nodo cruciale per la continuità di accesso e di utilizzo, fisico e intellettuale ai documenti digitali. I metadati sono spesso suddivisi in tre categorie concettuali (Tab. 1) indicate dal Working Group on Preservation Metadata e adottate come modello della CAL Digital Library (anche se alcune istituzioni, come il Getty Institute, distinguono però in 5 categorie):

1. metadati descrittivi: facilitano l'identificazione e il recupero della risorsa (ad es. metadati bibliografici) e rappresentano il tentativo di affrontare la proliferazione delle differenti versioni ed edizioni di documenti digitali. Nel mondo dei documenti a stampa, il ciclo di pubblicazione solitamente rinforza il processo editoriale e crea degli intervalli tra l'uscita delle diverse pubblicazioni. Ma per un'opera digitale, che è di per sé altamente mutevole, spesso i processi e gli intervalli vengono eliminati e le varianti sono create velocemente e senza troppo pensare all'impatto sul controllo bibliografico; 2. metadati amministrativi: supportano la gestione del documento all'interno di una collezione, facilitandone l'accesso e la conservazione. Possono descrivere il visualizzatore o il player necessario, oppure attributi come la risoluzione dell'immagine, le dimensioni del file, la velocità di campionamento, fornire dati su come e quando un oggetto digitale è stato creato e archiviato e sulla gestione dei diritti. I metadati amministrativi conservano le informazioni necessarie per mantenere un lavoro digitale accessibile nel tempo: nel caso di un libro, ad esempio, indicano che sono necessari tutti i file individuali per ottenere il volume, la loro localizzazione e quali applicazioni e formati sono necessari per la visualizzazione. Sono particolarmente importanti quando si spostano i file su un nuovo server, oppure si effettua il refreshing o la migrazione dei file a scopo conservativo; 3. metadati strutturali: collegano fra loro i componenti di oggetti informativi complessi, fornendo le indicazioni tecniche necessarie, descrivono le associazioni all'interno di o tra oggetti informativi individuali interrelati tra loro. In un libro, composto di capitoli e paragrafi, i metadati strutturali spiegano come le immagini delle singole pagine formano i singoli capitoli, e come i capitoli costituiscono il libro. I metadati strutturali aiutano cioè l'utente a navigare tra i singoli componenti di un oggetto composito, evidenziando che, per molti lavori in forma digitale, non è sufficiente la semplice visualizzazione del documento, poiché l'utente deve poter navigare attraverso esso e si aspettano un certo comportamento, in particolare quando ha di fronte la versione digitale di un documento cartaceo 12 . La 'piramide descrittiva' dei dati 13 continuerà a crescere sempre di più con il progressivo sviluppo di nuove modalità di combinazioni di metadati e con il crescente bisogno da parte degli utenti di conoscenze più dettagliate sulle similarità e differenze dei documenti. Come ricorda Carl Lagoze della Cornell University, i metadati non sono monolitici, ma rappresentano piuttosto «multiple views that can be projected from a single information object» 14 : implicano perciò un approccio modulare nell'architettura come il Resource Description Framework (RDF) 15 , che permette a differenti comunità di associare e mantenere pacchetti di metadati multipli per le risorse Web, o l'OAI (Open Archive Initiative) che definisce un'infrastruttura tecnologica tesa a garantire l'integrazione e l'interoperabilità di archivi distribuiti.

Princìpi e questioni pratiche

I metadati sono un importante collegamento nella catena di valore dell'econo-mia della conoscenza, ma vi è ancora molta confusione su come dovrebbero essere integrati nei sistemi di gestione dei documenti. In un articolo 16 stilato dai responsabili di due prominenti iniziative, Dublin Core Metadata Initiative (DCMI) e Institute for Electrical and Electronics Engineers (IEEE) Learning Object Metadata (LOM) Working Group, sono state affrontate queste questioni in modo puntuale e comprensivo, suddividendole in princìpi e questioni di carattere pratico.

Princìpi

Modularità

È la chiave principale per ambienti caratterizzati da fonti di contenuto profondamente diverse. La modularità permette di creare nuovi insiemi basati su schemi di metadati preesistenti. La dimensione modulare inoltre gioca un ruolo importante nella scoperta dei documenti perché gli utenti di solito cominciano la ricerca usando termini semplici e perfezionano le query nei passaggi successivi. Le descrizioni più complesse permettono agli utenti di effettuare ricerche più granulari, specifiche di un certo ambito e di alcuni aspetti delle risorse, o fornendo informazioni essenziali per la conservazione e gestione dell'accesso alla risorsa.

Namespace

Un namespace è una collezione formale di termini, gestiti secondo un criterio logico o un algoritmo, che permette l'identificazione univoca degli elementi e rappresenta una parte fondamentale dell'infrastruttura del W3C (e in particolare dello schema XML). Il protocollo di base del Web, ad esempio, è http, un namespace che garantisce che un dato URL sia unico a livello globale.

Ogni elemento di un metadato è un namespace regolato da regole e da convenzione determinate dall'ente che lo 'registra' e lo mantiene. Le dichiarazioni di namespace permettono di definire il contesto di un particolare termine, assicurando in tal modo che esso abbia una definizione unica nei confini di quel dichiarato namespace. Ad esempio il Dublin Core Metadata Element Set viene definito da una collocazione Web specificata da un URI, e tutti gli elementi Dublin Core nell'ambito dell'obiettivo di questa dichiarazione di namespace sono riconoscibili dal prefisso 'dc.'. Altri esempi di schemi di namespace sono il Biblink e il ROADS Template. Usando questa infrastruttura, chi progetta i metadati può selezionare gli elementi da metadati già esistenti, identificando chi li gestisce.

Estensibilità

Le architetture di metadati devono facilmente accogliere la nozione di uno schema di base, con elementi aggiuntivi che personalizzano una certa applicazione ai bisogni locali o a quelli di un contesto specifico, senza compromettere l'interoperabilità fornita dallo schema di base.

Refinement

Il mondo delle applicazioni si differenzia in base al livello di dettaglio necessario o desiderabile. Gli standard di metadati dovrebbero consentire di scegliere il livello di dettaglio appropriato per una certa applicazione. Poiché popolare i database di metadati è costoso, vi sono forti incentivi economici a creare metadati con sufficienti dettagli. Vi sono due nozioni da refinement da considerare: la prima è l'aggiunta di qualificatori che rifiniscono o rendono più specifico il significato di un termine (ad es. 'data di creazione', 'data di modifica' sono attributi dell'elemento 'data'), la seconda implica le specifiche di schemi particolari o di insiemi di valori che definiscono la gamma di valori di un dato elemento. In questo modo si può incrementare l'interoperabilità semantica attraverso le applicazioni, facendo riferimento ad un insieme di valori comune.

Multilinguismo

È uno degli aspetti più ampi del multiculturalismo, che include, ad esempio, il modo in cui le date vengono rappresentate su calendari diversi, la direzione in cui il testo viene visualizzato e letto, le connotazioni culturali di certe icone e pittogrammi, le pratiche standard (l'ordine dei nomi, standard di collazione, standard sugli articoli). Molti di questi aspetti, ovviamente, vanno al di là del contesto dei metadati. Tuttavia è importante che i metadati possano descrivere le caratteristiche rilevanti, e che facciano questo rispettando le differenze culturali e linguistiche a livello globale e locale.

Questioni pratiche

Profili di applicazione

Poiché nessun singolo insieme di elementi di metadati soddisferà mai i requisiti funzionali di tutti i sistemi, i profili di applicazione permettono di mescolare e armonizzare gli schemi nel modo più appropriato ai bisogni di una specifica comunità 17 . Un profilo di applicazione è un assemblaggio di elementi di metadati selezionati da uno o più schemi di metadati e combinati in uno schema composito. L'obiettivo è quello di adattare o combinare schemi esistenti in base ai requisiti funzionali di una particolare applicazione, conservando al tempo stesso l'interoperabilità con gli schemi base originali. I profili di applicazione raggiungono questa modularità attraverso una serie di meccanismi e di documentazione volti ad armonizzare ed identificare i diversi elementi di metadati: la dichiarazione del numero di elementi obbligatori di un insieme, la specifica delle relazioni e dell'indipendenza degli elementi, la restrizione dello spazio di valore degli elementi e la dichiarazione dei namespace selezionati, fonte/autorità responsabile della creazione e della manutenzione dei profili stessi, regole d'uso, vocabolari controllati utilizzati. Esempi di profili di applicazione sono il Biblink Core 18 , il DC Education Working Group, i ROADS Document Template, il CIMI Profile for Cultural Heritage Information e il Bath Profile for Library Application and Resource Discovery. In realtà il concetto non è nuovo: da diverso tempo molte applicazioni combinano elementi provenienti da più schemi, definendo determinati elementi come 'locali', aggiungendone di nuovi o modificando la semantica di schemi esistenti (ad es. i vari formati MARC, e l'uso tipico del numero 9 del formato UNIMARC per denotare un dato locale).

Sintassi e semantica per l'interoperabilità

La semantica riguarda il significato e la sintassi la forma: sono necessari accordi su entrambe perché due comunità possano condividere i metadati, ovvero occorre una convenzione condivisa sui valori di identificazione e di codifica. Tuttavia è importante mantenere la sintassi e la semantica il più separate possibile. La mancanza di stabilità nel mondo dei linguaggi di markup enfatizza la necessità di mantenere l'indipendenza tra la semantica degli elementi di metadati e la loro rappresentazione sintattica. Il linguaggio XML, che oggi rappresenta ancora una piccola parte dei markup sul Web, è il linguaggio ideale per la codifica e lo scambio di dati strutturati. La possibilità di creare namespace in XML fornisce capacità strutturali che HTML non possiede, rendendo più facile raggiungere i principi di modularità e di estendibilità. Le specifiche di schema XML definiscono un linguaggio che consente la specificazione dei profili di applicazione, che aumenteranno le prospettive di intero-perabilità. Infine, deve essere notato che vi è un terzo requisito per l'interoperabilità, al di là della sintassi e della semantica: i vocabolari di contenuto, che potrebbero essere illimitati come un linguaggio naturale. Gli schemi di metadati si differenziano in contenuti e struttura, che è particolarmente difficile da mappare. È possibile combinare questa interoperabilità semantica, supportata da un framework comune e flessibile come XML, con mappe semantiche create o potenziate dalle persone (ad esempio mappature di metadati) per sviluppare delle applicazioni di metadati human-understandable 19 .

Modelli di associazione

Vi sono vari modi di associare i metadati alle risorse. I metadati inseriti all'interno del linguaggio di markup di una risorsa. Questo implica che i metadati vengano creati insieme alla risorsa, spesso dall'autore. Non è chiaro se siano migliori i metadati creati dagli autori stessi o quelli creati da professionisti, ma in termini pratici la descrizione delle risorse è costosa e non sistematica, e quindi ogni investimento da parte degli autori nella descrizione dei loro lavori intellettuali è comunque preziosa. I metadati interni possono anche essere soggetti ad harvesting, e il presunto incremento in visibilità che potrebbe derivarne è un incentivo per la loro creazione 20 . I metadati associati sono invece mantenuti in file strettamente collegati alla risorsa che descrivono e possono essere o meno essere soggetti ad harvesting. Il vantaggio deriva dalla relative facilità di gestione dei metadati senza associare il contenuto della risorsa stessa, ma questo beneficio è acquisito a costo della semplicità, poiché è necessaria la co-gestione dei file delle risorse e dei file dei metadati. Infine i metadati third-party sono mantenuti in un repository separato da una organizzazione che può avere o meno il diretto controllo o l'accesso ai contenuti delle risorse. Tipicamente, questi metadati sono mantenuti in un database che non è accessibile agli harvester. Tuttavia la Open Archives Initiative propone un sistema che incoraggia l'apertura dei repository di metadati tra server che utilizzano l'Open Archives Initiative Metadata Harvesting Protocol (OAI-PMH) 21 . Le questioni di sintassi e i modelli associativi vengono spesso confusi. Ognuno di questi tre idiomi sintattici può essere facilmente inserito nel markup di una risorsa digitale o gestito come un'entità separata. Una data risorsa informativa spesso avrà record di metadati multipli che riflettono i vari obiettivi e prospettive delle organizzazioni che li creano e che li gestiscono.

Identificazione e denominazione degli elementi di metadati

Lo scopo dei namespace URI sul Web è quello di far sì che ogni elemento di un insieme di elementi possa essere rappresentato da un nominativo di indirizzo globale, il suo URI. Identificatori globali invarianti rendono molto più facile l'elaborazione informatica dei metadati attraverso linguaggi e applicazioni , ma non sono facilmente letti dalle persone. La denominazione persistente rimane una questione fondamentale nella costruzione di biblioteche digitali: sebbene il Web abbia portato ad un incremento dell'accesso ai contenuti, la sua architettura ha violato la tradizione di fornire informazioni di localizzazione relative ad un lavoro, indicando invece la localizzazione precisa. Il sistema di localizzazione precisa, cioè l'URL, porta spesso ai messaggi di errore (404 -File Not Found) che risultano nella maggior parte di casi dalla normale manutenzione dei siti Web (ridenominazione di cartelle, di directory, riorganizzazione delle localizzioni dei file). Negli ultimi anni è stato fatto molto lavoro sulla denominazione indiretta (PURL, URN e handle), ma oltre ad esservi disaccordi sulla forma di denominazione indiretta migliore, vi sono anche controversie se il nome persistente dovrebbe essere semanticamente leggibile o meno.

Registri di metadati

Con il progressivo aumento del numero di metadati e di profili di applicazioni, l'importanza della gestione e dei ruoli dei registri è destinata ad aumentare 22 . Con diversi gradi di funzionalità, essi assumeranno le caratteristiche di un dizionario digitale, disponibile in consultazione per i progettisti di applicazioni, i creatori e i gestori dei metadati, le applicazioni e gli utenti finali. Poiché ogni schema di metadati o profilo di applicazione è soggetto a evoluzioni, i registri manteranno le relazioni tra le diverse versioni degli schemi, in modo da promuovere l'interope-rabilità semantica e informatica .

Completezza della descrizione

Non tutti gli elementi dello schema di metadati di un sistema sono necessariamente appropriati per ogni tipo di risorsa, ma vanno selezionati in base al valore appropriato e alle best practice dell'ente creatore dei metadati. Descrizioni di metadati dettagliate possono migliorare la precisione della ricerca, ma richiedono un maggiore investimento e rendono più difficile promuovere la consistenza. Di contro le descrizioni semplici sono più facili e meno costose da generare, ma possono generare maggiore 'rumore' nei risultati della ricerca.

Oggettività vs. soggettività

Il processo di creazione dei metadati può implicare un input sia soggettivo che obiettivo. Alcuni metadati sono chiaramente oggettivi e possono anche essere generati in modo automatico; altri metadati possono essere soggettivi, sia perché alcuni elementi sono soggetti a differenti punti di vista (assegnazione di parole chiave, riassunti del contenuto in un abstract), o perché sono specificatamente intesi a rappresentare una valutazione soggettiva (la recensio-ne di un libro o una presentazione). Anche elementi più formali di metadati diventano soggettivi quando usati in un contesto culturale o disciplinare che dipende dall'interpre-tazione locale. Il requisito primario della progettazione dei metadati è quello, per quanto possibile, di rendere esplicito il contesto.

Generazione automatica

Prima del Web, la maggior parte dei metadati per il recupero dei documenti erano creati manualmente, con un'attività intensa e onerosa di catalogazione bibliotecaria che risulta costosa e poco pratica per molti dei materiali disponibili su Internet. I motori di ricerca oggi indicizzano una significativa porzione del Web e offrono accesso indicizzato a basso costo, generalmente secondo criteri pubblicitari. Tra questi due estremi vi è un'ampia gamma di modalità di creazione di metadati che possono essere rese automatiche, e che probabilmente diventeranno sempre più importanti a mano a mano che le tecniche di elaborazione del linguaggio naturale, il data mining, gli algoritmi di riconoscimento dei profili e dei pattern diventano più efficaci. Sarà più facile ed economico combinare metadati già forniti dalle applicazioni (ad es. data di creazione, elementi con tag strutturali, formati di file e informazioni correlate), metadati forniti dal creatore (keyword, autori, affiliazioni, ecc.) e metadati basati sulla deduzione (es. classificazione basata su algoritmi di classificazione automatici). Da quanto evidenziato sopra, è chiaro come i metadati siano un componente chiave dell'infrastruttura informativa, necessaria per aiutare a creare l'ordine nel caos documentale in ambienti di rete. Essi forniscono descrizioni, classificazioni e organizzazioni di differente qualità e organizzate in base a differenti scopi che rispecchieranno obiettivi, e modelli di business dei fornitori delle informazioni. Ma perché queste opportunità possano realizzarsi saranno necessarie alcune convergenze di formati di codifica e di semantiche approvate universalmente. Nei prossimi paragrafi verròà analizzata la categoria dei metadati descrittivi alla luce di quegli schemi nati per facilitare l'identificazione e il recupero dei documenti digitali online.

Metadati descrittivi

I metadati descrittivi non sono una novità, essendo stati elaborati da tempo in ambito bibliografico per consentire l'accesso a vari tipi di documenti. Essi includono schemi di classificazione (Classificazione Decimale Dewey, Library of Congress Classification, Classificazione Decimale Universale, ecc.), regole di catalogazione (Regole Italiane di Catalogazione per Autore, Anglo-American Cataloguing Rules, Regeln für die Alphabetische Katalogisierung, ecc.) e formati bibliografici (MARC e tutte le sue declinazioni locali: UNIMARC, USMARC, ecc.). La strutturazione dei dati é sempre stata importante nello sviluppo dell'organizzazione e della rappresentazione delle informazioni, ma l'avvento di nuovi media informativi con potenti capacità di elaborazione e l'ampliarsi degli orizzonti in varie discipline hanno determinato nuove problematiche nella catalogazione e nella restituzione dei documenti. La descrizione potrebbe costituire un impedimento alla scoperta dei documenti, anche se le tecnologie di rete hanno diminuito le barriere spazio-temporali: questo perchè la scoperta dei documenti varia in base alla struttura, al tipo e al contenuto del documento, e allo scopo di chi cataloga. Inoltre bisogni informativi complessi richiedono che sia possibile effettuare query parallele in sistemi informativi specifici, per permettere l'accesso ad archivi informativi distribuiti. In particolare, la rapida crescita di documenti digitali disponibili sul Web ha comportato in questi ultimi anni una serie di sforzi da parte di una molteplicità di attori della catena documentaria per garantirne l'identificazione e la localizzazione, sia seguendo tecniche e strumenti consolidati delle biblioteche, che adottando un approccio più snello, che sfrutta direttamente la codifica e le informazioni interne agli oggetti-documenti. Gli standard descrittivi correnti, basati su un modello bibliografico, sono progettati per entità analogiche, statiche e materiali, con caratteristiche relativamente semplici e definite. Essi si trovano in difficoltà di fronte alla descrizione di materiali digitali, temporalmente instabili e interrelati in modi complessi e diversificati e non riescono a tenere il passo con le trasformazioni tecnologiche, distinguendo inoltre ancora tra risorse elettroniche e audiovisive piuttosto che tra documenti analogici e digitali 23 Libraries Group), che viaggia in un paese con un linguaggio che non conosce e si porta con sé un insieme di frasi base per comunicare durante la sua visita. La chiave della semplicità è costituita da un vocabolario limitato e da una struttura semplice, ovvero senza construtti sintattici e utilizzando principalmente verbi al presente e frasi dichiarative che appiattiscono eventi ed entità. Progressivamente è aumentato l'interesse per arricchire questo schema e creare dei record catalografici più ricchi con versioni, linguaggi e codifiche multipli. L'approccio alternativo della comunità Dublin Core si basa su contenitori e pacchetti di metadati interconnessi, ognuno dei quali sono mantenuti da una specifica comunità. In base a questo approccio, ogni gruppo di utenti può supportare i pacchetti di metadati di cui ha bisogno per i suoi usi specifici, continuando al tempo stesso a interoperare con quelli di altre comunità. Rispetto agli oltre 800 campi del MARC, lo schema originario di Dublin Core proposto nel dicembre 1996 presentava soltanto 15 elementi di base (Fig. 2), definiti usando un set di 10 attributi ricavati dalla norma ISO 11179. Ciascun elemento è a sintassi indipendente e opzionale, ripetibile e senza ordine prefissato, in modo da permettere sia a professionisti delle biblioteche sia a non esperti una descrizione comune del materiale catalogato. Il set minimo si è attualmente esteso anche a sottoelementi o qualificatori, implementati in modi diversi dalle varie comunità di utenti, ma il nucleo originario della descrizione, che oggi conta 15 Lo schema è in progressiva via di sviluppo verso una forma più allargata e dettagliata, anche per consentire una migliore mappatura con altri metadati (Fig. 3), e d'altronde il nome stesso (core) indica l'assunto che DC coesisterà con altri set di metadati. La versione aggiornata del formato, che ha visto focalizzare l'interesse di musei, agenzie ed organizzazioni commerciali, si caratterizza per: -semplicità di utilizzo, in quanto si rivolge sia a non catalogatori che a specialisti (permette infatti a ciascun autore di autocatalogare i documenti nello stesso header dell'HTML o XML); -interoperabilità semantica, poiché stabilisce una rete comune di dati concordati nel loro significato e valore; -interdisciplinarietà; -flessibilità ed estensibilità, in quanto permette di integrare e sviluppare [ la struttura dei dati con significati semantici diversi ed appropriati al contesto di applicazione; -modularità, grazie alla natura della sua struttura; -consenso internazionale in oltre 30 nazioni: attualmente DC viene utilizzato come base di sistemi descrittivi di molteplici comunità di interesse, tra cui istituzioni educative, biblioteche, istituzioni governative, settore della ricerca scientifica, autori di pagine Web, e-business, Knowledge Management. Queste caratteristiche ne fanno una potenziale alternativa per il materiale digitale rispetto a formati più elaborati di catalogazione bibliografica, applicabile al tempo stesso alla descrizione di documenti diversi, indipendentemente dal formato, dall'area disciplinare o culturale. I formati MARC sono progettati per accogliere tutte le più minute informazioni bibliografiche, ma non sempre sono appropriati per la creazione di finding aid o per inventari museali. Forse con Dublin Core si perde la specificità di un certo tipo di materiale, ma si guadagna in trasparenza dell'informazione di base, ed è a questo livello che può avvenire una cooperazione interdisciplinare. Ad oggi questo schema di metadati è stato adottato dalla European Committee for Standardization / Information Society Standardization System (CEN/ISSS), è uno standard officiale del W3C ed è formalmente approvato dai governi di alcune nazioni per promuovere la scoperta delle informazioni governative in forma elettronica (ad es. la National Library Helsinki lo ha adottato come standard informativo nazionale ed è diventata il primo affiliato nazionale della DCMI). Il potenziale incremento di visibilità delle risorse di una collezione attraverso settori e ambiti disciplinari diversi, ad un basso costo, è certamente invitante. Il Dublin Core prende infatti in considerazione l'intero ciclo di vita di una risorsa informativa, ovvero la sequenza di eventi che ne segnano lo sviluppo e l'uso (ad esempio la creazione, l'elaborazione di una bozza, la revisione di un articolo, la pubblicazione di un libro, la trascrizione su un altro supporto, la traduzione, la derivazione di una nuova opera). I servizi che necessitano di descrizioni semanticamente più ricche continueranno ad utilizzarle, ma usando Dublin Core potranno offrire anche strumenti di scoperta interdisciplinari. La metafora del turista digitale è appropriata in questo senso: i viaggiatori su Internet che cercano informazioni in discipline straniere possono usare il ristretto vocabolario di Dublin Core per individuare risorse che altrimenti sarebbero passate inosservate. Dublin Core non intende sostituire altri standard di metadati, ma piuttosto coesistere -spesso nella medesima descrizione -con altre semantiche come supporto aggiuntivo ai metodi esistenti per la ricerca e l'indicizzazione di metadati Web-based in ambiti disciplinari diversi 39 , indipendentemente dal fatto che le corrispondenti risorse sia documenti analogici o digitali. La semplicità di Dublin Core può essere al tempo stesso la sua forza e la sua debolezza: la semplicità abbassa i costi di creazione dei metadati e promuove l'interoperabilità, ma non riesce ad accomodare la semantica e la ricchezza funzionale supportata da altri schemi di metadati più complessi. In effetti, il Dublin Core acquista visibilità al costo della ricchezza semantica; tuttavia, la natura stessa di questo schema incoraggia l'utilizzo di più ricchi schemi di metadati in combinazione con esso. Indipendentemente da quale di questi due approcci si scelga, ogni collezione dovrà affrontare il problema pratico di come rendere i propri metadati disponibili alle altre collezioni e ai software di ricerca esterni (harvesting). Per le biblioteche, questo potrebbe significare estrarre record più semplici in formato Dublin Core dai record in formato MARC ed esportarli. Un altro principio base della descrizione che utilizza Dublin Core è quello del 'principio 1:1' (one-to-one rule): in ogni singolo record di metadati può essere descritto soltanto un unico oggetto o risorsa o istanza. Anche i surrogati delle risorse devono essere descritti separatamente dall'oggetto originale, in modo che il record di metadati della fotografia di una sedia contenga metadati sulla fotografia e non sulla sedia e l'autore sarà l'autore della fotografia, non della sediaun criterio opposto ad esempio a quello adottato nelle soprintendenze italiane. Sono state infine elaborate delle bozze di schemi redatte dal W3C per le convenzioni di codifica del XML, descritte nelle linee guida per l'implementazione di Dublin Core in XML 40 . Questi schemi hanno un approccio modulare per offrire possibilità, in particolare cercano di permettere un'applicazione per selezionare vari sottoinsiemi di termini di Dublin Core in combinazione. Come ha scritto Stuart L. Weibel, coordinatore del gruppo di standardizzazione dei metadati dell'OCLC, «Dublin Core is probably our best hope for a common meeting ground between a collection of metadata standards that is evocative of the Tower of Babel. Although the DC is not large enough (it is a core, after all), nor granular enough, or adequately qualified (yet) for many metadata uses, we can all 'numb down' our metadata enough to contribute records into a common pot. And sometimes that makes all the difference in the world. So with this progress report we finally see DC coming into its own. NISO passed it as ANSI Standard Z39.85 (albeit by the skin of its teeth). But more importantly, the Open Archives initiative adopted it as the only required metadata element set OAI-compliant archives must support. This development alone may be enough to solidify the position of the DC at the center of disparate communities with metadata to share» 41 .

Figure 3

Dublin Core semplice

La definizione 'Dublin Core' in genere si riferisce allo schema di base (simple): i 15 elementi descrittivi semantici del Dublin Core (Fig. 2) e un limitato insieme di qualificatori opzionali verificati e approvati dalla DCMI. Dal 1995 la DCMI si è impegnata a perfezionare lo schema e a fornire informazioni semanticamente più specifiche sulle risorse Web. Altri risultati della DCMI sono il Warwick Framework 42 e la maggior parte del lavoro sull'utilizzo del Resource Description Framework (RDF) per i metadati descrittivi. L'obiettivo è quello di descrivere la risorsa e le sue relazioni con altre risorse (ad esempio con il campo 'Relazioni') che a loro volta possono essere o meno descritte dal DCMES. Non ci sono limiti di lunghezza di campo in Dublin Core, l'ordine degli elementi nello schema è irrilevante e ogni elemento è indipendente dall'altro, opzionale e ripetibile. Il cosiddetto principio di numb-down significa semplicemente che in qualsiasi utilizzo degli elementi, i qualificatori dovrebbero poter essere eliminati e i valori dell'elemento dovrebbero essere in ogni caso utili per la scoperta del documento. L'idea base è che i qualificatori dovrebbero migliorare la precisione di una parte dei metadati, ma i metadati dovrebbero essere utili anche senza questa precisione. Baker 43 definisce Dublin Core un 'piccolo linguaggio' per effettuare una particolare classe di affermazioni sulle risorse. Come i linguaggi naturali, esso ha un suo vocabolario di termini simili alle parole, le cui due classi (elementi e qualificatori) funzionano con affermazioni quali nomi e aggettivi, e presenta una sintassi per organizzare gli elementi e i qualificatori in affermazioni. Ognuno dei 15 elementi possiede:

-un'etichetta descrittiva intesa a fornire una comprensione semantica comune dell'elemento; -un nome unico costituito da una sola parola comprensibile al calcolatore, inteso per fare una specificazione sintattica degli elementi più semplice per gli schemi di codifica. Tecnicamente parlando, un elemento o un qualificatore di Dublin Core è un identificatore unico formato da un nome (ad esempio 'Titolo') preceduto dal prefisso di un URI nel namespace in cui viene definito.

Dublin Core qualificato e i profili di applicazione

I primi lavori sul DCMES si erano focalizzati sul requisito di semplicità, in modo che utenti non specializzati fossero in grado di formulare record descrittivi basati su uno schema relativamente semplice di 15 elementi a testo libero. Negli ultimi anni nell'ambito della comunità della DCMI, è nata una corrente detta 'strutturalista' (in opposizione alla corrente 'minimalista' che sostiene l'uso di un DCMES semplice) che ha affermato la necessità di creare meccanismi per arricchire le capacità descrittive del DCMES di base, sostenendo che i soli elementi sono insufficienti per la descrizione di una risorsa reale e non metaforica. Il risultato di questi tentativi hanno dato luogo al Dublin Core qualificato (qualified), che utilizza i qualificatori aggiuntivi per rifinire ulteriormente il significato della risorsa e permettere di aumentare la specificità o la precisione della descrizione. La DCMI ha invitato le varie comunità d'uso ad elaborare dei qualificatori specifici per i propri bisogni di complessità e particolarità, e i loro record in teoria dovrebbero essere interoperabili con altri record che contengono qualificatori scelti da altre comunità e anche con gli schemi DCMS non qualificati, grazie al principio di numb-down e all'uso di vocabolari controllati o di regole di codifica. Tuttavia la DCMI non funziona esattamente come un'autorità di controllo, e l'assenza di linee guida chiare e di motivazioni hanno dato origine in passato alla proliferazione di schemi di Dublin Core qualificato che rendono l'interoperabilità un miraggio. È stato un passo utile in questo senso l'istituzione di una commissione per la revisione e approvazione dei qualificatori e di un registro di conformità ai principi dell'interoperabilità e per verificare la conformità agli standard. I 15 elementi del DCMES sono le caratteristiche che definiscono Dublin Core come linguaggio, mentre i qualificatori modificano le proprietà delle affermazioni di Dublin Core specificando 'che tipo' di autore, di titolo, di soggetto, di data, di relazione ecc. I qualificatori comprendono due classi:

-qualificatori di valori: conservano un identificare per un vocabolario, una codifica o un linguaggio del valore e indicano informazioni contestuali o regole di apparizione che aiutano nell'interpretazione del valore di un elemento. Sono basati su standard esterni quali la DDC e su regole di codifica (ad es. ISO 8601 per data, ISO 639/1 per la lingua); -qualificatori degli elementi (type), che sono utilizzati per rifinire ulteriormente il significato semantico di un elemento. In questo contesto, è emerso il concetto di profilo di applicazione 44 come un modo di dichiarare quali elementi dei namespace sono utilizzati in una particolare applicazione o progetto. I profili di applicazione sono definiti come schemi che consistono di elementi di dati derivati da uno o più namespace, combinati insieme dagli implementatori e ottimizzati per particolari usi locali. Il DCMI-Libraries Working Group ha ipotizzato vari possibili utilizzi del DCMES e dei profili di applicazione in ambito bibliotecario:

-utilizzo come formato di interscambio tra sistemi diversi che usano standard di metadati o formati differenti;

-harvesting dei metadati da fonti nell'ambito e al di fuori della biblioteca; -supporto della creazione di record catalografici semplici per le risorse in tipi diversi di sistemi; -possibilità di esporre i dati in formati MARC ad altre comunità tramite la conversione nel formato DCMS; -permettere l'acquisizione di metadati di scoperta delle risorse da creatori non bibliotecari che utilizzano il Dublin Core.

Aspetti critici e potenzialità

Alcuni esperti, tra cui Carl Lagoze 45 , sostengono che il Dublin Core non sia semanticamente attrezzato per un utilizzo spinto dei qualificatori, e che si dovrebbe optare per la modularità quando si trova di fronte ad una varietà di requisiti descrittivi. Il punto è che tale descrizione è specifica di un contesto, e né lo schema né il vocabolario di DCMES secondo Lagoze sono comunque sufficienti per questa descrizione. Mentre i 15 elementi sono rimasti sostanzialmente invariati nel corso degli anni, la questione dei qualificatori ha dato luogo ad una serie di interpretazioni e di modelli difformi, nel tentativo di creare degli strumenti per accomodare la complessità e l'estensibilità del Dublin Core con la semplicità del Dublin Core base. Lagoze suggerisce di non ignorare gli scopi originari di DCMES, ma piuttosto di definire dei framework per la creazione di descrizioni più complesse che possano co-esistere insieme ai pacchetti separati, e che siano in grado di descrivere le entità in modo più complesso. Molte comunità, tra cui quella delle biblioteche, hanno cercato di capire come rendere ciò possibile. FRBR 46 , il framework dell'IFLA, ad esempio riconosce i vari aspetti del ciclo di vita di un contenuto intellettuale e distingue tra opere astratte, le loro manifestazioni e gli item che sono prodotti da queste manifestazioni. Il progetto Harmony 47 afferma che la consapevolezza degli eventi è vitale per la comprensione ed espressione di maggiori dettagli descrittivi delle risorse. Descrizioni più ricche dovrebbero non dovrebbero essere basate sulla qualificazione degli elementi di Dublin Core, ma costruite su modelli di dati più espressivi: questo è stata una della maggiori considerazioni dell'Open Archive Initiative (OAI), il cui approccio al metadata harvesting esemplifica la nozione di modularizzazione dei metadati, utilizzando lo schema semplice di Dublin Core per l'interoperabilità tra comunità diverse, supportando al tempo stesso metadati specifici delle singole comunità. Lo sviluppo di un modello di qualificazione con uno scopo ben chiaro ha definito una nicchia importante per Dublin Core nell'ampia ecologia dei metadati. Altrettanto importante per la comunità della DCMI è il completamento della documen-tazione di supporto per renderlo utilizzabile con strumenti Web comunemente diffusi. In tal modo la DCMI sposterà il focus delle sue attività dai 15 elementi alle partnership e interazioni con schemi di metadati multipli. I critici di Dublin Core sostengono inoltre che DCMES 1.1 fornisce soltanto una generica descrizione delle categorie semantiche, non ci sono regole per determinare o rappresentare il contenuto ma soltanto linee guida generali in stato di bozza sul sito della DCMI. Di conseguenza i progetti che usano DCMES per la descrizione delle risorse devono sviluppare le proprie convenzioni, uno sforzo difficile e che richiede molto tempo. Forse è la natura stessa di questo standard a non richiedere delle linee guida canoniche e l'aspettativa è che le comunità che condividono le stesse risorse svilupperanno insieme delle regole per uno specifico settore, un compito tuttavia arduo. Si critica poi il fatto che DCMES sia nato come un movimento dal basso, in modo indipendente dalle organizzazione esistenti e senza una struttura formale per gestirlo. Tuttora la grande diversità degli implementatori di Dublin Core rende difficile raggiungere il consenso sulle questioni più complesse e la partecipazione all'iniziativa, tranne la struttura direttiva, è basata principalmente sull'impegno di volontari. Inoltre, in seno allo DCMI, chi emette gli standard è preoccupato di identificare un approccio comune e condiviso per assicurare l'interoperabilità e le economie di scala, mentre gli implementatori, che in parte usano gli standard, in più vogliono poter descrivere aspetti specifici di quella risorsa in un modo 'speciale'. La separazione tra chi crea gli standard e tra gli implementatori può essere considerata una falsa dicotomia (molte delle persone attualmente coinvolte nel mondo dei metadati prendono parte ad entrambe le attività, il che costituisce uno dei punti di forza della DCMI), tuttavia i due gruppi hanno priorità differenti 48 . Sia gli elementi che i qualificatori possono essere espressi in lingue diverse dall'inglese. La vaghezza che caratterizza le modalità di riempimento dei 15 elementi è intenzionale: Internet è un luogo caotico in cui un approccio più disciplinato, top-down verso la standardizzazione è irrealistico, specialmente per un utilizzo in ambiti e linguaggi multipli. Un modo per risolvere questo problema è offerto dal più ampio framework dei profili di applicazione, paragonabili ad idiomi regionali. Gli implementatori che hanno bisogno di un linguaggio applicativo più espressivo di un pidgin possono combinare degli elementi e dei qualificatori di Dublin Core con altri elementi di altri namespace, formando un più ricco vocabolario o inserendoli in un modello di dati sintatticamente più sofisticato. Questa soluzione è ritenuta ragionevole dai più, fintanto che gli implementatori rispettano la distinzione tra i namespace, in cui agli elementi e ai qualificatori sono date . 4). Viene fornito: un core di descrittori (Ds) per varie caratteri-stiche del contenuto multimediale; una struttura predefinita di descrittori e delle loro relazioni, chiamati Description Schemes (DSs). Le descrizioni sono di carattere bibliografico (autore, titolo), semantico (informazioni sul chi, cosa, come dove degli oggetti ed eventi rappresentati) e strutturale (istogramma di colore, misurazioni del totale di colore associato ad un'immagine, o del timbro di uno strumento musicale). Si basano sulle rappresentazioni di dati definite da MPEG-1,2,4. MPEG-7 mira ad aumentare l'uso degli schemi di metadati come Dublin Core, nella descrizione e nel recupero di materiali audiovisuali: incorpora nella sua struttura ogni forma di metadati, sia proprietari che pubblici, in modo da espandere la capacità per la ricerca e la condivisione dei dati. Ad esempio, Il MPEG -7 Working Group del Department of Canadian Heritage ha in corso due progetti sulle possibili applicazioni di questo standard nei National Archives, nella Canadian Heritage, nella National Film Board of Canada e nella Canadian Broadcasting Corporation (CBC), mappato con Dublin Core ( Fig. 6) 57 . Tuttavia MPEG-7 non standardizza l'estrazione automatica di descrizioni o caratteristiche di documenti audiovisuali, né specifica le caratteristiche necessarie per i motori di ricerca o per i programmi che intendano utilizzare queste descrizioni che vengono lasciate alla creatività degli sviluppatori. Vi sono varie tecniche per cercare contenuti visuali utilizzando le caratteristiche intrinseche di un oggetto digitale: ad esempio gli strumenti di annotazione e ricerca video sviluppati dalla IBM, AudioID -del Fraunhofer IIS, Fingerprinting Audio Clips, i vari metodi per l'estrazione degli attributi, la segmentazione, la classificazione, l'analisi e dell'Audio Retrieval e le interfacce grafiche utente 3D e interattive sviluppati da George Tzanetakis della University of British Columbia, o l'accesso B2B a streaming media del motore di ricerca SingigFish.com. Le definizioni (schemi di descrizione e descrittori) sono esprimibili in XML, che offre la soluzione ideale a livello di sintassi, struttura, cardinalità e limitazioni del tipo di dati.

Figure 4

Information Retrieval

Nel mondo attuale, caratterizzato da un oceano di documenti virtualmente disponibili e dalla creazione e interconnessione di basi dati, le tecnologie informatiche offrono capacità di elaborazione e di memoria sempre più potenti. Le conoscenze depositate, tuttavia, hanno valore soltanto se accompagnate da sistemi di recupero efficaci ed efficienti, che forniscono cioè accesso solamente a tutti quei documenti di una collezione che sono rilevanti per l'utente. I problemi che si pongono riguardano quindi: -il sistema di rappresentazione di documenti spesso complessi, come i multimedia e i rich media (l'adozione di un vocabolario controllato e aggiornato, di un alto livello di specificità terminologica e di relazioni semantiche); -il sistema di accesso ai documenti (e quindi il problema del richiamo e della precisione, ossia la capacità di recuperare interamente e soltanto la documentazione pertinente e rilevante). Se non trovare nulla è frequente nelle ricerche online, come ha osservato Foskett ancora più fuorviante è trovare qualcosa e credere di avere recuperato tutte le informazioni disponibili 58 . È stato infatti evidenziato che la ricerca per soggetto negli attuali cataloghi sul Web risulta in un basso grado di richiamo e di precisione, che mette a dura prova il livello di futility point (la quantità massima di documenti tra i quali un utente è disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative). In queste circostanze vi è un reale bisogno di descrizioni consistenti e sistematiche e di appropriate classificazioni, in particolar modo per le risorse eterogenee e complesse. L'insieme dei sistemi di Information Retrieval rappresentano una nuova strategia di recupero dei documenti in rete, le cui metodologie sviluppate seguono due diversi approcci 59 : aggiornate in alcuni campi del sapere); -thesauri (vocabolari controllati e strutturati che consentono maggiore esaustività e specificità flessibilità); retrieval content-based, che comprende:

-visual retrieval: sistemi di ricerca visuale per il recupero di file d'immagine 2D e 3D, basati su robusti algoritmi che analizzano le caratteristiche visive degli oggetti digitali quali ad esempio la distribuzione del colore, le proprietà della texture ovvero l'omogeneità dei pattern visuali, la forma, l'orientamento e la distribuzione spaziale, l'illuminazione, la ripetitività 60 ; -video retrieval: sistemi di recupero che utilizzano algoritmi che analizzano le caratteristiche audiovisive dei documenti, quali i frame, il movimento degli oggetti nelle inquadrature, gli stacchi di montaggio, le tracce audio e i sottotitoli; -audio retrieval: sistemi per il recupero di informazioni sonore in base all'analisi delle proprietà e caratteristiche relative alla dimensione temporale e alla frequenza. Il primo approccio implica molto lavoro manuale di annotazione e si dimostra insufficiente nell'ambito di documentazione visuale, le cui proprietà sono difficili o quasi impossibili da descrivere testualmente. Il secondo approccio, adatto ai documenti multimediali, invece di annotare manualmente con parole chiave di testo indicizza i documenti attraverso il loro contenuto audiovisuale, servendosi degli strumenti della computer vision, pattern recognition e query audiovisuali. Gli indirizzi di ricerca in questo approccio riguardano la definizione di algoritmi di recupero più potenti e precisi e di criteri di multi-indicizzazione, la velocità di recupero dei dati anche attraverso l'interazione uomo-computer, l'elaborazione di query basate sulla percezione visiva umane e su criteri di valutazione personalizzabili. Tra gli esempi più significativi, il Visual Information Technology Group del National Research Council del Canada ha sviluppato sistema basato sulla ricerca in modo automatico di oggetti tridimensionali 61 .

Indicizzazione term-based, manuale e automatizzata

È fondamentale che le diverse comunità dei professionisti dell'informazione (bibliotecari, documentalisti, knowledge worker,…) siano consapevoli delle reciproche discipline, standard e bisogni. Spesso, infatti, vengono usati vecchi termini con definizioni e utilizzi nuovi, interpretati in modi anche molto diversi. Il termine 'indice', ad esempio, ha un significato diverso per un bibliotecario, un informatico, un utente che cerca documenti online e un editore, e tutti hanno ragione nell'ambito delle proprie comunità d'uso. L'indicizzazione è l'atto di produrre una descrizione a soggetto, composta di termini (etichette di valori) che rappresentano concetti (tipi di valori) coordinati da faccette (tipi di attributi). L'idea di base è che i concetti esistono in uno spazio concettuale e che il significato di un concetto è la sua estensione in tale spazio. L'indicizzazione consiste in pratica in procedure codificate per esaminare un documento: viene creato un ordinamento sistematico di entrate, scelte su misura secondo il grado di specificità richiesto, che permettono all'utente di identificare un documento in termini di contenuto di soggetto, grazie agli appropriati termini di indice da utilizzare come punti di accesso nel catalogo. Rispetto agli archivi analogici, quelli digitali permettono non solo una fruizione dei documenti non limitata da vincoli spazio-temporali, ma anche il 94 | -linguaggi che usano termini o parole estratte dal linguaggio naturale (thesauri, sistemi di intestazione di soggetto); -linguaggi che usano simboli: numeri, lettere o una combinazione di entrambi (classificazione bibliografica). Strumenti di accesso appropriati sono essenziali per orientarsi nella enorme massa di informazioni disponibili online: se esse non vengono indicizzate, l'utente non è in grado di rintracciarle e quindi 'non esistono'. Ma occorre ricordare che da quello fonologico a quello pragmatico, vi sono vari livelli di analisi linguistica (Fig. 7), che riflettono una crescente complessità e difficoltà del linguaggio. Molti motori di ricerca oggi utilizzano sistemi di Information Retrieval basati sulle modalità elementari di ricerca linguistica (troncamento automatico, identificazione automatica dei nomi, identificazioni delle frasi, identificazione del concetto). La ricerca per parole presenta dei difetti intrinseci, perchè le parole non sono estratte da un vocabolario controllato e sono quindi prive di contesto e di relazioni con altri termini. Inoltre al di fuori delle scienze tradizionalmente consolidate, la terminologia è ben lungi dall'essere precisa e accurata. I livelli più alti del linguaggio presuppongono la comprensione sia dei livelli inferiori, sia delle teorie impiegate per spiegare i dati, che devono necessariamente spostarsi nel campo della psicologia cognitiva e dell'intelligenza artificiale. Come risultato, la mancanza di mediazione semantica influisce in modo ancora determinante sulle prestazioni dei motori di ricerca 62 . Le tecnologie digitali non sono ancora in grado di risolvere questo 'caos semantico': il lavoro redazionale umano è perciò essenziale nell'estrazione delle informazioni ritenute più significative e nell'organizzazione tassonomica dei contenuti 63 . L'esatta descrizione dei concetti, della rete di relazioni e dei fenomeni sovrasegmentali significa efficienza nella comunicazione linguistica, sia all'interno della cerchia degli addetti ai lavori, sia all'esterno, sotto forma di divulgazione più o meno specifica, permettendo una comunicazione non ambigua. Risulta quindi fondamentale individuare i concetti cardine dei termini relativi al documento da indicizzare, relazionati attraverso la costruzione di una mappa ad hoc, una rete concettuale tessuta attorno alla parola, per assicurare la pertinenza nel recupero delle informazioni.

L'aspetto linguistico si articola in due diversi problemi, che danno origine ad un minor grado di precisione e di richiamo:

1. il problema del linguaggio naturale, poca consistente, poiché le persone utilizzano parole diverse per riferirsi alle medesime cose; 2. il problema del linguaggio di indicizzazione: caratterizzato spesso da poca esaustività e specificità. La soluzione auspicata dagli esperti è quella dell'analisi delle faccette unita ad un vocabolario di controllo e la specificazione dei termini preferiti (per migliorare la consistenza), delle relazioni sintagmatiche e paradigmatiche (per migliorare sia la consistenza che l'esaustività). I metodi di indicizzazione possono essere di vario tipo: manuali o automatici; assegnati o derivati; con linguaggio derivante da vocabolari controllati o dal linguaggio naturale; pre-coordinati o post-coordinati; frasi oppure parole; testo parziale oppure full-text. Oltre ad una buona struttura sindetica e pre-coordinata, che facilita sia la specificità che l'esaustività, l'indicizzazione di un sistema di recupero efficace e qualitativamente raffinato presenta:

-un alto livello di specificità (e quindi di precisione): ogni termine è preciso, non generico e questo aumenta la proporzione dei documenti recuperati che sono rilevanti; -un alto livello di esaustività (e quindi di richiamo): ogni descrizione di soggetto è approfondita, non superficiale e questo aumenta la proporzione di documenti rilevanti recuperati e la precisione; -un alto grado di consistenza: una buona indicizzazione dipende dall'abilità dell'indicizzatore e dalla qualità del linguaggio. Nella progettazione di sistemi di Information Retrieval è determinante il livello di specificità, correlato al concetto di futility point, cioè la quantità massima di documenti tra i quali un utente è disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative. Mentre il 100% del richiamo significa che vengono recuperati tutti i documenti rilevanti insieme a documenti non rilevanti, il 100% della precisione indica che verranno recuperati solo e soltanto i documenti rilevanti. Quindi in pratica una maggiore percentuale di richiamo equivale ad una minore percentuale di precisione, e viceversa. Tenendo ben presente che chi cerca presenta bisogni diversi di richiamo e di precisione e ha un diverso livello di futility point, un buon sistema di recupero dovrebbe ottimizzare di entrambi i valori 64 . Indubbiamente, il più grande vantaggio dei sistemi di recupero automatici è la riduzione dei costi: la potenza computazionale è progressivamente sempre più economica della competenza umana. Ma quando risorse economiche e tempo sono ugualmente disponibili, i professionisti esperti non hanno pari 65 . Il problema è che i sistemi automatici non hanno problemi ad essere comprensivi; essi hanno piuttosto difficoltà a cercare di essere selettivi. La loro debolezza è la mancanza di precisione -quello che, in termini umani, verrebbe definito come una capacità di giudizio molto limitata. I risultati dei motori di ricerca sono influenzati da algoritmi, operatori booleani, agenti intelligenti, cookies e profili inseriti dagli utenti per cercare di migliorare la precisione, ma continuano a riportare ancora troppi risultati errati o non rilevanti 66 . Un altro aspetto che spesso resta nascosto all'utente, inoltre, è l'influenza di alcune forma di pagamento sul contenuto di indici e motori. Un problema che risulta accentuato quando la ricerca viene effettuata con un metamotore di ricerca. Ciò che fa la differenza tra un motore di ricerca e un indicizzatore umano sono sostanzialmente due aspetti: la considerazione dell'audience di un documento (che sia un libro o una pagina Web) e l'avere in mente una 'struttura sindetica' o mappa mentale quando un documento viene indicizzato. Conoscere il pubblico cui è diretto un certo documento permette di dedurre quale linguaggio deve essere utilizzato per essere ricercabile da quel pubblico, mentre la struttura sindetica permette di fornire un indice con riferimenti incrociati. A volte anche i motori di ricerca li presentano, ma con troppi significati decontestualizzati. Quelli che vengono definiti come sistemi di classificazione, categorizzazione e indicizzazione automatica, ad esempio, si servono di operatori booleani, funzioni bayesiane, modelli di co-occorenza e sistemi di linguaggio naturale. In un primo passaggio, il sistema viene addestrato allo specifico soggetto o area tematica, selezionando un lista di parole chiave approvata e costruendo delle semplici regole attraverso accoppiamenti e sinonimi, oppure utilizzando algoritmi fraseologici, grammaticali, sintattici, semantici, di uso, di prossimità, di localizzazione ecc. per elaborare regole complesse. Nei sistemi che utilizzano le funzioni bayesiane prima si seleziona una lista approvata di parole chiave, con la quale il sistema viene educato a riconoscere le parole chiave giuste in un insieme di circa 50-60 documenti: si crea così uno scenario per l'occorrenza delle parole. Alcuni sistemi usano una combinazione di funzioni bayesiane e di logica booleana (gli operatori logici consentono la combinazione di più criteri di ricerca tramite delle operazioni logiche) per raggiungere i risultati di indicizzazione finale. Il linguaggio naturale, analizzato con le tecniche di Natural Language Processing, è spesso usato in modo diverso in contesti differenti, pur avendo a volte la stessa pronuncia ed etimologia (ad esempio 'plasma' in medicina e in fisica). Inoltre, prima di iniziare l'analisi contestuale, è opportuno servirsi di una tassonomia o di un thesaurus o di un sistema di classificazione, poiché le parole chiavi selezionate saranno tanto più efficaci quanto sarà consistente la loro fonte.

La misurazione dell'accuratezza del sistema è basata su risposte corrette (hits), risposte sbagliate (misses), parole chiave selezionate dal computer che una persona non avrebbe selezionato (rumore). Il cut-off dovrebbe essere 85% di hits, il che significa che il rumore e i misses dovrebbero insieme costituire meno del 15%. Attualmente un buon sistema è in grado di fornire una percentuale di accuratezza iniziale del 60%, che può essere migliorata fino l'85% con un addestramento specifico: il che significa che rimane un certo margine di errore e che il sistema può migliorare con la revisione umana. Naturalmente questo ha un costo economico e organizzativo non indifferente, perciò spesso si preferisce ricorrere a due forme di indicizzazione automatica per migliorare i risultati: le viste tassonomiche, ovvero delle liste gerarchiche di parole chiave che hanno un apprendimento notevole in alcune aree disciplinari, anche oltre 10 livelli. Un termine può così essere analizzato e applicato soltanto al livello finale, perciò il suo uso è inserito in un'applicazione circoscritta; gli elenchi di parole chiave possono essere ristretti soltanto ai termini il più generico possibile, non superando i tre livelli della gerarchia usata. Questo è l'approccio preferito nell'am-biente Web, dove alcune ricerche sui comportamenti degli utenti e un'opinione diffusa indicano che gli utenti si annoiano dopo tre click del mouse e non andranno comunque oltre il terzo livello della gerarchia. Nella pratica molti sistemi usano una combinazione di questi metodi per raggiungere i risultati desiderati. Nel mondo degli operatori booleani, i metadati fanno sì che possiamo trovare le informazioni senza troppo 'rumore' e, tuttavia, sono stati ampiamente ignorati: l'utilizzo di metadati nell'ambito di motori di ricerca statistici, come le intranet aziendali, hanno il merito di combinare la precisione degli operatori booleani, con la fuzziness della ricerca statistica (per occorrenza) o della ricerca tramite linguaggio naturale. I motori di ricerca statistici usano algoritmi complessi e proprietari che assegnano parametri e valori alle varie parole. Quando viene calcolata la rilevanza, questi fattori si sommano insieme e il documento con il punteggio maggiore appare primo nella lista. Se all'equazione si aggiungono i metadati, gli algoritmi che pesano le parole devono essere ricalibrati: i metadati appropriati dovrebbero descrivere gli argomenti chiave di un documento, perciò si dovrebbe assegnare un peso alto se alcuni termini appaiono nel full-text del documento. Inoltre potrebbero essere sviluppati nuovi metodi che mappano i metadati e i termini di query in un cluster di parole correlate tra loro. Il clustering è già stato sperimentato con diversi livelli di successo. Alcuni motori di ricerca del Web effettuano delle 'ricerche concettuali' che si basano sulla co-occorrenza dei termini in un database. In altre parole, se un termine continua ad apparire vicino ad un altro, vi dovrebbe essere qualche sorta di relazione tra i due e quindi l'utente dovrebbe essere interessato a selezionare quei documenti che li contengono entrambi o almeno uno. Oppure se un termine ambiguo (perché spesso è assente l'indicazione dell'accento acuto o grave) come 'pesca' ricorre in un contesto non ittico, allora per il motore di ricerca esso non si riferisce ad un'attività ittica ma ortofrutticola. Ma se l'utente sta cercando informazioni sull'utilizzo di antiparassitari per gli alberi di pesco, un documento che contiene 'antiparassitari di alberi da frutta' potrebbe risultare parimenti interessante. I metadati aiutano a stabilire con precisione il tipo di pesca di cui si sta parlando, usando termini specifici per descrivere i differenti significati. Il motore di ricerca partirebbe da questo significato base e aggiungerebbe i termini correlati per introdurre termini nuovi, ma comunque pertinenti. Il problema di base di questo approccio è che la comunicazione è più efficace se si usa un linguaggio comune che entrambi le parti accettano. Il nostro linguaggio può essere ambiguo o fuorviante a causa del modo in cui è usato, anche se di solito la quantità e il feedback dei messaggi scambiati permette alle parti di comunicare l'una con l'altra. Nel mondo delle informazioni registrate invece, non c'è la stessa opportunità per una interazione immediata. Gli autori, inoltre, non sono consistenti nell'uso delle parole che potrebbero descrivere o riferirsi ad un argomento, cosicché chi cerca scansiona in full text un documento deve includere in una ricerca tutti i sinonimi, i termini correlati e tutti i livelli di dettagli che l'autore potrebbe avere usato. Chi cerca non parla direttamente all'autore, ma al documento stesso, cioè ad uno strumento statico. Per questo motivo vi è bisogno di un sostituto dello scambio parlato con una persona: un linguaggio di indicizzazione controllato che l'indicizzatore usa per interpretare e rappresentare tematiche e concetti, il linguaggio dell'autore e di quello di chi cerca. In passato, per risparmiare, molti provider di database online hanno scelto di non utilizzare i thesauri: i costi per progettare e mantenere un thesaurus sembravano alti e ingiustificati a fronte delle dimensioni dei database e del minor costo dei sistemi di ricerca full-text. Ma questi dubbi risultarono infondati: i database raggiunsero presto dimensioni quasi ingestibili e il costo di cercare titoli e abstract superava di gran lunga quello che sarebbe stato l'investimento nello sviluppo e nell'uso di un linguaggio controllato di indicizzazione 67 . È vero che nel primo caso sono disponibili più termini per la ricerca rispetto a quelli dei linguaggi di indicizzazione controllati, e quindi teoricamente includono più termini precisi. Ma chi cerca deve sperare che l'autore abbia incluso tutti i termini necessari per descrivere l'argomento: vi sono casi in cui un autore potrebbe non usare mai i principali termini di una certa materia. Questo significa che gli sforzi, il tempo e i costi risparmiati inizialmente nella costruzione del database passano all'utente che ricerca le informazioni.

Da quanto scritto sopra è chiaro che vi sono delle differenze notevoli sulle modalità in cui i contenuti possono essere organizzati. In termini semplici, il problema è quello di ridurre le distanze tra le domande degli uomini e le risposte dei sistemi. Nonostante le funzionalità miracolose annunciate da vari sistemi commerciali, l'onere nel recupero delle informazioni potrebbe passare dall'autore all'indicizzatore, dal progettista del linguaggio di indicizzazione all'utente: il carico potrebbe essere condiviso in proporzioni diverse, ma comunque non sparirà. Una volta compreso questo, e tenendo conto che i sistemi di intelligenza artificiale sono ancora lontani dal potersi sostituire agli intermediari umani, si è in grado di percepire nella loro interezza la ricchezza (e lo spreco) dei sistemi di gestione dei documenti digitali 68 .

3.2.7

Vocabolari controllati: i thesauri I vocabolari costituiscono un corpus di conoscenze rappresentate da un linguaggio specifico di un particolare argomento o area disciplinare. Essi sono necessari perché il linguaggio è in continua evoluzione, e presenta molte sfaccettature e sfumature: le caratteristiche che lo rendono espressivo (gli stili, le differenze disciplinari, regionali e nazionali, i termini del linguaggio parlato e i nomi propri tradotti in varie lingue, i termini attuali e quelli storici) costituiscono anche una possibile causa di ambiguità e confusione nella documentazione e, in ultima analisi, impediscono l'accesso ai materiali registrati in una base dati. Controllare o gestire un vocabolario ai fini dell'indicizzazione e/o della ricerca fornisce una soluzione nota come 'vocabolario controllato'. I vocabolari controllati sono collezioni di parole e di frasi, chiamate terminologie, strutturate in modo da mostrare le relazioni tra termini e concetti. Essi soddisfano due criteri specifici: essere usati per facilitare l'analisi dei documenti e il loro conseguente recupero; offrire un ricco insieme di relazioni semantiche tra i termini. Il processo che conduce al vocabolario controllato permette sia all'indicizzatore che a chi cerca di accedere ai medesimi concetti attraverso termini autorizzati, noti come 'descrittori'. In questa categoria non sono comprese: le semplici liste di termini, con o senza relazioni di equivalenza; liste di termini la cui unica relazione sia la co-occorenza nei documenti; liste di termini il cui scopo primario è quello di fornire definizione (ad esempio dizionari e glossari). I vocabolari controllati sono progettati specificatamente per identificare e creare queste connessioni tra termini, attraverso la gestione dei sinonimi e la disambiguazione degli omografi, migliorando i risultati della ricerca e funzionando come un knowledge-base. Risultano ancora più efficaci quando vengono utilizzati insieme ad altri standard, specialmente standard sulle strutture di dati e sui contenuti.

Vi sono diverse tipologie di vocabolari controllati (molti dei quali creati da istituti di ricerca nazionali e internazionali, enti statali e associazioni professionali e culturali) che rispondono a diversi bisogni e sistemi locali: (Fig. 9) 75 , mantenuto dal J. Paul Getty Trust, contiene la terminologia dell'AAT terminology e permette di cercare i termini sia nel campo del termine che nella nota d'ambito. ICONCLASS Browser 76 è uno strumento sviluppato dall'ICONCLASS Research & Development Group (IRDG) delle Università di Utrecht e Leida per quanti sono coinvolti in ricerche iconografiche o nella documentazione di immagini. Sostanzialmente, la differenza tra i diversi tipi di vocabolari controllati consiste nei due tipi di relazioni possibili tra i termini: semantiche e sintattiche 77 . Le relazioni semantiche denotano concetti come 'acqua', 'mare' e 'fiume' che sono per definizione delle relazioni permanenti: esse derivano dalle definizioni dei soggetti coinvolti, e non sono dipendenti dal particolare contenuto in un documento. Le relazioni sintattiche, invece, denotano concetti altrimenti non correlati che vengono uniti insieme come soggetti compositi nei documenti indicizzati. Queste relazioni non sono permanenti, ma piuttosto specifiche di un dato documento. Dei diversi tipi di vocabolari controllati elencati sopra, i thesauri 78 negli ultimi anni hanno progressivamente attirato l'attenzione nel recupero di documenti in ambienti di rete. Gli standard ANSI/NISO e ISO 79 definiscono un thesaurus come un 'vocabolario controllato strutturato secondo un certo ordine', un sottoinsieme del linguaggio naturale, consistente in termini preferiti e non preferiti con specifiche tipologie di relazioni. Gli scopi principali di un thesaurus sono identificabili nella promozione della consistenza nell'indicizzazione di documenti e nel facilitare la ricerca dei documenti. Nel contesto dell'Information Retrieval, specialmente nel caso di software utilizzati per la ricerca full-text, il termine 'thesaurus' è talvolta utilizzato con un'accezione più limitata, per indicare un dizionario di termini equivalenti, precostituiti o costruiti dall'utente. Si tratta di strumenti comunque utili, ma lontani dalla ricchezza di un vero thesaurus, che oltre ai termini equivalenti contiene relazioni gerarchiche e associative e informazioni di autorità sui termini. Perciò, per gli obiettivi di questo volume, un 'thesaurus' è un vocabolario controllato come definito dagli standard sopracitati. La struttura del thesaurus riflette rigorose relazioni semantiche e riflette i princi-pi della post-coordinazione dei termini: ciò significa che i termini del thesaurus vengono combinati al momento della ricerca (tramite operatori booleani) piuttosto che al momento dell'indicizzazione, come nelle stringhe di soggetto. La post-coordinazione offre maggiore flessibilità nella costruzione di strategia di ricerca ma spesso riduce la precisione dell'indicizzazione perché la natura della relazione tra i termini rimane inespressa. Rigorose relazioni semantiche invece permettono all'utente di accedere al thesaurus e di identificare i termini di ricerca più appropriati. I thesauri contengono tre tipi di relazioni semantiche:

Figure 9

1 3. relazioni associative: coordinazione, genetica, co-occorrenza, causaeffetto, strumentale, materiale ecc. per termini che hanno significati associabili. Lo scopo dei thesauri é quello di assicurare consistenza nell'indicizzazione, e risultano essere uno strumento prezioso nei sistemi di gestione e recupero per descrivere, organizzare e fornire accesso all'enorme quantità di dati presenti sul Web, poiché consentono non soltanto di utilizzare un termine più corretto per la ricerca (con le varianti fonetiche, i sinomini e i termini correlati), ma anche di organizzare un insieme di concetti, funzionando come mappe che guidano l'utente all'informazione attraverso la visualizzazione delle relazioni semantiche. Rispetto alla soggettazione e alla classificazione, un thesaurus presenta termini controllati e strutturati gerarchicamente per soggetto, con relazioni tra i termini chiaramente esplicitate che consentono un coordinamento semantico più specifico e al tempo stesso flessibile di quello offerto dal soggettario e dagli schemi di classificazione 80 . Nella struttura del thesaurus, infatti, cluster di concetti che condividono caratteristiche comuni sono organizzati in famiglie ('faccette') e rappresentati da termini del linguaggio naturale utili nel contesto in cui il thesaurus è utilizzato. Faccette e sottofaccette sono quindi disposte come semplici gerarchie di termini, dal generale allo specifico. Questa procedura presenta molti vantaggi: organizzando i termini in gruppi più piccoli correlati tra loro, ogni gruppo può essere esaminato più facilmente. L'approccio a faccette è anche utile per la sua flessibilità nella gestione di nuovi termini e nuove relazioni: poiché ogni faccetta è indipendente, i cambiamenti in genere possono essere effettuati senza alterare l'architettura generale del thesaurus. Definendo un linguaggio di identificazione dei documenti, il thesaurus impedisce una valutazione soggettiva degli stessi e svolge dunque una funzione di mediazione determinante tra la ricerca dell'uten-te e l'informazione vera e propria. Per tale motivo i thesauri sono utili:

-nella fase di data entry, per la descrizione e la catalogazione; -come online search assistant in sistemi di rete 81 fornendo sinonimi, varianti lessicali, inversioni, nomi in diverse lingue, nomi storici, forme alternate (singolare/plurale, varianti grammaticali), omografi; -come knowledge base, mostrando relazioni gerarchiche tra termini articolati secondo uno schema di classificazione delle conoscenze relative al settore 82 . Un thesaurus può essere disponibile in formato cartaceo, o digitale, o entrambi (come l'AAT), ma data la difficoltà di formulazione della richiesta e l'inerente ambiguità della parola nel linguaggio naturale, in ambito informatico i thesauri sono particolarmente utili perché a differenza dei cataloghi cartacei i record sono letteralmente invisibili all'occhio finché non vengono recuperati. Il compito dell'indicizzatore, quindi, è quello di decostruire l'informazione derivata dai documenti e ricostruirla in una forma semantica che permette a chi cerca l'informazione di recuperare, nel modo più accurato possibile, lo specifico dato richiesto. Ma se per i materiali bibliografici ogni concetto viene 'atomizzato' in differenti parti sulla base di categorie sintattiche, nel caso di materiali visuali ogni termine rappresenta un concetto indipendente, non finalizzato alla creazione di una struttura sintattica. Si comprende bene il ruolo critico dei vocabolari strutturati nell'archiviazione dei materiali usuali: se un'immagine (statica o, ancor di più, in movimento) vale mille parole, la sua descrizione non è un'operazione meramente tecnica, perché i termini utilizzati sono influenzati dall'universo culturale cui apparteniamo e dal nostro vissuto. Lo schema concettuale delle immagini implica inoltre tre ulteriori livelli di analisi (preiconografico, iconografico e iconologico), che presentano numerose variabili di interpretazione. Gli standard di documentazione comuni e i vocabolari (come l'Art & Architecture Thesaurus (Fig. 9), la Union List of Artist Names e il Getty Thesaurus of Geographic Names 83 ; l'UNESCO Thesaurus, il Thesaurus of Engineering and Scientific Terms (TEST), il Transportation Research Thesaurus (TRT) gestito dal Transportation Research Board of the National Research Council, ERIC Thesaurus on education, il Thesaurus Regionale Toscano) sono dunque componenti importanti per permettere ai singoli utenti e alle istituzioni di condividere e arricchire le informazioni, aumentandone l'utilizzo, il valore e la durata nel tempo. Lo sviluppo dei thesauri tuttavia non è privo di problemi sia per la specificità di uno strumento di questo tipo che per la sua creazione che, se effettuata manualmente, è onerosa in termini di tempo. Anche il loro utilizzo nella ricerca potrebbe costituire una barriera per l'utente, se ad esempio non è integrato oppure se il suo browser è disponibile solo come lista alfabetica nell'interfaccia di ricerca. Tuttavia, è stato dimostrato che i thesaurus migliorano il recupero dei dati 84 , e come ha scritto Patricia Harpring, Managing Editor del Getty Vocabulary Program, «it is clear that vocabularies are the key to navigating and retrieving meaningful results from the massive amount of largely inchoate information now potentially available in digital form» 85 .

Authority control

L'operazione di verifica e validazione dei termini e dei nomi è una parte critica del lavoro di documentazione: l'applicazione di vocabolari controllati standard è un risultato significativo di questo lavoro. Il concetto originario della catalogazione bibliografica ai tempi del catalogo cartaceo era quello di una rigida consistenza, necessaria per l'accesso minimo: l'uso di una forma controllata di intestazione consentiva alle biblioteche di evitare l'acquisizione o la catalogazione involontaria e costosa di materiali già posseduti, permettendo inoltre all'utente di risparmiare tempo e fatica grazie alla esplicitazione dei rinvii alle forme controllate delle intestazioni e al raggruppamento delle opere sotto una sola forma. Oggi questa operazione si è estesa ad altre comunità di gestione delle informazioni e le procedure che hanno largamente beneficiato dell'informatizzazione e del Web sono le seguenti:

- Poichè si tratta di un lavoro spesso costoso e lungo, e che si cerchi quindi, nell'ottica della condivisione dei dati si cerca in genere di condividere anche le liste di autorità. L'intestazione è costituita da una registrazione, non solo da un nome, chiamata authority record, comprensiva della forma standard, delle forme varianti e delle forme correlate in altre lingue, dell'ambito culturale e delle osservazioni del catalogatore, secondo quanto stabilisce GARE 86 . Ciascun authority record è abbinato a uno o a più record bibliografici: in tal modo il catalogo digitale consente di accedere alle registrazioni delle opere di un autore da qualsiasi forma correlata e da qualsiasi ordine di combinazione. A differenza dei record bibliografici, che hanno una certa 'stabilità', gli authority record sono però soggetti a cambiamenti continui determinati da necessità di modifica nelle forme varianti, dall'introduzione di forme parallele o di forme correlate, dall'introduzione di nuove fonti bibliografiche, dalla necessità di disambiguazione con altri nuovi record, dal cambiamento del nome di un autore o semplicemente dalla necessità di variare le informazioni biografiche. Tutti elementi che ovviamente complicano notevolmente il problema dell'allineamento dei cataloghi e dello scambio dei record. L'authority control in un contesto universitario, come ha recentemente indicato Guido Badalamenti, è una scelta obbligata 87 . Il controllo e la normalizzazione degli accessi catalografici è sempre stato molto presente nell'organizzazione dei servizi delle biblioteche universitarie, sia nel contesto della catalogazione -data l'ampia tipologia delle raccolte che interessano i loro utenti istituzionali, che comprendono opere di autori locali, nazionali ed esteri e che abbracciano vari ambiti disciplinari -sia ai fini della predisposizione di OPAC coerenti ed adeguati per gli utenti, in grado di orientare in modo semplice ed efficace studenti e ricercatori verso un uso più approfondito delle collezioni bibliografiche. La crescita dei servizi offerti dalle biblioteche, la loro crescente complessità, la necessità di dedicare risorse umane adeguate per l'integrazione dei servizi tradizionali di biblioteca con quelli offerti dalle risorse digitali, la nascita della biblioteca digitale hanno posto seri problemi all'organizzazione degli uffici di catalogazione nelle biblioteche universitarie, soprattutto in un contesto di generale contrazione delle risorse economiche. La funzione principale svolta dall'authority file non comprende più soltanto la procedura della catalogazione, ma anche quella della ricerca. Si avverte sempre più infatti la necessità di poter definire strumenti che aiutino gli utenti a tracciare dei percorsi di ricerca personalizzati e controllati, che sfuggano alle logiche commerciali dei grandi editori o dei motori di ricerca. Barbara Tillett 88 suggerisce l'idea che, a partire dall'esistenza di authority file internazionali, reali o virtuali, in cui siano registrate le varianti del nome di ciascuna entità e le forme parallele nelle diverse lingue e nei diversi alfabeti, si possano sviluppare delle interfacce adatte alle esigenze e alle scelte di ciascun utente. Il Web rende possibili nuovi utilizzi per gli authority record e nuove funzioni, in aggiunta alle funzioni tradizionali: ad esempio la condivisione del carico di lavoro riduce i costi di catalogazione, ma a condizione di utilizzare standard catalografici, formati di scambio e di rendere i dati elaborati facilmente accessibili in rete. Per il momento non sono molti, anche in ambito internazionale, gli authority file disponibili in rete ed accessibili attraverso il protocollo Z39.50. Un punto di riferimento importante in questo contesto, in grado di dare una risposta ai problemi aperti, è il progetto europeo LEAF (Linking and Exploring Authority Files), che ha come obiettivo la creazione di un sistema centralizzato in cui saranno localizzati i record relativi ad autori persona ed enti presenti nei database di piccole e grandi biblioteche di diversi paesi. I record saranno raccolti attraverso procedure periodiche di harvesting dei diversi database, in modo da assicurare un costante aggiornamento dei dati.

Web semantico e ontologie

Un'ontologia definisce i termini utilizzati per descrivere e rappresentare un'area della conoscenza 89 . Le ontologie sono utilizzate dalle persone, dai database e dalle applicazioni che hanno bisogno di condividere le informazioni di un ambito tematico specifico. Esse includono le definizioni (utilizzabili dal computer) di concetti base e le relazioni tra questi concetti: in pratica cioè le ontologie codificano la conoscenza di un certo ambito e quella trasversale ad altri ambiti, rendendole in tal modo riutilizzabile. Sebbene vi sia un generale consenso su cosa sia un'ontologia e cosa dovrebbero fare, alcune definizioni esprimono significati differenti 90 . I filosofi hanno spesso costruito le ontologie con un approccio top-down omnicomprensivo, i programmatori invece tendono a lavorare in una modalità bottom-up. Per sviluppare database e sistemi di Intelligenza Artificiale, spesso partono con ontologie limitate o micromondi, che hanno un numero limitato di concetti e sono modellate per una specifica applicazione: questo tipo di prototipi è popolare nell'ambito della robotica, della progettazione, della machine vision e machine learning. Alcuni temi comuni emergono nelle varie interpretazioni del termine:

1. un'ontologia è una rappresentazione formale che ha lo scopo di precisare, esplicitare e rendere non ambiguo uno specifico ambiente conoscitivo che richiede un modello chiaramente definito (ad es. alcune ontologie sono basate su modelli derivanti dalla rappresentazione della conoscenza). Questi modelli ontologici, vere e proprie metaontologie sono tutte basate sull'ipotesi che gli aspetti più rilevanti della concettualizzazione di un dominio possano essere catturati usando solo pochi semplici costrutti 91 ; 2. un'ontologia descrive le entità e i concetti rilevanti di un dominio specifico. Se si vuole completare lo sviluppo di un'ontologia, lo scopo e gli obiettivi devono essere chiaramente definiti. Un'ontologia universale si estenderebbe in modo infinito e richiederebbe risorse illimitate; 3. un'ontologia rappresenta una visione soggettiva di un certo ambito, che potrebbe essere descritto in modi diversi da differenti ontologie. Questo aspetto riporta ad un'importante questione filosofica sulla possibilità o meno di concettualizzazioni multiple della realtà. Le divergenze potrebbero emergere semplicemente come il risultato di descrizioni di differenti ambiti o aspetti dello stesso ambito, ma queste differenze sono in un certo senso triviali poiché non portano a fondamentali disaccordi. Tuttavia ontologie incompatibili ma ugualmente plausibili potrebbero emergere in quei casi in cui il dominio è rigorosamente identico, suggerendo così che le concettualizzazioni di fondo non sono le stesse (ad esempio in questioni teoretiche o religiose). Questo porta all'importante conseguenza che unire una o più ontologie divergenti in alcuni casi potrebbe risultare concettualmente impossibile, sebbene le ontologie, come esplicite rappresentazioni formali, possono avere un ruolo utile aiutando a rivelare e a chiarire differenze concettuali che altrimenti rimarrebbero nascoste dalla terminologia comune o simile. Nell'attuale gergo dell'informatica, le ontologie sono delle risorse che rappresentano delle semantiche condivise a più ambiti. A differenza dei modelli di dati, il fondamentale assetto delle ontologie è la loro relativa indipendenza da una particolare applicazione, cioè un'ontologia consiste di una conoscenza relativamente generica che può essere riutilizzata per differenti applicazioni e compiti. Il termine ontologia è stata usato per descrivere artefatti con un diverso grado di struttura, dalle semplici tassonomie come di Yahoo agli schemi di metadati come Dublin Core e alle teorie logiche. In sintesi 92 , le ontologie sul Web sono utilizzabili per:

-la comunicazione (tra sistemi computazionali implementati, tra esseri umani, tra esseri umani e sistemi computazionali); -l'inferenza computazionale (per rappresentare e manipolare internamente piani e per pianificare l'informazione e analizzare le strutture interne, gli algoritmi, gli input e gli output dei sistemi implementati in termini concettuali e teoretici); -il riuso (e l'organizzazione) della conoscenza per la strutturazione e l'organizzazione di biblioteche digitali e repository. Il Web semantico ha bisogno di ontologie con un significativo grado di struttura, che devono specificare descrizioni per i seguenti tipi di concetti: classi (cose generali) nei tanti ambiti di interesse; relazioni esistenti tra le classi; proprietà (o attributi) che queste cose hanno. Le ontologie sono generalmente espresse in un linguaggio di base, in modo che si possano effettuare distinzioni accurate, consistenti e significative tra classi, proprietà e relazioni. Esse vengono utilizzate da sistemi automatizzati per la ricerca e recupero concettuale/semantico, agenti intelligenti, supporto alle decisioni, comprensione del parlato e del linguaggio naturale, Knowledge Management, database intelligenti, commercio elettronico. Per ottenere l'interoperabilità tra numerosi schemi sviluppati e gestiti in modo autonomo, è necessaria una semantica più ricca di quelle attualmente disponibili. Tim Berners-Lee, l'inventore del Web, ha recentemente affermato che «most of the Web's content today is designed for humans to read, not for computer programs to manipulate meaningfully» 93 . Il contenuto è comprensibile al calcolatore se viene collegato ad una qualche descrizione formale del contenuto stesso, ad esempio con i metadati. Affinché il Web semantico funzioni, i computer devono avere accesso a collezioni strutturate di informazioni e di insiemi di regole di inferenza, che possano essere utilizzati per effettuare ragionamenti automatici servendosi dell'XML, dello schema RDF, delle ontologie e degli agenti intelligenti. Costruire ontologie è un'operazione difficile, lunga e costosa, in particolar modo se l'obiettivo è la progettazione di un'ontologia sufficientemente formale da supportare l'inferenza automatica. Ciò è dovuto in parte al fatto che le ontologie richiedono consenso attraverso una comunità i cui membri potrebbero avere versioni radicalmente differenti del dominio in considerazione. Inoltre vi sono al momento poche tecniche di valutazione. Ma quando le ontologie saranno maggiormente condivise, il Web semantico entrerà nel nostro mondo fisico: gli URI infatti possono puntare a qualsiasi cosa, inclusi gli oggetti, che potranno in tal modo cercare automaticamente ed impiegare servizi e attivare altri dispositivi per aggiungere informazioni o funzionalità. [ 1 ] Cfr [ 3 ] G [ 4 ] I due enti più noti nell'ambito della biblioteconomia e dell'information Science sono la International Standard Association (ISO) e la National Information Standards Organization (NISO), accreditata dall'American National Standards Institute. A differenza degli standard ISO, quelli NISO sono volontari: non vi sono cioè politiche per rafforzare la conformità agli standard, che vengono emessi con lo scopo di rappresentare delle linee guide e di raccomandazioni di best practice piuttosto che come requisiti. [ 5 ] Per il profilo del documentalista cfr. Cfr. <http://mip.berkeley.edu/spiro/> [ 8 ] EAD è uno standard per la codifica di archival finding aids mantenuto dal Network Development and MARC Standards Office della Library of Congress, in partnership con la Society of American Archivists. In questo contesto verrà usato il termine 'catalogazione tradizionale' per fare riferimento a descrizioni delle risorse basate su un insieme d regole che includono le ISBD, le RICA e AACR2, i vari soggettari nazionali (Soggettario di Firenze e Library of Congress Subject Headings), formati MARC per i dati bibliografici. Il termine non riflette un valore negativo, ma è solo esemplificativo. [ 11] M. Gorman, Le risorse elettroniche. The digital library toolkit, Sun Microsystems, Palo Alto 2000 (2nd ed.), p. 175. [ 14 ] C. Lagoze [ 25 ] <http://www.loc.gov/standards/marcxml/> Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 115 [ 26 ] R. Tennant, Marc Must Die, in «Library Journal», 2002, <http://www.libraryjournal.com/article/CA250046> [ 27 ] Il Government Information Locator Service (GILS) è uno strumento per l'identificazione delle risorse informative del governo americano. Come parte del suo compito, GILS ha sviluppato un formato di metadati complesso, influenzato dal MARC e progettato per un'architettura client-server basata sullo standard Z39.50 (cfr. <http://www.access.gpo.gov/su_docs/gils/>). [ 28 ] La versione alfa della Encoded Archival Description (EAD) è stata emessa nel 1996 (cfr. Encoded Archival Description (EAD), Official EAD Version 2002 Web Site <http://www.loc.gov/ead/>). [ 29 ] Core Categories delle Visual Resources, versione 2.0, rilasciate dalla Visual Resources Association nel 1997. Gli elementi del Core, che prevedono l'integrazione con altri elementi per completare le descrizioni, sono stati progettati per facilitare la condivisione delle informazioni tra collezioni di risorse visuali. La versione 3.0, un progetto della Visual Resources Association Data Standards Committee, è uscita nel 2002. [ 30 ] Categories for the Description of Works of Art (CDWA), sviluppate dalla Art Information Task Force, con la sponsorizzazione del Getty Il sistema decimale ICONCLASS (<http://iconclass.let.uu.nl/>) è stato ideato da Henri van der Waal fra il 1948 e il '50 presso l'Istituto di Storia dell'arte dell'Università di Leida ed applicato per ordinare iconograficamente la locale fototeca. Attualmente viene adottato quale standard catalografico internazionale per il settore iconografico. ICONCLASS è composto da 10 grandi classi nelle quali sono comprese oltre 22.000 raffigurazioni che descrivono i temi principale dell'iconografia storico-artistica occidentale. Questa classificazione è stata scelta dall'Istituto Centrale per il Catalogo e la Documentazione (ICCD) del nostro Ministero per i Beni e le Attività Culturali quale supporto terminologico per la descrizione iconografica del soggetto. L'ICCD ha tradotto integralmente il Sistema e in accordo con il Iconclass Research & Development Group (IRDG) ha publicato il sistema in italiano e prodotto un CD-ROM per la ricerca in automatico dei soggetti. [ 70 ] La NML è utilizzata dal servizio OMNI (Organising Medical Networked Information) <http://www.omni.ac.uk/> [ 71 ] I codici di classificazione Ei sono usati dalla svedese Engineering Electronic Library (EELS) <http://eels.lub.lu.se/> e dall'inglese Edinburgh Engineering Virtual Library (EEVL) <http://eevl.icbl.hw.ac.uk/> [ 72 ] <http://www.zblmath.fizkarlsruhe.de/class/index.html> [ 73 ] <http://www.acm.org/> [ 74 ] Alcuni di questi schemi di classificazione hanno una struttura gerarchica, come la DDC o la UDC, altri invece elencano sia concetti singoli che composti e in pratica enumerano tutti i possibili soggetti che si prevede possano essere studiati nei documenti, come la LLC. Qualche schema, come la UDC, permette l'espressione di un numero virtualmente infinito di combinazione di soggetti nei documenti utilizzando delle faccette. [ La differenza tra i thesauri e gli schemi di classificazione non è nella loro rappresentazione. I thesauri progettati in modo appropriato avranno sia una rappresentazione come elenco alfabetico che come classificazione, e ogni classificazione bibliografica definisce relazioni tra i concetti e una sorta di indice alfabetico per soggetto. [ Thomas R. Gruber: «An ontology is an explicit specification of a conceptualization» (una concettualizzazione, in qeusto contesto, si riferisce ad un modello astratto di come le persone pensano circa le cose del mondo, di solito ristretto ad una particolare area tematica) Una specificazione esplicita significa che ai concetti e alle relazioni del modello atratto vengono dati termini e definizioni specifiche; Nicola Guarino: «An ontology is a logical theory accounting for the intended meaning of a formal vocabulary»; James Hendler: «An ontology is a formal definition of a body of knowledge»; John F. Sowa: «An ontology is a catalog of the types of things that are assumed to exist in a domain of interest D from the perspective of a person who uses a language L for the purpose of talking about D».

Figure

. Tassey, The roles of standards as technology infrastructure, in Standards, Innovation and Competitiveness: The Politics and Economics of Standards in

Euroguida I&D. Competenze dei professionisti europei dell'informazione e della documentazione, realizzata con supporto

Quali vale la pena di conservare e qual'è il loro ruolo nelle raccolte della biblioteca?, bozza dell'intervento, in

Un sistema conoscitivo per la didattica e la ricerca del design in ambito universitario

Perla Innocenti A library, to modify the famous metaphor of Socrates, should be the delivery room for the birth of ideas Norman Cousins

Introduzione

Il presente capitolo si propone di affrontare le problematiche relative alla formazione di un knowledge base, come strumento di supporto al progetto di Disegno Industriale. Si tratta di un tema particolarmente complesso poiché, a fronte di una operatività ampiamente riconosciuta, e che in ogni caso segue percorsi le cui procedure vanno progressivamente affinandosi sulla base di uno schematismo generalmente evidente e chiaro, il progetto vive la permanente scissione tra il sistema delle informazioni e delle conoscenze. Tale sistema info-conoscitivo costituisce la condizione a priori dell'atto creativo ed esecutivo e la definizione del progetto, che però raramente si riesce ad appoggiare ad esso. Ciò che caratterizza il problema è la forte differenziazione tipologica di dati, informazioni e conoscenze 1 relative ai prodotti, ai processi e ai progetti -siamo infatti solitamente in presenza di modelli, immagini, video, disegni, testi … -, e la loro sostanziale disomogeneità, che non ne permette la fruibilità immediata e la facile trasferibilità. Inoltre, mentre le informazioni e le conoscenze cui si appoggia il progetto di Disegno Industriale sono prevalentemente di tipo manipolativo-visuale, le tradizionali metodologie di catalogazione e di accesso ai dati seguono indicizzazioni prevalentemente di tipo testuale. Come risultato, i materiali del Disegno Industriale giacciono frammentati e poco visibili, giacenti in stato di materiale passivo e difficilmente utilizzabile come supporto ad ogni ulteriore elaborazione (di progetto e/o di studio). L'obiettivo in questa sede è dunque quello di mostrare i passaggi metodologici atti a creare una possibile struttura di un sistema informativo e conoscitivo in quest'ambito. L'ipotesi principale alla base di questo capitolo -certo fortemente parzializzante ma, a mio avviso, necessaria per definire una procedura circoscritta e circoscrivibile -è il riferimento non al progetto in senso ampio, ma alla fase metaprogettuale, «individuata nella predisposizione di strumenti e modelli che operano su risorse concettuali e conoscitive, nell'individuazione di una metodologia, e nell'organizzazione -attraverso strumenti e risorse -di nuove possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di offerta didattica» 2 , obiettivi perseguibili proprio attraverso un'attività di ricerca, acquisizione, sistematizzazione di dati, informazioni, conoscenze. La seconda ipotesi è quella dell'adozione di sistemi online, grazie alle loro caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità tipologie di documenti, di formati e di linguaggi. Il filo rosso seguito è quello che fa uso dei sistemi in ambienti di rete come strumento di archiviazione, restituzione, disseminazione dell'informazione sul design. Punto di partenza sono le modalità di restituzione di ciò che è oggi identificabile come il sistema conoscitivo per il design, così come sono presentate nei percorsi accademici e percorsi professionali. Una prima area di ricerca riguarda invece la tipologia dei dati che il progetto di design produce quotidianamente e di cui fa uso, a fronte della quale si tenterà di esporre il procedimento con cui si realizzano oggi i knowledge base online per altri campi affini della conoscenza. Infine, si cercherà di mostrare una prima serie di ipotesi di intersezioni, prefigurando i caratteri di un sistema conoscitivo per il design. Il testo non tratterà dei sistemi informatici utilizzati per due motivi fondamentali: non sono il nostro campo di competenze, e neppure pensiamo sia prospettabile un sistema informatico -che è un progetto di breve periodo -in assenza del progetto della struttura informativa. Ciò che risulta evidente, infatti, è che un sistema conoscitivo deve essere sviluppato innanzitutto in termini di metodologie, procedure ed infine di tecnologie: la rete come si sa è volatile, la tecnologia soggetta a rapida obsolescenza, è facile terminare nel nulla... e l'efficacia di un sistema di accesso all'informazione e alle conoscenze è direttamente proporzionale all'intelligenza impiegata per organizzarlo.

Restituzione online delle informazioni relative al design

A fronte delle enormi potenzialità della rete, come è stato più volte osservato é facile perdersi nell'oceano del Web senza un'organizzazione dell'enorme massa di risorse che ogni giorno vengono ad aggiungersi e a stratificarsi a quelli già presenti. Un primo tentativo di progressiva articolazione e circolazione dell'informazione online oltre il semplice accumulo è quello del portale, che rappresenta, secondo un'efficace descrizione di Howard Strauss un «hub from which users can locate all the Web content they commonly need» 3 . Verticali-specializzati oppure orizzontali-generali 4 , organizzati in directory, i portali cercano di rispondere alla necessità di una qualche forma elementare di stabilità, di sicurezza trasmissiva e di catalogazione, che permetta il veloce ritrovamento delle informazioni: nient'altro che l'antico concetto di catalogo cartaceo, sfruttando però uno dei maggiori vantaggi del Web, cioè la possibilità di collegare nuove risorse con materiali retrospettivi e ampliare costantemente la rete dei documenti collegati. Soprattutto in tempi recenti, e in ambiti disciplinari in cui le informazioni e le conoscenze non sono direttamente e unicamente letterarie (ad esempio per tutte le arti visuali, o per quelli legati alla costruzione in senso lato, o per le discipline scientifiche che fanno ampio uso di sistemi documentali visuali), al problema dell'accumulo e della catalogazione si è affiancato però quello della modalità di restituzione dell'informazione, che non si limita a semplici stringhe bibliografiche o ad apparati testuali ma che richiede la compresenza di immagini, disegni, video, modelli, articolati secondo una struttura che organizzi modi e forme di questa trasmissione e di questa fruizione. Questo ha portato innanzi due nuove problematiche: -il modo di veicolare le informazioni attraverso specifici media; -il modo di richiamare le informazioni non partendo soltanto da indicizzazioni di materiali testuali ma anche visuali (cfr. paragrafo 2.2.5). Nel caso del design, possiamo tranquillamente affermare che in questo panorama stiamo vivendo un'epoca delle origini, ancora con poca informazione accumulata, di solito marginalmente rappresentata (anche se spesso ben presentata). In ogni caso la tipologia di informazione offerta è quella della sintesi a-priori estratta o anche completa replica, semplicemente restituita in forma sequenziale navigabile e mancante di qualunque forma di strutturazione, relativa sia all'informazione di base che alla sua rielaborazione.

Le informazioni sul design si esauriscono dunque in quanto viene oggi mostrato sul Web? Evidentemente no, trattandosi di conoscenze di carattere manipolativo-visuale strettamente collegate all'esperienza e in quanto tali difficilmente proceduralizzabili, oltre che provenienti da forme di apprendimento diversificate. Ciò che, infatti, è presentato è in forma marginale materiale per il metaprogetto, non essendo il prodotto del processo progettuale, ma di solito semplicemente la sua 'demo' o una sua fotografia da lontano. Su questi siti Web e portali manca la gestione delle risorse presenti secondo schemi di metadati coerente e organizzato, l'individuazione delle chiavi di accesso (catalogazione sistematica secondo categorie e problematiche trasversali; indicizzazione, thesauri) per le varie tipologie di utenti e di bisogni informativi identificati, la coordinazione con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali. Scorrendo rapidamente le principali tipologie espositive e contenutistiche secondo cui viene articolata sul Web l'informazione sul design, si possono attualmente circoscrivere per fini esemplificativi due grandi bacini di fornitori. Da un lato, associazioni di categoria e grandi organizzazioni istituzionali o consorzi no-profit internazionali (ad esempio il canadese Design Exchange, l'inglese Design-Council, il Korean Institute of Design Promotion, le americane ICSID e Corporate Design Foundation), con finalità educative e di ricerca e forti legami con le istituzioni, si fanno carico della promozione e diffusione culturale e di sensibilizzazione sul design, sull'innovazione e sulla produzione nazionale. Queste realtà hanno dato vita a portali verticali di riferimento per aziende, professionisti e persone interessate al design, la cui caratteristica é quella di essere infrastrutture informative specializzate in una specifica categoria di informazione, offrendo una serie di servizi connessi: organizzazione di seminari, corsi di formazione, eventi e concorsi; realizzazione di indagini economico-scientifiche sul design e consulenze; promozioni; spazi di lavoro virtuali; pubblicazioni. I contenuti, a volte suddivisi per categorie merceologiche o per tematiche inerenti al progetto, spaziano da fonti di informazioni ed eventi ad interviste, da virtual gallery e virtual space a portfolio e case study. A fronte della gestione centralizzata di questi operatori, in Italia, dove vi é una importante cultura progettuale, manca una realtà istituzionale di coordinamento nel veicolamento dell'informazione relativa al metaprogetto di design. Sono invece presenti portali di carattere commerciale come Design Italia, e-magazine come Designboom, siti specializzati come E-interiors o comunità virtuali come Design Villane 5 . L'organizzazione delle informazioni in questi siti e portali avviene secondo sequenze lineari di dati, non strutturati secondo gli standard catalografici internazionali. La consultazione avviene in genere attraverso un elenco alfabetico di intestazioni o un menu di opzioni presenti nella videata. Laddove vengono adottate, le tecniche di information retrieval riportano le imprecisioni dei motori di ricerca nei livelli più complessi del linguaggio. In un'indagine su circa cento siti Web di facoltà e dipartimenti nazionali e internazionali nell'ambito del design, svolta da chi scrive nel 2001 con l'obiettivo di individuare la presenza di forme organizzate di esposizione di varie tipologie di dati nell'ambito delle attività didattiche e di ricerca, é stato rilevato come non siano presenti veri e propri sistemi di informazioni strutturate, ma collezioni di immagini e di dati spesso multimediali. Vengono in particolare privilegiate alcune forme specifiche di presentazione come ad esempio raccolte tematiche oppure portfolio individuali dei lavori di studenti e docenti, che negli ultimi anni hanno raggiunto una crescente popolarità e che costituiscono un incentivo al miglioramento della didattica e agli obiettivi della facoltà. Una tendenza che ha peraltro portato alla nascita degli electronic institutional portfolio 6 , sia come interfaccia di dialogo (interattivo, evidenziale, visuale) interno e con i diversi stakeholder, che come mezzo per focalizzare i propri obiettivi e le aree di competenze accademiche. La maggior parte delle facoltà e dei dipartimenti presentano delle virtual gallery collettive, relative ai lavori e ai progetti realizzati da studenti e vari membri della comunità accademica: le immagini sono accompagnate da una serie di informazioni cha vanno dal nome dell'autore al programma utilizzato all'anno di corso. Nel caso dei portfolio un esempio interessante é quello della School of Industrial Design della University of Montreal, che espone ogni anno i progetti presentati dagli studenti al termine del corso di studi, e consultabili on-line tramite una navigazione ipertestuale. Gli studenti hanno inoltre la possibilità di inserire on-line anche precedenti lavori, la loro fotografia e dei riferimenti per un eventuale contatto. Ad eccezione dell'Electronic Visualization Laboratory-EVL della University of Illinois di Chicago e dell'Istituto Superiore per le Industrie Artistiche di Firenze, i materiali didattici e di ricerca non sono sistematicamente archiviati. Un tentativo significativo di strutturazione delle informazioni secondo finalità didattiche è quello del Taubman College of Architecture and Urban Planning della University of Michigan, che lavora in tandem con un'unità della biblioteca di ateneo, la Digital Library Production Service. Il College crea le immagini digitali, le archivia in un database e le conserva su CD-ROM: una copia dei lavori viene inviata ogni mese alla Digital Library, che si occupa di inserire i dati appropriatamente rielaborati sul server del College, nel sito della Union Library Visual Resources Collection, con accesso parzialmente limitato. In tal modo gli utenti che utilizzano i computer dell'Università possono effettuare ricerche on-line e visualizzare sia la stringa di catalogazione, opportunamente elaborata dai bibliotecari, che l'immagine stessa. Poiché tuttavia «just as artists are reluctant to 'put their work on the web', students too are timid about it» 7 , è prevista la videoregistrazione in digitale delle fasi di progettazione dei lavori degli studenti.

-un'altrettanto ricca varietà di modalità di produzione (seppure sempre all'interno del desktop computer), collocabili nelle macrocategorie di documenti prodotti per utilizzo interno oppure on demand per usi esterni; -una tipologia diversificata di fornitori e utenti di dati e conoscenze: studenti, docenti, ricercatori, professionisti, aziende....; -modalità di acquisizione e conservazione che non presentano attualmente una procedura standardizzata, di modo che la maggior parte dei materiali risulta spesso 'invisibile' alla consultazione e senza una collocazione definita e organizzata nel tempo. Il contesto di tale panorama documentale è quello della Classe delle lauree specialistiche in Disegno Industriale del Politecnico di Milano, il cui obiettivo è la formazione di una figura di progettista di alto profilo culturale capace, di confrontarsi sia con le dinamiche di innovazione che attengono il prodotto finale (negli aspetti tecnico-produttivi, tecnico-funzionali e formali), il prodotto intermedio (materiali, semilavorati, componenti) e i processi che ne accompagnano il ciclo di vita (progettuali, produttivi, distributivi, d'uso); sia con le innovazioni socio-culturali, di consumo e di mercato che hanno diretta influenza sulle strategie produttive, comunicative, distributive che concorrono [ Fig. 1

] Esempi di output digitali prodotti nell'ambito della Facoltà del Design, Politecnico di Milano

alla definizione dell'identità dell'impresa (dalla progettazione di sistemi di servizio a quella dei luoghi e delle modalità di vendita); sia infine di intervenire progettualmente sul 'contesto' fisico di produzione e d'uso dei prodotti (dagli aspetti qualitativi che contribuiscono a migliorare la percezione e la fruizione di un ambiente ai requisiti ambientali di prodotti, processi produttivi e di consumo finalizzati a strategie di 'sostenibilità'). Ciò comporta una solida formazione, che raccolga e finalizzi al progetto oltre agli aspetti metodologicooperativi e teorico-scientifici della cultura del disegno industriale, anche gli ambiti interdisciplinari (dalla programmazione e organizzazione della produzione al marketing, dall'analisi settoriale e intersettoriale all'economia aziendale, dalla ingegneria dei materiali all'elettrotecnica ed elettronica, dall'ingegneria meccanica e delle tecnologie di lavorazione alla ricerca operativa dalla ricerca artistica e morfologica alla semiotica e linguistica, dall'estetica alle scienze dell'informazione, dalla psicologia cognitiva alle discipline dell'interattività sensoriale fra uomo e sistema artificiale).Questa ricca articolazione di dati è dunque notevolmente maggiore di ciò che solitamente 'presentano' i portali, e proprio per la sua complessità richiede forme di archiviazione, catalogazione, restituzione, 'illustrazione' che devono necessariamente non solo attingere a tutte le metodologie e potenzialità attuali, ma in più cercare di svilupparne capacità e qualità al fine di poter richiamare informazioni di una certa natura con metodi di ricerca ed esposizione dotati di un grado di iconicità e similarità appartenenti a quella stessa natura. La documentazione nel design presenta quindi un'ampia gamma di tipologie di materiale, variabile a seconda del contesto, che comprende le forme più diverse. Ogni archivio o giacimento documentale possiede un 'tassello' diverso della galassia della documentazione del design, che è funzionale agli interessi e al campo di indagine che gli sono propri. Le differenze tra le varie raccolte, inoltre, non derivano soltanto dalle diversità disciplinari o tematiche ma sono spesso determinate anche dalle diversa finalità con cui sono state costituite. Vi sono archivi e giacimenti documentali che si definiscono all'interno di un progetto di ricerca: la selezione dei documenti raccolti ma anche la struttura delle schede catalografiche e la definizione delle chiavi di ricerca è determinata dagli obiettivi stessi d'indagine; sono spesso interessati al processo, dunque anche alla documentazione di preparazione, di studio, di analisi, e/o alle varie fasi di elaborazione; altre volte ricostruiscono singole vicende di progettazione, raccogliendo anche documentazione grafica e normativa correlata. Esistono poi gli archivi di consultazione presso centri di documentazione universitari, che svolgono la funzione di supporto e reference alle attività didattiche e di ricerca: dovendo provvedere ad una documentazione fattuale di riferimento, spesso non hanno interesse per la fase preliminare o di elaborazione. Infine gli archivi o fondi storici, che nella maggioranza dei casi conservano l'insieme dei documenti raccolti nel corso della loro attività da designer e architetti famosi: vi si troverà a volte un'ampia documentazione della fase di elaborazione per i progetti da loro curati, corredati da sporadici e incompleti documenti sugli strumenti a partire da cui e per cui tali progetti sono stati elaborati. La documentazione del design assume quindi forme molteplici: complessi e diversificati sono i documenti che costituiscono un progetto, così come gli interessi e le finalità degli archivi del design e le logiche di catalogazione e di ricerca di questo tipo di documentazione, che in ambito bibliotecario rientra spesso nel settore della letteratura grigia. In generale, le pubblicazioni della letteratura grigia sono di tipo non convenzionale, fuggevole, a volte effimero, e per loro natura ai bibliotecari risultano di difficile acquisizione e messa a disposizione al pubblico. In questo quadro così complesso si è tentato di far luce sulle differenze e sui bisogni informativi comuni verso la definizione di un progetto di catalogazione per questo settore. I giacimenti documentali del design sono insieme fortemente virtuali (il knowhow, i processi, l'organizzazione, input e output digitali) e materiali (i prodotti di design, i materiali del design), a metà tra le collezioni bibliografiche, raccolte di letteratura grigia, collezioni museali e archivi. Dal punto di vista di chi si occupa della gestione di tali giacimenti, i tratti in comune con la documentazione d'archivio sono molteplici, dalla genesi dei documenti alla specificità del catalogo. «L'archivio -come ha scritto Ezio Lodolini -è un complesso organico di documenti prodotti nel corso di un'attività pratica, amministrativa, giuridica; il documento, singolarmente considerato, è privo di autonomia e ha scarsissimo valore, mentre ne ha uno grandissimo come parte di un complesso, come anello di una catena; lo scopo giuridico, amministrativo e pratico è determinante per la formazione dell'archivio. L'archivio è l'antitesi di una raccolta o collezione» 8 . Anche la «spontaneità di formazione dell'archivio», come l'ha definita Giuseppe Plessi 9 , è un elemento che non è possibile ravvisare in altri ambiti, data la volontarietà della formazione di una biblioteca, di un museo o di altri tipi di collezioni 10 . La redazione dell'inventario di un archivio quindi non può mai essere una mera somma di documenti. Spesso negli archivi, così come nella documentazione di progetto, non è possibile o è difficile ricondurre la documentazione ad una organizzazione originaria, capire i meccanismi di creazione. Ma nel design vi è la necessità vitale di riutilizzare i documenti e le conoscenze creati e accumulati nelle varie attività di progetto. Una volta compresi i nuovi attori e i processi della catena documentaria, la creazione di strutturazione ampia e la compilazione di ricchi indici rappresenta una notevole possibilità di accedere a giacimenti documen-tali eterogenei e complessi come quelli descritti all'inizio di questo paragrafo. Il comportamento nell'utilizzo delle informazioni (user modeling 11 ) per l'apprendimento universitario può essere identificato applicando le teorie educative. L'interattività è stata indicata come una componente rilevante della didattica e dell'insegnamento del design 12 : l'approccio learning-by-doing di John Dewey 13 , adottato come metodologia didattica del Corso di Laurea in Disegno Industriale, è spesso utilizzato per fornire nelle teorie pedagogiche all'uso dei computer per progettare ambienti didattici interattivi. Wilson definisce quelli di apprendimento interattivo degli ambienti che permettono «the electronically integrated display and user control of a variety of media formats and information types, including motion video and film, still photographs, text, graphics, animation, sound, numbers and data. The resulting interactive experience for the user is a multidimensional, multisensory interweave of self-directed reading, viewing, listening, and interacting, through activities such as exploring, searching, manipulating, writing, linking, creating, juxtaposing, and editing» 14 . L'interattività è altresì emersa come idea unificante e collante in diversi progetti di biblioteche digitali in ambito universitario 15 : Arms ha per esempio notato che le biblioteche «have always supported interactions with the fund of knowledge, interactions that come in many shapes and sizes... Interacting with knowledge is what life-long learning is all about» 16 . Nelle biblioteche digitali, inoltre, le interattività hanno il potenziale di operare a vari livelli: l'utente e il documento digitale, l'utente e le collezioni digitali, l'utente e i servizi, l'utente e la biblioteca come entità, l'utente e un altro utente.

Sistemi informativi e sistemi conoscitivi in ambienti di rete

Genericamente, sotto la categoria di sistemi informativi 17 si possono classificare tutti i sistemi tecnologici che manipolano, conservano, processano e distribuiscono un'informazione che ha o si aspetta possa avere un impatto sul comportamento umano, organizzato all'interno di un contesto reale di azione. Essi sono essenzialmente implementati per mettere a disposizione di una particolare classe di utenti una serie di servizi informativi con i quali interagire per il soddisfacimento dei loro più svariati bisogni informativi 18 . La maggior parte dei sistemi informativi attualmente in uso sono stati sviluppati in accordo con una serie di modelli normativi tesi a descrivere i processi cognitivi di problem solving e decision making 19 . L'assunzione implicita alla base di questi sistemi é che i bisogni informativi degli utenti siano statici e che il processo di accesso alle informazioni consista nella capacità di esternalizzare la loro mancanza di informazione e di ridefinire successivamente la domanda iniziale, prima di recuperare ciò di cui si ha bisogno.

In molti ambiti universitari tecnico-scientifici sono stati elaborati dei sistemi informativi d'area disciplinare, che si stanno evolvendo verso una sempre maggior integrazione transnazionale. L'affermazione di strategie di Knowledge Management -in ambito aziendale ma anche in organizzazioni come le università (cfr. paragrafo 1.7) -e gli studi e le indicazioni provenienti dalle scienze cognitive suggeriscono di tentare la trasformazione di questi sistemi informativi in sistemi cognitivi d'area disciplinare. Tutte le organizzazioni creano conoscenza. Nella maggior parte dei casi, però, questo processo è casuale, stocastico e come tale imprevedibile 20 . È però senz'altro possibile modificare le cose affinché la creazione e la diffusione (o disseminazione) della conoscenza escano dall'accidentale, dal fortunoso e dall'episodico per sistematizzarsi in organizzazioni e in processi più razionali ed efficaci, e che nel medesimo tempo riescano a salvare libertà di espressione e di creazione insieme con la stabilità e la sicurezza trasmissiva di un sistema di comunicazione omogeneo e controllabile. Nel passaggio di informazione e di conoscenza che avviene fra autore e lettore, come ha più volte puntualmente osservato Bogliolo 21 , è possibile e può essere vantaggioso frapporre una struttura cognitiva che organizzi modi e forme di questa trasmissione e di questa fruizione. Le biblioteche e i centri di documentazione da tempo si basano su un rapporto triadico tra documenti, meccanismi di mediazione semantica e utenti, ponendo l'enfasi sugli ultimi due elementi del rapporto. L'intermediazione delle scienze dell'informazione, operata dai bibliotecari-documentalisti, nei confronti e in collaborazione con gli utenti, allo scopo di creare una struttura cognitiva (la learning library 22 ) capace di facilitare l'apprendimento di tutti i suoi membri e di trasformare se stessa continuamente, come struttura e come organizzazione, con il modificarsi delle esigenze cognitive dei suoi membri. La letteratura sui sistemi cognitivi è molto ampia. Nati nell'ambito dell'intelligenza artificiale, sono usciti dalle stanze dei ricercatori quando l'industria ha avuto bisogno di nuovi strumenti per far fronte a nuove sfide del mercato. I tempi sono più che maturi perché queste realizzazioni, sperimentate nel mondo del profitto, tornino al mondo universitario e della ricerca, per la progettazione di nuovi e migliori servizi per le sue produzioni scientifiche e culturali. Un sistema cognitivo ha l'obiettivo di fornire mezzi e strumenti (logici e tecnologici) per generare interpretazioni dirette del mondo reale, piuttosto che delle sue interpretazioni tramite i documenti. Come ha acutamente osservato Bogliolo il compito di un sistema cognitivo è quello di «gestire il corto-circuito fra autore e lettore, mediante un'organizzazione del lavoro che integra le attività dell'autore e quelle del bibliotecario-documentalista. Succede, così, che la conoscenza tacita che è posseduta dall'autore, e che è fonte creatrice del documento, non possa essere integralmente trasferita in quest'ultimo: il documento rinvierà, alluderà, in misura maggiore o minore, a quella fonte, ma la natura stessa del documento, sia pur multimediale, non potrà offrirne una registrazione esplicita e completa» 23 . L'organizzazione è ancora e sempre quella della biblioteca o del centro d'infor-mazione e documentazione, non importa quanto tecnologicamente avanzato. Il professionista dell'informazione rimane comunque un intermediario, ma su un piano superiore di ricchezza ontologica e di efficacia cognitiva, e dunque anche informativa: non si limita a moltiplicare le porte di accesso semantico e semiotico a una base di dati statica, ma a creare chiavi interpretative del pensiero che fluisce dai fornitori dei documenti agli utenti. Il problema nella realizzazione e nell'utilizzo di questi sistemi non è tanto strumentale, giacché le tecnologie ICT forniscono un aiuto rilevante nel perseguimento di questi obiettivi, grazie alle loro caratteristiche intrinseche di capacità di creazione, elaborazione, immagazzinamento e scambio in breve tempo di grandi quantità di informazioni in tutte le loro forme (dati, suoni, immagini, multimedia). Le ICT e le loro estensioni Web-enabled permettono un nuovo tipo di interazione e di disponibilità dell'informazione: la sua teletrasferibilità a distanza. Infine, sono in grado di supportare quasi completamente ogni tipo di informazione visuale, permettendo tramite i processi di vettorializzazione e/o discretizzazione di rendere l'informazione richiamabile non solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in base a caratteristiche visuali (colori, geometrie, texture, ecc.). Il Web stesso sta vivendo una profonda autoriflessione in senso semantico ad opera del suo creatore, Tim Berners Lee 24 , al fine di creare sistemi aperti di accesso all'informazione che siano non solo semplicemente navigabili, ma completamente strutturabili e richiamabili tramite l'utilizzo del XML. Come spesso capita, si tratta di un problema di mentalità, poiché i sistemi knowledge-based sono accompagnati da una fama non positiva dovuta ad un approccio ingegneristico che ne ha appiattito e banalizzato la pluridimensionalità e pluridirezionalità. Per costruire un sistema cognitivo orientato a una disciplina, in pratica occorrono un progetto, un finanziamento, delle risorse tecnologiche e un gruppo di lavoro organizzato, interdisciplinare, composto da esperti del dominio (docenti e ricercatori della materia), esperti dell'informazione (bibliotecari e documentalisti), e esperti della tecnologia dell'informazione (ingegneri ed esperti d'intelligenza artificiale): in sostanza, le tre componenti della 'piramide di conoscenza dell'organizzazione intelligente' di Choo Chun Wei 25 . Il metodo lavoro è indicato dalle nozioni di Knowledge Management elaborate da Nonaka, di processi di creazione di conoscenza top-down, bottom-up e middle-up-down. Quest'ultimo approccio presenta un modello iterativo di lavoro comune continuo (di cui non sempre gli attori sono consapevoli) attraverso il quale la conoscenza viene realmente creata. I diversi attori di questo modello tendono a trattare tali materiali secondo svariate logiche ed esigenze: gli autori per disseminare e condividere conoscenze e informazioni, i bibliotecari e i documentalisti per creare un universo di informazioni correlate tra loro, gli utenti per recuperare documenti e/o informazioni a partire da esigenze di studio e di ricerca oppure ragioni professionali. Le loro azioni raramente si configurano come interazioni: pertanto, seppur inconsapevolmente, questi soggetti contribuiscono ad aumentare il 'disordine', l'entropia nell'universo catalografico. Il loro coordinamento in un sistema conoscitivo equivale a riunire sinergie positive e a potenziarle. Tale meccanismo, che rispecchia alcune modalità di lavoro tipiche del design, applicato alla sua documentazione potrebbe essere in grado di operare profondamente sull'informazione del disegno industriale con finalità progettuali, e molto di più perché la catalogazione di solito si riferisce a sistemi analogici, mentre tipicamente il dato di design è digitale.

Dal Cultural Heritage all'Industrial Design knowledgebase

Gli output tipici finali dei processi di design risultano spesso in prodotti matrici, che costituiscono la rappresentazione del progetto stesso. Le manifestazioni più alte di tali progetti, in quanto documenti di una cultura progettuale che nell'ultimo secolo si è sempre più velocizzata, rientrano a pieno titolo nella categoria di Beni Culturali da conservare e tutelare. In Italia i musei del design e gli archivi d'impresa sono, infatti, testimonianza di una civiltà progettuale raffinata e radicata nel territorio insieme ai distretti industriali. La loro specificità ha peraltro dato luogo ad interessanti riflessioni museografiche e museologiche 26 , intervenendo nel dibattito sui musei 'cimiteri' e i musei 'vivi': gli oggetti di design possono rimanere vitali e comunicare emozioni se utilizzati direttamente dai visitatori (far vedere solo l'oggetto e la sua fisicità è limitativo, inoltre molti oggetti del design sono ancora vivi nella nostra memoria quotidiana, a differenza di tanti artefatti di un passato remoto 27 ). Ciò implica un rinnovamento costante del museo o dell'archivio di impresa, e la necessità di ricostruire la storia e il contesto di oggetti di cui tipicamente non si registrano informazioni: anche in questo ambito emergono quindi problematiche relative alla sistematizzazione e alla restituzione di giacimenti documentali 'altri' rispetto ai tradizionali documenti bibliografici. Negli ultimi anni, in particolare in esperienze museali internazionali, sono stati applicati con successo molte delle metodologie e degli strumenti di sistematizzazione documentale descritti nei precedenti capitoli di questo volume: da specifici metadati come le CDWA elaborate dal Getty Institute e le VRA Core Categories, a thesauri costruiti sullo specifico vocabolario di discipline particolari (dal più famoso Art & Architecture Thesaurus del Getty a quello messo appunto dall'Istituto Centrale per il Catalogo e la Documentazione di Roma relativo agli arredi e alle suppellettili religiose), a portali 'per studiosi' di tipo verticale per facilitare una ricerca approfondita offrendo contenuti di alta qualità e permettendo la ricerca su collezioni multiple, come lo Humanities Web Portal della University of California di Los Angeles. Molti portali relativi a discipline umanistiche 28 sembrano peraltro sempre più ispirarsi al modello dei cosiddetti enterprise information portal 29 . Nel panorama italiano dei Beni Culturali, caratterizzato in modo imprescindibile dalla necessità di conservazione, tutela e fruizione, le possibilità offerte dalle ICT hanno offerto nuove possibili soluzioni alla secolare e spinosa questione della catalogazione complessiva del patrimonio sul territorio nazionale. Un recente rapporto della Corte dei Conti sullo stato della catalogazione statale ha infatti nuovamente ricordato come le schede di beni archeologici, artistici, architettonici, storici e demo-etno-antropologici redatte dall'Istituto centrale per il catalogo e la documentazione sono fino ad oggi momento circa 4.100.000 (tra schede di catalogo, pre-catalogo e inventario), delle quali oltre la metà sono già informatizzate. A queste devono essere aggiunte quelle curate dalle Regioni, per i beni di proprietà regionale e degli enti locali, e quelle a cura delle diocesi, per i beni ecclesiastici. «Nonostante la grande massa di dati acquisiti -si nota nella relazione della Corte dei Conti -il lavoro da compiere è ancora molto perché le più recenti stime indicano in oltre dieci milioni [ Fig. 2

] Sistema multimediale SIGEC dell'ICCD: diagramma del workflow (da Il Sistema Informativo Generale del Catalogo, 2002)

di beni il patrimonio complessivo italiano da censire. Una indicazione 'dinamica' ed in continua crescita per nuove analisi critiche, nuovi ritrovamenti, nuovi scavi e nuove acquisizioni. Ancora oggi non si ha una conoscenza esaustiva dei beni che costituiscono il patrimonio pubblico. Una lacuna grave che necessita di essere colmata» 30 . Quanto ai finanziamenti destinati alla catalogazione, per la Corte dei Conti «la somma spesa complessivamente nel settore negli ultimi quindici anni non è indifferente: 830 miliardi di vecchie lire di stanziamenti che non sempre hanno dato risultati positivi». Negli ultimi anni, l'Istituto Centrale per il Catalogo e la Documentazione (ICCD) del Ministero per i Beni e le Attività Culturali ha definito e avviato lo sviluppo di un progetto per la costruzione del Sistema Informativo Generale del Catalogo (SIGEC), che si fonda sul concetto, consolidato nel tempo dall'ICCD, del patrimonio come 'sistema' 31 . La ricchezza del patrimonio italiano diffuso su un territorio connotato da beni di inestimabile rilevanza culturale, contestualmente al complesso dei beni musealizzati, rendono la sistematicità una condizione necessaria a garantire l'organica e integrata conoscenza del patrimonio. In passato, il rapporto degli enti locali con l'ICCD e il Ministero si è tradotto nella maggior parte dei casi nell'adozione dei tipi di schede e degli standard di catalogazione ministeriali; tuttavia, su questo terreno molte sono state le innovazioni prodotte a livello locale, soprattutto per tipologie specifiche di oggetti (come l'architettura industriale, il design, i beni demo-etno-antropologici, ecc.). D'altronde proprio sul piano degli standard fissati dal ministero si registrano diffuse tensioni, soprattutto per le persistenti carenze degli 'standard di descrizione' o di sintassi compilativa delle voci, nonché per la lentezza della strutturazione informatica delle schede, che ha già costretto in passato alcune regioni ad anticipare per proprio conto la conversione informatica delle schede ministeriali, in assenza di direttive specifiche dall'ICCD. L'evoluzione operata dal SIGEC è notevole, poiché si passa da una visione puntuale identificativa del singolo bene a una concezione unitaria e complessa del patrimonio, e quindi a una maggiore consapevolezza del rilievo che hanno assunto le relazioni tra i beni e le interazioni significative all'interno del patrimonio artistico e culturale. L'innovazione sia metodologica che tecnologica investe non solo il modo di concepire la catalogazione informatizzata, e la comunicazione di contenuti informativi ad essa riferiti, ma promuove anche una rete di rapporti più ampia e differenziata con gli enti che operano per l'organizzazione sistematica e la diffusione delle conoscenze. Il SIGEC si presenta pertanto come sistema multimediale di banche dati distribuite sul territorio nazionale (Fig. 2): una conoscenza capillare ed esaustiva del territorio è infatti realizzabile solo coin-volgendo una pluralità di soggetti fra i quali le Regioni e gli Enti Ecclesiastici, ma anche di organizzazioni come l'università o enti privati che si vogliano correlare con l'ICCD, allineando i dati con le normative di riferimento. Dal punto di vista informatico, l'interoperabilità dei record viene resa possibile attraverso la mappatura di schemi di metadati diversi, tra cui anche -dato non indifferente per la sua diffusione e facilità d'uso -il Dublin Core.

Ipotesi per una soluzione

Lo scenario sopra descritto sembra particolarmente attuale e rilevante nell'ambito del metaprogetto nella Facoltà del Design del Politecnico di Milano, «individuato nella predisposizione di strumenti e modelli che operano su risorse concettuali e conoscitive, nell'individuazione di una metodologia, e nell'organiz-zazione -attraverso strumenti e risorse -di nuove possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di offerta» 32 . Obiettivi perseguibili proprio attraverso un'attività di ricerca, acquisizione e catalogazione di dati, informazioni e conoscenze, tesa ad ampliare e ridefinire gli strumenti del flusso di conoscenze e d'informazione della Facoltà del Design tramite la codifica di una serie di procedure sistematiche, secondo standard e criteri condivisi. Il progetto è un modo molto potente di comprendere un artefatto, ma per sua natura (il progetto si trasforma nello spazio e nel tempo) risulta difficile da visualizzare. Fino all'avvento del Visual Computing e della Realtà Virtuale, nel nostro bagaglio di rappresentazioni visive non sono state operate molte modifiche rispetto alla rappresentazione 'per esploso', che perciò non riesce a restituire la complessa ecologia del progetto, a rappresentare cioè simultaneamente gli artefatti del design e le persone attorno ad esso, le conoscenze in esso applicate e i problemi incontrati, in un sistema ibrido che coniuga soggettività e oggettività. Il design opera infatti una ri-progettazione del composito ambiente che lo circonda 33 , producendo degli artefatti attraverso una serie di interazioni e di compromessi secondo una traiettoria spaziale, temporale e sociale. Per tale motivo, una sistematizzazione documentale del design e la sua rappresentazione non possono prescindere dal contesto degli artefatti del progetto. Siamo in una fase, nell'evoluzione delle modalità di archiviazione dei documenti, in cui abbiamo la possibilità di archiviare documenti digitali nativi in sistemi ancora digitali, sfruttando appieno il potenziale interattivo e relazionale delle ICT per proporre al mondo accademico e professionale del design uno strumento di studio e di lavoro ad alto valore aggiunto. Il grado d'elaborazione attuale dei personal computer e l'introduzione del concetto di visual computing, strettamente connesso a quello di visualizzazione scientifica, come target di riferimento dell'evoluzione del sistema hardware e software, stanno veloce-mente conducendo verso la possibilità di realizzare non solo operazioni di ricodifica di documenti fisici in documenti digitali, ma una loro trascrizione in forma integrale unita ad un loro facile collegamento reciproco, alla possibilità di creazione di relazioni tra ambiti distinti, alla facilità di accostamento e all'accesso unificato e integrato di tipologie eterogenee, con processi di graduale standardizzazione tra differenti protocolli. Da un punto di vista della formazione di un archivio digitale e della sua fruizione, le caratteristiche distintive dei trend tecnologici attuali, che consentono di concepire uno scenario completamente nuovo e di dimensioni prima sconosciute nell'archiviazione e nell'Information Retrieval delle informazioni, sono sintetizzabile in sei punti:

1. il desktop fisico è stato completamente sostituto da un desktop virtuale. I sistemi operativi di nuova generazione (Windows XP, Mac OS X), sono destinati a realizzare una nuova rivoluzione del modo di lavorare degli utenti: il desktop virtuale può, infatti, permettere di costruire una soluzione specifica in forma completamente digitale per realizzare una determinata procedura nella sua completezza. Le implicazioni di questa sostituzione sono profonde e sostanziali: il PC non fornisce più solamente strumenti di ausilio, ma tutto il ragionamento e la sua visualizzazione sono trasferiti in forma digitale su un supporto unificante capace di metodi, più potenti e di accesso più immediato, in grado di integrare istantaneamente molteplici tecniche di rappresentazione (disegno tecnico, disegno concettuale, modellazione, fotografia, ipertestualità, animazione, filmati, testi, ecc.), che quindi possono essere sfruttate rapidamente, a basso costo, e con risultati immediatamente fruibili e fortemente stabili. Inoltre, per la semplicità delle interfacce, il lavoro sul computer oggi non costituisce più un mestiere per operatori specializzati, destinati a fungere da tramite tra il professionista e la macchina, ma una metodologia che presenta un'operatività e una facilità d'uso del tutto simile a quella degli strumenti analogici e quindi è l'esperto della singola disciplina (designer, fotografo, architetto, archivista, documentalista …) a potersi rioccupare direttamente del problema, con evidente possibilità di notevole miglioramento qualitativo e di controllo del processo; 2. i formati digitali sono sempre più standardizzati. Uno dei più grandi problemi dei sistemi computerizzati è sempre stato quello della codifica dei dati, in particolar modo nel caso dei formati grafici, di cui neanche la rappresentazione analogica è univocamente determinata (anche per la sua natura intrinseca di sistema ad alto simbolismo). Inizialmente si è assistito ad una proliferazione iniziale di miriadi di standard differenti incapaci di dialogare fra loro, con l'effetto -molto più grave di quanto può accadere per i mezzi tradizionali -non solo di impedire letture di confronto, ma di negare l'accesso stesso ai dati. Oggi la problematica sembra arrivata ad una svolta radicale con la comparsa di formati di gran lunga 'migliori', che stanno rapidamente soppiantando i precedenti formati in virtù della loro semplicità, completezza, possibilità di lettura anche in assenza del software nativo che li ha generati. XML per il Web, Quick Time e Windows Media per il video, Open GL per la grafica 3D real-time e soprattutto Acrobat PDF e formati quali il TIFF e il JPEG per i documenti 2D (disegni, immagini, testi, ecc.) descrivono formati universalmente riconosciuti e distribuibili su tutte le piattaforme oggi in commercio (UNIX, Apple, Windows), rendendo la standardizzazione un de facto, fino ad oggi assolutamente impensabile; 3. nell'universo digitale i documenti testuali e grafici sono divenuti nient'altro che casi particolari di un bagaglio di strumenti ben più articolato e nel contempo facilmente integrabile di quello cui siamo abituati per la figurazione del progetto (rappresentazioni 2D o al massimo maquette 3D statiche). Il disegno non è altro che una delle tante facce di un sovrainsieme dato da un sistema multimediale completo, in grado di distribuire a partire da una medesima piattaforma e dai medesimi materiali testi, immagini, disegni vettoriali, modelli tridimensionali animabili e renderizzabili in tempo reale, animazioni grafiche, filmati, documenti formattati per la stampa o per la visualizzazione attraverso Internet. La diffusione di strumenti come Java, una tecnologia basata sulle potenzialità della rete, e sull'idea che lo stesso software può funzionare su differenti tipi di computer e periferiche, permetterà di avere ipermedialità, animazione 2D e 3D semplicemente visualizzabili con un Web browser; 4. il modo di lavorare dell'utente prevede la possibilità, accanto al tipico modo in serie, anche quello della parallelizzazione dei processi. Il mondo del multitask (più applicazioni che funzionano contemporaneamente sulla stessa macchina) e del multi-user (più utenti che possono accedere alle stesse risorse) fino a poco tempo fa era confinato alle workstation e ai server professionali, ovvero pochi strumenti dall'accessibilità limitata alle grandi masse di utenti. Il tipico modo di lavorare su un Personal Computer era quello di realizzare un solo lavoro alla volta, di una sola tipologia, condotto da un unico utente che eseguiva processi necessariamente uno dopo l'altro, con tempi e limitazioni espressive e produttive assai elevati, rendendo in pratica impossibile effettuare analisi comparative non rigidamente precostituite. Oggi le potenze di calcolo, la diffusione dei sistemi di reti locali e globali, la possibilità di gestire grosse quantità di dati da parte di un PC, hanno consentito l'introduzione di metodi di gestione dello strumento tali da rendere possibile la compresenza di più azioni: più operazioni realizzate contemporaneamente, oggetti trasportati da un'applicazione all'altra, condivisione dei file di lavoro, per cui il singolo operatore può usare più strumenti contemporaneamente e più operatori possono usare lo stesso strumento sullo stesso progetto. I tempi e la qualità del lavoro sono marginalmente influenzati da limitazioni del mezzo, mentre sono assai più spiccatamente dipendenti, dalle capacità concettuali e figurative dell'operatore; 5. negli ultimi due anni il costo delle memorie di massa si è enormemente ridotto, peraltro rendendo accessibile a basso costo operazioni che fino a poco tempo fa erano di fatto impossibili per soggetti a basso valore aggiunto e ad alto dispendio di memoria per l'archiviazione e la manipolazione, come sono fondamentalmente le trasposizioni digitali dei documenti che compongono gli archivi di architettura. La legge di Moore del raddoppio ogni 18 mesi è applicabile anche alle memorie di massa, sostituendo il termine 'capacità' a 'potenza'. I costi sono passati dai 3 Euro per Megabyte di dieci anni fa a quelli di 3 Euro per Gigabyte attuali (2003). L'unità di massa mobile per eccellenza, il DVD, può contenere nella soluzione più utilizzata oggi (4,7 Gigabyte di spazio disponibile per pochi Euro) oltre 400 immagini fotografiche in bianco e nero di dimensioni A4 stampabili in formato non compresso, mentre i costi d'acquisto di un server dati da qualche Terabyte è circa un decimo di quello di tre anni fa, appartenendo ormai alla categoria di poche migliaia di Euro; 6. il partner di lavoro del ricercatore o del progettista non è più solo l'archivista o il documentalista, ma l'intera comunità scientifica. Il tradizionale approccio al Personal Computer ha sempre individuato il nostro modo di lavorare come quello di un operatore che legge e scrive informazioni sul proprio hard disk, che quindi è sostanzialmente l'unico contenitore su cui andare a depositare e attingere forme della conoscenza. La movimentazione delle informazioni tra un operatore e l'altro è stata inizialmente assai difficoltosa, solitamente legata alla movimentazione fisica di interi dispositivi capaci di trasportare quantità di dati sempre più crescenti ma sempre in modo discreto. La definizione anche in questo campo di standard universali di trasporto dati attraverso una rete via cavo, la possibilità di visualizzazione di 'finestre' comuni tra operatori diversi, ma soprattutto il vorticoso incremento delle prestazioni del trasporto del flusso delle informazioni attraverso il network (lo standard è ormai 1 Gb/sec per le reti locali, cioè circa tre fotografie a colori stampabili in formato A4 al secondo, e 2 Mbit/secondo per reti globali) ha condotto al necessario ripensamento di tutta la filosofia del sistema. L'hard disk non è che uno dei contenitori di banche dati a disposizione, cui aggiungere ciò che rendono disponibile in risorse dati e computazionali altri computer che lavorano nel nostro stesso ambito di lavoro e, soprattutto, ciò che restituiscono su Internet, ormai in tempo reale, tutti i server collegati. Non siamo più soli, né possiamo lavorare da soli: oggi è il mondo intero che ci aiuta e ci guida nel nostro lavoro. E lo è molto di più perché i laptop portatili, per la prima volta, possono sostituire in tutto i PC da tavolo. L'ipotesi di maggior interesse da esplorare attualmente, nell'ambito in oggetto, è dunque quella di un sistema di diffusione dell'informazione e delle conoscenze dall'interno verso l'esterno e viceversa, un sistema con interfacce analogiche e digitale volto a costituire e implementare un knowledge network universitario per l'acquisizione, la sistematizzazione e la visualizzazione di risorse eterogenee distribuite, creando una struttura conoscitiva e di erogazione di servizi: vale a dire un Quality-Controlled Subject Gateway e un Learning Resource Centre per il design. Non sono, infatti, le funzioni della biblioteca odierna intesa in senso lato ad essere mutate, come è stato osservato nei primi capitoli di questo volume, quanto piuttosto lo spazio e i servizi in virtù dell'utilizzo di nuove tecnologie di visione per nuove tipologie di documenti e di informazioni: non più la semplice 'forma libro' ma documenti digitali per loro natura instabili e complessi da poter scambiare e manipolare. La novità, nello scenario sopra delineato, sono l'indipendenza dall'ubicazione e la centralità dell'utente, in particolare in ambito universitario, dove le biblioteche sono il principale centro servizi. Si prospettano quindi specifiche tematiche da affrontare:

1. predisposizione di strumenti che permettano un'efficiente gestione e recupero dell'informazione all'interno dei sistemi di catalogazione e di descrizione che utilizzano metadati e standard riconosciuti; 2. possibilità di rendere questi strumenti un ponte fra universi informativi contigui (biblioteche, archivi, musei, raccolte in genere); 3. qualificazione ed arricchimento di contenuti conoscitivi i sistemi informativi, attraverso la ricostruzione e l'intreccio di contesti. Le risposte individuate, al fine di provvedere una operatività di base, sono le seguenti:

-metodi di archiviazione dei dati e formazione di schemi di metadati per la descrizione e il recupero dei documenti; -metodi di esposizione dei dati (quality-controlled subject gateway); -metodi di accesso ai dati (learning resource centre).

Un knowledge base per il design dovrebbe saper restituire ed evocare quell'intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui si origina il progetto: l'interdisciplinarietà che caratterizza il design offre, infatti, una ricchezza incredibile di punti di vista, di diverse realtà conoscitive da esplicitare e far dialogare tra loro, secondo categorie e tematiche trasversali. Un sistema così metodologicamente definito potrebbe divenire punto di incontro tra studenti, docenti e professionisti del settore, finalizzato alla costruzione di un ambiente innovativo di collaborazione, d´interazione e di discussione a supporto della didattica e della ricerca online e offline, attraverso l´accesso Web a contenuti e servizi realizzati e alimentati dalla comunità. Il modello del Gateway to Cornell University Library 34 sembra rappresentare un sistema informativo che promette grandi potenzialità e flessibilità in ambienti di rete, certamente perfettibile e implementabile (Fig. 3). L'interazione e il coinvolgimento dell'utente sono certamente da favorire e da stimolare, per esempio tramite la creazione di una comunità virtuale interattiva e di uno spazio digitale di lavoro e di servizi personalizzati. Tuttavia, l'approccio prettamente top-down di un archivio digitale dinamico 35 , se da un [ Fig. 3] Screenshot dell'homepage del Gateway to Cornell University Library lato mette a proprio agio sia studenti che designer offrendo una piattaforma di scambio di esperienze e di informazioni, in differenti contesti e a differenti livelli, pone non trascurabili difficoltà per un'evoluzione strutturata e logica del sistema, come rilevato dagli stessi autori. È certamente importante predisporre strumenti per un'efficiente gestione e visualizzazione dei dati e renderli un ponte fra patrimoni conoscitivi contigui, attraverso l'interoperabilità tra diversi tipi di risorse. Non esiste, infatti, un unico formato standard di metadati, ma piuttosto numerosi schemi nati da esigenze specifiche, che è fondamentale far dialogare tra loro. In tal senso, la messa a punto di un thesaurus, secondo un rigoroso lavoro di controllo e compilazione, rappresenta un mezzo potente ed efficace di accesso e condivisione delle conoscenze, in particolar modo se è previsto complementare ed integrato ad un sistema di Visual Retrieval come quello già citato realizzato dal gruppo di Visual Information Technology del National Research Council of Canada. Ciò che risulta evidente, in ogni caso, è che un sistema conoscitivo deve essere sviluppato innanzitutto in termini di metodologie, procedure ed infine di software. La ricchezza di un sistema conoscitivo per il design dovrebbe saper restituire ed evocare quell'intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui si origina e si alimento il progetto. Tuttavia, se l'accesso istantaneo all'informazione digitale è forse la caratteristica più significativa dell'era dell'informazione, frutto di elaborati meccanismi di recupero prodotti dalla tecnologia, la tecnologia non è sufficiente. L'efficacia di un sistema di accesso all'informazione e alla conoscenza è infatti direttamente proporzionale all'intelligenza e ai metodi impiegati per organizzarlo. [ 1 ] Si intende qui per 'dato' la registrazione in un codice di un aspetto della realtà; per 'informazione' la percezione di un insieme di dati, attraverso un processo di interpretazione; per 'conoscenza' il processo cognitivo di rielaborazione delle informazioni e delle esperienze. [ 3 ] H.Strauss, What Is a Portal, Anyway?, CREN (Corporation for Research and Educational Networking) Tech Talk, January 2000 <http://www.cren.net/know/techtalk/events/ portals.html> [ 4 ] Un portale é, per definizione, un sito Web che é o si propone di essere un importante punto di accesso per altre destinazioni, e può essere a carattere generale o di nicchia, cioé dedicato ad una precisa tematica. Vi sono centinaia di portali verticali (specializzati in una categoria dell'informazione, come una disciplina, o un utente, come quelli universitari) o di portali aperti, generali. I portali offrono un'ampia gamma di opzioni per la personalizzazione e di servizi e di funzioni. [ 5 ] Rispettivamente < www.design-italia.it/>, <http://www.designboom.com/>,<http://w ww.designboom.com/>, < www.e-interiors.net/>, <www.designvillage.it> [ 6 ] Si tratta di un progetto inaugurato nel 1998 da sei università americane, finalizzato a diventare strumento di supporto e continuo miglioramento degli atenei: The Urban University Portfolio Project: Linking Learning, Improvement and Accountability, International Conference on Assessing Quality in Higher Education, 2000, <ww.imir.iupui.edu/portfolio/> [ 7 ] E-mail del 25 settembre 2001.

Due istituti a confronto. Intervista a Ezio

Lodolini sui rapporti tra archivi e biblioteche, in «Biblioteche Oggi», maggio-giugno 1985, vol. 2, n. pp.11-15. [ 11 ] Cfr. M. Budhu, A. Coleman, The Design and Evaluation of Interactivities in a Digital Library, in «D-Lib Magazine», November 2002, vol. 8, n. 11 <http://www.dlib.org/dlib/november02/col eman/11coleman.html> [ 12 ] Cfr. Didattica e design, cit. [ 13 ] J. Dewey, Democracy and Education: An Introduction to the Philosophy of Education, Macmillan, New York 1916 <http://140.211.62.101/dewey/contents.html> [ 14 ] K. Wilson [ 23 ] D. Bogliolo, Sistemi informativi e sistemi cognitivi, cit. [ 24 ] Il Web Semantico «is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation» (da T. Berners-Lee, J. Hendler, O. Lassila, The Semantic Web, in «Scientific American», 2001 <http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html >). [ 25 ] C.W. Choo, Information management for the intelligent organization, cit. [ 26 ] Cfr. Musei e archivi d'impresa: il territorio, le imprese, gli oggetti e i documenti, atti del convegno di studi di Assolombarda, Assolombarda, Milano 2001. [ 27 ] Il Museo Ducati (<http://www.ducati.com>), ad esempio, cerca di valorizzare il prodotto attraverso il suo impatto emozionale (ponendosi non come una fabbrica di moto ma una comunità), creando identità tra prodotto e museo, aspetto emozionale dell'oggetto moto e del museo in quanto tale. [ 28 ] Per una definizione dei portali accademici e degli information gateway cfr. S. E. Come quello creato da Ann Heylighen (prototipo DINAMO consultabile al sito <http://www.asro.kuleuven.ac.be/dynamo>

Thomas, L'impiego del portale per l'individuazione di risorse elettroniche specialistiche, in

Il progetto DesignNet

Paolo Ciuccarelli, Perla Innocenti

The real challenge is creating appropriate organisational contexts for action Paul Conway

Bisogni e obiettivi

Per una esigenza come quella manifestata dalla Facoltà del Design, che a fronte di quanto detto nei capitoli precedenti, possiamo riassumere nel doppio bisogno di azzeramento rispetto a dati e informazioni, e di supporto per operazioni esperienzial-conoscitive sui documenti, non esiste tout-court una soluzione unica e compiuta. Non è possibile pensare di codificare a priori il processo conoscitivo del design, che abbiamo visto essere basato prevalentemente sull'esperienza, né immaginare di organizzare in un archivio completo e preordinato l'universo infinito dei possibili frammenti documentali, degli stimoli culturali, utili ad alimentare la creatività e il design. Si può però analizzare attentamente quella esigenza, come abbiamo cercato di fare, per trarne delle indicazioni di metodo e sviluppare strumenti e metodi di gestione delle informazioni e dei documenti più coerenti con il processo progettuale. Ci siamo quindi concentrati sulle regole del gioco, mettendo da parte il risultato: è difficile, impossibile, anzi, inutile, dire cosa debba contenere un sistema conoscitivo per il design, mentre è utile e anzi necessario restituire la geografia e il significato di ogni singolo documento selezionato, e delle sue relazioni con altri, infiniti, documenti. In luogo di una selezione ridotta dei documenti da trattare, per ridurre la complessità del problema abbiamo viceversa rinunciato a definire categorie preliminari, esplorando quanti più scenari informativi possibile, per mantenere alto il livello di flessibilità del sistema. A partire da queste condizioni abbiamo agito da un lato (quello della struttura del contenitore) sui possibili denominatori comuni dei diversi documenti, sulla flessibilità, la più alta possibile, in modo che qualsiasi documento potesse essere trattato; dall'altro (quello dei contenuti che descrivono il documento e le relazioni che gli danno significato) la flessibilità diventa la più bassa possibile, in modo che, almeno all'interno della comunità di riferimento, il senso di quel documento sia compreso senza ambiguità e in modo univoco. Questo è il motivo principale della prima grande scelta operata nel progetto DesignNet, l'identificazione di tre moduli strumentali distinti ma integrati ( Fig. 1), che rispecchiano le esigenze sopra descritte: uno strumento di gestione della terminologia, per costruire il vocabolario del design (DesignThesaurus) attraverso il quale dar corpo al linguaggio comune neces-[ Fig. 1 sario a descrivere i documenti in modo significativo; una directory del design (DesignDirectory) che permettesse l'identificazione univoca degli specifici elementi di indicizzazione: persone, organizzazioni, marche (brands), locations, eventi; uno strumento di catalogazione che utilizzasse uno standard il più possibile aperto e pensato già in origine per far stare insieme in modo coerente risorse documentali eterogenee. Ognuno di questi moduli è stato declinato per il design: per il catalogo ad esempio è stato sviluppato uno specifico 'profilo di applicazione' dello standard scelto, Dublin Core; nella definizione degli authority file della Design Directory emergono specificità che sono tipiche della produzione industriale, come la distinzione tra marca e produttore (organizzazione-azienda) e la possibilità di stabilire una relazione temporale tra i due elementi oltre che attraverso il prodotto.

] I tre moduli del progetto DesignNet (Thesaurus, Directory e Catalogue) e l'interazione con l' interfaccia digitale (design gateways) e fisica (design knowledge centres) (P. Ciuccarelli)

In sintesi il nodo principale del progetto DesignNet sta proprio nel fatto che la tipologia dei documenti da gestire non è identificabile a priori, sia nella organizzazione dei documenti per il design, sia, estendendo il discorso, nella gestione dei documenti del design. Qualsiasi documento può essere preso in considerazione, se, e solo se, si dispone di un metodo per contestualizzarlo, dargli significato, posizionarlo (mapparlo) attraverso le relazioni con termini, elementi di indicizzazione, altri documenti. Se pensiamo ai documenti del design, quelli più tradizionali come i prodotti fisici, è evidente come il loro racconto assuma significato proporzionalmente all'estensione della trama delle relazioni intessute con altri documenti all'interno del contesto sociale e culturale, della cultura materiale soprattutto, di riferimento. Per questo motivo non ci siamo interessati in prima battuta delle singole schedature (ad esempio quella dell'oggetto di design), spostandoci invece subito al livello metadescrittivo (dal metadato al meta-metadato), al modo di mettere insieme qualsiasi documento perdendo il meno possibile delle singole descrizioni, e cogliendo però contemporaneamente l'obiettivo strategico di farli dialogare tra loro, attraverso relazioni e termini unificati e normati. La stessa visione, lo stesso approccio integrativo e metaprogettuale, sono stati applicati, oltre che nella definizione del metodo e degli strumenti DesignNet, anche nella sperimentazione degli stessi all'interno della Facoltà del Design: si è deciso che non serviva tanto creare un nuovo giacimento di documenti quanto piuttosto organizzare quelli esistenti in un insieme integrato (un sistema), organizzato per il design(er). La stessa integrazione poi è stata declinata sia sul piano immateriale che su quello materiale: gli archivi/laboratori informativi esistenti all'interno del Politecnico di Milano sono integrati, da una parte attraverso l'utilizzo dei metodi e degli strumenti DesignNet, dando vita quindi, almeno potenzialmente ad un catalogo unico; dall'altra, fisicamente, attraverso l'individuazione di un luogo e la attivazione di un servizio che costituisce un punto di accesso unico, con regole uniche, ad archivi che rimangono comunque autonomi per quanto riguarda i contenuti. L'integrazione anche fisica degli archivi informativi per il design, come possibile ulteriore momento di attribuzione di significato a documenti eterogenei, è alla base del concetto di 'Design Knowledge Centre', del quale la POLI.teca costituita al Politecnico di Milano è un primo, sperimentale, esempio. La POLIteca si costituisce come centro di documentazione locale, e insieme possibile nodo di una rete di giacimenti di documentazione e conoscenza per il design, attivabile attraverso la condivisione da parte di altri centri di documentazione, musei, biblioteche, dei metodi e degli strumenti sviluppati nell'ambito di DesignNet 1 .

Analisi e progettazione del sistema

All'inizio della fase di ricerca del progetto DesignNet, si è effettuato un processo comune ai professionisti dell'informazione, dai bibliotecari ai documentalisti: la codifica, tramite ricerca nelle mappe mentali degli utenti, dello specifico territorio informativo di un ambito disciplinare. Una ricognizione statistica sul Web dei siti delle università, associazioni, fondazioni e società collegate al design nel contesto nazionale e internazionale, è stata funzionale a comprendere come il patrimonio informativo accademico si serve delle potenzialità della Rete e a rilevare la presenza e le caratteristiche dei servizi e delle informazioni di altri portali e siti internazionali dedicati al design (cfr. capitolo 3). L'analisi è avvenuta in concomitanza con lo studio dell'evoluzione del concetto di biblioteca e di archiviazione dei documenti, e con l'analisi degli standard di catalogazione, indicizzazione e visualizzazione delle informazioni in ambienti di rete (cfr. capitolo 1 e 2). Sono stati inoltre esaminati i modelli e gli strumenti di Knowledge Management e delle attività e servizi di documentazione applicabili in ambito universitario. Parallelamente, allo scopo di identificare le caratteristiche della documentazione per il design e i bisogni informativi degli utenti locali, è stata effettuata una mappatura dei giacimenti esistenti attraverso un'indagine a campione sulla forma degli elaborati informatici prodotto di ricerca e/o didattica della Facoltà del Design del Politecnico, e la somministrazione di un questionario di rilevazione sulle raccolte documentarie e materiche dei laboratori e degli archivi qui presenti, modellato sull'esempio della ben più dettagliata Rilevazione sulle biblioteche delle università italiane preparato dal MURST nel 1997 2 e di una serie di questionari e rilevazioni in ambito internazionale 3 In questa prima fase di ricerca sono stati inoltre presi numerosi contatti con i responsabili dei più rilevanti progetti di biblioteche digitali online di università e istituti, responsabili tecnici di progetti di archiviazione ad alta informatizzazione e di produzione software (tra cui ICCD del Ministero per i Beni e le Attività Culturali, il Getty Research Institute, la University of California a Berkeley, la Cornell University). L'analisi di tecnologie hardware e software funzionali al progetto è stata effettuata in base alla documentazione richiesta ai fornitori e alla rapportistica tecnica di università ed istituti internazionali. I software possibili sono stati selezionati tra decine di esemplari italiani e internazionali, in base alle esigenze di gestione di documenti non solo testuali ma soprattutto multimediali (immagini, audio e video), utilizzo di schemi di metadati più semplici e flessibili di UNIMARC, modalità di visualizzazione delle risorse, relativa facilità di inserimento, interoperabilità. Le attività sopradescritte sono risultate nella evidenza di molteplici e sostanziali conoscenze e informazioni sul design -di carattere manipolativo-visuale strettamente collegate all'esperienza, difficilmente proceduralizzabili e provenienti da forme di apprendimento diversificate -che non si esauriscono a quanto viene oggi mostrato sul Web e che non sono ancora sistematizzate. L'identificazione di tipologie documentarie, formati e modalità di acquisizione/archiviazione eterogenee e complesse ha permesso la contestualizzazione e definizione degli scenari operativi e di riferimento del progetto nell'ambito dell'evoluzione delle biblioteche e dei documenti, e la definizione di standard di catalogazione, indicizzazione restituzione e di visualizzazione online delle risorse e dei documenti per il design. Informazioni preziose sono state anche reperite attraverso newsgroup e gruppi discussione internazionali 4 . In questa fase è emersa la necessità di gestione delle risorse secondo schemi di metadati coerenti e organizzati, l'individuazione delle chiavi di lettura per le varie tipologie di utenti e bisogni informativi identificati, la coordinazione con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali. In particolare, sono stati identificati i seguenti elementi: -schemi di metadati funzionali per la loro interoperabilità, modularità e flessibilità; -un protocollo per lo scambio dei record; -struttura e caratteristiche di un thesaurus monolingue per il design; -tecnologie hardware e software necessarie. L'obiettivo di DesignNet é quello di soddisfare i bisogni informativi e conoscitivi della comunità universitaria, e al tempo stesso di alimentare lo scambio e la creazione di risorse ed esperienze progettuali, fornendo strumenti che permettono un'efficace gestione, recupero e visualizzazione di documenti 3D e 2D in un framework in rete collaborativo e integrato. Per raggiungere tale obiettivo si è cercato di definire un sistema knowledge-based per il disegno industriale: un tema particolarmente complesso poiché, come è stato scritto nei paragrafi precedenti, il progetto vive la permanente scissione tra il sistema delle informazioni e delle conoscenze che costituiscono la condizione a priori dell'atto creativo ed esecutivo e la definizione del progetto, ma che raramente si riesce ad appoggiare ad essi.

Un Quality-controlled Subject Gateway per il design

I sistemi di archiviazione, restituzione, disseminazione delle risorse online, grazie alle loro caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità tipologie di documenti, di formati e di linguaggi, si propongono oggi come un potente strumento a supporto delle attività di didattica e di ricerca in ambito universitario. Tuttavia (come è stato già osservato nel paragrafo 3.1.2), la ricca articolazione delle risorse del design è notevolmente maggiore di ciò che solitamente 'presentano' i siti Web o i portali. Se adeguatamente implementati, i Quality-controlled Subject Gateway (QCSG) 5 , basati su un'ampia e dettagliata descrizione di risorse distribuite in ambiente di rete (o accessibili tramite Internet) e sull'adozione di standard, rappresentano certamente uno degli approcci più efficaci in questo senso. Un'ampia gamma di metodologie, linguaggi e tecnologie adottati nei QCSG risultano rilevante nella didattica del design e nello sviluppo dei progetti. Un QCSG è qualcosa di più di un semplice punto di accesso unico ad un determinato campo del sapere: esso vuole costituire un portale di ingresso a praticamente tutte le informazioni e i documenti rilevanti in uno specifico ambito, indipendentemente dalla loro forma (analogica o digitale) e dalla collocazione fisica del documento. Solo la rilevanza del contenuto è importante. I servizi di organizzazione e delivery dei contenuti sono implementati in modo da soddisfare i bisogni degli utenti. Nel progetto DesignNet i vari partecipanti cooperano insieme in un unico framework coordinato da DesignNet: il Design Gateway. Nei paragrafi successivi vengono perciò brevemente analizzati gli aspetti cruciali e i componenti dei QCSG, contestualizzati nell'ambito di una sistematizzazione delle risorse relative al disegno industriale:

1. schemi metadati standard e descrizione dei contenuti (paragrafo 4.4.2); 2. accesso per soggetto tramite vocabolario controllato e liste di autorità (paragrafo 4.2.3 e 4.2.4); 3. selezione qualitativa e descrizione dei documenti ad opera di risorse umane specializzate; sviluppo, aggiornamento e gestione delle collezioni con il continuo monitoraggio del gateway (paragrafo 4.2.5) 4. adozione di standard per l'interoperabilità con altri servizi e basi dati e progettazione di servizi aggiuntivi (paragrafo 4.2.6). Nella user modeling del QCSG per il progetto DesignNet, sono stati distinti quattro tipi di comportamenti informativi:

-serendipity: trovare informazioni non cercate e impreviste. Nella ricerca scientifica si tratta anche della capacità di individuare e valutare correttamente dati o risultati imprevisti rispetto ai presupposti teorici di partenza; information seeking: essere alla ricerca di informazioni con uno scopo deliberato; information searching: microlivello di informazione usato da chi cerca mentre interagisce con sistemi di vario tipo; -information use: atto fisico e mentale di incorporare l'informazione trovata nel proprio patrimonio conoscitivo 6 . Questi diversi comportamenti presuppongono diversi livelli di ricerca attraverso i documenti disponibili in un QCSG, ed evidenziano l'importanza della granularità dell'informazione, ovvero del livello di dettaglio reso disponibile.

Schemi di metadati e protocolli: Dublin Core e OAI

Come osservato nel paragrafo 2.2.1, l'interoperabilità migliora la qualità di un sistema info-conoscitivo e le possibilità di usare documenti provenienti da fonti diverse, riduce i costi, permettendo il riutilizzo delle informazioni e delle risorse una loro gestione in parte automatica. Affinché si possa realizzare questo libero flusso di informazioni, è però necessario che l'interoperabilità non dipenda dai media e dal sistema utilizzati, dal contesto amministrativo, da contenuto o dal tipo di informazione: perché ciò avvenga è fondamentale utilizzare dei metadati standard. La situazione ideale sarebbe quella di avere a priori un modello di schema di metadati completo e un framework definito, entrambi riconosciuti come standard internazionali e utilizzati dagli utenti. Nella realtà, esistono soltanto alcuni modelli parziali, spesso non coordinati (cioè mappati) tra loro, non utilizzati su larga scala dagli attuali sistemi e poco conosciuti. Nessuno singolo schema di metadati soddisferà tutti i requisiti funzionali di tutte le applicazioni. È inoltre importante ricordare che le «categories are historically situated artifacts, and like all artifacts, are learned as part of membership in a community of practice» 7 : il contenuto, la semantica e la sintassi di uno schema di metadati dipenderà dal contesto che lo promuove, dalle funzioni o dagli scopi dello schema e dal livello di aggregazioni, dal tipo di oggetto e di entità a cui esso si correla. Carl Lagoze esprime lucidamente questo problema: «The Web environment [...] is massively distributed, involving an arbitrary number of schemas, many of which will be not known. The querying of semi-structured and imperfectly understood data in such a diverse environment is a topic of research, not a readily deployable technology» 8 . Per il progetto DesignNet è stata scelta la creazione e lo sviluppo collaborativo di un catalogo di documenti eterogenei per il design, utilizzando lo standard internazionale Dublin Core e l'expertise disponibile nella Facoltà del Design come punto di partenza. L'obiettivo complessivo è quello di definire livelli di interoperabilità con minori barriere e metadati più ricchi, utilizzando standard emergenti che intendono facilitare una efficace disseminazione questo ambito. Negli ultimi anni, come analizzato nei primi due capitoli di questo volume, sono emersi nuovi approcci alla descrizione dei documenti digitali, e al tempo stesso standard consolidati come il formato UNIMARC e le RICA (e in ambito anglosassone USMARC e le AACR2) sono state applicate a documenti digitali. In base ad una verifica preliminare, è emerso che i partecipanti al progetto DesignNet, ma anche, più in generale, chi si occupa della documentazione di design, adottano una varietà di approcci quasi sempre non allineati agli standard attualmente disponibili. Gli standard che un'organizzazione adotta dipendono da una serie di fattori, inclusi le tipologie di materiali posseduti, lo scopo del progetto di fruizione/conservazione, gli utenti potenziali, la conoscenza e l'esperienza dello staff di progetto e le infrastrutture tecniche disponibili per l'istituzione. I livelli di dettaglio variano da istituzione a istituzione; inoltre, alcune informazioni potrebbero essere riservate. Questa fase è quindi partita da alcune domande:

-Di che livello di standardizzazione abbiamo bisogno? -Chi è responsabile della creazione di metadati? -Quanto costa la creazione e la gestione dei metadati nel medio e lungo periodo? -Quali sono i limiti dei diversi tipi di formati di file? -Quali sono gli strumenti per l'estrazione dei metadati? -È possibile riutilizzare i metadati provenienti da altre fonti? -Quali saranno le scelte, le procedure, i manuali e gli standard per l'implementazione? Per la catalogazione di documenti eterogenei analogici e digitali per il design, online e offline, in DesignNet si è scelto di non adottare le metodologie catalografiche convenzionali, a favore di uno schema di metadati adatto ai vari ambiti del design e finalizzato allo scambio delle informazioni e alla ricerca da parte dell'utente.

In seguito ad una verifica nella fase 1 del progetto, il Dublin Core Metadata Element Set (cfr. paragrafo 2.2.3) è stato selezionato in quanto standard (è sia ANSI/NISO Z39.85-2001 che ISO 15836) semplice e flessibile, che gode di un largo in ambito internazionale e che consente la descrizione adeguata di un'ampia gamma di documenti di diverse comunità diversamente dislocate, facilitando al tempo stesso l'integrazione e l'interoperabilità tra vari sistemi cognitivi. Dublin Core è uno standard aperto che permette il coinvolgimento di diverse comunità, senza escludere gruppi di utenti, come farebbe lo standard MARC. Tuttavia, per le istituzioni legate al formato MARC, Dublin Core offre comunque sufficienti equivalenze e un'adeguata mappatura MARC-Dublin Core. Inoltre è ormai diventato uno standard riconosciuto, semplice da imparare e da utilizzare anche per persone che non sono dei catalogatori professionisti. E il core dei suoi elementi fornisce le informazioni essenziali. Come schema per la descrizione, Dublin Core è stato scelto con gli specifici obiettivi di:

1. facilitare la scoperta dei documenti di design; 2. assistere nella gestione delle risorse; 3. permettere l'interoperabilità tra differenti strutture di metadati attraverso un semplice formato; 4. sviluppare un framework di metadati conforme con altri standard da tempo consolidati, come il MARC, ed emergenti, come MPEG-7; 5. codificare i metadati utilizzando il protocollo della Open Archive Initiative (OAI) e l'Extensible Markup Language (XML). In particolare, per quanto riguarda l'interoperabilità semantica, sono stati analizzati vari schemi di equivalenza o crosswalk già realizzati e pubblicati sul Web che hanno permesso di accertare, per i diversi settori presi in esame, l'esistenza di problemi riguardanti la granularità e la semantica dei dati, nonché l'importanza di definire una struttura che, dando adeguato rilievo alle specificità degli stessi, eviti l'appiattimento e quindi la perdita di efficacia del sistema di ricerca così prodotto 9 . A livello sperimentale, nel corso di questa fase e in collaborazione con il Laboratorio di Fotografia della Facoltà del Design è stata anche effettuata una crosswalk tra Dublin Core e IPTC (cfr. paragrafo 6.2). Oltre alla creazione di metadati di qualità, per il tipo di documentazione per il design, è necessario anche poter raccogliere in modo facile ma selettivo informazioni provenienti da un'ampia gamma di content-provider e utenti in differenti localizzazioni. Con l'evolversi del progetto inoltre si evolvono anche i bisogni: non è realistico aspettarsi che gli utenti specifichino in modo accurato e in anticipo le loro necessità informative. All'esterno ma anche nella stessa comunità di pratica, il mancato riconoscimento della realtà del design, che si basa su una metodologia progettuale, creativa e programmatica al tempo stesso, è spesso causa di trappole tecnologiche per i progetti di catalogazione: i fornitori commerciali offrono soluzioni tecnologiche spesso basate su generalità vaghe e idee incerte. Quando infine viene sviluppata qualche soluzione tecnica che supera le precedenti, o la tecnologia è diventata obsoleta o i requisiti sono cambiati e quindi il progetto fallisce. Un approccio più pragmatico è quello di monitorare i progressi tecnologici e -quando le risorse e le competenze sono limitate -mantenere tutto il più semplice e modulare possibile. In questo senso, il sottoprogetto di catalogazione e indicizzazione si è posto quattro obiettivi principali:

-raccogliere la conoscenza degli individui che potrebbero influenzare il life-cycle di un documento, incanalandole nei metadati; -rendere questi contenuti disponibili per le attività di didattica e di ricerca in ambito di dipartimento e facoltà, controllando e supportando il flusso informativo; -generare record catalografici basati sullo standard Dublin Core, per poter scambiare metadati con altre organizzazioni e iniziative; -creare un vocabolario controllato per il design, come strumento di supporto all'attività catalografica ma anche didattica e di ricerca, come specchio del know-how e degli interessi della comunità del design. I documenti digitali sono spesso caratterizzati dalla possibilità di essere restituiti in formati multipli. Si è quindi deciso di non seguire il modello catalografico centrato sull'item o sul formato, per abbracciare invece l'approccio basato sul modello, in cui i documenti sono espressi in vari generi o eseguiti molte volte e potrebbero essere prodotti in numerose manifestazioni. Dublin Core ha permesso di sviluppare gli elementi di metadati predefiniti, e al tempo stesso di condurre esperimenti su qualificatori ed elementi extra per rifinire il modello. Implementare standard e protocolli di catalogazione in un contesto come quello del progetto DesignNet non è un'operazione banale, in parte perché vi sono una miriade di piccole comunità (laboratori, unità di ricerca, singoli) che devono essere persuasi a usare gli stessi standard e protocolli, in parte perché queste persone non si occupano normalmente di catalogazione, e per questo motivo è necessario che capiscano alcuni elementi base della gestione documetale e che vengano forniti loro degli strumenti semplici da usare in modo che siano più disponibili a cooperare e che il loro lavoro sia così facilitato. La cooperazione di tante micro-comunità poneva il problema di condividere i record: in base alle analisi dei requisiti, come già osservato, è emerso che nella maggior parte dei casi i documenti non venivano catalogati, e quando lo erano i metodi adottati non erano conformi agli standard. Relativamente alla strategia e alla metodologia adottata per definire i metadati, sono state intraprese specifiche azioni per:

-sviluppare una mappa concettuale dei differenti tipi di documenti usati in questo contesto; -valutare standard e pratiche descrittive comunemente utilizzate nell'ambito del design; -focalizzarsi sulla descrizione dei documenti, partendo da quelli non bibliografici e concentrandosi in particolare sui rich media; -sviluppare uno specifico profilo d'applicazione per la descrizione di tali documenti, basato sugli attributi raccomandati dalla Dublin Core Metadata Initiative (DCMI) e da qualificatori selezionati in base alle esigenze dei partecipanti al progetto. Si è ritenuto che il modo migliore di analizzare i documenti del design sia in termini di vari livelli di granularità (o livelli di dettaglio). La strategia e la metodologia sopraindicate sono state adottate in una modalità progressivamente partecipata con tutti i partecipanti a DesignNet, cui è stato proposta ogni volta, sotto la supervisione di chi scrive, uno schema di metadati iterativamente modellato sulle loro esigenze. La catalogazione è cominciata partendo dallo schema di metadati descrittivi di Dublin Core semplice, effettuando delle prove su file di Excel con diverse tipologie di documenti, verificando l'efficacia dei record nel recupero del documento, e identificando progressivamente una serie di qualificatori aggiuntivi utili rispetto ai 15 elementi di base. In questo processo si sono parallelamente analizzate le attività del Sistema Bibliotecario di Ateneo del Politecnico di Milano, prevedendo la possibilità di interazione con l'OPAC di Ateneo (il sovrainsieme istituzionale di riferimento) tramite la mappatura dei metadati da esso utilizzati. Dopo circa un centinaio di record compilati e di verifica progressivo dello schema con i partecipanti, gli elementi e i qualificatori di Dublin Core sono diventati sufficientemente più specifici e più complessi nelle relazioni reciproche, rendendo possibile definire un profilo di applicazione del progetto DesignNet. Il processo di numb down ai soli 15 elementi, così come è inteso dalla DCMI, è rimasto certamente un'importante pietra di paragone per le nostre attività collaborative, poiché appunto fornisce un core di elementi essenziali. Se si cerca di rendere più ricca la descrizione, infatti, lo schema di DC rischia di perdere in semplicità e vi è bisogno di un grande numero di qualificatori, di schemi di codifica e di regole. Ciò nonostante, i profili di applicazione stanno progressivamente diventando il metodo preferito di rappresentazione dei principi sottesi al progetto di uno spazio informativo e sono condivisibili attraverso registri di metadati in cui chi crea nuovi profili si assume la responsabilità di dichiararli e mantenerli per la comunità degli utenti della rete 10 . Nel progetto DesignNet il profilo d'applicazione prodotto, che al termine della fase di sperimentazione verrà inserito nei registri creati, include:

-elementi obbligatori; -elementi opzionali; -qualificatori opzionali; -elementi o qualificatori aggiuntivi provenienti da altri profili di applicazione; -elementi utilizzati da altri namespace; -schemi e valori permessi, che nel progetto includono schemi di codifica, un thesaurus per il design e delle liste di autorità; -specifica delle definizioni (poiché in DesignNet si utilizza un linguaggio specifico di un certo ambito disciplinare); -specifica dell'utilizzo (cioè delle opzioni, sottoinsieme e parametri di valutazione lasciati aperti) di un particolare standard o gruppo di standard per supportare un determinata applicazione, funzione (ad es. la ricerca per autore, per titolo, per soggetto ecc.), comunità (ad es. la comunità del design in ambito universitario, i designer professionisti, ecc.) o contesto (ad es. il Web, l'Italia, l'Europa). Nell'elaborazione del profilo di applicazione sono stati presi in considerazione anche i possibili metadati amministrativi, strutturali e di conservazione (cfr. paragrafo 2.2.1). I metadati amministrativi previsti includono informazioni su chi ha digitalizzato e come (hardware e software usati, modalità di compressione), chi è responsabile del documento e informazioni più dettagliate sulla gestione dei diritti: ad esempio lo schema MAG, definito dall'Istituto Centrale per il Catalogo Unico del Ministero per i Beni e le Attività Culturali. Per gli scopi del progetto DesignNet, sono stati selezionati 8 elementi obbligatori per la descrizione dei documenti, mentre gli altri elementi sono considerati opzionali ma desiderabili (Tab. 1). Alcuni partecipanti sceglieranno di compilare soltanto gli elementi obbligatori, qualcuno potrebbe usare elementi facilmente mappabili con o da il formato MARC e altri potrebbero scegliere di descrivere le loro risorse in modo più approfondito, utilizzando tutti gli elementi a disposizione. Le linee guida definite per il progetto descrivono i campi obbligatori e quelli opzionali, indicazioni di compilazione per ogni campo. I molteplici input e la raccolta di informazioni e competenze hanno reso evidente l'importanza, nella creazione di metadati per documenti del design, di riportare questa operazione il più possibile vicino al luogo di creazione o di acquisizione del documento, poiché lì è dove si coagula maggiore conoscenza su di esso. Si è perciò scelto l'approccio che vede gli autori stessi e i gestori dei documenti compilare il più possibile i metadati dei documenti, mentre si è previsto che informazioni ulteriori (ad esempio di conservazione), revisioni e/o correzioni siano effettuate da una unità di coordinamento del processo di catalogazione. È stato inoltre previsto di condividere in partenza lo stesso schema di metadati di base, e in seguito di entrare in contatto con schemi più approfonditi mappabili con Dublin Core. Come supporto a queste attività, è stato elaborato un documento che contiene il profilo di applicazione in forma di una tabella testuale, lo schema del thesaurus e i criteri di catalogazione, un manuale di compilazione con esempi per ogni tipo di documento e un glossario dei termini più utilizzati nel sistema (cfr. le appendici nel capitolo 7). Il manuale di compilazione è finalizzato a favorire la consistenza dei record del catalogo, e riporta una scheda descrittiva di ognuno degli elementi e dei qualificatori, di cui vengono forniti: la definizione, l'indicazione di obbligatorietà o opzionalità, l'indicazione degli standard e schemi di codifica da adottare, esempi di compilazione per ogni tipo di documento. L'elaborazione del manuale rappresenta una cartina di tornasole dei processi iterativi di verifica effettuati con i partecipanti al progetto DesignNet, e riporta una serie di commenti a margine dell'applicazione dello schema di Dublin Core. Innanzitutto, le diverse rielaborazioni del manuale hanno evidenziato la difficoltà della spiegazione secondo un linguaggio user-friendly dei 15 elementi di Dublin Core, così come sono stati tradotti dall'Istituto Centrale per il Catalogo Unico. Nell'ambito del design 'Creatore' e 'Autore di contributo subordinato' hanno dato luogo a numerose discussioni, così come il campo 'Relazioni'. Inoltre, il manuale riporta i diversi tentativi di traduzione dei qualificatori raccomandati dalla DCMI (non tradotti dall'Istituto Centrale per il Catalogo Unico-ICCU) e di altri qualificatori utilizzati in diversi progetti di biblioteche digitali, dal Colorado Digitazion Project alla Cornell University. In base all'esperienza effettuata nelle prove di compilazione con i partecipanti, in contrasto con la convenzione di cominciare il record con il campo del 'Titolo' si è consigliato di cominciare con il 'Tipo', poiché la conoscenza di quello che si sta descrivendo aiuta a chiarire i valori degli altri elementi. L'elemento 'Formato', in cui la DCMI raccomanda l'uso dell'Internet Media Types (MIME), non contempla tutti i tipi di file: ad esempio non include i file di Flash, per non parlare di molti formati di file di computergrafica (sebbene nella comunità DCMI siano in corso di definizione delle proposte di aggiornamento. L'elemento 'Relazioni' e i suoi qualificatori, così come indicati dalla DCMI, hanno dato origine a qualche confusione. In generale, è stato più volte ricordato ai partecipanti che solo l'interpretazione e l'applicazione consistente degli elementi è significativa, non le etichette degli elementi di per sé. Un'altra questione affrontata è stata quella del'adozione di un protocollo di interoperabilità, che andrebbe a vantaggio dell'editoria scientifica per il settore del design. Ad oggi infatti questo ambito non possiede, ad esempio, una propria lista di periodici equivalente ai periodici ISI, e mentre a livello internazionale vi sono molti progetti già in atto, in Italia la ricerca scientifica universitaria ha pochissima visibilità, anche a causa dei strumenti che permettono di documentare le attività all'esterno. Spesso le pubblicazioni vengono cedute ad editori commerciali senza vantaggi per gli atenei. Gli strumenti software a disposizione oggi sono molteplici, e in particolare nel settore dell'Open Source i costi sono ridotti 11 . Tuttavia, le funzionalità di questi software non sono molto sviluppate, e se per l'avvio è necessaria una professionalità medio/bassa, per l'implementazione di questi programmi occorrono professionalità più elevate, sia in termini di sviluppo software che di raccordo con le realtà istituzionali. Alcuni programmi come E-prints sono semplici da installare ma gli autori vanno poi incentivati, servono politiche istituzionali precise e un supporto tecnologico avanzato con servizi integrati con le altre collezioni. Per tali motivi si stanno investigando le modalità di applicazione nel progetto DesignNet del protocollo della Open Archives Initiative (OAI) [ (il termine Open indica l'interoperabilità, mentre per Archives si intendono dei depositi di lavori scientifici e altri materiali digitali). OAI si basa sul concetto di Open Access: accesso libero (senza barriere tecnologiche, legali, finanziarie) e utilizzo aperto (per scopi legittimi e legali). In tal modo l'autore del documento mantiene tutti i diritti, ad esclusione di quelli commerciali. Laddove tale strategia venga applicata sia agli Open Archives che agli Open Access Journals, come nel caso di BOAI (Budapest Open Archives) 12 , si può permettere un accesso aperto a tutta la letteratura scientifica peer-reviewed, con un notevole aumento dell'impatto in termini di download e citazioni.

Indicizzazione e information retrieval: il Design Thesaurus

Come è stato osservato nel paragrafo 2.2.7, per chi compila i record del catalogo e per l'utente che effettua la ricerca un thesaurus è sia uno strumento di inserimento che di recupero dei dati. Il suo utilizzo risulta particolarmente utile nel caso in cui un'organizzazione possieda grandi quantità di documenti e di informazioni non strutturate e 'atipiche', e necessiti di controllare e di fornire accesso a queste informazioni. Un thesaurus rappresenta uno strumento efficace di knowledge representation per l'inserimento dati (in fase di indicizzazione come vocabolario di termini, di relazioni semantiche, varianti e sinonimi) e il loro recupero (nell'interfaccia utente come supporto alla navigazione) in ambienti di rete. La selezione di uno strumento di indicizzazione ad hoc per il progetto è stata preceduta da alcune riflessioni . Nel corso della fase di analisi dei requisiti del progetto DesignNet, è stato osservato che mentre gli OPAC di biblioteche generali si basano fondamentalmente sullo schema di Classificazione Decimale Dewey per la classificazione e sulle liste nazionali di intestazioni di soggetto per la soggettazione, i database specializzati sono dotati di vocabolari specifici quali schemi di classificazione disciplinare o thesauri. Dopo un'indagine sui vocabolari attualmente disponibili online e offline, ad eccezione dell'Art&Architecture Thesaurus del Getty Information Institute, è emerso che in ambito nazionale e internazionale non risulta disponible un thesaurus progettato esplicitamente per il design, un ambito interdisciplinare nel quale è ben più difficile applicare schemi come la DDC e per il quale non esistono schemi di classificazione di riferimento come quelli in uso nelle discipline scientifiche 13 . Inoltre è stata spesso segnalata la mancanza di identità metodologica e soprattutto di rigore terminologico nel linguaggio del design, che spesso utilizza in modo specialistico vocaboli di uso comune. Il concetto di granularità è stato applicato anche nella scelta del thesaurus come strumento di indicizzazione, ritenuto efficace per migliorare la precisione delle descrizione della tipologia di documenti del design, poichè una maggiore -funzioni e le attività inerenti agli ambiti disciplinari trattati; -terminologia non ambigua;

-classi discrete di termini; -gerarchie organizzate dal generale allo specifico; -termini verificate consultandosi con gli utenti del thesaurus. 5. collazione delle informazioni. Questa fase implica:

vocabulary control: un processo di organizzazione delle liste dei termini indicizzati, indicando i termini preferiti e i gruppi di sinonimi, e distinguendo tra gli omografi (dallo standard Z39. ; -organizzazione dei termini preferiti in una struttura logica di termini generici e termini più specifici; -elaborazione delle note d'ambito, con la descrizione di ogni termine e il modo in cui dovrebbe essere utilizzato, e definizione/verifica dei termini associati. 6. compilazione: il tempo varia a seconda delle dimensioni dell'organizzazione, dell'esperienza dei compilatori e della loro disponibilità parttime o full-time al progetto; 7. verifica dei termini funzionali. In questa fase i termini selezionati vengono verificati con le liste di parole chiave precedentemente raccolte, per assicurarsi che non vi siano duplicati o sovrapposizioni; 8. collazioni e verifica dei dati in un software per la gestione di un thesaurus, controllando le inconsistenze, errori di battitura e di compilazione; 9. disseminazione della bozza del thesaurus nell'organizzazione, cosicché i vari membri (sia gli alti quadri che i potenziali utenti) possano esprimere commenti e suggerimenti al riguardo. Si effettua quindi la revisione della bozza del thesaurus, incorporando in essa il feedback più rilevante; 10. verifica finale del thesaurus prodotto; 11. disseminazione del thesaurus completo. Questa fase implica l'accertamento che il thesaurus risponda ai requisiti dell'organizzazione e agli standard in uso, e l'individuazione delle modalità e degli ambiti in cui il thesaurus viene reso accessibile. Sulle versioni a stampa e in digitale del thesaurus verrà indicata la data della release, e per completezza, riporterà le date di modifica di ogni termine del thesaurus; 12. implementazione. In questa fase si organizza la presentazione del thesaurus completo e si programma la sua implementazione futura. Si tratta probabilmente di una delle fasi più complesse, poiché implica la previsione delle politiche di sviluppo nella terminologia e nel software, dell'integrazione tra il thesaurus e il database del catalogo, degli output previsti, dei fondi a disposizione, dei tempi di realizzazione. Prima della release della versione implementata il thesaurus viene verificato con un gruppo di testing, e parallelamente l'implementazione includerà il tirocinio degli utenti e l'analisi dei feedback degli utenti;

13. pianificazione della manutenzione. Molti problemi riguardanti il thesaurus e il suo utilizzo diventano manifesti solo quanto esso viene applicato nella pratica quotidiana: occorre perciò pianificare un'accurata implementazione ogni 6-12 mesi, oltre a verifiche periodiche che permettano di aggiornare il thesaurus all'evoluzione delle funzioni e dei processi dell'organizzazione, e alle modifiche del linguaggio utilizzato. Da un punto di vista concettuale, la progettazione del linguaggio di indicizzazione del Design Thesaurus (che si compone di una semantica degli attributi, una semantica dei valori e una sintassi), è stata definita nei seguenti quattro passaggi:

1. analisi a faccette: specificazione della semantica degli attributi, consistente in un insieme di attributi e di relazioni sintagmatiche tra i vari tipi di attributi, noto anche come ordine di citazione; 2. analisi del vocabolario: specificazione della semantica dei valori, riguarda un insieme di relazioni paradigmatiche tra tipi di versi di valori (come avviene in un thesaurus che presenta relazioni di equivalenza, gerarchiche e associative); 3. specificazione della sintassi: specificazione del formato, consistente in sintassi del record (forma grammaticale della descrizione di un oggetto) e sintassi del campo (forma grammaticale della descrizione di una proprietà); 4. organizzazione della classe (opzionale). Sono state inoltre adottate le seguenti distinzioni:

-cose vs. simboli (cose: nel mondo esterno; simboli: utilizzati in un linguaggio per rappresentare una cosa); -elementi vs. insiemi (elemento: qualcosa di indivisibile; insieme: qualcosa costituita da un certo numero di elementi); -istanze/item/particolari vs. classi/tipi/universali (istanza: una particolare occorrenza di una cosa di un certo tipo; classe: un insieme universale di cose di un certo tipo). È opportuno soffermarsi sull'articolazione a faccette, che assorbono l'intero dominio concettuale espresso dal Design Thesaurus. Una faccetta indica un gruppo di termini che condividono una singola, principale caratteristica (anche se i termini potrebbero condividerne altre). Ad esempio, 'legno', 'lana', 'polipropilene', 'rame e 'acciaio' condividono tutti la caratteristica di essere di essere dei MATERIALI, sebbene alcuni di loro hanno in comune altre caratteristiche come la combustibilità. Nell'ambito della faccetta, i termini possono essere suddivisi in un ulteriori subfaccette con caratteristiche secondarie: ad esempio nella faccetta dei MATERIALI il legno e la lana appartengono ai materiali organici, mentre l'acciaio e il rame ai materiali inorganici e specificatamente ai metalli. Ogni gerarchia di termini necessita di un meccanismo per conservare l'ordine e il livello di subordinazione dei propri contenuti, e per rappresentare i termini stessi tramite un insieme di codici univoco e non ambiguo, che possa collegare l'ordine gerarchico con l'ordine alfabetico o con la rappresentazione grafica. I codici notazionali previsti nel Design Thesaurus utilizzano l'alfabeto romano: i termini in lettere maiuscole indicano la faccetta o Top Term, e quelli in lettere minuscole indicano i dettagli nella gerarchia. Inoltre i codici notazionali standard 14 (UF per i Sinonimi, BT per Termine Generico, NT per i Termini Specifici, RT per i Termini Associati, SN per la Nota d'Ambito), permettono la manipolazione efficace di un ampio numero di termini, consentendo ai software di effettuare verifiche di consistenza automatiche. I codici notazionali facilitano anche la manipolazione dei termini per produrre delle liste dai termini del thesaurus, organizzabili in una varietà di ordini e formati, e l'elaborazione del thesaurus finale mostrandone tutte le sue relazioni. L'analisi a faccette permette dunque di organizzare i termini in piccoli gruppi interrelati tra loro, in modo che ogni gruppo possa essere esaminato facilmente e efficacemente per quanto riguarda la consistenza, l'ordine, le relazioni gerarchiche e associative e la loro accettabilità o meno nel linguaggio specifico usato nei termini. Essa fornisce anche la possibilità di designare in modo ordinato le relazioni tra i termini, eliminando la necessità di assegnare relazioni BT e NT in modo intuitivo, operazione che nei vocabolari di grandi dimensioni non è scevra di errori ed omissioni. L'articolazione a faccette risulta essere utile anche per la flessibilità che consente nel gestire l'aggiunta di nuovi termini e di nuove relazioni. Poiché ogni faccetta è indipendente, i cambiamenti possono in genere essere operati facilmente senza bisogno di alterare il resto del thesaurus. Un ulteriore beneficio di questo approccio è risultato evidente nella fase di utilizzo sperimentale del thesaurus. Sia per chi compila i record di catalogo, che per l'utente che ricerca un documento, un insieme di faccette gerarchicamente organizzate risulta più semplice comprendere, costituendo una mappa concettuale che mostra il livello e insieme di associazioni di un termine, sia negli output a stampa o a schermo di differenti formati del thesaurus che per la rappresentazione nell'interfaccia di ricerca del catalogo online.

Authority file: la Design Directory

La comunità bibliotecaria ha da tempo definito gli standard sia per la descrizione di entità bibliografiche, che per l'identificazione univoca di individui ed enti. Tuttavia, per tradizione i bibliotecari si sono concentrati sul controllo dei nominativi e non sulla descrizione delle persone e organizzazioni corrispondenti. In altre parole, gli standard dell'authority control biblioteconomico sono utili alla descrizione bibliografica tramite il controllo delle intestazioni o delle registrazioni usate.

Il controllo archivistico si differenzia da quello biblioteconomico poiché necessita non solo di un controllo di autorità o di intestazione, ma anche di una dettagliata descrizione biografica e storica delle entità nominate: le registrazioni archivistiche infatti hanno funzione di testimonianza sia legale che storica, perciò documentare il contesto della creazione della registrazione è essenziale. Quando l'organizzazione e la descrizione sono basate sulla provenienza, c'è una corrispondenza 1:1 tra la descrizione dell'unità archivistica e l'entità produttrice, che rende logico documentare nello stesso apparato descrittivo sia il creatore che i documenti creati. A livello informatico, attraverso i linguaggi di mark-up e i database relazionali, la sfida di rappresentare queste informazioni in modo efficace ed economico ha imposto una analisi della logica e della struttura della descrizione, ed una conseguente crescente differenziazione e definizione formale dei componenti della descrizione e delle loro relazioni. In generale, partendo dall'assunto che «senza authority control la struttura relazionale e la struttura sindetica del catalogo hanno fondamenta di argilla» 15 , si può affermare che promuovere il controllo dei punti di accesso attualmente è una attività indispensabile soprattutto in un contesto di network globale e di biblioteche digitali. Gli attuali sviluppi nel W3C sul Web semantico stanno reinventando i concetti dell'authority control al fine di migliorare l'uso del Web. Così come vengono posti in relazione con le descrizioni della documentazione archivistica prodotta, gli authority record di persone e di organizzazioni possono infatti essere connessi con risorse informative ad essi relative, presenti in banche dati online. La standardizzazione della descrizione del soggetto produttore offre sostanziali benefici economici, dato che la descrizione degli individui, delle famiglie e delle organizzazioni è una operazione onerosa in termini di tempo e di risorse umane specializzate, il cui costo si va ad aggiungere alla descrizione dei documenti. Tornando al caso specifico affrontato in questo volume, l'ampia interdisciplinarietà riscontrabile in un catalogo accademico richiede un'attenta selezione di forme di intestazione standard. Il contesto e le esigenze della documentazione del design sono per molti versi simili a quelli degli archivisti: descrivere il contesto, le circostanze della progettazione di un prodotto, i protagonisti primari e secondari è importante per comprenderne le caratteristiche. Per tale motivo, nel progetto DesignNet è prevista la creazione di una lista di autorità specifica il mondo del design, denominata Design Directory e organizzata come un insieme di authority file di persone, organizzazioni e nomi commerciali di prodotti, secondo intestazioni omogenee e controllate. Insieme al Design Thesaurus, con la Design Directory l'utente potrà passare senza soluzione di continuità da un thesaurus testuale di concetti, al catalogo dei documenti, ai documenti stessi -se presenti in forma digitale e accessibili in base al copyright -, alle descrizioni dei produttori, stimolando così nuove costellazioni di relazioni. Come il Design Thesaurus, la Design Directory crea una rete di sinomini e varianti collegati tra loro, sfruttando l'ipertestualità e le caratteritiche del database relazionale. Inoltre, anche qui, è prevista la consultazione indipendente delle liste di autorità dei produttori, che verranno così a costituire delle risorse biografiche e storiche di cui è possibile registrare l'evoluzione nel tempo.

Modalità di lavoro collaborativo

Nella biblioteconomia viene espressa l'idea che non tutta l'informazione sia conoscenza, ma diventi tale solo quando viene mappata ad una struttura cognitiva, ad esempio organizzata in modo tale da diventare accessibile e comprensibile agli utenti. Di fatto potrebbero esistere molte strutture cognitive per organizzare lo stesso tipo di informazioni, a riprova del fatto che il contesto e lo scopo sono essenziali per trasformare le informazioni in conoscenza. Ciò implica anche l'importanza di identificare la cosiddetta 'comunità di interesse' sia per i produttori che per i consumatori di informazioni. Il termine 'comunità' sta diventando sempre più ubiquo, in particolare in relazione ai servizi personalizzati su Internet, ma con varie accezioni. Una definizione culturalmente sofisticata è quella di una comunità i cui membri, in aggiunta alle due precedenti condizioni, condividono lo stesso vocabolario, semantica e teoria di organizzazione delle informazioni. Per i membri di questa comunità esistono degli obiettivi comuni e concetti con cui condividere idee ed esperienze. L'analisi del consenso è basata su semplici assunti: la conoscenza è sia distribuita che condivisa in un dato ambito, e ogni gruppo di esperti delle aree di questo ambito possiede esperienze diverse. La condivisione delle informazioni facilita la disponibilità di un bacino di informazioni con una distribuzione di conoscenza non uniforme attraverso i vari gruppi. Il processo di mappare le informazioni su tale consenso rappresenta l'essenza della creazione della conoscenza culturale, tema che permette di identificare quattro aree di ricerca principali: acquisizione dell'informazione, derivazione della conoscenza, rappresentazione della conoscenza, riutilizzo della conoscenza. Il sistema DesignNet è stato progettato come il punto di raccordo dei dati descrittivi e terminologici, e più in generale dei flussi informativi, che vengono validati dopo una fase di normalizzazione su base collettiva. Si prevede il coinvolgimento attivo della comunità dei fornitori di contenuto e degli utenti, che plasmano il sistema attraverso una catalogazione e indicizzazione partecipata, resa possibile tramite istruzione dell'utenza e continui interfacciamenti con essa. A vari livelli gli utenti si affiancano alla unità di documentazione nelle attività di selezione, indicizzazione e catalogazione delle risorse disponibili; per garantire il controllo sulla qualità, le attività di catalogazione e indicizzazione sono accessibili tramite password con diversi livelli di autorizzazione. Il sistema richiede che i partecipanti al progetto imparino a collaborare, a condividere le risorse e ad adottare un livello catalografico standard. L'obiettivo è quello di coinvolgere l'intera la comunità dipartimentale e di facoltà nel sistema: essendo costituita non soltanto da docenti strutturati, ma da un alto numero di docenti a contratto e di collaboratori spesso professionisti, per ricchezza ed eterogeneità di argomenti trattati e attività in corso essa sembra infatti costituire un buon campione rappresentativo del mondo del design. In molti modi, si tratta del paradigma del Web in opera: più la rete (nel nostro caso il catalogo, il Design Thesaurus e la Design Directory) cresce, e più essa diventa utile. Consolidata l'adesione interna, è previsto il rafforzamento del coinvolgimento di istituzioni esterne (in particolare i musei d'impresa e gli archivi del design), con l'obiettivo di istituire un network regionale (e in prospettiva nazionale e internazionale) per il design. Il livello comune di catalogazione dovrebbe essere minimo, con informazioni essenziali ritenute sufficienti a individuare e a caratterizzare il documento. L'adozione di un eventuale livello più analitico è demandato alla disponibilità dei singoli partecipanti, ed è giustificato dalla necessità di descrivere in modo più dettagliato specifici materiali. Un'unità di documentazione dedicata collabora con i fornitori di contenuto per l'implementazione di un Thesaurus per il Design e per l'identificazione e la selezione di nuove risorse e servizi da includere nel gateway. L'unità valida le proposte, verifica direttamente in rete i relativi record (compilati, secondo un'estensione del principio di catalogazione partecipata, sia da fornitori di contenuto riconosciuti che da utenti), provvede ad una loro eventuale integrazione e li valida includendoli nel database. Questo tipo di workflow e l'architettura di sistema che lo supporta consentono di effettuare velocemente modifiche di informazioni sul lato server e di renderle immediatamente disponibili agli utenti (Tab. 2). Durante il processo di formazione e di verifica, i dati possono essere consultati solo da parte degli utenti abilitati ad operare nei rispettivi ambiti di competenza. I dati che hanno superato l'intero processo descritto ottengono lo status di 'dati validati' e possono essere resi disponibili per la fruizione alle diverse tipologie d'utenza. Le esperienze maturate in vari progetti catalografici negli ultimi anni hanno evidenziato l'onerosità e l'inadeguatezza del controllo e della correzione condotti a posteriori (come ad esempio lo schiacciamento dei dati catalografici duplicati), spingendo sempre più a favore di un forte impegno nella definizione di conoscenze diffuse e di competenze decentrate. Per tale motivo nel progetto DesignNet si è scelta la strada del decentramento, formazione continua e tutoraggio, con tirocinio e assistenza durante le attività di routine. Il passaggio finale nel processo di creazione dei metadati prevede l'intervento di un esperto che verifichi il record finale con i metadati, e individui eventuali inconsistenze nei metadati o delle possibili integrazioni dei record. I metadati verosimilmente non saranno statici ma cambieranno nel tempo: per tale motivo la loro creazione non è un'operazione che avviene una sola volta ma piuttosto un processo iterativo, che richiederà verifiche periodiche. Documentare manualmente i passaggi di elaborazione degli insiemi di dati individuali è generalmente riconosciuto come non fattibile e oneroso. Queste operazioni possono essere tracciate più facilmente con strumenti di estrazione dedicati, e i principali passaggi cumulativi di elaborazione si possono riservare ai metadati. Tra gli elementi previsti per i metadati strutturali, vi sarà un campo specifico per questo scopo: una data programmata di revisione. L'obiettivo successivo al conseguimento della validazione qualitativa dei dati catalografici è quello della loro uniformità di presentazione sul Web, per poter costituire un patrimonio unico, condiviso e omogeneo organizzato attraverso una architettura informativa multilivello, personalizzabile in base [Tab.2] Definizione del workflow e delle modalità di accesso dei servizi nel progetto DesignNet alle esigenze degli utenti. I dati possono cioè essere organizzati secondo esplicite richieste, oppure in base alle indicazioni dedotte dal monitoraggio, dalla bonifica e dall'analisi statistica sull'utilizzo del sistema da parte degli utenti, secondo una modalità iterativa che beneficia dell'effettivo coinvolgimento degli utenti nella fruizione.

Management e visualizzazione di risorse eterogenee complesse

Una biblioteca digitale può funzionare solo se viene gestito in modo rigoroso l'intero ciclo di vita degli oggetti digitali, e per fare ciò il sistema deve essere sufficientemente versatile per descrivere in modo appropriato i documenti, supportare formati presenti e futuri, essere in grado di migrare i contenuti tra i diversi tipi di documenti, essere accessibile all'esterno e contenere le informazioni necessarie di copyright e di autorizzazioni. Un problema fondamentale delle collezioni di risorse eterogenee complesse come multimedia e rich media in applicazioni Web-based, spesso conservate in repository diversi secondo standard e formati differenti, è quello della loro gestione e visualizzazione con un'interfaccia di ricerca unica e omogenea 16 . Le varie soluzioni offerte dal mercato variano a seconda della complessità, della performance e dei costi. La soluzione ideale dipende dai propri specifici bisogni: ad esempio dimensioni del database, volume ipotizzato della domanda, volatilità dei dati, disponibilità delle risorse tecniche. Altri elementi da considerare sono l'accesso ad un vocabolario controllato, la flessibilità nella progettazione del database, la lunghezze di vita prevista per i dati, il potenziale per la migrazione, l'aderenza agli standard dei database e agli standard di contenuti di dati. Oggi si possono identificare tre classi di sistemi di gestione di documento testuali e audiovisuali:

1. applicazioni generiche di database (desktop e client/server); 2. programmi specializzati di gestione delle immagini (desktop e client/server); 3. soluzioni basate su SGML e XML. I più comuni programmi desktop del primo gruppo sono MS Access, Filemaker Pro; le applicazioni più comuni client/server sono Oracle, Informix (incluso Illustra), 4th Dimension e applicazioni object-oriented. I vantaggi dei programmi desktop riguardano i bassi costi iniziali, la relativa facilità di programmazione e utilizzo, la semplicità dei moduli di data import ed export e la crescente disponibilità di aggiunte commerciali, specialmente di strumenti Web. Tuttavia essi presentano poca scalabilità, poche strutture standard di dati, la necessità di personalizzare l'interfaccia Web e gli alti costi della programmazione, espliciti con le grandi applicazioni e nascosti ma comunque presenti con le applicazioni desktop.

Del secondo gruppo fanno parte soluzioni desktop commerciali: ad esempio Cumulus della Canto, ImageAXS, Portfolio (già Fetch), Luna Imagining Insight, ContentDm. I vantaggi di gestione, nelle immagini in particolare, sono certamente la struttura predefinita dei dati, i link costruiti dentro le immagini, la funzionalità cross-platform e link inseriti dentro per il Web di alcuni di essi, e una minore capacità di programmazione richiesta per l'implementazione. Di contro, gli svantaggi riguardano proprio la struttura fissa dei dati, strutture proprietarie di database, una possibilità di personalizzazione limitata e l'accesso Web possibile principalmente tramite script. I programmi specializzati di gestione delle immagini client e server sono principalmente software per biblioteche per biblioteche digitali, programmi destinati ai musei, applicativi per la gestione dei documenti e per i multimedia. Analizzando l'ambito oggetto di questo volume, ovvero i sistemi automatizzati per le biblioteche, gli applicativi che gestiscono anche immagini includono VTLS, CARL OCLC Sitesearch, Voyager ed Encompass della Endeavor, prodotti che in generale presentano ancora un'integrazione parziale tra immagini e testi, l'assenza di standard comuni per i repository e per l'utilizzo dei metadati, difficoltà nella gestione delle attività amministrative. L'ultimo gruppi dei sistemi in esame utilizza un nuovo approccio: l'uso di metadati codificati con SGML o XML, basandosi sulla definizione del tipo di documento (DTD: Document Type Definition). Tra gli esempi vi sono il California Heritage Project, che archivia le immagini utilizzando l'Encoded Archival Description (EAD), i testi che usano Ebind (un DTD di rilegatura elettronico), e il completo sistema di gestione Agora. I motivi per prendere in considerazione l'uso del SGML sono molteplici: innanzitutto questo linguaggio di marcatura è basato su uno standard internazionale, e i DTD stessi potrebbero diventare degli standard (basti pensare al MOA2). Inoltre SGML potrebbe essere più appropriato per una descrizione orientata al testo, ed è possibile creare dei link tra altre risorse codificate in SGML o XML. Ma esso presenta anche degli svantaggi: pochi client nativi supportano SGML, i motori che lo utilizzano potrebbero non essere potenti come i database relazionali, i database in XML sono attualmente ancora in fase di sviluppo, i software nativi in SGML tendono ad essere piuttosto costosi, e spesso è più facile immagazzinare i dati in un database e scriverlo senza i tag SGML o XML per lo scambio o l'export. Gli attuali software di ricerca cross-database attualmente sembrano rappresentare una buona soluzione per un accesso unificato soprattutto per la scoperta di informazioni generiche. Questi strumenti non soltanto ricercano i cataloghi di biblioteca ma anche per database commerciali di abstract e indici, motori di ricerca e una varietà di altri database, spesso effettuando la riunione e l'eliminazione dei risultati doppioni (de-duping). Varie biblioteche internazionali utilizzano software come MuseGlobal, EnCompass, WebFeat, MetaLib, MetaStar e Millennium 17 . I prodotti sul mercato variano abbastanza per caratteristiche, stabilità e facilità di implementazione: in alcuni casi potrebbe essere necessario solo un minimo di configurazione alle interfacce utenti di questi prodotti, mentre in altri occorrerà effettuare ulteriori implementazioni e potenziamenti dei sistemi, sempre che i vincoli tecnologici e le restrizioni imposte dalle software house lo consentano. Bisognerà in ogni caso mettere in conto modifiche continue al database, alle interfacce e ai metadati, al tempo stesso monitorando attentamente lo sviluppo degli standard dei database di immagini nella propria area di interesse. Nel caso di biblioteche universitarie, verosimilmente, l'implementazione e la manutenzione necessaria per questi software sembra tuttora notevole, e rimangono aperte le questioni del protocollo di ricerca e della efficace eliminazione dei risultati doppioni. Un altro problema non indifferente è quello del relevance ranking: ottenere dei risultati di ricerca da una varietà di fonti è assai elencarle in ordine di rilevanza. Per calcolare la rilevanza, il sistema deve supporre che alcuni documenti siano relativi ai bisogni degli utenti, e deve anche cercare di determinare quali item soddisferanno meglio i bisogni degli utenti, spesso disponendo solo di informazioni molto ridotte. Con i record MARC ad esempio non è possibile, e poiché le biblioteche usano sempre di più sistemi basati sull'OpenURL (come SFX di Ex Libris), è difficile o quasi impossibile conoscere in anticipo se una dato risultato di ricerca può essere accessibile online. Alcuni progetti degli ultimi anni, tra cui quello della California Digital Library, hanno indicato che:

-non sempre i migliaia di risultati ottenuti attraverso ricerche crossdatabase sono utili; -non sempre le soluzioni che comprendono tutti i database soddisfano i bisogni fondamentali degli utenti; -se da un lato della scala degli utenti vi sono gli studenti non laureati, che tipicamente hanno bisogno solo di un qualche documento da citare nei loro lavori, all'altro capo della scala vi sono gli studenti laureati o i membri della facoltà che richiedono documenti molto più dettagliati su una certa disciplina o un dato problema. Una soluzione a misura unica che vada bene per tutti non accontenta nessuna di queste due categorie. I risultati del benchmarking tra i diversi applicativi -unitamente ad alcuni vincoli di tipo economico -hanno portato alla scelta di sviluppare internamente al Dipartimento INDACO gli applicativi per il progetto DesignNet.

La soluzione identificata è stata quella di associare i metadati alle risorse dentro un Relational Database Management System (RDBMS) con interfaccia Web appositamente creato. Questa soluzione permette di utilizzare sistemi di Information Retrieval e di manipolazione delle risorse attraverso l'utilizzo di Java e dell'eXtensible Markup Language (XML), che consentono l'accesso non soltanto ai metadati ma alle risorse stesse (utilizzando una chiara codifica degli standard di archiviazione per le risorse digitali). Sebbene i RDBMS possano presentare limitazioni dovute a restrizioni di lunghezza e problemi relativi ai campi multipli (e in Dublin Core tutti i campi sono ripetibili), un sistema object-oriented come allegro-C 18 , attualmente in utilizzo in alcuni progetti tedeschi sui metadati, non è sembrata un'alternativa migliore. Per quanto riguarda i risultati della query, la tradizionale visualizzazione di dati è in genere focalizzata su un approccio descrittivo testuale piuttosto che visuale. Una soluzione alternativa potrebbe essere quella della restituzione accurata dei dati testuali, cercando però al tempo stesso di evidenziare percorsi significativi attraverso l'utilizzo di elementi grafici codificati. Questo approccio di 'visualizzazione semantica' 19 introduce una valutazione sul significato e la rilevanza dei dati nel processo evocativo di visualizzazione. Nell'ambito del design (come anche in altri settori) ciò consentirebbe di soddisfare alcuni bisogni specifici, quali ad esempio la possibilità di recuperare materiali (soprattutto visuali) che altri membri della comunità hanno valutato come interessanti, ottenere i risultati della ricerca filtrati o elencati in base a regole basate sulla qualità delle risorse, conoscere le modalità di utilizzo di alcune risorse da parte di altri utenti. Inoltre attraverso una visualizzazione grafica dei risultati delle query, il surfing -considerato negativamente come una perdita di tempo che abbassa la qualità dei risultati ottenuti -viene trasformato nel più positivo concetto di serendipity. Dal punto di vista catalografico, si prevede che tutti i documenti catalogati confluiscano in un OPAC arricchito (comprensivo di risorse possedute in locale e di risorse ad accesso remoto), strumento di accesso unico e omnicomprensivo, dotato di filtri incrociabili, ad esempio per restringere la ricerca alle sole risorse analogiche, oppure solo a quelle consultabili a distanza secondo accessi diversificati. Nel sistema così definito, una collezione tipicamente includerà documenti digitali e riproduzioni digitali di documenti analogici (contenuti) e supporti di accesso coerenti (tipicamente, un insieme di record descrittivi e dei finding aid). Un documento potrebbe rappresentare un gruppo di documenti fisici che vengono descritti, identificati e presentati come un insieme. Un link a livello di documento punta ad un singolo oggetto digi-tale, singolo o più spesso multiparte. I collegamenti tra i finding aid e i documenti saranno allo stesso livello della descrizione, normalmente per un documento o un gruppo di documenti collegati che viene descritto come un insieme. Perciò, un link da un record descrittivo dovrebbe puntare ad una rappresentazione Web-based di un oggetto digitale corrispondente al documento descritto, e questa rappresentazione potrebbe a sua volta costituire un documento di per sé: la copertina di un libro sarà cioè presente nel record del volume in oggetto, ma, se ritenuta utile come esempio di grafica, avrà un proprio record. Se un gruppo di item fisici viene descritto come insieme, il record descrive il gruppo e possiede un link ad una presentazione del gruppo visualizzato come una sequenza di thumbnail (che sarà visibile come un multi-view object, ovvero come immagini multiple di un documento), un indice dei contenuti o qualche altra forma di anteprima che fornisca dei link ai documenti individuali, o al primo documento con opzioni di navigazione. La scelta varierà con il tipo di documento e le preferenze degli utenti. È prevista la distinzione fra la presentazione del record destinata all'utente e quello ad uso di chi si effettua la compilazione: il primo conterrà solo gli elementi funzionali alla ricerca, mentre nel secondo verranno visualizzati i dati gestionali e amministrativi (come il numero di inventario, i software e le procedure necessarie alla conservazione) e le notizie di servizio (come il tracciato). Contestualmente, è stato analizzato il processo di recupero dei documenti, tipicamente reiterativo, sotteso all'interfaccia grafica prevista e i relativi processi di valutazione e di perfezionamento della query. Nel progetto DesignNet sono stati adottati approcci consolidati nell'area dell'Information Visualization: incorporare la visualizzazione e l'interazione nella funzione di recupero dell'infor-mazione può migliorare in modo notevole la performance di richiamo dei documenti 20 . La rappresentazione grafica dei risultati e il recupero dei risultati intermedi da un lato stimola il processo di valutazione sfruttando la capacità umana di valutare facilmente le informazioni visuali, dall'altro permette all'utente di controllare interattivamente il processo di perfezionamento delle ricerche, identificando insiemi di documenti rilevanti. Perciò, oltre ad una rappresentazione lineare, DesignNet si pone l'obiettivo di una visualizzazione di relazioni più dettagliate tra i risultati della ricerca e la formulazione, ribadendo l'importanza di restituzione del contesto. Nella GUI le relazioni tra differenti documenti, scelte in base a parametri che possono variare dalla tipologia dei documenti al tipo di file di un documento digitale (sfruttando cioè tutte le informazioni dei vari campi della scheda di catalogo), vengono mappate con differenti proprietà visive come il colore e la forma. Questo approccio permette di mostrare differenti dimensioni usando proprietà distinte, in modo che un osservatore umano possa immediatamente riconoscere pattern importanti che gli permetteranno un eventuale perfezionamento della query. Nel processo di richiamo dei documenti sono stati distinti quattro differenti subcompiti:

1. formulare una ricerca che descrive il tipo di documenti che si stanno cercando; 2. effettuare la ricerca e ottenere un insieme di risultati; 3. rappresentazione dell'insieme di risultati; 4. valutazione dell'insieme di risultati. La formulazione della query viene di volta in volta adattata alle intenzioni di recupero e ai risultati intermedi precedenti la sua esecuzione. Infine quando l'iterazione converge, viene generata una query ritenuta adatta a recuperare il risultato migliore: l'insieme di risultati ottenuti con questa ricerca contiene cioè i documenti che soddisfano al meglio i criteri di selezione. La visualizzazione grafica permette all'utente di individuare meglio dei percorsi specifici nella valutazione della query e trasforma quindi la sua percezione nella sua riformulazione: la capacità umana di riconoscere dei pattern o certe composizioni geometriche e di associarle instantaneamente a determinate interpretazioni permette un incremento nella performance della valutazione dei risultati. Inoltre incorporare metodi e tecniche di interazione come la manipolazione diretta o indiretta e meccanismi di feedback può facilitare il perfezionamento della ricerca. Per essere realmente efficace, tuttavia, pur favorendo quel concetto di serendipity che abbiamo visto essere funzionale alle modalità di apprendimento e di lavoro nel design, il processo di recupero dovrebbe essere integrato da specifici logaritmi di recupero, sia per il recupero term-based che, in prospettiva, per quello content-based (cfr. il paragrafo 2.2.5). Tali logaritmi, in particolare, saranno necessari nella gestione di un repository di grandi dimensioni, poiché la quantità di documenti recuperati nei risultati può raggiungere dimensioni notevoli.

Un Learning Resource Centre per il design

Dai processi di design, basati su modalità di lavoro collaborative, come si è visto derivano una molteplicità di output e documenti eterogenei. Ad un'interfaccia digitale, costituita da un Quality-Controlled Subject Gateway e dalle sue componenti descritte nei paragrafi precedenti, occorre allora far corrispondere un'interfaccia analogica, un luogo di accesso e consultazione dei documenti analogici, di incontro della comunità di didattica e di ricerca e di occasione di attività di vario tipo. Tale luogo dovrebbe presentare spazi colla-borativi per attività basate sulla circolazione della conoscenza, nei quali l'ambiente fisico e quello virtuale non siano contrapposti ma integrati sinergicamente per una compenetrazione degli strumenti di lavoro. Nell'ambito del design, ad oggi si è tentato di dare una risposta a questa esigenza attraverso tre diverse soluzioni: i cosiddetti design centre, i centri di documentazione e gli archivi per il design. I design centre 21 sono delle strutture pubbliche finalizzati alla promozione, sensibilizzazione e diffusione delle tematiche inerenti il design e delle politiche industriali nazionali, puntando sull'organizzazione di manifestazioni, mostre ed eventi come strumento di diffusione delle cultura del design sia per le aziende che per il pubblico in generale, erogando servizi specifici in base alle necessità delle aziende e alla particolare tipologia di centro. In Europa e nel mondo il modello dei design centre ha riscosso successo (si pensi, solo per citarne alcuni, al Design Exchange, all'Internation Council of Industrial Design o al Centre Design Rhone-Alpes), mentre in Italia non si è ancora diffusamente affermato a causa in parte della specificità del variegato e frammentato tessuto industriale italiano, e dell'impegno statale, che ha attribuito alle tematiche del design una scarsa importanza nel raggiungimento degli obiettivi sia aziendali che dell'intero sistema produttivo nazionale. Uno dei compiti dei design centre è quello di diffondere informazioni e attraverso queste sviluppare la cultura del design: in questa ottica, essi si occupano tangenzialmente anche di attività documentali e di banche dati. I centri di documentazione, da parte loro, si dedicano ad attività ad elevato contenuto specialistico, selettivo e aggiornato, a supporto di attività di didattica, ricerca e formazione, che sembrano soddisfare le esigenze di una struttura di questo tipo 22 . Specificatamente, le finalità dei centri documentazione comprendono:

-la trasformazione e la riduzione del documento a unità informative, la creazione di lessici documentari e di thesauri, lo sviluppo di sistemi informativi, l'archiviazione, il recupero e la circolazione delle informazioni; -la promozione di attività di formazione per favorire l'utenza e l'utilizzazione più adeguata dei servizi di documentazione ed informazioni; -l'organizzazione, il supporto e/o la consulenza per ricerche di vario tipo e organizzazione di attività culturali quali convegni, mostre ecc. A fronte di queste esperienze, nel mondo delle biblioteche, e di quelle universitarie in particolare, negli ultimi anni si è affermato sempre più una visione sistemica della biblioteca come nodo di una rete, e prima di tutto luogo di incontro, di socializzazione, è un luogo capace di trasmettere, citando Michel Melot, un 'sentimento di comunità provvisoria'. È proprio in ambito didattico e universitario, come si è visto (paragrafo 1.2.3) che è in corso la definizione di nuovi modelli concettuali e progettuali, quali ad esempio i learning resource centre, concepiti come centri funzionali e flessibili di risorse e luogo di molteplici attività di studio, di ricerca e di interazione sociale. Dagli aspetti tipici dei centri di documentazione, un learning resource centre per il design può derivare l'alta specializzazione delle attività di catalogazione e indicizzazione, collezioni documentali selezionate e aggiornate, il focus su attività di formazione, ricerca e information literacy. Dai design centre, esso può trarre un approccio proattivo e propositivo, orientato alla ricerca e alla sperimentazione, alla collaborazione con istituzioni e aziende, all'organizzazione di eventi culturali e mostre, alla disseminazione in varie forme della propria attività. Allo stesso tempo, andrebbe dedicata speciale attenzione ad un approccio personalizzato in base ai bisogni e alle esigenze dei content provider e degli utenti. Il principio alla base di una tale struttura, così come è stata ideata per il progetto DesignNet, è una concezione del design come processo di ricombinazione creativa. Seguendo il modello di biblioteca a tre livelli di Heinz Hemunds, a livello architettonico un learning resource centre per il design dovrebbe comprendere:

-un settore d'ingresso, provvisto di guardaroba, libreria, servizio di ristorazione, banco informazioni, materiali informativi sulla biblioteca e generali, postazioni informatiche utilizzabili in piedi e in modo diretto e rapido. Con la tessera magnetica di riconoscimento il lettore può controllare la sua situazione di utente o avere informazioni nell'ambito delle proprie specifiche aree di interesse; -la collocazione integrata del patrimonio: la distribuzione dei documenti non può essere effettuata in base al tipo di supporto. L'utente deve poter accedere a qualsiasi tipo di informazione in modo integrato, servendosi di tag elettronici; -zona di reference, zona di lettura (in biblioteca non si va solo per prendere in prestito opere ma per studiare, per leggere, per informarsi, per lavorare in gruppo), zone pluriuso (la biblioteca come luogo di accrescimento culturale individuale e collettivo, quindi servono spazi da adibire a rotazione a diversi tipi di attività). Le fasi di progettazione si conformano a quelle già identificate per le biblioteche:

-il funzionamento generale della struttura (programmazione del servizio); -il dimensionamento, i requisiti e l'assetto distributivo degli spazi e degli arredi per un corretto svolgimento delle funzioni previste; -l'immagine della biblioteca, la sua qualità formale, i materiali, i colori, gli impianti ecc. nel rispetto del vigente regolamento edilizio per i locali pubblici e del modello dimensionale precedentemente elaborato (progetto architettonico); -la scelta degli arredi e dei complementi di arredi (progetto di arredo). L'uso delle tecnologie digitali dovrebbe avvenire a diversi livelli:

-automazione dei servizi (catalogazione, reference, document delivery, prestito interbibliotecario…) e le attività amministrative; -gestione in rete dei rapporti tra partner e fornitori; -collegamento con Intranet e Internet; -produzione di un proprio sito Internet e possibilità di accesso ai servizi in linea non solo in sede ma anche a terminali remoti; -postazioni con terminali in rete e senza terminali ma cablati, per chi volesse recarsi in biblioteca con il proprio portatile. Poter usufruire dalla propria postazione di un terminale consente un nuovo tipo di lettura 'contaminata', ovvero consultazione non solo di tradizionali materiali cartacei ma contemporaneamente anche di documenti multimediali, per effettuare una ricerca incrociata senza limiti di supporto e favorire un processo associativo di conoscenze e nuove idee.

Risultati e problemi incontrati

Nella fase di progettazione del sistema si è giunti alla definizione di: 1. definizione del workflow e delle modalità di accesso dei servizi messi a disposizione nel progetto DesignNet; 2. uno schema di metadati ad hoc per l'ambito del design, suscettibile di ulteriori perfezionamenti nelle successive fasi di testing e di messa a regime; 3. strumenti di indicizzazione specifici per il design in forma di un vocabolario controllato e strutturato e degli authority file; 4. modalità di gestione, restituzione e visualizzazione dei documenti dal punto di vista informatico; 5. un modello di riferimento per la creazione di un'interfaccia fisica (un learning resource centre per il design) dell'interfaccia digitale del sistema delineato; 6. disseminazione dei risultati ottenuti in ambito dipartimentale e di facoltà. Per quanto riguarda gli schemi di metadati, si è riscontrata l'assenza di uno standard catalografico unico nella gestione di giacimenti documentali del mondo del design, sia a livello nazionale che internazionale. La scelta di Dublin Core non è stata indolore, poiché la mappatura di metadati non è una mera operazione automatica. Al tempo stesso, anche i vari profili di applicazione di Dublin Core si presentano come diversi dialetti, con la presenza di differenti elementi e qualificatori e a volte una interpretazione dissimile dei medesimi elementi e qualificatori. I qualificatori, come già evidenziato nel paragrafo 2.2.3, permettono di aumentare la specificità della descrizione ma al tempo stesso rischiano di comprometterne l'interoperabilità. Per tale motivo è stato ritenuto fondamentale conformarsi per quanto possibile a standard e schemi di codifica, dichiarando esplicitamente i riferimenti adottati. È state altresì effettuata una crosswalk di verifica con Dublin Core dell'unico standard formalizzato utilizzato nei laboratori del Dipartimento INDACO: lo standard americano IPTC (cfr. paragrafo 6.2). Per quanto riguarda gli identificatori, è stato preso in considerazione il DOI (Digital Object Identifier), un identificatore persistente delle entità su cui insistono diritti di proprietà intellettuale, non solo (qualsiasi forma di) oggetti digitali, ma qualsiasi 'IP entity', inclusi i libri e le opere dell'ingegno. Nell'ecommerce dei contenuti, lo standard DOI riveste un ruolo simile di quello del codice a barra nel commercio di oggetti fisici: facilita l'interoperabilità tra i sistemi informativi delle parti, utilizzando schemi di metadati esistenti. Per tale motivo più complessa è la catena di valore e maggiore sarà l'importanza del DOI, che però non è un accorgimento tecnico di protezione del copyright, né una tecnologia di ricerca dei contenuti. Per quanto riguarda il Design Thesaurus e la Design Directory, si è ritenuto opportuno pianificare un sistema ampio e più comprensivo, flessibile e suscettibile di successive e periodiche implementazioni, piuttosto che un sistema di dimensioni ridotte, che potrebbe diventare rapidamente inadeguato con il progressivo incremento della base dati. Lo sviluppo di un buon thesaurus richiede uno sforzo intellettuale non indifferente, equivalente al relativo data entry manuale e all'elaborazione di liste di classi. Il data entry si prospetta certamente oneroso nella prima fase di inserimento e di raggiungimento di un nucleo consistente di voci (la creazione di termini normalizzati e di authority record implica rigoroso lavoro di controllo e compilazione), ma nel lungo periodo, se metodologicamente bene impostato e avviato, risulterà economica e vantaggiosa. Infine, va tenuto in considerazione che un thesaurus non è mai finito, a meno che esso non venga più utilizzato in un database o non venga più aggiornato: nuove scoperte, reinterpetazioni e nuovi ambiti disciplinari richiedono l'aggi-unta di nuovi termini, la loro modifica e occasionalmente la loro eliminazione. Se la manutenzione non viene effettuata in modo costante, il thesaurus potrebbe perciò velocemente diventare una faticosa incombenza invece di un vantaggio. Per poter continuare ad essere utile, esso richiede costante aggiornamento.

-definire le caratteristiche della scheda di catalogo delle raccolte; -collaborare alla creazione di un prototipo di thesaurus; -inserire almeno qualche decina di record dei documenti analogici e degli oggetti presenti nella raccolta di ogni partecipante, e dei relativi documenti digitali.

[ Fig. 3 Il data-entry si è servito della scheda di catalogo precedentemente definita e del prototipo di thesaurus creato. I dati immessi sono stati quindi importati dal gruppo DesignNet in un'applicazione informatica elaborata nell'ambito del progetto. Durante le prove, effettuate dai partecipanti sia insieme a chi scrive che singolarmente, è stata fornita una prima bozza di linee guida per la compilazione e la sintassi e, in generale, si è raccomandato di porsi le seguenti domande prima e al termine dell'operazione di catalogazione:

-il record di per sé e il contenuto in ogni elemento del record è utile per la scoperta del documento? -il contenuto di un elemento è noto con certezza e velocemente da una base dati già esistente o da altre fonti informative? se così non è, si possono fornire informazioni che non saranno fuorvianti? -sono stati inseriti termini controllati adatti/sufficienti? -se si enfatizzano gli attributi di un oggetto fisico, sono state incluse queste informazioni negli elementi corretti? Sono state incluse informazioni significative sulla versione digitale e sulle 'pre-condizioni d'uso'? Sono state inserite sufficienti informazioni per un'intera collezione o per un documento individuale? Sono stati compilati un centinaio di record, scegliendo appositamente i documenti più disparati e complessi per avere un campione rappresentativo delle collezioni e delle raccolte di documenti presenti nei vari laboratori. Al termine delle prove è stato possibile effettuare alcune modifiche nello schema Dublin Core (riportato in appendice nel paragrafo 6.2), che è stato quindi utilizzato nel prototipo informatico creato (descritto nel paragrafo precedente) e reso disponibile nella Intranet del Dipartimento INDACO. Il prototipo (Fig. 4) permetteva di:

1. inserire ed importare i dati; 2. editare e aggiornare i record; 3. creare nuovi record; 4. effettuare il browsing; 5. permettere un processo di verifica per controllare la qualità dei record da parte di un'unità di supervisione. Gli elementi e i qualificatori erano visualizzabili con un indice a menù, e nella finestra del record erano mostrati sia gli schemi di codifica che i termini del Design Thesaurus (Fig. 4). Con il progressivo aumentare dei record, sono state aggiunte ulteriori funzionalità ritenute utili, come ad esempio l'inserimento di help in linea e di completamento automatico delle parole.

In questa fase di start-up si sono ottenuti i seguenti risultati: 1. avviamento della struttura della POLI.teca e definizione del regolamento e delle modalità di consultazione; 2. avviamento dei processi di catalogazione, indicizzazione e classificazione collettiva, tramite il coordinamento dei partecipanti al progetto DesignNet in prove di catalogazione, verifiche in itinere, selezione di termini di indicizzazione e definizione degli schemi di classificazione in base alle specificità di ognuno dei laboratori (cfr. paragrafo 6.6); 3. disseminazione in ambito interdipartimentale.

Nella progettazione di questa struttura, come spesso capita in Italia (non solo per le biblioteche ma anche per i musei), è stata palese la contraddizione tra l'esigenza di elaborare un piano di fattibilità che tenesse conto delle finalità della POLI.teca, e i condizionamenti dovuti al fatto che essa abbia trovato sede in un edificio preesistente con altre destinazioni d'uso. Per quanto riguarda le attività di catalogazione e di gestione della struttura, con la release delle applicazioni 1.0 del Design Thesaurus, del Design Catalogue e delle Design Directory, è cominciato l'utilizzo operativo degli applicativi da parte dei partecipanti al progetto. Reference in sede, per telefono e per e-mail; Current Contents per e-mail Nei limiti permessi dalla legge sul copyright, la POLI.teca invia i propri materiali, anche in formato digitale, alle strutture dipartimentali afferenti, per le attività di ricerca e didattica Segnalazione delle nuove acquisizioni, di siti web, di convegni, corsi, seminari, ecc. È consentito il prestito giornaliero dei materiali bibliografici. È permessa la riproduzione di alcuni documenti nei limiti permessi dalla legge sul copyright.

La POLI.teca si dedica attivamente all'incremento e all'aggiornamento della propria documentazione. È possibile avanzare richieste di desiderata per e-mail.

digitale. Si è inoltre registrato l'interesse, da parte di varie organizzazioni pubbliche e private, della possibilità di applicazione e di utilizzo delle metodologie e dei software di DesignNet. Le conclusioni, in un progetto come questo, ad uno stadio ancora di sperimentazione, non possono che essere provvisorie e non definitive. Più interessanti forse sono le prospettive, che sono comunque fondate giocoforza sulle prime certezze che il programma di ricerca ha fatto emergere. Alcune prospettive sono di breve periodo, e coincidono con gli obiettivi di sviluppo del sistema che ci siamo già posti, come la possibilità di raccogliere l'esperienza dell'utente, i suoi percorsi all'interno degli archivi e dei documenti, per integrarla al patrimonio esistente. Il modo in cui gli utenti mettono in relazione e utilizzano i documenti può costituire in sostanza un ulteriore livello di conoscenza, da rendere disponibile insieme ai documenti e alle informazioni preesistenti. Altri obiettivi di breve periodo, molto tecnici, sono: l'integrazione delle tre applicazioni di gestione in un unico strumento; la possibilità di lavorare su finestre multiple; la possibilità di creare collezioni di documenti, la definizione delle regole di esportazione dei metadati, la creazione delle interfacce di navigazione visuale (visual browsing) dei documenti per il Design Gateway, delle quali si è parlato nel primo capitolo. Ad un livello intermedio, quello degli obiettivi di medio periodo, c'è la volontà di gettare un ponte verso l'e-learning, sfruttando la 'didatticità' di certe relazioni che gli strumenti DesignNet permettono di creare, con la convinzione che un certo tipo di navigazione all'interno di un sistema conoscitivo per il design possa essere parte integrante di un programma di didattica a distanza. In sintesi, buona parte degli sviluppi futuri del progetto DesignNet riguarderanno: implementazione dell'interfaccia grafica del sistema; personalizzazione e customizzazione dell'interfaccia utente; implementazione dell'architettura e dei servizi di un Quality-Controlled Subject Gateway per il design; ulteriori investigazioni sui sistemi content-based di Information Retrieval, identificatori in ambienti di rete, tecnologie di infomobility e di bar-code e microchip per la gestione delle movimentazioni nella POLI.teca. Allargando ancora l'orizzonte, proiettandoci sul medio-lungo periodo, crediamo che gli ingredienti chiave per il successo di un progetto come DesignNet siano i seguenti:

-affrontare ogni problema in modo 'progettuale', organizzando il progetto in fasi che comprendono l'indagine preliminare sullo stato dell'arte dei metodi e degli strumenti utilizzati e il benchmarking, le verifica in itinere e il budget; -lavorare con un team interdisciplinare di specialisti che definiscano prioritariamente metodologie, strumenti, specifiche tecniche e modalità operative di base, ed effettuino verifiche periodiche durante il progetto;

-creare un archivio digitale con le qualità sedimentarie, la capacità di integrazione di materiali eterogenei e diffusi, la capacità di restituzione dell'informazione tipica degli archivi analogici e i plusvalori tipici dei sistemi digitali, con contenuti intellettualmente 'curati', modellati e aggiornati sui bisogni degli utenti. Sul medio-lungo periodo la prospettiva più importante, allo stato attuale, è senz'altro quella legata all'estensione della validità delle metodologie e degli strumenti sviluppati nell'ambito di questo programma di ricerca. Ricordiamo come tutto il programma DesignNet avesse in origine lo scopo di rispondere alle esigenze specifiche della Facoltà del Design; tirando qualche conclusione, abbiamo visto come in realtà i metodi e gli strumenti sviluppati possano avere valore anche in altri casi, e, ad un livello più generale, possano essere utilizzati -in virtù della loro flessibilità e della possibilità di gestire separatamente terminologia e elementi di indicizzazione -per trattare i documenti progettuali in momenti diversi della 'filiera del progetto': dalla organizzazione dei documenti in uno studio di design, fino alla catalogazione dei prodotti industriali nel museo di imprese design-oriented. Già nelle fasi di avvio del progetto DesignNet era emersa l'intenzione di puntare alla interazione con soggetti del mondo del design esterni al Politecnico, auspicando la connessione dei bacini di documenti e informazioni interni con quelli esterni, con la convinzione che questo potesse dare maggiore valore agli uni e agli altri 1 . Ora siamo nelle condizioni di dire che quell'intenzione può essere perseguita come obiettivo, ed abbiamo avviato per questo una serie di incontri con il mondo della gestione dei patrimoni documentali del design italiano (musei e archivi) e con gli studi professionali. Incontri che ci hanno rivelato una situazione di relativa verginità rispetto all'adozione di metodi e strumenti di catalogazione, soprattutto se paragonata a quella di ambiti del patrimonio culturale che da più tempo sono stati identificati e codificati e quindi si sono organizzati per la conservazione, la tutela, la valorizzazione dei propri documenti, o a quella di professioni più inclini a considerare il valore delle informazioni e della conoscenza e quindi della loro organizzazione e gestione. Una verginità che è in realtà una grande opportunità: quella di spostare da subito l'attenzione dal documento in sé, dal progetto, dal singolo elemento, al contesto, alle relazioni tra i documenti, al significato dei documenti e delle relazioni. Capita spesso di sentir lamentare la mancanza di una metodologia riconosciuta e validata per descrivere oggetti del design o i documenti del design, ammesso che si riesca a confinare questo dominio 2 . L'idea dietro al progetto DesignNet è che prima di definire una scheda per catalogare gli oggetti di design può essere più utile concertare un metodo per far dialogare i diversi giacimenti di documenti esistenti che possono essere utili al design. Con la convinzione che sia comunque possibile estendere il modello e considerare anche i documenti del design come documenti per il design, per poterli utilizzare da subito -insieme agli altri -come risorsa conoscitiva per nuovi processi progettuali. L'ampliamento di prospettiva, dalle esigenze della Facoltà a quelle del Sistema Design, pota con sé, per passare agli obiettivi futuri del programma, la necessità di una maggiore flessibilità nella creazione di pacchetti di contenuti, che può venire dalla piena adozione delle disposizione dell'OAI: uno standard che, come già detto in questo testo, «definisce un'infrastruttura tecnologica tesa a garantire l'integrazione e l'interoperabilità di archivi distribuiti» e «il cui approccio al metadata harvesting esemplifica la nozione di modularizzazione dei metadati, utilizzando lo schema semplice di DC per l'interoperabilità tra comunità diverse, supportando al tempo stesso metadati specifici delle singole comunità». Dietro questo allargamento al Sistema Design del programma di ricerca c'è anche una specie di sogno, o forse meglio un'ambizione: quella di dare alla comunità del design, che storicamente non ne ha create molte, una occasione di unificazione, attraverso la condivisione di una metodologia e alcuni strumenti per la gestione del proprio patrimonio informativo e documentale e quindi culturale. Una occasione per certi versi più tecnica e meno politica, e quindi forse più facilmente accettabile. Recentemente, sull'onda dell'accordo raggiunto da diversi soggetti del Sistema Design sull'istituzione del Museo del Design, l'idea di condividere uno standard di catalogazione unico ha trovato una via verso la concretizzazione nella istituzione di un "gruppo di lavoro per l'avvio e la realizzazione di un sistema catalografico del design finalizzato alla documentazione, conoscenza, tutela, conservazione e valorizzazione del patrimonio del design italiano" 3 . In realtà più che un'ambizione, quello del rafforzamento della comunità è una necessità: se è vero che ogni progetto di integrazione va ricondotto alla comunità di riferimento e con essa continuamente confrontato, e che il differenziale tra informazione e conoscenza è nell'esperienza, che è sempre contestuale, la formazione di un sistema conoscitivo non può prescindere da un contesto e da una comunità che porti la sua esperienza all'interno del sistema conoscitivo e sia responsabile del suo mantenimento e delle sue regole. Per questo è importante che si lavori parallelamente alla formazione (riconoscimento, integrazione) della comunità di riferimento oltre che allo sviluppo di metodologie e strumenti. Anche nel caso del Sistema Design la possibilità di raccogliere e rendere utilizzabile l'intelligenza collettiva passa -come dice Rullani -dal «costruire e far fun-zionare una rete di persone e una rete di imprese che, mantenendo la loro autonomia, cooperino nella produzione e valorizzazione della conoscenza posseduta». E, ancora con Rullani, l'intelligenza collettiva, è tale solo se «la conoscenza che contiene ed elabora non può essere divisa in parti che possano essere sommate senza perdere qualcosa di essenziale. Ciò significa che il sapere rilevante deve stare non nei singoli nodi della rete cognitiva ma nel pattern che li congiunge e che -essendo in gran parte implicito -non è separabile da essi». A questo pattern abbiamo dedicato gli sforzi finora compiuti; alla possibilità che il Sistema Design in tutta la sua estensione sia in grado di riconoscerlo e valorizzarlo vorremmo dedicare il proseguimento del programma DesignNet, consapevoli, come ha ricordato Peter Hirtle della Cornell University, che «once you start a digital project, you are committed to it for life» 4 .

Design Thesaurus

In base ai passaggi delineati nella fase di progettazione del sistema (paragrafo 4.4), la creazione del prototipo del Design Thesaurus è stata organizzata come segue:

Preparazione

La definizione della struttura e la compilazione del thesaurus è stata effettuata da chi scrive, come parte delle attività operative dell'assegno di ricerca. Sono stati utilizzati sia l'approccio top-down che quello bottom-up. Dopo lo studio delle norme e degli standard di riferimento e l'analisi di progetti rilevanti di thesauri online, sono state effettuate proficue riunioni con i responsabili operativi dei laboratori afferenti al Dipartimento INDACO del Politecnico di Milano; in particolare del Laboratorio MAST e Materiali e Design, che hanno contribuito con liste di termini e schemi di classificazioni. Le informazioni ottenute dall'Indexer's Discussion Group si sono rivelate altresì utili.

Raccolta, selezione e analisi dei termini

La selezione delle risorse per la raccolta dei termini, aggiornata periodicamente durante il data-entry, è stata effettuata in base ai seguenti criteri, che hanno costituito le linee guide anche nella successiva fase di implementazione della versione 1.0 dell'applicazione del Design Thesaurus:

[ Fig. 4] Screenshot del prototipo del Design Catalogue 1. risorse pre-ordinate (richiedono minori difficoltà e spesso offrono relazioni): -altri thesauri già esistenti, sia offline che online 23 : in particolare l'Art&Architecture Thesaurus del Getty, i Thesauri della Library of Congress, NASA Thesaurus, GeoScience Thesaurus, Thesaurus Regionale Toscano; -liste di descrittori, schemi di classificazione come la Classificazione

Decimale Dewey e i Library of Congress Subject Headings; -nomenclature delle singole discipline; -trattati terminologici dei vari campi; -enciclopedie, lessici, dizionari e glossari; -indici di monografie e studi di rilievo delle varie discipline; -indici o abstract dei periodici. 2. risorse aperte (più aggiornate alla terminologia corrente e più specifiche): -descrizioni di progetti o attività di indicizzazione; -discussioni con specialisti dei vari settori; -siti Web; -periodici di settore e materiali della letteratura grigia; -indagine presso gli utenti; -conoscenze personali. Ogni partecipante del progetto DesignNet, così come per le attività di catalogazione, ha indicato la disponibilità di un referente, con il quale chi scrive ha tenuto incontri settimanali per collaborare alla creazione del prototipo. Per quanto riguarda la scelta terminologica operata, oltre ai termini più noti sono stati privilegiati in modo particolare quei termini appartenenti a linguaggi specialistici e di settore. Sebbene nel corso di questa fase siano stati contestualmente raccolti molteplici nomi propri e nomi di luoghi pertinenti al design, in loro inserimento non sono è stata previsto nel Design Thesaurus, bensì nella Design Directory.

Raggruppamento e sviluppo delle classi di concetti

I termini raccolti sono stati riuniti e organizzati in ordine alfabetico, eliminando i termini identici. Sono stati quindi uniti i sinonimi o i termini nella stessa classe di concetti, definendo ampi campi e sottocampi di soggetto e ordinando i termini nell'ambito di questi campi. Parallelamente, si è provveduto a selezionare i termini preferiti e ad unire le informazioni per i termini della stessa classe di concetto. Questi passaggi sono stati ripetuti finché tutti i termini non sono stati sufficientemente consolidati e i termini preferiti identificati.

Struttura di classificazione

La creazione delle faccette, avvenuta parallelamente alla fase precedente, ha implicato l'identificazione di cluster indipendenti di termini nell'ambito del vocabolario, e ha richiesto fondamentalmente due passaggi:

1. creazione di una lista di termini organizzata in un insieme di cluster che presentano affinità semantica o concettuale, derivata dal raggruppamento e sviluppo delle classi di concetti della fase precedente. Questi cluster sono stati analizzati per identificare le faccette e le subfaccette, per quanto possibili indipendenti l'una dall'altra. Il nome di ogni faccetta, ad esempio MATERIALI, è stato considerato come Top Term, di modo che la faccetta costituisce l'organizzazione gerarchica dei termini ad essa subordinati; 2. il secondo passaggio è stato quello di allocare quanti più termini possibili derivanti dalla fase precedente nelle facette così identificate. Si tratta di un processo iterativo, nel quale alcuni termini all'inizio sembrano non rientrare in nessuna o al contrario molteplici faccette. Questi termini sono stati messi temporaneamente da parte finché non è stato validato l'insieme delle faccette: pur così difficili da assegnare, essi si sono spesso rivelati molto utili nel processo di validazione, aiutando a definire l'indirizzo delle faccette che li avrebbero dovuti accogliere. Questo processo, inoltre, è servito anche a validare i Top Term. Le faccette identificate per il prototipo del Design Thesaurus sono state le seguenti:

-AGENTI -ATTIVITÀ -ATTRIBUTI -CONCETTI -DISCIPLINE -FORME DI COMUNICAZIONE -LUOGHI -MATERIALI -PROCESSI -PRODOTTI -STILI E PERIODI -TECNICHE E TECNOLOGIE. L'ampia portata di ciascuna faccetta e la facile interferenza concettuale tra alcune di esse (ad esempio tra Attività e Discipline) è stato oggetto di numerose riflessioni e revisioni, che nello sviluppo dell'applicativo si sono concretizzati in un più sintetico elenco.

In questa fase è stata ulteriormente affinata l'identificazione dei termini preferiti e si è predisposta una griglia con i codici notazionali standard (TT, ALT, UF, BT, NT, RT, SN). A questi codici sono stati aggiunti l'ID del termine e il campo della Fonte. Nella griglia i termini preferiti sono stati organizzati in una struttura logica di termini generici e termini più specifici, identificando gruppi di sinonimi, distinguendo gli omografi e inserendo le note d'ambito. Una volta pronta l'applicativo prototipale del Design Thesaurus (Fig. 5), sono stati importati i dati creando un record per ogni termine preferito. Il prototipo per la gestione del Design Thesaurus presenta una struttura classificatoria di tipo monogerarchico, ovvero una struttura nella quale un termine appartiene ad una sola gerarchia (ha un solo BT), che supporta le tre relazioni semantiche tipiche dei thesauri: di equivalenza, gerarchiche e associative. La lingua scelta per il thesaurus è stato l'italiano, a partire dalla terminologia realmente utilizzata dalla comunità scientifica del Dipartimento INDACO. La decisione di sviluppare un software in-house per la gestione del Thesaurus nell'ambito del progetto DesignNet è stata presa dopo un attento benchmarking dei programmi disponibili commercialmente. Tra le varie soluzioni software per thesauri (comunque creati manualmente, non automatizzati), l'attenzione è stata rivolta in particolare a software per la gestione e l'accesso online per thesauri e la personalizzazione dell'interfaccia utente, come MultiTes, Synaptica, Lexico, TermTree e IC Index. Le caratteristiche e i limiti dell'indicizzazione automatica sono state già analizzate in dettaglio in questo volume (paragrafo 2.2.6). Basti ricordare che l'indicizzazione automatica tipicamente consiste nella semplice derivazione di parole chiave da un documento, e nel fornire accesso a tutti queste parole, mentre i sistemi più complessi di indicizzazione automatica tentano di selezionare dei vocabolari controllati di termini, basati sui termini del documento. La classificazione automatica tenta di raggruppare automaticamente documenti simili, utilizzando sia un metodo di clustering completamente automatico, che uno schema di classificazione definito e un insieme di documenti già indicizzati secondo quello schema.

Graphic User Interface (GUI)

Nell'interfaccia grafica del prototipo del progetto DesignNet la rappresentazione visuale prescelta è stata inizialmente quella di un bersaglio (Fig. 6), evoluto poi in una mappa sferica (Figg. 7-8). Da un punto di vista semiotico, comunicare significa interagire in uno spazio condiviso, servendosi di una mappa che può rappresentare un territorio reale in modo realistico (una carta topografica) o in modo simbolico (il grafo delle linee del metro), un territorio irreale (la mappa dell'Inferno di Dante) o un insieme di dati di diversa natura (la distribuzione del reddito su un planisfero).

Ogni mappa è una semplificazione, una rappresentazione per difetto, ma è utile proprio in quanto presenta una visione limitata di un insieme di fenomeni e visualizza in modalità bidimensionali gli insiemi di risultati, permettendo di identificare determinati pattern semplicemente variando dei parametri. Questi approcci sono ben noti dell'area dell'Information Visualization, e consentono all'utente di scoprire in modo interattivo delle relazioni tra uno spazio infomativo in genere non noto e la formulazione della query. La scelta di una visualizzazione 2D, nella fase prototipale, è dovuta a due ragioni: da un lato, in termini di tempo di risposta della query, il carico computazionale per la visualizzazione dovrebbe essere mantenuto al minimo; dall'altro, per permettere un riconoscimento istantaneo dei pattern una visualizzazione 2D risulta più semplice di una generalmente più complessa visualizzazione 3D, che può causare problemi aggiuntivi, ad es. in termini di visibilità, gestione e orientamento dei dispositivi di interazione 3D. Nella visualizzazione dei risultati, la relazione tra i documenti (ad esempio il loro grado di equivalenza semantica) può essere espresso in vari modi. Nei tradizionali sistemi di Information Retrieval, l'insieme dei risultati viene rappresentato in forma di liste ordinate, ponendo i documenti che più soddisfano i criteri di ricerca [Fig. 5] Screenshot del prototipo del Design Thesaurus all'inizio della lista. Sebbene tali rappresentazioni favoriscano l'identificazione dei documenti ritenuti più appropriati nell'insieme dei risultati della query, viene persa ogni informazione di dettaglio relativa alle relazioni con gli altri documenti o tra i documenti e la corrente formulazione della query. La GUI del prototipo DesignNet fornisce tre distinti strumenti con cui interagire:

-un applicativo di query, in cui la query può essere formulata con termini derivanti dal Design Thesaurus e parole a testo libero; -un applicativo di visualizzazione grafica, in cui i risultati vengono interattivamente mostrati all'utente in base ai parametri di ricerca selezionati; -un applicativo di visualizzazione testuale, in cui i risultati vengono interattivamente mostrati all'utente in forma di elenco testuale tradizionale. Tutti gli strumenti sopracitati sono importanti per il compito di valutazione dell'insieme di risultati e per il perfezionamento della definizione della query per l'iterazione successiva.

Design Directory

[ Fig. 8

Figure 8

] Visualizzazione dei record nel l'interfaccia del prototipo

Le aree di queste liste di autorità sono state definite e organizzate (Figg. 9-11) come segue: -persone; -organizzazioni; -prodotti astratti; -marchi. Le operazioni identificate per la creazione della Design Directory sono state le seguenti:

-la proposta di forme di intestazione autorevoli e omogenee, derivanti da documentazione formalizzata; -la creazione di una rete di termini e varianti tra loro collegati per agevolare la ricerca; -la pubblicazione online di liste periodiche di aggiornamento, per seguire l'evoluzione del mondo del design, in costante evoluzione.

[ Fig. 9] Screenshot della versione 1.0 della Design Directory: lista delle organizzazioni prevista l'implementazione di un modulo informatico che segnali all'operatore le discordanze nei dati importati. Parallelamente alle prove di catalogazione con i laboratori, lo schema di metadati è stato verificato anche in una ipotesi di progetto di catalogazione e fruizione delle tesi di laurea della Facoltà del Design e dei materiali derivanti dall'OpenLab, la mostra didattica annuale allestita con i lavori degli studenti del Corso di Laurea in Disegno Industriale. Per quanto riguarda il prototipo del Design Thesaurus, la cui compilazione è stata effettuata e verificata con i partecipanti al progetto, si è riscontrata l'esigenza di utilizzare dei codici di notazione standard 25 per la terminologia. Le relazioni dei termini di un thesaurus possono anche essere mostrate graficamente, sebbene vi sia il rischio che il diagramma risultante sia così complesso da risultare incomprensibile all'occhio inesperto. In genere i thesauri sul Web tendono a ricopiare il layout delle loro controparti cartacee, spesso contengono minori informazioni rispetto alla versione stampata e, nonostante i link ipertestuali, non sembrano fruttare pienamente le potenzialità del digitale.

[ Fig. 10 È stata inoltre recepita l'importanza di una corretta gestione del thesaurus, che cresce e si evolve nel tempo con nuovi ambiti disciplinari, concetti e termini, tenendo comunque presente che diventando sempre più grande e complesso, la consistenza d'indicizzazione diminuirà: chi gestisce il thesaurus si trova sempre a dover affrontare un trade-off tra il perfezionamento terminologico e la facilità di localizzazione dei termini.

Figure 10

In merito all'interfaccia grafica del prototipo, nella maggior parte dei casi la progettazione di una nuova interfaccia per applicazioni multimediali come le biblioteche digitali è ancora abbastanza arbitraria e imprevedibile. Con l'implementazione del sistema sono state previste modifiche e in particolare si è rilevata la necessità di ulteriori approfondimenti ed esperimenti per sviluppare molteplici visualizzazioni che consentano di utilizzare in modo efficace il sistema sia ai content provider che agli utenti. . STILI E PERIODI Concretizzando un'ipotesi presa in considerazione con il prototipo, e in base a quanto deciso per la Design Directory, nella faccetta LUOGHI è stato previsto l'inserimento di nomi geografici e delle loro varianti in inglese. Nel Design Thesaurus è cioè possibile, attraverso l'etichetta di nodo 'nomi geografici', accedere ad un elenco di nomi organizzati gerarchicamente per continente, stato, regione, città e quartiere. Tale scelta, che in qualche modo viene a creare un ibrido tra termini relativi a concetti e termini relativi a cose storicamente esistenti, è stata dettata da esigenze funzionali, ma non è escluso che in futuro i nomi geografici vadano a formare un thesaurus a sé stante, sull'esempio di quello -sviluppato su tutt'altra scala -del Thesaurus of Geographic Names del Getty 26 . Per quanto riguarda le diverse possibili organizzazioni di un thesaurus in forma gerarchica, in modo da fornire strumenti aggiuntivi per navigarne la struttura, è stata decisa l'adozione delle etichette di nodo (Fig. 12), per indicare la caratteristica di divisione utilizzata per la classe (rappresentata dal termine più generale) nelle singole specie (rappresentate dai termini specifici). Le etichette mostrano la base logica sulla quale la gerarchia è stata organizzata, mentre i termini BT/NT da entrambe le parti dell'etichetta si riferiscono a concetti del medesimo tipo. Un'altra possibile funzione di etichetta è quello di introdurre diversi tipi di concetti, assicurando che questi vengono collocati, per comodità degli utenti, sotto i concetti con i quali vengono solitamente associati. In questi casi, il termine apparentemente generale serve unicamente a collocare i concetti associati introdotti dall'etichetta di nodo, che non sono quindi dei termini generici e specifici bensì dei termini associati. Mentre le classificazioni dei termini sono relativi alla struttura gerarchica BT/NT, le etichette di nodo deviano dalla gerarchia rigida per sviluppare raggruppamenti aggiuntivi e funzionali di termini. Le classificazioni variano da categorie appiattite (ampie classi con un singolo livello di elencazione dei termini inclusi nella classe, come nell'ERIC Thesaurus), a strutture complete di notazioni, come nella struttura ad albero del Medical Subject Headings (MeSH). Le etichette di nodo sono comunemente utilizzate per organizzare rappresentazioni gerarchiche, ad esempio: occhiali <per uso> occhiali da sole occhiali da vista occhiali sportivi <per tipo di montatura> montature face-à-main montature pieghevoli montature semicerchiate montature senza cerchio Questo accorgimento è molto utile quando vi è un grande numero di NT sotto uno specifico BT: una tale rappresentazione rende più facile comprendere l'organizzazione dei termini e identificare i termini utili senza dover leggere un'unica lunga lista. Le etichette di nodo non sono di per sé utilizzate nell'indicizzazione, il loro scopo è puramente di tipo organizzativo. Alcuni thesauri organizzati gerarchicamente, come ICONCLASS e l'Art & Architecture Thesaurus (AAT), usano una rigida relazione tra classi inferiori e superiori in una singola gerarchia. I termini possono essere classificati in molteplici modi, ad esempio per forma, per utilizzo ecc. L'AAT affronta questo problema attraverso la qualificazione di alcuni termini: ad esempio, il concetto di paesaggio è rappresentato dai due termini 'landscape (representations)' e 'landscape (environments)'. Sebbene questa soluzione possa presentare alcuni svantaggi ( la distinzione tra due termini qualificati potrebbe non essere chiara all'utente ed è difficile decidere dove dovrebbero essere localizzati le sottoclasse di concetti), la si è ritenuta sufficientemente funzionale e ne è stato perciò previsto l'uso nel Design Thesaurus.

Figure 12

Implementazione

Le relazioni RT rappresentano una classe di relazioni non gerarchiche, la cui applicazione spesso non risulta chiara nella costruzione di un thesaurus (Fig. 13). Semplificando, si potrebbe dire che le relazioni RT rappresentano una generica connessione 'vedi anche' tra due concetti: questo potrebbe portare ad una espansione incontrollata dei risultati dei termini della query e ad una potenziale perdita nella precisione a fronte di un incremento del richiamo, come è stato evidenziato in alcuni studi empirici 27 . Lo standard ISO 2788 identifica innanzitutto due tipi di termini che possono essere correlati da una relazione associativa: quelli che appartengono alla stessa categoria e quelli che collegano categorie diverse all'interno del thesaurus. Vi sono poi una serie di ulteriori e diverse sub-relazioni (ad esempio la relazione 'funzionalmente correlato a'). Nel Design Thesaurus si è scelto di dare priorità di compilazione agli altri campi del record di un termine, e di sottoporre la segnalazione delle relazioni associative al Gruppo di Lavoro sulla Terminologia del Design [ Fig. 12] Screenshot della versione 1.0 del Design Thesaurus: esempio di gerarchia con etichetta di nodo Durante la revisione del corpus di termini raccolti e già in parte strutturati, si verificano le cross reference e si effettuano test di indicizzazione: assegnando i descrittori ad un set campione di nuovi documenti, in un numero sufficiente da avere un'idea delle possibili lacune nel thesaurus, è possibile verificare il richiamo usando delle domande-campione per vedere con quale efficacia il thesaurus conduce al descrittore appropriato. In vista della prima fase di catalogazione collettiva e consultazione sperimentale del catalogo del progetto DesignNet, prevista durante l'anno accademico 2004-2005, è stata inoltre attivata una iniziativa volta a creare un accordo stabile tra la comunità scientifica e chi compila il Design Thesaurus: l'istituzione di un Gruppo di Lavoro sulla Terminologia del Design. Tale gruppo di lavoro utilizzerà questo vocabolario come strumento di mediazione e punto di comune accordo linguistico-semantico tra gli esperti e i professionisti in questo ambito, [Fig. 13] Screenshot della versione 1.0 del Design Thesaurus: record compilato di un termine per consentire una standardizzazione sulla quale è possibile costruire un consenso terminologico. In tal modo sarà possibile rendere il Thesaurus uno strumento efficace e funzionale per gli utenti del sistema, oltre che di valorizzazione del lavoro e delle competenze della comunità interdipartimentale. Obiettivi generali del Gruppo di Lavoro, che verrà coordinato da chi scrive e si incontrerà periodicamente, saranno:

Figure 13

1. l'identificazione e selezione dei termini relativi ai vari ambiti disciplinari dei Laboratori (ad es. materiali, colore, merceologia, fotografia, storia del design, video, requisiti ambientali, computergrafica, progettazione per l'infanzia), che verranno inseriti da chi scrive; 2. l'identificazione delle relazioni e delle gerarchie dei termini relativi ai vari ambiti disciplinari; 3. la disseminazione del proprio lavoro in ambito di ateneo e con altri enti ed istituzioni dedicate alla terminologia. Nel Gruppo di Lavoro è prevista la distinzione in tre categorie di membri:

-commissione scientifica; -gruppo operativo; -partner istituzionali.

Disseminazione della bozza del thesaurus

In previsione della prima fase di catalogazione collettiva e consultazione sperimentale del catalogo del progetto DesignNet, prevista durante l'anno accademico 2004-2005, sono state analizzate e definite le sue possibili forme di rappresentazione del Design Thesaurus. Vi sono molti modi di rappresentare un thesaurus in formato digitale e cartaceo: la vista bidimensionale presenta i termini del thesaurus in ordine alfabetico, con i relativi dettagli e solo un livello di termini BT e NT (come nell'Eric Thesaurus), mentre in una presentazione 'piatta' -che fornisce tutte le relazioni per ogni termini del thesaurus -un utente che comincia con un termine che non fa parte dei termini formali del thesaurus potrebbe avere delle difficoltà. Questo può succedere quando il termini di ricerca è una parola che nel thesaurus non è un termine d'entrata (cross reference). Tuttavia, una lista di termini 'ruotata' o 'permutata' mostra tutte le parole utilizzate nel thesaurus, permettendo quindi a chi cerca di usare qualsiasi parola, che sia un termine formale del thesaurus o un sinonimo. Ad esempio il Thesaurus of Engineering and Scientific Terms elenca ogni parola in un formato keywordout-of-context: i termini formali del thesaurus e i sinonimi in cui la parola appare sono indentati sotto la parola chiave. Una presentazione multilivello e ad albero mostra tutti i livelli delle relazioni gerarchiche, come nel caso del già citato Art and Architecture Thesaurus, in cui una struttura gerarchica con faccette è suddivisa inizialmente da etichette di nodo (comprese tra <>) che indicano il tipo di relazione gerarchica. Due fattori decisivi del grado di flessibilità di un thesaurus sono inoltre la lunghezza e il numero dei campi: più specifico è il vocabolario di un thesaurus e maggiore sarà la necessità di campi oltre 50 caratteri; le note descrittive dovrebbero essere di lunghezza illimitata. Uguale importanza riveste la consistenza dei meccanismi di controllo, per prevenire: -entrate multiple dello stesso termine (duplicati); -relazioni multiple tra due termini (sia dello stesso tipo che di tipo diverso); -relazione incomplete: relazione da un termine ad un altro senza la reciprocità; relazione tra soltanto un fattore e un termine combinato.

[ Fig. 14 Questo approccio rientrerebbe in una sorta di rituale generale di 'canonizzazione del termine', di cui si verifica l'efficacia prima di inserirlo nella struttura definitiva del vocabolario (Fig. 14); -gestione delle fonti dei termini in una sezione apposita (Fig. 15); -numero di termini illimitato; hyperlink tra tutti gli elementi; -report online; -applicazione integrato nel database con livelli di accesso diversificati e consultabile in modo indipendente; -data di ingresso del termine e data dell'ultima modifica; -possibilità di spostare termini e sotto-rami; display online dei termini in ordine gerarchico (relazioni di equivalenza, relazioni gerarchiche, relazioni associative -mostrando ogni termine nel suo contesto gerarchico sia superiore che inferiore), alfabetico, KWOC, microthesauri, a seconda della selezione dell'utente; -rappresentazioni grafiche delle relazioni; -ricerca semplice (descrittori o parole chiave) o complessa (con filtri multipli);

Figure 14

Figure 15

[ Fig. 16] Screenshot della versione 1.0 del Design Catalogue: elenco dei record con anteprima -pop-up con i dettagli dei termini; -cluster concettuale di termini multipli.

Figure 16

Catalogazione con Dublin Core

Un requisito previsto per l'applicativo di catalogazione, come già scritto, è che i campi della descrizione possono essere collegati al Design Thesaurus (Figg. [16][17]. Si è previsto anche, in particolare per i documenti bibliografici e in vista delle connessioni con basi dati di questo tipo, la possibilità di riportare l'equivalente Classificazione Decimale Dewey. La compilazione dei record del catalogo dei siti Web è stato oggetto di alcune riflessioni. 'Includere nel catalogo' significa infatti 'fornire accesso attraverso il catalogo', sia che si tratti di record e documenti conservati fisicamente sull'hard disk del sistema che di siti Web. In quest'ultimo caso, ci si è interrogati su cosa rappresenti una unità (un sito Web per intero o una pagina Web?), se distinguere o meno tra documenti commerciali e non, come gestire documenti dinamici per sé e l'instabilità dei documenti presenti all'interno di un sito (disponibili per periodi limitati e poi rimossi), l'eventuale download e conservazione in locale delle informazioni ritenute utili, come eseguire l'indicizzazione di siti il cui contenuto specifico è soggetto a cambiamenti periodici.

Primi risultati e problemi

Nella fase di implementazione della versione 1.0 delle applicazioni si è giunti ai seguenti risultati: 1. revisione dell'applicazione prototipale per la compilazione dei record secondo lo schema Dublin Core Qualified definito per il progetto DesignNet; 2. revisione dell'applicazione prototipale per la gestione del Design Thesaurus e realizzazione della versione 1.0; 3. approfondimento delle modalità di applicazione dello standard per interoperabilità OAI-PMH (che utilizza Dublin Core e XML) (cfr. paragrafo 6.4); 4. applicazione delle metodologie definite e dei software nella start-up di un Design Knowledge Centre (cfr. paragrafo successivo); 5. disseminazione dei risultati in ambito interdipartimentale e nazionale 28 e contatti con istituzioni rilevanti nel settore della documentazione, tra cui l'Istituto Centrale per il Catalogo e la Documentazione. Per quanto riguarda difficoltà incontrate nella catalogazione, si è verificato come i documenti audiovisuali e gli artefatti del design (prodotti, semilavorati) richiedano di norma tempi maggiori rispetto ai documenti bibliografici: si tratta spesso di prodotti corale, che presentano una pluralità di responsabilità. Negli standard catalografici tradizionali viene effettuata una distinzione tra 'fonti interne' ritenute più affidabili e stabili, nel caso di un documento audiovisuale raggiungibili mediante il dispositivo che ne consente la lettura, e 'altre fonti', leggibili a occhio nudo, come le etichette stampate sul supporto, il contenitore e la documentazione allegata, che presentano una minore curabilità e attendibilità dovuta spesso a motivi commerciali (basti pensare alle numerose versioni del packaging). Se l'assenza di fonti sicuri da cui derivare i record catalografici potrebbe costituire una remora al decollo di collezioni di questo tipo. Ai partecipanti al progetto DesignNet è stato suggerito di ricorrere principalmente alle fonti interne, riportando comunque gli altri dati a vantaggio di una maggiore ricchezza del record. Testando le modalità di recupero dei documenti nelle applicazioni prototipali e nelle versioni 1.0, si è riflettuto sull'efficacia dell'utilizzo di parole chiave provenienti dal Design Thesaurus e sull'eventualità di adottare anche fonti intermedie alternative di suggerimento dei termini per incrementare il richiamo di documenti testuali 29 , nello specifico liste di co-occorenza dei termini generate automaticamente dal computer. Tali liste permetterebbero di poten-[ Fig. 17] Screenshot della versione 1.0 del Design Catalogue: record di un documento ziare l'efficacia del Design Thesaurus -che non copre tutti gli ambiti dello scibile umano o tutti i possibili sinonimi -, consentendo ad un utente non esperto di un determinato ambito di poter rintracciare i documenti servendosi sia dei termini del vocabolario utilizzati nell'indicizzazione dei documenti che dei termini suggeriti dalle liste di co-occorenza, e ad un utente esperto di recuperare documenti servendosi di termini leggermente diversi da quelli usati nell'indicizzazione, al di là dell'aiuto offerto dalle tecniche di stemming. In ogni caso, il Design Thesaurus rimane lo strumento principale e privilegiato di accesso e recupero, offrendo termini organizzati nell'ambito una precisa mappa mentale e riflettendo la semantica dei documenti ad un livello più generale e con una maggiore precisione concettuale, laddove le liste di cooccorrenza rifletterebbero dettagli più minuti ma spesso non accurati né sistematizzati, in quanto semplici risultati di calcoli statistici sulla compresenza di alcuni termini in specifici documenti. gruppo di progetto DesignNet e i laboratori partecipanti hanno dato vita ad struttura ispirata al modello di un design knowledge centre, ovvero un combinazione tra un centro di documentazione specificatamente pensato per il design e un design centre che intende essere complementare, per tipologia di documenti e servizi offerti, alle biblioteche già presenti nel Politecnico di Milano. Questa struttura, avviata nel giugno 2003 nell'edificio AR del Campus Bovisa, dopo una fase di start-up e sperimentazione, è oggi pienamente operativa con il nome di 'POLI.teca' (Figg.18-19), aperta a studenti, docenti e ricercatori di Ateneo con l'obiettivo di:

Figure 17

Figure 18

Start-up di un Design Knowledge Centre

-dare accesso a documenti analogici e digitali sul design, sia generali che di settore e utili alle diverse fasi del processo progettuale, ponendosi come interfaccia fisico del Design Gateway; -sperimentare strumenti innovativi per la condivisione e la manipolazione delle risorse documentali e lo sviluppo di conoscenza progettuale (la catalogazione e la restituzione online avverrà in base alle metodologie e agli strumenti sviluppati nell'ambito del progetto DesignNet); -ospitare occasioni di formazione e incontro che utilizzino i bacini documentali della POLI.teca. La struttura si pone perciò come un luogo d'incontro e d'integrazione dei laboratori, con obiettivi e compiti comuni: acquisizione di nuova documentazione, gestione, catalogazione e accesso dei documenti a supporto delle attività di didattica e di ricerca del design, applicando le metodologie definite nel progetto DesignNet con il coordinamento di chi scrive. Nella POLI.teca si integrano varie strutture interateneo, i cui patrimoni sono accessibili tramite uno sportello unico: è stato previsto un ampliamento dello spazio disponibile, coerentemente con l'aumentare del numero e della capacità dei servizi offerti, attraverso l'utilizzo dei diversi piani dell'edificio: tali locali saranno dotato di spazi e strumentazioni adeguate a consentire sia le attività che richiedono il contatto diretto o telefonico con il pubblico (front-office), sia il contemporaneo svolgimento dei compiti e delle funzioni di supporto alla attività di documentazione e formazione, nonché alla progettazione ed alla realizzazione di iniziative di ricerca, monitoraggio, innovazione organizzativa e sviluppo telematico dei propri patrimoni documentali (back-office) e di iniziative culturali inerenti tematiche progettuali. Per quanto riguarda le risorse finanziarie, attualmente la POLI.teca si avvale di una parte dei fondi per la didattica dei laboratori e delle attività didattiche dei dipartimenti che si appoggiano ai laboratori integrati nella POLI.teca. Il patrimonio attuale e i servizi offerti sono riportati nelle tabelle 3-4. Dati i risultati già ottenuti con la struttura attualmente operativa, la formalizzazione istituzionale della POLI.teca non potrà che aumentare quantitativamente e qualitativamente il supporto già fornito alle attività didattiche e di ricerca delle diverse Facoltà dell'Ateneo, e accelerare quei processi di integrazione nella rete delle biblioteche, dei centri di documentazione e degli archivi del Politecnico di Milano.

Processi

Per favorire l'operatività di base nella fase pilota del progetto e nella successiva messa a regime del sistema, sono stati segmentati e analizzati i processi rilevati, per ottimizzare più agevolmente le procedure. In un sistema di catalogazione ideale (in ambiente digitale e non), i record dovrebbero essere gestiti in modo tale che essi siano:

1. completi (nessuna delle parti di informazioni su un documento deve andare perduta, e che i documenti più importanti devono essere conservati) e recuperabili; 2. autentici e accessibili (significa che i record trovati o recuperati possono essere consultati velocemente da quelli che ne hanno bisogno e che hanno l'autoriz-zazione); 3. affidabili (i record possono essere localizzati) e utilizzabili (i record possono essere realmente letti Circa 200 monografie e materiali bibliografici inerenti la cultura progettuale e settoriale, tecnologie, innovazione, ecc.

-dossier di ricerca settoriale elaborati da studenti, relativi a processi produttivi o dossier di indagine settoriale; circa 600 schede tecniche; -oltre 1000 tesi ed elaborati di laurea del corso di laurea in Disegno Industriale -descrizione essenziale: informazioni contestuali e metadati. I metadati giocano un ruolo primario, ma non esclusivo, nei sistemi automatizzati. Quando queste informazioni vengono prese allo stesso momento della cattura, descrizioni di base (ad esempio informazioni tecniche su file d'immagine) possono essere acquisite automaticamente. Tuttavia anche in un ambiente digitale la descrizione a livello della serie e ad altri livelli superiori dovrà essere effettuata manualmente; -valutazione: determinazione di come i documenti dovrebbero essere conservati dal sistema. La valutazione è un processo continuativo. Infatti esso comincia già con il processo di cattura, quando si decide se un documento debba essere inserito o meno nel catalogo. L'immagazzinamento e la conservazione digitale sono costose e i soldi potrebbero essere invece impiegati per migliorare sistema; -conservazione: molto più dinamica nell'ambiente digitale che in quello analogico. L'operazione di migrazione dei record da un ambiente software all'altro è complessa e oggi comporta comunque la perdita di alcuni attributi. Bisogna quindi determinare quale grado di perdita sia accettabile; -accesso e delivery dei documenti: grazie al processo di conservazione i documenti rimangono leggibili e comprensibili, grazie al processo di ordinamento e di descrizione possono essere recuperati e compresi nel loro contesto, grazie alla selezione e alla disposizione i documenti non rilevanti non vengono inseriti nel catalogo; -integrazione di più applicativi e servizi indipendenti; -reference, cioè selezione delle opere d'interesse anche grazie a segnalazioni, valutazioni di esperti, graduatorie ed indicatori formali di rilevanza.

Log In

Sistemi conoscitivi per il Design: una proposta metodologica

Sign up for access to the world's latest research

Abstract

Related papers

Related papers

Related topics