Academia.eduAcademia.edu

Sistemi conoscitivi per il Design: una proposta metodologica

2006

Il volume descrive le orgini e gli obiettivi del progetto/programma di ricerca DesignNet, avviato dall’esigenza di mettere a disposizione di studenti e docenti della Facoltà del Design del Politecnico di Milano informazioni e documenti per alimentare la didattica progettuale, e affrontava il problema dei documenti per il design insieme a quello della raccolta, descrizione e trasmissione dei documenti del design. La ristampa coincide con uno degli obiettivi dichiarati: promuovere ed allargare la rete del design identificata nel progetto, offrendo alla comunità del design un’occasione di unificazione attraverso la condivisione di una metodologia e di alcuni strumenti per la gestione del proprio patrimonio informativo, documentale, e quindi culturale.

| Sistemi conoscitivi per il design: una proposta metodologica | Il caso DesignNet | Paolo Ciuccarelli, Perla Innocenti | Sono passati 4 anni dall’avvio del programma di ricerca DesignNet, del quale in questo volume vengono descritte le scelte operate e i principali risultati. Il programma nasceva dall’esigenza di mettere a disposizione di studenti e docenti della Facoltà del Design del Politecnico di Milano informazioni e documenti per alimentare la didattica progettuale, e affrontava il problema dei documenti per il design insieme a quello della raccolta, descrizione e trasmissione dei documenti del design. La ristampa coincide con uno degli obiettivi dichiarati: promuovere ed allargare la rete del design identificata nel progetto, offrendo alla comunità del design un’occasione di unificazione attraverso la condivisione di una metodologia e di alcuni strumenti per la gestione del proprio patrimonio informativo, documentale, e quindi culturale. ISBN: 88-87981-60-4 © 2006 Edizioni POLI.design Prima edizione: dicembre 2004 Ristampa: ottobre 2006 via Durando 38/A - 20158 Milano Tel. 02-2399.7206 Fax 02-2399.5970 E-mail: edizioni.polidesign@polimi.it internet: www.polidesign.net Coordinamento editoriale Michela Pelizzari Sistema grafico editoriale Art direction: d.com Grafica e impaginazione: Alessandra Albano, Lucia Oliosi Stampa: ALLgrafic sas - Milano I capitoli 2, 3, 4 e i paragrafi dal 5.2 al 5.5 sono stati scritti da Perla Innocenti; il capitolo 1 e il paragrafo 5.1 sono stati scritti da Paolo Ciuccarelli; il capitolo 6 è stato scritto da entrambi gli autori. Le immagini riprodotte in questo volume sono © dei rispettivi legittimi proprietari e sono qui utilizzate senza fini di lucro. Si rimane a disposizione degli aventi diritto con i quali non è stato possibile comunicare, nonché per eventuali involontarie omissioni o inesattezze. Tutti i diritti sono riservati; è vietata la riproduzione non autorizzata, con qualsiasi mezzo effettuata, compresa la fotocopia, la memorizzazione elettronica o altro sistema di registrazione. Indice 1. Documenti del design, documenti per il design Paolo Ciuccarelli 1.1 Dall informazione alla conoscenza per il design 1.2 L interfaccia tra il designer e la conoscenza 9 11 14 2. Evoluzione dei documenti e della biblioteca nell’era digitale Perla Innocenti 19 2.1 L’universo biblioteche oggi: tendenze in atto 20 2.2 Le biblioteche universitarie dall’automazione alla trasformazione: il contesto internazionale 23 2.3 La situazione in Italia 28 2.4 Sfide e scenari prossimi venturi 29 2.5 Spazi fisici: Learning Resource Centre e Information Commons 32 2.6 Spazi virtuali: biblioteche digitali e repository 35 2.6.1 Le biblioteche digitali in ambito universitario 36 2.6.2 Architettura, componenti e caratteristiche delle biblioteche digitali 2.6.3 Interoperabilità, standard, modelli organizzativi 40 2.6.4 Linee di sviluppo future 42 2.7 Knowledge Management e sistemi di organizzazione della conoscenza 3. Organizzazione e restituzione della conoscenza in ambienti di rete Perla Innocenti 3.1 Standard di digitalizzazione 57 3.1.1 Conservazione del dettaglio più fine 59 3.1.2 Definizione della qualità dell immagine in funzione della finalità d’uso 38 44 55 60 3.1.3 Definizione del workflow, gestione delle caratteristiche dell’immagine 3.2 Standard di documentazione 62 3.2.1 Il mondo degli schemi di metadati: principi e questioni 65 3.2.2 Metadati descrittivi 76 3.2.3 Dublin Core Metadata Element Set (DCMES) 79 3.2.4 MPEG-7 89 3.2.5 Information Retrieval 90 3.2.6 Indicizzazione term-based, manuale e automatizzata 94 3.2.7 Vocabolari controllati: i thesauri 100 3.2.8 Authority control 107 3.2.9 Web semantico e ontologie 109 4. Un sistema conoscitivo per la didattica e la ricerca del design in ambito universitario 125 Perla Innocenti 4.1 Introduzione 125 4.1.1. Restituzione online delle informazioni relative al design 127 4.1.2 I giacimenti documentali del design: il caso della Facoltà del Design del Politecnico di Milano 130 4.1.3 Sistemi informativi e sistemi conoscitivi in ambienti di rete 134 4.1.4 Dal Cultural Heritage all’Industrial Design Knowledgebase 137 4.2 Ipotesi per una soluzione 140 5. Il progetto DesignNet 151 Paolo Ciuccarelli, Perla Innocenti 5.1 Bisogni e obiettivi 151 5.2 Analisi e progettazione del sistema 154 5.2.1 Un Quality-Controlled Subject Gateway per il design 156 5.2.2 Schemi di metadati: Dublin Core e OAI 157 5.2.3 Indicizzazione e Information Retrieval: il Design Thesaurus 5.2.4 Authority file: la Design Directory 171 5.2.5 Modalità di lavoro collaborativo 172 5.2.6 Management e visualizzazione di risorse eterogenee 176 5.2.7 Un Learning Resource Centre per il design 181 5.2.8 Risultati e problemi incontrati 183 5.3 Implementazione del prototipo 185 5.3.1 Architettura di sistema e componenti 185 5.3.2 Catalogazione con Dublin Core 187 5.3.3 Design Thesaurus 189 165 60 5.3.4 Graphic User Interface (GUI) 193 5.3.5 Design Directory 197 5.3.6 Risultati e problemi incontrati 197 5.4 Implementazione della versione 1.0 delle applicazioni 5.4.1 Architettura di sistema e componenti 200 5.4.2 Design Thesaurus 200 5.4.3 Catalogazione con Dublin Core 208 5.4.4 Primi risultati e problemi incontrati 209 5.5 Start-up di un Design Knowledge Centre 211 5.5.1 Processi 214 5.5.2 Risultati e problemi incontrati 217 6. Conclusioni e prospettive Paolo Ciuccarelli, Perla Innocenti 7. Appendici Perla Innocenti 200 223 229 7.1 DCMES Qualified Schema per il progetto DesignNet 229 7.1.1 Schema per il prototipo del sistema 229 7.1.2 Schema per la versione 1.0 del sistema 232 7.2 Crosswalk Dublin Core - IPTC 234 7.3 Qualified DCMES + XML 235 7.4 Design Thesaurus 236 7.5 Schemi di classificazione per i laboratori partecipanti al progetto 7.5.1 Laboratorio di Merceologia e Analisi Settoriale 237 7.5.2 Laboratorio Materiali e Design 240 7.5.3 Laboratorio Sistemi e componenti per l’edilizia 242 7.5.4 Osservatorio Progetto Bambino 245 7.5 Standard adottati 246 237 1 Documenti del design, documenti per il design Paolo Ciuccarelli L’esplorazione del mondo, anche quando è compiuta con mezzi razionali (di razionalità strumentale), nasce da un processo di costruzione dell’identità che ingloba materiali casuali, singolari, non giustificati razionalmente e spesso non giustificabili, perché rimasti nell’ombra Enzo Rullani Il titolo di questo primo capitolo riassume le due anime del programma di ricerca avviato nel 2001 1 con l’etichetta DesignNet, e del quale vengono descritti in questo testo i principali risultati. Un programma che nasceva dall’esigenza di mettere a disposizione di studenti e docenti della Facoltà del Design del Politecnico di Milano informazioni e documenti 2 per alimentare la didattica progettuale, e affrontava dunque il problema dei documenti per il design insieme a quello – più comune – della raccolta, descrizione e trasmissione dei documenti del design. Quella esigenza è stata declinata in tre obiettivi principali: - sviluppare strumenti e metodi per gestire e restituire la complessità del materiale informativo e documentale potenzialmente utile al processo progettuale 3, compresi i documenti e le informazioni prodotti Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica |9 nello svolgimento dello stesso processo progettuale, in particolare all’interno della didattica; - ri-metterlo a disposizione degli studenti-progettisti – più in generale degli operatori del mondo del design 4 – in forma organizzata, per un accesso integrato e personalizzabile (flessibile); - raccogliere la nuova conoscenza generata dall’utilizzo (esperienza) delle informazioni e dei documenti, integrando e amplificando così, attraverso un nuovo livello (layer), il patrimonio originale. Questi obiettivi – che sottolineano la scelta della centralità dell’utente, o meglio delle sue azioni (dal designer-soggetto al design-processo) fin dalle fasi di impostazione del progetto – nascono da una contaminazione: dall’incontro tra il già citato bisogno della Facoltà del Design di fornire supporto informativo all’attività progettuale degli studenti e le ricerche già attive in seno al dipartimento INDACO 5, sempre al Politecnico di Milano, intorno ai temi del ‘designer lavoratore della conoscenza’ 6. A posteriori, possiamo dire che gli elementi fondativi e i principi guida del progetto DesignNet sono proprio il frutto della integrazione virtuosa tra due filoni di ricerca: quello che andava declinando sul campo del design i temi più generali della società e dell’economia della conoscenza da una parte, e, dall’altra, quello sui metodi, gli standard e gli strumenti per la gestione e la catalogazione delle informazioni e dei documenti nei processi creativi. Il secondo filone, avviato con il progetto DesignNet, è diventato l’occasione per dare concretezza ed esiti strumentali alle ricerche più teoriche sulla relazione tra design, informazione e conoscenza. Non poteva mancare in questo percorso una ricognizione accurata su quanto già disponibile in termini di risorse informative e documentali per il design. Un background importante, collante nella integrazione dei due filoni di ricerca, costruito, coerentemente con gli obiettivi e le ipotesi del programma di ricerca, con un’attenzione particolare alle risorse disponibili in rete, via Internet, come documentato nel terzo capitolo. In questo libro sono descritte le scelte operate per cogliere gli obiettivi dichiarati, in particolare rispetto alle metodologie e agli strumenti per la catalogazione, indicizzazione, organizzazione dei documenti per il design. Si documenta la creazione di una metodologia – nuova e diversa da quelle relative ad altri ambiti disciplinari, didattici e di prassi professionale – fondata proprio sulle specificità del design e del suo essere, ancor più di altre e con caratteri specifici molto forti, attività knowledge intensive 7. Una metodologia che ha una prospettiva di servizio, di gestione dei documenti finalizzata al loro utilizzo, e che ha portato il progetto DesignNet a seguire più le linee di sviluppo e innovazione tracciate dalla biblioteconomia che quelle della conservazione e dell’archivistica, e, ancora di più, quelle proprie della gestione della conoscenza (Fig. 1) 8. 10 | 1.1 Dall’informazione alla conoscenza per il design Cosa significa organizzare i documenti per il design? Per capirlo è stato necessario riprendere in mano ed approfondire le riflessioni già fatte, all’interno del dipartimento ma non solo, sul modo in cui il designer, studente o professionista, lavora in termini di flussi di informazioni e conoscenza. Stante la difficoltà di individuare un metodo/modello generale del processo progettuale, soprattutto per le fasi iniziali (creative), da prendere come riferimento, l’unico procedimento possibile era quello di cogliere i tratti salienti, i caratteri peculiari della relazione tra design, informazione e conoscenza, e quindi tra il design e i documenti. Tra questi caratteri, uno dei più evidenti è che il designer si trova spesso nella situazione di reset informativo, a dover cioè ricominciare (quasi) da zero rispetto al proprio bagaglio di conoscenze, essendo chiamato ad affrontare progetti in ambiti assai diversi tra loro 9. Proprio per rispondere all’esigenza di acquisire rapidamente un quadro informativo sul sistema industriale e sul settore nell’ambito del quale si è chiamati a sviluppare il progetto, era stato avviato nel 1998 il laboratorio di Merceologia e conservazione biblioteconomia Knowledge Management archivistica [Fig. 1] Ambiti disciplinari interconessi nel progetto DesignNet (P. Ciuccarelli) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 11 Analisi Settoriale, sempre in un’ottica di supporto all’attività didattica nei corsi della Facoltà del Design. Ma la questione dell’azzeramento riguarda soprattutto la sfera tecnico-operativa, spesso quantitativa, delle informazioni, e non è l’unico bisogno espresso dal progettista: accanto alla necessità di aggiornamento verticale su tematiche specifiche, che trova invero molte risposte già disponibili, il designer ha l’esigenza peculiare di alimentare il livello più alto della conoscenza 10, fondato su elementi più qualitativi e sulla capacità di mettere in relazione, attraverso quegli elementi, dati, informazioni e documenti eterogenei. Un’esigenza alla quale gli strumenti e i metodi di gestione dei documenti e delle informazioni, sviluppati spesso per specifiche tipologie di documenti o per obiettivi di informazione specialistici, non danno risposte soddisfacenti: avevamo l’impressione che proprio in questo ambito si dovesse e si potesse fare di più, fare un passo in avanti nella direzione di dare al design strumenti e metodi più coerenti con il proprio modo di operare sul terreno dell’informazione e, soprattutto, della conoscenza. La necessità di affrontare insieme il livello dell’informazione e della conoscenza è ancora più evidente se si considera la fase di generazione del concept. Se infatti è vero che in questa fase il designer può aver bisogno di trovare e utilizzare informazioni tecniche molto specializzate, o che può basarsi, ad esempio, sulle caratteristiche tecniche di un materiale, più spesso però, soprattutto in assenza di brief focalizzati e richieste specifiche, il designer lavora digerendo quelle informazioni attraverso gli ‘stimoli culturali’ 11 di cui va continuamente nutrendosi e che funzionano proprio come ‘enzimi’. Stimoli che possono essere trovati ovunque 12, in qualsiasi tipo di documento o anche in frammenti, spesso superficiali e visivi – sensoriali e percettivi – di documenti 13; o, ancora di più, nella connessione, ibridazione, integrazione, quasi mai logica e lineare, di un certo numero di documenti o frammenti di essi. Stimoli che vengono più dall’osservazione fisica del reale, dall’esperienza, e meno dall’applicazione di regole astratte 14. Una conferma di questo modo di procedere può venire dall’osservazione di come a volte il designer – non richiesto – tenda a rielaborare deliberatamente il brief, riportando il discorso progettuale dalla sfera del problem solving a quella del problem setting o re-setting, spostando la questione informativa dal cercare il documento o l’informazione che risolva quel problema all’esplorazione del mondo che può dargli senso: il designer predilige i processi di sense-making. L’idea che il processo di generazione del concept, processo creativo, sia interpre tabile come ricombinazione di elementi che di solito sono separati, come un «mettere vecchie cose in nuove combinazioni e nuove cose in vecchie combinazioni» 15 non è certo nuova; manca però una traduzione sul piano strumentale di questa visione, e mancano strumenti in grado di abilitare e 12 | sostenere quei comportamenti connettivi, esplorativi e conoscitivi, attinenti più al contesto che al testo, che ribadiscono l’azione culturale oltre che tecnica del design. Il rapporto del designer con le informazioni e i documenti non poteva dunque essere affrontato solo sul piano delle informazioni, dei documenti ‘ufficiali’, delle conoscenza codificate: bisognava necessariamente porsi il problema della gestione di quei frammenti documentali, quelle eccedenze cognitive 16 che il progettista riorganizza creativamente in forma nuova integrandoli alle informazioni e ai documenti più tecnici e verticali, generando innovazione (nuova conoscenza) non inventando ma, appunto, ricombinando. Un processo che va sostenuto fornendo strumenti e metodi per la ricombinazione, per la costruzione di relazioni significative tra i frammenti qualitativi, i documenti, le informazioni, e per argomentare quelle relazioni (Fig. 2). [Fig. 2] Relazioni multiple tra documenti nell’ambito del design (P. Ciuccarelli) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 13 1.2 L’interfaccia tra il designer e la conoscenza Abbiamo visto fin qui come il programma di ricerca DesignNet sia basato in gran parte su una ipotesi: per supportare l’azione conoscitiva, fondativa di qualsiasi processo progettuale, non è importante tanto l’informazione o il documento in sé quanto il modo in cui quelle informazioni e quei documenti stanno, o possono stare insieme, e il perché di quello stare e poter stare insieme. A questo prima ipotesi progettuale se n’è aggiunta nel tempo un’altra, diventata oggi altrettanto rilevante: l’importanza del modo in cui i documenti vengono messi a disposizione, del cosa viene rappresentato di un documento, e del come vengono rappresentate le relazioni esistenti tra documenti diversi. L’attività di ricerca e sviluppo è stata dunque allargata, per cogliere l’obiettivo di definire le caratteristiche che devono avere le interfacce mediatrici del rapporto tra design, informazione e conoscenza. A queste problematiche, il progetto DesignNet non ha ancora fornito risposte esaustive: siamo ancora nella fase di analisi del problema e di definizione delle principali linee guida. Il più consistente tra i filoni di ricerca attivati in questo ambito si basa sull’ipotesi che nelle fasi preliminari della ricerca per il progetto spesso i risultati più interessanti emergano esplorando (exploration vs. exploitation) la realtà o le risorse informative e documentali, o anche con le modalità tipiche della serendipity: trovo qualcosa di interessante mentre cercavo qualcos’altro, o più in generale, ‘stimoli culturali’ utili possono emergere in momenti e situazione in cui non si sta cercando nulla, non c’è intenzione di ricerca, anche perché nel processo creativo è lecito anche non sapere cosa si sta cercando, mentre è più facilmente noto, ad esempio, il contesto o il motivo della ricerca. Pensando alle interfacce, dare supporto all’esplorazione conoscitiva, non negare l’accesso, nascondendole, alle eccedenze cognitive, può significare – è l’ipotesi alla quale stiamo lavorando – sostituire alla gerarchia dei risultati di una ricerca à-la Google un territorio di stimoli, in cui sono possibili molti e diversi percorsi, e all’interno del quale diventa possibile – paradossalmente – anche una specie di smarrimento programmato. Si potrebbe in questo modo coltivare quell’ozio creativo, quella improduttività solo apparente in cui a volte si possono trovare i semi delle idee più interessanti. Alle esigenze del designer – del design, meglio – rispetto alla gestione e alla fruizione di giacimenti/patrimoni documentali si sono intrecciate, avanzando il programma di ricerca, quelle di chi istituzionalmente si deve occupare di gestire i documenti del design tradizionalmente intesi. Documenti ai quali da qualche tempo, poco, è stata riconosciuta la dignità di ‘beni culturali’ 17. Il focus del progetto e della ricerca si è allargato, a considerare la gestione dei documenti prodotti durante il processo progettuale o che ne rappresentano l’output diretto (documenti di progetto) e indiretto (prodotti industriali). 14 | Coerentemente con quanto detto finora è ovvio che anche in questo allargamento l’obiettivo non può essere solo quello della descrizione e della conservazione del patrimonio – che pure deve essere garantita: la prospettiva dovrà essere ancora quella di gestirli per farne patrimonio riutilizzabile (documenti del design per il design), conoscenza già ‘masticata’ da mettere a scaffale per essere più facilmente (ri)manipolata, ricombinata per produrre ancora nuovi progetti e quindi nuova conoscenza. Garantire questa possibilità, nel caso specifico del design, significa rispettare alcune condizioni di fondo. La prima è sicuramente la serialità del design, il fatto che il design presuppone sempre non un documento ma, appunto una serie di documenti – i prodotti industriali – che hanno uguali caratteristiche per definizione, hanno la stessa origine, la stessa matrice, ma destini diversi: se è vero che da una parte c’è una standardizzazione necessaria, normata, del singolo prodotto che può semplificare la questione della descrizione, dall’altra c’è la estrema variabilità del contesto, delle storie legate a quel prodotto, che tutte insieme costruiscono il significato di quel documento. Un’altra condizione è la necessità di prescindere dalla tendenza, già storica nel caso dell’architettura, a creare archivi dei progetti. Il progetto è un filo conduttore tra gli altri, uno dei modi possibili per raccogliere e dare senso ad un insieme eterogeneo di documenti, ma non è certo l’unico, né può esserlo se si vuole preservare il valore conoscitivo del sistema che si costruisce. Se si vuole costruire un ‘archivio dei documenti del design’, forse può essere sufficiente; un ‘sistema conoscitivo per il design’ dovrà viceversa considerare il progetto come documento tra gli altri, subordinato all’esperienza sociale e culturale legata a quel particolare esemplare del prodotto industriale in questione. Concludo questo capitolo, introduttivo, sottolineando come in realtà non esistano, in origine, i documenti per il design: esistono i documenti delle discipline codificate, esistono frammenti di documenti mai catalogati, esistono, certo, i documenti del design – i progetti, le foto, i carteggi, gli oggetti – che possono diventare materiale di nuovo utile per il design, e quindi documenti per il design oltre che del design, se messi in relazione in modo significativo, per essere fruiti in modo integrato. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 15 Note [1] L’ avvio ‘ufficiale’ del progetto è sancito dal seminario internazionale organizzato per sancire la necessità di un percorso di ricerca che indagasse la relazione tra design, informazione e conoscenza con obiettivi strumentali. Il seminario, dal titolo DesignNet. Knowledge e Information Management per il design si è tenuto presso la Facoltà del Design l’8 febbraio del 2002 (cfr. http://www.designnet.polimi.it/Seminario/ presentazione.htm e DesignNet. Knowledge e Information Management per il design. Atti del seminario internazionale, Milano 8 febbraio 2002, Politecnico di Milano, a cura di P. Ciuccarelli e P. Innocenti, prefazione di G. Simonelli, Edizioni POLI.design, Milano 2002). Il gruppo di ricerca nel Politecnico di Milano che sta portando avanti il progetto DesignNet è oggi composto da: Paolo Ciuccarelli, Luca Cosmai, Perla Innocenti, Federico Vidari. Mida Boghetich ha partecipato fino al 2005 alla progettazione e allo sviluppo del codice delle applicazioni DesignNet. Allo sviluppo partecipa dal 2004 Daniele Galiffa, tutt’ora attivo soprattutto nella costruzione dell’interfaccia di consultazione Design Gateway. [2] Nel programma DesignNet l’accezione del termine documento è la più ampia possibile, così come indicata nel paragrafo 2.1 di questo volume. [3] Complessità del materiale informativo e documentale che è data dalla eterogeneità 16 | - per formato, tipologia, modalità di descrizione ecc. - dello stesso e dal potenziale (grande) numero di relazioni esistenti tra i documenti [4] C’è implicita in questo obiettivo l’ipotesi che, dal punto di vista dell’architettura dei flussi di utilizzo e produzione di informazioni e conoscenza, i processi progettuali condotti per scopi didattici all’interno dei laboratori e quelli dei professionisti del design siano assimilabili. Un’ipotesi avvalorata dalla scelta della Facoltà del Design di coinvolgere in modo diretto i professionisti nella didattica, con un apporto che sarà presumibilmente un trasferimento di esperienza progettuale. [5] La sigla INDACO sta per Industrial Design Arti, Comunicazione e Moda. [6] Quello indicato è il titolo di un saggio scritto da Paola Bertola, ricercatore del dipartimento INDACO, e contenuto in Didattica &Design. Processi e prodotti formativi nell’università che cambia, a cura di A. Penati e A. Seassaro, Edizioni POLI.Design, Milano, 2000. Altri lavori dello stesso autore sullo stesso tema: Design as a Knowledge Agent. How design as a knowledge process is embedded into organizations to foster innovation, atti del convegno ADC2001, 5th Asian Design Conference, Seoul, Korea, Settembre 2001, e Embedding meaning in products, Proceedings of The International Conference on Affective Human Factors Design, Asean Academic Press, London, 2001. Cfr. Inoltre P. Bertola, L. Collina, P. Ciuccarelli, P. Innocenti, Design networks and knowledge management for supporting small and medium enterprises. Cases from Italy, in Techné: design wisdom. Proceedings of the 5th European Academy of Design Conference, Barcelona, 28-30 April 2003 <http://www.ub.edu/5ead/PDF/13/Bertola. pdf> [7] Si discute molto oggi sul fatto che in realtà quasi tutte le professioni contemporanee siano, ad un certo livello, knowledge intensive. Sicuramente il design lo è, con la ulteriore specifica derivante dal fatto che gran parte della conoscenza circolante è conoscenza tacita, non codificata. Si potrebbe quindi meglio definire il design come attività knowledge intensive. [8] Testimonianza di questo orientamento sono alcuni dei primi testi scritti nelle fasi di avvio del programma DesignNet: P. Ciuccarelli, Strumenti per il progetto tra formazione e gestione della conoscenza: ipotesi per un portale del design, in Didattica &Design. Processi e prodotti formativi nell’università che cambia, a cura di A. Penati e A. Seassaro, Edizioni POLI.Design, Milano 2000, pp. 236-262; DesignNet. Knowledge e Information Management per il design. Atti del seminario internazionale, cit. [9] Per gli architetti si diceva ‘dal cucchiaio alla città’. Nel caso del design da una parte è vero che oggi, almeno guardando ai percorsi formativi, la situazione è cambiata, i rispettivi ambiti di pertinenza sono stati distinti, l’architettura e il design hanno trovato - come dimostra anche l’organizzazione didattica del Politecnico di Milano le loro strade. Ulteriori e forti distinzioni e quindi riduzioni di campo - sono state Ciuccarelli, Innocenti | operate anche nella Facoltà del Design, e hanno portato a definire Corsi di Laurea distinti per il progetto della comunicazione, della moda, degli interni ecc. Ed è anche vero che una porzione di informazioni e conoscenza - quella più tecnica, trasversale, o di metodo - acquisita nei progetti precedenti può essere accumulata e riutilizzata. Rimane però anche vero che all’interno dei diversi ambiti di progetto, settori merceologici, nelle macro aree del prodotto, della comunicazione, degli interni rimane comunque una grande varietà, soprattutto se si considerano gli scenari culturali e sociali da controllare, e le ibridazioni tra queste aree sono ancora molto frequenti. [ 10 ] Per questo motivo, tra gli altri, definiamo DesignNet un ‘sistema conoscitivo’, come recita anche il titolo di questo libro, e non solo un archivio o un ‘sistema informativo’. [ 11 ] Traduzione non letterale di cultural seeds, espressione utilizzata nella presentazione del programma DesignNet, in occasione dell’incontro di lavoro Iniziative e progetti digitali del Politecnico, Politecnico di Milano, 1 ottobre 2004. La presentazione è visibile sul sito <http://www.biblio.polimi.it/progetti/ incontro_bibdig> [ 12 ] Non conosco l’esistenza di studi scientifici sull’argomento, ma sembra incredibile l’ipotesi che molti designer soffrano della sindrome del collezionismo, della raccolta di frammenti documentali che ‘potrebbero essere utili’ - se (ri)contestualizzati o (ri)combinati con altre risorse documentali Sistemi conoscitivi per il design: una proposta metodologica | 17 - per generare nuove soluzioni. Si pensi all’armadietto nello studio Castiglioni, all’interno del quale si trovano oggetti e componenti della cui raccolta è difficile immaginare la ragione (sarebbe anche difficile dare un nome a quell’armadietto: archivio? di cosa?). Solo osservando gli oggetti progettati dal designer - creando quindi la connessione tra quell’oggetto, quel frammento, e il prodotto industriale si può capirne (forse) il senso, capire cosa ha generato quel seme. poco o perché non abbiamo il tempo e la voglia di scegliere tra i milioni di stimoli e di informazioni che ci bombardano. È vero, le eccedenze cognitive appaiono un ingombro senza valore in un quadro di scelte e di comportamenti dominato dalla razionalità strumentale. Ma sono invece il sale della ragione riflessiva. Per rendere solido - riflessivamente solido - il terreno in cui si vuole agire, serve, infatti, un lavoro di esplorazione della complessità che non produce vantaggi immediati ma può cambiare la posta in gioco» (pp. 395 ssg.). [ 13 ] Sempre per restare nel campo dei materiali, si parla qui, ad esempio, delle caratteristiche estetico-sensoriali contrapposte a quelle tecnico-funzionali. [ 14 ] Insieme alla sindrome del collezionismo, c’è un altro atteggiamento che sembra tipico del designer, anche questo (ancora) non verificato scientificamente: l’uso della macchina fotografica digitale come bloccoappunti visuale (visual notebook) da portare sempre con sé. [ 15 ] K. Weick, The Social Psycology of Organizations, Random House, London 1969, citato da E. Rullani, Economia della conoscenza. Creatività e valore nel capitalismo delle reti, Carocci, Firenze 2004, p.p. 400. [ 16 ] «Le eccedenze cognitive - dice Rullani non sono soltanto il sovrabbondante prodotto - senza costo e senza valore - che risulta dalle capacità moltiplicative della propagazione cognitiva. Non sono un ‘di più’, un superfluo di cui potremmo fare a meno, me che tolleriamo perché costano 18 | [ 17 ] Il 22 aprile 2004, con Decreto del Ministero per i Beni e le Attività Culturali - Soprintendenza Regionale per la Lombardia, la Collezione Storica Premio Compasso d’Oro ADI è diventata la prima collezione di Design riconosciuta ‘patrimonio di eccezionale interesse artistico e storico’. Il decreto recita: (Omissis) «La serie di 651 oggetti di design costituenti la Collezione Storica Compasso d’Oro ADI (1954-2001) individuata nelle premesse è dichiarata di eccezionale interesse artistico e storico ai sensi degli artt 2, 1° co., lett. C, e 6, 2° co., del D.L. 490/99 e, come tale, è sottoposta a tutte le disposizioni di tutela contenute nel citato Decreto Legislativo». 2 Evoluzione dei documenti e della biblioteca nell’era digitale Perla Innocenti This is not the Library, the Library is within Iscrizione nella Yale University Library Nel corso della loro storia le biblioteche 1 non sono certamente rimaste estranee ai cambiamenti: nuove tecnologie e nuovi tipi di utenti hanno richiesto nel tempo un ripensamento dei metodi e degli strumenti. La differenza, oggi, è nella scala e nella rapidità dei cambiamenti, nel passaggio dalle raccolte e dai cataloghi alle persone e ai processi di tipo proattivo (Fig. 1) (cioè verso le attività necessarie alla trasformazione delle risorse disponibili in elementi di servizio), e nel rapporto con il sistema aperto della biblioteca 2. Questi processi – basati su nuove forme di cooperazione, collaborazione, elaborazione e scambio delle conoscenze – sono sostenuti dall’uso delle nuove tecnologie digitali, che permettono possibilità senza precedenti: la multimedialità (con l’ingresso del digitale negli anni ‘70), la connettività (con la commutazione di pacchetto) e la mobilità (con l’avvento del wireless). Tuttavia, come ricorda Giovanni Di Domenico, «il problema rimane quello di elaborare e trasmettere le conoscenze necessarie alla organizzazione di realtà, strategie e attività di servizio non attorno ai documenti, neanche attorno alle tecnologie, ma attorno ai bisogni diversificati di apprendimento, di infor- Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 19 mazione e di conoscenza degli uomini (degli individui, come dei gruppi e delle comunità). Il controllo dell’universo documentario, l’offerta informativa, le pratiche e gli strumenti della mediazione sono funzionali al soddisfacimento di questi bisogni» 3. 2.1 L’universo biblioteche oggi: tendenze in atto Gli elementi distintivi dell’attuale Knowledge Society (che identifica la conoscenza come fattore produttivo dominante), altrimenti detta Learning Society (la società dell’apprendimento permanente), sono sostanzialmente due: da un lato, la profonda metamorfosi e riarticolazione del tradizionale sistema della produzione, circolazione e fruizione del sapere; dall’altro, una crescita vertiginosa della produzione documentaria sia in formato analogico che, soprattutto, digitale. Nell’era digitale, al di là delle nuove metafore coniate in questi anni (biblioteca elettronica, digitale, virtuale e, più recentemente, ibrida e diffusa 4), non sono le funzioni della biblioteca in senso lato ad essere mutate, quanto piuttosto le modalità di gestione, l’organizzazione spaziale e i servizi (Fig. 2), grazie all’utilizzo di nuove tecnologie di fruizione per nuove tipologie di documenti e di informazioni (Fig. 3). Non più soltanto la semplice ‘forma libro’, ma documenti digitali per loro natura instabili e complessi, da poter scambiare e manipolare. Utilizzo il termine ‘documenti digitali’ in luogo di ‘risorse elettroniche’ perché mi sembra cogliere in modo più accurato gli aspetti essenziali del problema. Catena dei processi di una biblioteca processi di realizzazione START: Esplicitazione della mission e della politica di offerta A Analisi dei bisogni informativi e culturali degli utenti K Logistica/ Gestione spazi e attrezzature B Progettazione dell’offerta culturale L Gestione del sistema informativo C Gestione del patrimonio e delle risorse informative M D E Promozione dell’offerta di servizi ed eventi Gestione di servizi agli utenti N Amministrazione Gestione e controllo della di gestione Sicurezza F Gestione di servizi integrati con altri Soggetti P Gestione/ sviluppo Risorse Umane G Verifica di efficacia dell’offerta Q Gestione del Sistema per la Qualità processi di supporto [Fig. 1] L’insieme dei processi di realizzazione e supporto attivi in una biblioteca (da Regione Lombardia, IREF, Le professionalità operanti nel settore dei Servizi culturali, 2001) 20 | Dal punto di vista concettuale, come ha evidenziato anche Riccardo Ridi, «il termine ‘risorsa’ viene considerato troppo generico per indicare documenti analogici e lo si abbina, in tal caso, ad aggettivi come ‘informativa’ o ‘documentaria’, mentre in ambito digitale (e soprattutto di rete) ‘risorsa’ e ‘documento’ vengono sostanzialmente utilizzati come sinonimi» 5. Dal punto di vista tecnico, inoltre, l’informazione digitale può essere in principio rappresenta in forma non elettronica, per esempio utilizzando tecniche ottiche o quantiche, laddove l’informazione elettronica può non essere necessariamente digitale. E come ha recentemente rilevato anche Barbara Tillett «il termine ‘risorse elettroniche’ è artificioso – quando vado a incontri sulle biblioteche digitali, ‘elettronico’ ha il significato di piccoli accessori, quali asciugacapelli o forni a microonde» 6. A questo proposito risultano interessanti le definizioni dei supporti ottici riportate nella Deliberazione n. 42/2001 dell’Autorità per l’Informatica nella Pubblica Amministrazione (AIPA). Con una valutazione più agile del mondo in continua evoluzione dei supporti ottici, la deliberazione propone un’inedita classificazione del documento, distinto in analogico e digitale, facendo rientrare il documento informatico, conforme al DPR 445/2000, nel più ampio concetto di documento digitale 7. Con i supporti analogici, ad esempio cartacei o audiovisuali, vi è una ‘analogia’ tra il processo e la forma: anche senza un’attrezzatura specifica di playback si può sostanzialmente simulare l’esperienza del supporto, mentre con il digitale è necessario un dispositivo specifico che esegua delle operazioni logiche e di calcolo con quantità rappresentate dai digiti, generalmente in un sistema binario. L’avvento dei documenti multimediali digitali ha reso questo panorama ancora più variegato e complesso 8. Modernizzazione (biblioteca elettronica) Innovazione (biblioteca virtuale e digitale) Trasformazione (learning resource center) [Fig. 2] Evoluzione delle biblioteche (P. Innocenti) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 21 A differenza di un passato in cui i documenti delle biblioteche erano eminentemente di carattere alfanumerico e cartaceo, oggi dunque i contenuti e i supporti materiali dei documenti sono incredibilmente eterogenei e diversificati, così come le tecniche e tecnologie necessarie per la loro produzione, distribuzione, conservazione, organizzazione e fruizione. La raccolta di una biblioteca odierna può consistere di una o più di queste tipologie: documenti analogici posseduti dalla biblioteca e aventi una precisa localizzazione fisica; documenti digitali posseduti dalla biblioteca e disponibili per l’uso locale; documenti analogici posseduti da altre biblioteche ma disponibili attraverso sistemi interbibliotecari di condivisione delle collezioni e cataloghi collettivi; documenti digitali ad accesso riservato, che la biblioteca non possiede ma cui fornisce accesso tramite contratti a pagamento. Prima dell’avvento del Web, la biblioteca tradizionale imponeva la fruizione on-site di documenti analogici di una collezione just-in-case. L’ambiente informativo era relativamente stabile e costituito per la maggior parte da materiali a stampa; le dimensioni delle collezioni erano un indicatore della qualità della biblioteca, che poteva così soddisfare in modo adeguato i bisogni informativi dei suoi utenti; gli acquisti erano predittivi. Il contenuto era mantenuto attraverso la conservazione dell’oggetto fisico, costituito da materiali organici, e la conservazione era distinta dalle questioni relative all’accesso, costituito da una serie di strumenti correlati ma non integrati. Gli utenti si recavano in una biblioteca per accedere e utilizzare specifiche informazioni e, per via delle limitazioni spazio-temporali delle tecniche utilizzate per la descrizione di documenti analogici (catalogo cartaceo per autore e per soggetto), analogico analogico (documenti cartacei, fotografici e audiovisivi, registrazioni sonore, nastri magnetici) analogico (documenti digitalizzati) analogico analogico (documenti digitali nativi) analogico [Fig. 3] Evoluzione delle modalità di trasmissione e fruizione dei documenti (P. Innocenti) 22 | era dato per scontato che l’utente avesse già abbastanza informazioni in anticipo, prima di andare in biblioteca, e che sapesse già cosa cercare. Nel nuovo ambiente digitale si presenta un diverso panorama: la biblioteca digitale va a completare ed integrare la biblioteca tradizionale, con una fruizione just-in-time delle risorse digitali native o digitalizzate, una nuova concezione dei cataloghi e degli accessi e l’utilizzo di tecnologie digitali. Le procedure interne sono state automatizzate per una gestione integrata del ‘circuito del documento’ e il catalogo 9 costituisce una base di dati unica e non sequenziale, indicizzato per autore, per soggetto, per classe, ma recuperabile da qualsiasi elemento e con varie modalità. E, aspetto determinante, è possibile accedere in remoto non più soltanto all’informazione sul documento, ma al documento stesso (digitale o digitalizzato), disponibile contemporaneamente a più persone grazie ad una sempre maggiore convergenza documentale, tecnologica, professionale 10. Le novità, nello scenario sopra delineato, sono l’indipendenza dall’ubicazione e la centralità dell’utente 11, in particolare in ambito universitario, dove le biblioteche sono il principale centro servizi. In questo contesto possono risultare preziose le teorie del Knowledge Management, che riguarda propriamente l’acquisizione, la creazione e il packaging (o l’applicazione o il riuso) della conoscenza servendosi dei vantaggi offerti dalle Information Communication Technologies e dalle sue estensioni Web-enabled: capacità di creazione, elaborazione, immagazzinamento e scambio in breve tempo di grandi quantità di informazioni in tutte le loro forme, nuovo tipo di interazione e di disponibilità dell’informazione tramite teletrasferibilità a distanza, supporto di quasi ogni tipo di informazione visuale, tramite i processi di vettorializzazione e/o discretizzazione che permettono di rendere l’informazione richiamabile non solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in base a caratteristiche visuali. Quando Jorge Louis Borges ne La biblioteca di Babele ipotizzò un sapere indefinito, ma infinitamente grande e infinitamente connesso, decretandone il senso nel contempo assoluto e surreale, per la prima volta ipotizzò, inconsapevolmente, ciò che la rivoluzione dell’era informatica dell’Internet Visual Computing avrebbe reso reale. 2.2 Le biblioteche universitarie dall’automazione alla trasformazione: il contesto internazionale Peter Lyman ha evidenziato un processo a tre fasi degli effetti delle Information Communication Technology (ICT) sulle biblioteche 12: 1. modernizzazione (fare ciò che si sta già facendo, ma in modo più efficiente servendosi dell’automazione per la gestione di collezioni di documenti, soprattutto cartacei); Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 23 2. innovazione (sperimentare le nuove possibilità offerte dalle ICT); 3. trasformazione (modificare la natura dell’organizzazione attraverso le ICT). Questo schema è utile per capire cosa le dinamiche in atto negli ultimi anni nelle biblioteche universitarie, come parti di un contesto più ampio che include il mercato dell’editoria e dell’informazione, le nuove modalità di comunicazione del mondo accademico, e l’evoluzione in atto nella comunità degli utenti. Le ICT hanno profondamente modificato tutti gli aspetti della didattica universitaria e post-universitaria, e queste trasformazioni sono tuttora in corso 13. Nella fase di modernizzazione, attraverso l’automazione, a partire dal mondo anglossassone le biblioteche universitarie hanno utilizzato un’ampia gamma di tecnologie dell’informazione per la gestione di collezione di documenti primariamente cartacei. Un primo periodo ha dato origine alla catalogazione partecipata e all’automazione dei processi amministrativi, favorendo l’efficienza e il controllo dei costi. Questi sistemi hanno costituito un importante precedente nell’utilizzo dei computer e dei sistemi di rete per la collaborazione e cooperazione interbibliotecaria. I consorzi bibliotecari americani degli anni ‘60 e ‘70, oggi consolidati in due principali sistemi di catalogazione partecipata – Online Computer Library Centre e Research Libraries Information Network – sono stati i pionieri della catalogazione condivisa. In un secondo momento della fase di modernizzazione vi è stata l’ascesa dell’accesso pubblico. A partire dagli anni ‘80, i database di catalogazione partecipata sono diventati sufficientemente consistenti dopo operazioni di catalogazione retrospettiva e di utilizzo per le nuove acquisizioni, e si è diffuso un formato di record di catalogo leggibile al calcolatore, il MARC. Parallelamente, come previsto dalla legge di Moore, i costi delle tecnologie dell’informazione (in particolare dei sistemi interattivi) sono scesi e le potenze computazionali sono aumentate, rendendo possibile l’utilizzo su più larga scala di applicazioni informatiche. Questa nuova fase ha determinato dei drastici cambiamenti nei servizi visibili agli utenti: il primo risultato è stato quello dell’OPAC (Online Public Access Catalog), di cui il MELVYL della University of Berkeley, California è il più importante esempio. L’OPAC andava a sostituire il più tradizionale catalogo cartaceo, permettendo operazioni prima impensabili: possibilità di ricerche multiple con accesso su tutto il posseduto delle biblioteche di ricerca, tramite record bibliografici. Il diffondersi dei network e dei consorzi universitari hanno stimolato la condivisione delle risorse informative, dando luogo a collezioni virtualmente condivise. Con gli sviluppi di Internet, i cataloghi delle biblioteche hanno cominciato ad essere in rete, permettendo così l’accesso remoto. Tuttavia, il livello di granularità 24 | offerto dai cataloghi era ancora irrilevante per molti utenti, in particolare per quelli delle discipline scientifiche, poiché non permetteva di ricercare i singoli articoli dei periodici ma soltanto le testate e le annate delle stesse. Servizi di abstract e di indicizzazione degli articoli dei periodici come l’Index Medicus (l’attuale MEDLINE) cominciarono a dar vita a database specializzati, alcuni dei quali disponibili commercialmente anche online, molto costosi e progettati per essere utilizzati da utenti esperti. La possibilità di offrire ricerche su vasta scala a persone diverse dei ricercatori che lavoravano per l’industria era economicamente impensabile. Tra la fine degli anni ‘80 e gli inizi degli anni ‘90 questi database iniziarono però ad essere implementati per l’accesso pubblico interattivo, costituendo un impatto oggi forse non percepibile nell’ampliamento delle risorse disponibili per gli utenti e delle modalità di ricerca, sebbene i costi si siano mantenuti abbastanza elevati e le biblioteche non dispongano della proprietà dei database ma soltanto delle licenze d’uso. Il risultato di questo passaggio dei cataloghi della biblioteca alla dimensione del anytime, everywhere è stata la massiccia richiesta, da parte di un numero sempre maggiore di utenti, non più soltanto di servizi bibliografici online ma di contenuti disponibili sul Web. È importante rilevare anche il cambiamento della prospettiva: dai sistemi altamente ottimizzati ma chiusi, progettati per un utilizzo in loco su hardware speciale, a servizi online progettati per un utilizzo su computer di uso comune e basati su protocolli di rete standard utilizzati dall’industria. Lo stesso periodo ha visto notevoli investimenti nell’ambito delle risorse condivise: i grandi cataloghi nazionali come il nostro Servizio Bibliotecario Nazionale (SBN) e gli sviluppi del prestito interbibliotecario ne sono un esempio. Contestualmente sono emersi in modo sempre più critico le restrizioni e i problemi legati al copyright e al diritto d’autore, che costituiscono un limite significativo allo scambio regolare di risorse di qualità tra istituzioni. Così se la rete è diventata sempre più ubiqua con la crescente digitalizzazione delle risorse, è evidente che la condivisione delle stesse risorse è tecnicamente possibile ma giuridicamente complessa da attuare. Nell’ultimo periodo della modernizzazione, i cataloghi online hanno creato una forte richiesta di contenuti da poter accedere sul Web. Tra la fine degli anni ‘80 e l’inizio degli anni ‘90 il costo delle memoria e le tecnologie di visualizzazione con file bitmap di immagini o testi ASCII è notevolmente diminuito, e l’HTML ha offerto un’ulteriore alternativa a editori e società di database per offrire il proprio materiale alle biblioteche. La convenienza dei contenuti digitali era così impressionante che moltissimi utenti hanno cominciato ad ignorare il materiale disponibile solo su carta, anche se a volte più appropriato, e a considerare i motori di ricerca una fonte primaria di informazioni. A partire dalla fine degli anni ‘80-inizio anni 90, forzate a reagire all’impatto Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 25 culturale ed economico delle ICT, il focus delle biblioteche si è progressivamente spostato dall’automazione alla definizione del loro ruolo e dei servizi nell’era digitale, in cui sono stati determinanti la progressiva importanza del World Wide Web alla metà degli anni ‘90 e l’ascesa della computer science e del nuovo ruolo dei database in tutti i campi dell’istruzione. I progressi delle ICT e la rivoluzione del Web hanno funzionato da catalizzatori per le innovazioni e le trasformazioni nel mondo della comunicazione, della didattica e della ricerca universitaria. Nella ricerca, ad esempio, i ricercatori sono oggi in grado di lavorare continuamente a contatto con colleghi in tutto il mondo, su progetti di ricerca e sviluppo collaborativi. Nell’insegnamento in aula vi sono nuove modalità di didattica esperienziale, hands-on, spesso focalizzati sull’interazione Web-based, che possono avvenire sia nelle aule che nel cyberspazio. L’esperienza del campus non è più totalizzante ma diventa il crocevia di una serie di attività ed esperienze interdisciplinari spesso o in parte svolte al suo esterno, il che riflette l’atteggiamento dell’università stessa. I cambiamenti che avvengono nell’università devono essere rispecchiati da quelli nella sua infrastruttura informativa, che ha il suo cuore nella biblioteca universitaria. Tra il fiorire di sperimentazioni innovative e creative, è emersa l’idea di un ambiente informativo in rete che si presenta come una vasta costellazione di contenuti e servizi digitali online, accessibili in ogni momento da qualsiasi connessione remota, da poter essere utilizzate più volte, navigate, manipolate, integrate, personalizzate per gli obiettivi e le esigenze di ogni utente. L’identificazione delle risorse più appropriate ha posto il problema di chi dovesse farsi carico della responsabilità dell’organizzazione di network di risorse e le relazioni tra information provider e information user sono diventate più complesse, ma la condivisione di risorse a livello internazionale è risultata certamente facilitata. L’utilizzo del Web è diventato critico in molte forme di comunicazione universitaria: i pre-print e i report tecnici sono diventati ampliamente disponibili online e attorno ad essi si è sviluppato il movimento dell’Open Access; monografie e testi di consultazione sono confluiti in database e siti Web e in particolare nel mondo scientifico, dalla fisica alle scienze naturali, dalla biologia alla genetica, ma anche nell’ambito delle scienze sociali e in parte degli studi umanistici. All’inizio degli anni ‘90 in ambito anglosassone l’idea della biblioteca digitale è diventata molto popolare, in parte grazie ai programmi di finanziamento ARPA/NSF/NASA. I contenuti digitali hanno anche facilitato la creazione di e-reserves e hanno supportato i progetti di Online Distance Learning. Nel frattempo le aspettative degli utenti hanno registrato una nuova svolta: per26 | sonalizzazione della visualizzazione delle risorse informative, current awareness, sistemi di rating o selezione collaborativa sono stati sviluppati per gli utenti del Web. Questa impressionante mole di cambiamenti (nelle collezioni, nelle modalità d’accesso, negli spazi fisici e virtuali della biblioteca, nella conservazione, nelle attività), insieme alla coesistenza di nuovi supporti e dei processi ad essi legati con i documenti di tipo tradizionale, ha sollevato questioni metodologiche e strumentali: una così alta percentuale di contenuti si trova al di fuori del perimetro (fisico e concettuale) della biblioteca e dell’intero sistema editoriale tradizionale che non è chiaro quanta responsabilità possano o debbano assumersi le biblioteche in merito, e in che modo. Un aspetto rilevante di tale problematica è costituito dalla qualità dei documenti, che fa la differenza tra le collezioni e i servizi della biblioteca e l’enorme e caotico oceano informativo disponibile sul Web. Vi sono inoltre vari problemi di carattere economico, a fronte di budget sempre più ridotti. Il costo e l’ingombro delle pubblicazione scientifiche universitarie continua a crescere senza controllo, i documenti stampati tra la fine del XIX e l’inizio del XX secolo, prevalentemente su carta acida, continuano a disintegrarsi e richiederebbero investimenti in conservazione e/o digitalizzazione. Le spese per nuovi servizi vanno poi ad aggiungersi a quelli già esistenti: dalla descrizione dei documenti digitali multimediali alla loro archiviazione, dalla questione dell’autenticità, dell’integrità e della provenienza dei documenti (e quindi del copyright e dei diritti intellettuali e di sfruttamento) alla creazione di strumenti che ne permettano la manipolazione sul proprio desktop. La rivoluzione dell’informazione in rete è solo all’inizio, e probabilmente occorrerà ancora qualche decennio per perfezionare la tecnologia e raggiungere masse di contenuto sempre più consistenti 14. Le biblioteche universitarie oggi sono delle organizzazioni in cui i professionisti dell’informazione (bibliotecari e documentalisti) lavorano per garantire accessi mirati e selettivi agli artefatti informativi con valore aggiunto che fanno parte delle collezioni della biblioteca, così come a informazioni, risorse e sistemi disponibili altrove, nella logica dell’accesso anytime-anywhere 15. E non soltanto offrono servizi Web-based, ma sono anche progressivamente coinvolte nella gestione e nell’organizzazione di collaborazioni e consulenze su aspetti informativi dei contenuti didattici e di ricerca. L’utente e i suoi bisogni diventano il focus dei servizi informativi, il cui valore aggiunto è nella valutazione, nell’analisi, nel ‘confezionamento’ e nelle modalità di divulgazione e di fruizione attivamente operate dal bibliotecario/documentalista. Dunque non una strategia del libro o della digitalizzazione o della tecnologia, Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 27 ma una strategia dell’informazione, creando valore aggiunto attraverso strumenti di accesso che collegano le risorse selezionate da fonti disparate, fornendo collegamenti tra diversi strumenti di accesso all’oggetto informativo nella sua interezza, favorendo l’integrazione e lo scambio dei documenti. Questo processo sarà al contempo molto più impegnativo, ma anche più stimolante dell’automazione, e sarà proattivo: i cambiamenti nella pratica dell’editoria e della comunicazione universitaria, le applicazione della tecnologia didattica e gli sviluppi delle leggi sulla proprietà intellettuale plasmeranno gran parte del futuro delle biblioteche universitarie. 2.3 La situazione in Italia Nel panorama internazionale la posizione dell’Italia è parzialmente disallineata ma comunque attiva. Negli ultimi anni le caratteristiche nelle biblioteche delle università italiane hanno determinato un alto grado di frammentazione e dispersione dell’informazione scientifica 16, parallelo ad un ampio uso dell’informatica e dei servizi di reti telematiche che attesta modalità e supporti del tutto differenti da quelli che hanno caratterizzato i primi secoli di vita della biblioteca moderna. Per fronteggiare questa situazione, i sistemi bibliotecari di ateneo hanno registrato un notevole incremento degli investimenti per lo sviluppo di servizi e di progetti sperimentali nell’ambito delle ICT anche d’avanguardia 17, dimostrando un approccio dinamico ed una sempre maggiore consapevolezza dell’importanza della funzionalità e dell’efficienza. Sembra tuttavia ancora lunga la strada da percorrere, a livello locale e nazionale, per raggiungere gli esempi del mondo anglosassone. Eterogeneità e specificità dei sistemi bibliotecari delle singole università, elevato numero delle strutture e livello dei servizi spesso non adeguato, uniti alla sostanziale autonomia normativa rispetto allo Stato ma non amministrativa rispetto all’ateneo, alla frammentazione organizzativa ed economica, all’assenza o carenza di monitoraggio, evidenziano un quadro non ancora sistemico e organico rispetto ad altre realtà internazionali 18. La cooperazione inter-universitaria, che contribuisce al superamento dei particolarismi spesso riscontrati in ambito bibliotecario, si è manifestata intorno ad obiettivi concreti e specifici: i consorzi per la condivisione delle risorse elettroniche (CILEA, CIPE e CIBER), metodi e attività di monitoraggio dei sistemi bibliotecari (GIM), la cooperazione e collaborazione tra biblioteche in vari settori di attività ed in progetti innovativi (DAFNE); i network disciplinari (CNBA, ESSPER Matematica). Con l’anno accademico 2001/2002 è inoltre entrata in vigore la riforma degli ordinamenti didattici con l’istituzione della laurea triennale, che ha determinato un ampliamento dell’offerta didattica, ma anche l’incremento delle spese per le retribuzioni (legato all’aumento degli insegnamenti attivati). Ciò sembra aver prodotto una generaliz28 | zata contrazione delle spese, tra cui quelle per l’acquisizione del materiale librario, rimarcando ancora una volta un forte sbilanciamento fra l’offerta didattica e l’offerta di servizi bibliotecari. Il rapporto con l’utenza primaria dei docenti e degli studenti è caratterizzato dall’assenza o dalla lentezza della cosiddetta ‘fidelizzazione’, che risulta in un’occasione mancata di fruizione della biblioteca come laboratorio didattico e scientifico e luogo di apprendimento interattivo e socializzato. Dal punto di vista informatico, i pacchetti software utilizzati negli atenei per la gestione del catalogo digitale sono eterogenei, spesso anche all’interno di una stessa università. Anche se la tendenza generale è quella di dotarsi di uno strumento di gestione unitario, sembra utopistica l’idea di un software unico per le biblioteche di tutte le università italiane, visto anche che l’adesione al Servizio Bibliotecario Nazionale (SBN) non è assolutamente generalizzata. Il MetaOPAC Azalai italiano (MAI), che al momento offre una copertura solo parziale dei cataloghi delle università, potrà forse in futuro rispondere alle principali esigenze degli utenti di un catalogo nazionale. Aspetti critici, oltre alla limitata capacità di sviluppo delle collezioni, risultano essere la mancanza di una politica accademica e nazionale a sostegno dei sistemi bibliotecario universitari, oltre all’esistenza di un doppio livello di biblioteche universitarie, divise tra quelle più antiche, che appartengono al Ministero per i Beni e le Attività Culturali e sono pertanto fuori dal controllo delle rispettive università, e quelle moderne nate come servizio a istituti e dipartimenti, che costituiscono oggi il fulcro dei servizi bibliotecari degli atenei. 2.4 Sfide e scenari prossimi venturi Come ha rilevato il sociologo Manuel Castells 19, il nuovo paradigma informativo della società in rete presenta cinque caratteristiche: 1. l’informazione è materiale grezzo sui cui agiscono le nuove tecnologie; 2. gli effetti delle nuove tecnologie sono pervasivi e stanno plasmando tutti i processi delle nostre esperienze individuali e collettive; 3. la logica di networking ben si adatta alla sempre crescente complessità dell’interazione e agli imprevedibili percorsi di sviluppo, e può essere implementata in tutti i tipi di processi e organizzazioni; 4. tutti i processi sono reversibili e possono essere riconfigurati, in una società sempre più caratterizzata dal costante cambiamento e dalla fluidità organizzativa; 5. è in atto una crescente convergenza di tecnologie specifiche in un unico sistema altamente integrato. Le ICT sono al tempo stesso un prodotto della Knowledge Economy e un catalizzatore dei cambiamenti da essa apportati. Se le informazioni e la conoCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 29 scenza sono il carburante di questa economia, le biblioteche possono e devono essere i carburatori e le pompe di iniezione che rendono le informazioni disponibili quando e dove esse sono richieste. Alcuni esperti del settore, tra cui Clifford Linch 20, hanno identificato i seguenti elementi chiave per le biblioteche universitarie del XXI secolo: - creazione di una nuova definizione del canone dell’editoria e della comunicazione universitaria e delle relazioni delle biblioteche universitarie in rapporto ad essa, in termini di acquisizione o selezione, organizzazione, gestione, accesso e conservazione; - problematiche legate all’acquisizione, alla gestione e alla conservazione di materiali ‘grezzi’ per la didattica e la ricerca, a mano a mano che questi materiali diventano digitali e si diversificano e lo sviluppo delle ICT prosegue a ritmi sostenuti; - identificazione di un nuovo equilibrio tra azioni collettive e centralizzate e attività locali: in un mondo di risorse condivise su rete, si tenderà a centralizzare ulteriormente la gestione, l’organizzazione e la descrizione e aumenteranno le convergenze tra biblioteche, centri informativi e dipartimenti di informatica 21; - progressivo sviluppo di applicazioni e sistemi in-house, in opposizione all’acquisto di software proprietari; - le biblioteche dovranno sempre più occuparsi di questioni contabili, finanziarie e legali (inerenti copyright e proprietà intellettuale), oltre che rivedere il loro status giuridico e sostenere il riconoscimento della biblioteca e dei bibliotecari universitari nella società; - risoluzione dei sistematici problemi di finanziamenti, tramite l’introduzione di alcuni servizi a pagamento e la ricerca di sponsor; - sviluppo di nuovi ruoli per le biblioteche nel contesto universitario, abbracciando campi e raggiungendo comunità di utenti sempre più ampie e diversificate, anche in relazione alla crescente competizione tra gli atenei: insegnamento dei principi di base dell’information retrieval e la valutazione delle risorse informative; progettazione e gestione di prodotti didattici multimediali; partnership in progetti di ricerca e programmi su temi specifici dell’informazione e della documentazione; supporto di programmi e prodotti per l’informazione a distanza; fornitura di materiali didattici, in particolare di learning object; gestione delle problematiche relative ai diritti e della proprietà intellettuale, anche in una prospettiva di e-commerce; tirocini e consulenze nell’ambito della strutturazione, rappresentazione, organizzazione e conservazione dei dati. A tali scopi aumenterà anche l’utilizzo di figure paraprofessionali esperte nelle ICT. 30 | La cooperazione tra le biblioteche universitarie e la tendenza a creare a consorzi regionali o disciplinari sarà uno dei fattori che influenzeranno di più la visione della biblioteca universitaria, influenzando le politiche di gestione delle collezioni. A loro volta, i progressi delle ICT porteranno ad una sempre maggiore integrazione di diverse tipologie di supporti, e con la disponibilità futura di più potenti larghezze di banda e di oggetti informativi multimediali sarà possibile progettare, sviluppare e alimentare sistemi interattivi molto più sofisticati. I software si stanno già evolvendo da applicazioni sul desktop o client-server ad applicazioni online: La fase successiva di questa evoluzione consisterà nello sviluppo di sofisticati servizi Web, che facilitano un’interazione diretta tra i programmi senza bisogno dell’intervento dell’utente e costituiscono delle componenti funzionali che possono combinarsi dinamicamente con altri servizi, per creare applicazioni più potenti ed efficaci. La biblioteca digitale del futuro offrirà smart media service che abbinano contenuti multimediali interattivi allo specifico contesto dell’utente, offrendo un’esperienza personalizzata cui accedere tramite un’unica password. Una componente chiave per il successo del modello dei servizi Web interoperabili sarà l’utilizzo dell’Extensible Markup Language (XML) e dello Standard General Markup Language (SGML) 22. Attraverso l’identificazione, la selezione e l’organizzazione dei servizi di accesso all’informazione, i bibliotecari universitari copriranno un ruolo sempre più rilevante nel supporto alla didattica e alla ricerca universitaria 23, grazie anche agli strumenti offerti dal Knowledge Management. Essi dovranno essere sempre più versatili, con ottime capacità comunicative e interpersonali, padronanza delle lingue e continuo aggiornamento professionale. La formazione degli utenti, che presenteranno aspettative sempre maggiori, sarà uno dei più importanti servizi della biblioteca user-oriented, perciò le capacità didattiche saranno essenziali. Le competenze informatiche dei bibliotecari dovranno comprendere, oltre l’utilizzo del computer, dei pacchetti applicativi del desktop office e della conoscenza di Internet conoscenze avanzate dell’HTML (e a breve del XML), progettazione di pagine Web e di sistemi informativi. Oltre alle conoscenze biblioteconomiche, sarà utile la conoscenza di almeno una delle discipline oggetto di insegnamento della didattica e della ricerca. Infine, la valutazione dei bisogni degli utenti richiederà maggiori informazioni empiriche recuperabili attraverso la misurazione e valutazione, il monitoraggio e ricerca. L’interazione tra i diversi protagonisti dello scenario delineato avverrà infine in uno spazio sempre più condiviso: 1. tra biblioteche, con il progressivo ingresso e riorganizzazione funzionale in uno spazio condiviso digitale in rete e la digitalizzazione di risorse e servizi; Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 31 2. nel campus dell’università, attraverso una biblioteca digitale, sistemi di e-learning, il sito Web pubblico, la Intranet istituzionale, una Intranet per gli studenti; 3. per il supporto della comunità universitaria, tramite la creazione di repository istituzionali delle attività di ricerca e di didattica prodotte dai membri. Oltre alle applicazioni commerciali come la Berkeley Electronic Press (Bepress), sono attualmente disponibili varie applicazioni open-source, pronte per l’uso o in corso di implementazione, tra cui E-prints 24 e D-Space 25; 4. nella gestione della didattica, come testimoniano gli esempi di MERLOT (Multimedia Educational Resource for learning and online teaching), E-science, Journal of Molecular Spectroscopy Supplementary Material Archives, Advanced Computing Center for the Arts and Design, Motion Capture Lab. 2.5 Spazi fisici: Learning Resource Centre e Information Commons Con i cambiamenti nelle modalità di apprendimento e di insegnamento e l’avvento dell’accesso remoto a sempre maggiori tipologie di documenti, la qualità della consultazione e la concezione spaziale e temporale in cui essa avviene ne risultano trasformate. Se anche il numero degli utenti che si reca fisicamente in biblioteca diminuisse sensibilmente, chi vi andrà, come indicava Giovanni Solimine nel 1996, «avrà bisogno di più spazio, di una postazione di lavoro molto sofisticata e non solo di un posto di lettura» 26. Non solo lo spazio per gli utenti, ma lo spazio per le risorse umane in generale, per le operazioni di rielaborazione delle informazioni e per gli oggetti digitali sarà maggiore. La biblioteca universitaria, infatti, ospita progressivamente sempre più servizi e attrezzature per sistemi informativi, per la comunicazione, per le risorse informative in rete, per lo sviluppo delle collezioni (ad esempio attrezzature per la digitalizzazione o il post-processing), insieme a collezioni eterogenee di oggetti analogici e digitali, e spazi di lavoro e di interrelazione per gli utenti, rappresentando un luogo d’incontro e di scambio per tutti i membri della comunità accademica (per attività di information literacy, progressivamente inserite nel curriculum universitario, e per eventi di vario tipo). L’attenzione si muoverà sempre più dallo spazio e dal luogo alle persone e alle attività nell’edificio, per offrire diversi tipi di spazio per un’ampia gamma di attività e di servizi offerti dalla biblioteca, assicurando la massima flessibilità per facilitare la riprogettazione in base ai nuovi bisogni degli utenti e ai cambiamenti tecnologici. È necessario una visione allargata del ruolo della biblioteca nell’ateneo, integrando funzioni aggiuntive orientate all’apprendimento 32 | attraverso il continuo monitoraggio dei trend emergenti nell’educazione universitaria e l’analisi dell’impatto che essi avranno sui servizi della biblioteca e sulle facility ad essa associata, in collaborazione con esperti di diverse aree 27. Da alcune indagini completate nel 2000 28, sono emersi gli elementi che influenzeranno la progettazione della biblioteca universitaria del futuro. In primo luogo, le risorse a stampa saranno ancora necessarie e l’accesso al mondo delle risorse in rete aumenterà sempre di più. L’equilibrio tra documenti analogici e documenti digitali varierà a seconda delle discipline, ma certamente maggiore spazio sarà richiesto per la fruizione dei documenti digitali. Si continuerà a fare affidamento sulla possibilità di accedere e di usare l’informazione dal campus, da casa e dal proprio spazio di lavoro, tramite le postazioni della biblioteca o usando il proprio computer. Gli utenti continueranno a studiare e a lavorare in modi diversi, in un’ottica di life-long learning, richiederanno orari di apertura più lunghi, accesso 24 ore su 24 ai servizi di rete, sezioni di raccolte di documenti specializzate per gli studenti post-laurea, incremento di sezioni a scaffale aperto, diversificazione delle postazioni. Le modalità di lavoro saranno spesso collaborative e si serviranno di molteplici media, aspetti che influenzeranno lo spazio dello studio e il tipo di attrezzature necessarie. L’indipendenza tecnologica degli utenti e la domanda per servizi self-service aumenteranno, ma sarà comunque necessaria l’assistenza nella scelta dei servizi e dei documenti disponibili 29. Gli spazi di apprendimento dovranno essere flessibili, equipaggiati con varie facility e network accessibili da gruppi di studio e di progetto, workstation diversificate dotate di software per l’accesso online ma anche per la creazione di risorse multimediali in una varietà di formati, e assistenza tecnica a portata di mano. L’isolamento acustico sarà fondamentale in presenza di tali dispositivi, così come sarà sempre più importante che l’ambiente fisico sia ergonomicamente favorevole, esteticamente piacevole e sicuro. Crescente enfasi dovrà essere posta sul potenziale sociale/di intrattenimento delle biblioteche universitarie con l’aggiunta di spazi espositivi e caffetterie. Sarà perciò necessario che l’edificio sia sufficientemente flessibile per accomodare modifiche future portate dalla trasformazione delle modalità di insegnamento e apprendimento, non sottodimensionando gli spazi in fase di progetto. La biblioteca universitaria assomiglierà sempre più di più ad un laboratorio, dove gli studenti e i ricercatori integrano le informazioni da un’ampia gamma di tipologie di media 30. Le implicazioni di questo cambiamento nella progettazione degli edifici non sono ancora state pienamente esplorate, e sono perciò necessari ulteriori studi sui nuovi comportamento degli utenti nel cercare, selezionare e usare le informazioni, e su come questi potrebbero essere facilitati dalla progettazione e dalle attrezzature dello spazio fisico. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 33 Gli Information Commons 31 sono un primo tentativo di rispondere a questo scenario, ponendosi come nuovo tipo di facility fisica specificatamente progettata per organizzare lo spazio di lavoro e i servizi in un ambiente digitale integrato: sono caratterizzati da aree di workstation per uso individuale e collaborativo, con accesso ad un’ampia gamma di software oltre che di risorse informative, assistenza da parte dello staff della biblioteca specializzato in alcuni settori (computer, reference e nuovi media) che forniscono un servizio senza soluzione di continuità, e spazi di lavoro di gruppo o individuali fisicamente vicini agli specialisti e alle tecnologie, secondo un approccio one-stop shop. L’Information Commons della University of Southern California è stato uno dei primissimi e più pubblicizzati tentativi di incorporare questo nuovo tipo di spazio e di servizi, per fronteggiare ai nuovi bisogni dell’ambiente digitale. L’esperienza ebbe un tale successo che raddoppiò gli spazi alla fine del 1998 e da allora molte biblioteche nordamericane hanno adottato questo modello 32. In questo nuovo contesto Leighton e Weber 33 descrivono le due configurazioni di quella che chiamano la ‘meta-library’: 1. Integrated Facility: comprende sia la fornitura sia l’accesso all’informazione. Il risultato è un nuovo amalgama di funzioni e di spazi, che riuniscono le risorse informative, le tecnologie, i servizi e professionisti dell’informazione di tutto il campus; 2. Learning Centre: si focalizza sul supporto alla didattica universitaria, raccogliendo e riunendo sotto un unico tetto documenti, tecnologia, studenti, docenti e professionisti dell’informazione. Gli studi universitari sono collegati ad altre attività educative e culturali ad hoc, in uno spazio intellettualmente e socialmente integrato. Questo modello di biblioteca universitaria, basato su una organizzazione decentralizzata, è focalizzato sull’accesso distribuito ai servizi e continua ad evolversi al di là delle sue mura. Anche in passato alcune collezioni della biblioteca erano dislocate all’esterno, ma le tecnologie oggi consentono servizi e consulenze ancora una volta distribuiti e riposizionati vicini agli utenti, nei loro uffici e laboratori. Quali che siano le declinazioni di questo modello, esso sarà guidato soprattutto dagli obiettivi didattici delle singole università, dalla loro struttura organizzativa e istituzionale e dall’evoluzione dei comportamenti e delle richieste di una comunità di utenti sempre più eterogenea. 2.6 Spazi virtuali: biblioteche digitali e repository Nonostante le molteplici riflessioni e gli sviluppi dell’ultimo decennio, non vi è una definizione unica di biblioteca digitale e questo concetto viene inteso in modo diverso dalle differenti comunità. 34 | In questo volume si è adottata la famosa definizione utilizzata nel Workshop on distributed knowledge environment di Santa Fé, secondo cui una biblioteca digitale «is not merely equivalent to a digitized collection with information management tools. It is rather an environment to bring together collections, services, and people in support of the full life cycle of creation, dissemination, use, and preservation of data, information, and knowledge» 34 . L’aspetto importante è che una biblioteca digitale possiede del materiale digitalizzato e/o digitale nativo 35, conservato nel sistema di un computer in una forma tale da poter essere manipolato e reso accessibile all’utente in modi che non erano possibili con i materiali analogici. Una biblioteca automatizzata non è necessariamente una biblioteca digitale, poiché una biblioteca che consiste interamente di materiali analogici potrebbe anche essere altamente automatizzata, ma questa automatizzazione non la rende ‘digitale’ nel senso indicato nel paragrafo 1.1. Tuttavia, è vero che una biblioteca digitale deve essere automatizzata in alcune delle sue funzioni essenziali 36. Da un punto di vista informatico, la biblioteca digitale viene costruita su semplici componenti detti ‘oggetti digitali’. Un oggetto digitale è un modo di strutturare in forma digitale l’informazione, in parte costituita da metadati. Le informazioni digitali però sono tutt’altro che semplici: una singola opera potrebbe essere costituite da più parti parti, una struttura interna complessa e una o più relazioni arbitrarie con altri lavori. Tutti gli oggetti digitali hanno la stessa forma base, ma la struttura dell’insieme di oggetti digitali dipende dal tipo di informazioni che essa rappresenta. Da un punto di vista dell’utente, la biblioteca digitale è basata sul flusso informativo e sull’organizzazione delle informazioni, con un modello a tre livelli di distribuzione: fornitore dell’informazione (information provider), mediatore dell’informazione (information broker) e utente dell’informa-zione (information user). I fornitori dell’informazione tipicamente producono contenuti digitali o digitalizzati di vari media e li conservano in database con contenuti multimediali, oppure li acquistano da altri fornitori. Per facilitare il recupero dell’informazione da parte degli utenti, i fornitori organizzano l’infor-mazione attaccando delle parole chiave al contenuto (diverse tra fornitore e fornitore), mettendolo in sequenza e così via, secondo percorsi di recupero tipici. Il secondo livello consiste di mediatori dell’informazione, che creano dei database di link che puntano ai contenuti dei fornitori di informazioni 37, secondo le modalità con cui si ritiene che gli utenti vogliano accedere all’informazione. Un mediatore d’informazione appare quindi agli utenti come un gigantesco fornitore di contenuti. I mediatori possono anche fornire altri e vari servizi tra cui, per esempio, filtro delle informazioni, mirroring dei database, gestione Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 35 del copyright e collezioni a pagamento degli information provider. Infine, quando ci si riferisce alla biblioteca digitale in genere si maschera il fatto che le biblioteche digitali esistono in forme diverse e con differenti funzioni, priorità e obiettivi. I vari progetti sviluppati in tutto il mondo hanno ognuno la propria personalità e riflettono le circostanze della loro nascita, le persone che se ne sono occupate e i diversi responsabili. Le biblioteche digitali probabilmente manteranno le loro caratteristiche distintive anche quando diventeranno maggiormente integrate e costruite su collezioni e servizi user-oriented. Ma vale la pena di riflettere su dove porterà la traiettoria di sviluppo 38, e come verrà descritto il patrimonio di documenti che viene progressivamente reso disponibile per la ricerca e la didattica attraverso l’impegno di istituzioni no-profit. 2.6.1 Le biblioteche digitali in ambito universitario Il primo studio di quella che oggi sono definite ‘biblioteche digitali automatizzate’ venne effettuato al Massacchuttes Institute of Technology negli anni ‘60 del secolo scorso, sotto la guida di J.C.R. Licklider 39. Negli anni dei primissimi esperimenti di intelligenza artificiale, che alimentarono grandi speranze per l’imitazione dei processi umani tramite sofisticati algoritmi, Licklider descrisse il progetto di quelli che chiamava ‘sistemi procognitivi’, prevedendo che per l’anno 2000 si sarebbero superati i limiti fisici dei libri e degli scaffali della biblioteca. Oggi molti dei risultati che egli aveva previsto sono diventati realtà, ma non tutti e non nei modi che egli si aspettava. Lo sviluppo di sofisticati processi di elaborazione del linguaggio naturale è stato più lento di quanto sperava, e i software di utilizzo generico sono ancora lontani. Licklider e i suoi contemporanei avevano sottovalutato quanto sarebbe stato possibile ottenere nella realizzazione delle biblioteche digitali dalla sola forza computazionale, sfruttando le capacità di elaborazione di numerosi computer servendosi di algoritmi semplici, come è accaduto in ambito universitario. Lo sviluppo delle biblioteche digitali universitarie deve essere considerato nel contesto complessivo delle iniziative volte a unificare le infrastrutture informatiche e tecnologiche nel campus e trasformare il processo di apprendimento attraverso tecnologie innovative. Negli ultimi anni la riduzione del costo dell’hardware e la disponibilità di network a banda larga hanno reso accessibili all’istruzione un mix di sofisticati servizi digitali e Web-based, che stanno rapidamente diffondendo contenuti digitali per il virtual learning environment di cui la biblioteca digitale è una delle componenti chiave. Con il Web e le tecnologie telematiche i servizi della biblioteca si estendono al di là del suo spazio fisico e si registra una sempre maggiore aspettativa per servizi informativi personalizzati, veloci e sempre disponibili su dispositivi 36 | fissi e mobili. Ma qual’è in generale il ruolo delle biblioteche universitarie nello sviluppo delle biblioteche digitali? Al tempo dei primi progetti 40, si trattava di attività largamente sperimentali e sviluppate non dalle biblioteche (come è il caso di SFX), ma dai centri di computer science e robotica (Informedia), supercomputer (Internet Archive), laboratori di ricerca industriale (ResearchIndex), e si servono di staff altamente qualificato. Successivamente, gli esperti di computer science hanno cominciato a collaborare con le biblioteche e varie organizzazioni sono state coinvolte nell’implementazione delle tecnologie delle biblioteche digitali, inclusa la Comunità Europea, la Association for Computing Machinery (ACM), l’Institute of Electrical and Electronics Engineers (IEEE), la International Federation of Library Associations (IFLA), la American Library Association (ALA), the Coalition for Networked Information (CNI) e la Digital Library Federation (DLF). Anche le case produttrici di software per biblioteche hanno introdotto i primi prodotti commerciali, destinati alle istituzioni didattiche che cercavano semplici soluzioni facili da installare e da manutere. La maggior parte dei progetti di biblioteche digitali in ambito universitario derivano da idee innovative sul futuro ruolo delle biblioteche in un ambiente didattico in rete, e sono stati finanziati grazie ad un sostanziale impegno istituzionale. All’inizio degli anni ‘90 la biblioteca cerca di sfruttare Internet per svolgere dei ruoli tradizionali, come ad esempio dare accesso ai cataloghi della biblioteca, ad alcuni materiali di reference e a periodici scientifici. Con le successive sperimentazioni nella riformattazione digitale, accompagnate dalla retorica sull’accesso universale a tutta la conoscenza umana, alcune biblioteche si sono focalizzate sull’accesso online a risorse selezionate. Giudicati alla luce delle aspettative iniziali, le prime collezioni sul Web nella maggiore parte dei casi erano troppo piccole per supportare più di un browsing casuale, troppo idiosincratiche per essere integrate in modo significativo in collezioni virtuali più ampie e troppo passive per mantenere l’interesse dell’utente a lungo. L’ubiqua penetrazione delle tecnologie di rete oggi crea nuove opportunità per forme più strette di associazione e condivisione delle risorse e il focus è stato spostato sull’integrazione dei materiali digitali nella collezione della biblioteca. Le biblioteche digitali attuali sono più interessate ai sistemi di architetture modulari e sono concepite come un complesso ambiente di servizi online supportato da sistemi locali e globali, ognuno dei quali fornisce specifiche funzioni e si interrala con gli altri in un modo rappresentabile attraverso uno schema architettonico modulare. Questo modello non è solo sofisticato ma anche pratico ed economico, permette maggiore libertà nella selezione Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 37 dei componenti di servizio e abilita la biblioteca a gestire e rispondere ai cambiamenti tecnici con maggiore facilità, senza re-ingegnerizzare l’intero ambiente di servizio. 2.6.2 Architettura, componenti e caratteristiche delle biblioteche digitali Un ambiente completamente sviluppato di biblioteca digitale include le seguenti componenti funzionali (Fig. 5): - raccolta di documenti digitali nativi e/o di documenti da sottoporre a digitalizzazione; - estrazione o creazione di metadati o di informazioni di indicizzazione che descrivono il contenuto, per facilitare la ricerca e la scoperta, così come metadati amministrativi e strutturali per assistere nella visualizzazione, gestione e conservazione dell’oggetto; - conservazione del contenuto digitale e dei metadati in un repository multimediale appropriato, che includerà la gestione dei diritti e strumenti per l’e-commerce; - servizi sul lato client per la query e il browsing; - content delivery tramite trasferimento dei file o streaming media; - accesso degli utenti attraverso un browser o un client dedicato; - un network pubblico o privato. 1 Content digitization/ acquisition Network 6 Patron’s Browser or Client 7 2 4 3 Rights Mgmt./ E-Commerce File Transfer Client Services Streaming Metadata Extration 5 Multimedia Content Metadata Content Delivery Repository [Fig. 5] Componenti funzionali di una biblioteca digitale (da The digital library toolkit, 2000) 38 | Queste componenti potrebbero anche non far tutte parti di un sistema di biblioteca digitale, ma essere fornite da altri sistemi/ambienti correlati o multifunzionali. Di conseguenza, l’integrazione è un tema essenziale: per interoperare con l’infrastruttura bibliotecaria esistente, la biblioteca digitale deve essere progettata per lavorare con i cataloghi esistenti e per incorporare standard, formati e protocolli bibliotecari. Per sua natura, le collezioni digitali richiedono un uso intensivo delle tecnologie. Oggi i maggiori progetti di biblioteche digitali stanno mettendo online collezioni di notevoli dimensioni (a volte milioni di oggetti digitali), che richiederanno capacità di deposito misurate in Petabytes (1 Petabyte è l’equivalente di oltre 50.000 desktop computer con 20 Gigabytes di hard drive ciascuno).Poiché le biblioteche digitali variano in dimensioni e funzionalità, è essenziale che le piattaforme tecnologiche sottostanti offrano le performance e l’affidabilità richiesta. Inoltre gli utenti si aspettano servizi di alta qualità, il che significa che non sono tollerabili tempi di attesa lunghi e risposte incomplete. Infine, poiché i costi sono sempre un aspetto critico, la scalabilità, l’efficienza e un’architettura di sistema aperta costituiscono dei requisiti chiave. Anche le capacità di archiviazione devono essere scalabili per adattarsi alla rapida crescita della domanda, e devono adattarsi a varie tipologia di media che possono essere conservate in una biblioteca digitale: - file di testo (relativamente stabili e non richiedono grandi quantità di dati da archiviare); - file di grafica (possono essere dinamici e richiedere grandi quantità di dati da archiviare); - file audio (altamente dinamici); - file video (altamente dinamici e possono richiedere grandi quantità di dati da archiviare). L’uso di nuovi modelli computazionali, di Internet e dei portali, il crescente numero di studenti al di fuori dal campus e la necessità di gestire meglio risorse eterogenee in ambienti di rete hanno stimolato lo sviluppo di molte applicazioni bibliotecarie. Per ottenere benefici reali e un modello economico fattibile, le biblioteche digitali devono poter supportare la pratica non solo didattica ma anche professionale dei vari ambiti disciplinari, da un lato sviluppando sistemi innovativi e dall’altro educando gli utenti al loro utilizzo 41. L’accesso all’informazione dovrebbe essere inserito senza soluzione di continuità in un sistema integrato che superi le limitazioni dei materiali cartacei e supporti il lavoro degli utenti, l’accesso alle informazioni e il loro utilizzo e applicazione. Alcuni esempi famosi in quest’ottica sono quelli dell’Art Museum Image Consortium (AMICO) 42, della University of California at Berkeley 43, della Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 39 Cornell University 44, dell’Harvard University 45, di JSTOR 46 e della Stanford University 47. Gli applicativi realizzati in-house sono frequenti nei primi progetti di biblioteche digitali, principalmente perché le soluzioni commerciali adeguate hanno cominciato ad essere disponibili in tempi relativamente recenti. Questo approccio oggi presenta sia vantaggi che svantaggi. Tra i primi vi è la possibilità di modellare l’applicazione sui bisogni specifici dell’utente, e di spalmare il costo iniziale su un lungo periodo di utilizzo senza ulteriori spese di licenze o di manutenzione. Lo sviluppo futuro è controllabile e prevedibile, e non vi dovrebbero essere dubbi sulla costante disponibilità del sistema. Il costo dello sviluppo e del mantenimento di un ambiente complesso di gestione di multimedia è tuttavia alto, e non sempre è possibile disporre di un budget e di competenze tecniche adeguate. Varie aziende produttrici di sistemi di automazione per biblioteche e sistemi di ricerca cross-database (tra cui Endeavor Information Systems, Ex Libris e Millenium) offrono anche soluzioni per biblioteche digitali, e altre società di tecnologie di gestione di multimedia stanno cominciando ad orientarsi verso il mercato della didattica e delle biblioteche. In generale, la sfida è capire come passare dalle collezioni digitali isolate alle biblioteche digitali interoperabili, e come trasportare nelle biblioteche digitali i componenti della biblioteca tradizionale: infrastrutture, metadati robusti e strategie di conservazione efficaci 48. 2.6.3. Interoperabilità, standard, modelli organizzativi Nei primi progetti di biblioteche digitali l’utente doveva interagire con ogni repository in modo indipendente, impararne la sintassi e installare sul proprio computer le applicazioni necessarie per visualizzare i documenti digitali di ciascuno. Gli utenti di oggi chiedono presentazioni senza soluzione di continuità delle collezioni e dei servizi, indipendentemente da dove, da chi e in quale formato esse sono gestite, cui accedere attraverso un’unica query (Fig. 6) e un ambiente di ricerca da personalizzare in base alle loro esigenze. Gli sviluppi degli OPAC sono stati un progresso in tal senso, i browser Web hanno dato un aspetto unitario alle interfacce dei differenti database e i protocolli Z39.50 hanno permesso agli utenti di impiegare una sintassi di ricerca familiare. Ma quando si lascia il mondo degli OPAC e si entra in quello dei repository digitali, l’interoperabilità è ancora lontana. Per ottenerla è necessario perfezionare la metrica per identificare e analizzare i bisogni degli utenti, e aderire a processi e codifiche standard, che permettano alla biblioteca digitale di fornire una vista consistente e coerente di quanti più repository possibili: dagli standard per vari tipi di metadati (amministrativi, strut40 | turali, di identificazione, di longevità) ai modi per rendere i metadati visibili a sistemi esterni (harvesting), alle architetture comuni per supportare l’interoperabilità (open archives). Questi due aspetti hanno implicazioni rivoluzionarie per la biblioteca. Da un lato l’integrazione in un network integrato di servizi informativi, sfidando la sua tradizionale insularità organizzativa; dall’altro, la collocazione di parte delle collezioni e dei servizi in nuovi contesti esterni alla biblioteca. La rapida penetrazione delle tecnologie di rete ha minato le fondamenta della forma fisica, culturale, organizzativa, finanziaria e professionale delle biblioteche universitarie. In un mondo interconnesso, in cui l’accesso ad una larga parte dell’informazione non richiede più la prossimità al medium fisico su cui essa è trasportata, si potrebbero ipotizzare la seguente articolazione dei servizi informativi: - punti di servizio (biblioteche universitarie) che gestiscono l’accesso tramite la messa online, print-on-demand ecc.; - repository per la gestione dei documenti digitali e loro disponibilità ai diversi punti di servizio; - repository per i documenti analogici, che li rendono disponibili a quegli studiosi le cui ricerche richiedono la manipolazione e l’osservazione diretta. - Patron information Favorite subjects Saved searches Personalized alerts Course materials - Ask a Librarian - Online reference tools - Search tools My Library Local Resources - Virtual Reference Desk Remote Resources - Other libraries - Subscription databases - E-content Books Journals Databases Digital collections Library Information Online Communities [Fig. 6] Componenti di un portale per biblioteche (da The digital library toolkit, 2000) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 41 Si può anche immaginare una gamma di servizi essenziali di supporto ai punti di servizio e ai repository, che includono cataloghi partecipati sul posseduto, e servizi per la denominazione e l’identificazione persistente dei file. Ma se le tecnologie di rete permettono agli utenti di accedere alle informazioni indipendentemente dalla localizzazione delle informazioni, vi sono ancora ostacoli significativi alla vera condivisione delle risorse, inclusi gli effetti della competizione tra università sulla cooperazione bibliotecaria. La fornitura coordinata di servizi informativi di rete è probabilmente la sfida maggiore che le biblioteche affrontano oggi. Senza un approccio e una collaborazione tecnologica di tutto il campus con la biblioteca, che includa anche le risorse digitali già disponibili, questi sistemi sono destinati ad essere ridondanti e con risultati limitati, a fronte di budget già ridotti. 2.6.4 Linee di sviluppo future Tra le tendenze che stanno emergendo e che continueranno ad affermarsi nel contesto delle biblioteche digitali, è possibile identificare alcuni punti salienti 49. In primis questioni relative alle architetture dei sistemi (query routing, interazione con il database e gestione della consistenza) e all’organizzazione dei network locali, così che questi possano cooperare e avvantaggiarsi del loro potenziale su una scala globale, dove i componenti sono gestiti da varie istituzioni indipendenti con scopi e priorità diverse. Molti aspetti della ricerca crossdatabase (sicurezza, privacy, servizi a pagamento) sono tecnicamente difficili, perchè i sistemi perdono la loro efficacia senza un sostanziale livello di standardizzazione e armonizzazione. Le attività relative ai metadati saranno sempre più finalizzate ad incrementare il livello di standardizzazione e conformità, permettendo al tempo stesso flessibilità per continuare a incoraggiare la creazione di contenuto. Assisteremo poi al progressivo passaggio dai sistemi testuali a quelli multimediali, grazie alla riduzione dei costi dei network a banda larga e ai miglioramenti delle tecnologie di streaming, ed emergeranno best practice comuni per la digitalizzazione, la gestione dei diritti, la conservazione, la codifica dei metadati e altri processi chiave della biblioteca digitale. Il mondo delle biblioteche lavorerà sempre più al fianco delle organizzazioni internazionali preposte alla creazione degli standard, che saranno recepiti nei prodotti commerciali, e la prossima fase dello sviluppo delle biblioteche digitali si focalizzerà sulla standardizzazione, sulla personalizzazione e lo user modeling, sull’usabilità, su spazi di lavoro collaborativi, fornendo maggiore interoperabilità tra le collezioni digitali e scelte cost-effective per le istituzioni che incominceranno a digitalizzare. 42 | In questi ambiti nuovi servizi tecnologici potenzieranno il processo di comunicazione scientifica, insieme ai sistemi di rating e Web-feed, e l’accesso ai materiali sarà integrato con quello agli strumenti necessari per elaborare e presentare questi materiali: dalle strutture semantiche per supportare la ricerca e il recupero dei documenti, sia in modalità manuale che automatizzata, alle tecniche di Natural Language Processing (inclusi i riassunti, l’estrazione dell’informazione, traduzione e riconoscimento automatico del parlato) e alla modelizzazione statistica e scientifica, dai rendering grafici alla visualizzazione. Per effettuare query attraverso database multipli verranno implementati i sistemi di Multimedia Information Retrieval, ambito nel quale si cercheranno di risolvere le questioni relative a ranking unificato, eliminazione dei risultati doppione e delle inconsistenze, combinazione di dati strutturali, funzionali, sociali ed economici e utilizzo di tecniche di statistica e di sistemi di intelligenza artificiale. Per quanto riguarda le questioni economiche, la crescente dipendenza dalle risorse digitali determinerà la creazione di soluzioni cooperative per la conservazione nel lungo periodo a costi contenuti. L’accesso ad alcune informazioni potrebbe essere ristretto, ma anche quando l’informazione è gratuita, rimarrà il problema della gestione e della protezione dei diritti e delle informazioni personali. Inoltre il problema della digitalizzazione non è solo e tanto di carattere economico o tecnologico, ma piuttosto giuridico, dato che i diritti di riproduzione e di proprietà rimangono in vigore a lungo. Le biblioteche digitali avranno bisogno di modelli economici sostenibili, poiché come hanno già dimostrato molti progetti, l’eccellenza tecnica e intellettuale non garantiscono da sole il successo. In generale, è chiaro come la tecnologia della biblioteca digitale stia diventando un essenziale abilitatore dei servizi delle biblioteche. Il termine stesso sta già cominciando a diventare anacronistico, così come il termine electronic banking oggi viene indicato semplicemente come banking. È certo che tutte le biblioteche in futuro saranno caratterizzate da servizi informativi basati sulle ICT, che estenderanno e potenzieranno la tradizionale missione delle biblioteche nella nostra società. 2.7 Knowledge Management e sistemi di organizzazione della conoscenza La crescente concorrenza in un’economia globalizzata ha spinto le organizzazioni a un diverso genere di allocazione delle risorse e alla valorizzazione del capitale umano. Il Knowledge Management (KM) è un approccio strategico integrato, promosso principalmente attraverso la tecnologia (ma non esclusivamente attraverso di essa) e basato sulle attività di documentazione e di forCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 43 mazione. In sintesi esso tenta di teorizzare, acquisire, rielaborare, arricchire e trasmettere il capitale umano, per modificare il comportamento e la struttura dell’organizzazione e consentirle di capitalizzare e trasmettere conoscenza esplicitata, rendendo quindi più efficiente la sua produttività e innovazione. Ma i contenuti di valore di questo capitale per loro natura non sono direttamente percettibili, né operabili in un normale sistema informativo aziendale: la scommessa del KM consiste perciò nel rendere rielaborabile in modo il più possibile automatizzato questa conoscenza tacita e intangibile (Fig. 7). Poiché i progressi dell’ingegneria dell’intelligenza artificiale sono ancora lontani dall’eguagliare il sistema cognitivo umano, occorre elaborare quelli che Bogliolo definisce ‘sistemi differenziali di significato’, che costituiscono la base per un’integrazione dinamica di universi semantici diversi 50. I Data Base Management System (DBMS) vengono cioè sostuiti dai Knowledge Base Management System (KBMS) per acquisire, rappresentare e gestire non più solo dati e informazioni‚ ma conoscenza, tramite l’ausilio dell’information retrieval. Il ruolo dei professionisti dell’informazione in questi contesti non si limita più alla raccolta delle informazioni, ma crea nuove conoscenze rielaborando criticamente il know-how dei singoli dipendenti, i valori dell’organizzazione e la propria personale conoscenza del contesto, esplorando non solo i documenti ‘espliciti’, ma anche quelli ‘impliciti’ come i processi aziendali, Information vs. Knowledge Systems Organization’s knowledge system Individual knowledge’s system Organization information’s system Disintermediated approach Author’s tacit knowledge Explicit knowledge formalized into a document Reader’s tacit knowledge [Fig. 7] Differenze tra un sistema informativo ed un sistema conoscitivo (da D. Bogliolo, 2002) 44 | e le pratiche organizzative. La trasformazione dei centri di documentazione aziendale è quindi riassumibile come l’evoluzione da un centro di costo ad un centro di valore aggiunto, che non si limita a offrire servizi ma incontra proattivamente i bisogni degli utenti, cambiando il proprio ruolo da distributore dell’informazione a partner di conoscenze, che supportano le attività di ricerca e sviluppo della organizzazione, definiscono un legame tra informazioni esterne ed interne e contribuiscono a creare contatti fra i diversi settori dell’azienda.. L’organizzazione knowledge managed diventa quindi learning – o learned – organization‚ similmente ad una università o ad un ente di ricerca. Dal punto di vista del KM, le similitudini tra il gruppo di lavoro di un’azienda e quello di un’università sono varie, dall’approccio collaborativi alla centralità dell’utente come esperto di un certo ambito. Se le biblioteche universitarie venissero percepite come un valido supporto all’attività di decision-making, i dipartimenti, le facoltà e le università nel loro insieme agirebbero come un’azienda e si potrebbero applicare i principi del KM. Una differenza si rileva invece nei servizi di reference, che in ambito universitario vengono offerti in modo generico a tutta la comunità come un insieme, mentre in un’azienda essi vengono personalizzati per piccoli gruppi che condividono gli stessi sistemi semantici e lavorano su progetti specifici. Poiché il KM lavora sulla condivisione della conoscenza tacita, questa attività potrebbe essere perseguita solo in gruppi omogenei e coesi all’interno dell’università. Bogliolo sostiene che esso possa essere adottato con successo in biblioteca solo se finalizzato al miglioramento della qualità dei servizi bibliotecari, cioè identificando la biblioteca come una struttura organizzativa che apprende in continuo divenire, il cui obiettivo è rendere più efficienti ed efficaci nei processi e nelle procedure. Quando si va ad applicare praticamente l’approccio knowledge-based, una delle trappole maggiori, come ricorda McDermott 51, riguarda l’utilizzo nell’utilizzo degli strumenti e concetti di gestione dell’informazione per progettare sistemi di gestione della conoscenza: conoscere un ambito o una disciplina significa infatti essere in grado di pensare nel suo territorio, e per tale motivo le idee sono significative solo in relazione agli ‘abiti mentali’ di una comunità. Spesso chi implementa le tecnologie è talmente assorbito dall’aspetto gestionale che perde di vista gli obiettivi originali del loro utilizzo. In ambito biblioteconomico, si è cominciato ad affrontare la questione dell’organizzazione e della condivisione della conoscenza in termini di sistematizzazione e di trasposizione in un nuovo contesto di strumenti ben noti nel mondo delle biblioteche digitali, e durante la ACM Digital Libraries ‘98 Conference di Pittsburgh in Pennsylvania, è stato coniato il termine di Knowledge Organization System (KOS) 52. I KOS includono tutti gli schemi per organizzare, gestire e recuperare l’informazione, con la funzione primaria Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 45 di fornire accesso ai documenti per una specifica comunità secondo un approccio knowledge-managed: ad esempio schemi di classificazione e categorizzazione che organizzano i materiali ad un livello generale, soggettari che forniscono un accesso più dettagliato, e liste d’autorità che controllano le varianti di nomi geografici e nomi propri, ma anche vocabolari altamente strutturati come i thesauri, e schemi meno tradizionali come i network semantici e le ontologie (cfr. i paragrafi 2.2.5 e 2.2.7). Essi rivestono un ruolo importante nella costruzione delle collezioni, nella scoperta e nella ricerca, nella navigazione, valutazione e visualizzazione: perciò per il successo dell’implementazione e dell’utilizzo di qualsiasi biblioteca digitale, è essenziale che questa venga organizzata, direttamente o indirettamente, da uno o più sistemi di organizzazione della conoscenza, e si può affermare che l’architettura di una biblioteca digitale è costituita dalle sue collezioni, dai suoi KOS e dai servizi che essa mette a disposizione. Vi sono molteplici modi per organizzare la conoscenza. A seconda dei contesti, i KOS possono essere presi in prestito da una biblioteca nazionale, da un motore di ricerca, oppure sviluppati localmente; possono essere applicati ai record di metadati di ogni risorsa, inseriti nei metatag, oppure separati dalle risorse della biblioteca digitale come parte del meccanismo di accesso. A fronte di queste diversità i KOS condividono le seguenti caratteristiche, che influiscono profondamente sul modo in cui sono organizzate le biblioteche digitali: - un KOS impone una particolare visione del mondo sulla collezione e sui documenti che ne fanno parte, poiché modella un dominio della conoscenza ed è progettato per un obiettivo specifico. Per tale motivo ogni KOS possiede una sua metastruttura, la cui comprensione è necessaria per l’interpretazione dei contenuti; - la stessa entità può essere caratterizzata in modi diversi, a seconda del KOS utilizzato; - il valore di un KOS deriva dal riconoscimento e dalla validazione della comunità di utenti (ad esempio organizzazioni di istruzione, associazioni commerciali o gruppi di standard); - vi deve essere sufficiente comunanza tra un concetto espresso in un KOS e l’oggetto del mondo reale cui si riferisce quel concetto, cosicché una persona sia in grado di applicare il sistema con ragionevole affidabilità. Nel più ampio contesto dell’Internet Commons, i KOS sono degli strumenti in grado di fornire chiavi di soggetto alternative, fornendo uno o più intestazioni aggiuntive che rendono i documenti della biblioteca digitale accessibili ad audience diverse, che non condividono una terminologia comune. Inoltre 46 | essi supportano un accesso multilingue, ad esempio tramite dizionari e thesauri quali il Generalized Multilingual Environmental Thesaurus (GEMET) della European Environment Agency (EEA), e forniscono termini per espandere le ricerche testuali, in ambiti poco noti all’utente o in settore interdisciplinari. Uno dei modi possibili per superare queste difficoltà terminologiche è quella di usare i KOS come supporti nella selezione di parole chiave a testo libero, come evidenziano i vocabolari del Getty Vocabulary Project (Art and Architecture Thesaurus, the Union List of Artists Names, and the Thesaurus of Geographic Names). Infine, l’utilizzo dei KOS favorisce l’analisi dei bisogni degli utenti, fondamentale in ogni progetto di biblioteca digitale. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 47 Note [1] Il termine ‘biblioteca’ viene qui utilizzato per indicare ogni organizzazione che fornisce servizi informativi, il cui scopo primario sia quello dell’acquisizione, organizzazione, preservazione e predisposizione dell’accesso all’informazione. Per ‘bibliotecari’ si intende chiunque svolga o diriga un lavoro direttamente correlato alla missione e ai servizi della biblioteca, come sopra definita. [2] Per il concetto di biblioteca come sistema aperto cfr. P. Traniello, La biblioteca tra istituzione e sistema comunicativo, Editrice Bibliografica, Milano 1986; G. Tirelli, Il ‘sistema’ biblioteca, Editrice Bibliografica, Milano 1990. [3] G. Di Domenico, Problemi e prospettive della biblioteconomia in Italia, in «Bibliotime», n. 2, luglio 2001, <http://www.spbo.unibo.it/bibliotime/num -iv-2/didomeni.htm#nota37>. Cfr. inoltre Regione Lombardia, IREF, Le professionalità operanti nel settore dei Servizi culturali. Le Biblioteche lombarde, a cura di Satef, Milano 2001, accessibile a <http://lombardiacultura.it/ricercaProfili.cfm> [4] Cfr. A. Salarelli, A.M. Tammaro, La biblioteca digitale, Editrice Bibliografica, Milano 2001, p.13 e vari interventi in La biblioteca ibrida: verso un servizio informativo integrato, atti del convegno, Milano, Palazzo delle Stelline, 14-15 marzo 2002, a cura di O. Fogliani, Editrice Bibliografica, Milano 2003. Per le problematiche e le potenzialità 48 | del Web nelle biblioteche cfr. inoltre C. Basili, La biblioteca in rete, Editrice Bibliografica, Milano 2000 e Risorse elettroniche, definizione, selezione e catalogazione, Atti della Conferenza Internazionale, Roma 2001 <http://w3.uniroma1.it/ssab/ER/it/programma.htm> [5] R. Ridi, Il mondo come volontà e documentazione. Definizione, selezione e accesso alle risorse elettroniche remote (RER), bozza dell’intervento in Risorse elettroniche, definizione, selezione e catalogazione, cit., <http://w3.uniroma1.it/ssab/er/relazioni/ridi_ita.pdf> [6] B. Tillett, Gli aggiornamenti delle AACR2 per le risorse elettroniche. La risposta di un codice di catalogazione multinazionale. Un approfondimento, traduzione provvisoria, in ibidem <http://w3.uniroma1.it/ssab/er/relazioni/ti llett_ita.pdf> [7] Regole tecniche per la riproduzione e conservazione di documenti su supporto ottico idoneo a garantire la conformità dei documenti agli originali - articolo 6, commi 1 e 2, del Testo unico delle disposizioni legislative e regolamentari in materia di documentazione amministrativa, di cui al decreto del Presidente della Repubblica 28 dicembre 2000, n. 445, consultabile a <http://www.interlex.it/testi/aipa0142.htm >. La deliberazione dell’Autorità per l’Informatica nella Pubblica Amministrazione (AIPA) sui supporti ottici, approvata il 17 ottobre 2001, intendeva risolvere i problemi di compatibilità tra la precedente deliberazione n. 24/1998, il DPCM 08/02/99 e il DPR 445/2000, che disciplinava la riproduzione e la conservazione dei documenti. copernicana non è più il lettore a girare intorno al catalogo, bensì è il catalogo a girare intorno al lettore. [ 12 ] [8] Con il termine ‘audiovisuale’, si intende ogni documento che presenta suoni registrati e immagini in movimento o ferme. Con il termine ‘multimediale’, si intende ogni medium che risiede in uno o più supporti fisici (ad es. un CD-ROM) oppure in network o sistemi di computer. I multimedia interattivi dovrebbero presentare le seguenti caratteristiche: essere controllati dall’utente, con una navigazione non lineare usando la tecnologia del computer; la combinazione di due o più media (suoni, testi, grafica, animazione e video) che l’utente manipola per controllare l’ordine e/o la natura della presentazione. [9] Cfr. M. Guerrini, Il catalogo di qualità, presentazione di L. Crocetti, Giunta regionale, Firenze 2002. [ 10 ] Convergence in the digital age. Challenges for Libraries, Museums and Archives Proceedings of the Seminar, CORDIS, 13 - 14 August 1998, Amsterdam, <ftp://ftp.cordis.lu/pub/libraries/docs/proceedings.pdf> [ 11 ] Secondo la fortunata metafora di Weston e Pernigotti (P.G. Weston, A. Pernigotti, La biblioteca nel computer : come automatizzare?, con la collaborazione di M. Ghera, presentazione di L.E. Boyle, Biblioteca Apostolica Vaticana, Citta del Vaticano 1990), come nella rivoluzione Ciuccarelli, Innocenti | P. Lyman, The Social Impact of Digital Libraries Technologies, in 2000 Kyoto International Conference on Digital Libraries: Research and Practice, Y. Kambayashi et alii (eds.), 13-16 November 2000, Kyoto University Press, Kyoto 2000, pp. 157-164. [ 13 ] Cfr. in merito Gateways to Knowledge. The Role of Academic Libraries in Teaching, Learning and Research, Lawrence Dowler Editor, Cambridge, Massachusetts and London, 1997; C. Lynch, From automation to transformation. Forty years of libraries and information technology in higher education, in «Educase Review», January February 2000, pp. 60- 68; B.L. Hawkins, P. Battin (eds.), The Mirage of Continuity: Reconfiguring Academic Information Resources for the 21st Century, Council on Library and Information Resources and Association of American Universities, Washington 1998; L. Hardesty, Do we need academic libraries?, Position paper of the Association of College and Research Libraries (ACRL), American Library Association (ALA), 2000 <http://www.ala.org/acrl/academiclib.html >; P. Bellini, Struttura e infrastrutture della biblioteca universitaria nell’era digitale: tendenze in atto, in «Bollettino AIB», vol. 4, n. 3, settembre 2000, pp.331-346; <http://www.ala.org/acrl/guides/college.html>; H.B Rader, Managing academic and research libraries partnership, in Universities libraries and other Sistemi conoscitivi per il design: una proposta metodologica | 49 general research libraries workshop, 67th IFLA Council and General Conference, 16-25 August 2001, Boston, USA; A. Byrne, After the fireworks: Opportunities and directions for university libraries, in Virtual Libraries: Virtual Communities, 21st IATUL Conference, 3-7July 2000, Brisbane, Australia. <http://www.iatul.org/conference/qutpap/byrne_full.html> [ 14 ] C. Lynch, On the Threshold of Discontinuity: The New Scholarly Genres and the Role of the Research Library, in H. Thompson (ed.), Racing toward Tomorrow. Proceedings of the Ninth National Conference of the Association of College and Research Libraries, 8–11April 1999, ACRL, Chicago 1999, pp. 410–18; cfr. anche S. Foo, A.S. Chaudhry, S.M. Majid, E. Logan, Academic libraries in transition: Challenges ahead, in Proceedings of World Library Summit, 22-26 April 2001, National Library Board, Singapore. [ 15 ] Nelle Linee guida per la valutazione delle biblioteche universitarie (edizione italiana di Measuring quality, a cura della Commissione nazionale Università ricerca. Roma, Associazione Italiana Biblioteche, 1999) si afferma che il fine istituzionale di una biblioteca universitaria è quello di «scegliere, raccogliere, organizzare e consentire l’accesso all’informazione all’utenza, in particolare all’utenza primaria, rappresentata dai membri dell’istituzione». [ 16 ] Osservatorio per la valutazione del sistema universitario. Misurazione e valutazione delle biblioteche universitarie, 1999 50 | <http://www.miur.it/osservatorio/ricbibl.ht m>. Cfr. inoltre L. Maffei, Alcuni nodi della questione ‘informazione’ nell’università italiana di oggi, in «Bollettino AIB», 1997, n.1, pp. 29-36 e D. Bogliolo, Knowledge management in Italian Univeristy libraries <http://www.uniroma1.it/documentation/G eorgeATesoro.html#1>. Per una prospettiva internazionale cfr. Bibliothèques universitaires : nouveaux bátiments… nouveaux services, sous la dir. de M.-F. Bisbrouck, Ministère de l’Èducation nationale, de la Recherche et de la Technologie, Direction de l’Enseignement Supèrieur, Paris 1998; Association of College and Research Libraries, Guidelines for Media Resources in Academic Libraries, 1999 <http://www.ala.org/acrl/guides/medresg.html> [ 17 ] Tra cui l’Università di Firenze per l’evoluzione dell’assetto organizzativo e per il progetto innovativo della University Press, il sistema bibliotecario dell’Università di Padova per il servizio Banche dati in rete, che viene erogato anche ad enti terzi con una originale formula di partnership pubblico-privato; l’Università di Bologna per il catalogo nazionale dei periodici ACNP. [ 18 ] Cfr. Rapporto sulle biblioteche italiane 2001, a cura di V. Ponzani <http://www.aib.it/aib/boll/rapp01.htm> ; L. Bardi, Le biblioteche di università italiane: problemi strutturali e soluzioni sistemiche, 21 giugno 2002, Roma <http://www.cab.unipd.it/eventi/2002/ 21602.ppt>; L. Bardi, Lo stato dell’arte dei sistemi bibliotecari di Ateneo: risultati di una ricerca, Roma, Bibliocom, ottobre 2001. [ 19 ] [ 24 ] M. Castells,The rise of the network society, in The information age: economy, society and culture, vol. 1, Blackwell, Oxford 1996, pp. 61-62. <http://www.eprints.org> [ 20 ] [ 26 ] C. Linch, From automation to transformation, cit. e B.Feret, M. Marcinek, The future of the academic library and the academic librarian: A Delphi study, in The Future of Libraries in Human Communication. 20th IATUL Conference, 17-21 May 1999, Chania, Greece, <http://educate.lib.chalmers.se/IATUL/pro ceedcontents/chanpap/feret.html> G. Solimine, Spazio e funzioni nell’evoluzione della biblioteca: una prospettiva storica, in La biblioteca tra spazio e progetto. Nuove frontiere dell’architettura e nuovi scenari tecnologici, V Conferenza Nazionale per i Beni Librari, 7-8 marzo 1996, Editrice Bibliografica, Milano 1998, p. 34. [ 21 ] L. Hardesty, Books Bytes and Bridges: Libraries and Computer Centers in Academic Institutions, American Library Association, Chicago 2000. [ 22 ] SGML è uno standard internazionale per i sistemi di markup testuali ampi e complessi, che descrive migliaia di differenti tipi di documenti. XML è uno standard per la descrizione di altri linguaggi, scritto in SGML, che permette la progettazione di linguaggi personalizzati di markup per tipi illimitati di documenti, fornendo un modo flessibile e semplici per scrivere applicazioni Web-based. I principali standard che alimentano i servizi Web sono basati XML e includono il Simple Object Access Protocol (SOAP), la Universal Description, Discovery and Integration (UDDI), il Web Services Description Language (WSDL), l’Electronic Business XML (ebXML). [ 23 ] [ 25 ] <http://web.mit.edu/dspace> [ 27 ] M. Eisenberg et alii, Re-Envisioning the Library: The Intellectual Commons of the University, Washington University, 7 December 2000, <http://www.washington.edu/change/library/appb.pdf> [ 28 ] H.M. King, The academic library in the 21st century: What need for a physical place? in Virtual Libraries: Virtual Communities, 21st IATUL Conference, 37 July 2000, Brisbane, Australia, <http://www.iatul.org/conference/proceedings/vol10/papers/king_full.html>; Construire une bibliothèque universitaire. De la conception à la réalisation, M.-F. Bisbrouck, D. Renoult (eds.), Editions du Cercle de la Librairie, Paris 1993; Les bibliothèques universitaires. Evaluation des nouveaux bâtiments (1992-2000), M.F. Bisbrouck (ed.), Ministère de l’éducation nationale, La Documentation française, Paris 2000. Per ulteriori approfondimenti cfr. anche i quaderni del Gruppo LIBER, associazione europea delle biblioteche accademiche e di ricerca. L. Hardesty, Do we need academic libraries?, cit. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 51 [ 29 ] L. Hardesty, Do we need academic libraries?, cit. [ 30 ] B. Edwards, B. Fisher, Libraries and learning resource centres, Architectural Press, Oxford 2002; A. Salarelli, A. M. Tammaro, La biblioteca digitale, cit.; The multifunctional library, 20-24 April 1998, J.P. Batalla, D.Osuna Paez (eds.), Universitat de Barcelona, Barcelona 1999. Vari learning resource centre sono stati premiati dallo UKOLN negli ultimi anni (cfr.<http://www.sconul.ac.uk/award.htm>). through personalized systems as well as through the services of information professionals» (in Digital Library Definition for DLI2, 1998 <http://scholar.lib.vt.edu/DLI2/defineDL. html>). [ 35 ] Nell’era digitale, l’informazione e il medium su cui essa è registrata può essere considerato in forma digitalizzata o meno. Naturalmente vi sono anche altri modi di categorizzare il materiale, ma la leggibilità al computer è un criterio importante. [ 31 ] [ 36 ] Beagle D., Conceptualizing an Information Commons, in «Journal of Academic Librarianship», vol. 25, n. 2, 1999, pp. 82-89. M. Halbert, Lessons from the Information Commons frontier, in ibidem, pp. 90-91. Cfr. W.Y. Arms, Automated Digital Libraries. How Effectively Can Computers Be Used for the Skilled Tasks of Professional Librarianship?, in «D-Lib Magazine», July/August 2000, vol. 6, n. 7/8, <http://www.dlib.org/dlib/july00/arms/07 arms.html> [ 33 ] [ 37 ] P.D. Leighton, D.C. Weber, Planning academic and research library buildings, 3rd ed. American Library Association, Chicago 1999, p. 887. Ad es. Infomine <http://infomine.ucr.edu>, Infoseek <http://infoseek.go.com>, Yahoo <http:www.yahoo.com> [ 34 ] [ 38 ] <http://www.si.umich.edu/SantaFe/>. Cfr. inoltre la definizione di Seamans e McMillan della Virginia Polytechnic Institute and State University: «A digital library should be a seamless extension of the library that provides scholars with access to information in any format that has been evaluated, organized, archived, and preserved. Access to this evolving collection of digital information is provided Per una storia delle biblioteche digitali e dei trend futuri cfr. Digital Library Technology Trends, Sun Microsystems, Inc., USA 2002 <http://www.sun.com/products-nsolutions/edu/whitepapers/pdf/digital_library_tre nds.pdf> [ 32 ] 52 | [ 39 ] J.C.R. Licklider, Libraries of the Future, MIT Press, Cambridge (Mass.) 1965. [ 40 ] D. Greenstein, S.E. Thorin, The Digital Library: a Biography, Digital Library Federation, Council on Digital Libraries and Information Resources, September 2002 <http://www.clir.org> [ 41 ] Cfr. Special Theme: e-Government, «ERCIM News», n. 48, January 2002, <http://www.ercim.org/publication/Ercim_ News/enw48/> [ 42 ] <www.amico.org> [ 43 ] <http://elib.cs.berkeley.edu> <http://sunsite.berkeley.edu> Series of Joint NSF-EU Working Groups on Future Directions for Digital Libraries Research, P. Schäuble, A.F. Smeaton (eds.), 12 October 1998, <http://www.iei.pi.cnr.it/DELOS/REPOR TS/Brussrep.htm>; D. Soergel, A Framework for Digital Library Research. Broadening the vision, in «D-Lib Magazine», vol. 8, n. 2, December 2002 <http://www.dlib.org/dlib/december02/soe rgel/12soergel.html>; D. Stevenson, Building Digital Libraries. Playing in the Technology Sandbox, in «Computer in Libraries», vol. 22, n. 9, October 2002, <http://www.infotoday.com/cilmag/oct02/ stevenson.htm>; DELOS brainstorming report, June 2001, San Cassiano, Italy, ERCIM-02-W02, <http://delosnoe.iei.pi.cnr.it/activities/researchforum/Br ainstorming/brainstorming-report.pdf>. [ 44 ] <http://campusgw.library.cornell.edu> [ 45 ] <http://lib.harvard.edu> [ 46 ] <http://www.jstor.org> [ 47 ] <http://www-sul.stanford.edu> <http://highwire.stanford.edu> [ 48 ] H. Besser, The Next Stage: Moving from Isolated Digital Collections to Interoperable Digital Libraries, in «First Monday», vol. 7, n. 6, June 2002, <http://firstmonday.org/ issues/issue7_6/besser/index.html> [ 49 ] Cfr. An International Research Agenda for Digital Libraries. Summary Report of the Ciuccarelli, Innocenti | [ 50 ] Cfr. D. Bogliolo, Network Management in un ente di ricerca, in DesignNet. Knowledge e Information Management per il design, atti del seminario internazionale, a cura di P. Ciuccarelli e P. Innocenti, prefazione di G. Simonelli, Edizioni Poli.design, Milano 2002, pp. 37-47; idem, Knowledge management in Italian university libraries, in The American University of Rome - AIB Regione Lazio, Distinguished Lecture Series, 10 November 2000, <http://www.uniroma1.it/Documentation/GeorgeATesoro.ht ml>; idem, Gestione della conoscenza vs gestione dell’informazione, in Incontro culturale su Modelli per l’uso dell’Informazione nelle Scienze e nelle Attività Economiche, Università degli Studi di Roma ‘La Sapienza’, 8-9 Giugno 2000, <http://www.uniroma1.it/Documentation/a damsingo.html>; G. Walsham, Knowledge Management: The Benefits and Limitations Sistemi conoscitivi per il design: una proposta metodologica | 53 of Computer Systems, in «European Management Journal», vol. 19, n. 6, December 2000, pp. 599-608; M. Santarsiero, Un modello possibile: il knowledge management per i servizi informativi, 27 giugno 2001, <http://www.gidifrbm.it/Santarsiero_workshop01.ppt>; C.W. Choo, Information Management for the Intelligent Organization: Roles and Implications for the Information Professions, in 1995 Digital Libraries Conference, March 27-28, 1995, Singapore <http://128.100.159.139/FIS/ResPub/DLC 95.html> [ 51 ] R. McDermott, Why information technology inspired but cannot deliver knowledge management, in E.L. Lesser, M.A. Fontaine, J.A. Slusher, Knowledge and communities, Butterworth Heinemann, Boston 2001, pp. 21-35. [ 52 ] Sull’argomento cfr. G. Hodge, Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority Files, The Digital Library Federation, Council on Library and Information Resources, April 2000, <http://www.clir.org/pubs/reports/pub91/c ontents.html>; Challenges in Knowledge Representation and Organization for the 21st Century. Integration of Knowledge Across Boundaries: proceedings of the Seventh International ISKO Conference, 10-13 July 2002, Granada, Spain, M.J. López-Huertas (ed.), Ergon Verlag, Würtzburg 2002. 54 | 3 Organizzazione e restituzione della conoscenza in ambienti di rete Perla Innocenti The nice thing about standards is that you have so many to choose from. Furthermore, if you do not like any of them, you can just wait for next year’s model Andrew Tanenbaum In un sistema di organizzazione dei documenti, la caratteristica più importante dell’informazione è che può essere usata fuori dal contesto. La conoscenza riguarda invece la ricostruzione delle reti di relazioni, dei contesti. Nell’ambito di questo volume, per documento si intende qualcosa che può essere localizzato e manipolato sia attraverso l’attività umana che tramite un sistema automatico come un’entità discreta. In generale tutti i documenti, indipendentemente dalla forma fisica o intellettuale che essi assumono, possiedono tre caratteristiche: contenuto, contesto e struttura, le quali possono essere ricomposte attraverso i metadati. Il contenuto stabilisce un nesso tra ciò che il documento contiene in sé o nei suoi dintorni ed è intrinseco al documento stesso. Il contesto indica il chi, cosa, perché, dove: tutti aspetti associati con la creazione dell’oggetto e comunque estrinseci al documento stesso. La struttura si riferisce all’insieme formale di associazioni situate all’inCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 55 terno o tra documenti, che possono essere intrinseche o estrinseche. Un documento digitale, rispetto ad uno analogico, è un’entità complessa, multiparte, costituito da contenuti originariamente digitali oppure derivanti da riformattazione, codificati e integrati da metadati per supportare l’archiviazione, la scoperta e l’uso del documento 1. In ambito biblioteconomico la sua natura pone una serie di questioni aggiuntive: ad esempio la questione delle unità bibliografiche nelle strutture multi-parte in un contesto digitale 2 porta a rivedere il concetto di unità bibliografica, la relazione tra record bibliografico e unità bibliografica e l’eventuale necessità di descrizioni ad un livello di granularità più approfondito. Da un punto di vista documentale, i problemi chiave riguardanti l’odierna sistematizzazione e fruibilità di documenti digitali in ambienti di rete sono sostanzialmente cinque, da affrontare in modo unitario: - gli standard di digitalizzazione: ovvero la qualità della trasposizione dell’informazione analogica in digitale, tipicamente per un’immagine esplicitabile in parametri come risoluzione, fedeltà del colore, capacità di cogliere le sfumature, consistenza della procedura attraverso tutte le sue fasi dall’acquisizione alla visualizzazione a schermo fino alla stampa; - gli standard di documentazione: ovvero come strutturiamo e contestualizziamo l’informazione per permettere la condivisione e l’utilizzo dei documenti in un ambiente informativo integrato; - le modalità di conservazione: ovvero i metodi con cui preserviamo i documenti digitali e affrontiamo il problema dell’obsolescenza tecnologica. Il rapido sviluppo delle tecnologie e il degrado dei mezzi di archiviazione digitale rende infatti questi dati inaccessibili molto più rapidamente dei dati su supporto cartaceo (Fig. 1); - le modalità di accesso: ovvero i metodi con cui si affrontano i problemi di diritto d’autore e copyright, la risposta ai bisogni dell’utente e i problemi tecnici di delivery. La loro risoluzione é essenziale laddove molti utenti devono poter accedere a risorse in un ambiente di rete come Internet; - gli standard tecnici: cioè i formati e i metodi di gestione dell’informazione. Il loro utilizzo implica lunga durata e interoperabilità. In un’accezione più ampia, interoperabilità significa efficace coesistenza su vari livelli (operativi, semantici e linguistici) di diverse risorse informative. È chiaro come l’approccio metodologico sia quello che presenta la necessità di maggiori riflessioni, perché rappresenta la base che consentirà di richiamare o individuare o meno una data informazione. La soluzione delle tematiche sopraelencate comporta infatti un lungo cammino, non risolvibile semplice56 | mente impostando una procedura unificata a-priori ma chiarendo, a mano a mano che il lavoro procede, singoli e specifici aspetti nell’ambito di un quadro unificante metodologico, basato sul riferimento agli standard. Non esiste infatti attività che noi svolgiamo quotidianamente che non sia o non possa essere regolamentata da uno standard 3, elaborato attraverso il consenso professionale ed approvato da uno o più enti riconosciuti 4. Poiché il progetto descritto nel volume si propone lo scopo di operare entro questo quadro, per cercare di definire una metodologia di base relativa al secondo dei cinque punti fissati, nei paragrafi successivi verranno analizzate in quest’ottica le tematiche relative all’organizzazione e alla gestione delle conoscenze in ambienti di rete. 3.1 Standard di digitalizzazione Oggi, solitamente, a differenti tipologie di giacimenti documentali (che siano archivi di preziosi manoscritti o letteratura grigia) corrispondono anche differenti strutture di conservazione, ubicate a volte in luoghi diversi e spesso governate da sistemi, regole di conservazioni e gestori differenti. Dal punto di vista dell’utente, ciò che contraddistingue la ricerca è proprio la frammentazione ubicativa (se non addirittura sovente lo smembramento e la perdita) che deriva da questa diaspora gestionale, l’impossibilità di ricerca statistica e quantitativa, la difficoltà di analisi comparativa. surface metadata Metadata (annotation/labeling) Documentation Explanation Digital document Operating System Software Emulator specification Original software digitization/acquisition [Fig. 1] Schema logico di un documento digitale incapsulato (rielaborazione da J. Rothemberg, 1998) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 57 Dal punto di vista del bibliotecario – o meglio del documentalista 5 – i problemi principali nella costruzione di un archivio, oltre alla già citata collocazione fisica, sono una classificazione del materiale che ne permette il ritrovamento e una modalità di conservazione che si proponga di limitare nel tempo il degrado dovuto alla manipolazione e a varie cause di deterioramento e degradazione. La creazione di archivi di giacimenti documentali analogici ha permesso, nel tempo, la possibilità di conservazione in forma semi-ordinata dei materiali accumulati, con forme di deterioramento più o meno controllate. Questi archivi, tuttavia, hanno mantenuto un livello di accesso alle fonti estremamente ridotto e parziale (se non altro per la trasportabilità limitata e la difficoltà di manipolazione), che sono rimaste, in ogni caso, di difficile recupero. Ciò è tanto più problematico per discipline come l’architettura e il design, in cui accanto a documenti testuali coesistono anche documenti visuali e materici come disegni e fotografie, che presentano proprietà quali il colore, le tessiture, le sfumature, le dimensioni fisiche, modelli e maquette, artefatti di vario tipo (prodotti, semilavorati, componenti ecc.). La formazione di un archivio digitale d’architettura e di design, oggi, è quindi al tempo stesso un tema e una problematica che si muove in questo contesto, cioè la necessità di fornire una proposta di soluzione ai tipici problemi che l’archiviazione fisica, per limiti intrinseci, non è riuscita a risolvere 6. La replica di un oggetto fedelmente a se stesso – approccio che offre la possibilità di fruizione del documento digitale con tutti i suoi attributi cromatici, grafici, dimensionali – è un problema concettualmente semplice, che oggi può fruire di una tecnologia ormai avanzata ad un livello definibile come professionale e non più di laboratorio di ricerca (i tempi del progetto di digitalizzazione dei manoscritti della Biblioteca Vaticana da parte di IBM sembrano incredibilmente lontani, pur essendo passati meno di dieci anni). Tuttavia, l’attuale tecnologia presenta una serie di problematiche che non rendono immediata tale soluzione: - una sostanziale incapacità da parte degli addetti ai lavori (bibliotecari e archivisti in primis) a realizzare il lavoro di acquisizione in prima persona, e conseguenti forti limiti di base in ogni operazione non squisitamente catalografica o archivistica; - un conseguente livello dei costi di digitalizzazione estremamente elevato per la necessità di servirsi di specialisti, cosicché le uniche operazioni in pratica realizzabili (anche in presenza di meccanismi di sovvenzione rilevanti) sono quelle che riguardano opere d’arte ad elevato valore aggiunto; - una sovente considerevole eterogeneità dei materiali, che impedisce la definizione per ogni archivio di una singola metodologia, ma impone la pluralità di strumenti e metodiche; 58 | - una sostanziale difficoltà a definire gli usi fondamentali di questi prodotti digitali, i caratteri della loro integrazione (essenziali, ad esempio, per definire le metodologie di profilatura del colore) e, infine, a gestire la loro fruizione in forma strutturata; - l’assenza di progettualità nel settore, perché da un lato rifiutata dai tecnici, interessati di solito esclusivamente allo sviluppo di algoritmi; e dall’altro dai fruitori, che non la ritengono necessaria (in ciò dimenticando la natura intrinsecamente progettuale di ogni costruzione che pure l’architettura tanto chiaramente insegna), confondendo l’automazione con il meccanicismo. Inoltre, poiché le tecnologie consentono ormai un tale tipo di conversione, è indispensabile definire di standard riferiti al materiale originale, e non autoreferenziali al sistema digitale o all’output previsto. Occorre anche definire la scelta dell’utilizzo delle tecnologie e dei dispositivi, scegliere la qualità migliore all’interno della gamma prefissata attraverso un benchmarking delle caratteristiche dei prodotti disponibili. I fattori che concorrono a formare i contenuti informativi digitalizzati includono principalmente: 1. conservazione: la salvaguardia dell’originale all’operazione di acquisizione; 2. fattori economici: maggiore risoluzione, profondità in bit, o elaborazioni possono causare maggiori costi di acquisizione e di archiviazione; 3. tecnologia: definizione del livello tecnologico di ogni singola operazione e globale dall’acquisizione alla visualizzazione. Livelli troppo alti possono semplicemente aumentare i costi, livelli troppo bassi possono causare perdita di informazione, incoerenze lungo tutto il processo possono causare colli di bottiglia che accoppiano alti costi a risultati marginali; 4. necessità degli utenti: i requisiti richiesti dagli utenti possono causare variazioni nel processo di acquisizione. I passaggi fondamentali nella progettazione di ogni operazione di acquisizione riguardano gli aspetti riportati di seguito. 3.1.1 Conservazione del dettaglio più fine Viene realizzata attraverso un esame visuale di campioni rappresentativi. Se gli oggetti sono disegnati o dipinti, l’indagine deve includere misure dell’ampiezza delle linee più fini. Se gli oggetti sono stampe fotografiche o negativi l’indagine riguarderà la misura della grana del film. Quindi la frequenza di campionamento spaziale dovrà essere selezionata per preservare adeguatamente tutti i dettagli rilevanti nelle immagini destinate alla qualità più elevata; buona regola vuole che sia normalmente almeno il Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 59 doppio dell’inverso dell’ampiezza del dettaglio più fine. Tuttavia, per motivi di spazio d’archiviazione e di tempi di acquisizione (proporzionali al quadrato della frequenza spaziale) occorre trovare un compromesso tra conservazione del livello di dettaglio e costi di archiviazione, trasmissione e acquisizione. 3.1.2 Definizione della qualità dell’immagine in funzione della finalità d’uso È ormai generalizzata la suddivisione delle immagini digitali secondo tre famiglie principali, soluzione che si adatta perfettamente anche al progetto descritto in questo volume: - l’immagine digitale è utilizzata soltanto come un riferimento visuale nel database elettronico. La qualità dell’immagine digitale richiesta è limitata sia in dimensioni che in risoluzione luminosa. La visualizzazione è di solito per uno schermo o ad una stampante a bassa risoluzione e la riproduzione esatta del colore non è fondamentale. Le immagini posso essere compresse per risparmiare spazio di archiviazione e tempo di visualizzazione; - l’immagine digitale è utilizzata per la riproduzione e la visualizzazione. I requisiti di qualità dipendono dalla definizione della riproduzione desiderata. Lo stesso vale per le tonalità di riproduzione. Attualmente, la maggior parte dei sistemi di digitalizzazione permette soltanto un output di colore a 8 bit per colore primario che, se mappato non correttamente, non consente una precisa riproduzione tonale e cromatica dell’originale; - l’immagine digitale rappresenta una ‘sostituzione’ dell’originale sia in termini spaziali che di contenuti di informazioni tonali. Questo obiettivo è il più impegnativo da raggiungere, poiché il contenuto di informazioni in termini di equivalenza di pixel varia da originale a originale. 3.1.3 Definizione del workflow, gestione delle caratteristiche dell’immagine La produzione di un’immagine fedele all’originale richiede una gestione del colore end-to-end. Un fattore chiave è certamente definire se l’operazione di digitalizzazione può avvenire direttamente od occorra procedere tramite supporti intermediari. Le due pipeline di lavoro risultano infatti abbastanza differenti e necessitano di definizione di parametri qualitativi, modalità attuative e tecniche di controllo di qualità diversi. I passi fondamentali sono dati da: - acquisizione dell’immagine: occorre definire le caratteristiche fondamentali dello strumento di acquisizione, condizioni di illuminazio- 60 | - - - - - ne, parametri di acquisizione (risoluzione, profondità di colore, parametri di camera, ecc.); definizione del formato digitale e compressione dell’immagine: la definizione dei formati grafici deve essere tale da consentire la conservazione senza perdita di informazioni; la compressione deve rendere possibile la visualizzazione in condizioni di larghezza di banda e risorse computazionali limitate; visualizzazione dell’immagine: la visualizzazione accurata di un’immagine sullo schermo di un computer richiede l’applicazione di procedure di calibrazione e profilatura per correggere le caratteristiche di dimensione, colore e luminosità dello specifico monitor, servendosi di vari parametri sul dispositivo; stampa dell’immagine: così come è necessario conoscere le caratteristiche del monitor per la visualizzazione di un’immagine, la sua stampa fedele richiede la conoscenza delle caratteristiche della stampante e della sua calibrazione; watermarking e protezione dell’immagine: un watermark è un’immagine secondaria che viene sovrapposta sull’immagine primaria, per proteggere la proprietà intellettuale o per permettere l’autenticazione e la validazione delle immagini (cfr. anche il paragrafo 2.4.3). Una valida alternativa al watermarking fisico è l’accesso selettivo alle immagini. Un esempio di accesso selettivo ai documenti visuali senza l’ausilio dei watermark è quello di SPIRO, l’OPAC della Architecture Visual Resources Library della University of California, Berkeley. La visione delle immagini derivate di dimensioni maggiori (un patrimonio di oltre 55.000 documenti) è consentita soltanto all’interno della Intranet del campus di Berkeley, mentre gli utenti esterni accedono alle immagini thumbnail e al record dei documenti 7; controllo di qualità: il controllo di qualità sull’intero sistema di acquisizione si compone di due momenti distinti: - valutazione delle prestazioni dei sistemi utilizzati: il riferimento normativo è quello della ANSI/AIMM MS441988 (R1993). Recommended practice for Quality Control of Image Scanners; - verifica della rispondenza delle acquisizioni ai parametri di progetto: questa operazione consiste nello sviluppo di un insieme di procedure per verificare il risultato dell’acquisizione. Per far sì che queste procedure costituiscano un vero e proprio controllo di qualità, occorre identificare: tempi, pasCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 61 saggi e durata dell’ispezione; strumenti hardware e software necessari all’ispezione e le unità di misura; valori per cui un prodotto risulta inaccettabile. 3.2 Standard di documentazione Quello degli standard di documentazione rappresenta il punto nodale di qualsiasi progetto per la gestione e restituzione dei documenti digitali. L’odierna situazione documentale è caratterizzata da una grande varietà di entità disponibili offline e online, un’esplosione di informazioni e di formati non organizzati e non controllati, che si evolvono nel tempo dando luogo a numerose e complesse interrelazioni. A fronte di questa eterogeneità, c’è una esigenza di tipo unificante: accedere alle risorse digitali indipendentemente dalla loro natura e tipo, area disciplinare e localizzazione, tramite degli strumenti che le descrivano e le controllino. Gli strumenti che si hanno a disposizione possono essere in modo generale suddivisi fra quelli di tipo tecnologico e quelli di tipo intellettuale. Nella prima categoria rientrano reti e protocolli di comunicazione evoluti, linguaggi di marcatura e strumenti standard per lo scambio di informazioni, standard per la digitalizzazione. Della seconda categoria fanno parte essenzialmente sia gli schemi di metadati, che sono elaborati e attribuiti sulla base elle caratteristiche specifiche degli oggetti da descrivere e gestire in rete, sia i sistemi di classificazione e indicizzazione. Entrambi sono utilizzati dai fornitori di informazione e dei relativi servizi di accesso, per descrivere i documenti; dai sistemi di ricerca e successivamente dagli utenti nel recupero di informazioni. Tra l’ampia gamma di standard disponibili, vi è una speciale categoria utilizzata per la documentazione e il recupero delle informazioni: gli standard di dati, che la natura interconnettiva del Web ha reso ancora più necessari per facilitare l’usabilità delle risorse attraverso ambiti e comunità diverse. Gli standard sono cioè fondamentali per poter trasformare collezioni digitali isolate in biblioteche digitali interoperabili. Vi sono quattro tipi di standard di dati, che usati insieme migliorano in modo sostanziale l’accesso all’informazione: 1. standard di struttura dei dati: definiscono le categorie in cui l’informazione deve essere suddivisa. Essi stabiliscono gli elementi che verranno inclusi nei record dei database, ad esempio una categoria per un nome o per una data. Alcune strutture di dati funzionano anche come linee guida, come le Categories for the Description of Works of Art (CDWA) e le Core Categories for Visual Resources (VRA) 2.0. Altre, come il formato MARC e la Encoded Archival Description (EAD) 8, funzionano sia come strutture di dati che come standard di comunicazione dei dati; 62 | 2. standard di comunicazione dei dati: facilitano lo scambio di informazioni tra la struttura dei dati e il modo in cui il valore dei dati individuali viene codificato, o etichettato in una certa struttura. I formati MARC ed EAD possiedono entrambi queste qualità; 3. standard di contenuti dei dati: sono delle linee guida che regolano l’ordine, la sintassi, la forma in cui i valori dei dati vengono immessi nelle categorie strutturali. Le RICA e le AACR2 sono degli standard di contenuti usati rispettivamente in Italia e negli Stati Uniti; 4. standard del valore dei dati: regolano i termini o le parole che saranno inserite nelle categorie definite dalla struttura dei dati. I vocabolari controllati e le liste di autorità regolarizzano e standardizzano la terminologia. Ad esempio, una lista di autorità indicherà le varianti del nome di un autore; un vocabolario controllato collegherà i sinonimi. La struttura dei dati è un contenitore in cui i valori dei dati (i termini) sono collocate in base al contenuto dei dati (le regole). L’utilizzo di questi strumenti, uniti a potenti capacità di elaborazione e di scambio delle informazioni, risulta in una documentazione e in un accesso migliore ai patrimoni informativi, in una maggiore qualità, consistenza delle informazioni e compatibilità delle strutture informative, anche tramite delle mappature tra standard diversi che favoriscono l’interoperabilità. Gli standard della documentazione esistono da molto prima dell’avvento dei computer e del Web: in un ambiente digitale, l’adozione di formati standard e di vocabolari assicura la conservazione dei dati per applicazioni future, facilita l’Information Retrieval, permette e favorisce l’interscambio delle informazioni. Ad esempio, la capacità di fornire accesso remoto ai record della biblioteca non sarebbe possibile senza l’adozione del formato MARC accettato come standard di comunicazione dei dati. Ma se gli standard sono la chiave per l’effettiva condivisione delle risorse e per l’interoperabilità dei sistemi, gli standard di ambito bibliotecario quali Z39.50 (lo standard internazionale per la ricerca e il recupero tra siti) non sono stati incorporati nei browser o nei motori di ricerca di Internet. Sebbene siano in corso ricerche per far sì che lo Z39.50 possa supportare la ricerca cross-database in sistemi Web-based, uno sviluppo sufficiente per supportare i sistemi bibliotecari è ancora al di là da venire. Al tempo stesso, sono in corso di implementazione standard tradizionali quali il MARC, e si stanno affermando il Dublin Core e l’Encoded Archival Description. A questa situazione in divenire vanno aggiunti i differenti approcci alla documentazione e le diverse tradizioni di gestione delle informazioni. Le metodologie e le pratiche della documentazione dipendono dalla natura, dal ruolo e dalle Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 63 prospettive di chi possiede le informazioni. Vi sono in generale quattro approcci principali, che si sono evoluti nel tempo in seguito a nuove sfide e contesti: - approccio archivistico: implica l’organizzazione e la descrizione dei record, di carte personali e di manoscritti, enfatizzando la funzione e la provenienza dei materiali d’archivio. Si applica a documenti, immagini, artefatti, registrazioni sonore, immagini in movimento, record elettronici ed è basato sulla creazione di finding aid, ovvero di documenti che elencano o descrivono un insieme di record nell’archivio, fornendo accesso all’utente. Questo approccio descrive collezioni, serie e gruppi di materiali, invece di focalizzasi su item individuali; è basato su standard ben definiti, come il formato MARC, RAD, APPM e EAD e include metodologie per la creazione di record di catalogo, inventari e registri e l’uso di vocabolari controllati come LCSH e AAT. Il concetto di base è che la propria collezione sia costituita da materiale unico. Questo metodo non è ancora completamente informatizzato, ma è sempre più orientato verso iniziative di condivisione dei dati; - approccio biblioteconomico (anche noto come catalogazione e classificazione bibliografica): implica la catalogazione e la classificazione di libri e di altri materiali testuali pubblicati. È basato sul concetto che vi sono molteplici item per una stessa opera, e per questo motivo la condivisione dei dati è particolarmente vantaggiosa (ad esempio la catalogazione partecipata). È guidato da principi e da pratiche che hanno origine da istituzioni guida nazionali (Biblioteca Nazionale Centrale, Library of Congress) e viene insegnato nelle scuole di biblioteconomia e pone una grande importanza sull’accesso per soggetto. Questo metodo è facilitato da una lunga tradizione di condivisione dei dati, ora gestita da associazioni e consorzi nazionali, ed è basato su standard ben definiti, come il formato MARC e le RICA, e continua a sviluppare nuovi standard (Z39.50). Include metodologie per il lavoro d’autorità e l’uso di vocabolari controllati; la sua informatizzazione è cominciata negli anni ‘70 per fornire accesso pubblico ai materiali catalogati; è basato su una catalogazione a livello dell’item, ovvero viene creato un record catalografico per ogni item, invece che ogni collezione; è potenziato dall’utilizzo di servizi analitici di riassunti e indicizzazione (come Avery Index); - approccio museografico: implica la documentazione di oggetti museali (opere d’arte, artefatti, specimen). È un metodo complesso che incorpora diversi argomenti informativi sull’oggetto (ad es. la descrizione fisica, la provenienza, la conservazione, la documentazione fotografica, dati di ricerca) ed è basato sul concetto di esemplare 64 | unico. Negli ultimi ha visto un incremento delle iniziative di condivisione dei dati; vengono utilizzati schemi di classificazione spesso basati su divisioni disciplinari o su tassonomie e il controllo d’autorità sta diventando la pratica base. Questo approccio si è rivelato prezioso perché può essere riadattato per sistemi informativi pubblici, in particolare per presentare le informazioni sulle proprie collezioni attraverso Internet; - approccio delle risorse visuali: include la catalogazione, classificazione e indicizzazione di immagini; fornisce accesso a immagini che arricchiscono l’esperienza didattica e descrive sia i singoli esemplari che insiemi di immagini, con livelli di descrizione complessi che coinvolgono sia l’esemplare che il contenuto dell’immagine. È in corso l’adozione di standard come il MARC, e al momento si utilizzano sia vocabolari controllati istituzionali che liste locali, ponendo un grande importanza sull’accesso per soggetto. Questo approccio ha uno stretto collegamento con la tradizionale documentazione museale nella descrizione di immagini di oggetti museali, e usa sistemi di classificazione altamente sviluppati sebbene non standardizzati. Un esempio di rilievo è quello del database di risorse visuali SPIRO della University of California, Berkeley, degli Archivi Alinari di Firenze e del RomeDAI - Guide for the photographs degli archivi del Deutsches archäologisches Institute a Roma. In base all’approccio scelto tra quelli sopraelencati, l’interoperabilità può essere raggiunta a livello tecnico, contenutistico o organizzativo, oppure per una combinazione di questi. Questa situazione certamente rappresenta una sfida e un’opportunità, poiché l’interoperabilità è necessaria per poter garantire la compatibilità tra i diversi livelli che compongono la biblioteca digitale ma al tempo stesso la diversità del Web ha anche fornito un’occasione unica per la personalizzazione e la specializzazione. 3.2.1 Il mondo degli schemi di metadati: princìpi e questioni pratiche Il termine metadati, letteralmente ‘dati strutturati riguardo altri dati’, é sempre più ubiquamente adottato, secondo modalità diverse, da differenti comunità professionali addette alla progettazione di sistemi documentali. Una definizione puntuale é quella di Anne J. Gilliland-Swetland del Getty Research Institute, secondo cui i metadati sono «the sum total of what one can say about any information object – at any level of aggregation» 9 (per information object si intende un’entità digitale, singola o aggregata, indipendentemente dal tipo e dal formato, che può essere identificata e manipolata dall’uomo o da un computer come un’entità discreta). I metadati sono cioè serie struttura- Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 65 te di informazioni relative ad un documento costituito da un insieme di dati. Essi non soltanto identificano, descrivono e localizzano entità (digitali e analogiche) in un sistema distribuito di rete, ma ne documentano il comportamento, le funzioni e l’utilizzo, le relazioni con altre entità e le modalità di gestione e di accesso, facilitandone il recupero. Nell’era dell’ICT, queste caratteristiche rendono i metadati sempre più importanti nella messa a punto di sistemi efficaci, interoperabili, scalabili e longevi. È importante ricordare che l’idea dei metadati è nata da un nuovo concetto sorto al di fuori della tradizionale arena bibliografica: a mano a mano che venivano creati dati scientifici in forma digitale, in particolar modo dati geospaziali, divenne evidente la necessità di surrogati per fornire informazioni sui contenuti degli insiemi digitali. Un numero sempre maggiore di tipi e di quantità di oggetti divenne progressivamente disponibile in forma digitale, ma si capì che i dati grezzi non avevano valore senza informazioni sul modo e l’obiettivo in cui erano stati raccolti, sui formati, le piattaforme per visualizzarli e manipolarli, le restrizioni sulla riproduzione e sul riuso, oltre naturalmente ad informazioni per l’identificazione più convenzionali come l’autore o il produttore il titolo, il soggetto e l’abstract. Inoltre il valore dei metadati è limitato, se non vi è accordo comune su quali elementi o contenuti dovrebbero possedere: la loro affidabilità e la loro intelligibilità verrebbero meno senza una buona dose di standardizzazione. Tutte le ragioni per cui l’indicizzazione e la catalogazione sono necessarie per i documenti analogici si applicano in modo ancora maggiore ai metadati per i documenti digitali. E come nel mondo della catalogazione e indicizzazione tradizionale, servono diversi livelli di metadati, a seconda del tipo di documento e dell’utilizzo che se ne intende fare. Il concetto è determinante sia per gli autori di documenti che per chi cerca informazioni: usati in modo efficace, nel cyberspazio rendono l’informazione visibile e accessibile etichettando i suoi contenuti in modo consistente. Le risorse il cui valore è effimero potrebbero richiedere solo un livello minimo di descrizione, mentre i documenti con un valore di ricerca o commerciale più duraturo potrebbero avere descrizioni più complete. I bibliotecari e gli indicizzatori hanno prodotto e standardizzato metadati per secoli, ma è importante rilevare che al di fuori dell’ambito biblioteconomico il termine assume significati molto ampi. I computer, ad esempio, catalogano i loro dati interni per tenere traccia di differenti oggetti discreti e funzionare correttamente: questo tipo di catalogo di dati è conservato dal computer come una relazione ricorsiva che è stata definita ‘metadati’. Nel mondo dei database il termine viene utilizzato per fare riferimento a informazioni strutturate che ne descrivono l’organizzazione: ad esempio il modo in cui i dati 66 | sono organizzati le tabelle e i campi di un database, inclusi i tipi di dati, la gamma di valori accettabili e il modo in cui questa viene trasformata. Inoltre vi sono alcune incomprensioni comuni sul termine. Ad esempio, si suppone che i metadati facciano riferimento ad informazioni codificate secondo uno schema specifico e non alla tecnologia che le gestisce, e nemmeno agli spazi concettuali che controllano il valore degli elementi dell’informazione. In questo senso MARCXML o DCMES non sono metadati, ma schemi di metadati, XML è solo uno strumento tecnologico e i linguaggi di indicizzazione, gli schemi di classificazione, ecc., non sono metadati in se stessi, ma valori o regole per trovare il giusto valore da dare a elementi di metadati. Tipologie di metadati Fino ad oggi i bibliotecari hanno focalizzato la loro attenzione su metadati in associazione ad attività di descrizione o catalogazione. Oltre alla funzione descrittiva, tuttavia, per essere efficace uno schema di metadati deve anche stabilire un struttura e una terminologia standard, in modo che i vari campi possano essere mappati ad un unico concetto e i termini inseriti abbiano una codifica chiara (in contrasto, la maggior parte dei contesti non catalografici affronta il problema della struttura dei dati piuttosto che dei loro contenuti). L’obiettivo di base è quello di cercare di comprendere e di affrontare l’universo documentale, semplificandolo attraverso la categorizzazione e la classificazione, che creano delle realtà artificialmente ordinate. Queste classificazioni servono ad ignorare le idiosincrasie delle entità individuali e a manipolarle attraverso le caratteristiche collettive più generali. L’emergenza del Web e la crescita esplosiva di contenuti online hanno ulteriormente stimolato questo compito ordinativo e l’interesse nei metadati si è evoluto in risposta alle sfide del nuovo contesto. Pur condividendo alcuni degli obiettivi delle biblioteche, i metadati svolgono tuttavia un ruolo in qualche modo diverso, dovuto al fatto che il Web si differenzia dalle modalità di catalogazione tradizionali 10. L’ambiente in cui esiste il catalogo e i suoi standard è relativamente indipendente e controllato, la creazione e il mantenimento di un catalogo di record sono svolti da una comunità di esperti e l’interfaccia del catalogo è in genere ristretta ai sistemi bibliotecari integrati. Infine, lo scambio di record catalografici è regolamentato in forma di download di record in formato MARC da enti autorizzati come il nostro Servizio Bibliotecario Nazionale (SBN) o l’americano Online Computer Library Center (OCL). In contrasto, il Web assomiglia ad una specie di Far West informativo, in cui il mantenimento di informazioni è perseguito da diverse comunità con una grande varietà di standard descrittivi. I contenuti e i servizi forniti da queste comunità coesistono nello stesso spazio e il loro uso Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 67 di frequente attraversa i confini delle diverse comunità, dando origine a quello che Stuart Weibel ha definito Internet Commons. Ottenere il consenso sui metadati e su altri standard è importante per gestire e conservare i documenti digitali nel tempo, per permettere l’interoperabilità e la ricerca attraverso database multipli. Gli insiemi di metadati finora creati, conformi per quanto possibile agli standard nazionali e internazionali, sono diventati strumenti che i professionisti dell’informazione stanno usando per sfruttare queste opportunità, e affrontare numerose questioni relative alla gestione di grandi quantità di dati: l’aumentata accessibilità attraverso collezioni multiple o collezioni virtuali dai materiali che sono distribuiti attraverso numerosi repository; la contestualizzazione del documento; molteplici modi di ricercare le informazioni, presentare i risultati e manipolare gli oggetti informativi, senza compromettere l’integrità dei questi oggetti; la multiversionalità; questioni legali relative ai diritti di proprietà e di riproduzione di un documento e delle sue diverse versioni; la conservazione nel lungo periodo; modelli economici sostenibili per la loro creazione e gestione. I metadati possono essere distinti in base ai loro attributi, quali la fonte da cui provengono, i metodi di creazione (automatica, semiautomatica, manuale), i tempi di creazione (insieme al documento o aggiunti in seguito), la qualità (se creati o meno da esperti), la staticità, la struttura standard o meno, la conformità semantica e il livello di riferimento (collezioni o singola entità). Certamente sono entità mutevoli nel tempo e nello spazio e continuano ad accrescersi entro il sistema entro cui dimorano, durante il ciclo di vita del documento con il quale si relazionano. I metadati non possono essere considerati come ‘definitivi’, perché una volta creati non rimangono statici, ma vanno incontro a modifiche (a volte ad eliminazioni) e a localizzazioni diverse nel corso del tempo. Certo anche l’adozione dei metadati non è esente da problemi. Uno dei detrattori più noti, Michael Gorman, li ritiene «un tentativo sconsiderato di trovare una sorta di terza via tra il deserto dei motori di ricerca e della ricerca a testo libero e la grande architettura del controllo bibliografico che i bibliotecari hanno sviluppato negli ultimi centocinquant’anni», prodotti da «quelli che, senza alcuna conoscenza della catalogazione, né riguardo per essa, come alchimisti bibliografi, cercano la pietra filosofale che ci offrirà una catalogazione efficace senza spese e accesso efficace senza vocabolari controllati» 11. Ma la realtà dei fatti ne sta dimostrando l’importanza e l’utilità, tanto che stanno avendo un ruolo sempre più importante nel mondo della catalogazione. Con la parcellizzazione delle conoscenze, anche le specificità degli stessi metadati sono andate via via differenziandosi a seconda delle condizioni in cui essi si muovono insieme agli oggetti cui si riferiscono. L’esistenza di una moltepli68 | cità tipologica di metadati sarà il nodo cruciale per la continuità di accesso e di utilizzo, fisico e intellettuale ai documenti digitali. I metadati sono spesso suddivisi in tre categorie concettuali (Tab. 1) indicate dal Working Group on Preservation Metadata e adottate come modello della CAL Digital Library (anche se alcune istituzioni, come il Getty Institute, distinguono però in 5 categorie): 1. metadati descrittivi: facilitano l’identificazione e il recupero della risorsa (ad es. metadati bibliografici) e rappresentano il tentativo di affrontare la proliferazione delle differenti versioni ed edizioni di documenti digitali. Nel mondo dei documenti a stampa, il ciclo di pubblicazione solitamente rinforza il processo editoriale e crea degli intervalli tra l’uscita delle diverse pubblicazioni. Ma per un’opera digitale, che è di per sé altamente mutevole, spesso i processi e gli intervalli vengono eliminati e le varianti sono create velocemente e senza troppo pensare all’impatto sul controllo bibliografico; 2. metadati amministrativi: supportano la gestione del documento all’interno di una collezione, facilitandone l’accesso e la conservazione. Possono descrivere il visualizzatore o il player necessario, oppure attributi come la risoluzione dell’immagine, le dimensioni del file, la velocità di campionamento, fornire dati su come e quando un oggetto digitale è stato creato e archiviato e sulla gestione dei diritti. I metadati amministrativi conservano le informazioni necessarie per mantenere un lavoro digitale accessibile nel tempo: nel caso di un libro, ad esempio, indicano che sono necessari tutti i file individuali per ottenere il volume, la loro localizzazione e quali applicazioni e formati sono necessari per la visualizzazione. Sono particolarmente importanti quando si spostano i file su un nuovo server, oppure si effettua il refreshing o la migrazione dei file a scopo conservativo; 3. metadati strutturali: collegano fra loro i componenti di oggetti informativi complessi, fornendo le indicazioni tecniche necessarie, descrivono le associazioni all’interno di o tra oggetti informativi individuali interrelati tra loro. In un libro, composto di capitoli e paragrafi, i metadati strutturali spiegano come le immagini delle singole pagine formano i singoli capitoli, e come i capitoli costituiscono il libro. I metadati strutturali aiutano cioè l’utente a navigare tra i singoli componenti di un oggetto composito, evidenziando che, per molti lavori in forma digitale, non è sufficiente la semplice visualizzazione del documento, poiché l’utente deve poter navigare attraverso esso e si aspettano un certo comportamento, in particolare quando ha di fronte la versione digitale di un documento cartaceo 12. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 69 Tipo Definizione Metadati descrittivi Metadati che descrivono e identificano il contenuto (intellettuale) di un documento, come il MARC e Dublin Core Metadata Element Schema - Record catalografici - Finding aid per il recupero dei documenti - Indici su database specializzati - Link ipertestuali tra risorse Web - Annotazioni degli utenti - Metadati generati automaticamente in sistemi di archiviazione Metadati amministrativi Metadati utilizzati nella gestione e nell’ammnistrazione dei documenti, includono informazioni sulla proprietà e sulla gestione dei diritti - Informazioni sulle modalità di acquisizione - Regesto dei diritti di proprietà intellettuale e di riproduzione - Documentazione dei requisiti di accesso legale - Informazioni sulla reperibilità - Controllo delle versioni - Informazione sulla fonte originale (URN, handle) - Informazioni su chi ha digitalizzato e come - Informazioni su chi è responsabile del documento Metadati strutturali Metadati che indicano come mostrare e navigare tra i documenti digitali - Descrizione delle relazioni tra file digitali multipli, come l’ordine delle pagine in un libro digitale Metadati di conservazione (Getty Institute) Metadati relativi alla conservazione dei documenti Documentano: - Requisiti hardware e software per la conservazione - Status conservativo - Azioni per la conservazione della versione digitale o fisica del documento (ad es. refreshing e migrazione) Metadati tecnici (Getty Institute) Metadati che descrivono le funzionalità di un sistema e il comportamento dei metadati - Informazioni di digitalizzazione (risoluzione, dimensioni dei pixel, compressione ecc.) - Dati di autenticazione e sicurezza (dati criptati, password) Metadati di uso (Getty Institute) Metadati relativi al livello e al tipo di utilizzo dei documenti - Regesto dell’uso e del comportamento dell’utente - Gestione profilo utente - Riutilizzo del contenuto - Informazioni relative all’esistenza di versioni multiple - Informazioni relative alle registrazioni di visualizzazione [Tab.1] I diversi tipi di metadati e le loro funzioni 70 | Esempi La ‘piramide descrittiva’ dei dati 13 continuerà a crescere sempre di più con il progressivo sviluppo di nuove modalità di combinazioni di metadati e con il crescente bisogno da parte degli utenti di conoscenze più dettagliate sulle similarità e differenze dei documenti. Come ricorda Carl Lagoze della Cornell University, i metadati non sono monolitici, ma rappresentano piuttosto «multiple views that can be projected from a single information object» 14: implicano perciò un approccio modulare nell’architettura come il Resource Description Framework (RDF) 15, che permette a differenti comunità di associare e mantenere pacchetti di metadati multipli per le risorse Web, o l’OAI (Open Archive Initiative) che definisce un’infrastruttura tecnologica tesa a garantire l’integrazione e l’interoperabilità di archivi distribuiti. Princìpi e questioni pratiche I metadati sono un importante collegamento nella catena di valore dell’econo-mia della conoscenza, ma vi è ancora molta confusione su come dovrebbero essere integrati nei sistemi di gestione dei documenti. In un articolo 16 stilato dai responsabili di due prominenti iniziative, Dublin Core Metadata Initiative (DCMI) e Institute for Electrical and Electronics Engineers (IEEE) Learning Object Metadata (LOM) Working Group, sono state affrontate queste questioni in modo puntuale e comprensivo, suddividendole in princìpi e questioni di carattere pratico. Princìpi Modularità È la chiave principale per ambienti caratterizzati da fonti di contenuto profondamente diverse. La modularità permette di creare nuovi insiemi basati su schemi di metadati preesistenti. La dimensione modulare inoltre gioca un ruolo importante nella scoperta dei documenti perché gli utenti di solito cominciano la ricerca usando termini semplici e perfezionano le query nei passaggi successivi. Le descrizioni più complesse permettono agli utenti di effettuare ricerche più granulari, specifiche di un certo ambito e di alcuni aspetti delle risorse, o fornendo informazioni essenziali per la conservazione e gestione dell’accesso alla risorsa. Namespace Un namespace è una collezione formale di termini, gestiti secondo un criterio logico o un algoritmo, che permette l’identificazione univoca degli elementi e rappresenta una parte fondamentale dell’infrastruttura del W3C (e in particolare dello schema XML). Il protocollo di base del Web, ad esempio, è http, un namespace che garantisce che un dato URL sia unico a livello globale. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 71 Ogni elemento di un metadato è un namespace regolato da regole e da convenzione determinate dall’ente che lo ‘registra’ e lo mantiene. Le dichiarazioni di namespace permettono di definire il contesto di un particolare termine, assicurando in tal modo che esso abbia una definizione unica nei confini di quel dichiarato namespace. Ad esempio il Dublin Core Metadata Element Set viene definito da una collocazione Web specificata da un URI, e tutti gli elementi Dublin Core nell’ambito dell’obiettivo di questa dichiarazione di namespace sono riconoscibili dal prefisso ‘dc.’. Altri esempi di schemi di namespace sono il Biblink e il ROADS Template. Usando questa infrastruttura, chi progetta i metadati può selezionare gli elementi da metadati già esistenti, identificando chi li gestisce. Estensibilità Le architetture di metadati devono facilmente accogliere la nozione di uno schema di base, con elementi aggiuntivi che personalizzano una certa applicazione ai bisogni locali o a quelli di un contesto specifico, senza compromettere l’interoperabilità fornita dallo schema di base. Refinement Il mondo delle applicazioni si differenzia in base al livello di dettaglio necessario o desiderabile. Gli standard di metadati dovrebbero consentire di scegliere il livello di dettaglio appropriato per una certa applicazione. Poiché popolare i database di metadati è costoso, vi sono forti incentivi economici a creare metadati con sufficienti dettagli. Vi sono due nozioni da refinement da considerare: la prima è l’aggiunta di qualificatori che rifiniscono o rendono più specifico il significato di un termine (ad es. ‘data di creazione’, ‘data di modifica’ sono attributi dell’elemento ‘data’), la seconda implica le specifiche di schemi particolari o di insiemi di valori che definiscono la gamma di valori di un dato elemento. In questo modo si può incrementare l’interoperabilità semantica attraverso le applicazioni, facendo riferimento ad un insieme di valori comune. Multilinguismo È uno degli aspetti più ampi del multiculturalismo, che include, ad esempio, il modo in cui le date vengono rappresentate su calendari diversi, la direzione in cui il testo viene visualizzato e letto, le connotazioni culturali di certe icone e pittogrammi, le pratiche standard (l’ordine dei nomi, standard di collazione, standard sugli articoli). Molti di questi aspetti, ovviamente, vanno al di là del contesto dei metadati. Tuttavia è importante che i metadati possano descrivere le caratteristiche rilevanti, e che facciano questo rispettando le differenze culturali e linguistiche a livello globale e locale. 72 | Questioni pratiche Profili di applicazione Poiché nessun singolo insieme di elementi di metadati soddisferà mai i requisiti funzionali di tutti i sistemi, i profili di applicazione permettono di mescolare e armonizzare gli schemi nel modo più appropriato ai bisogni di una specifica comunità 17. Un profilo di applicazione è un assemblaggio di elementi di metadati selezionati da uno o più schemi di metadati e combinati in uno schema composito. L’obiettivo è quello di adattare o combinare schemi esistenti in base ai requisiti funzionali di una particolare applicazione, conservando al tempo stesso l’interoperabilità con gli schemi base originali. I profili di applicazione raggiungono questa modularità attraverso una serie di meccanismi e di documentazione volti ad armonizzare ed identificare i diversi elementi di metadati: la dichiarazione del numero di elementi obbligatori di un insieme, la specifica delle relazioni e dell’indipendenza degli elementi, la restrizione dello spazio di valore degli elementi e la dichiarazione dei namespace selezionati, fonte/autorità responsabile della creazione e della manutenzione dei profili stessi, regole d’uso, vocabolari controllati utilizzati. Esempi di profili di applicazione sono il Biblink Core 18, il DC Education Working Group, i ROADS Document Template, il CIMI Profile for Cultural Heritage Information e il Bath Profile for Library Application and Resource Discovery. In realtà il concetto non è nuovo: da diverso tempo molte applicazioni combinano elementi provenienti da più schemi, definendo determinati elementi come ‘locali’, aggiungendone di nuovi o modificando la semantica di schemi esistenti (ad es. i vari formati MARC, e l’uso tipico del numero 9 del formato UNIMARC per denotare un dato locale). Sintassi e semantica per l’interoperabilità La semantica riguarda il significato e la sintassi la forma: sono necessari accordi su entrambe perché due comunità possano condividere i metadati, ovvero occorre una convenzione condivisa sui valori di identificazione e di codifica. Tuttavia è importante mantenere la sintassi e la semantica il più separate possibile. La mancanza di stabilità nel mondo dei linguaggi di markup enfatizza la necessità di mantenere l’indipendenza tra la semantica degli elementi di metadati e la loro rappresentazione sintattica. Il linguaggio XML, che oggi rappresenta ancora una piccola parte dei markup sul Web, è il linguaggio ideale per la codifica e lo scambio di dati strutturati. La possibilità di creare namespace in XML fornisce capacità strutturali che HTML non possiede, rendendo più facile raggiungere i principi di modularità e di estendibilità. Le specifiche di schema XML definiscono un linguaggio che consente la specificazione dei profili di applicazione, che aumenteranno le prospettive di interoCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 73 perabilità. Infine, deve essere notato che vi è un terzo requisito per l’interoperabilità, al di là della sintassi e della semantica: i vocabolari di contenuto, che potrebbero essere illimitati come un linguaggio naturale. Gli schemi di metadati si differenziano in contenuti e struttura, che è particolarmente difficile da mappare. È possibile combinare questa interoperabilità semantica, supportata da un framework comune e flessibile come XML, con mappe semantiche create o potenziate dalle persone (ad esempio mappature di metadati) per sviluppare delle applicazioni di metadati human-understandable 19. Modelli di associazione Vi sono vari modi di associare i metadati alle risorse. I metadati inseriti all’interno del linguaggio di markup di una risorsa. Questo implica che i metadati vengano creati insieme alla risorsa, spesso dall’autore. Non è chiaro se siano migliori i metadati creati dagli autori stessi o quelli creati da professionisti, ma in termini pratici la descrizione delle risorse è costosa e non sistematica, e quindi ogni investimento da parte degli autori nella descrizione dei loro lavori intellettuali è comunque preziosa. I metadati interni possono anche essere soggetti ad harvesting, e il presunto incremento in visibilità che potrebbe derivarne è un incentivo per la loro creazione 20. I metadati associati sono invece mantenuti in file strettamente collegati alla risorsa che descrivono e possono essere o meno essere soggetti ad harvesting. Il vantaggio deriva dalla relative facilità di gestione dei metadati senza associare il contenuto della risorsa stessa, ma questo beneficio è acquisito a costo della semplicità, poiché è necessaria la co-gestione dei file delle risorse e dei file dei metadati. Infine i metadati third-party sono mantenuti in un repository separato da una organizzazione che può avere o meno il diretto controllo o l’accesso ai contenuti delle risorse. Tipicamente, questi metadati sono mantenuti in un database che non è accessibile agli harvester. Tuttavia la Open Archives Initiative propone un sistema che incoraggia l’apertura dei repository di metadati tra server che utilizzano l’Open Archives Initiative Metadata Harvesting Protocol (OAIPMH)21. Le questioni di sintassi e i modelli associativi vengono spesso confusi. Ognuno di questi tre idiomi sintattici può essere facilmente inserito nel markup di una risorsa digitale o gestito come un’entità separata. Una data risorsa informativa spesso avrà record di metadati multipli che riflettono i vari obiettivi e prospettive delle organizzazioni che li creano e che li gestiscono. Identificazione e denominazione degli elementi di metadati Lo scopo dei namespace URI sul Web è quello di far sì che ogni elemento di un insieme di elementi possa essere rappresentato da un nominativo di indirizzo globale, il suo URI. Identificatori globali invarianti rendono molto più facile 74 | l’elaborazione informatica dei metadati attraverso linguaggi e applicazioni , ma non sono facilmente letti dalle persone. La denominazione persistente rimane una questione fondamentale nella costruzione di biblioteche digitali: sebbene il Web abbia portato ad un incremento dell’accesso ai contenuti, la sua architettura ha violato la tradizione di fornire informazioni di localizzazione relative ad un lavoro, indicando invece la localizzazione precisa. Il sistema di localizzazione precisa, cioè l’URL, porta spesso ai messaggi di errore (404 - File Not Found) che risultano nella maggior parte di casi dalla normale manutenzione dei siti Web (ridenominazione di cartelle, di directory, riorganizzazione delle localizzioni dei file). Negli ultimi anni è stato fatto molto lavoro sulla denominazione indiretta (PURL, URN e handle), ma oltre ad esservi disaccordi sulla forma di denominazione indiretta migliore, vi sono anche controversie se il nome persistente dovrebbe essere semanticamente leggibile o meno. Registri di metadati Con il progressivo aumento del numero di metadati e di profili di applicazioni, l’importanza della gestione e dei ruoli dei registri è destinata ad aumentare 22. Con diversi gradi di funzionalità, essi assumeranno le caratteristiche di un dizionario digitale, disponibile in consultazione per i progettisti di applicazioni, i creatori e i gestori dei metadati, le applicazioni e gli utenti finali. Poiché ogni schema di metadati o profilo di applicazione è soggetto a evoluzioni, i registri manteranno le relazioni tra le diverse versioni degli schemi, in modo da promuovere l’interope-rabilità semantica e informatica . Completezza della descrizione Non tutti gli elementi dello schema di metadati di un sistema sono necessariamente appropriati per ogni tipo di risorsa, ma vanno selezionati in base al valore appropriato e alle best practice dell’ente creatore dei metadati. Descrizioni di metadati dettagliate possono migliorare la precisione della ricerca, ma richiedono un maggiore investimento e rendono più difficile promuovere la consistenza. Di contro le descrizioni semplici sono più facili e meno costose da generare, ma possono generare maggiore ‘rumore’ nei risultati della ricerca. Oggettività vs. soggettività Il processo di creazione dei metadati può implicare un input sia soggettivo che obiettivo. Alcuni metadati sono chiaramente oggettivi e possono anche essere generati in modo automatico; altri metadati possono essere soggettivi, sia perché alcuni elementi sono soggetti a differenti punti di vista (assegnazione di parole chiave, riassunti del contenuto in un abstract), o perché sono specificatamente intesi a rappresentare una valutazione soggettiva (la recensioCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 75 ne di un libro o una presentazione). Anche elementi più formali di metadati diventano soggettivi quando usati in un contesto culturale o disciplinare che dipende dall’interpre-tazione locale. Il requisito primario della progettazione dei metadati è quello, per quanto possibile, di rendere esplicito il contesto. Generazione automatica Prima del Web, la maggior parte dei metadati per il recupero dei documenti erano creati manualmente, con un’attività intensa e onerosa di catalogazione bibliotecaria che risulta costosa e poco pratica per molti dei materiali disponibili su Internet. I motori di ricerca oggi indicizzano una significativa porzione del Web e offrono accesso indicizzato a basso costo, generalmente secondo criteri pubblicitari. Tra questi due estremi vi è un’ampia gamma di modalità di creazione di metadati che possono essere rese automatiche, e che probabilmente diventeranno sempre più importanti a mano a mano che le tecniche di elaborazione del linguaggio naturale, il data mining, gli algoritmi di riconoscimento dei profili e dei pattern diventano più efficaci. Sarà più facile ed economico combinare metadati già forniti dalle applicazioni (ad es. data di creazione, elementi con tag strutturali, formati di file e informazioni correlate), metadati forniti dal creatore (keyword, autori, affiliazioni, ecc.) e metadati basati sulla deduzione (es. classificazione basata su algoritmi di classificazione automatici). Da quanto evidenziato sopra, è chiaro come i metadati siano un componente chiave dell’infrastruttura informativa, necessaria per aiutare a creare l’ordine nel caos documentale in ambienti di rete. Essi forniscono descrizioni, classificazioni e organizzazioni di differente qualità e organizzate in base a differenti scopi che rispecchieranno obiettivi, e modelli di business dei fornitori delle informazioni. Ma perché queste opportunità possano realizzarsi saranno necessarie alcune convergenze di formati di codifica e di semantiche approvate universalmente. Nei prossimi paragrafi verròà analizzata la categoria dei metadati descrittivi alla luce di quegli schemi nati per facilitare l’identificazione e il recupero dei documenti digitali online. 3.2.2 Metadati descrittivi I metadati descrittivi non sono una novità, essendo stati elaborati da tempo in ambito bibliografico per consentire l’accesso a vari tipi di documenti. Essi includono schemi di classificazione (Classificazione Decimale Dewey, Library of Congress Classification, Classificazione Decimale Universale, ecc.), regole di catalogazione (Regole Italiane di Catalogazione per Autore, Anglo-American Cataloguing Rules, Regeln für die Alphabetische Katalogisierung, ecc.) e formati bibliografici (MARC e tutte le sue declinazioni locali: UNIMARC, USMARC, ecc.). La strutturazione dei dati é sempre stata importante nello sviluppo dell’organizzazione e della rappresentazione delle informazioni, ma 76 | l’avvento di nuovi media informativi con potenti capacità di elaborazione e l’ampliarsi degli orizzonti in varie discipline hanno determinato nuove problematiche nella catalogazione e nella restituzione dei documenti. La descrizione potrebbe costituire un impedimento alla scoperta dei documenti, anche se le tecnologie di rete hanno diminuito le barriere spazio-temporali: questo perchè la scoperta dei documenti varia in base alla struttura, al tipo e al contenuto del documento, e allo scopo di chi cataloga. Inoltre bisogni informativi complessi richiedono che sia possibile effettuare query parallele in sistemi informativi specifici, per permettere l’accesso ad archivi informativi distribuiti. In particolare, la rapida crescita di documenti digitali disponibili sul Web ha comportato in questi ultimi anni una serie di sforzi da parte di una molteplicità di attori della catena documentaria per garantirne l’identificazione e la localizzazione, sia seguendo tecniche e strumenti consolidati delle biblioteche, che adottando un approccio più snello, che sfrutta direttamente la codifica e le informazioni interne agli oggetti-documenti. Gli standard descrittivi correnti, basati su un modello bibliografico, sono progettati per entità analogiche, statiche e materiali, con caratteristiche relativamente semplici e definite. Essi si trovano in difficoltà di fronte alla descrizione di materiali digitali, temporalmente instabili e interrelati in modi complessi e diversificati e non riescono a tenere il passo con le trasformazioni tecnologiche, distinguendo inoltre ancora tra risorse elettroniche e audiovisive piuttosto che tra documenti analogici e digitali 23. La situazione attuale richiede un ripensamento di questi standard: l’ISBD NBM (Non Book Materials) venne concepito nel 1977 come una semplice categoria ‘diversa’ rispetto ai documenti a stampa, mentre il più recente ISBD ER (Electronic Resources) tende a specializzarsi sulle cosiddette ‘risorse elettroniche remote’ e ad abbracciare sempre più tipologie di documenti che rientrano negli audiovisivi. I metadati descrittivi si pongono l’obiettivo di permettere la scoperta di collezioni e di documenti attraverso l’uso di strumenti di ricerca, e forniscono un contesto sufficiente a capire cosa è stato recuperato. Ma quando le collezioni sono molto ampie o si cerca attraverso collezioni multiple, come succede sul Web, scoprire i documenti che ci interessano diventa come cercare un ago in un pagliaio. Senza standard e una costante verifica e conservazione dei metadati descritti, queste grandi collezioni sarebbero inutili. Uno standard di metadati descrittivi e al tempo stesso di standard strutturale molto conosciuto per le biblioteche è il MARC (MAchine-Readable Catalog), utilizzato per catalogare entità bibliografiche. Il MARC assegna nomi ai campi e sottocampi del record leggibile da una macchina, senza specificare i dati che devono essere inseriti in quei campi e sottocampi, indicazione che proviene dagli standard di contenuto, come le RICA, le AACR2, gli schemi di classifiCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 77 cazione e le liste di voci di soggetto. Negli ultimi anni, parallelamente alla creazione degli OPAC Web e dell’ISBD (ER), il MARC si è evoluto per rispondere alle sfide degli ambienti di rete aggiungendo campi specifici obbligatori per la descrizione delle risorse sul Web (ad esempio il campo 538 per i requisiti di sistema e le modalità di accesso, i campi 256 e 516 per le caratteristiche dei file, il campo 856 per la localizzazione elettronica e accesso) 24 ed è stato creato uno standard MARC XML 25. Il successo che hanno incontrato nuovi tipi di metadati dimostra che il MARC funziona certamente molto bene nella biblioteca tradizionale, ma non è stato progettato per descrivere immagini, file audio e altri nuovi tipi di media ed è carente a livello di granularità semantica e di strutturazione tecnica dei dati 26. Se il MARC non è in grado di fornire la flessibilità richiesta in quest’ambito, ciò non significa che non verrà più utilizzato. Vi sono miliardi di record in formato MARC nei cataloghi online: in termini di tempo, energie e risorse, il costo di una conversione in altri formati sarebbe improponibile. Piuttosto, lo scenario attuale indica che sarà necessario mantenere l’interoperabilità con altri schemi di metadati per il Web. L’ultimo decennio del ‘movimento dei metadati’ ha incluso lo sviluppo di schemi di metadati generali come Dublin Core (cfr. paragrafo 2.2.3), GILS (Government Information Locator Service) 27, e schemi di metadati per ambiti più specifici come MPEG-7 (cfr. paragrafo 2.2.4), TEI (Text Encoding Initiative), EAD (Encoded Archival Description) 28, CIMI (Consortium for the Interchange of Museum Information), VRA (Visual Resources Association) 29, Categories for the Description of Works of Art (CDWA) 30, Content Standard for Digital Geospatial Metadata (CSDGM) 31 e molti altri che hanno in comune una sintassi machine-readable. Le numerose crosswalk o mappature tra diversi schemi di metadati 32(cfr. paragrafo precedente) denotano lo sforzo di stabilire un raccordo fra i formati bibliografici strutturati e i metadati dei documenti digitali, per garantire l’interoperabilità tra sistemi e database multipli 33. Il mondo dei metadati sta diventando ogni giorno più complesso, a seconda degli standard creati dalle diverse comunità: un giardino, secondo la fortunata metafora di Priscilla Caplan, in cui nascono e crescono mille fiori, dove esistono molte differenze, ma anche diverse affinità 34. I metadati descrittivi si distinguono per livello di specificità, struttura, maturità, tipo di utenza e di utilizzo, orientamento o meno a funzioni bibliografiche sulla linea tracciata dal modello FRBR 35, risorse descritte, sintassi usata (alcuni schemi come l’EAD o MPEG-7 sono molto articolati mentre altri, come ad esempio Dublin Core o le VRA Core Categories, esprimono delle semplici categorie semantiche). Il loro scopo comune rimane comunque quello di descrivere, identificare e usare risorse in rete. 78 | 3.2.3 Dublin Core Metadata Element Set (DCMES) Breve storia La Dublin Core Metadata Initiative (DCMI) è un’organizzazione nata nel 1995 a Dublin, nell’Ohio, nell’ambito di un workshop della OCLC (Online Computer Library Center) che ha riunito bibliotecari, ricercatori sulla biblioteca digitale, fornitori di contenuto ed esperti di linguaggi di markup con l’obiettivo di migliorare gli standard per la scoperta delle risorse informative in ambienti di rete 36. Le biblioteche, come osservato, hanno tradizionalmente adottato l’approccio che impiega un singolo schema omnicomprensivo per tutti i tipi di documenti e tutti i gruppi di utenti. In presenza di nuovi tipi di documenti, vengono aggiunti nuovi campi a questo framework, oppure si modificano le regole di campi già esistenti; e quando le comunità mostrano il bisogno di nuovi metadati, anche questi vengono incorporati nello schema esistente. Le critiche a questo approccio rilevano che lo schema è diventato così complesso che soltanto degli esperti altamente specializzati (i catalogatori di biblioteca) sono in grado di assegnare i metadati, che il sistema è troppo lento nell’adattarsi a nuovi di tipi di documenti e molti utenti hanno bisogno di specifici metadati che non vengono contemplati nel mondo del MARC. Le metodologie di catalogazione delle biblioteche erano e continuano ad essere troppo complesse e costose per fornire una base ragionevole per la descrizione di contenuti Web, e sono nella maggior parte dei casi inappropriati per gli ambienti in rete, che hanno un contenuto effimero e disseminato in una varietà di fonti che spesso non coincidono con enti autorevoli e riconosciuti. Questa situazione ha portato alla creazione del Dublin Core Metadata Element Set (DCMES, o più semplicemente Dublin Core o DC) 37, come schema di metadati di scoperta che permettesse agli utenti di ricercare attraverso diversi documenti, catalogati sia in modo approfondito (spesso ereditati dai sistemi tradizionali di catalogazione) che generico (nuovi o in forma digitale) sia dai professionisti che dagli autori. L’obiettivo iniziale della DCMI è stato quello di fornire descrizione di uno specifico tipo di risorsa: semplici documenti Web in HTML, non interrelati con altre risorse e con un ciclo di vita molto semplice, indicati come Document-Like Object o DLO. Questi DLO sono stati utilizzati per facilitare la scoperta interdisciplinare e intertipologica, utilizzando due metafore: - DC come linguaggio pidgin (coniata da Tom Baker, membro della DCMI) ovvero come un linguaggio grezzo e con una sintassi ridotta usato per comunicazione di base tra individui che hanno linguaggi e background diversi; - metafora del turista digitale (coniata da Ricky Erway of Research Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 79 Libraries Group), che viaggia in un paese con un linguaggio che non conosce e si porta con sé un insieme di frasi base per comunicare durante la sua visita. La chiave della semplicità è costituita da un vocabolario limitato e da una struttura semplice, ovvero senza construtti sintattici e utilizzando principalmente verbi al presente e frasi dichiarative che appiattiscono eventi ed entità. Progressivamente è aumentato l’interesse per arricchire questo schema e creare dei record catalografici più ricchi con versioni, linguaggi e codifiche multipli. L’approccio alternativo della comunità Dublin Core si basa su contenitori e pacchetti di metadati interconnessi, ognuno dei quali sono mantenuti da una specifica comunità. In base a questo approccio, ogni gruppo di utenti può supportare i pacchetti di metadati di cui ha bisogno per i suoi usi specifici, continuando al tempo stesso a interoperare con quelli di altre comunità. Rispetto agli oltre 800 campi del MARC, lo schema originario di Dublin Core proposto nel dicembre 1996 presentava soltanto 15 elementi di base (Fig. 2), definiti usando un set di 10 attributi ricavati dalla norma ISO 11179. Ciascun elemento è a sintassi indipendente e opzionale, ripetibile e senza ordine prefissato, in modo da permettere sia a professionisti delle biblioteche sia a non esperti una descrizione comune del materiale catalogato. Il set minimo si è attualmente esteso anche a sottoelementi o qualificatori, implementati in modi diversi dalle varie comunità di utenti, ma il nucleo originario della descrizione, che oggi conta 15 descrittori, è rimasto stabile. 15 Elementi di Dublin Core Contenuto Proprietà Istanza Titolo Creatore Data Soggetto Altro responsabile Tipo di risorsa Descrizione Editore Formato Fonte Diritti Identificatore Lingua Relazione Copertura [Fig. 2] Dublin Core semplice: gli elementi base nella traduzione di Antonio Scolari 80 | Oggi il Dublin Core è diventato uno standard diffuso in tutto il mondo (ANSI/NISO Z39.85 – 2001 e standard ISO nel 2003) 38 e tradotto in oltre 20 lingue, consentendo la descrizione di un’ampia gamma di oggetti digitali e facilitando al tempo stesso l’integrazione e l’interoperabilità tra diversi sistemi cognitivi. Lo schema è in progressiva via di sviluppo verso una forma più allargata e dettagliata, anche per consentire una migliore mappatura con altri metadati (Fig. 3), e d’altronde il nome stesso (core) indica l’assunto che DC coesisterà con altri set di metadati. La versione aggiornata del formato, che ha visto focalizzare l’interesse di musei, agenzie ed organizzazioni commerciali, si caratterizza per: - semplicità di utilizzo, in quanto si rivolge sia a non catalogatori che a specialisti (permette infatti a ciascun autore di autocatalogare i documenti nello stesso header dell’HTML o XML); - interoperabilità semantica, poiché stabilisce una rete comune di dati concordati nel loro significato e valore; - interdisciplinarietà; - flessibilità ed estensibilità, in quanto permette di integrare e sviluppare Dublin Core Unimarc Title 200 200 517 700 701 710 711 200 610 606 675 676 680 686 330 210 701 711 200 210 608 336 Creator Subject Description Publisher Contribution Date Type Format $a Title proper $e Other Title information (for subtitle) $a Other Variant Titles (for other titles) $a Personal Name - Primary Intellectual Responsability, or if more than one: $a Personal Name - Alternative Intellectual Responsability $a Corporate Body Name - Primary Intellectual Responsability, or: $a Corporate Body Name - Alternative Intellectual Responsability $f First Statement of Responsability $a Uncontrolled Subject Terms Tropical Name Used as Subject (for LCSH and MeSH) UDC DDC ICC Other Classification Systems $a Summary or Abstract $a Name of Publisher, Distributor, etc. $a Personal Name - Alternative Intellectual Responsability $a Corporate Body Name - Alternative Intellectual Responsability $g Subsequent Statement of Responsability (if role know) $d Date of Publication, Distribution, etc. $a Form, Genre or Physical Characteristics Heading $a Type of Computer File (provisional) [Fig. 3] Mappatura di Dublin Core con UNIMARC della Dublin Core Metadata Initiative Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 81 la struttura dei dati con significati semantici diversi ed appropriati al contesto di applicazione; - modularità, grazie alla natura della sua struttura; - consenso internazionale in oltre 30 nazioni: attualmente DC viene utilizzato come base di sistemi descrittivi di molteplici comunità di interesse, tra cui istituzioni educative, biblioteche, istituzioni governative, settore della ricerca scientifica, autori di pagine Web, e-business, Knowledge Management. Queste caratteristiche ne fanno una potenziale alternativa per il materiale digitale rispetto a formati più elaborati di catalogazione bibliografica, applicabile al tempo stesso alla descrizione di documenti diversi, indipendentemente dal formato, dall’area disciplinare o culturale. I formati MARC sono progettati per accogliere tutte le più minute informazioni bibliografiche, ma non sempre sono appropriati per la creazione di finding aid o per inventari museali. Forse con Dublin Core si perde la specificità di un certo tipo di materiale, ma si guadagna in trasparenza dell’informazione di base, ed è a questo livello che può avvenire una cooperazione interdisciplinare. Ad oggi questo schema di metadati è stato adottato dalla European Committee for Standardization / Information Society Standardization System (CEN/ISSS), è uno standard officiale del W3C ed è formalmente approvato dai governi di alcune nazioni per promuovere la scoperta delle informazioni governative in forma elettronica (ad es. la National Library Helsinki lo ha adottato come standard informativo nazionale ed è diventata il primo affiliato nazionale della DCMI). Il potenziale incremento di visibilità delle risorse di una collezione attraverso settori e ambiti disciplinari diversi, ad un basso costo, è certamente invitante. Il Dublin Core prende infatti in considerazione l’intero ciclo di vita di una risorsa informativa, ovvero la sequenza di eventi che ne segnano lo sviluppo e l’uso (ad esempio la creazione, l’elaborazione di una bozza, la revisione di un articolo, la pubblicazione di un libro, la trascrizione su un altro supporto, la traduzione, la derivazione di una nuova opera). I servizi che necessitano di descrizioni semanticamente più ricche continueranno ad utilizzarle, ma usando Dublin Core potranno offrire anche strumenti di scoperta interdisciplinari. La metafora del turista digitale è appropriata in questo senso: i viaggiatori su Internet che cercano informazioni in discipline straniere possono usare il ristretto vocabolario di Dublin Core per individuare risorse che altrimenti sarebbero passate inosservate. Dublin Core non intende sostituire altri standard di metadati, ma piuttosto coesistere – spesso nella medesima descrizione – con altre semantiche come supporto aggiuntivo ai metodi esistenti per la ricerca e l’indicizzazione di 82 | metadati Web-based in ambiti disciplinari diversi 39, indipendentemente dal fatto che le corrispondenti risorse sia documenti analogici o digitali. La semplicità di Dublin Core può essere al tempo stesso la sua forza e la sua debolezza: la semplicità abbassa i costi di creazione dei metadati e promuove l’interoperabilità, ma non riesce ad accomodare la semantica e la ricchezza funzionale supportata da altri schemi di metadati più complessi. In effetti, il Dublin Core acquista visibilità al costo della ricchezza semantica; tuttavia, la natura stessa di questo schema incoraggia l’utilizzo di più ricchi schemi di metadati in combinazione con esso. Indipendentemente da quale di questi due approcci si scelga, ogni collezione dovrà affrontare il problema pratico di come rendere i propri metadati disponibili alle altre collezioni e ai software di ricerca esterni (harvesting). Per le biblioteche, questo potrebbe significare estrarre record più semplici in formato Dublin Core dai record in formato MARC ed esportarli. Un altro principio base della descrizione che utilizza Dublin Core è quello del ‘principio 1:1’ (one-to-one rule): in ogni singolo record di metadati può essere descritto soltanto un unico oggetto o risorsa o istanza. Anche i surrogati delle risorse devono essere descritti separatamente dall’oggetto originale, in modo che il record di metadati della fotografia di una sedia contenga metadati sulla fotografia e non sulla sedia e l’autore sarà l’autore della fotografia, non della sedia – un criterio opposto ad esempio a quello adottato nelle soprintendenze italiane. Sono state infine elaborate delle bozze di schemi redatte dal W3C per le convenzioni di codifica del XML, descritte nelle linee guida per l’implementazione di Dublin Core in XML 40. Questi schemi hanno un approccio modulare per offrire possibilità, in particolare cercano di permettere un’applicazione per selezionare vari sottoinsiemi di termini di Dublin Core in combinazione. Come ha scritto Stuart L. Weibel, coordinatore del gruppo di standardizzazione dei metadati dell’OCLC, «Dublin Core is probably our best hope for a common meeting ground between a collection of metadata standards that is evocative of the Tower of Babel. Although the DC is not large enough (it is a core, after all), nor granular enough, or adequately qualified (yet) for many metadata uses, we can all ‘numb down’ our metadata enough to contribute records into a common pot. And sometimes that makes all the difference in the world. So with this progress report we finally see DC coming into its own. NISO passed it as ANSI Standard Z39.85 (albeit by the skin of its teeth). But more importantly, the Open Archives initiative adopted it as the only required metadata element set OAI-compliant archives must support. This development alone may be enough to solidify the position of the DC at the center of disparate communities with metadata to share» 41. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 83 Dublin Core semplice La definizione ‘Dublin Core’ in genere si riferisce allo schema di base (simple): i 15 elementi descrittivi semantici del Dublin Core (Fig. 2) e un limitato insieme di qualificatori opzionali verificati e approvati dalla DCMI. Dal 1995 la DCMI si è impegnata a perfezionare lo schema e a fornire informazioni semanticamente più specifiche sulle risorse Web. Altri risultati della DCMI sono il Warwick Framework 42 e la maggior parte del lavoro sull’utilizzo del Resource Description Framework (RDF) per i metadati descrittivi. L’obiettivo è quello di descrivere la risorsa e le sue relazioni con altre risorse (ad esempio con il campo ‘Relazioni’) che a loro volta possono essere o meno descritte dal DCMES. Non ci sono limiti di lunghezza di campo in Dublin Core, l’ordine degli elementi nello schema è irrilevante e ogni elemento è indipendente dall’altro, opzionale e ripetibile. Il cosiddetto principio di numb-down significa semplicemente che in qualsiasi utilizzo degli elementi, i qualificatori dovrebbero poter essere eliminati e i valori dell’elemento dovrebbero essere in ogni caso utili per la scoperta del documento. L’idea base è che i qualificatori dovrebbero migliorare la precisione di una parte dei metadati, ma i metadati dovrebbero essere utili anche senza questa precisione. Baker 43 definisce Dublin Core un ‘piccolo linguaggio’ per effettuare una particolare classe di affermazioni sulle risorse. Come i linguaggi naturali, esso ha un suo vocabolario di termini simili alle parole, le cui due classi (elementi e qualificatori) funzionano con affermazioni quali nomi e aggettivi, e presenta una sintassi per organizzare gli elementi e i qualificatori in affermazioni. Ognuno dei 15 elementi possiede: - un’etichetta descrittiva intesa a fornire una comprensione semantica comune dell’elemento; - un nome unico costituito da una sola parola comprensibile al calcolatore, inteso per fare una specificazione sintattica degli elementi più semplice per gli schemi di codifica. Tecnicamente parlando, un elemento o un qualificatore di Dublin Core è un identificatore unico formato da un nome (ad esempio ‘Titolo’) preceduto dal prefisso di un URI nel namespace in cui viene definito. Dublin Core qualificato e i profili di applicazione I primi lavori sul DCMES si erano focalizzati sul requisito di semplicità, in modo che utenti non specializzati fossero in grado di formulare record descrittivi basati su uno schema relativamente semplice di 15 elementi a testo libero. Negli ultimi anni nell’ambito della comunità della DCMI, è nata una corrente detta 84 | ‘strutturalista’ (in opposizione alla corrente ‘minimalista’ che sostiene l’uso di un DCMES semplice) che ha affermato la necessità di creare meccanismi per arricchire le capacità descrittive del DCMES di base, sostenendo che i soli elementi sono insufficienti per la descrizione di una risorsa reale e non metaforica. Il risultato di questi tentativi hanno dato luogo al Dublin Core qualificato (qualified), che utilizza i qualificatori aggiuntivi per rifinire ulteriormente il significato della risorsa e permettere di aumentare la specificità o la precisione della descrizione. La DCMI ha invitato le varie comunità d’uso ad elaborare dei qualificatori specifici per i propri bisogni di complessità e particolarità, e i loro record in teoria dovrebbero essere interoperabili con altri record che contengono qualificatori scelti da altre comunità e anche con gli schemi DCMS non qualificati, grazie al principio di numb-down e all’uso di vocabolari controllati o di regole di codifica. Tuttavia la DCMI non funziona esattamente come un’autorità di controllo, e l’assenza di linee guida chiare e di motivazioni hanno dato origine in passato alla proliferazione di schemi di Dublin Core qualificato che rendono l’interoperabilità un miraggio. È stato un passo utile in questo senso l’istituzione di una commissione per la revisione e approvazione dei qualificatori e di un registro di conformità ai principi dell’interoperabilità e per verificare la conformità agli standard. I 15 elementi del DCMES sono le caratteristiche che definiscono Dublin Core come linguaggio, mentre i qualificatori modificano le proprietà delle affermazioni di Dublin Core specificando ‘che tipo’ di autore, di titolo, di soggetto, di data, di relazione ecc. I qualificatori comprendono due classi: - qualificatori di valori: conservano un identificare per un vocabolario, una codifica o un linguaggio del valore e indicano informazioni contestuali o regole di apparizione che aiutano nell’interpretazione del valore di un elemento. Sono basati su standard esterni quali la DDC e su regole di codifica (ad es. ISO 8601 per data, ISO 639/1 per la lingua); - qualificatori degli elementi (type), che sono utilizzati per rifinire ulteriormente il significato semantico di un elemento. In questo contesto, è emerso il concetto di profilo di applicazione 44 come un modo di dichiarare quali elementi dei namespace sono utilizzati in una particolare applicazione o progetto. I profili di applicazione sono definiti come schemi che consistono di elementi di dati derivati da uno o più namespace, combinati insieme dagli implementatori e ottimizzati per particolari usi locali. Il DCMI-Libraries Working Group ha ipotizzato vari possibili utilizzi del DCMES e dei profili di applicazione in ambito bibliotecario: - utilizzo come formato di interscambio tra sistemi diversi che usano standard di metadati o formati differenti; Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 85 - harvesting dei metadati da fonti nell’ambito e al di fuori della biblioteca; supporto della creazione di record catalografici semplici per le risorse in tipi diversi di sistemi; possibilità di esporre i dati in formati MARC ad altre comunità tramite la conversione nel formato DCMS; permettere l’acquisizione di metadati di scoperta delle risorse da creatori non bibliotecari che utilizzano il Dublin Core. Aspetti critici e potenzialità Alcuni esperti, tra cui Carl Lagoze 45, sostengono che il Dublin Core non sia semanticamente attrezzato per un utilizzo spinto dei qualificatori, e che si dovrebbe optare per la modularità quando si trova di fronte ad una varietà di requisiti descrittivi. Il punto è che tale descrizione è specifica di un contesto, e né lo schema né il vocabolario di DCMES secondo Lagoze sono comunque sufficienti per questa descrizione. Mentre i 15 elementi sono rimasti sostanzialmente invariati nel corso degli anni, la questione dei qualificatori ha dato luogo ad una serie di interpretazioni e di modelli difformi, nel tentativo di creare degli strumenti per accomodare la complessità e l’estensibilità del Dublin Core con la semplicità del Dublin Core base. Lagoze suggerisce di non ignorare gli scopi originari di DCMES, ma piuttosto di definire dei framework per la creazione di descrizioni più complesse che possano co-esistere insieme ai pacchetti separati, e che siano in grado di descrivere le entità in modo più complesso. Molte comunità, tra cui quella delle biblioteche, hanno cercato di capire come rendere ciò possibile. FRBR 46, il framework dell’IFLA, ad esempio riconosce i vari aspetti del ciclo di vita di un contenuto intellettuale e distingue tra opere astratte, le loro manifestazioni e gli item che sono prodotti da queste manifestazioni. Il progetto Harmony 47 afferma che la consapevolezza degli eventi è vitale per la comprensione ed espressione di maggiori dettagli descrittivi delle risorse. Descrizioni più ricche dovrebbero non dovrebbero essere basate sulla qualificazione degli elementi di Dublin Core, ma costruite su modelli di dati più espressivi: questo è stata una della maggiori considerazioni dell’Open Archive Initiative (OAI), il cui approccio al metadata harvesting esemplifica la nozione di modularizzazione dei metadati, utilizzando lo schema semplice di Dublin Core per l’interoperabilità tra comunità diverse, supportando al tempo stesso metadati specifici delle singole comunità. Lo sviluppo di un modello di qualificazione con uno scopo ben chiaro ha definito una nicchia importante per Dublin Core nell’ampia ecologia dei metadati. Altrettanto importante per la comunità della DCMI è il completamento della documen- 86 | tazione di supporto per renderlo utilizzabile con strumenti Web comunemente diffusi. In tal modo la DCMI sposterà il focus delle sue attività dai 15 elementi alle partnership e interazioni con schemi di metadati multipli. I critici di Dublin Core sostengono inoltre che DCMES 1.1 fornisce soltanto una generica descrizione delle categorie semantiche, non ci sono regole per determinare o rappresentare il contenuto ma soltanto linee guida generali in stato di bozza sul sito della DCMI. Di conseguenza i progetti che usano DCMES per la descrizione delle risorse devono sviluppare le proprie convenzioni, uno sforzo difficile e che richiede molto tempo. Forse è la natura stessa di questo standard a non richiedere delle linee guida canoniche e l’aspettativa è che le comunità che condividono le stesse risorse svilupperanno insieme delle regole per uno specifico settore, un compito tuttavia arduo. Si critica poi il fatto che DCMES sia nato come un movimento dal basso, in modo indipendente dalle organizzazione esistenti e senza una struttura formale per gestirlo. Tuttora la grande diversità degli implementatori di Dublin Core rende difficile raggiungere il consenso sulle questioni più complesse e la partecipazione all’iniziativa, tranne la struttura direttiva, è basata principalmente sull’impegno di volontari. Inoltre, in seno allo DCMI, chi emette gli standard è preoccupato di identificare un approccio comune e condiviso per assicurare l’interoperabilità e le economie di scala, mentre gli implementatori, che in parte usano gli standard, in più vogliono poter descrivere aspetti specifici di quella risorsa in un modo ‘speciale’. La separazione tra chi crea gli standard e tra gli implementatori può essere considerata una falsa dicotomia (molte delle persone attualmente coinvolte nel mondo dei metadati prendono parte ad entrambe le attività, il che costituisce uno dei punti di forza della DCMI), tuttavia i due gruppi hanno priorità differenti 48. Sia gli elementi che i qualificatori possono essere espressi in lingue diverse dall’inglese. La vaghezza che caratterizza le modalità di riempimento dei 15 elementi è intenzionale: Internet è un luogo caotico in cui un approccio più disciplinato, top-down verso la standardizzazione è irrealistico, specialmente per un utilizzo in ambiti e linguaggi multipli. Un modo per risolvere questo problema è offerto dal più ampio framework dei profili di applicazione, paragonabili ad idiomi regionali. Gli implementatori che hanno bisogno di un linguaggio applicativo più espressivo di un pidgin possono combinare degli elementi e dei qualificatori di Dublin Core con altri elementi di altri namespace, formando un più ricco vocabolario o inserendoli in un modello di dati sintatticamente più sofisticato. Questa soluzione è ritenuta ragionevole dai più, fintanto che gli implementatori rispettano la distinzione tra i namespace, in cui agli elementi e ai qualificatori sono date Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 87 definizioni, e i profili, in cui elementi di namespace multipli vengono soltanto riutilizzati, combinati, adattati e limitati 49. Il profilo è dunque il focus naturale per descrizioni complete, il pacchetto di metadati preso come un insieme. Alcuni gruppi di lavoro della DCMI stanno sviluppando profili specifici di alcuni ambiti, verificando i bisogni descrittivi in ambito didattico e governativo per determinare quale sia l’appropriato mix di elementi di Dublin Core con elementi di altri namespace, creando magari nuovi elementi aggiuntivi non contemplati dagli standard esistenti. Il Dublin Core è stato adottato in numerosi progetti internazionali, che ne hanno favorito ulteriormente la diffusione. Il Nordic Metadata Project, inteso a promuovere l’adozione del Dublin Core nei paesi nordici, ha sviluppato strumenti per la creazione, l’harvesting e l’indicizzazione di metadati basati su DC. Uno dei risultati più interessanti è il generatore di URN (Universal Resource Name), un’applicazione fornita di linee guida sviluppata seguendo una sintassi di URN basata sui numeri bibliografici nazionali, che sta avendo un ampio successo nel nord Europa. Lo UKOLN ha promosso il progetto Resource Organisation and Discovery in Subject-based Services (ROADS) 50, progettato e implementato come un sistema user-oriented di scoperta delle risorse. Tra le varie funzionalità, vi è un elenco di mappature tra formati di metadati. Il Consortium for the Computer Interchange of Museum Information (CIMI) è stato uno dei principali sperimentatori e implementatori del DCMES, includendo un livello di descrizione più dettagliato per soddisfare requisiti come la ricerca sui diritti di proprietà e le modalità d’uso 51. Ha definito un DTD XML per DCMES e ha creato un ampio numero di record utilizzando DC non qualificato, verificandone l’utilità nella scoperta di risorse ad un livello generale. Il progetto di Instructional Management Systems (IMS) è il frutto di una collaborazione tra EDUCOM e il National Institute for Standards and Technology’s Information Technology Laboratory ed è uno degli schemi di metadati più altamente sviluppati per un dominio specifico. Mathematics Subject Classification è uno dei sistemi di classificazione previsti da Dublin Core, ed è utilizzata per il motore di ricerca sviluppato nel progetto dell’Unione Europea European Libraries and Electronic Resources in Mathematical Science (EULER) 52. L’obiettivo principale di EULER è la realizzazione di un one-stop shop per la ricerca di risorse informative per la matematica quali libri, pre-print, pagine Web, abstract, collezioni di articoli e recensioni, periodici, rapporti tecnici e tesi. Il risultato è una metainterfaccia Web per interrogazioni parallele dirette a una collezione etero88 | genea di database. Una strategia simile potrebbe essere messa in campo per la connessione delle classificazioni: le descrizioni degli oggetti identificati a partire da diverse classificazioni, opportunamente codificate, potrebbero entrare a far parte dei metadati gestiti dal motore di ricerca. In ambito italiano 53 l’Istituto Centrale per il Catalogo Unico ha redatto un elenco di progetti finalizzati prevalentemente all’ambito dei beni culturali, che utilizzano i metadati per fini in prevalenza di accesso, per risorse prevalentemente testuali, poi immagini e quindi audiovisivi. 3.2.4 MPEG-7 Secondo Peter Lyman e Hal R. Varian dell’University di California a Berkeley «the world’s total yearly production of print, film, optical, and magnetic content would require roughly 1.5 billion gigabytes (1.5 Exabytes) of storage» 54. Il bisogno di accedere a questa incredibile quantità di materiali audiovisuali eterogenei richiede degli strumenti standard, veloci ed efficaci per il recupero e la selezione di vari tipi di materiali multimediali (ad esempio trovare documenti con query non testuali ma visuali o tramite entrambi i modi) sia da archivi digitali (applicazioni ‘pull’) sia da broadcast audiovisuali in streaming sul Web (applicazioni ‘push’). Gli standard MPEG, creati dal Moving Picture Coding Experts Group (MPEG) 55, sono standard di descrizione di contenuti multimediali che cercano di rispondere alle esigenze di interazione uomo-computer fornendo ricche descrizioni dei contenuti multimediali. Si basano sugli standard ISO/IEC (International Standards Organization/International Electrotechnical Committee 56 per la compressione, decompressione e rappresentazione codificata di immagini in movimento, audio, e file audiovisuali. Sono stati formalizzati vari tipi di MPEG: - MPEG-1: per l’immagazzinamento e il recupero di immagini in movimento e audio su supporti di conservazione; - MPEG-2: per la televisione digitale, satellitare e via cavo; - MPEG-4: per la codifica del contenuto come oggetto digitale manipolabile individualmente o collettivamente; - MPEG-7: approvato nel 2001 come standard ISO #15938 per permetter di recuperare il contenuto multimediale. L’approccio di MPEG-7 è quello di fornire una descrizione di informazioni audiovisuali digitali (incluse immagini statiche, modelli 3D, audio, video, multimedia) attraverso il campionamento (sampling) e l’utilizzo di termini di ricerca testuali, e indipendentemente dalla codifica, dalla trasmissione, dal supporto, dall’immagazzinamento o dalla tecnologia (Fig. 4). Viene fornito: un core di descrittori (Ds) per varie caratteri- Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 89 stiche del contenuto multimediale; una struttura predefinita di descrittori e delle loro relazioni, chiamati Description Schemes (DSs). Le descrizioni sono di carattere bibliografico (autore, titolo), semantico (informazioni sul chi, cosa, come dove degli oggetti ed eventi rappresentati) e strutturale (istogramma di colore, misurazioni del totale di colore associato ad un’immagine, o del timbro di uno strumento musicale). Si basano sulle rappresentazioni di dati definite da MPEG-1,2,4. MPEG-7 mira ad aumentare l’uso degli schemi di metadati come Dublin Core, nella descrizione e nel recupero di materiali audiovisuali: incorpora nella sua struttura ogni forma di metadati, sia proprietari che pubblici, in modo da espandere la capacità per la ricerca e la condivisione dei dati. Ad esempio, Il MPEG -7 Working Group del Department of Canadian Heritage ha in corso due progetti sulle possibili applicazioni di questo standard nei National Archives, nella Canadian Heritage, nella National Film Board of Canada e nella Canadian Broadcasting Corporation (CBC), mappato con Dublin Core (Fig. 6) 57. Tuttavia MPEG-7 non standardizza l’estrazione automatica di descrizioni o caratteristiche di documenti audiovisuali, né specifica le caratteristiche necessarie per i motori di ricerca o per i programmi che intendano utilizzare queste descrizioni che vengono lasciate alla creatività degli sviluppatori. Vi sono varie tecniche per cercare contenuti visuali utilizzando le caratteristiche intrinseche di un oggetto digitale: ad esempio gli strumenti di annotazione e ricerca video sviluppati dalla IBM, AudioID – del Fraunhofer IIS, Fingerprinting Audio Clips, i vari metodi per l’estrazione degli attributi, la segmentazione, la classificazione, l’analisi e dell’Audio Retrieval e le interfacce grafiche utente 3D e interattive sviluppati da George Tzanetakis della University of British Columbia, o l’accesso B2B a streaming media del motore di ricerca SingigFish.com. Le definizioni (schemi di descrizione e descrittori) sono esprimibili in XML, che offre la soluzione ideale a livello di sintassi, struttura, cardinalità e limitazioni del tipo di dati. 3.2.5 Information Retrieval Nel mondo attuale, caratterizzato da un oceano di documenti virtualmente disponibili e dalla creazione e interconnessione di basi dati, le tecnologie informatiche offrono capacità di elaborazione e di memoria sempre più potenti. Le conoscenze depositate, tuttavia, hanno valore soltanto se accompagnate da sistemi di recupero efficaci ed efficienti, che forniscono cioè accesso solamente a tutti quei documenti di una collezione che sono rilevanti per l’utente. I problemi che si pongono riguardano quindi: 90 | - il sistema di rappresentazione di documenti spesso complessi, come i multimedia e i rich media (l’adozione di un vocabolario controllato e aggiornato, di un alto livello di specificità terminologica e di relazioni semantiche); - il sistema di accesso ai documenti (e quindi il problema del richiamo e della precisione, ossia la capacità di recuperare interamente e soltanto la documentazione pertinente e rilevante). Se non trovare nulla è frequente nelle ricerche online, come ha osservato Foskett ancora più fuorviante è trovare qualcosa e credere di avere recuperato tutte le informazioni disponibili 58. È stato infatti evidenziato che la ricerca per soggetto negli attuali cataloghi sul Web risulta in un basso grado di richiamo e di precisione, che mette a dura prova il livello di futility point (la quantità massima di documenti tra i quali un utente è disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative). In queste circostanze vi è un reale bisogno di descrizioni consistenti e sistematiche e di appropriate classificazioni, in particolar modo per le risorse eterogenee e complesse. L’insieme dei sistemi di Information Retrieval rappresentano una nuova strategia di recupero dei documenti in rete, le cui metodologie sviluppate seguono due diversi approcci 59: Collection and Classification Content organization Media Information Creation Information Usage Information Content Management Content Description Spatio-temporal Structures Datatypes and Structures Audio and Visual Features Semantic Structures Link and Media Locations Basic Elements User Interaction Models Navigation and Access Users Preferences Summaries Partitions and Decompositions Usage History Variations Root and TopLevels Elements Schema Tools Packages [Fig. 5] Il contesto in cui si muove MPEG-7 in D. Dale, R. Rog, 2002) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 91 Dublin Core Element Definition MPEG-7 Descriptor Title A name given to the resource CreationInformation/Creation/Title(@type”original”) Creator An entity primarily responsible for making the content of the resource CreationInformation/Creation/Creator Subject The topic of the content of the resource CreationInformation/Classification/Subject Description An account of the content of the resource An entity responsible for making the resource available Creation/Abstract ContentDescription/Creation/Abstract CreationInformation/Creation/Creator (Role/@term-”Publisher”)Note: (No distinct Publisher element exists in MDS, with the exception of the publisher element in the SourcePreferences DS.) (This may have been corrected in a later version) Contributor An entity responsible for making contributions to the content of the Resource CreationInformation/Creation/Creator (Role/@term-”Contributor”) Date A date associated with an event in the life cycle of the resource The nature or genre of the content of the resource CreationInformation/Creation/CreationCoordi nates/CreationDate Publisher Type CreationInformation/Classification/Genre File format or mirne type [MPEG1, QuickTime, RealVideo...] An unambiguos reference to the resource within a given context MediaInformation/MediaProfile/MediaFormat/ FileFormat MediaInformation/MediaProfile/MediaIstance/ IstanceIdentifier Source A Reference to a resource from which the present resource is derived MediaInformation/MediaIdentification/EntityI dentifier (the “reality”) Language A language of the intellectual content of the resource CreationInformation/Classification/Language Relation A Reference to a related resource Coverage The extent or scope of the content of the resource CreationInformation/RelatedMaterial/MediaLocator CreationInformation/Creation/Abstract or CreationInformation/Creation/CreationCoordi nates/CreationLocation or CreationInformation/Classification/TargetCountry Rights Information about rights held in and over the resource Format Identifier UsageInformation/Rights/RightsID (Currently, RightsID is simply a UniqueIDType. Further identification of the rights holder awaits MPEG-7 IPMP development.) [Fig. 6] Dublin Core to MPEG-7 Descriptors Mapping (rielaborazione da D. Dale, R. Rog, 2002) 92 | - retrieval term-based, ovvero indicizzazione dei dati realizzabile tramite: - termini estratti dal linguaggio naturale dei documenti (basso livello di consistenza); - classificazioni e soggettazioni (relazioni precoordinate rigide, non aggiornate in alcuni campi del sapere); - thesauri (vocabolari controllati e strutturati che consentono maggiore esaustività e specificità flessibilità); - retrieval content-based, che comprende: - visual retrieval: sistemi di ricerca visuale per il recupero di file d’immagine 2D e 3D, basati su robusti algoritmi che analizzano le caratteristiche visive degli oggetti digitali quali ad esempio la distribuzione del colore, le proprietà della texture ovvero l’omogeneità dei pattern visuali, la forma, l’orientamento e la distribuzione spaziale, l’illuminazione, la ripetitività 60; - video retrieval: sistemi di recupero che utilizzano algoritmi che analizzano le caratteristiche audiovisive dei documenti, quali i frame, il movimento degli oggetti nelle inquadrature, gli stacchi di montaggio, le tracce audio e i sottotitoli; - audio retrieval: sistemi per il recupero di informazioni sonore in base all’analisi delle proprietà e caratteristiche relative alla dimensione temporale e alla frequenza. Il primo approccio implica molto lavoro manuale di annotazione e si dimostra insufficiente nell’ambito di documentazione visuale, le cui proprietà sono difficili o quasi impossibili da descrivere testualmente. Il secondo approccio, adatto ai documenti multimediali, invece di annotare manualmente con parole chiave di testo indicizza i documenti attraverso il loro contenuto audiovisuale, servendosi degli strumenti della computer vision, pattern recognition e query audiovisuali. Gli indirizzi di ricerca in questo approccio riguardano la definizione di algoritmi di recupero più potenti e precisi e di criteri di multi-indicizzazione, la velocità di recupero dei dati anche attraverso l’interazione uomo-computer, l’elaborazione di query basate sulla percezione visiva umane e su criteri di valutazione personalizzabili. Tra gli esempi più significativi, il Visual Information Technology Group del National Research Council del Canada ha sviluppato sistema basato sulla ricerca in modo automatico di oggetti tridimensionali 61. 3.2.6 Indicizzazione term-based, manuale e automatizzata È fondamentale che le diverse comunità dei professionisti dell’informazione (bibliotecari, documentalisti, knowledge worker,…) siano consapevoli delle Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 93 reciproche discipline, standard e bisogni. Spesso, infatti, vengono usati vecchi termini con definizioni e utilizzi nuovi, interpretati in modi anche molto diversi. Il termine ‘indice’, ad esempio, ha un significato diverso per un bibliotecario, un informatico, un utente che cerca documenti online e un editore, e tutti hanno ragione nell’ambito delle proprie comunità d’uso. L’indicizzazione è l’atto di produrre una descrizione a soggetto, composta di termini (etichette di valori) che rappresentano concetti (tipi di valori) coordinati da faccette (tipi di attributi). L’idea di base è che i concetti esistono in uno spazio concettuale e che il significato di un concetto è la sua estensione in tale spazio. L’indicizzazione consiste in pratica in procedure codificate per esaminare un documento: viene creato un ordinamento sistematico di entrate, scelte su misura secondo il grado di specificità richiesto, che permettono all’utente di identificare un documento in termini di contenuto di soggetto, grazie agli appropriati termini di indice da utilizzare come punti di accesso nel catalogo. Rispetto agli archivi analogici, quelli digitali permettono non solo una fruizione dei documenti non limitata da vincoli spazio-temporali, ma anche il pragmatico discorsivo semantico sintattico lessicale morfologico fonologico [Fig. 7] I diversi livelli dell’analisi linguistica in E. Liddy, 1998 94 | recupero delle informazioni tramite accessi multipli, ottenute con un’accurata operazione di mediazione semantica che fa da ‘filtro’ alle informazioni. Le informazioni vengono cioè organizzate e ordinate secondo indici di parole chiave estratte dal documento stesso o assegnate secondo un linguaggio prefissato, un vocabolario controllato o un thesaurus. Come ogni linguaggio, anche quello di indicizzazione consiste di un vocabolario e di regole sintattiche. Vi sono due tipi principali di linguaggi di indicizzazione: - linguaggi che usano termini o parole estratte dal linguaggio naturale (thesauri, sistemi di intestazione di soggetto); - linguaggi che usano simboli: numeri, lettere o una combinazione di entrambi (classificazione bibliografica). Strumenti di accesso appropriati sono essenziali per orientarsi nella enorme massa di informazioni disponibili online: se esse non vengono indicizzate, l’utente non è in grado di rintracciarle e quindi ‘non esistono’. Ma occorre ricordare che da quello fonologico a quello pragmatico, vi sono vari livelli di analisi linguistica (Fig. 7), che riflettono una crescente complessità e difficoltà del linguaggio. Molti motori di ricerca oggi utilizzano sistemi di Information Retrieval basati sulle modalità elementari di ricerca linguistica (troncamento automatico, identificazione automatica dei nomi, identificazioni delle frasi, identificazione del concetto). La ricerca per parole presenta dei difetti intrinseci, perchè le parole non sono estratte da un vocabolario controllato e sono quindi prive di contesto e di relazioni con altri termini. Inoltre al di fuori delle scienze tradizionalmente consolidate, la terminologia è ben lungi dall’essere precisa e accurata. I livelli più alti del linguaggio presuppongono la comprensione sia dei livelli inferiori, sia delle teorie impiegate per spiegare i dati, che devono necessariamente spostarsi nel campo della psicologia cognitiva e dell’intelligenza artificiale. Come risultato, la mancanza di mediazione semantica influisce in modo ancora determinante sulle prestazioni dei motori di ricerca 62. Le tecnologie digitali non sono ancora in grado di risolvere questo ‘caos semantico’: il lavoro redazionale umano è perciò essenziale nell’estrazione delle informazioni ritenute più significative e nell’organizzazione tassonomica dei contenuti 63. L’esatta descrizione dei concetti, della rete di relazioni e dei fenomeni sovrasegmentali significa efficienza nella comunicazione linguistica, sia all’interno della cerchia degli addetti ai lavori, sia all’esterno, sotto forma di divulgazione più o meno specifica, permettendo una comunicazione non ambigua. Risulta quindi fondamentale individuare i concetti cardine dei termini relativi al documento da indicizzare, relazionati attraverso la costruzione di una mappa ad hoc, una rete concettuale tessuta attorno alla parola, per assicurare la pertinenza nel recupero delle informazioni. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 95 L’aspetto linguistico si articola in due diversi problemi, che danno origine ad un minor grado di precisione e di richiamo: 1. il problema del linguaggio naturale, poca consistente, poiché le persone utilizzano parole diverse per riferirsi alle medesime cose; 2. il problema del linguaggio di indicizzazione: caratterizzato spesso da poca esaustività e specificità. La soluzione auspicata dagli esperti è quella dell’analisi delle faccette unita ad un vocabolario di controllo e la specificazione dei termini preferiti (per migliorare la consistenza), delle relazioni sintagmatiche e paradigmatiche (per migliorare sia la consistenza che l’esaustività). I metodi di indicizzazione possono essere di vario tipo: manuali o automatici; assegnati o derivati; con linguaggio derivante da vocabolari controllati o dal linguaggio naturale; pre-coordinati o post-coordinati; frasi oppure parole; testo parziale oppure full-text. Oltre ad una buona struttura sindetica e pre-coordinata, che facilita sia la specificità che l’esaustività, l’indicizzazione di un sistema di recupero efficace e qualitativamente raffinato presenta: - un alto livello di specificità (e quindi di precisione): ogni termine è preciso, non generico e questo aumenta la proporzione dei documenti recuperati che sono rilevanti; - un alto livello di esaustività (e quindi di richiamo): ogni descrizione di soggetto è approfondita, non superficiale e questo aumenta la proporzione di documenti rilevanti recuperati e la precisione; - un alto grado di consistenza: una buona indicizzazione dipende dall’abilità dell’indicizzatore e dalla qualità del linguaggio. Nella progettazione di sistemi di Information Retrieval è determinante il livello di specificità, correlato al concetto di futility point, cioè la quantità massima di documenti tra i quali un utente è disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative. Mentre il 100% del richiamo significa che vengono recuperati tutti i documenti rilevanti insieme a documenti non rilevanti, il 100% della precisione indica che verranno recuperati solo e soltanto i documenti rilevanti. Quindi in pratica una maggiore percentuale di richiamo equivale ad una minore percentuale di precisione, e viceversa. Tenendo ben presente che chi cerca presenta bisogni diversi di richiamo e di precisione e ha un diverso livello di futility point, un buon sistema di recupero dovrebbe ottimizzare di entrambi i valori 64. Indubbiamente, il più grande vantaggio dei sistemi di recupero automatici è la riduzione dei costi: la potenza computazionale è progressivamente sempre più economica della competenza umana. Ma quando risorse economiche e tempo sono ugualmente disponibili, i professionisti esperti non hanno pari 65. Il problema è che i sistemi automatici non hanno problemi ad essere comprensivi; 96 | essi hanno piuttosto difficoltà a cercare di essere selettivi. La loro debolezza è la mancanza di precisione – quello che, in termini umani, verrebbe definito come una capacità di giudizio molto limitata. I risultati dei motori di ricerca sono influenzati da algoritmi, operatori booleani, agenti intelligenti, cookies e profili inseriti dagli utenti per cercare di migliorare la precisione, ma continuano a riportare ancora troppi risultati errati o non rilevanti 66. Un altro aspetto che spesso resta nascosto all’utente, inoltre, è l’influenza di alcune forma di pagamento sul contenuto di indici e motori. Un problema che risulta accentuato quando la ricerca viene effettuata con un metamotore di ricerca. Ciò che fa la differenza tra un motore di ricerca e un indicizzatore umano sono sostanzialmente due aspetti: la considerazione dell’audience di un documento (che sia un libro o una pagina Web) e l’avere in mente una ‘struttura sindetica’ o mappa mentale quando un documento viene indicizzato. Conoscere il pubblico cui è diretto un certo documento permette di dedurre quale linguaggio deve essere utilizzato per essere ricercabile da quel pubblico, mentre la struttura sindetica permette di fornire un indice con riferimenti incrociati. A volte anche i motori di ricerca li presentano, ma con troppi significati decontestualizzati. Quelli che vengono definiti come sistemi di classificazione, categorizzazione e indicizzazione automatica, ad esempio, si servono di operatori booleani, funzioni bayesiane, modelli di co-occorenza e sistemi di linguaggio naturale. In un primo passaggio, il sistema viene addestrato allo specifico soggetto o area tematica, selezionando un lista di parole chiave approvata e costruendo delle semplici regole attraverso accoppiamenti e sinonimi, oppure utilizzando algoritmi fraseologici, grammaticali, sintattici, semantici, di uso, di prossimità, di localizzazione ecc. per elaborare regole complesse. Nei sistemi che utilizzano le funzioni bayesiane prima si seleziona una lista approvata di parole chiave, con la quale il sistema viene educato a riconoscere le parole chiave giuste in un insieme di circa 50-60 documenti: si crea così uno scenario per l’occorrenza delle parole. Alcuni sistemi usano una combinazione di funzioni bayesiane e di logica booleana (gli operatori logici consentono la combinazione di più criteri di ricerca tramite delle operazioni logiche) per raggiungere i risultati di indicizzazione finale. Il linguaggio naturale, analizzato con le tecniche di Natural Language Processing, è spesso usato in modo diverso in contesti differenti, pur avendo a volte la stessa pronuncia ed etimologia (ad esempio ‘plasma’ in medicina e in fisica). Inoltre, prima di iniziare l’analisi contestuale, è opportuno servirsi di una tassonomia o di un thesaurus o di un sistema di classificazione, poiché le parole chiavi selezionate saranno tanto più efficaci quanto sarà consistente la loro fonte. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 97 La misurazione dell’accuratezza del sistema è basata su risposte corrette (hits), risposte sbagliate (misses), parole chiave selezionate dal computer che una persona non avrebbe selezionato (rumore). Il cut-off dovrebbe essere 85% di hits, il che significa che il rumore e i misses dovrebbero insieme costituire meno del 15%. Attualmente un buon sistema è in grado di fornire una percentuale di accuratezza iniziale del 60%, che può essere migliorata fino l’85% con un addestramento specifico: il che significa che rimane un certo margine di errore e che il sistema può migliorare con la revisione umana. Naturalmente questo ha un costo economico e organizzativo non indifferente, perciò spesso si preferisce ricorrere a due forme di indicizzazione automatica per migliorare i risultati: le viste tassonomiche, ovvero delle liste gerarchiche di parole chiave che hanno un apprendimento notevole in alcune aree disciplinari, anche oltre 10 livelli. Un termine può così essere analizzato e applicato soltanto al livello finale, perciò il suo uso è inserito in un’applicazione circoscritta; gli elenchi di parole chiave possono essere ristretti soltanto ai termini il più generico possibile, non superando i tre livelli della gerarchia usata. Questo è l’approccio preferito nell’am-biente Web, dove alcune ricerche sui comportamenti degli utenti e un’opinione diffusa indicano che gli utenti si annoiano dopo tre click del mouse e non andranno comunque oltre il terzo livello della gerarchia. Nella pratica molti sistemi usano una combinazione di questi metodi per raggiungere i risultati desiderati. Nel mondo degli operatori booleani, i metadati fanno sì che possiamo trovare le informazioni senza troppo ‘rumore’ e, tuttavia, sono stati ampiamente ignorati: l’utilizzo di metadati nell’ambito di motori di ricerca statistici, come le intranet aziendali, hanno il merito di combinare la precisione degli operatori booleani, con la fuzziness della ricerca statistica (per occorrenza) o della ricerca tramite linguaggio naturale. I motori di ricerca statistici usano algoritmi complessi e proprietari che assegnano parametri e valori alle varie parole. Quando viene calcolata la rilevanza, questi fattori si sommano insieme e il documento con il punteggio maggiore appare primo nella lista. Se all’equazione si aggiungono i metadati, gli algoritmi che pesano le parole devono essere ricalibrati: i metadati appropriati dovrebbero descrivere gli argomenti chiave di un documento, perciò si dovrebbe assegnare un peso alto se alcuni termini appaiono nel full-text del documento. Inoltre potrebbero essere sviluppati nuovi metodi che mappano i metadati e i termini di query in un cluster di parole correlate tra loro. Il clustering è già stato sperimentato con diversi livelli di successo. Alcuni motori di ricerca del Web effettuano delle ‘ricerche concettuali’ che si basano sulla co-occorrenza dei termini in un database. In altre parole, se un termine continua ad apparire vicino ad un altro, vi dovrebbe essere qualche sorta di relazione tra i due e quindi l’utente dovrebbe 98 | essere interessato a selezionare quei documenti che li contengono entrambi o almeno uno. Oppure se un termine ambiguo (perché spesso è assente l’indicazione dell’accento acuto o grave) come ‘pesca’ ricorre in un contesto non ittico, allora per il motore di ricerca esso non si riferisce ad un’attività ittica ma ortofrutticola. Ma se l’utente sta cercando informazioni sull’utilizzo di antiparassitari per gli alberi di pesco, un documento che contiene ‘antiparassitari di alberi da frutta’ potrebbe risultare parimenti interessante. I metadati aiutano a stabilire con precisione il tipo di pesca di cui si sta parlando, usando termini specifici per descrivere i differenti significati. Il motore di ricerca partirebbe da questo significato base e aggiungerebbe i termini correlati per introdurre termini nuovi, ma comunque pertinenti. Il problema di base di questo approccio è che la comunicazione è più efficace se si usa un linguaggio comune che entrambi le parti accettano. Il nostro linguaggio può essere ambiguo o fuorviante a causa del modo in cui è usato, anche se di solito la quantità e il feedback dei messaggi scambiati permette alle parti di comunicare l’una con l’altra. Nel mondo delle informazioni registrate invece, non c’è la stessa opportunità per una interazione immediata. Gli autori, inoltre, non sono consistenti nell’uso delle parole che potrebbero descrivere o riferirsi ad un argomento, cosicché chi cerca scansiona in full text un documento deve includere in una ricerca tutti i sinonimi, i termini correlati e tutti i livelli di dettagli che l’autore potrebbe avere usato. Chi cerca non parla direttamente all’autore, ma al documento stesso, cioè ad uno strumento statico. Per questo motivo vi è bisogno di un sostituto dello scambio parlato con una persona: un linguaggio di indicizzazione controllato che l’indicizzatore usa per interpretare e rappresentare tematiche e concetti, il linguaggio dell’autore e di quello di chi cerca. In passato, per risparmiare, molti provider di database online hanno scelto di non utilizzare i thesauri: i costi per progettare e mantenere un thesaurus sembravano alti e ingiustificati a fronte delle dimensioni dei database e del minor costo dei sistemi di ricerca full-text. Ma questi dubbi risultarono infondati: i database raggiunsero presto dimensioni quasi ingestibili e il costo di cercare titoli e abstract superava di gran lunga quello che sarebbe stato l’investimento nello sviluppo e nell’uso di un linguaggio controllato di indicizzazione 67. È vero che nel primo caso sono disponibili più termini per la ricerca rispetto a quelli dei linguaggi di indicizzazione controllati, e quindi teoricamente includono più termini precisi. Ma chi cerca deve sperare che l’autore abbia incluso tutti i termini necessari per descrivere l’argomento: vi sono casi in cui un autore potrebbe non usare mai i principali termini di una certa materia. Questo significa che gli sforzi, il tempo e i costi risparmiati inizialmente nella costruzione del database passano all’utente che ricerca le informazioni. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 99 Da quanto scritto sopra è chiaro che vi sono delle differenze notevoli sulle modalità in cui i contenuti possono essere organizzati. In termini semplici, il problema è quello di ridurre le distanze tra le domande degli uomini e le risposte dei sistemi. Nonostante le funzionalità miracolose annunciate da vari sistemi commerciali, l’onere nel recupero delle informazioni potrebbe passare dall’autore all’indicizzatore, dal progettista del linguaggio di indicizzazione all’utente: il carico potrebbe essere condiviso in proporzioni diverse, ma comunque non sparirà. Una volta compreso questo, e tenendo conto che i sistemi di intelligenza artificiale sono ancora lontani dal potersi sostituire agli intermediari umani, si è in grado di percepire nella loro interezza la ricchezza (e lo spreco) dei sistemi di gestione dei documenti digitali 68. 3.2.7 Vocabolari controllati: i thesauri I vocabolari costituiscono un corpus di conoscenze rappresentate da un linguaggio specifico di un particolare argomento o area disciplinare. Essi sono necessari perché il linguaggio è in continua evoluzione, e presenta molte sfaccettature e sfumature: le caratteristiche che lo rendono espressivo (gli stili, le differenze disciplinari, regionali e nazionali, i termini del linguaggio parlato e i nomi propri tradotti in varie lingue, i termini attuali e quelli storici) costituiscono anche una possibile causa di ambiguità e confusione nella documentazione e, in ultima analisi, impediscono l’accesso ai materiali registrati in una base dati. Controllare o gestire un vocabolario ai fini dell’indicizzazione e/o della ricerca fornisce una soluzione nota come ‘vocabolario controllato’. I vocabolari controllati sono collezioni di parole e di frasi, chiamate terminologie, strutturate in modo da mostrare le relazioni tra termini e concetti. Essi soddisfano due criteri specifici: essere usati per facilitare l’analisi dei documenti e il loro conseguente recupero; offrire un ricco insieme di relazioni semantiche tra i termini. Il processo che conduce al vocabolario controllato permette sia all’indicizzatore che a chi cerca di accedere ai medesimi concetti attraverso termini autorizzati, noti come ‘descrittori’. In questa categoria non sono comprese: le semplici liste di termini, con o senza relazioni di equivalenza; liste di termini la cui unica relazione sia la co-occorenza nei documenti; liste di termini il cui scopo primario è quello di fornire definizione (ad esempio dizionari e glossari). I vocabolari controllati sono progettati specificatamente per identificare e creare queste connessioni tra termini, attraverso la gestione dei sinonimi e la disambiguazione degli omografi, migliorando i risultati della ricerca e funzionando come un knowledge-base. Risultano ancora più efficaci quando vengono utilizzati insieme ad altri standard, specialmente standard sulle strutture di dati e sui contenuti. 100 | Vi sono diverse tipologie di vocabolari controllati (molti dei quali creati da istituti di ricerca nazionali e internazionali, enti statali e associazioni professionali e culturali) che rispondono a diversi bisogni e sistemi locali: 1. soggettari: compilazioni di intestazioni di soggetto di solito presentate in ordine alfabetico. Raccolgono parole, frasi, o combinazioni di parole e modificatori che combinano concetti separati in quelle che vengono definite stringhe di soggetto. Tra gli esempi più noti: il Soggettario di Firenze, la Library of Congress List of Subject Headings (LCSH), il Medical Subject Headings (MeSH); 2. thesauri: vocabolari strutturati di termini che rappresentano singoli soggetti e organizzati secondo relazioni semantiche (come l’Art and Architecture Thesaurus); 3. schemi di classificazione: organizzano insiemi di conoscenza in categorie concettuali. Sono intesi come schemi organizzativi per le collezioni, ma a volte vengono usati anche per estrarre termini individuali e usarli come valori al di fuori del contesto dello schema di classificazione. Tra gli esempi più noti vi è la multidisciplinare Classificazione Decimale Dewey (DDC), la Universal Decimal Classification (UDC) e la Library of Congress Classification (LCC) Scheme per l’ambito bibliografico, ICONCLASS 69 per le discipline storico-artistiche, la National Library of Medicine (NML) Classification per la medicina 70, Engineering Information (Ei) Classification Codes per le scienze e l’ingegneria 71, la Mathematics Subject Classification (MSC) per la matematica 72, la Computing Classification System per l’informatica della Association for Computing Machinery (ACM) 73. La principale differenza tra la classificazione della conoscenza e la classificazione bibliografica è che entrambe, sia che siano specifiche come la NML o INSPEC o generali come la DDC, la LCC o la UDC, sono sistemi di indicizzazioni progettati per trattare la conoscenza registrata nei documenti 74, il modo in cui essa viene registrata, il linguaggio con cui viene presentata e molte caratteristiche relative all’istanziazione di un particolare soggetto in un documento. La classificazione della conoscenza può essere, e spesso è, tassonomica, come le classificazioni della zoologia, del mondo vegetale o degli elementi chimici: un concetto verrà elencato una sola volta in un solo posto all’interno della classificazione. Invece le classificazioni bibliografiche, ad esempio quelle utilizzate per descrivere i documenti reali, non sono e non possono essere tassonomiche, poiché sono classificazioni disciplinari: ciò significa che un concetto sarà elencato in tutte le discipline e in tutti i campi in cui può essere studiato; Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 101 4. liste d’autorità: sono spesso create da singole organizzazioni e riflettono lo scopo della collezione dell’istituzione. Molte di queste liste includono termini provenienti da altri vocabolari controllati e possono essere una risorsa preziosa per terminologie uniche, regionali, storiche o molto specifiche. In base al tipo di termini trattati, i vocabolari controllati si possono inoltre distinguere in vocabolari di: - nomi propri: (ad esempio l’Union List of Artist Names (ULAN) del Getty Research Institute); - nomi di luoghi geografici: (ad es. Getty Thesaurus of Geographic Names); - nomi di società e aziende (ad es. Library of Congress Name Authority File); - nomi di oggetti (ad es. Art & Architecture Thesaurus, Thesaurus Multilingue del Corredo Ecclesiastico dell’ICCD, Fig. 8); - soggetti e temi iconografici (ad es. ICONCLASS); [Fig. 8] Thesaurus Multilingue del Corredo Ecclesiastico dell’Istituto Centrale per il Catalogo e la Documentazione: rappresentazione dei termini secondo la struttura gerarchica 102 | - termini di tipologie (Thesaurus for Graphic Materials II); termini multilingue: (Thesauri Database della European Commission’s Directorate General for Information Technologies and Industries, and Telecommunications (DG XIII); Multilingual Egyptological o il CHIN Religious Objects Collections Database). I browser dei vocabolari controllati sono applicazioni che permettono agli utenti di accedere al vocabolario in un ambiente di rete, fornendo una vista unitaria di tutto il contenuto, indipendentemente dalla fonte, e di effettuare ricerche molto specializzate. Ad esempio l’Art & Architecture Thesaurus Browser (Fig. 9) 75, mantenuto dal J. Paul Getty Trust, contiene la terminologia dell’AAT terminology e permette di cercare i termini sia nel campo del termine che nella nota d’ambito. ICONCLASS Browser 76 è uno strumento sviluppato dall’ICONCLASS Research & Development Group (IRDG) delle Università di Utrecht e Leida per quanti sono coinvolti in ricerche iconografiche o nella documentazione di immagini. Sostanzialmente, la differenza tra i diversi tipi di vocabolari controllati consiste nei due tipi di relazioni possibili tra i termini: semantiche e sintattiche 77. Le relazioni semantiche denotano concetti come ‘acqua’, ‘mare’ e ‘fiume’ che sono per definizione delle relazioni permanenti: esse derivano dalle definizioni dei soggetti coinvolti, e non sono dipendenti dal particolare contenuto in un documento. Le relazioni sintattiche, invece, denotano concetti altrimenti non correlati che vengono uniti insieme come soggetti compositi nei documenti indicizzati. Queste relazioni non sono permanenti, ma piuttosto specifiche di un dato documento. Dei diversi tipi di vocabolari controllati elencati sopra, i thesauri 78 negli ultimi anni hanno progressivamente attirato l’attenzione nel recupero di documenti in ambienti di rete. Gli standard ANSI/NISO e ISO 79 definiscono un thesaurus come un ‘vocabolario controllato strutturato secondo un certo ordine’, un sottoinsieme del linguaggio naturale, consistente in termini preferiti e non preferiti con specifiche tipologie di relazioni. Gli scopi principali di un thesaurus sono identificabili nella promozione della consistenza nell’indicizzazione di documenti e nel facilitare la ricerca dei documenti. Nel contesto dell’Information Retrieval, specialmente nel caso di software utilizzati per la ricerca full-text, il termine ‘thesaurus’ è talvolta utilizzato con un’accezione più limitata, per indicare un dizionario di termini equivalenti, precostituiti o costruiti dall’utente. Si tratta di strumenti comunque utili, ma lontani dalla ricchezza di un vero thesaurus, che oltre ai termini equivalenti contiene relazioni gerarchiche e associative e informazioni di autorità sui termini. Perciò, per gli obiettivi di questo volume, un ‘thesaurus’ è un vocabolario controllato come definito dagli standard sopracitati. La struttura del thesaurus riflette rigorose relazioni semantiche e riflette i princiCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 103 pi della post-coordinazione dei termini: ciò significa che i termini del thesaurus vengono combinati al momento della ricerca (tramite operatori booleani) piuttosto che al momento dell’indicizzazione, come nelle stringhe di soggetto. La post-coordinazione offre maggiore flessibilità nella costruzione di strategia di ricerca ma spesso riduce la precisione dell’indicizzazione perché la natura della relazione tra i termini rimane inespressa. Rigorose relazioni semantiche invece permettono all’utente di accedere al thesaurus e di identificare i termini di ricerca più appropriati. I thesauri contengono tre tipi di relazioni semantiche: 1. relazioni di equivalenza: sinonimi, varianti fonetiche preferite, acronimi, abbreviazioni, traduzioni ecc.; 2. relazioni gerarchiche: di tre tipi: generico-specifico, istanza, e partetutto. Più perfezionate sono le relazioni gerarchiche e più accurate sono le inferenze. Alcuni termini del thesaurus potrebbero appartenere ad un’unica gerarchia o ad una struttura ad albero. Tuttavia, in alcuni casi un termine potrebbe avere due termini BT o due differenti relazioni gerarchiche e il thesaurus dovrebbe accomodare queste ‘poliarchie’; Relazioni di equivalenza CAD (used for) computer-aided design Relazioni associative CAD (see also) computer-aided engineering computer-aided manufacturing Relazioni gerarchiche Processes and Techniques ......<image-making processes and techniques> ......<computer image-making processes and techniques> ......computer graphics ......raster graphics ......vector graphics ......computer-aided design [Fig. 9] Art&Architecture Thesaurus del Getty Institute: esempi di relazioni 104 | 3. relazioni associative: coordinazione, genetica, co-occorrenza, causaeffetto, strumentale, materiale ecc. per termini che hanno significati associabili. Lo scopo dei thesauri é quello di assicurare consistenza nell’indicizzazione, e risultano essere uno strumento prezioso nei sistemi di gestione e recupero per descrivere, organizzare e fornire accesso all’enorme quantità di dati presenti sul Web, poiché consentono non soltanto di utilizzare un termine più corretto per la ricerca (con le varianti fonetiche, i sinomini e i termini correlati), ma anche di organizzare un insieme di concetti, funzionando come mappe che guidano l’utente all’informazione attraverso la visualizzazione delle relazioni semantiche. Rispetto alla soggettazione e alla classificazione, un thesaurus presenta termini controllati e strutturati gerarchicamente per soggetto, con relazioni tra i termini chiaramente esplicitate che consentono un coordinamento semantico più specifico e al tempo stesso flessibile di quello offerto dal soggettario e dagli schemi di classificazione 80. Nella struttura del thesaurus, infatti, cluster di concetti che condividono caratteristiche comuni sono organizzati in famiglie (‘faccette’) e rappresentati da termini del linguaggio naturale utili nel contesto in cui il thesaurus è utilizzato. Faccette e sottofaccette sono quindi disposte come semplici gerarchie di termini, dal generale allo specifico. Questa procedura presenta molti vantaggi: organizzando i termini in gruppi più piccoli correlati tra loro, ogni gruppo può essere esaminato più facilmente. L’approccio a faccette è anche utile per la sua flessibilità nella gestione di nuovi termini e nuove relazioni: poiché ogni faccetta è indipendente, i cambiamenti in genere possono essere effettuati senza alterare l’architettura generale del thesaurus. Definendo un linguaggio di identificazione dei documenti, il thesaurus impedisce una valutazione soggettiva degli stessi e svolge dunque una funzione di mediazione determinante tra la ricerca dell’uten-te e l’informazione vera e propria. Per tale motivo i thesauri sono utili: - nella fase di data entry, per la descrizione e la catalogazione; - come online search assistant in sistemi di rete 81 fornendo sinonimi, varianti lessicali, inversioni, nomi in diverse lingue, nomi storici, forme alternate (singolare/plurale, varianti grammaticali), omografi; - come knowledge base, mostrando relazioni gerarchiche tra termini articolati secondo uno schema di classificazione delle conoscenze relative al settore 82. Un thesaurus può essere disponibile in formato cartaceo, o digitale, o entrambi (come l’AAT), ma data la difficoltà di formulazione della richiesta e l’inerente ambiguità della parola nel linguaggio naturale, in ambito informatico i thesauri sono particolarmente utili perché a differenza dei cataloghi cartacei i Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 105 record sono letteralmente invisibili all’occhio finché non vengono recuperati. Il compito dell’indicizzatore, quindi, è quello di decostruire l’informazione derivata dai documenti e ricostruirla in una forma semantica che permette a chi cerca l’informazione di recuperare, nel modo più accurato possibile, lo specifico dato richiesto. Ma se per i materiali bibliografici ogni concetto viene ‘atomizzato’ in differenti parti sulla base di categorie sintattiche, nel caso di materiali visuali ogni termine rappresenta un concetto indipendente, non finalizzato alla creazione di una struttura sintattica. Si comprende bene il ruolo critico dei vocabolari strutturati nell’archiviazione dei materiali usuali: se un’immagine (statica o, ancor di più, in movimento) vale mille parole, la sua descrizione non è un’operazione meramente tecnica, perché i termini utilizzati sono influenzati dall’universo culturale cui apparteniamo e dal nostro vissuto. Lo schema concettuale delle immagini implica inoltre tre ulteriori livelli di analisi (preiconografico, iconografico e iconologico), che presentano numerose variabili di interpretazione. Gli standard di documentazione comuni e i vocabolari (come l’Art & Architecture Thesaurus (Fig. 9), la Union List of Artist Names e il Getty Thesaurus of Geographic Names 83; l’UNESCO Thesaurus, il Thesaurus of Engineering and Scientific Terms (TEST), il Transportation Research Thesaurus (TRT) gestito dal Transportation Research Board of the National Research Council, ERIC Thesaurus on education, il Thesaurus Regionale Toscano) sono dunque componenti importanti per permettere ai singoli utenti e alle istituzioni di condividere e arricchire le informazioni, aumentandone l’utilizzo, il valore e la durata nel tempo. Lo sviluppo dei thesauri tuttavia non è privo di problemi sia per la specificità di uno strumento di questo tipo che per la sua creazione che, se effettuata manualmente, è onerosa in termini di tempo. Anche il loro utilizzo nella ricerca potrebbe costituire una barriera per l’utente, se ad esempio non è integrato oppure se il suo browser è disponibile solo come lista alfabetica nell’interfaccia di ricerca. Tuttavia, è stato dimostrato che i thesaurus migliorano il recupero dei dati 84, e come ha scritto Patricia Harpring, Managing Editor del Getty Vocabulary Program, «it is clear that vocabularies are the key to navigating and retrieving meaningful results from the massive amount of largely inchoate information now potentially available in digital form» 85. 3.2.8 Authority control L’operazione di verifica e validazione dei termini e dei nomi è una parte critica del lavoro di documentazione: l’applicazione di vocabolari controllati standard è un risultato significativo di questo lavoro. Il concetto originario della 106 | catalogazione bibliografica ai tempi del catalogo cartaceo era quello di una rigida consistenza, necessaria per l’accesso minimo: l’uso di una forma controllata di intestazione consentiva alle biblioteche di evitare l’acquisizione o la catalogazione involontaria e costosa di materiali già posseduti, permettendo inoltre all’utente di risparmiare tempo e fatica grazie alla esplicitazione dei rinvii alle forme controllate delle intestazioni e al raggruppamento delle opere sotto una sola forma. Oggi questa operazione si è estesa ad altre comunità di gestione delle informazioni e le procedure che hanno largamente beneficiato dell’informatizzazione e del Web sono le seguenti: - liste d’autorità (authority file): compilazioni di termini o di intestazioni autorizzate utilizzate da una singola organizzazione o da un consorzio per la catalogazione, l’indicizzazione o la documentazione. Le liste d’autorità sono gestite in modo estremamente accurato e spesso includono anche informazioni associate al termine o all’intestazione di soggetto (ad esempio sinonimi, termini correlati o associati), e fonti originali del termine. Una lista d’autorità è un vocabolario controllato, ma non tutti i vocabolari controllati sono liste d’autorità, perché l’obiettivo principale di una lista d’autorità è quello di regolare l’utilizzo dei termini in una specifica base di dati. Spesso le liste d’autorità utilizzano molteplici vocabolari strutturati come fonte e la maggior parte includono anche termini locali nati nell’ambito dell’organizzazione stessa. Esse sono parte integrante della maggior parte dei sistemi informativi automatizzati, sebbene con diversi livelli di implementazione, in base al sistema; - controllo d’autorità (authority control): un sistema di procedure che conserva informazioni consistenti nel record di un database. Le procedure includono la registrazione dei termini e la loro validazione utilizzando liste d’autorità, con l’obiettivo di consentire a chi cerca di collegare tra loro termini simili. Il controllo d’autorità è, tra le attività bibliotecarie, forse quella più strettamente legata alla cultura generale, ed è particolarmente importante nell’ambiente Web, per facilitare la ricerca e migliorare la precisione dei risultati della query. Può essere automatizzato, ma i processi intellettuali necessari per creare delle liste d’autorità qualitativamente valide sono ancora quelli effettuati manualmente, come già evidenziato. Questo lavoro può includere: verifica dei termini o dei nomi proposti in fonti autorevoli come dizionari, monografie o fonti storiche; ricerca di sinonimi come varianti fonetiche; definizione di relazioni tra termini o nomi; creazione di record di autorità da poter essere inseriti nella base di dati. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 107 Poichè si tratta di un lavoro spesso costoso e lungo, e che si cerchi quindi, nell’ottica della condivisione dei dati si cerca in genere di condividere anche le liste di autorità. L’intestazione è costituita da una registrazione, non solo da un nome, chiamata authority record, comprensiva della forma standard, delle forme varianti e delle forme correlate in altre lingue, dell’ambito culturale e delle osservazioni del catalogatore, secondo quanto stabilisce GARE 86. Ciascun authority record è abbinato a uno o a più record bibliografici: in tal modo il catalogo digitale consente di accedere alle registrazioni delle opere di un autore da qualsiasi forma correlata e da qualsiasi ordine di combinazione. A differenza dei record bibliografici, che hanno una certa ‘stabilità’, gli authority record sono però soggetti a cambiamenti continui determinati da necessità di modifica nelle forme varianti, dall’introduzione di forme parallele o di forme correlate, dall’introduzione di nuove fonti bibliografiche, dalla necessità di disambiguazione con altri nuovi record, dal cambiamento del nome di un autore o semplicemente dalla necessità di variare le informazioni biografiche. Tutti elementi che ovviamente complicano notevolmente il problema dell’allineamento dei cataloghi e dello scambio dei record. L’authority control in un contesto universitario, come ha recentemente indicato Guido Badalamenti, è una scelta obbligata 87. Il controllo e la normalizzazione degli accessi catalografici è sempre stato molto presente nell’organizzazione dei servizi delle biblioteche universitarie, sia nel contesto della catalogazione – data l’ampia tipologia delle raccolte che interessano i loro utenti istituzionali, che comprendono opere di autori locali, nazionali ed esteri e che abbracciano vari ambiti disciplinari – sia ai fini della predisposizione di OPAC coerenti ed adeguati per gli utenti, in grado di orientare in modo semplice ed efficace studenti e ricercatori verso un uso più approfondito delle collezioni bibliografiche. La crescita dei servizi offerti dalle biblioteche, la loro crescente complessità, la necessità di dedicare risorse umane adeguate per l’integrazione dei servizi tradizionali di biblioteca con quelli offerti dalle risorse digitali, la nascita della biblioteca digitale hanno posto seri problemi all’organizzazione degli uffici di catalogazione nelle biblioteche universitarie, soprattutto in un contesto di generale contrazione delle risorse economiche. La funzione principale svolta dall’authority file non comprende più soltanto la procedura della catalogazione, ma anche quella della ricerca. Si avverte sempre più infatti la necessità di poter definire strumenti che aiutino gli utenti a tracciare dei percorsi di ricerca personalizzati e controllati, che sfuggano alle logiche commerciali dei grandi editori o dei motori di ricerca. Barbara Tillett 88 suggerisce l’idea che, a partire dall’esistenza di authority file internazionali, reali o virtuali, in cui siano registrate le varianti del 108 | nome di ciascuna entità e le forme parallele nelle diverse lingue e nei diversi alfabeti, si possano sviluppare delle interfacce adatte alle esigenze e alle scelte di ciascun utente. Il Web rende possibili nuovi utilizzi per gli authority record e nuove funzioni, in aggiunta alle funzioni tradizionali: ad esempio la condivisione del carico di lavoro riduce i costi di catalogazione, ma a condizione di utilizzare standard catalografici, formati di scambio e di rendere i dati elaborati facilmente accessibili in rete. Per il momento non sono molti, anche in ambito internazionale, gli authority file disponibili in rete ed accessibili attraverso il protocollo Z39.50. Un punto di riferimento importante in questo contesto, in grado di dare una risposta ai problemi aperti, è il progetto europeo LEAF (Linking and Exploring Authority Files), che ha come obiettivo la creazione di un sistema centralizzato in cui saranno localizzati i record relativi ad autori persona ed enti presenti nei database di piccole e grandi biblioteche di diversi paesi. I record saranno raccolti attraverso procedure periodiche di harvesting dei diversi database, in modo da assicurare un costante aggiornamento dei dati. 3.2.9 Web semantico e ontologie Un’ontologia definisce i termini utilizzati per descrivere e rappresentare un’area della conoscenza 89. Le ontologie sono utilizzate dalle persone, dai database e dalle applicazioni che hanno bisogno di condividere le informazioni di un ambito tematico specifico. Esse includono le definizioni (utilizzabili dal computer) di concetti base e le relazioni tra questi concetti: in pratica cioè le ontologie codificano la conoscenza di un certo ambito e quella trasversale ad altri ambiti, rendendole in tal modo riutilizzabile. Sebbene vi sia un generale consenso su cosa sia un’ontologia e cosa dovrebbero fare, alcune definizioni esprimono significati differenti 90. I filosofi hanno spesso costruito le ontologie con un approccio top-down omnicomprensivo, i programmatori invece tendono a lavorare in una modalità bottom-up. Per sviluppare database e sistemi di Intelligenza Artificiale, spesso partono con ontologie limitate o micromondi, che hanno un numero limitato di concetti e sono modellate per una specifica applicazione: questo tipo di prototipi è popolare nell’ambito della robotica, della progettazione, della machine vision e machine learning. Alcuni temi comuni emergono nelle varie interpretazioni del termine: 1. un’ontologia è una rappresentazione formale che ha lo scopo di precisare, esplicitare e rendere non ambiguo uno specifico ambiente conoscitivo che richiede un modello chiaramente definito (ad es. alcune ontologie sono basate su modelli derivanti dalla rappresentazione Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 109 della conoscenza). Questi modelli ontologici, vere e proprie metaontologie sono tutte basate sull’ipotesi che gli aspetti più rilevanti della concettualizzazione di un dominio possano essere catturati usando solo pochi semplici costrutti 91; 2. un’ontologia descrive le entità e i concetti rilevanti di un dominio specifico. Se si vuole completare lo sviluppo di un’ontologia, lo scopo e gli obiettivi devono essere chiaramente definiti. Un’ontologia universale si estenderebbe in modo infinito e richiederebbe risorse illimitate; 3. un’ontologia rappresenta una visione soggettiva di un certo ambito, che potrebbe essere descritto in modi diversi da differenti ontologie. Questo aspetto riporta ad un’importante questione filosofica sulla possibilità o meno di concettualizzazioni multiple della realtà. Le divergenze potrebbero emergere semplicemente come il risultato di descrizioni di differenti ambiti o aspetti dello stesso ambito, ma queste differenze sono in un certo senso triviali poiché non portano a fondamentali disaccordi. Tuttavia ontologie incompatibili ma ugualmente plausibili potrebbero emergere in quei casi in cui il dominio è rigorosamente identico, suggerendo così che le concettualizzazioni di fondo non sono le stesse (ad esempio in questioni teoretiche o religiose). Questo porta all’importante conseguenza che unire una o più ontologie divergenti in alcuni casi potrebbe risultare concettualmente impossibile, sebbene le ontologie, come esplicite rappresentazioni formali, possono avere un ruolo utile aiutando a rivelare e a chiarire differenze concettuali che altrimenti rimarrebbero nascoste dalla terminologia comune o simile. Nell’attuale gergo dell’informatica, le ontologie sono delle risorse che rappresentano delle semantiche condivise a più ambiti. A differenza dei modelli di dati, il fondamentale assetto delle ontologie è la loro relativa indipendenza da una particolare applicazione, cioè un’ontologia consiste di una conoscenza relativamente generica che può essere riutilizzata per differenti applicazioni e compiti. Il termine ontologia è stata usato per descrivere artefatti con un diverso grado di struttura, dalle semplici tassonomie come di Yahoo agli schemi di metadati come Dublin Core e alle teorie logiche. In sintesi 92, le ontologie sul Web sono utilizzabili per: - la comunicazione (tra sistemi computazionali implementati, tra esseri umani, tra esseri umani e sistemi computazionali); - l’inferenza computazionale (per rappresentare e manipolare internamente piani e per pianificare l’informazione e analizzare le strutture interne, gli algoritmi, gli input e gli output dei sistemi implementati in termini concettuali e teoretici); 110 | - il riuso (e l’organizzazione) della conoscenza per la strutturazione e l’organizzazione di biblioteche digitali e repository. Il Web semantico ha bisogno di ontologie con un significativo grado di struttura, che devono specificare descrizioni per i seguenti tipi di concetti: classi (cose generali) nei tanti ambiti di interesse; relazioni esistenti tra le classi; proprietà (o attributi) che queste cose hanno. Le ontologie sono generalmente espresse in un linguaggio di base, in modo che si possano effettuare distinzioni accurate, consistenti e significative tra classi, proprietà e relazioni. Esse vengono utilizzate da sistemi automatizzati per la ricerca e recupero concettuale/semantico, agenti intelligenti, supporto alle decisioni, comprensione del parlato e del linguaggio naturale, Knowledge Management, database intelligenti, commercio elettronico. Per ottenere l’interoperabilità tra numerosi schemi sviluppati e gestiti in modo autonomo, è necessaria una semantica più ricca di quelle attualmente disponibili. Tim Berners-Lee, l’inventore del Web, ha recentemente affermato che «most of the Web’s content today is designed for humans to read, not for computer programs to manipulate meaningfully» 93. Il contenuto è comprensibile al calcolatore se viene collegato ad una qualche descrizione formale del contenuto stesso, ad esempio con i metadati. Affinché il Web semantico funzioni, i computer devono avere accesso a collezioni strutturate di informazioni e di insiemi di regole di inferenza, che possano essere utilizzati per effettuare ragionamenti automatici servendosi dell’XML, dello schema RDF, delle ontologie e degli agenti intelligenti. Costruire ontologie è un’operazione difficile, lunga e costosa, in particolar modo se l’obiettivo è la progettazione di un’ontologia sufficientemente formale da supportare l’inferenza automatica. Ciò è dovuto in parte al fatto che le ontologie richiedono consenso attraverso una comunità i cui membri potrebbero avere versioni radicalmente differenti del dominio in considerazione. Inoltre vi sono al momento poche tecniche di valutazione. Ma quando le ontologie saranno maggiormente condivise, il Web semantico entrerà nel nostro mondo fisico: gli URI infatti possono puntare a qualsiasi cosa, inclusi gli oggetti, che potranno in tal modo cercare automaticamente ed impiegare servizi e attivare altri dispositivi per aggiungere informazioni o funzionalità. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 111 Note [1] Cfr. California Digital Library, Digital Object Standard: Metadata, Content and Encoding, 18 May 2001, <http://www.cdlib.org/news/pdf/CDLObj ectStd-2001.pdf> [2] G. Jonsson, The bibliographic unit in digital context, how to define it?, in IFLA Meeting of Experts on an International Cataloguing Code, 2003, Frankfurt, Germany, <http://www.ddb.de/news/pdf/papers_jonsson.pdf> [3] G. Tassey, The roles of standards as technology infrastructure, in Standards, Innovation and Competitiveness: The Politics and Economics of Standards in Natural and Technical Environments, R. Hawkins (ed.), Edward Elgar, Brookfield 1995; W. Lehr, Compatibility standards and interoperability: Lessons from the Internet, in Standards Policy for Information Infrastructure, B. Kahin, J. Abbate (eds.), MIT Press, Cambridge 1995, pp. 121-147; P.A. David, Standardization policies for network technologies: the flux between freedom and order revisited, in Standards, Innovation and Competitiveness: The Politics and Economics of Standards in Natural and Technical Environments, R. Hawkins, J. Skea (eds.), Edward Elgar, Brookfield 1995, pp. 15.35 [4] I due enti più noti nell’ambito della biblioteconomia e dell’information Science 112 | sono la International Standard Association (ISO) e la National Information Standards Organization (NISO), accreditata dall’American National Standards Institute. A differenza degli standard ISO, quelli NISO sono volontari: non vi sono cioè politiche per rafforzare la conformità agli standard, che vengono emessi con lo scopo di rappresentare delle linee guide e di raccomandazioni di best practice piuttosto che come requisiti. [5] Per il profilo del documentalista cfr. Euroguida I&D. Competenze dei professionisti europei dell’informazione e della documentazione, realizzata con supporto Commissione UE, versione italiana di M.P. Carosella, D. Bogliolo, Casalini Libri, Roma 2000 e V. Couzinet, Médiations hybrides. Le documentaliste et le chercheur en sciences de l’information, ADBS, Paris, 2001. [6] Per un’analisi delle problematiche in un progetto di digitalizzazione cfr. il volume Una metodologia per l’acquisizione e la restituzione dei giacimenti documentali dell’architettura. I materiali per lo studio di Andrea Palladio, a cura di G. Beltramini e M. Gaiani, Edizioni POLI.design, Milano 2003. [7] Cfr. <http://mip.berkeley.edu/spiro/> [8] EAD è uno standard per la codifica di archival finding aids mantenuto dal Network Development and MARC Standards Office della Library of Congress, in partnership con la Society of American Archivists. [9] [ 11] T. Gill, A. Gilliland-Swetland, M. Baca, Introduction to Metadata, Getty Information Institute, 2000 <www.getty.edu/research/conducting_research/standards/intrometadata>; J. Milstead, S. Feldman, Metadata: Cataloging by Any Other Name ..., in «Online», January 1999, vol. 23, n. 1, <http://www.infotoday.com/online/OL1999/ milstead1.html>; T. Gill, Metadata and the World Wide Web, 2000 <http://www.getty.edu/research/institute/standards/intrometadata/2_articles/gill/index.htm l; G. Mura, Nel labirinto dei metadati, in «Biblioteche oggi», settembre 2001, pp.3842. Per una riflessione sugli standard di catalogazione cfr. T. Franco, Do we sill need cataloging stantards?, in OSS 97 Global Security & Global Competitiveness: Open Source Solutions, 1997 <http://www.dtic.mil/cendi/presentations/oss 9_97/franco/index.html>; R. Wendler, Branching Out: Cataloging Skills and Functions in the Digital Age, in «Journal of Internet Cataloging», n. 2, 1999, pp. 43-54; H. Besser, The Next Stage: Moving from Isolated Digital Collections to Interoperable Digital Libraries, in «First Monday», volume 7, number 6 (June 2002), <http://firstmonday.org/issues/issue7_6/besser/index.html> M. Gorman, Le risorse elettroniche. Quali vale la pena di conservare e qual’è il loro ruolo nelle raccolte della biblioteca?, bozza dell’intervento, in International Conference on Electronic Resources, cit., <http://w3.uniroma1.it/ssab/er/relazioni/gorman_ita.pdf> [ 10 ] In questo contesto verrà usato il termine ‘catalogazione tradizionale’ per fare riferimento a descrizioni delle risorse basate su un insieme d regole che includono le ISBD, le RICA e AACR2, i vari soggettari nazionali (Soggettario di Firenze e Library of Congress Subject Headings), formati MARC per i dati bibliografici. Il termine non riflette un valore negativo, ma è solo esemplificativo. Ciuccarelli, Innocenti | [ 12 ] Cfr. A. De Robbio, Metadati per la comunicazione scientifica, ICCU 2001 <http://www.iccu.sbn.it/Derobbio.rtf>; A. Scolari, M. Messina, C. Leombroni, G. Cirocchi, G. Bergamin, Appunti per la definizione di un set di metadati gestionali-ammnistrativi e strutturali per le risorse digitali, 2000 <http://www.iccu.sbn.it/metaAG1.pdf> [ 13 ] The digital library toolkit, Sun Microsystems, Palo Alto 2000 (2nd ed.), p. 175. [ 14 ] C. Lagoze, Keeping Dublin Core Simple. Cross Domain Discovery or Resource Description?, in «D-Lib Magazine», n. 1, January 2001 <http://www.dlib.org/dlib/january01/lagoze/01lagoze.html> [ 15 ] D. Brickley, R.V. Guha, Resource Description Framework (RDF) Schema Specification, World Wide Web Consortium, 2000 <http://www.w3.org/TR/rdf-schema>; O. Lassilla, R.R. Swick, Resource Description Framework (RDF). Model and Syntax Specification, 1999 <http://www.w3.org/TR/PR-rdf-syntax> Sistemi conoscitivi per il design: una proposta metodologica | 113 [ 16 ] [ 20 ] E. Duval, W. Hodgins, S. Sutton, S.L. Weibel, Metadata Principles and Practicalities, in «D-Lib Magazine», vol. 8, n. 4, April 2002, <http://www.dlib.org/dlib/april02/weibel/04weibel.html> J. Greenberg, M. Pattuelli, B. Parsia, W. Robertson, Author-generated Dublin Core Metadata for Web Resources: A Baseline Study in an Organization, in Journal of Digital Information, vol. 2, n. 2 (November 2001) <http://jodi.ecs.soton.ac.uk/Articles/v02/i0 2/Greenberg> [ 17 ] Cfr. R. Heery, M. Patel, Application profiles: mixing and matching metadata schemas The idea of application profiles grew out of UKOLN’s work on the DESIRE project, in «Ariadne», issue 25 (http://www.ariadne.ac.uk/issue25/app-profiles/); S. Peruginelli, I profili di applicazione, ICCU, <http://www.iccu.sbn.it/PDF/Peruginelli.pdf> [ 21] The Open Archives Initiative Protocol for Metadata Harvesting, Protocol Version 1.1 of 2001-07-02, Document Version 2001-06-20, <http://www.openarchives.org/OAI/openarchivesprotocol.htm> [ 22 ] [ 18 ] Work Package 8. BIBLINK Core Field Semantics, <http://hosted.ukoln.ac.uk/biblink/wp8/fs /bc-semantics.html> Cfr. ad esempio il Metadata Schema Registry (<http://metadata.net>), o il sito dell’inglese Office for Library and Information Networking (<http://ukoln.bath.ac.uk/metadata/interoperability>). [ 19 ] L.C. Howarth, Creating a MetadataEnabled Framework for Resource Discovery in Knowledge Bases, in CAIS 2000: Dimensions of a Global Information Science, Canadian Association for Information Science, Proceedings of the 28th Annual Conference, 2000, <http://www.slis.ualberta.ca/cais2000/howarth.htm>; M. Day, Metadata Mapping between metadata formats, UKOLNl, last updated 2004, <http://www.ukoln.ac.uk/metadata/interoperability/>; M.St. Pierre, W.P. LaPlant Jr., Issues in Crosswalking Content Metadata Standards, in National Information Standard Organization, 15 October 1998, <http://www.niso.org/press/whitepapers/crss walk.html> 114 | [ 23 ] Cfr. le osservazioni di A. Scolari, UNIMARC, AIB, Roma 2000 e G. Cirocchi, S. Gatta, L. Panciera, E. Seta, Metadati, informazionidi qualità e conservazione delle risorse digitali, in «Bollettino AIB», n. 40, 2000, pp. 397-409. [ 24 ] Cfr. N. Medeiros, Making Room for MARC in a Dublin Core World, in «Online», November 1999, <http://www.onlinemag.net/OL1999/med eiros11.html> [ 25 ] <http://www.loc.gov/standards/marcxml/> [ 26 ] R. Tennant, Marc Must Die, in «Library Journal», 2002, <http://www.libraryjournal.com/article/CA250046> [ 27 ] Il Government Information Locator Service (GILS) è uno strumento per l’identificazione delle risorse informative del governo americano. Come parte del suo compito, GILS ha sviluppato un formato di metadati complesso, influenzato dal MARC e progettato per un’architettura client-server basata sullo standard Z39.50 (cfr. <http://www.access.gpo.gov/su_docs/gils/>). [ 28 ] La versione alfa della Encoded Archival Description (EAD) è stata emessa nel 1996 (cfr. Encoded Archival Description (EAD), Official EAD Version 2002 Web Site <http://www.loc.gov/ead/>). per gli studiosi e gli esperti d’arte e i ricercatori universitari, permettono la descrizione di opere d’arte e delle loro rappresentazioni digitali. La versione 2.0 è uscita nel 2000 (<http://www.gii.getty.edu/index/cdwa. html>). [ 31 ] I Content Standard for Digital Geospatial Metadata (CSDGM) sono stati sviluppati dalla Federal Geographical Data Committee (FGDC) con lo scopo di un insieme comune di termini e definizioni per la documentazione dei dati digitali geospaziali. Definiscono l’informazione necessaria per gli utenti dei dati geospaziali per determinare la disponibilità di un insieme di dati, la sua appropriatezza per un dato scopo, le modalità di accesso e quelle di trasferimento. [ 32 ] [ 29 ] Core Categories delle Visual Resources, versione 2.0, rilasciate dalla Visual Resources Association nel 1997. Gli elementi del Core, che prevedono l’integrazione con altri elementi per completare le descrizioni, sono stati progettati per facilitare la condivisione delle informazioni tra collezioni di risorse visuali. La versione 3.0, un progetto della Visual Resources Association Data Standards Committee, è uscita nel 2002. [ 30 ] Categories for the Description of Works of Art (CDWA), sviluppate dalla Art Information Task Force, con la sponsorizzazione del Getty Information Institute e della College Art Association. Le CDWA, molto dettagliate e pensate Ciuccarelli, Innocenti | Cfr. M. Woodley, Crosswalks: the paths to universal access ?, 2000 <http://www.getty.edu/research/institute/st andards/intrometadata/2_articles/woodley/index.html>; M. Day, Metadata: Mapping between Metadata Formats, cit. [ 33 ] D. Bearman, G. Rust., S. Weibel., E. Miller, J. Trant, A Common Model to Support Interoperable Metadata, in «DLib Magazine», n.1, 1999 <http://www.dlib.org/dlib/january99/bea rman/01bearman.html>. Queste sono anche le tematiche base del V programma quadro della Comunità Europea, nell’ambito dell’Information Society Technologies Programme (1998-2002), che intende promuovere un nuovo approccio integrato alle informazioni, Sistemi conoscitivi per il design: una proposta metodologica | 115 che venga incontro alle esigenze dell’utenza, che offra servizi e tecnologie a tutte le attività e che tra le sue strategie stabilisca un consenso necessario per la standardizzazione a tutti i livelli <http://www.cordis.lu/ist/> [ 34 ] P. Caplan, International metadata initiatives: lessons in bibliographic control, in Bicentennial Conference on Bibliographic Control for the New Millennium, 2001, <http://www.loc.gov/catdir/bibcontrol/cap lan_paper.html>; R. Wendler, Musings on Priscilla Caplan’s, in Bicentennial Conference on Bibliographic Control for the New Millennium, 2001, <http://www.loc.gov/catdir/bibcontrol/we ndler_paper.html> [ 37 ] <http://dublincore.org/index.shtml>. Cfr. Inoltre A. Powel, Metadata for the web: RDF and Dublin Core, 1998 <http://www.ukoln.ac.uk/metadata/presentations/ukolug98/paper/intro.html>. Per le potenzialità dei metadati in ambito commerciale cfr. G. Rust, Metadata: the right approach : an integrated model for descriptive and rights metadata in E-commerce, in «D-Lib magazine», JulyAugust 1998 <http://www.dlib.org/dlib/july98/rust/0 7rust.html> [ 38 ] The Dublin Core Metadata Element Set, ANSI/NISO Z39.85-2001 e ISO 15836:2003 <http://www.niso.org/standards/resources/Z39-85.pdf> [ 35 ] Per il modello bibliografico proposto dall’IFLA. Cfr. IFLA, Functional Requirements for Bibliographic Records Final Report, 2000 <http://www.ifla.org/VII/s13/frbr/frbr1.h tm#1>; Seminario FRBR : Functional Requirements for bibliographic records. Requisiti funzionali per record bibliografici, 27-28 gennaio 2000, Roma, AIB, Roma 2000; C. Fasella, IL modello bibliografico FRBR e il Dublin Core, in Seminario Nazionale sui Metadati, 3 aprile 2001 <http://www.iccu.sbn.it/semimeta.htm> [ 36 ] Per risorsa informativa si intende qui ‘tutto ciò che possiede un’identità’, secondo la definizione di Tim Berners-Lee et alii, Internet RFC 2396 - Uniform Resource Identifiers (URI): Generic Syntax, August 1998, <http://www.faqs.org/rfcs/rfc2396.html> 116 | [ 39 ] E. Miller, D. Brickley, R. Dornfest, DCMI Architecture: Metadata Entities and Relationships, presentation in Dublin Core 8 Workshop, 10 April 2000, National Library of Canada, Ottawa, <http://dublincore.org/workshops/dc8/DC MIArchitecture2/> [ 40 ] Rispettivamente <http://www.w3c.org/XML/Schema> e <http://www.ukoln.ac.uk/metadata/dcmi/ dc-xml-guidelines/>. Cfr. anche A. Powell, P. Johnston, Guidelines for implementing Dublin Core in XML, 2 April 2003, <http://dublincore.org/documents/dc-xmlguidelines/index.shtml> [ 41 ] Current Cites annotation of latest DCMI report (61 lines) di S. Weibel, weibel@OCLC.ORG, 01 March 2002 00:37,<http://www.jiscmail.ac.uk/cgibin/wa.exe?A2=ind0203&L=dcgeneral&F=&S=&P=53> [ 42 ] L. Dempsey, S. Weibel, The Warwick Metadata Workshop, in «D-Lib Magazine», July/August 1996, <http://www.dlib.org/dlib/july96/07weibel.html> Associations and Institutions, March 1998 <http://www.ifla.org/VII/s13/frbr/frbr.pdf> [ 47 ] The Harmony Project, <http://www.ilrt.bris.ac.uk/discovery/harmony/>; D. Brickley, J. Hunter, C. Lagoze, ABC: A Logical Model for Metadata Interoperability, Harmony Project, Working Paper, 1999 <http://www.ilrt.bris.ac.uk/discovery/harmony/docs/abc/abc_draft.html> [ 43 ] T. Baker, A Grammar of Dublin Core, in «D-Lib Magazine», October 2000, vol. 6, n. 10, <http://www.dlib.org/dlib/october00/baker/10baker.html> [ 44 ] R. Guenther, Library Application Profile, Dublin Core Metadata Initiative, DCMI, 24 September 2002, <http://dublincore.org/documents/libraryapplication-profile/> [ 48 ] D. Bearman, E. Miller, G. Rust, J. Trant, S. Weibel, A Common Model to Support Interoperable Metadata. Progress report on reconciling metadata requirements from the Dublin Core and INDECS/DOI Communities, in «D-Lib Magazine», January 1999, vol. 5, n. 1, <http://www.dlib.org/dlib/january99/bearman/01bearman.html> [ 49 ] [ 45 ] C. Lagoze, Accommodating Simplicity and Complexity in Metadata: Lessons from the Dublin Core Experience, in Seminar on Metadata Organized by Archiefschool, Netherlands Institute for Archival Education and Research June 8, 2000, <http://www.cs.cornell.edu/lagoze/Papers/dc.pdf>.; C. Lagoze, Keeping Dublin Core Simple. Cross-Domain Discovery or Resource Description?, in «D-Lib Magazine», January 2001, vol. 7 n. 1, <http://www.dlib.org/dlib/january01/lagoze/01lagoze.html> [ 46 ] R. Heery, M. Patel, Application Profiles: Mixing and Matching Metadata Schemas, in «Ariadne», Issue 25, September 2000, <http://www.ariadne.ac.uk/issue25/appprofiles/intro.html> [ 50 ] <http://www.ukoln.ac.uk/metadata/roads/> [ 51 ] Cfr. Guide to Best Practice: Dublin Core, Version 1.1, Consortium for the Computer Interchange of Museum Information (CIMI), 21 April 2000, version 1.1, <http://www.cimi.org/public_docs/meta_b estprac_v1_1_210400.pdf> Functional Requirements for Bibliographic Records, International Federation of Library Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 117 [ 52 ] <http://www.emis.de/projects/EULER/> [ 53 ] C. Parmeggiani, Il questionario e il suo sviluppo: i progetti censiti, le metodologie e le tematiche relative alle diverse tipologie di progetti, in I METADATI seminario nazionale, Roma, 3 aprile 2001, <http://www.iccu.sbn.it/Parmeggiani.ppt >; Questionario sull’utilizzo dei metadati, in ibidem, <http://www.iccu.sbn.it/quesmeta.htm>; Lista dei progetti che utilizzano i metadati in Italia, in ibidem, <http://www.iccu.sbn.it/metaprog.htm> [ 54 ] P. Lyman, H.R. Varian, How Much Information Study 2000, School of Information Management and Systems at the University of California at Berkeley, <http://www.sims.berkeley.edu/research/pr ojects/how-much-info/how-muchinfo.pdf> (nel sito è disponibile anche l’aggiornamento del 2003). Multimedia description schemes, m3705, in 54th MPEG meeting, La Baule, October 2000, <http://metadata.net/harmony/MW200 2_paper.pdf>; J. Hunter, J. Martinez, E. Oltmans, Rehm, C. Jörgensen, MPEG-7 Harmonization with Dublin Core: Current Status and Concerns, m6160, 53rd MPEG meeting, Beijing, July 2000. [ 56 ] <http://www.itscj.ipsj.or.jp/sc29/> [ 57 ] D. Dale, R. Rog, The Need for a Meta-Tag Standard for Audio and Visual Materials, in Proc. Int. Conf. on Dublin Core and Metadata for e-Communities, Florence University Press, Florence 2002, pp. 205206. [ 58 ] A.C. Foskett, The subject approach to information, Library Association, London 1996. [ 55 ] [ 59 ] <http://www.mpeg-7.com>. Sullo standard MPEG-7 e le sue applicazioni cfr. N. Day, MPEG-7: Solutions for Rich Content Management, in «ONLINE», September 2001 <http://www.onlinemag.net/pdf2001/article#_01.pdf>; J. Hunter, MPEG-7 Behind the Scenes, in «D-Lib Magazine», September 1999, vol. 5, n. 9, <http://www.dlib.org/dlib/september99/hunter/09hunter.html>; J. Hunter, Combining the CIDOC CRM and MPEG-7 to Describe Multimedia in Museums; ISO/IEC CD 15938-5 Information technology - Multimedia content description interface - Part 5 Cfr. Multimedia Information Retrieval, a cura di R. Raieli, P. Innocenti, AIDA, Roma, 2004. 118 | [ 60 ] Ad esempio il sistema sviluppato dal gruppo Visual Information Technology del National Research Council of Canada <http://www.vit.iit.nrc.ca/VIT.html>, di cui fa parte Eric Paquet. [ 61 ] E. Paquet, M. Rioux, Content-based Access of VRML Libraries, in IAPRInternational Workshop on Multimedia Information Analysis and Retrieval, in «Lecture Notes in Computer Sciences», vol. 1464, 1998, Springer, pp. 20-32; E. Paquet, M. Rioux, A Content-based Search Engine for CAD and VRML Databases, in Dedicated Conference on Robotics, Motion and Machine Vision in the Automotive Industries. Proceesfings of ISATA 31, Dusseldorf, Germany 1998, pp. 427-434. [ 62 ] Cfr. E.D. Liddy, Enhanced Text Retrieval Using Natural Language Processin, in «Bulletin of the American Society for Information Science», n. 4, 1998 <http://www.asis.org/Bulletin/Apr98/liddy.html> e idem, Text Mining, in «Bulletin of American Society for Information Science & Technology», 2000 <http://www.asis.org/Bulletin/Oct00/liddy.html>; Natural Language Processing, in Encyclopedia of Library and Information Science, 2nd ed., Marcel Decker Inc., 2001 New York. [ 63 ] K. Hagedorn, Extracting value from automated classification tools. The role of Manual involvement and controlled vocabularies, White Paper, Argus Center for Information Architecture, 2001 <http://argus-acia.com/white_papers/classification.pdf> Computers Be Used for the Skilled Tasks of Professional Librarianship?, in «DLib Magazine», vol. 6, n. 7/8, July/August 2000, <http://www.dlib.org/dlib/july00/arms/ 07arms.html>; N.K. Humphreys, Mind Maps: Hot New Tools Proposed for Cyberspace Librarians, in «The Searcher», Volume 7, No. 6, June 1999, <http://www.infotoday.com/searcher/jun 99/humphreys.htm> [ 66 ] M.M. Hlava, Automatic Indexing: A Matter of Degree, in «Bulletin of the American Society for Science and Information Technology», vol. 29, n. 1, October-November 2002, <http://www.asis.org/Bulletin/Oct02/hlava.html> [ 67 ] Cfr. ad esempio D.C. Blair and M.E. Maron, An evaluation of retrieval effectiveness for a full-text document-retrieval system, in Communications of the ACM, March 1985, 28:3, pp. 289-299; G. Salton, in «Communications of the ACM», July 1986, vol. 29, n. 7, pp. 648656; D.C. Blair, M.E. Maron, in «Information Processing and Management», 1990, 26:3, pp. 437- 447. [ 68 ] [ 64 ] La prassi di alcune autorevoli istituzioni bibliotecarie, tra cui la Library of Congress, continuano invece a privilegiare il richiamo. D. Batty, WWW - Wealth, Weariness or Waste. Controlled vocabulary and thesauri in support of online information access, in «D-Lib Magazine», November 1998 <http://www.dlib.org/dlib/november98/11batty.html> [ 65 ] Cfr. W. Arms, Automated Digital Libraries: How Effectively Can Ciuccarelli, Innocenti | [ 69 ] Il sistema decimale ICONCLASS Sistemi conoscitivi per il design: una proposta metodologica | 119 (<http://iconclass.let.uu.nl/>) è stato ideato da Henri van der Waal fra il 1948 e il ‘50 presso l’Istituto di Storia dell’arte dell’Università di Leida ed applicato per ordinare iconograficamente la locale fototeca. Attualmente viene adottato quale standard catalografico internazionale per il settore iconografico. ICONCLASS è composto da 10 grandi classi nelle quali sono comprese oltre 22.000 raffigurazioni che descrivono i temi principale dell’iconografia storico-artistica occidentale. Questa classificazione è stata scelta dall’Istituto Centrale per il Catalogo e la Documentazione (ICCD) del nostro Ministero per i Beni e le Attività Culturali quale supporto terminologico per la descrizione iconografica del soggetto. L’ICCD ha tradotto integralmente il Sistema e in accordo con il Iconclass Research & Development Group (IRDG) ha publicato il sistema in italiano e prodotto un CD-ROM per la ricerca in automatico dei soggetti. [ 70 ] La NML è utilizzata dal servizio OMNI (Organising Medical Networked Information) <http://www.omni.ac.uk/> [ 71 ] I codici di classificazione Ei sono usati dalla svedese Engineering Electronic Library (EELS) <http://eels.lub.lu.se/> e dall’inglese Edinburgh Engineering Virtual Library (EEVL) <http://eevl.icbl.hw.ac.uk/> [ 72 ] <http://www.zblmath.fizkarlsruhe.de/class/index.html> [ 73 ] <http://www.acm.org/> 120 | [ 74 ] Alcuni di questi schemi di classificazione hanno una struttura gerarchica, come la DDC o la UDC, altri invece elencano sia concetti singoli che composti e in pratica enumerano tutti i possibili soggetti che si prevede possano essere studiati nei documenti, come la LLC. Qualche schema, come la UDC, permette l’espressione di un numero virtualmente infinito di combinazione di soggetti nei documenti utilizzando delle faccette. [ 75 ] <http://www.getty.edu/research/tools/vocabulary/aat/> [ 76 ] <http://www.iconclass.nl/> [ 77 ] Cfr. A. Maple, Faceted access: a review of literature, BCC95/WG FAM/2, MLA Clearinghouse, 1995 <http://theme.music.indiana.edu/tech_s/m la/facacc.rev> e Foskett, cit., capitoli 5-6. [ 78 ] Cfr. il manuale di J. M. Aitchinson, NISO Z39.19: Standard for Structure and Organization of Information Retrieval Thesauri, 1998 <http://www.jelem.com/z39.htm>; F. Brown, Vocabulary Links:// Thesaurus Design for Information Systems - seminar by Dr. Bella Hass Weinberg, 1998, <http://www.allegrotechindexing.com/article02.htm>. Bella Hass è autrice della prima bozza del NISO National Standard on Thesaurus Construction, pubblicato nel 1994. [ 79 ] [ 83 ] UNI ISO 2788 Linee guida per la costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985. Metodi per l’analisi dei documenti, la determinazione del loro soggetto e la selezione dei termini di indicizzazione; Guidelines for the Construction, Format, and Management of Monolingual Thesauri Document Number: ANSI/NISO Z39.19-2003, National Information Standards Organization, 28 August 2003; Guidelines for Indexes and Related Information Retrieval Devices Document Number: NISO TR-02-1997, National Information Standards Organization, 1 January 1997. <http://www.getty.edu/research/tools/vocabulary/> [ 80 ] La differenza tra i thesauri e gli schemi di classificazione non è nella loro rappresentazione. I thesauri progettati in modo appropriato avranno sia una rappresentazione come elenco alfabetico che come classificazione, e ogni classificazione bibliografica definisce relazioni tra i concetti e una sorta di indice alfabetico per soggetto. [ 84 ] M. Hearst, User interfaces and visualization, in R. Baeza-Yates & B. Ribeiro-Neto (Eds.), Modern Information Retrieval, Addison-Wesley, MA, 1999, pp. 257-325. [ 85 ] P. Harpring, How Forcible are Right Words!: Overview of Applications and Interfaces Incorporatine the Getty Vocabularies, paper, Museum and the Web Conference,1999, <http://www.archimuse.com!mw99/papers/harpring/harpring.ht ml>. Cfr. inoltre P. Harpring, User’s Guide to the AAT Data Releases, J. Paul Getty Trust, 2000 e M. Doerr, Semantic Problems of Thesaurus Mapping, in «Journal of Digital Information», 2001 <http://jodi.ecs.soton.ac.uk/Articles/v01/i0 8/Doerr/#_Toc497798905> [ 86 ] Cfr. ad esempio SPIRO Online Visual Database (<http://www.lib.berkeley.edu/ARCH>) The University of California at Berkeley Architecture Slide Library’s SPIRO Online Visual Database. Guidelines for Authority and Reference Entries, recommended by the Working Group on and International Authority System, approved by the Standing Committee of the IFLA Section on Cataloguing and the IFLA Section on International Technology, IFLA International Office for UBC, London 1984. [ 82 ] [ 87 ] Come nel caso dell’Image Directory (<http://www.imagedir.com/>) che presenta link diretti a AAT e ULAN web browsers, o il National Graphic Design Image Database (http://ngda.cooper.edu/), che utilizza l’AAT per descrivere gli attribute dei documenti. G. Badalamenti, L’authority control in un contesto universitario: una scelta obbligata, presentato a The authority control in the Academic context: a Hobson’s choice, in Proceedings International Conference Authority Control: Definition [ 81 ] Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 121 and International Experiences, Florence, Italy, <http://eprints.rclis.org/archive/00000339/02/badalamenti_ita.pdf> [ 88 ] B. Tillett, International shared resource record for controlled access, in Authority control in the 21st century: an invitational conference, March 31-April 1, 1996 <http://www.oclc.org/oclc/man/authconf/t illett.htm> [ 89 ] Cfr. J.F. Sowa, Building, Sharing, and Merging Ontologies, 18 July 2003, <http://www.jfsowa.com/ontology/ontoshar.htm>; N. Crofts, P. Le Bœuf, O. Artur, Ontology, Semantic Web and Libraries, in Semantic Web and Libraries. 26 Library Systems Seminar, ELAG, Rome, 17-19 April 2002, <http://www.ifnet.it/elag2002/papers/pap9 .html>; C. Behrens, V. Kashyap, The ‘Emergent’ Semantic Web: A Consensus Approach for Deriving Semantic Knowledge on the Web, Telcordia Technologies, 2001, <http://lsdis.cs.uga.edu/~kashyap/publications/SWWS01.pdf> [ 90 ] Thomas R. Gruber: «An ontology is an explicit specification of a conceptualization» (una concettualizzazione, in qeusto contesto, si riferisce ad un modello astratto di come le persone pensano circa le cose del mondo, di solito ristretto ad una particolare area tematica) Una specificazione esplicita significa che ai concetti e alle relazioni del modello atratto vengono dati termini e definizioni specifiche; Nicola Guarino: «An ontology is a logical theory accounting for the intended meaning of a 122 | formal vocabulary»; James Hendler: «An ontology is a formal definition of a body of knowledge»; John F. Sowa: «An ontology is a catalog of the types of things that are assumed to exist in a domain of interest D from the perspective of a person who uses a language L for the purpose of talking about D». [ 91 ] A. Lozano-Tello, A. Gómez-Pérez, E. Sosa, Selection of Ontologies for the Semantic Web, in «Lecture Notes in Computer Science», Springer-Verlag Heidelberg, vol. 2722 / 2003, pp. 413 – 416. [ 92 ] M. Gruninger, J. Lee, Ontology applications and design: Introduction, in «Communications of the ACM», vol. 45, n. 2, 2002, pp. 39-41. [ 93 ] T. Berners-Lee, J. Hendler, O. Lassila, The semantic Web, in «Scientific American», n. 284, May 2001, pp. 34–43. 4 Un sistema conoscitivo per la didattica e la ricerca del design in ambito universitario Perla Innocenti A library, to modify the famous metaphor of Socrates, should be the delivery room for the birth of ideas Norman Cousins 4.1 Introduzione Il presente capitolo si propone di affrontare le problematiche relative alla formazione di un knowledge base, come strumento di supporto al progetto di Disegno Industriale. Si tratta di un tema particolarmente complesso poiché, a fronte di una operatività ampiamente riconosciuta, e che in ogni caso segue percorsi le cui procedure vanno progressivamente affinandosi sulla base di uno schematismo generalmente evidente e chiaro, il progetto vive la permanente scissione tra il sistema delle informazioni e delle conoscenze. Tale sistema info-conoscitivo costituisce la condizione a priori dell’atto creativo ed esecutivo e la definizione del progetto, che però raramente si riesce ad appoggiare ad esso. Ciò che caratterizza il problema è la forte differenziazione tipologica di dati, informazioni e conoscenze 1 relative ai prodotti, ai processi e ai progetti – siamo infatti solitamente in presenza di modelli, immagini, video, disegni, testi … –, e la loro Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 123 sostanziale disomogeneità, che non ne permette la fruibilità immediata e la facile trasferibilità. Inoltre, mentre le informazioni e le conoscenze cui si appoggia il progetto di Disegno Industriale sono prevalentemente di tipo manipolativo-visuale, le tradizionali metodologie di catalogazione e di accesso ai dati seguono indicizzazioni prevalentemente di tipo testuale. Come risultato, i materiali del Disegno Industriale giacciono frammentati e poco visibili, giacenti in stato di materiale passivo e difficilmente utilizzabile come supporto ad ogni ulteriore elaborazione (di progetto e/o di studio). L’obiettivo in questa sede è dunque quello di mostrare i passaggi metodologici atti a creare una possibile struttura di un sistema informativo e conoscitivo in quest’ambito. L’ipotesi principale alla base di questo capitolo – certo fortemente parzializzante ma, a mio avviso, necessaria per definire una procedura circoscritta e circoscrivibile – è il riferimento non al progetto in senso ampio, ma alla fase metaprogettuale, «individuata nella predisposizione di strumenti e modelli che operano su risorse concettuali e conoscitive, nell’individuazione di una metodologia, e nell’organizzazione – attraverso strumenti e risorse – di nuove possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di offerta didattica» 2, obiettivi perseguibili proprio attraverso un’attività di ricerca, acquisizione, sistematizzazione di dati, informazioni, conoscenze. La seconda ipotesi è quella dell’adozione di sistemi online, grazie alle loro caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità tipologie di documenti, di formati e di linguaggi. Il filo rosso seguito è quello che fa uso dei sistemi in ambienti di rete come strumento di archiviazione, restituzione, disseminazione dell’informazione sul design. Punto di partenza sono le modalità di restituzione di ciò che è oggi identificabile come il sistema conoscitivo per il design, così come sono presentate nei percorsi accademici e percorsi professionali. Una prima area di ricerca riguarda invece la tipologia dei dati che il progetto di design produce quotidianamente e di cui fa uso, a fronte della quale si tenterà di esporre il procedimento con cui si realizzano oggi i knowledge base online per altri campi affini della conoscenza. Infine, si cercherà di mostrare una prima serie di ipotesi di intersezioni, prefigurando i caratteri di un sistema conoscitivo per il design. Il testo non tratterà dei sistemi informatici utilizzati per due motivi fondamentali: non sono il nostro campo di competenze, e neppure pensiamo sia prospettabile un sistema informatico – che è un progetto di breve periodo – in assenza del progetto della struttura informativa. Ciò che risulta evidente, infatti, è che un sistema conoscitivo deve essere sviluppato innanzitutto in termini di metodologie, procedure ed infine di tecnologie: la 124 | rete come si sa è volatile, la tecnologia soggetta a rapida obsolescenza, è facile terminare nel nulla... e l’efficacia di un sistema di accesso all’informazione e alle conoscenze è direttamente proporzionale all’intelligenza impiegata per organizzarlo. 4.1.1 Restituzione online delle informazioni relative al design A fronte delle enormi potenzialità della rete, come è stato più volte osservato é facile perdersi nell’oceano del Web senza un’organizzazione dell’enorme massa di risorse che ogni giorno vengono ad aggiungersi e a stratificarsi a quelli già presenti. Un primo tentativo di progressiva articolazione e circolazione dell’informazione online oltre il semplice accumulo è quello del portale, che rappresenta, secondo un’efficace descrizione di Howard Strauss un «hub from which users can locate all the Web content they commonly need» 3. Verticali-specializzati oppure orizzontali-generali 4, organizzati in directory, i portali cercano di rispondere alla necessità di una qualche forma elementare di stabilità, di sicurezza trasmissiva e di catalogazione, che permetta il veloce ritrovamento delle informazioni: nient’altro che l’antico concetto di catalogo cartaceo, sfruttando però uno dei maggiori vantaggi del Web, cioè la possibilità di collegare nuove risorse con materiali retrospettivi e ampliare costantemente la rete dei documenti collegati. Soprattutto in tempi recenti, e in ambiti disciplinari in cui le informazioni e le conoscenze non sono direttamente e unicamente letterarie (ad esempio per tutte le arti visuali, o per quelli legati alla costruzione in senso lato, o per le discipline scientifiche che fanno ampio uso di sistemi documentali visuali), al problema dell’accumulo e della catalogazione si è affiancato però quello della modalità di restituzione dell’informazione, che non si limita a semplici stringhe bibliografiche o ad apparati testuali ma che richiede la compresenza di immagini, disegni, video, modelli, articolati secondo una struttura che organizzi modi e forme di questa trasmissione e di questa fruizione. Questo ha portato innanzi due nuove problematiche: - il modo di veicolare le informazioni attraverso specifici media; - il modo di richiamare le informazioni non partendo soltanto da indicizzazioni di materiali testuali ma anche visuali (cfr. paragrafo 2.2.5). Nel caso del design, possiamo tranquillamente affermare che in questo panorama stiamo vivendo un’epoca delle origini, ancora con poca informazione accumulata, di solito marginalmente rappresentata (anche se spesso ben presentata). In ogni caso la tipologia di informazione offerta è quella della sintesi a-priori estratta o anche completa replica, semplicemente restituita in forma sequenziale navigabile e mancante di qualunque forma di strutturazione, relativa sia all’informazione di base che alla sua rielaborazione. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 125 Le informazioni sul design si esauriscono dunque in quanto viene oggi mostrato sul Web? Evidentemente no, trattandosi di conoscenze di carattere manipolativo-visuale strettamente collegate all’esperienza e in quanto tali difficilmente proceduralizzabili, oltre che provenienti da forme di apprendimento diversificate. Ciò che, infatti, è presentato è in forma marginale materiale per il metaprogetto, non essendo il prodotto del processo progettuale, ma di solito semplicemente la sua ‘demo’ o una sua fotografia da lontano. Su questi siti Web e portali manca la gestione delle risorse presenti secondo schemi di metadati coerente e organizzato, l’individuazione delle chiavi di accesso (catalogazione sistematica secondo categorie e problematiche trasversali; indicizzazione, thesauri) per le varie tipologie di utenti e di bisogni informativi identificati, la coordinazione con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali. Scorrendo rapidamente le principali tipologie espositive e contenutistiche secondo cui viene articolata sul Web l’informazione sul design, si possono attualmente circoscrivere per fini esemplificativi due grandi bacini di fornitori. Da un lato, associazioni di categoria e grandi organizzazioni istituzionali o consorzi no-profit internazionali (ad esempio il canadese Design Exchange, l’inglese Design-Council, il Korean Institute of Design Promotion, le americane ICSID e Corporate Design Foundation), con finalità educative e di ricerca e forti legami con le istituzioni, si fanno carico della promozione e diffusione culturale e di sensibilizzazione sul design, sull’innovazione e sulla produzione nazionale. Queste realtà hanno dato vita a portali verticali di riferimento per aziende, professionisti e persone interessate al design, la cui caratteristica é quella di essere infrastrutture informative specializzate in una specifica categoria di informazione, offrendo una serie di servizi connessi: organizzazione di seminari, corsi di formazione, eventi e concorsi; realizzazione di indagini economico-scientifiche sul design e consulenze; promozioni; spazi di lavoro virtuali; pubblicazioni. I contenuti, a volte suddivisi per categorie merceologiche o per tematiche inerenti al progetto, spaziano da fonti di informazioni ed eventi ad interviste, da virtual gallery e virtual space a portfolio e case study. A fronte della gestione centralizzata di questi operatori, in Italia, dove vi é una importante cultura progettuale, manca una realtà istituzionale di coordinamento nel veicolamento dell’informazione relativa al metaprogetto di design. Sono invece presenti portali di carattere commerciale come Design Italia, e-magazine come Designboom, siti specializzati come E-interiors o comunità virtuali come Design Villane 5. L’organizzazione delle informazioni in questi siti e portali avviene secondo sequenze lineari di dati, non strutturati secondo gli standard catalografici 126 | internazionali. La consultazione avviene in genere attraverso un elenco alfabetico di intestazioni o un menu di opzioni presenti nella videata. Laddove vengono adottate, le tecniche di information retrieval riportano le imprecisioni dei motori di ricerca nei livelli più complessi del linguaggio. In un’indagine su circa cento siti Web di facoltà e dipartimenti nazionali e internazionali nell’ambito del design, svolta da chi scrive nel 2001 con l’obiettivo di individuare la presenza di forme organizzate di esposizione di varie tipologie di dati nell’ambito delle attività didattiche e di ricerca, é stato rilevato come non siano presenti veri e propri sistemi di informazioni strutturate, ma collezioni di immagini e di dati spesso multimediali. Vengono in particolare privilegiate alcune forme specifiche di presentazione come ad esempio raccolte tematiche oppure portfolio individuali dei lavori di studenti e docenti, che negli ultimi anni hanno raggiunto una crescente popolarità e che costituiscono un incentivo al miglioramento della didattica e agli obiettivi della facoltà. Una tendenza che ha peraltro portato alla nascita degli electronic institutional portfolio 6, sia come interfaccia di dialogo (interattivo, evidenziale, visuale) interno e con i diversi stakeholder, che come mezzo per focalizzare i propri obiettivi e le aree di competenze accademiche. La maggior parte delle facoltà e dei dipartimenti presentano delle virtual gallery collettive, relative ai lavori e ai progetti realizzati da studenti e vari membri della comunità accademica: le immagini sono accompagnate da una serie di informazioni cha vanno dal nome dell’autore al programma utilizzato all’anno di corso. Nel caso dei portfolio un esempio interessante é quello della School of Industrial Design della University of Montreal, che espone ogni anno i progetti presentati dagli studenti al termine del corso di studi, e consultabili on-line tramite una navigazione ipertestuale. Gli studenti hanno inoltre la possibilità di inserire on-line anche precedenti lavori, la loro fotografia e dei riferimenti per un eventuale contatto. Ad eccezione dell’Electronic Visualization Laboratory-EVL della University of Illinois di Chicago e dell’Istituto Superiore per le Industrie Artistiche di Firenze, i materiali didattici e di ricerca non sono sistematicamente archiviati. Un tentativo significativo di strutturazione delle informazioni secondo finalità didattiche è quello del Taubman College of Architecture and Urban Planning della University of Michigan, che lavora in tandem con un’unità della biblioteca di ateneo, la Digital Library Production Service. Il College crea le immagini digitali, le archivia in un database e le conserva su CD-ROM: una copia dei lavori viene inviata ogni mese alla Digital Library, che si occupa di inserire i dati appropriatamente rielaborati sul server del College, nel sito della Union Library Visual Resources Collection, con accesso parzialmente limitato. In tal modo gli utenti che utilizzano i computer dell’Università possono effettuare ricerche onCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 127 line e visualizzare sia la stringa di catalogazione, opportunamente elaborata dai bibliotecari, che l’immagine stessa. Poiché tuttavia «just as artists are reluctant to ‘put their work on the web’, students too are timid about it» 7, è prevista la videoregistrazione in digitale delle fasi di progettazione dei lavori degli studenti. 4.1.2 I giacimenti documentali del design: il caso della Facoltà del Design del Politecnico di Milano In base a questa veloce ricognizione il panorama documentale sembrerebbe sostanzialmente indicare degli output modesti, ma se andiamo ad osservare con più di attenzione, ad esempio, che cosa si produce oggi come materiali nell’ambito della didattica e della ricerca nella Facoltà del Design del Politecnico, le categorie dei materiali individuati da chi scrive indicano: - una netta prevalenza della documentazione visuale rispetto a quella testuale. Le informazioni visuali nella didattica e nella ricerca occupano un posto sempre più rilevante: archivi multimediali, video di conferenze, seminari ed incontri dedicati a temi specifici (lezioni di specialisti, scambi tra i docenti e il pubblico), educazione e tirocinio a distanza (corsi on-demand, lezioni di tipo hands-on, classi virtuali); - una quasi totalità di materiale prodotto in forma digitale (solo talvolta successivamente stampato o prototipizzato, in ogni caso a partire da file) (Fig. 1); - una straordinaria ricchezza di forme di rappresentazione che corrispondono ad altrettante tipologie di risorse per il progetto: - materiali grafici e multimediali (disegni 2D e 3D, video, movie, siti Web, immagini fisse e in movimento, walk-through, VRML, interviste…); - materiali testuali (prevalentemente documenti della cosiddetta ‘letteratura grigia’, che possono includere, ma non sono limitati a, i seguenti tipi di materiali: report (pre-print, report preliminari e di avanzamento, report tecnici, report statistici, memoranda, report sullo stato dell’arte, report su ricerche di mercato, ecc.), tesi di laurea e di dottorato, atti di conferenze, documentazione tecnica e standard, traduzioni non commerciali, bibliografie, documentazione tecnica e commerciale, documenti ufficiali non pubblicati, ricerche e studi di settore, case study, presentazioni, materiale informativo, normative); - campioni, oggetti e semilavorati; - eterogeneità di formati di file grafici (.3ds; .ai; .avi; .dgn; .dwg; .dxf; .e2; .e3; .eps; .gif;.html; .iges; .jpg; .lp; .ma; .max; .mov; .mpg; .mts; .obj; .pdf; .ppt; .psd; .rtf; .swf; .tiff; .wire; .wrl; doc; dxf;...); 128 | - un’altrettanto ricca varietà di modalità di produzione (seppure sempre all’interno del desktop computer), collocabili nelle macrocategorie di documenti prodotti per utilizzo interno oppure on demand per usi esterni; - una tipologia diversificata di fornitori e utenti di dati e conoscenze: studenti, docenti, ricercatori, professionisti, aziende....; - modalità di acquisizione e conservazione che non presentano attualmente una procedura standardizzata, di modo che la maggior parte dei materiali risulta spesso ‘invisibile’ alla consultazione e senza una collocazione definita e organizzata nel tempo. Il contesto di tale panorama documentale è quello della Classe delle lauree specialistiche in Disegno Industriale del Politecnico di Milano, il cui obiettivo è la formazione di una figura di progettista di alto profilo culturale capace, di confrontarsi sia con le dinamiche di innovazione che attengono il prodotto finale (negli aspetti tecnico-produttivi, tecnico-funzionali e formali), il prodotto intermedio (materiali, semilavorati, componenti) e i processi che ne accompagnano il ciclo di vita (progettuali, produttivi, distributivi, d’uso); sia con le innovazioni socio-culturali, di consumo e di mercato che hanno diretta influenza sulle strategie produttive, comunicative, distributive che concorrono [Fig. 1] Esempi di output digitali prodotti nell’ambito della Facoltà del Design, Politecnico di Milano Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 129 alla definizione dell’identità dell’impresa (dalla progettazione di sistemi di servizio a quella dei luoghi e delle modalità di vendita); sia infine di intervenire progettualmente sul ‘contesto’ fisico di produzione e d’uso dei prodotti (dagli aspetti qualitativi che contribuiscono a migliorare la percezione e la fruizione di un ambiente ai requisiti ambientali di prodotti, processi produttivi e di consumo finalizzati a strategie di ‘sostenibilità’). Ciò comporta una solida formazione, che raccolga e finalizzi al progetto oltre agli aspetti metodologicooperativi e teorico-scientifici della cultura del disegno industriale, anche gli ambiti interdisciplinari (dalla programmazione e organizzazione della produzione al marketing, dall’analisi settoriale e intersettoriale all’economia aziendale, dalla ingegneria dei materiali all’elettrotecnica ed elettronica, dall’ingegneria meccanica e delle tecnologie di lavorazione alla ricerca operativa dalla ricerca artistica e morfologica alla semiotica e linguistica, dall’estetica alle scienze dell’informazione, dalla psicologia cognitiva alle discipline dell’interattività sensoriale fra uomo e sistema artificiale).Questa ricca articolazione di dati è dunque notevolmente maggiore di ciò che solitamente ‘presentano’ i portali, e proprio per la sua complessità richiede forme di archiviazione, catalogazione, restituzione, ‘illustrazione’ che devono necessariamente non solo attingere a tutte le metodologie e potenzialità attuali, ma in più cercare di svilupparne capacità e qualità al fine di poter richiamare informazioni di una certa natura con metodi di ricerca ed esposizione dotati di un grado di iconicità e similarità appartenenti a quella stessa natura. La documentazione nel design presenta quindi un’ampia gamma di tipologie di materiale, variabile a seconda del contesto, che comprende le forme più diverse. Ogni archivio o giacimento documentale possiede un ‘tassello’ diverso della galassia della documentazione del design, che è funzionale agli interessi e al campo di indagine che gli sono propri. Le differenze tra le varie raccolte, inoltre, non derivano soltanto dalle diversità disciplinari o tematiche ma sono spesso determinate anche dalle diversa finalità con cui sono state costituite. Vi sono archivi e giacimenti documentali che si definiscono all’interno di un progetto di ricerca: la selezione dei documenti raccolti ma anche la struttura delle schede catalografiche e la definizione delle chiavi di ricerca è determinata dagli obiettivi stessi d’indagine; sono spesso interessati al processo, dunque anche alla documentazione di preparazione, di studio, di analisi, e/o alle varie fasi di elaborazione; altre volte ricostruiscono singole vicende di progettazione, raccogliendo anche documentazione grafica e normativa correlata. Esistono poi gli archivi di consultazione presso centri di documentazione universitari, che svolgono la funzione di supporto e reference alle attività didattiche e di ricerca: dovendo provvedere ad una documentazione fattuale di riferimento, spesso non hanno interesse per la fase preliminare o di elaborazione. Infine gli archivi 130 | o fondi storici, che nella maggioranza dei casi conservano l’insieme dei documenti raccolti nel corso della loro attività da designer e architetti famosi: vi si troverà a volte un’ampia documentazione della fase di elaborazione per i progetti da loro curati, corredati da sporadici e incompleti documenti sugli strumenti a partire da cui e per cui tali progetti sono stati elaborati. La documentazione del design assume quindi forme molteplici: complessi e diversificati sono i documenti che costituiscono un progetto, così come gli interessi e le finalità degli archivi del design e le logiche di catalogazione e di ricerca di questo tipo di documentazione, che in ambito bibliotecario rientra spesso nel settore della letteratura grigia. In generale, le pubblicazioni della letteratura grigia sono di tipo non convenzionale, fuggevole, a volte effimero, e per loro natura ai bibliotecari risultano di difficile acquisizione e messa a disposizione al pubblico. In questo quadro così complesso si è tentato di far luce sulle differenze e sui bisogni informativi comuni verso la definizione di un progetto di catalogazione per questo settore. I giacimenti documentali del design sono insieme fortemente virtuali (il knowhow, i processi, l’organizzazione, input e output digitali) e materiali (i prodotti di design, i materiali del design), a metà tra le collezioni bibliografiche, raccolte di letteratura grigia, collezioni museali e archivi. Dal punto di vista di chi si occupa della gestione di tali giacimenti, i tratti in comune con la documentazione d’archivio sono molteplici, dalla genesi dei documenti alla specificità del catalogo. «L’archivio – come ha scritto Ezio Lodolini – è un complesso organico di documenti prodotti nel corso di un’attività pratica, amministrativa, giuridica; il documento, singolarmente considerato, è privo di autonomia e ha scarsissimo valore, mentre ne ha uno grandissimo come parte di un complesso, come anello di una catena; lo scopo giuridico, amministrativo e pratico è determinante per la formazione dell’archivio. L’archivio è l’antitesi di una raccolta o collezione» 8. Anche la «spontaneità di formazione dell’archivio», come l’ha definita Giuseppe Plessi 9, è un elemento che non è possibile ravvisare in altri ambiti, data la volontarietà della formazione di una biblioteca, di un museo o di altri tipi di collezioni 10. La redazione dell’inventario di un archivio quindi non può mai essere una mera somma di documenti. Spesso negli archivi, così come nella documentazione di progetto, non è possibile o è difficile ricondurre la documentazione ad una organizzazione originaria, capire i meccanismi di creazione. Ma nel design vi è la necessità vitale di riutilizzare i documenti e le conoscenze creati e accumulati nelle varie attività di progetto. Una volta compresi i nuovi attori e i processi della catena documentaria, la creazione di strutturazione ampia e la compilazione di ricchi indici rappresenta una notevole possibilità di accedere a giacimenti documenCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 131 tali eterogenei e complessi come quelli descritti all’inizio di questo paragrafo. Il comportamento nell’utilizzo delle informazioni (user modeling 11) per l’apprendimento universitario può essere identificato applicando le teorie educative. L’interattività è stata indicata come una componente rilevante della didattica e dell’insegnamento del design 12: l’approccio learning-by-doing di John Dewey 13, adottato come metodologia didattica del Corso di Laurea in Disegno Industriale, è spesso utilizzato per fornire nelle teorie pedagogiche all’uso dei computer per progettare ambienti didattici interattivi. Wilson definisce quelli di apprendimento interattivo degli ambienti che permettono «the electronically integrated display and user control of a variety of media formats and information types, including motion video and film, still photographs, text, graphics, animation, sound, numbers and data. The resulting interactive experience for the user is a multidimensional, multisensory interweave of self-directed reading, viewing, listening, and interacting, through activities such as exploring, searching, manipulating, writing, linking, creating, juxtaposing, and editing» 14. L’interattività è altresì emersa come idea unificante e collante in diversi progetti di biblioteche digitali in ambito universitario 15: Arms ha per esempio notato che le biblioteche «have always supported interactions with the fund of knowledge, interactions that come in many shapes and sizes... Interacting with knowledge is what life-long learning is all about» 16. Nelle biblioteche digitali, inoltre, le interattività hanno il potenziale di operare a vari livelli: l’utente e il documento digitale, l’utente e le collezioni digitali, l’utente e i servizi, l’utente e la biblioteca come entità, l’utente e un altro utente. 4.1.3 Sistemi informativi e sistemi conoscitivi in ambienti di rete Genericamente, sotto la categoria di sistemi informativi 17si possono classificare tutti i sistemi tecnologici che manipolano, conservano, processano e distribuiscono un’informazione che ha o si aspetta possa avere un impatto sul comportamento umano, organizzato all’interno di un contesto reale di azione. Essi sono essenzialmente implementati per mettere a disposizione di una particolare classe di utenti una serie di servizi informativi con i quali interagire per il soddisfacimento dei loro più svariati bisogni informativi 18. La maggior parte dei sistemi informativi attualmente in uso sono stati sviluppati in accordo con una serie di modelli normativi tesi a descrivere i processi cognitivi di problem solving e decision making 19. L’assunzione implicita alla base di questi sistemi é che i bisogni informativi degli utenti siano statici e che il processo di accesso alle informazioni consista nella capacità di esternalizzare la loro mancanza di informazione e di ridefinire successivamente la domanda iniziale, prima di recuperare ciò di cui si ha bisogno. 132 | In molti ambiti universitari tecnico-scientifici sono stati elaborati dei sistemi informativi d’area disciplinare, che si stanno evolvendo verso una sempre maggior integrazione transnazionale. L’affermazione di strategie di Knowledge Management – in ambito aziendale ma anche in organizzazioni come le università (cfr. paragrafo 1.7) – e gli studi e le indicazioni provenienti dalle scienze cognitive suggeriscono di tentare la trasformazione di questi sistemi informativi in sistemi cognitivi d’area disciplinare. Tutte le organizzazioni creano conoscenza. Nella maggior parte dei casi, però, questo processo è casuale, stocastico e come tale imprevedibile 20. È però senz’altro possibile modificare le cose affinché la creazione e la diffusione (o disseminazione) della conoscenza escano dall’accidentale, dal fortunoso e dall’episodico per sistematizzarsi in organizzazioni e in processi più razionali ed efficaci, e che nel medesimo tempo riescano a salvare libertà di espressione e di creazione insieme con la stabilità e la sicurezza trasmissiva di un sistema di comunicazione omogeneo e controllabile. Nel passaggio di informazione e di conoscenza che avviene fra autore e lettore, come ha più volte puntualmente osservato Bogliolo 21, è possibile e può essere vantaggioso frapporre una struttura cognitiva che organizzi modi e forme di questa trasmissione e di questa fruizione. Le biblioteche e i centri di documentazione da tempo si basano su un rapporto triadico tra documenti, meccanismi di mediazione semantica e utenti, ponendo l’enfasi sugli ultimi due elementi del rapporto. L’intermediazione delle scienze dell’informazione, operata dai bibliotecari-documentalisti, nei confronti e in collaborazione con gli utenti, allo scopo di creare una struttura cognitiva (la learning library 22) capace di facilitare l’apprendimento di tutti i suoi membri e di trasformare se stessa continuamente, come struttura e come organizzazione, con il modificarsi delle esigenze cognitive dei suoi membri. La letteratura sui sistemi cognitivi è molto ampia. Nati nell’ambito dell’intelligenza artificiale, sono usciti dalle stanze dei ricercatori quando l’industria ha avuto bisogno di nuovi strumenti per far fronte a nuove sfide del mercato. I tempi sono più che maturi perché queste realizzazioni, sperimentate nel mondo del profitto, tornino al mondo universitario e della ricerca, per la progettazione di nuovi e migliori servizi per le sue produzioni scientifiche e culturali. Un sistema cognitivo ha l’obiettivo di fornire mezzi e strumenti (logici e tecnologici) per generare interpretazioni dirette del mondo reale, piuttosto che delle sue interpretazioni tramite i documenti. Come ha acutamente osservato Bogliolo il compito di un sistema cognitivo è quello di «gestire il corto-circuito fra autore e lettore, mediante un’organizzazione del lavoro che integra le attività dell’autore e quelle del bibliotecario-documentalista. Succede, così, che la conoscenza tacita che è posseduta dall’autore, e che è fonte creatrice del Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 133 documento, non possa essere integralmente trasferita in quest’ultimo: il documento rinvierà, alluderà, in misura maggiore o minore, a quella fonte, ma la natura stessa del documento, sia pur multimediale, non potrà offrirne una registrazione esplicita e completa» 23. L’organizzazione è ancora e sempre quella della biblioteca o del centro d’infor-mazione e documentazione, non importa quanto tecnologicamente avanzato. Il professionista dell’informazione rimane comunque un intermediario, ma su un piano superiore di ricchezza ontologica e di efficacia cognitiva, e dunque anche informativa: non si limita a moltiplicare le porte di accesso semantico e semiotico a una base di dati statica, ma a creare chiavi interpretative del pensiero che fluisce dai fornitori dei documenti agli utenti. Il problema nella realizzazione e nell’utilizzo di questi sistemi non è tanto strumentale, giacché le tecnologie ICT forniscono un aiuto rilevante nel perseguimento di questi obiettivi, grazie alle loro caratteristiche intrinseche di capacità di creazione, elaborazione, immagazzinamento e scambio in breve tempo di grandi quantità di informazioni in tutte le loro forme (dati, suoni, immagini, multimedia). Le ICT e le loro estensioni Web-enabled permettono un nuovo tipo di interazione e di disponibilità dell’informazione: la sua teletrasferibilità a distanza. Infine, sono in grado di supportare quasi completamente ogni tipo di informazione visuale, permettendo tramite i processi di vettorializzazione e/o discretizzazione di rendere l’informazione richiamabile non solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in base a caratteristiche visuali (colori, geometrie, texture, ecc.). Il Web stesso sta vivendo una profonda autoriflessione in senso semantico ad opera del suo creatore, Tim Berners Lee 24, al fine di creare sistemi aperti di accesso all’informazione che siano non solo semplicemente navigabili, ma completamente strutturabili e richiamabili tramite l’utilizzo del XML. Come spesso capita, si tratta di un problema di mentalità, poiché i sistemi knowledge-based sono accompagnati da una fama non positiva dovuta ad un approccio ingegneristico che ne ha appiattito e banalizzato la pluridimensionalità e pluridirezionalità. Per costruire un sistema cognitivo orientato a una disciplina, in pratica occorrono un progetto, un finanziamento, delle risorse tecnologiche e un gruppo di lavoro organizzato, interdisciplinare, composto da esperti del dominio (docenti e ricercatori della materia), esperti dell’informazione (bibliotecari e documentalisti), e esperti della tecnologia dell’informazione (ingegneri ed esperti d’intelligenza artificiale): in sostanza, le tre componenti della ‘piramide di conoscenza dell’organizzazione intelligente’ di Choo Chun Wei 25. Il metodo lavoro è indicato dalle nozioni di Knowledge Management elaborate da Nonaka, di processi di creazione di conoscenza top-down, bottom-up 134 | e middle-up-down. Quest’ultimo approccio presenta un modello iterativo di lavoro comune continuo (di cui non sempre gli attori sono consapevoli) attraverso il quale la conoscenza viene realmente creata. I diversi attori di questo modello tendono a trattare tali materiali secondo svariate logiche ed esigenze: gli autori per disseminare e condividere conoscenze e informazioni, i bibliotecari e i documentalisti per creare un universo di informazioni correlate tra loro, gli utenti per recuperare documenti e/o informazioni a partire da esigenze di studio e di ricerca oppure ragioni professionali. Le loro azioni raramente si configurano come interazioni: pertanto, seppur inconsapevolmente, questi soggetti contribuiscono ad aumentare il ‘disordine’, l’entropia nell’universo catalografico. Il loro coordinamento in un sistema conoscitivo equivale a riunire sinergie positive e a potenziarle. Tale meccanismo, che rispecchia alcune modalità di lavoro tipiche del design, applicato alla sua documentazione potrebbe essere in grado di operare profondamente sull’informazione del disegno industriale con finalità progettuali, e molto di più perché la catalogazione di solito si riferisce a sistemi analogici, mentre tipicamente il dato di design è digitale. 4.1.4 Dal Cultural Heritage all’Industrial Design knowledgebase Gli output tipici finali dei processi di design risultano spesso in prodotti matrici, che costituiscono la rappresentazione del progetto stesso. Le manifestazioni più alte di tali progetti, in quanto documenti di una cultura progettuale che nell’ultimo secolo si è sempre più velocizzata, rientrano a pieno titolo nella categoria di Beni Culturali da conservare e tutelare. In Italia i musei del design e gli archivi d’impresa sono, infatti, testimonianza di una civiltà progettuale raffinata e radicata nel territorio insieme ai distretti industriali. La loro specificità ha peraltro dato luogo ad interessanti riflessioni museografiche e museologiche 26, intervenendo nel dibattito sui musei ‘cimiteri’ e i musei ‘vivi’: gli oggetti di design possono rimanere vitali e comunicare emozioni se utilizzati direttamente dai visitatori (far vedere solo l’oggetto e la sua fisicità è limitativo, inoltre molti oggetti del design sono ancora vivi nella nostra memoria quotidiana, a differenza di tanti artefatti di un passato remoto 27). Ciò implica un rinnovamento costante del museo o dell’archivio di impresa, e la necessità di ricostruire la storia e il contesto di oggetti di cui tipicamente non si registrano informazioni: anche in questo ambito emergono quindi problematiche relative alla sistematizzazione e alla restituzione di giacimenti documentali ‘altri’ rispetto ai tradizionali documenti bibliografici. Negli ultimi anni, in particolare in esperienze museali internazionali, sono stati applicati con successo molte delle metodologie e degli strumenti di sistematizzazione documentale descritti nei precedenti capitoli di questo volume: Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 135 da specifici metadati come le CDWA elaborate dal Getty Institute e le VRA Core Categories, a thesauri costruiti sullo specifico vocabolario di discipline particolari (dal più famoso Art & Architecture Thesaurus del Getty a quello messo appunto dall’Istituto Centrale per il Catalogo e la Documentazione di Roma relativo agli arredi e alle suppellettili religiose), a portali ‘per studiosi’ di tipo verticale per facilitare una ricerca approfondita offrendo contenuti di alta qualità e permettendo la ricerca su collezioni multiple, come lo Humanities Web Portal della University of California di Los Angeles. Molti portali relativi a discipline umanistiche 28 sembrano peraltro sempre più ispirarsi al modello dei cosiddetti enterprise information portal 29. Nel panorama italiano dei Beni Culturali, caratterizzato in modo imprescindibile dalla necessità di conservazione, tutela e fruizione, le possibilità offerte dalle ICT hanno offerto nuove possibili soluzioni alla secolare e spinosa questione della catalogazione complessiva del patrimonio sul territorio nazionale. Un recente rapporto della Corte dei Conti sullo stato della catalogazione statale ha infatti nuovamente ricordato come le schede di beni archeologici, artistici, architettonici, storici e demo-etno-antropologici redatte dall’Istituto centrale per il catalogo e la documentazione sono fino ad oggi momento circa 4.100.000 (tra schede di catalogo, pre-catalogo e inventario), delle quali oltre la metà sono già informatizzate. A queste devono essere aggiunte quelle curate dalle Regioni, per i beni di proprietà regionale e degli enti locali, e quelle a cura delle diocesi, per i beni ecclesiastici. «Nonostante la grande massa di dati acquisiti – si nota nella relazione della Corte dei Conti – il lavoro da compiere è ancora molto perché le più recenti stime indicano in oltre dieci milioni [Fig. 2] Sistema multimediale SIGEC dell’ICCD: diagramma del workflow (da Il Sistema Informativo Generale del Catalogo, 2002) 136 | di beni il patrimonio complessivo italiano da censire. Una indicazione ‘dinamica’ ed in continua crescita per nuove analisi critiche, nuovi ritrovamenti, nuovi scavi e nuove acquisizioni. Ancora oggi non si ha una conoscenza esaustiva dei beni che costituiscono il patrimonio pubblico. Una lacuna grave che necessita di essere colmata» 30. Quanto ai finanziamenti destinati alla catalogazione, per la Corte dei Conti «la somma spesa complessivamente nel settore negli ultimi quindici anni non è indifferente: 830 miliardi di vecchie lire di stanziamenti che non sempre hanno dato risultati positivi». Negli ultimi anni, l’Istituto Centrale per il Catalogo e la Documentazione (ICCD) del Ministero per i Beni e le Attività Culturali ha definito e avviato lo sviluppo di un progetto per la costruzione del Sistema Informativo Generale del Catalogo (SIGEC), che si fonda sul concetto, consolidato nel tempo dall’ICCD, del patrimonio come ‘sistema’ 31. La ricchezza del patrimonio italiano diffuso su un territorio connotato da beni di inestimabile rilevanza culturale, contestualmente al complesso dei beni musealizzati, rendono la sistematicità una condizione necessaria a garantire l’organica e integrata conoscenza del patrimonio. In passato, il rapporto degli enti locali con l’ICCD e il Ministero si è tradotto nella maggior parte dei casi nell’adozione dei tipi di schede e degli standard di catalogazione ministeriali; tuttavia, su questo terreno molte sono state le innovazioni prodotte a livello locale, soprattutto per tipologie specifiche di oggetti (come l’architettura industriale, il design, i beni demo-etno-antropologici, ecc.). D’altronde proprio sul piano degli standard fissati dal ministero si registrano diffuse tensioni, soprattutto per le persistenti carenze degli ‘standard di descrizione’ o di sintassi compilativa delle voci, nonché per la lentezza della strutturazione informatica delle schede, che ha già costretto in passato alcune regioni ad anticipare per proprio conto la conversione informatica delle schede ministeriali, in assenza di direttive specifiche dall’ICCD. L’evoluzione operata dal SIGEC è notevole, poiché si passa da una visione puntuale identificativa del singolo bene a una concezione unitaria e complessa del patrimonio, e quindi a una maggiore consapevolezza del rilievo che hanno assunto le relazioni tra i beni e le interazioni significative all’interno del patrimonio artistico e culturale. L’innovazione sia metodologica che tecnologica investe non solo il modo di concepire la catalogazione informatizzata, e la comunicazione di contenuti informativi ad essa riferiti, ma promuove anche una rete di rapporti più ampia e differenziata con gli enti che operano per l’organizzazione sistematica e la diffusione delle conoscenze. Il SIGEC si presenta pertanto come sistema multimediale di banche dati distribuite sul territorio nazionale (Fig. 2): una conoscenza capillare ed esaustiva del territorio è infatti realizzabile solo coinCiuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 137 volgendo una pluralità di soggetti fra i quali le Regioni e gli Enti Ecclesiastici, ma anche di organizzazioni come l’università o enti privati che si vogliano correlare con l’ICCD, allineando i dati con le normative di riferimento. Dal punto di vista informatico, l’interoperabilità dei record viene resa possibile attraverso la mappatura di schemi di metadati diversi, tra cui anche – dato non indifferente per la sua diffusione e facilità d’uso – il Dublin Core. 4.2 Ipotesi per una soluzione Lo scenario sopra descritto sembra particolarmente attuale e rilevante nell’ambito del metaprogetto nella Facoltà del Design del Politecnico di Milano, «individuato nella predisposizione di strumenti e modelli che operano su risorse concettuali e conoscitive, nell’individuazione di una metodologia, e nell’organiz-zazione – attraverso strumenti e risorse – di nuove possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di offerta» 32. Obiettivi perseguibili proprio attraverso un’attività di ricerca, acquisizione e catalogazione di dati, informazioni e conoscenze, tesa ad ampliare e ridefinire gli strumenti del flusso di conoscenze e d’informazione della Facoltà del Design tramite la codifica di una serie di procedure sistematiche, secondo standard e criteri condivisi. Il progetto è un modo molto potente di comprendere un artefatto, ma per sua natura (il progetto si trasforma nello spazio e nel tempo) risulta difficile da visualizzare. Fino all’avvento del Visual Computing e della Realtà Virtuale, nel nostro bagaglio di rappresentazioni visive non sono state operate molte modifiche rispetto alla rappresentazione ‘per esploso’, che perciò non riesce a restituire la complessa ecologia del progetto, a rappresentare cioè simultaneamente gli artefatti del design e le persone attorno ad esso, le conoscenze in esso applicate e i problemi incontrati, in un sistema ibrido che coniuga soggettività e oggettività. Il design opera infatti una ri-progettazione del composito ambiente che lo circonda 33, producendo degli artefatti attraverso una serie di interazioni e di compromessi secondo una traiettoria spaziale, temporale e sociale. Per tale motivo, una sistematizzazione documentale del design e la sua rappresentazione non possono prescindere dal contesto degli artefatti del progetto. Siamo in una fase, nell’evoluzione delle modalità di archiviazione dei documenti, in cui abbiamo la possibilità di archiviare documenti digitali nativi in sistemi ancora digitali, sfruttando appieno il potenziale interattivo e relazionale delle ICT per proporre al mondo accademico e professionale del design uno strumento di studio e di lavoro ad alto valore aggiunto. Il grado d’elaborazione attuale dei personal computer e l’introduzione del concetto di visual computing, strettamente connesso a quello di visualizzazione scientifica, come target di riferimento dell’evoluzione del sistema hardware e software, stanno veloce138 | mente conducendo verso la possibilità di realizzare non solo operazioni di ricodifica di documenti fisici in documenti digitali, ma una loro trascrizione in forma integrale unita ad un loro facile collegamento reciproco, alla possibilità di creazione di relazioni tra ambiti distinti, alla facilità di accostamento e all’accesso unificato e integrato di tipologie eterogenee, con processi di graduale standardizzazione tra differenti protocolli. Da un punto di vista della formazione di un archivio digitale e della sua fruizione, le caratteristiche distintive dei trend tecnologici attuali, che consentono di concepire uno scenario completamente nuovo e di dimensioni prima sconosciute nell’archiviazione e nell’Information Retrieval delle informazioni, sono sintetizzabile in sei punti: 1. il desktop fisico è stato completamente sostituto da un desktop virtuale. I sistemi operativi di nuova generazione (Windows XP, Mac OS X), sono destinati a realizzare una nuova rivoluzione del modo di lavorare degli utenti: il desktop virtuale può, infatti, permettere di costruire una soluzione specifica in forma completamente digitale per realizzare una determinata procedura nella sua completezza. Le implicazioni di questa sostituzione sono profonde e sostanziali: il PC non fornisce più solamente strumenti di ausilio, ma tutto il ragionamento e la sua visualizzazione sono trasferiti in forma digitale su un supporto unificante capace di metodi, più potenti e di accesso più immediato, in grado di integrare istantaneamente molteplici tecniche di rappresentazione (disegno tecnico, disegno concettuale, modellazione, fotografia, ipertestualità, animazione, filmati, testi, ecc.), che quindi possono essere sfruttate rapidamente, a basso costo, e con risultati immediatamente fruibili e fortemente stabili. Inoltre, per la semplicità delle interfacce, il lavoro sul computer oggi non costituisce più un mestiere per operatori specializzati, destinati a fungere da tramite tra il professionista e la macchina, ma una metodologia che presenta un’operatività e una facilità d’uso del tutto simile a quella degli strumenti analogici e quindi è l’esperto della singola disciplina (designer, fotografo, architetto, archivista, documentalista …) a potersi rioccupare direttamente del problema, con evidente possibilità di notevole miglioramento qualitativo e di controllo del processo; 2. i formati digitali sono sempre più standardizzati. Uno dei più grandi problemi dei sistemi computerizzati è sempre stato quello della codifica dei dati, in particolar modo nel caso dei formati grafici, di cui neanche la rappresentazione analogica è univocamente determinata (anche per la sua natura intrinseca di sistema ad alto simbolismo). Inizialmente si è assistito ad una proliferazione iniziale di miriadi di standard differenti incapaci di dialogare fra loro, con l’effetto – molto più grave di quanto può accadere per i mezzi tradizionali – non solo Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 139 di impedire letture di confronto, ma di negare l’accesso stesso ai dati. Oggi la problematica sembra arrivata ad una svolta radicale con la comparsa di formati di gran lunga ‘migliori’, che stanno rapidamente soppiantando i precedenti formati in virtù della loro semplicità, completezza, possibilità di lettura anche in assenza del software nativo che li ha generati. XML per il Web, Quick Time e Windows Media per il video, Open GL per la grafica 3D real-time e soprattutto Acrobat PDF e formati quali il TIFF e il JPEG per i documenti 2D (disegni, immagini, testi, ecc.) descrivono formati universalmente riconosciuti e distribuibili su tutte le piattaforme oggi in commercio (UNIX, Apple, Windows), rendendo la standardizzazione un de facto, fino ad oggi assolutamente impensabile; 3. nell’universo digitale i documenti testuali e grafici sono divenuti nient’altro che casi particolari di un bagaglio di strumenti ben più articolato e nel contempo facilmente integrabile di quello cui siamo abituati per la figurazione del progetto (rappresentazioni 2D o al massimo maquette 3D statiche). Il disegno non è altro che una delle tante facce di un sovrainsieme dato da un sistema multimediale completo, in grado di distribuire a partire da una medesima piattaforma e dai medesimi materiali testi, immagini, disegni vettoriali, modelli tridimensionali animabili e renderizzabili in tempo reale, animazioni grafiche, filmati, documenti formattati per la stampa o per la visualizzazione attraverso Internet. La diffusione di strumenti come Java, una tecnologia basata sulle potenzialità della rete, e sull’idea che lo stesso software può funzionare su differenti tipi di computer e periferiche, permetterà di avere ipermedialità, animazione 2D e 3D semplicemente visualizzabili con un Web browser; 4. il modo di lavorare dell’utente prevede la possibilità, accanto al tipico modo in serie, anche quello della parallelizzazione dei processi. Il mondo del multitask (più applicazioni che funzionano contemporaneamente sulla stessa macchina) e del multi-user (più utenti che possono accedere alle stesse risorse) fino a poco tempo fa era confinato alle workstation e ai server professionali, ovvero pochi strumenti dall’accessibilità limitata alle grandi masse di utenti. Il tipico modo di lavorare su un Personal Computer era quello di realizzare un solo lavoro alla volta, di una sola tipologia, condotto da un unico utente che eseguiva processi necessariamente uno dopo l’altro, con tempi e limitazioni espressive e produttive assai elevati, rendendo in pratica impossibile effettuare analisi comparative non rigidamente precostituite. Oggi le potenze di calcolo, la diffusione dei sistemi di reti locali 140 | e globali, la possibilità di gestire grosse quantità di dati da parte di un PC, hanno consentito l’introduzione di metodi di gestione dello strumento tali da rendere possibile la compresenza di più azioni: più operazioni realizzate contemporaneamente, oggetti trasportati da un’applicazione all’altra, condivisione dei file di lavoro, per cui il singolo operatore può usare più strumenti contemporaneamente e più operatori possono usare lo stesso strumento sullo stesso progetto. I tempi e la qualità del lavoro sono marginalmente influenzati da limitazioni del mezzo, mentre sono assai più spiccatamente dipendenti, dalle capacità concettuali e figurative dell’operatore; 5. negli ultimi due anni il costo delle memorie di massa si è enormemente ridotto, peraltro rendendo accessibile a basso costo operazioni che fino a poco tempo fa erano di fatto impossibili per soggetti a basso valore aggiunto e ad alto dispendio di memoria per l’archiviazione e la manipolazione, come sono fondamentalmente le trasposizioni digitali dei documenti che compongono gli archivi di architettura. La legge di Moore del raddoppio ogni 18 mesi è applicabile anche alle memorie di massa, sostituendo il termine ‘capacità’ a ‘potenza’. I costi sono passati dai 3 Euro per Megabyte di dieci anni fa a quelli di 3 Euro per Gigabyte attuali (2003). L’unità di massa mobile per eccellenza, il DVD, può contenere nella soluzione più utilizzata oggi (4,7 Gigabyte di spazio disponibile per pochi Euro) oltre 400 immagini fotografiche in bianco e nero di dimensioni A4 stampabili in formato non compresso, mentre i costi d’acquisto di un server dati da qualche Terabyte è circa un decimo di quello di tre anni fa, appartenendo ormai alla categoria di poche migliaia di Euro; 6. il partner di lavoro del ricercatore o del progettista non è più solo l’archivista o il documentalista, ma l’intera comunità scientifica. Il tradizionale approccio al Personal Computer ha sempre individuato il nostro modo di lavorare come quello di un operatore che legge e scrive informazioni sul proprio hard disk, che quindi è sostanzialmente l’unico contenitore su cui andare a depositare e attingere forme della conoscenza. La movimentazione delle informazioni tra un operatore e l’altro è stata inizialmente assai difficoltosa, solitamente legata alla movimentazione fisica di interi dispositivi capaci di trasportare quantità di dati sempre più crescenti ma sempre in modo discreto. La definizione anche in questo campo di standard universali di trasporto dati attraverso una rete via cavo, la possibilità di visualizzazione di ‘finestre’ comuni tra operatori diversi, ma soprattutto il vorticoso incremento delle prestazioni del trasporto del flusso delle informazioni attraverso il network (lo standard è ormai 1 Gb/sec per le reti locali, Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 141 cioè circa tre fotografie a colori stampabili in formato A4 al secondo, e 2 Mbit/secondo per reti globali) ha condotto al necessario ripensamento di tutta la filosofia del sistema. L’hard disk non è che uno dei contenitori di banche dati a disposizione, cui aggiungere ciò che rendono disponibile in risorse dati e computazionali altri computer che lavorano nel nostro stesso ambito di lavoro e, soprattutto, ciò che restituiscono su Internet, ormai in tempo reale, tutti i server collegati. Non siamo più soli, né possiamo lavorare da soli: oggi è il mondo intero che ci aiuta e ci guida nel nostro lavoro. E lo è molto di più perché i laptop portatili, per la prima volta, possono sostituire in tutto i PC da tavolo. L’ipotesi di maggior interesse da esplorare attualmente, nell’ambito in oggetto, è dunque quella di un sistema di diffusione dell’informazione e delle conoscenze dall’interno verso l’esterno e viceversa, un sistema con interfacce analogiche e digitale volto a costituire e implementare un knowledge network universitario per l’acquisizione, la sistematizzazione e la visualizzazione di risorse eterogenee distribuite, creando una struttura conoscitiva e di erogazione di servizi: vale a dire un Quality-Controlled Subject Gateway e un Learning Resource Centre per il design. Non sono, infatti, le funzioni della biblioteca odierna intesa in senso lato ad essere mutate, come è stato osservato nei primi capitoli di questo volume, quanto piuttosto lo spazio e i servizi in virtù dell’utilizzo di nuove tecnologie di visione per nuove tipologie di documenti e di informazioni: non più la semplice ‘forma libro’ ma documenti digitali per loro natura instabili e complessi da poter scambiare e manipolare. La novità, nello scenario sopra delineato, sono l’indipendenza dall’ubicazione e la centralità dell’utente, in particolare in ambito universitario, dove le biblioteche sono il principale centro servizi. Si prospettano quindi specifiche tematiche da affrontare: 1. predisposizione di strumenti che permettano un’efficiente gestione e recupero dell’informazione all’interno dei sistemi di catalogazione e di descrizione che utilizzano metadati e standard riconosciuti; 2. possibilità di rendere questi strumenti un ponte fra universi informativi contigui (biblioteche, archivi, musei, raccolte in genere); 3. qualificazione ed arricchimento di contenuti conoscitivi i sistemi informativi, attraverso la ricostruzione e l’intreccio di contesti. Le risposte individuate, al fine di provvedere una operatività di base, sono le seguenti: - metodi di archiviazione dei dati e formazione di schemi di metadati per la descrizione e il recupero dei documenti; - metodi di esposizione dei dati (quality-controlled subject gateway); - metodi di accesso ai dati (learning resource centre). 142 | Un knowledge base per il design dovrebbe saper restituire ed evocare quell’intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui si origina il progetto: l’interdisciplinarietà che caratterizza il design offre, infatti, una ricchezza incredibile di punti di vista, di diverse realtà conoscitive da esplicitare e far dialogare tra loro, secondo categorie e tematiche trasversali. Un sistema così metodologicamente definito potrebbe divenire punto di incontro tra studenti, docenti e professionisti del settore, finalizzato alla costruzione di un ambiente innovativo di collaborazione, d´interazione e di discussione a supporto della didattica e della ricerca online e offline, attraverso l´accesso Web a contenuti e servizi realizzati e alimentati dalla comunità. Il modello del Gateway to Cornell University Library 34sembra rappresentare un sistema informativo che promette grandi potenzialità e flessibilità in ambienti di rete, certamente perfettibile e implementabile (Fig. 3). L’interazione e il coinvolgimento dell’utente sono certamente da favorire e da stimolare, per esempio tramite la creazione di una comunità virtuale interattiva e di uno spazio digitale di lavoro e di servizi personalizzati. Tuttavia, l’approccio prettamente top-down di un archivio digitale dinamico 35, se da un [Fig. 3] Screenshot dell’homepage del Gateway to Cornell University Library Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 143 lato mette a proprio agio sia studenti che designer offrendo una piattaforma di scambio di esperienze e di informazioni, in differenti contesti e a differenti livelli, pone non trascurabili difficoltà per un’evoluzione strutturata e logica del sistema, come rilevato dagli stessi autori. È certamente importante predisporre strumenti per un’efficiente gestione e visualizzazione dei dati e renderli un ponte fra patrimoni conoscitivi contigui, attraverso l’interoperabilità tra diversi tipi di risorse. Non esiste, infatti, un unico formato standard di metadati, ma piuttosto numerosi schemi nati da esigenze specifiche, che è fondamentale far dialogare tra loro. In tal senso, la messa a punto di un thesaurus, secondo un rigoroso lavoro di controllo e compilazione, rappresenta un mezzo potente ed efficace di accesso e condivisione delle conoscenze, in particolar modo se è previsto complementare ed integrato ad un sistema di Visual Retrieval come quello già citato realizzato dal gruppo di Visual Information Technology del National Research Council of Canada. Ciò che risulta evidente, in ogni caso, è che un sistema conoscitivo deve essere sviluppato innanzitutto in termini di metodologie, procedure ed infine di software. La ricchezza di un sistema conoscitivo per il design dovrebbe saper restituire ed evocare quell’intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui si origina e si alimento il progetto. Tuttavia, se l’accesso istantaneo all’informazione digitale è forse la caratteristica più significativa dell’era dell’informazione, frutto di elaborati meccanismi di recupero prodotti dalla tecnologia, la tecnologia non è sufficiente. L’efficacia di un sistema di accesso all’informazione e alla conoscenza è infatti direttamente proporzionale all’intelligenza e ai metodi impiegati per organizzarlo. 144 | Note [1] Si intende qui per ‘dato’ la registrazione in un codice di un aspetto della realtà; per ‘informazione’ la percezione di un insieme di dati, attraverso un processo di interpretazione; per ‘conoscenza’ il processo cognitivo di rielaborazione delle informazioni e delle esperienze. generali. I portali offrono un’ampia gamma di opzioni per la personalizzazione e di servizi e di funzioni. [5] Rispettivamente < www.design-italia.it/>, <http://www.designboom.com/>,<http://w ww.designboom.com/>, < www.e-interiors.net/>, <www.designvillage.it> [6] [2] P. Ciuccarelli, Strumenti per il progetto tra formazione e gestione della conoscenza: ipotesi per un portale del design,in Didattica &Design. Processi e prodotti formativi nell’università che cambia, A. Penati, A. Seassaro, (a cura di), Edizioni POLI.Design, Milano 2000, p. 254. Cfr. anche W. Warkoski, I sistemi informativi: il ruolo dei fattori umani nel processo di design, CNUCE – C.N.R. 2001, <http://giove.cnuce.cnr.it/simposioHCI01 /054.pdf> Si tratta di un progetto inaugurato nel 1998 da sei università americane, finalizzato a diventare strumento di supporto e continuo miglioramento degli atenei: The Urban University Portfolio Project: Linking Learning, Improvement and Accountability, International Conference on Assessing Quality in Higher Education, 2000, <ww.imir.iupui.edu/portfolio/> [7] E-mail del 25 settembre 2001. [8] [3] H.Strauss, What Is a Portal, Anyway?, CREN (Corporation for Research and Educational Networking) Tech Talk, January 2000 <http://www.cren.net/know/techtalk/events/ portals.html> [4] Un portale é, per definizione, un sito Web che é o si propone di essere un importante punto di accesso per altre destinazioni, e può essere a carattere generale o di nicchia, cioé dedicato ad una precisa tematica. Vi sono centinaia di portali verticali (specializzati in una categoria dell’informazione, come una disciplina, o un utente, come quelli universitari) o di portali aperti, Ciuccarelli, Innocenti | E. Lodolini, Organizzazione e legislazione archivistica in Italia. Dall’unità d’Italia alla costituzione del Ministero per i beni culturali e ambientali, Pàtron, Bologna 1989 (IV ed.), pp. 345-358. [9] G. Plessi, L’archivio, Pàtron, Bologna 1972, pp.11-12. [ 10 ] A questo proposito cfr. A. Petrucci, Sui rapporti fra archivi e biblioteche, in «Bollettino di informazioni dell’Associazione Italiana Biblioteche», 1964, IV, pp.213-219; G. Orlandi, Archivi e biblioteche, in «Archivi e cultura», 1980, pp. 217-230; M.A. Quesada, Sistemi conoscitivi per il design: una proposta metodologica | 145 Due istituti a confronto. Intervista a Ezio Lodolini sui rapporti tra archivi e biblioteche, in «Biblioteche Oggi», maggio-giugno 1985, vol. 2, n. pp.11-15. [ 11 ] Cfr. M. Budhu, A. Coleman, The Design and Evaluation of Interactivities in a Digital Library, in «D-Lib Magazine», November 2002, vol. 8, n. 11 <http://www.dlib.org/dlib/november02/col eman/11coleman.html> [ 12 ] Cfr. Didattica e design, cit. [ 13 ] J. Dewey, Democracy and Education: An Introduction to the Philosophy of Education, Macmillan, New York 1916 <http://140.211.62.101/dewey/contents.html> Bicentennial Conference on Bibliographic Control for the New Millennium: Confronting the Challenges of Networked Resources and the Web, Library of Congress Directorate, 15 -17 November 2000, Washington <http://lcweb.loc.gov/catdir/bibcontrol/ar ms_paper.html> [ 17 ] Cfr. D.A. Norman, Things that make us smart. Defending human attributes in the age of the machine, Addison Wesley, New York 1993; F. Rizzo, W. Warkoski, I sistemi informativi: il ruolo dei fattori umani nel processo di design, CNUCE – C.N.R. 2001, <http://giove.cnuce.cnr.it/simposioHCI01/ 054.pdf> [ 18 ] K. Wilson, Discussion on two multimedia R & D projects: The Plaenque Project and the Interactive Video Project of the Museum Education Consortium, in Interactive Multimedia Learning Environments, M. Giardina (ed.), Springer-Verlag, Berlin 1992, pp.186-196. Cfr. N.J. Belkin, Anomalous states of knowledge as a basis for information retrieval, in «Canadian Journal of Information Science», 5, 1980, pp. 133-143; T.D. Wilson, Human Information Behavior, in «Informing Science», 2000, vol. 3, n. 2, pp. 49-56; G. Marchionini, Information seeking in electronic environments, Cambridge University Press, Cambridge (Eng.) 1995. [ 15 ] [ 19 ] [ 14 ] Cfr. ad esempio MIT OpenCourseWare <http://ocw.mit.edu/index.html> e le Open Knowledge Initiatives <http://web.mit.edu/oki/> per gli ambienti didattici virtuali. Esiste anche un «Journal of Interactive Learning Research» <http://www.aace.org/pubs/jilr/default.htm> A.H. Marti, User interface and visualization, in R. Baeza-Yates, B. Rebeiro-Neto, Modern Information Retrieval, ACM Press, Addison Wesley, New York 1999 <http://www.sims.berkeley.edu/~hearst/irb ook/10/node1.html>. [ 20 ] [ 16 ] C.R. Arms, Some Observations on Metadata and Digital Libraries, in 146 | I. Nonaka, H. Takeuchi, The KnowledgeCreating Company, Oxford University Press, 1995. (trad. it., The knowledge creating com- pany. Creare le dinamiche dell’innovazione, a cura di U. Frigelli e K. Inumaru, Guerini e Associati, Milano, 1997). [ 23 ] [ 21 ] [ 24 ] Bogliolo ha affrontato il tema in diversi articoli introduttivi apparsi fra il 1998 e il 2000 su «AIDA Informazioni», <http://www.aidainformazioni.it>: 2/1998, pag. 18-22; 3/1998, pag. 8-14; 4/1998, pag. 16-25; 1/1999, pag. 8-15, e nella rubrica Schegge sul medesimo periodico, apparsa finora sui numeri 1/2000, pag. 24-28; 2/2000, pag. 13-16. Cfr. inoltre dello stesso autore Sistemi informativi e sistemi cognitivi, in SINM 2000: un modello di sistema informativo nazionale per aree disciplinari, IV Seminario Sistema Informativo Nazionale per la Matematica, Lecce, 4 ottobre 2000 <http://siba2.unile.it/sinm/4sinm/interventi/sinmingo.html> e tra gli altri autori: C. W. Choo, Information management for the intelligent organization: roles and implications for the information profession, in Digital Libraries Conference, March 27-28, 1995, Singapore <http://128.100.159.139/FIS/ResPub/D LC95.html>; P.H. Hendriks, The organisational impact of knowledge-based systems: a knowledge perspective, in «Knowledge-based systems», 12, 1999, pp. 159-169. Il Web Semantico «is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation» (da T. Berners-Lee, J. Hendler, O. Lassila, The Semantic Web, in «Scientific American», 2001 <http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html >). D. Bogliolo, Sistemi informativi e sistemi cognitivi, cit. [ 25 ] C.W. Choo, Information management for the intelligent organization, cit. [ 26 ] Cfr. Musei e archivi d’impresa: il territorio, le imprese, gli oggetti e i documenti, atti del convegno di studi di Assolombarda, Assolombarda, Milano 2001. [ 27 ] Il Museo Ducati (<http://www.ducati.com>), ad esempio, cerca di valorizzare il prodotto attraverso il suo impatto emozionale (ponendosi non come una fabbrica di moto ma una comunità), creando identità tra prodotto e museo, aspetto emozionale dell’oggetto moto e del museo in quanto tale. [ 28 ] [ 22 ] G. di Domenico, La biblioteca apprende: qualità organizzativa e qualità di servizio nella società cognitiva, comunicazione al convegno La qualità nel sistema biblioteca, Milano, Palazzo delle Stelline, 9-10 marzo 2000, pubblicata in «Biblioteche oggi», maggio 2000, pp. 16-25. Ciuccarelli, Innocenti | Per una definizione dei portali accademici e degli information gateway cfr. S. E. Thomas, L’impiego del portale per l’individuazione di risorse elettroniche specialistiche, in Risorse elettroniche, definizione, selezione e catalogazione, cit. <http://w3.uniroma1.it/ssab/er/relazioni/th Sistemi conoscitivi per il design: una proposta metodologica | 147 omas_ita.pdf>; H. Strass, What Is a Portal, Anyway?, CREN (Corporation for Research and Educational Networking) Tech Talk, January 2000 <http://www.cren.net/know/techtalk/events /portals.html>; UCLA Humanities Web Portal Home Page <http://www.humnet.ucla.edu/index2.htm >; J.D. Campbell, The Case for Creating a Scholars Portal to the Web: a White Paper, in «Portal: Libraries and the Academy», January 2001, pp. 15-21, <http://muse.jhu.edu/demo/pla/>; M. Looney, P. Lyman, Portals in Higher education: What Are They and What is Their Potential?, in ««Educause Review», July/August 2000, pp. 28-35 e <http://www.educause.edu/pub/er/erm00/a rticles004/looney.pdf> zione del patrimonio culturale nazionale, ICCD, Roma 14 febbraio 2002 <http://www.iccd.beniculturali.it/download/polichetti.pdf>; A. Di Lorenzo, Dai dati catalografici alle informazioni sui Beni Culturali: i Metadati, ICCD, Roma 14 febbraio 2002, <http://www.iccd.beniculturali.it/download/atti/36_2-di.pdf> [ 32 ] Cfr. i volumi Didattica & Design. Processi e prodotti formativi nell’università che cambia, cit. e Giovane è il design. Nodi contemporanei della didattica per il progetto, a cura di A. Penati, Edizioni Poli.design, Milano 2001. Un esempio significativo delle potenzialità del Web in quest’ambito proviene da A. Andia, Internet Studios Consortium, 2001 <http://miami00.tripod.com> [ 29 ] Secondo un’indagine effettuata nell’ambito dell’Academic Portal Initiative/Project di TERENA <http://www.terena.nl> [ 30 ] Corte dei Conti – Sezione Centrale di Controllo sulla gestione delle Amministrazioni dello Stato, Deliberazione n. 2/2003/G del 13 gennaio 2003. Relazione concernente l’attività di catalogazione dei beni culturali. Per l’indagine e i relativi documenti legislativi consultare <http://www.corteconti.it/Ricerca-e-1/GliAtti-d/Controllo-/Documenti/Sezionece1/Anno-2003/Secondo-co/index.asp> [ 31 ] Cfr. M.L. Polichetti, Beni culturali e Innovazione Tecnologica. Il Sistema informativo Generale del Catalogo: strumento per la conoscenza, la tutela e la valorizza- 148 | [ 33 ] Cfr. a questo proposito G. Simonelli, S. Maffei, I territori del design: made in Italy e sistemi produttivi locali, IlSole24Ore, Milano, 2002. [ 34 ] <http://campusgw.library.cornell.edu/> [ 35 ] Come quello creato da Ann Heylighen (prototipo DINAMO consultabile al sito <http://www.asro.kuleuven.ac.be/dynamo> 5 Il progetto DesignNet Paolo Ciuccarelli, Perla Innocenti The real challenge is creating appropriate organisational contexts for action Paul Conway 5.1 Bisogni e obiettivi Per una esigenza come quella manifestata dalla Facoltà del Design, che a fronte di quanto detto nei capitoli precedenti, possiamo riassumere nel doppio bisogno di azzeramento rispetto a dati e informazioni, e di supporto per operazioni esperienzial-conoscitive sui documenti, non esiste tout-court una soluzione unica e compiuta. Non è possibile pensare di codificare a priori il processo conoscitivo del design, che abbiamo visto essere basato prevalentemente sull’esperienza, né immaginare di organizzare in un archivio completo e preordinato l’universo infinito dei possibili frammenti documentali, degli stimoli culturali, utili ad alimentare la creatività e il design. Si può però analizzare attentamente quella esigenza, come abbiamo cercato di fare, per trarne delle indicazioni di metodo e sviluppare strumenti e metodi di gestione delle informazioni e dei documenti più coerenti con il processo progettuale. Ci siamo quindi concentrati sulle regole del gioco, mettendo da parte il risultato: è difficile, impossibile, anzi, inutile, dire cosa debba contenere un sistema conoscitivo per il design, mentre è utile e anzi necessario restituire la geografia e il Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 149 significato di ogni singolo documento selezionato, e delle sue relazioni con altri, infiniti, documenti. In luogo di una selezione ridotta dei documenti da trattare, per ridurre la complessità del problema abbiamo viceversa rinunciato a definire categorie preliminari, esplorando quanti più scenari informativi possibile, per mantenere alto il livello di flessibilità del sistema. A partire da queste condizioni abbiamo agito da un lato (quello della struttura del contenitore) sui possibili denominatori comuni dei diversi documenti, sulla flessibilità, la più alta possibile, in modo che qualsiasi documento potesse essere trattato; dall’altro (quello dei contenuti che descrivono il documento e le relazioni che gli danno significato) la flessibilità diventa la più bassa possibile, in modo che, almeno all’interno della comunità di riferimento, il senso di quel documento sia compreso senza ambiguità e in modo univoco. Questo è il motivo principale della prima grande scelta operata nel progetto DesignNet, l’identificazione di tre moduli strumentali distinti ma integrati (Fig. 1), che rispecchiano le esigenze sopra descritte: uno strumento di gestione della terminologia, per costruire il vocabolario del design (DesignThesaurus) attraverso il quale dar corpo al linguaggio comune neces- Thesaurus terminologia + Directory persone, organizzazioni, brands, locations Catalogue + documenti/metadati DESIGN KNOWLEDGE CENTRES PLACES for accessing, sharing and using information and knowledge in design activities DESIGN GATEWAYS WEB INTERFACES fto access design knowledge [Fig. 1] I tre moduli del progetto DesignNet (Thesaurus, Directory e Catalogue) e l’interazione con l’ interfaccia digitale (design gateways) e fisica (design knowledge centres) (P. Ciuccarelli) 150 | sario a descrivere i documenti in modo significativo; una directory del design (DesignDirectory) che permettesse l’identificazione univoca degli specifici elementi di indicizzazione: persone, organizzazioni, marche (brands), locations, eventi; uno strumento di catalogazione che utilizzasse uno standard il più possibile aperto e pensato già in origine per far stare insieme in modo coerente risorse documentali eterogenee. Ognuno di questi moduli è stato declinato per il design: per il catalogo ad esempio è stato sviluppato uno specifico ‘profilo di applicazione’ dello standard scelto, Dublin Core; nella definizione degli authority file della Design Directory emergono specificità che sono tipiche della produzione industriale, come la distinzione tra marca e produttore (organizzazione-azienda) e la possibilità di stabilire una relazione temporale tra i due elementi oltre che attraverso il prodotto. In sintesi il nodo principale del progetto DesignNet sta proprio nel fatto che la tipologia dei documenti da gestire non è identificabile a priori, sia nella organizzazione dei documenti per il design, sia, estendendo il discorso, nella gestione dei documenti del design. Qualsiasi documento può essere preso in considerazione, se, e solo se, si dispone di un metodo per contestualizzarlo, dargli significato, posizionarlo (mapparlo) attraverso le relazioni con termini, elementi di indicizzazione, altri documenti. Se pensiamo ai documenti del design, quelli più tradizionali come i prodotti fisici, è evidente come il loro racconto assuma significato proporzionalmente all’estensione della trama delle relazioni intessute con altri documenti all’interno del contesto sociale e culturale, della cultura materiale soprattutto, di riferimento. Per questo motivo non ci siamo interessati in prima battuta delle singole schedature (ad esempio quella dell’oggetto di design), spostandoci invece subito al livello metadescrittivo (dal metadato al meta-metadato), al modo di mettere insieme qualsiasi documento perdendo il meno possibile delle singole descrizioni, e cogliendo però contemporaneamente l’obiettivo strategico di farli dialogare tra loro, attraverso relazioni e termini unificati e normati. La stessa visione, lo stesso approccio integrativo e metaprogettuale, sono stati applicati, oltre che nella definizione del metodo e degli strumenti DesignNet, anche nella sperimentazione degli stessi all’interno della Facoltà del Design: si è deciso che non serviva tanto creare un nuovo giacimento di documenti quanto piuttosto organizzare quelli esistenti in un insieme integrato (un sistema), organizzato per il design(er). La stessa integrazione poi è stata declinata sia sul piano immateriale che su quello materiale: gli archivi/laboratori informativi esistenti all’interno del Politecnico di Milano sono integrati, da una parte attraverso l’utilizzo dei metodi e degli strumenti DesignNet, dando vita quindi, almeno potenzialmente ad un catalogo unico; dall’altra, fisicamente, attraverso l’individuazione di un luogo e la attivazione di un servizio che Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 151 costituisce un punto di accesso unico, con regole uniche, ad archivi che rimangono comunque autonomi per quanto riguarda i contenuti. L’integrazione anche fisica degli archivi informativi per il design, come possibile ulteriore momento di attribuzione di significato a documenti eterogenei, è alla base del concetto di ‘Design Knowledge Centre’, del quale la POLI.teca costituita al Politecnico di Milano è un primo, sperimentale, esempio. La POLIteca si costituisce come centro di documentazione locale, e insieme possibile nodo di una rete di giacimenti di documentazione e conoscenza per il design, attivabile attraverso la condivisione da parte di altri centri di documentazione, musei, biblioteche, dei metodi e degli strumenti sviluppati nell’ambito di DesignNet 1. 5.2 Analisi e progettazione del sistema All’inizio della fase di ricerca del progetto DesignNet, si è effettuato un processo comune ai professionisti dell’informazione, dai bibliotecari ai documentalisti: la codifica, tramite ricerca nelle mappe mentali degli utenti, dello specifico territorio informativo di un ambito disciplinare. Una ricognizione statistica sul Web dei siti delle università, associazioni, fondazioni e società collegate al design nel contesto nazionale e internazionale, è stata funzionale a comprendere come il patrimonio informativo accademico si serve delle potenzialità della Rete e a rilevare la presenza e le caratteristiche dei servizi e delle informazioni di altri portali e siti internazionali dedicati al design (cfr. capitolo 3). L’analisi è avvenuta in concomitanza con lo studio dell’evoluzione del concetto di biblioteca e di archiviazione dei documenti, e con l’analisi degli standard di catalogazione, indicizzazione e visualizzazione delle informazioni in ambienti di rete (cfr. capitolo 1 e 2). Sono stati inoltre esaminati i modelli e gli strumenti di Knowledge Management e delle attività e servizi di documentazione applicabili in ambito universitario. Parallelamente, allo scopo di identificare le caratteristiche della documentazione per il design e i bisogni informativi degli utenti locali, è stata effettuata una mappatura dei giacimenti esistenti attraverso un’indagine a campione sulla forma degli elaborati informatici prodotto di ricerca e/o didattica della Facoltà del Design del Politecnico, e la somministrazione di un questionario di rilevazione sulle raccolte documentarie e materiche dei laboratori e degli archivi qui presenti, modellato sull’esempio della ben più dettagliata Rilevazione sulle biblioteche delle università italiane preparato dal MURST nel 1997 2 e di una serie di questionari e rilevazioni in ambito internazionale 3. Il questionario è stato compilato da 9 tra laboratori e archivi (Archivio Materiali da Costruzione, Laboratorio Colore, Laboratorio di Analisi Merceologica e Settoriale (MAST), Laboratorio di Requisiti Ambientali per i Prodotti Industriali (RAPI), 152 | Laboratorio Fotografia, Laboratorio Media Digitali, Laboratorio Produzione Video, Materiali e Design (MeD), Laboratorio Modelli). In questa prima fase di ricerca sono stati inoltre presi numerosi contatti con i responsabili dei più rilevanti progetti di biblioteche digitali online di università e istituti, responsabili tecnici di progetti di archiviazione ad alta informatizzazione e di produzione software (tra cui ICCD del Ministero per i Beni e le Attività Culturali, il Getty Research Institute, la University of California a Berkeley, la Cornell University). L’analisi di tecnologie hardware e software funzionali al progetto è stata effettuata in base alla documentazione richiesta ai fornitori e alla rapportistica tecnica di università ed istituti internazionali. I software possibili sono stati selezionati tra decine di esemplari italiani e internazionali, in base alle esigenze di gestione di documenti non solo testuali ma soprattutto multimediali (immagini, audio e video), utilizzo di schemi di metadati più semplici e flessibili di UNIMARC, modalità di visualizzazione delle risorse, relativa facilità di inserimento, interoperabilità. Le attività sopradescritte sono risultate nella evidenza di molteplici e sostanziali conoscenze e informazioni sul design – di carattere manipolativo-visuale strettamente collegate all’esperienza, difficilmente proceduralizzabili e provenienti da forme di apprendimento diversificate – che non si esauriscono a quanto viene oggi mostrato sul Web e che non sono ancora sistematizzate. L’identificazione di tipologie documentarie, formati e modalità di acquisizione/archiviazione eterogenee e complesse ha permesso la contestualizzazione e definizione degli scenari operativi e di riferimento del progetto nell’ambito dell’evoluzione delle biblioteche e dei documenti, e la definizione di standard di catalogazione, indicizzazione restituzione e di visualizzazione online delle risorse e dei documenti per il design. Informazioni preziose sono state anche reperite attraverso newsgroup e gruppi discussione internazionali 4. In questa fase è emersa la necessità di gestione delle risorse secondo schemi di metadati coerenti e organizzati, l’individuazione delle chiavi di lettura per le varie tipologie di utenti e bisogni informativi identificati, la coordinazione con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali. In particolare, sono stati identificati i seguenti elementi: - schemi di metadati funzionali per la loro interoperabilità, modularità e flessibilità; - un protocollo per lo scambio dei record; - struttura e caratteristiche di un thesaurus monolingue per il design; - tecnologie hardware e software necessarie. L’obiettivo di DesignNet é quello di soddisfare i bisogni informativi e conoscitivi della comunità universitaria, e al tempo stesso di alimentare lo scambio e la creazione di risorse ed esperienze progettuali, fornendo strumenti che Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 153 permettono un’efficace gestione, recupero e visualizzazione di documenti 3D e 2D in un framework in rete collaborativo e integrato. Per raggiungere tale obiettivo si è cercato di definire un sistema knowledge-based per il disegno industriale: un tema particolarmente complesso poiché, come è stato scritto nei paragrafi precedenti, il progetto vive la permanente scissione tra il sistema delle informazioni e delle conoscenze che costituiscono la condizione a priori dell’atto creativo ed esecutivo e la definizione del progetto, ma che raramente si riesce ad appoggiare ad essi. 5.2.1 Un Quality-controlled Subject Gateway per il design I sistemi di archiviazione, restituzione, disseminazione delle risorse online, grazie alle loro caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità tipologie di documenti, di formati e di linguaggi, si propongono oggi come un potente strumento a supporto delle attività di didattica e di ricerca in ambito universitario. Tuttavia (come è stato già osservato nel paragrafo 3.1.2), la ricca articolazione delle risorse del design è notevolmente maggiore di ciò che solitamente ‘presentano’ i siti Web o i portali. Se adeguatamente implementati, i Quality-controlled Subject Gateway (QCSG) 5, basati su un’ampia e dettagliata descrizione di risorse distribuite in ambiente di rete (o accessibili tramite Internet) e sull’adozione di standard, rappresentano certamente uno degli approcci più efficaci in questo senso. Un’ampia gamma di metodologie, linguaggi e tecnologie adottati nei QCSG risultano rilevante nella didattica del design e nello sviluppo dei progetti. Un QCSG è qualcosa di più di un semplice punto di accesso unico ad un determinato campo del sapere: esso vuole costituire un portale di ingresso a praticamente tutte le informazioni e i documenti rilevanti in uno specifico ambito, indipendentemente dalla loro forma (analogica o digitale) e dalla collocazione fisica del documento. Solo la rilevanza del contenuto è importante. I servizi di organizzazione e delivery dei contenuti sono implementati in modo da soddisfare i bisogni degli utenti. Nel progetto DesignNet i vari partecipanti cooperano insieme in un unico framework coordinato da DesignNet: il Design Gateway. Nei paragrafi successivi vengono perciò brevemente analizzati gli aspetti cruciali e i componenti dei QCSG, contestualizzati nell’ambito di una sistematizzazione delle risorse relative al disegno industriale: 1. schemi metadati standard e descrizione dei contenuti (paragrafo 4.4.2); 2. accesso per soggetto tramite vocabolario controllato e liste di autorità (paragrafo 4.2.3 e 4.2.4); 3. selezione qualitativa e descrizione dei documenti ad opera di risorse 154 | umane specializzate; sviluppo, aggiornamento e gestione delle collezioni con il continuo monitoraggio del gateway (paragrafo 4.2.5) 4. adozione di standard per l’interoperabilità con altri servizi e basi dati e progettazione di servizi aggiuntivi (paragrafo 4.2.6). Nella user modeling del QCSG per il progetto DesignNet, sono stati distinti quattro tipi di comportamenti informativi: - serendipity: trovare informazioni non cercate e impreviste. Nella ricerca scientifica si tratta anche della capacità di individuare e valutare correttamente dati o risultati imprevisti rispetto ai presupposti teorici di partenza; - information seeking: essere alla ricerca di informazioni con uno scopo deliberato; - information searching: microlivello di informazione usato da chi cerca mentre interagisce con sistemi di vario tipo; - information use: atto fisico e mentale di incorporare l’informazione trovata nel proprio patrimonio conoscitivo 6. Questi diversi comportamenti presuppongono diversi livelli di ricerca attraverso i documenti disponibili in un QCSG, ed evidenziano l’importanza della granularità dell’informazione, ovvero del livello di dettaglio reso disponibile. 5.2.2 Schemi di metadati e protocolli: Dublin Core e OAI Come osservato nel paragrafo 2.2.1, l’interoperabilità migliora la qualità di un sistema info-conoscitivo e le possibilità di usare documenti provenienti da fonti diverse, riduce i costi, permettendo il riutilizzo delle informazioni e delle risorse una loro gestione in parte automatica. Affinché si possa realizzare questo libero flusso di informazioni, è però necessario che l’interoperabilità non dipenda dai media e dal sistema utilizzati, dal contesto amministrativo, da contenuto o dal tipo di informazione: perché ciò avvenga è fondamentale utilizzare dei metadati standard. La situazione ideale sarebbe quella di avere a priori un modello di schema di metadati completo e un framework definito, entrambi riconosciuti come standard internazionali e utilizzati dagli utenti. Nella realtà, esistono soltanto alcuni modelli parziali, spesso non coordinati (cioè mappati) tra loro, non utilizzati su larga scala dagli attuali sistemi e poco conosciuti. Nessuno singolo schema di metadati soddisferà tutti i requisiti funzionali di tutte le applicazioni. È inoltre importante ricordare che le «categories are historically situated artifacts, and like all artifacts, are learned as part of membership in a community of practice» 7: il contenuto, la semantica e la sintassi di uno schema di metadati dipenderà dal contesto che lo promuove, dalle funzioni o dagli scopi dello schema e dal livello di aggregazioni, dal tipo di oggetto e di entità a cui esso si correla. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 155 Carl Lagoze esprime lucidamente questo problema: «The Web environment [...] is massively distributed, involving an arbitrary number of schemas, many of which will be not known. The querying of semi-structured and imperfectly understood data in such a diverse environment is a topic of research, not a readily deployable technology» 8. Per il progetto DesignNet è stata scelta la creazione e lo sviluppo collaborativo di un catalogo di documenti eterogenei per il design, utilizzando lo standard internazionale Dublin Core e l’expertise disponibile nella Facoltà del Design come punto di partenza. L’obiettivo complessivo è quello di definire livelli di interoperabilità con minori barriere e metadati più ricchi, utilizzando standard emergenti che intendono facilitare una efficace disseminazione questo ambito. Negli ultimi anni, come analizzato nei primi due capitoli di questo volume, sono emersi nuovi approcci alla descrizione dei documenti digitali, e al tempo stesso standard consolidati come il formato UNIMARC e le RICA (e in ambito anglosassone USMARC e le AACR2) sono state applicate a documenti digitali. In base ad una verifica preliminare, è emerso che i partecipanti al progetto DesignNet, ma anche, più in generale, chi si occupa della documentazione di design, adottano una varietà di approcci quasi sempre non allineati agli standard attualmente disponibili. Gli standard che un’organizzazione adotta dipendono da una serie di fattori, inclusi le tipologie di materiali posseduti, lo scopo del progetto di fruizione/conservazione, gli utenti potenziali, la conoscenza e l’esperienza dello staff di progetto e le infrastrutture tecniche disponibili per l’istituzione. I livelli di dettaglio variano da istituzione a istituzione; inoltre, alcune informazioni potrebbero essere riservate. Questa fase è quindi partita da alcune domande: - Di che livello di standardizzazione abbiamo bisogno? - Chi è responsabile della creazione di metadati? - Quanto costa la creazione e la gestione dei metadati nel medio e lungo periodo? - Quali sono i limiti dei diversi tipi di formati di file? - Quali sono gli strumenti per l’estrazione dei metadati? - È possibile riutilizzare i metadati provenienti da altre fonti? - Quali saranno le scelte, le procedure, i manuali e gli standard per l’implementazione? Per la catalogazione di documenti eterogenei analogici e digitali per il design, online e offline, in DesignNet si è scelto di non adottare le metodologie catalografiche convenzionali, a favore di uno schema di metadati adatto ai vari ambiti del design e finalizzato allo scambio delle informazioni e alla ricerca da parte dell’utente. 156 | In seguito ad una verifica nella fase 1 del progetto, il Dublin Core Metadata Element Set (cfr. paragrafo 2.2.3) è stato selezionato in quanto standard (è sia ANSI/NISO Z39.85-2001 che ISO 15836) semplice e flessibile, che gode di un largo in ambito internazionale e che consente la descrizione adeguata di un’ampia gamma di documenti di diverse comunità diversamente dislocate, facilitando al tempo stesso l’integrazione e l’interoperabilità tra vari sistemi cognitivi. Dublin Core è uno standard aperto che permette il coinvolgimento di diverse comunità, senza escludere gruppi di utenti, come farebbe lo standard MARC. Tuttavia, per le istituzioni legate al formato MARC, Dublin Core offre comunque sufficienti equivalenze e un’adeguata mappatura MARC-Dublin Core. Inoltre è ormai diventato uno standard riconosciuto, semplice da imparare e da utilizzare anche per persone che non sono dei catalogatori professionisti. E il core dei suoi elementi fornisce le informazioni essenziali. Come schema per la descrizione, Dublin Core è stato scelto con gli specifici obiettivi di: 1. facilitare la scoperta dei documenti di design; 2. assistere nella gestione delle risorse; 3. permettere l’interoperabilità tra differenti strutture di metadati attraverso un semplice formato; 4. sviluppare un framework di metadati conforme con altri standard da tempo consolidati, come il MARC, ed emergenti, come MPEG-7; 5. codificare i metadati utilizzando il protocollo della Open Archive Initiative (OAI) e l’Extensible Markup Language (XML). In particolare, per quanto riguarda l’interoperabilità semantica, sono stati analizzati vari schemi di equivalenza o crosswalk già realizzati e pubblicati sul Web che hanno permesso di accertare, per i diversi settori presi in esame, l’esistenza di problemi riguardanti la granularità e la semantica dei dati, nonché l’importanza di definire una struttura che, dando adeguato rilievo alle specificità degli stessi, eviti l’appiattimento e quindi la perdita di efficacia del sistema di ricerca così prodotto 9. A livello sperimentale, nel corso di questa fase e in collaborazione con il Laboratorio di Fotografia della Facoltà del Design è stata anche effettuata una crosswalk tra Dublin Core e IPTC (cfr. paragrafo 6.2). Oltre alla creazione di metadati di qualità, per il tipo di documentazione per il design, è necessario anche poter raccogliere in modo facile ma selettivo informazioni provenienti da un’ampia gamma di content-provider e utenti in differenti localizzazioni. Con l’evolversi del progetto inoltre si evolvono anche i bisogni: non è realistico aspettarsi che gli utenti specifichino in modo accurato e in anticipo le loro necessità informative. All’esterno ma anche nella Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 157 stessa comunità di pratica, il mancato riconoscimento della realtà del design, che si basa su una metodologia progettuale, creativa e programmatica al tempo stesso, è spesso causa di trappole tecnologiche per i progetti di catalogazione: i fornitori commerciali offrono soluzioni tecnologiche spesso basate su generalità vaghe e idee incerte. Quando infine viene sviluppata qualche soluzione tecnica che supera le precedenti, o la tecnologia è diventata obsoleta o i requisiti sono cambiati e quindi il progetto fallisce. Un approccio più pragmatico è quello di monitorare i progressi tecnologici e – quando le risorse e le competenze sono limitate – mantenere tutto il più semplice e modulare possibile. In questo senso, il sottoprogetto di catalogazione e indicizzazione si è posto quattro obiettivi principali: - raccogliere la conoscenza degli individui che potrebbero influenzare il life-cycle di un documento, incanalandole nei metadati; - rendere questi contenuti disponibili per le attività di didattica e di ricerca in ambito di dipartimento e facoltà, controllando e supportando il flusso informativo; - generare record catalografici basati sullo standard Dublin Core, per poter scambiare metadati con altre organizzazioni e iniziative; - creare un vocabolario controllato per il design, come strumento di supporto all’attività catalografica ma anche didattica e di ricerca, come specchio del know-how e degli interessi della comunità del design. I documenti digitali sono spesso caratterizzati dalla possibilità di essere restituiti in formati multipli. Si è quindi deciso di non seguire il modello catalografico centrato sull’item o sul formato, per abbracciare invece l’approccio basato sul modello, in cui i documenti sono espressi in vari generi o eseguiti molte volte e potrebbero essere prodotti in numerose manifestazioni. Dublin Core ha permesso di sviluppare gli elementi di metadati predefiniti, e al tempo stesso di condurre esperimenti su qualificatori ed elementi extra per rifinire il modello. Implementare standard e protocolli di catalogazione in un contesto come quello del progetto DesignNet non è un’operazione banale, in parte perché vi sono una miriade di piccole comunità (laboratori, unità di ricerca, singoli) che devono essere persuasi a usare gli stessi standard e protocolli, in parte perché queste persone non si occupano normalmente di catalogazione, e per questo motivo è necessario che capiscano alcuni elementi base della gestione documetale e che vengano forniti loro degli strumenti semplici da usare in modo che siano più disponibili a cooperare e che il loro lavoro sia così facilitato. La cooperazione di tante micro-comunità poneva il problema di condividere i record: in base alle analisi dei requisiti, come già osservato, è emerso 158 | che nella maggior parte dei casi i documenti non venivano catalogati, e quando lo erano i metodi adottati non erano conformi agli standard. Relativamente alla strategia e alla metodologia adottata per definire i metadati, sono state intraprese specifiche azioni per: - sviluppare una mappa concettuale dei differenti tipi di documenti usati in questo contesto; - valutare standard e pratiche descrittive comunemente utilizzate nell’ambito del design; - focalizzarsi sulla descrizione dei documenti, partendo da quelli non bibliografici e concentrandosi in particolare sui rich media; - sviluppare uno specifico profilo d’applicazione per la descrizione di tali documenti, basato sugli attributi raccomandati dalla Dublin Core Metadata Initiative (DCMI) e da qualificatori selezionati in base alle esigenze dei partecipanti al progetto. Si è ritenuto che il modo migliore di analizzare i documenti del design sia in termini di vari livelli di granularità (o livelli di dettaglio). La strategia e la metodologia sopraindicate sono state adottate in una modalità progressivamente partecipata con tutti i partecipanti a DesignNet, cui è stato proposta ogni volta, sotto la supervisione di chi scrive, uno schema di metadati iterativamente modellato sulle loro esigenze. La catalogazione è cominciata partendo dallo schema di metadati descrittivi di Dublin Core semplice, effettuando delle prove su file di Excel con diverse tipologie di documenti, verificando l’efficacia dei record nel recupero del documento, e identificando progressivamente una serie di qualificatori aggiuntivi utili rispetto ai 15 elementi di base. In questo processo si sono parallelamente analizzate le attività del Sistema Bibliotecario di Ateneo del Politecnico di Milano, prevedendo la possibilità di interazione con l’OPAC di Ateneo (il sovrainsieme istituzionale di riferimento) tramite la mappatura dei metadati da esso utilizzati. Dopo circa un centinaio di record compilati e di verifica progressivo dello schema con i partecipanti, gli elementi e i qualificatori di Dublin Core sono diventati sufficientemente più specifici e più complessi nelle relazioni reciproche, rendendo possibile definire un profilo di applicazione del progetto DesignNet. Il processo di numb down ai soli 15 elementi, così come è inteso dalla DCMI, è rimasto certamente un’importante pietra di paragone per le nostre attività collaborative, poiché appunto fornisce un core di elementi essenziali. Se si cerca di rendere più ricca la descrizione, infatti, lo schema di DC rischia di perdere in semplicità e vi è bisogno di un grande numero di qualificatori, di schemi di codifica e di regole. Ciò nonostante, i profili di applicazione stanno progressivamente diventando il metodo preferito di rappresentazione Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 159 dei principi sottesi al progetto di uno spazio informativo e sono condivisibili attraverso registri di metadati in cui chi crea nuovi profili si assume la responsabilità di dichiararli e mantenerli per la comunità degli utenti della rete 10. Nel progetto DesignNet il profilo d’applicazione prodotto, che al termine della fase di sperimentazione verrà inserito nei registri creati, include: - elementi obbligatori; - elementi opzionali; - qualificatori opzionali; - elementi o qualificatori aggiuntivi provenienti da altri profili di applicazione; - elementi utilizzati da altri namespace; - schemi e valori permessi, che nel progetto includono schemi di codifica, un thesaurus per il design e delle liste di autorità; - specifica delle definizioni (poiché in DesignNet si utilizza un linguaggio specifico di un certo ambito disciplinare); - specifica dell’utilizzo (cioè delle opzioni, sottoinsieme e parametri di valutazione lasciati aperti) di un particolare standard o gruppo di standard per supportare un determinata applicazione, funzione (ad es. la ricerca per autore, per titolo, per soggetto ecc.), comunità (ad es. la comunità del design in ambito universitario, i designer professionisti, ecc.) o contesto (ad es. il Web, l’Italia, l’Europa). Nell’elaborazione del profilo di applicazione sono stati presi in considerazione anche i possibili metadati amministrativi, strutturali e di conservazione (cfr. paragrafo 2.2.1). I metadati amministrativi previsti includono informazioni su chi ha digitalizzato e come (hardware e software usati, modalità di compressione), chi è responsabile del documento e informazioni più dettagliate sulla gestione dei diritti: ad esempio lo schema MAG, definito dall’Istituto Centrale per il Catalogo Unico del Ministero per i Beni e le Attività Culturali. Per gli scopi del progetto DesignNet, sono stati selezionati 8 elementi obbligatori per la descrizione dei documenti, mentre gli altri elementi sono considerati opzionali ma desiderabili (Tab. 1). Alcuni partecipanti sceglieranno di compilare soltanto gli elementi obbligatori, qualcuno potrebbe usare elementi facilmente mappabili con o da il formato MARC e altri potrebbero scegliere di descrivere le loro risorse in modo più approfondito, utilizzando tutti gli elementi a disposizione. Le linee guida definite per il progetto descrivono i campi obbligatori e quelli opzionali, indicazioni di compilazione per ogni campo. I molteplici input e la raccolta di informazioni e competenze hanno reso evidente l’importanza, nella creazione di metadati per documenti del design, di riportare questa operazione il più possibile vicino al luogo di creazione o di acquisizione del documento, poiché lì è dove si coagula maggiore conoscenza 160 | su di esso. Si è perciò scelto l’approccio che vede gli autori stessi e i gestori dei documenti compilare il più possibile i metadati dei documenti, mentre si è previsto che informazioni ulteriori (ad esempio di conservazione), revisioni e/o correzioni siano effettuate da una unità di coordinamento del processo di catalogazione. È stato inoltre previsto di condividere in partenza lo stesso schema di metadati di base, e in seguito di entrare in contatto con schemi più approfonditi mappabili con Dublin Core. Come supporto a queste attività, è stato elaborato un documento che contiene il profilo di applicazione in forma di una tabella testuale, lo schema del thesaurus e i criteri di catalogazione, un manuale di compilazione con esempi per ogni tipo di documento e un glossario dei termini più utilizzati nel sistema (cfr. le appendici nel capitolo 7). Il manuale di compilazione è finalizzato a favorire la consistenza dei record del catalogo, e riporta una scheda descrittiva di ognuno degli elementi e dei qualificatori, di cui vengono forniti: la definizione, l’indicazione di obbligatorietà o opzionalità, l’indicazione degli standard e schemi di codifica da adottare, esempi di compilazione per ogni tipo di documento. L’elaborazione del manuale rappresenta una cartina di tornasole dei processi iterativi di verifica effettuati con i partecipanti al progetto DesignNet, e riporta una serie di commenti a margine dell’applicazione dello schema di Dublin Core. Innanzitutto, le diverse rielaborazioni del manuale hanno evidenziato la difficoltà della spiegazione secondo un linguaggio user-friendly dei 15 elementi di Dublin Core, così come sono stati tradotti dall’Istituto Centrale per il Catalogo Unico. Nell’ambito del design ‘Creatore’ e ‘Autore di contributo subordinato’ hanno dato luogo a numerose discussioni, così come il campo ‘Relazioni’. Inoltre, il manuale riporta i diversi tentativi di traduzione dei qualificatori raccomandati dalla DCMI (non tradotti dall’Istituto Centrale per il Catalogo Unico-ICCU) e di altri qualificatori utilizzati in diversi progetti di biblioteche digitali, dal Colorado Digitazion Project alla Cornell University. In base all’esperienza effettuata nelle prove di compilazione con i partecipanti, in contrasto con la convenzione di cominciare il record con il campo del ‘Titolo’ si è consigliato di cominciare con il ‘Tipo’, poiché la conoscenza di quello che si sta descrivendo aiuta a chiarire i valori degli altri elementi. L’elemento ‘Formato’, in cui la DCMI raccomanda l’uso dell’Internet Media Types (MIME), non contempla tutti i tipi di file: ad esempio non include i file di Flash, per non parlare di molti formati di file di computergrafica (sebbene nella comunità DCMI siano in corso di definizione delle proposte di aggiornamento. L’elemento ‘Relazioni’ e i suoi qualificatori, così come indicati dalla DCMI, hanno dato origine a qualche confusione. In generale, è stato più volte Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 161 ricordato ai partecipanti che solo l’interpretazione e l’applicazione consistente degli elementi è significativa, non le etichette degli elementi di per sé. Un’altra questione affrontata è stata quella del’adozione di un protocollo di interoperabilità, che andrebbe a vantaggio dell’editoria scientifica per il settore del design. Ad oggi infatti questo ambito non possiede, ad esempio, una propria lista di periodici equivalente ai periodici ISI, e mentre a livello internazionale vi sono molti progetti già in atto, in Italia la ricerca scientifica universitaria ha pochissima visibilità, anche a causa dei strumenti che permettono di documentare le attività all’esterno. Spesso le pubblicazioni vengono cedute ad editori commerciali senza vantaggi per gli atenei. Gli strumenti software a disposizione oggi sono molteplici, e in particolare nel settore dell’Open Source i costi sono ridotti 11. Tuttavia, le funzionalità di questi software non sono molto sviluppate, e se per l’avvio è necessaria una professionalità medio/bassa, per l’implementazione di questi programmi occorrono professionalità più elevate, sia in termini di sviluppo software che di raccordo con le realtà istituzionali. Alcuni programmi come E-prints sono semplici da installare ma gli autori vanno poi incentivati, servono politiche istituzionali precise e un supporto tecnologico avanzato con servizi integrati con le altre collezioni. Per tali motivi si stanno investigando le modalità di applicazione nel progetto DesignNet del protocollo della Open Archives Initiative (OAI) Progetto DesignNet - Dublin Core Elementi obbligatori Elementi opzionali Autore Autore di contributo subordinato Data Copertura Diritti Descrizione Editore Fonte Formato Lingua Identificatore Relazione Soggetto Tipo Titolo [Tab.1] Elementi definiti obbligatori e opzionali nello schema Dublin Core del Progetto DesignNet 162 | (il termine Open indica l’interoperabilità, mentre per Archives si intendono dei depositi di lavori scientifici e altri materiali digitali). OAI si basa sul concetto di Open Access: accesso libero (senza barriere tecnologiche, legali, finanziarie) e utilizzo aperto (per scopi legittimi e legali). In tal modo l’autore del documento mantiene tutti i diritti, ad esclusione di quelli commerciali. Laddove tale strategia venga applicata sia agli Open Archives che agli Open Access Journals, come nel caso di BOAI (Budapest Open Archives) 12, si può permettere un accesso aperto a tutta la letteratura scientifica peer-reviewed, con un notevole aumento dell’impatto in termini di download e citazioni. 5.2.3 Indicizzazione e information retrieval: il Design Thesaurus Come è stato osservato nel paragrafo 2.2.7, per chi compila i record del catalogo e per l’utente che effettua la ricerca un thesaurus è sia uno strumento di inserimento che di recupero dei dati. Il suo utilizzo risulta particolarmente utile nel caso in cui un’organizzazione possieda grandi quantità di documenti e di informazioni non strutturate e ‘atipiche’, e necessiti di controllare e di fornire accesso a queste informazioni. Un thesaurus rappresenta uno strumento efficace di knowledge representation per l’inserimento dati (in fase di indicizzazione come vocabolario di termini, di relazioni semantiche, varianti e sinonimi) e il loro recupero (nell’interfaccia utente come supporto alla navigazione) in ambienti di rete. La selezione di uno strumento di indicizzazione ad hoc per il progetto è stata preceduta da alcune riflessioni . Nel corso della fase di analisi dei requisiti del progetto DesignNet, è stato osservato che mentre gli OPAC di biblioteche generali si basano fondamentalmente sullo schema di Classificazione Decimale Dewey per la classificazione e sulle liste nazionali di intestazioni di soggetto per la soggettazione, i database specializzati sono dotati di vocabolari specifici quali schemi di classificazione disciplinare o thesauri. Dopo un’indagine sui vocabolari attualmente disponibili online e offline, ad eccezione dell’Art&Architecture Thesaurus del Getty Information Institute, è emerso che in ambito nazionale e internazionale non risulta disponible un thesaurus progettato esplicitamente per il design, un ambito interdisciplinare nel quale è ben più difficile applicare schemi come la DDC e per il quale non esistono schemi di classificazione di riferimento come quelli in uso nelle discipline scientifiche 13. Inoltre è stata spesso segnalata la mancanza di identità metodologica e soprattutto di rigore terminologico nel linguaggio del design, che spesso utilizza in modo specialistico vocaboli di uso comune. Il concetto di granularità è stato applicato anche nella scelta del thesaurus come strumento di indicizzazione, ritenuto efficace per migliorare la precisione delle descrizione della tipologia di documenti del design, poichè una maggiore Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 163 esaustività, precisione e flessibilità rispetto alle classificazioni e ai soggettari esistenti. Le risposte che si ricevono nell’interrogazione di un catalogo dipendono infatti dalle domande poste e dalla specifica struttura del catalogo: un thesaurus consente sia a chi si occupa della compilazione di un record, sia all’utente che effettua una query, di muoversi in un continuum di concetti dal generale allo specifico. Se si utilizzassero soltanto termini specifici, si perderebbero fonti utili che non riportano quei termini; se al contrario ci servissimo solamente di termini generali, otterremmo molti cosiddetti false drop. Questo processo riveste altresì una funzione conoscitiva preziosa in un contesto didattico, sia per l’indicizzatore che per l’utente, favorendo la disseminazione di concetti relativi al design e del loro significato ed utilizzo in una specifica comunità d’uso. La progettazione di questo thesaurus in lingua italiana sulle discipline e tematiche inerenti il design, denominato Design Thesaurus, è avvenuto secondo i seguenti criteri: - conformità ai seguenti standard: UNI ISO 2788 Linee guida per la costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985. Metodi per l’analisi dei documenti, la determinazione del loro soggetto e la selezione dei termini di indicizzazione; Guidelines for the Construction, Format, and Management of Monolingual Thesauri Document Number: ANSI/NISO Z39.19-2003, National Information Standards Organization, 28 August 2003; Guidelines for Indexes and Related Information Retrieval Devices Document Number: NISO TR02-1997, National Information Standards Organization, 1 January 1997; - riferimento a esempi rilevanti di progetti di thesauri esistenti, in particolar modo all’Art&Architecture Thesaurus del Getty; - sviluppo in-house di un software per la gestione del Design Thesaurus, concepito come un database con struttura gerarchica, consultabile a <www.designthesaurus.polimi.it>. Oltre ad essere integrato nel catalogo del progetto DesignNet, è previsto l’utilizzo indipendente del Design Thesaurus come banca dati terminologica sul design, in continuo aggiornamento. Nelle implementazioni successive del sistema, si ipotizza l’integrazione del sistema term-based del Design Thesaurus con un sistema content-based di Visual Retrieval per file 2D e 3D, che permette di effettuare query in base al colore, alla forma, alla texture e alle relazioni spaziali di un oggetto digitale. Da un punto di vista organizzativo, le attività relative alla creazione del thesaurus sono state programmate come segue: 1. preparazione: chi si occupa della compilazione del thesaurus deve possedere ottime capacità analitiche e una conoscenza generale degli argomenti trattati. Da un punto di vista concettuale, vi sono due 164 | approcci distinti nella costruzione di un thesaurus, anche se nella pratica, tuttavia, per la maggior parte dei thesauri si utilizzano entrambi: il metodo top-down e quello bottom-up. Il metodo topdown consiste nel creare un gruppo di esperti nelle aree disciplinari del thesaurus, per decidere lo scopo e l’ampiezza delle categorie dei termini che verranno inclusi. Per decidere i termini da selezionare e le loro relazioni vengono utilizzati dei dizionari e dei thesauri: l’insieme preliminare dei termini viene revisionato e organizzato decidendo i termini preferiti, per passare poi alla selezione delle varianti e dei sinomini e quindi alla costruzione delle relazioni associative tra i termini preferiti. La bozza di thesaurus che ne deriva viene quindi verificata e nuovamente revisionata. Nel metodo bottom-up, attraverso una serie di fonti diverse i termini vengono selezionati e organizzati, facendo riferimento ad un gruppo di esperti per termini il cui significato risulta ambiguo e per l’indicazione delle varianti e dei sinonimi da preferire. La bozza di thesaurus che ne deriva viene quindi verificata e nuovamente revisionata. Sia scegliendo l’approccio top-down che bottom-up, chi si occupa della compilazione deve inoltre possedere una capacità di comunicazione e coordinamento con interlocutori di diverso livello, poiché la compilazione implica un’ampia quantità di discussioni e di confronti; 2. raccolta, selezione e analisi dei termini. Lo stadio successivo nel nostro progetto è stato quello di effettuare una investigazione preliminare della propria organizzazione e delle sue attività, attraverso: - l’analisi della documentazione interna e delle diverse pubblicazioni dei membri dell’organizzazione; - interviste campione del personale, per identificare i termini utilizzati dalle persone e validare/potenziare le informazioni già raccolte dalle fonti documentali. Come operazione introduttiva alla raccolta delle informazioni, somo stati identificati dei referenti chiavi che possano collaborare alla verifica dei termini raccolti nelle fasi successive; - revisione delle liste di titoli e di parole chiave. 3. raggruppamento e sviluppo delle classi di concetti, utilizzando le funzioni, le attività, le transazioni e la terminologia individuate nella seconda fase; 4. struttura di classificazione. I termini analizzati vengono organizzati in uno schema di classificazione generale che includa e/o preveda: - funzioni e le attività documentate dall’organizzazione; - funzioni e le attività inerenti agli ambiti disciplinari trattati; - terminologia non ambigua; Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 165 - classi discrete di termini; - gerarchie organizzate dal generale allo specifico; - termini verificate consultandosi con gli utenti del thesaurus. 5. collazione delle informazioni. Questa fase implica: - vocabulary control: un processo di organizzazione delle liste dei termini indicizzati, indicando i termini preferiti e i gruppi di sinonimi, e distinguendo tra gli omografi (dallo standard Z39.19-1993); - organizzazione dei termini preferiti in una struttura logica di termini generici e termini più specifici; - elaborazione delle note d’ambito, con la descrizione di ogni termine e il modo in cui dovrebbe essere utilizzato, e definizione/verifica dei termini associati. 6. compilazione: il tempo varia a seconda delle dimensioni dell’organizzazione, dell’esperienza dei compilatori e della loro disponibilità parttime o full-time al progetto; 7. verifica dei termini funzionali. In questa fase i termini selezionati vengono verificati con le liste di parole chiave precedentemente raccolte, per assicurarsi che non vi siano duplicati o sovrapposizioni; 8. collazioni e verifica dei dati in un software per la gestione di un thesaurus, controllando le inconsistenze, errori di battitura e di compilazione; 9. disseminazione della bozza del thesaurus nell’organizzazione, cosicché i vari membri (sia gli alti quadri che i potenziali utenti) possano esprimere commenti e suggerimenti al riguardo. Si effettua quindi la revisione della bozza del thesaurus, incorporando in essa il feedback più rilevante; 10. verifica finale del thesaurus prodotto; 11. disseminazione del thesaurus completo. Questa fase implica l’accertamento che il thesaurus risponda ai requisiti dell’organizzazione e agli standard in uso, e l’individuazione delle modalità e degli ambiti in cui il thesaurus viene reso accessibile. Sulle versioni a stampa e in digitale del thesaurus verrà indicata la data della release, e per completezza, riporterà le date di modifica di ogni termine del thesaurus; 12. implementazione. In questa fase si organizza la presentazione del thesaurus completo e si programma la sua implementazione futura. Si tratta probabilmente di una delle fasi più complesse, poiché implica la previsione delle politiche di sviluppo nella terminologia e nel software, dell’integrazione tra il thesaurus e il database del catalogo, degli output previsti, dei fondi a disposizione, dei tempi di realizzazione. Prima della release della versione implementata il thesaurus viene verificato con un gruppo di testing, e parallelamente l’implementazione includerà il tirocinio degli utenti e l’analisi dei feedback degli utenti; 166 | 13. pianificazione della manutenzione. Molti problemi riguardanti il thesaurus e il suo utilizzo diventano manifesti solo quanto esso viene applicato nella pratica quotidiana: occorre perciò pianificare un’accurata implementazione ogni 6-12 mesi, oltre a verifiche periodiche che permettano di aggiornare il thesaurus all’evoluzione delle funzioni e dei processi dell’organizzazione, e alle modifiche del linguaggio utilizzato. Da un punto di vista concettuale, la progettazione del linguaggio di indicizzazione del Design Thesaurus (che si compone di una semantica degli attributi, una semantica dei valori e una sintassi), è stata definita nei seguenti quattro passaggi: 1. analisi a faccette: specificazione della semantica degli attributi, consistente in un insieme di attributi e di relazioni sintagmatiche tra i vari tipi di attributi, noto anche come ordine di citazione; 2. analisi del vocabolario: specificazione della semantica dei valori, riguarda un insieme di relazioni paradigmatiche tra tipi di versi di valori (come avviene in un thesaurus che presenta relazioni di equivalenza, gerarchiche e associative); 3. specificazione della sintassi: specificazione del formato, consistente in sintassi del record (forma grammaticale della descrizione di un oggetto) e sintassi del campo (forma grammaticale della descrizione di una proprietà); 4. organizzazione della classe (opzionale). Sono state inoltre adottate le seguenti distinzioni: - cose vs. simboli (cose: nel mondo esterno; simboli: utilizzati in un linguaggio per rappresentare una cosa); - elementi vs. insiemi (elemento: qualcosa di indivisibile; insieme: qualcosa costituita da un certo numero di elementi); - istanze/item/particolari vs. classi/tipi/universali (istanza: una particolare occorrenza di una cosa di un certo tipo; classe: un insieme universale di cose di un certo tipo). È opportuno soffermarsi sull’articolazione a faccette, che assorbono l’intero dominio concettuale espresso dal Design Thesaurus. Una faccetta indica un gruppo di termini che condividono una singola, principale caratteristica (anche se i termini potrebbero condividerne altre). Ad esempio, ‘legno’, ‘lana’, ‘polipropilene’, ‘rame e ‘acciaio’ condividono tutti la caratteristica di essere di essere dei MATERIALI, sebbene alcuni di loro hanno in comune altre caratteristiche come la combustibilità. Nell’ambito della faccetta, i termini possono essere suddivisi in un ulteriori subfaccette con caratteristiche secondarie: ad esempio nella faccetta dei MATERIALI il legno e la lana appartengono ai materiali organici, mentre l’acciaio e il rame ai materiali inorganici e specificatamente ai metalli. Ogni gerarchia di termini necessita di un meccanismo per conservare l’ordine Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 167 e il livello di subordinazione dei propri contenuti, e per rappresentare i termini stessi tramite un insieme di codici univoco e non ambiguo, che possa collegare l’ordine gerarchico con l’ordine alfabetico o con la rappresentazione grafica. I codici notazionali previsti nel Design Thesaurus utilizzano l’alfabeto romano: i termini in lettere maiuscole indicano la faccetta o Top Term, e quelli in lettere minuscole indicano i dettagli nella gerarchia. Inoltre i codici notazionali standard 14 (UF per i Sinonimi, BT per Termine Generico, NT per i Termini Specifici, RT per i Termini Associati, SN per la Nota d’Ambito), permettono la manipolazione efficace di un ampio numero di termini, consentendo ai software di effettuare verifiche di consistenza automatiche. I codici notazionali facilitano anche la manipolazione dei termini per produrre delle liste dai termini del thesaurus, organizzabili in una varietà di ordini e formati, e l’elaborazione del thesaurus finale mostrandone tutte le sue relazioni. L’analisi a faccette permette dunque di organizzare i termini in piccoli gruppi interrelati tra loro, in modo che ogni gruppo possa essere esaminato facilmente e efficacemente per quanto riguarda la consistenza, l’ordine, le relazioni gerarchiche e associative e la loro accettabilità o meno nel linguaggio specifico usato nei termini. Essa fornisce anche la possibilità di designare in modo ordinato le relazioni tra i termini, eliminando la necessità di assegnare relazioni BT e NT in modo intuitivo, operazione che nei vocabolari di grandi dimensioni non è scevra di errori ed omissioni. L’articolazione a faccette risulta essere utile anche per la flessibilità che consente nel gestire l’aggiunta di nuovi termini e di nuove relazioni. Poiché ogni faccetta è indipendente, i cambiamenti possono in genere essere operati facilmente senza bisogno di alterare il resto del thesaurus. Un ulteriore beneficio di questo approccio è risultato evidente nella fase di utilizzo sperimentale del thesaurus. Sia per chi compila i record di catalogo, che per l’utente che ricerca un documento, un insieme di faccette gerarchicamente organizzate risulta più semplice comprendere, costituendo una mappa concettuale che mostra il livello e insieme di associazioni di un termine, sia negli output a stampa o a schermo di differenti formati del thesaurus che per la rappresentazione nell’interfaccia di ricerca del catalogo online. 5.2.4 Authority file: la Design Directory La comunità bibliotecaria ha da tempo definito gli standard sia per la descrizione di entità bibliografiche, che per l’identificazione univoca di individui ed enti. Tuttavia, per tradizione i bibliotecari si sono concentrati sul controllo dei nominativi e non sulla descrizione delle persone e organizzazioni corrispondenti. In altre parole, gli standard dell’authority control biblioteconomico sono utili alla descrizione bibliografica tramite il controllo delle intestazioni o delle registrazioni usate. 168 | Il controllo archivistico si differenzia da quello biblioteconomico poiché necessita non solo di un controllo di autorità o di intestazione, ma anche di una dettagliata descrizione biografica e storica delle entità nominate: le registrazioni archivistiche infatti hanno funzione di testimonianza sia legale che storica, perciò documentare il contesto della creazione della registrazione è essenziale. Quando l’organizzazione e la descrizione sono basate sulla provenienza, c’è una corrispondenza 1:1 tra la descrizione dell’unità archivistica e l’entità produttrice, che rende logico documentare nello stesso apparato descrittivo sia il creatore che i documenti creati. A livello informatico, attraverso i linguaggi di mark-up e i database relazionali, la sfida di rappresentare queste informazioni in modo efficace ed economico ha imposto una analisi della logica e della struttura della descrizione, ed una conseguente crescente differenziazione e definizione formale dei componenti della descrizione e delle loro relazioni. In generale, partendo dall’assunto che «senza authority control la struttura relazionale e la struttura sindetica del catalogo hanno fondamenta di argilla» 15 , si può affermare che promuovere il controllo dei punti di accesso attualmente è una attività indispensabile soprattutto in un contesto di network globale e di biblioteche digitali. Gli attuali sviluppi nel W3C sul Web semantico stanno reinventando i concetti dell’authority control al fine di migliorare l’uso del Web. Così come vengono posti in relazione con le descrizioni della documentazione archivistica prodotta, gli authority record di persone e di organizzazioni possono infatti essere connessi con risorse informative ad essi relative, presenti in banche dati online. La standardizzazione della descrizione del soggetto produttore offre sostanziali benefici economici, dato che la descrizione degli individui, delle famiglie e delle organizzazioni è una operazione onerosa in termini di tempo e di risorse umane specializzate, il cui costo si va ad aggiungere alla descrizione dei documenti. Tornando al caso specifico affrontato in questo volume, l’ampia interdisciplinarietà riscontrabile in un catalogo accademico richiede un’attenta selezione di forme di intestazione standard. Il contesto e le esigenze della documentazione del design sono per molti versi simili a quelli degli archivisti: descrivere il contesto, le circostanze della progettazione di un prodotto, i protagonisti primari e secondari è importante per comprenderne le caratteristiche. Per tale motivo, nel progetto DesignNet è prevista la creazione di una lista di autorità specifica il mondo del design, denominata Design Directory e organizzata come un insieme di authority file di persone, organizzazioni e nomi commerciali di prodotti, secondo intestazioni omogenee e controllate. Insieme al Design Thesaurus, con la Design Directory l’utente potrà passare senza soluzione di continuità da un thesaurus testuale di concetti, al catalogo dei documenti, Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 169 ai documenti stessi – se presenti in forma digitale e accessibili in base al copyright –, alle descrizioni dei produttori, stimolando così nuove costellazioni di relazioni. Come il Design Thesaurus, la Design Directory crea una rete di sinomini e varianti collegati tra loro, sfruttando l’ipertestualità e le caratteritiche del database relazionale. Inoltre, anche qui, è prevista la consultazione indipendente delle liste di autorità dei produttori, che verranno così a costituire delle risorse biografiche e storiche di cui è possibile registrare l’evoluzione nel tempo. 5.2.5 Modalità di lavoro collaborativo Nella biblioteconomia viene espressa l’idea che non tutta l’informazione sia conoscenza, ma diventi tale solo quando viene mappata ad una struttura cognitiva, ad esempio organizzata in modo tale da diventare accessibile e comprensibile agli utenti. Di fatto potrebbero esistere molte strutture cognitive per organizzare lo stesso tipo di informazioni, a riprova del fatto che il contesto e lo scopo sono essenziali per trasformare le informazioni in conoscenza. Ciò implica anche l’importanza di identificare la cosiddetta ‘comunità di interesse’ sia per i produttori che per i consumatori di informazioni. Il termine ‘comunità’ sta diventando sempre più ubiquo, in particolare in relazione ai servizi personalizzati su Internet, ma con varie accezioni. Una definizione culturalmente sofisticata è quella di una comunità i cui membri, in aggiunta alle due precedenti condizioni, condividono lo stesso vocabolario, semantica e teoria di organizzazione delle informazioni. Per i membri di questa comunità esistono degli obiettivi comuni e concetti con cui condividere idee ed esperienze. L’analisi del consenso è basata su semplici assunti: la conoscenza è sia distribuita che condivisa in un dato ambito, e ogni gruppo di esperti delle aree di questo ambito possiede esperienze diverse. La condivisione delle informazioni facilita la disponibilità di un bacino di informazioni con una distribuzione di conoscenza non uniforme attraverso i vari gruppi. Il processo di mappare le informazioni su tale consenso rappresenta l’essenza della creazione della conoscenza culturale, tema che permette di identificare quattro aree di ricerca principali: acquisizione dell’informazione, derivazione della conoscenza, rappresentazione della conoscenza, riutilizzo della conoscenza. Il sistema DesignNet è stato progettato come il punto di raccordo dei dati descrittivi e terminologici, e più in generale dei flussi informativi, che vengono validati dopo una fase di normalizzazione su base collettiva. Si prevede il coinvolgimento attivo della comunità dei fornitori di contenuto e degli utenti, che plasmano il sistema attraverso una catalogazione e indicizzazione partecipata, resa possibile tramite istruzione dell’utenza e continui interfacciamenti con essa. A vari livelli gli utenti si affiancano alla unità di documentazione 170 | nelle attività di selezione, indicizzazione e catalogazione delle risorse disponibili; per garantire il controllo sulla qualità, le attività di catalogazione e indicizzazione sono accessibili tramite password con diversi livelli di autorizzazione. Il sistema richiede che i partecipanti al progetto imparino a collaborare, a condividere le risorse e ad adottare un livello catalografico standard. L’obiettivo è quello di coinvolgere l’intera la comunità dipartimentale e di facoltà nel sistema: essendo costituita non soltanto da docenti strutturati, ma da un alto numero di docenti a contratto e di collaboratori spesso professionisti, per ricchezza ed eterogeneità di argomenti trattati e attività in corso essa sembra infatti costituire un buon campione rappresentativo del mondo del design. In molti modi, si tratta del paradigma del Web in opera: più la rete (nel nostro caso il catalogo, il Design Thesaurus e la Design Directory) cresce, e più essa diventa utile. Consolidata l’adesione interna, è previsto il rafforzamento del coinvolgimento di istituzioni esterne (in particolare i musei d’impresa e gli archivi del design), con l’obiettivo di istituire un network regionale (e in prospettiva nazionale e internazionale) per il design. Il livello comune di catalogazione dovrebbe essere minimo, con informazioni essenziali ritenute sufficienti a individuare e a caratterizzare il documento. L’adozione di un eventuale livello più analitico è demandato alla disponibilità dei singoli partecipanti, ed è giustificato dalla necessità di descrivere in modo più dettagliato specifici materiali. Un’unità di documentazione dedicata collabora con i fornitori di contenuto per l’implementazione di un Thesaurus per il Design e per l’identificazione e la selezione di nuove risorse e servizi da includere nel gateway. L’unità valida le proposte, verifica direttamente in rete i relativi record (compilati, secondo un’estensione del principio di catalogazione partecipata, sia da fornitori di contenuto riconosciuti che da utenti), provvede ad una loro eventuale integrazione e li valida includendoli nel database. Questo tipo di workflow e l’architettura di sistema che lo supporta consentono di effettuare velocemente modifiche di informazioni sul lato server e di renderle immediatamente disponibili agli utenti (Tab. 2). Durante il processo di formazione e di verifica, i dati possono essere consultati solo da parte degli utenti abilitati ad operare nei rispettivi ambiti di competenza. I dati che hanno superato l’intero processo descritto ottengono lo status di ‘dati validati’ e possono essere resi disponibili per la fruizione alle diverse tipologie d’utenza. Le esperienze maturate in vari progetti catalografici negli ultimi anni hanno evidenziato l’onerosità e l’inadeguatezza del controllo e della correzione condotti a posteriori (come ad esempio lo schiacciamento dei dati catalografici duplicati), spingendo sempre più a favore di un forte impegno nella definizione di conoscenze diffuse e di competenze decentrate. Per tale motivo nel progetto DesignNet si è scelta la strada del decentramento, formazione continua e Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 171 tutoraggio, con tirocinio e assistenza durante le attività di routine. Il passaggio finale nel processo di creazione dei metadati prevede l’intervento di un esperto che verifichi il record finale con i metadati, e individui eventuali inconsistenze nei metadati o delle possibili integrazioni dei record. I metadati verosimilmente non saranno statici ma cambieranno nel tempo: per tale motivo la loro creazione non è un’operazione che avviene una sola volta ma piuttosto un processo iterativo, che richiederà verifiche periodiche. Documentare manualmente i passaggi di elaborazione degli insiemi di dati individuali è generalmente riconosciuto come non fattibile e oneroso. Queste operazioni possono essere tracciate più facilmente con strumenti di estrazione dedicati, e i principali passaggi cumulativi di elaborazione si possono riservare ai metadati. Tra gli elementi previsti per i metadati strutturali, vi sarà un campo specifico per questo scopo: una data programmata di revisione. L’obiettivo successivo al conseguimento della validazione qualitativa dei dati catalografici è quello della loro uniformità di presentazione sul Web, per poter costituire un patrimonio unico, condiviso e omogeneo organizzato attraverso una architettura informativa multilivello, personalizzabile in base Proposta di, catalogazione, indicizzazione Data entry Coordinamento, revisione, validazione Consultazione Manipolazione Selezione risorse utenti generici - unità di documentazione - content provider - utenti autorizzati unità di documentazione utenti generici utenti autorizzati Catalogazione con Dublin Core utenti generici - unità di documentazione - content provider - utenti autorizzati unità di documentazione utenti generici utenti autorizzati Indicizzazione con Thesaurus del Design utenti generici - unità di documentazione unità di documentazione + Gruppo di Studio sulla Terminologia del Design utenti generici utenti autorizzati Directory del Design utenti generici - unità di documentazione - content provider - utenti autorizzati unità di documentazione utenti generici utenti autorizzati [Tab.2] Definizione del workflow e delle modalità di accesso dei servizi nel progetto DesignNet 172 | alle esigenze degli utenti. I dati possono cioè essere organizzati secondo esplicite richieste, oppure in base alle indicazioni dedotte dal monitoraggio, dalla bonifica e dall’analisi statistica sull’utilizzo del sistema da parte degli utenti, secondo una modalità iterativa che beneficia dell’effettivo coinvolgimento degli utenti nella fruizione. 5.2.6 Management e visualizzazione di risorse eterogenee complesse Una biblioteca digitale può funzionare solo se viene gestito in modo rigoroso l’intero ciclo di vita degli oggetti digitali, e per fare ciò il sistema deve essere sufficientemente versatile per descrivere in modo appropriato i documenti, supportare formati presenti e futuri, essere in grado di migrare i contenuti tra i diversi tipi di documenti, essere accessibile all’esterno e contenere le informazioni necessarie di copyright e di autorizzazioni. Un problema fondamentale delle collezioni di risorse eterogenee complesse come multimedia e rich media in applicazioni Web-based, spesso conservate in repository diversi secondo standard e formati differenti, è quello della loro gestione e visualizzazione con un’interfaccia di ricerca unica e omogenea 16. Le varie soluzioni offerte dal mercato variano a seconda della complessità, della performance e dei costi. La soluzione ideale dipende dai propri specifici bisogni: ad esempio dimensioni del database, volume ipotizzato della domanda, volatilità dei dati, disponibilità delle risorse tecniche. Altri elementi da considerare sono l’accesso ad un vocabolario controllato, la flessibilità nella progettazione del database, la lunghezze di vita prevista per i dati, il potenziale per la migrazione, l’aderenza agli standard dei database e agli standard di contenuti di dati. Oggi si possono identificare tre classi di sistemi di gestione di documento testuali e audiovisuali: 1. applicazioni generiche di database (desktop e client/server); 2. programmi specializzati di gestione delle immagini (desktop e client/server); 3. soluzioni basate su SGML e XML. I più comuni programmi desktop del primo gruppo sono MS Access, Filemaker Pro; le applicazioni più comuni client/server sono Oracle, Informix (incluso Illustra), 4th Dimension e applicazioni object-oriented. I vantaggi dei programmi desktop riguardano i bassi costi iniziali, la relativa facilità di programmazione e utilizzo, la semplicità dei moduli di data import ed export e la crescente disponibilità di aggiunte commerciali, specialmente di strumenti Web. Tuttavia essi presentano poca scalabilità, poche strutture standard di dati, la necessità di personalizzare l’interfaccia Web e gli alti costi della programmazione, espliciti con le grandi applicazioni e nascosti ma comunque presenti con le applicazioni desktop. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 173 Del secondo gruppo fanno parte soluzioni desktop commerciali: ad esempio Cumulus della Canto, ImageAXS, Portfolio (già Fetch), Luna Imagining Insight, ContentDm. I vantaggi di gestione, nelle immagini in particolare, sono certamente la struttura predefinita dei dati, i link costruiti dentro le immagini, la funzionalità cross-platform e link inseriti dentro per il Web di alcuni di essi, e una minore capacità di programmazione richiesta per l’implementazione. Di contro, gli svantaggi riguardano proprio la struttura fissa dei dati, strutture proprietarie di database, una possibilità di personalizzazione limitata e l’accesso Web possibile principalmente tramite script. I programmi specializzati di gestione delle immagini client e server sono principalmente software per biblioteche per biblioteche digitali, programmi destinati ai musei, applicativi per la gestione dei documenti e per i multimedia. Analizzando l’ambito oggetto di questo volume, ovvero i sistemi automatizzati per le biblioteche, gli applicativi che gestiscono anche immagini includono VTLS, CARL OCLC Sitesearch, Voyager ed Encompass della Endeavor, prodotti che in generale presentano ancora un’integrazione parziale tra immagini e testi, l’assenza di standard comuni per i repository e per l’utilizzo dei metadati, difficoltà nella gestione delle attività amministrative. L’ultimo gruppi dei sistemi in esame utilizza un nuovo approccio: l’uso di metadati codificati con SGML o XML, basandosi sulla definizione del tipo di documento (DTD: Document Type Definition). Tra gli esempi vi sono il California Heritage Project, che archivia le immagini utilizzando l’Encoded Archival Description (EAD), i testi che usano Ebind (un DTD di rilegatura elettronico), e il completo sistema di gestione Agora. I motivi per prendere in considerazione l’uso del SGML sono molteplici: innanzitutto questo linguaggio di marcatura è basato su uno standard internazionale, e i DTD stessi potrebbero diventare degli standard (basti pensare al MOA2). Inoltre SGML potrebbe essere più appropriato per una descrizione orientata al testo, ed è possibile creare dei link tra altre risorse codificate in SGML o XML. Ma esso presenta anche degli svantaggi: pochi client nativi supportano SGML, i motori che lo utilizzano potrebbero non essere potenti come i database relazionali, i database in XML sono attualmente ancora in fase di sviluppo, i software nativi in SGML tendono ad essere piuttosto costosi, e spesso è più facile immagazzinare i dati in un database e scriverlo senza i tag SGML o XML per lo scambio o l’export. Gli attuali software di ricerca cross-database attualmente sembrano rappresentare una buona soluzione per un accesso unificato soprattutto per la scoperta di informazioni generiche. Questi strumenti non soltanto ricercano i cataloghi di biblioteca ma anche per database commerciali di abstract e indici, motori di ricerca e una varietà di altri database, spesso effettuando la riunione 174 | e l’eliminazione dei risultati doppioni (de-duping). Varie biblioteche internazionali utilizzano software come MuseGlobal, EnCompass, WebFeat, MetaLib, MetaStar e Millennium 17. I prodotti sul mercato variano abbastanza per caratteristiche, stabilità e facilità di implementazione: in alcuni casi potrebbe essere necessario solo un minimo di configurazione alle interfacce utenti di questi prodotti, mentre in altri occorrerà effettuare ulteriori implementazioni e potenziamenti dei sistemi, sempre che i vincoli tecnologici e le restrizioni imposte dalle software house lo consentano. Bisognerà in ogni caso mettere in conto modifiche continue al database, alle interfacce e ai metadati, al tempo stesso monitorando attentamente lo sviluppo degli standard dei database di immagini nella propria area di interesse. Nel caso di biblioteche universitarie, verosimilmente, l’implementazione e la manutenzione necessaria per questi software sembra tuttora notevole, e rimangono aperte le questioni del protocollo di ricerca e della efficace eliminazione dei risultati doppioni. Un altro problema non indifferente è quello del relevance ranking: ottenere dei risultati di ricerca da una varietà di fonti è assai elencarle in ordine di rilevanza. Per calcolare la rilevanza, il sistema deve supporre che alcuni documenti siano relativi ai bisogni degli utenti, e deve anche cercare di determinare quali item soddisferanno meglio i bisogni degli utenti, spesso disponendo solo di informazioni molto ridotte. Con i record MARC ad esempio non è possibile, e poiché le biblioteche usano sempre di più sistemi basati sull’OpenURL (come SFX di Ex Libris), è difficile o quasi impossibile conoscere in anticipo se una dato risultato di ricerca può essere accessibile online. Alcuni progetti degli ultimi anni, tra cui quello della California Digital Library, hanno indicato che: - non sempre i migliaia di risultati ottenuti attraverso ricerche crossdatabase sono utili; - non sempre le soluzioni che comprendono tutti i database soddisfano i bisogni fondamentali degli utenti; - se da un lato della scala degli utenti vi sono gli studenti non laureati, che tipicamente hanno bisogno solo di un qualche documento da citare nei loro lavori, all’altro capo della scala vi sono gli studenti laureati o i membri della facoltà che richiedono documenti molto più dettagliati su una certa disciplina o un dato problema. Una soluzione a misura unica che vada bene per tutti non accontenta nessuna di queste due categorie. I risultati del benchmarking tra i diversi applicativi – unitamente ad alcuni vincoli di tipo economico – hanno portato alla scelta di sviluppare internamente al Dipartimento INDACO gli applicativi per il progetto DesignNet. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 175 La soluzione identificata è stata quella di associare i metadati alle risorse dentro un Relational Database Management System (RDBMS) con interfaccia Web appositamente creato. Questa soluzione permette di utilizzare sistemi di Information Retrieval e di manipolazione delle risorse attraverso l’utilizzo di Java e dell’eXtensible Markup Language (XML), che consentono l’accesso non soltanto ai metadati ma alle risorse stesse (utilizzando una chiara codifica degli standard di archiviazione per le risorse digitali). Sebbene i RDBMS possano presentare limitazioni dovute a restrizioni di lunghezza e problemi relativi ai campi multipli (e in Dublin Core tutti i campi sono ripetibili), un sistema object-oriented come allegro-C 18, attualmente in utilizzo in alcuni progetti tedeschi sui metadati, non è sembrata un’alternativa migliore. Per quanto riguarda i risultati della query, la tradizionale visualizzazione di dati è in genere focalizzata su un approccio descrittivo testuale piuttosto che visuale. Una soluzione alternativa potrebbe essere quella della restituzione accurata dei dati testuali, cercando però al tempo stesso di evidenziare percorsi significativi attraverso l’utilizzo di elementi grafici codificati. Questo approccio di ‘visualizzazione semantica’ 19 introduce una valutazione sul significato e la rilevanza dei dati nel processo evocativo di visualizzazione. Nell’ambito del design (come anche in altri settori) ciò consentirebbe di soddisfare alcuni bisogni specifici, quali ad esempio la possibilità di recuperare materiali (soprattutto visuali) che altri membri della comunità hanno valutato come interessanti, ottenere i risultati della ricerca filtrati o elencati in base a regole basate sulla qualità delle risorse, conoscere le modalità di utilizzo di alcune risorse da parte di altri utenti. Inoltre attraverso una visualizzazione grafica dei risultati delle query, il surfing – considerato negativamente come una perdita di tempo che abbassa la qualità dei risultati ottenuti – viene trasformato nel più positivo concetto di serendipity. Dal punto di vista catalografico, si prevede che tutti i documenti catalogati confluiscano in un OPAC arricchito (comprensivo di risorse possedute in locale e di risorse ad accesso remoto), strumento di accesso unico e omnicomprensivo, dotato di filtri incrociabili, ad esempio per restringere la ricerca alle sole risorse analogiche, oppure solo a quelle consultabili a distanza secondo accessi diversificati. Nel sistema così definito, una collezione tipicamente includerà documenti digitali e riproduzioni digitali di documenti analogici (contenuti) e supporti di accesso coerenti (tipicamente, un insieme di record descrittivi e dei finding aid). Un documento potrebbe rappresentare un gruppo di documenti fisici che vengono descritti, identificati e presentati come un insieme. Un link a livello di documento punta ad un singolo oggetto digi176 | tale, singolo o più spesso multiparte. I collegamenti tra i finding aid e i documenti saranno allo stesso livello della descrizione, normalmente per un documento o un gruppo di documenti collegati che viene descritto come un insieme. Perciò, un link da un record descrittivo dovrebbe puntare ad una rappresentazione Web-based di un oggetto digitale corrispondente al documento descritto, e questa rappresentazione potrebbe a sua volta costituire un documento di per sé: la copertina di un libro sarà cioè presente nel record del volume in oggetto, ma, se ritenuta utile come esempio di grafica, avrà un proprio record. Se un gruppo di item fisici viene descritto come insieme, il record descrive il gruppo e possiede un link ad una presentazione del gruppo visualizzato come una sequenza di thumbnail (che sarà visibile come un multi-view object, ovvero come immagini multiple di un documento), un indice dei contenuti o qualche altra forma di anteprima che fornisca dei link ai documenti individuali, o al primo documento con opzioni di navigazione. La scelta varierà con il tipo di documento e le preferenze degli utenti. È prevista la distinzione fra la presentazione del record destinata all’utente e quello ad uso di chi si effettua la compilazione: il primo conterrà solo gli elementi funzionali alla ricerca, mentre nel secondo verranno visualizzati i dati gestionali e amministrativi (come il numero di inventario, i software e le procedure necessarie alla conservazione) e le notizie di servizio (come il tracciato). Contestualmente, è stato analizzato il processo di recupero dei documenti, tipicamente reiterativo, sotteso all’interfaccia grafica prevista e i relativi processi di valutazione e di perfezionamento della query. Nel progetto DesignNet sono stati adottati approcci consolidati nell’area dell’Information Visualization: incorporare la visualizzazione e l’interazione nella funzione di recupero dell’infor-mazione può migliorare in modo notevole la performance di richiamo dei documenti 20. La rappresentazione grafica dei risultati e il recupero dei risultati intermedi da un lato stimola il processo di valutazione sfruttando la capacità umana di valutare facilmente le informazioni visuali, dall’altro permette all’utente di controllare interattivamente il processo di perfezionamento delle ricerche, identificando insiemi di documenti rilevanti. Perciò, oltre ad una rappresentazione lineare, DesignNet si pone l’obiettivo di una visualizzazione di relazioni più dettagliate tra i risultati della ricerca e la formulazione, ribadendo l’importanza di restituzione del contesto. Nella GUI le relazioni tra differenti documenti, scelte in base a parametri che possono variare dalla tipologia dei documenti al tipo di file di un documento digitale (sfruttando cioè tutte le informazioni dei vari campi della scheda di catalogo), vengono Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 177 mappate con differenti proprietà visive come il colore e la forma. Questo approccio permette di mostrare differenti dimensioni usando proprietà distinte, in modo che un osservatore umano possa immediatamente riconoscere pattern importanti che gli permetteranno un eventuale perfezionamento della query. Nel processo di richiamo dei documenti sono stati distinti quattro differenti subcompiti: 1. formulare una ricerca che descrive il tipo di documenti che si stanno cercando; 2. effettuare la ricerca e ottenere un insieme di risultati; 3. rappresentazione dell’insieme di risultati; 4. valutazione dell’insieme di risultati. La formulazione della query viene di volta in volta adattata alle intenzioni di recupero e ai risultati intermedi precedenti la sua esecuzione. Infine quando l’iterazione converge, viene generata una query ritenuta adatta a recuperare il risultato migliore: l’insieme di risultati ottenuti con questa ricerca contiene cioè i documenti che soddisfano al meglio i criteri di selezione. La visualizzazione grafica permette all’utente di individuare meglio dei percorsi specifici nella valutazione della query e trasforma quindi la sua percezione nella sua riformulazione: la capacità umana di riconoscere dei pattern o certe composizioni geometriche e di associarle instantaneamente a determinate interpretazioni permette un incremento nella performance della valutazione dei risultati. Inoltre incorporare metodi e tecniche di interazione come la manipolazione diretta o indiretta e meccanismi di feedback può facilitare il perfezionamento della ricerca. Per essere realmente efficace, tuttavia, pur favorendo quel concetto di serendipity che abbiamo visto essere funzionale alle modalità di apprendimento e di lavoro nel design, il processo di recupero dovrebbe essere integrato da specifici logaritmi di recupero, sia per il recupero term-based che, in prospettiva, per quello content-based (cfr. il paragrafo 2.2.5). Tali logaritmi, in particolare, saranno necessari nella gestione di un repository di grandi dimensioni, poiché la quantità di documenti recuperati nei risultati può raggiungere dimensioni notevoli. 5.2.7 Un Learning Resource Centre per il design Dai processi di design, basati su modalità di lavoro collaborative, come si è visto derivano una molteplicità di output e documenti eterogenei. Ad un’interfaccia digitale, costituita da un Quality-Controlled Subject Gateway e dalle sue componenti descritte nei paragrafi precedenti, occorre allora far corrispondere un’interfaccia analogica, un luogo di accesso e consultazione dei documenti analogici, di incontro della comunità di didattica e di ricerca e di occasione di attività di vario tipo. Tale luogo dovrebbe presentare spazi colla178 | borativi per attività basate sulla circolazione della conoscenza, nei quali l’ambiente fisico e quello virtuale non siano contrapposti ma integrati sinergicamente per una compenetrazione degli strumenti di lavoro. Nell’ambito del design, ad oggi si è tentato di dare una risposta a questa esigenza attraverso tre diverse soluzioni: i cosiddetti design centre, i centri di documentazione e gli archivi per il design. I design centre 21 sono delle strutture pubbliche finalizzati alla promozione, sensibilizzazione e diffusione delle tematiche inerenti il design e delle politiche industriali nazionali, puntando sull’organizzazione di manifestazioni, mostre ed eventi come strumento di diffusione delle cultura del design sia per le aziende che per il pubblico in generale, erogando servizi specifici in base alle necessità delle aziende e alla particolare tipologia di centro. In Europa e nel mondo il modello dei design centre ha riscosso successo (si pensi, solo per citarne alcuni, al Design Exchange, all’Internation Council of Industrial Design o al Centre Design Rhone-Alpes), mentre in Italia non si è ancora diffusamente affermato a causa in parte della specificità del variegato e frammentato tessuto industriale italiano, e dell’impegno statale, che ha attribuito alle tematiche del design una scarsa importanza nel raggiungimento degli obiettivi sia aziendali che dell’intero sistema produttivo nazionale. Uno dei compiti dei design centre è quello di diffondere informazioni e attraverso queste sviluppare la cultura del design: in questa ottica, essi si occupano tangenzialmente anche di attività documentali e di banche dati. I centri di documentazione, da parte loro, si dedicano ad attività ad elevato contenuto specialistico, selettivo e aggiornato, a supporto di attività di didattica, ricerca e formazione, che sembrano soddisfare le esigenze di una struttura di questo tipo 22. Specificatamente, le finalità dei centri documentazione comprendono: - la trasformazione e la riduzione del documento a unità informative, la creazione di lessici documentari e di thesauri, lo sviluppo di sistemi informativi, l’archiviazione, il recupero e la circolazione delle informazioni; - la promozione di attività di formazione per favorire l’utenza e l’utilizzazione più adeguata dei servizi di documentazione ed informazioni; - l’organizzazione, il supporto e/o la consulenza per ricerche di vario tipo e organizzazione di attività culturali quali convegni, mostre ecc. A fronte di queste esperienze, nel mondo delle biblioteche, e di quelle universitarie in particolare, negli ultimi anni si è affermato sempre più una visione sistemica della biblioteca come nodo di una rete, e prima di tutto luogo di incontro, di socializzazione, è un luogo capace di trasmettere, citando Michel Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 179 Melot, un ‘sentimento di comunità provvisoria’. È proprio in ambito didattico e universitario, come si è visto (paragrafo 1.2.3) che è in corso la definizione di nuovi modelli concettuali e progettuali, quali ad esempio i learning resource centre, concepiti come centri funzionali e flessibili di risorse e luogo di molteplici attività di studio, di ricerca e di interazione sociale. Dagli aspetti tipici dei centri di documentazione, un learning resource centre per il design può derivare l’alta specializzazione delle attività di catalogazione e indicizzazione, collezioni documentali selezionate e aggiornate, il focus su attività di formazione, ricerca e information literacy. Dai design centre, esso può trarre un approccio proattivo e propositivo, orientato alla ricerca e alla sperimentazione, alla collaborazione con istituzioni e aziende, all’organizzazione di eventi culturali e mostre, alla disseminazione in varie forme della propria attività. Allo stesso tempo, andrebbe dedicata speciale attenzione ad un approccio personalizzato in base ai bisogni e alle esigenze dei content provider e degli utenti. Il principio alla base di una tale struttura, così come è stata ideata per il progetto DesignNet, è una concezione del design come processo di ricombinazione creativa. Seguendo il modello di biblioteca a tre livelli di Heinz Hemunds, a livello architettonico un learning resource centre per il design dovrebbe comprendere: - un settore d’ingresso, provvisto di guardaroba, libreria, servizio di ristorazione, banco informazioni, materiali informativi sulla biblioteca e generali, postazioni informatiche utilizzabili in piedi e in modo diretto e rapido. Con la tessera magnetica di riconoscimento il lettore può controllare la sua situazione di utente o avere informazioni nell’ambito delle proprie specifiche aree di interesse; - la collocazione integrata del patrimonio: la distribuzione dei documenti non può essere effettuata in base al tipo di supporto. L’utente deve poter accedere a qualsiasi tipo di informazione in modo integrato, servendosi di tag elettronici; - zona di reference, zona di lettura (in biblioteca non si va solo per prendere in prestito opere ma per studiare, per leggere, per informarsi, per lavorare in gruppo), zone pluriuso (la biblioteca come luogo di accrescimento culturale individuale e collettivo, quindi servono spazi da adibire a rotazione a diversi tipi di attività). Le fasi di progettazione si conformano a quelle già identificate per le biblioteche: - il funzionamento generale della struttura (programmazione del servizio); - il dimensionamento, i requisiti e l’assetto distributivo degli spazi e degli arredi per un corretto svolgimento delle funzioni previste; - l’immagine della biblioteca, la sua qualità formale, i materiali, i colori, gli impianti ecc. nel rispetto del vigente regolamento edilizio per i 180 | locali pubblici e del modello dimensionale precedentemente elaborato (progetto architettonico); - la scelta degli arredi e dei complementi di arredi (progetto di arredo). L’uso delle tecnologie digitali dovrebbe avvenire a diversi livelli: - automazione dei servizi (catalogazione, reference, document delivery, prestito interbibliotecario…) e le attività amministrative; - gestione in rete dei rapporti tra partner e fornitori; - collegamento con Intranet e Internet; - produzione di un proprio sito Internet e possibilità di accesso ai servizi in linea non solo in sede ma anche a terminali remoti; - postazioni con terminali in rete e senza terminali ma cablati, per chi volesse recarsi in biblioteca con il proprio portatile. Poter usufruire dalla propria postazione di un terminale consente un nuovo tipo di lettura ‘contaminata’, ovvero consultazione non solo di tradizionali materiali cartacei ma contemporaneamente anche di documenti multimediali, per effettuare una ricerca incrociata senza limiti di supporto e favorire un processo associativo di conoscenze e nuove idee. 5.2.8 Risultati e problemi incontrati Nella fase di progettazione del sistema si è giunti alla definizione di: 1. definizione del workflow e delle modalità di accesso dei servizi messi a disposizione nel progetto DesignNet; 2. uno schema di metadati ad hoc per l’ambito del design, suscettibile di ulteriori perfezionamenti nelle successive fasi di testing e di messa a regime; 3. strumenti di indicizzazione specifici per il design in forma di un vocabolario controllato e strutturato e degli authority file; 4. modalità di gestione, restituzione e visualizzazione dei documenti dal punto di vista informatico; 5. un modello di riferimento per la creazione di un’interfaccia fisica (un learning resource centre per il design) dell’interfaccia digitale del sistema delineato; 6. disseminazione dei risultati ottenuti in ambito dipartimentale e di facoltà. Per quanto riguarda gli schemi di metadati, si è riscontrata l’assenza di uno standard catalografico unico nella gestione di giacimenti documentali del mondo del design, sia a livello nazionale che internazionale. La scelta di Dublin Core non è stata indolore, poiché la mappatura di metadati non è una mera operazione automatica. Al tempo stesso, anche i vari profili di applicazione di Dublin Core si presentano come diversi dialetti, Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 181 con la presenza di differenti elementi e qualificatori e a volte una interpretazione dissimile dei medesimi elementi e qualificatori. I qualificatori, come già evidenziato nel paragrafo 2.2.3, permettono di aumentare la specificità della descrizione ma al tempo stesso rischiano di comprometterne l’interoperabilità. Per tale motivo è stato ritenuto fondamentale conformarsi per quanto possibile a standard e schemi di codifica, dichiarando esplicitamente i riferimenti adottati. È state altresì effettuata una crosswalk di verifica con Dublin Core dell’unico standard formalizzato utilizzato nei laboratori del Dipartimento INDACO: lo standard americano IPTC (cfr. paragrafo 6.2). Per quanto riguarda gli identificatori, è stato preso in considerazione il DOI (Digital Object Identifier), un identificatore persistente delle entità su cui insistono diritti di proprietà intellettuale, non solo (qualsiasi forma di) oggetti digitali, ma qualsiasi ‘IP entity’, inclusi i libri e le opere dell’ingegno. Nell’ecommerce dei contenuti, lo standard DOI riveste un ruolo simile di quello del codice a barra nel commercio di oggetti fisici: facilita l’interoperabilità tra i sistemi informativi delle parti, utilizzando schemi di metadati esistenti. Per tale motivo più complessa è la catena di valore e maggiore sarà l’importanza del DOI, che però non è un accorgimento tecnico di protezione del copyright, né una tecnologia di ricerca dei contenuti. Per quanto riguarda il Design Thesaurus e la Design Directory, si è ritenuto opportuno pianificare un sistema ampio e più comprensivo, flessibile e suscettibile di successive e periodiche implementazioni, piuttosto che un sistema di dimensioni ridotte, che potrebbe diventare rapidamente inadeguato con il progressivo incremento della base dati. Lo sviluppo di un buon thesaurus richiede uno sforzo intellettuale non indifferente, equivalente al relativo data entry manuale e all’elaborazione di liste di classi. Il data entry si prospetta certamente oneroso nella prima fase di inserimento e di raggiungimento di un nucleo consistente di voci (la creazione di termini normalizzati e di authority record implica rigoroso lavoro di controllo e compilazione), ma nel lungo periodo, se metodologicamente bene impostato e avviato, risulterà economica e vantaggiosa. Infine, va tenuto in considerazione che un thesaurus non è mai finito, a meno che esso non venga più utilizzato in un database o non venga più aggiornato: nuove scoperte, reinterpetazioni e nuovi ambiti disciplinari richiedono l’aggi-unta di nuovi termini, la loro modifica e occasionalmente la loro eliminazione. Se la manutenzione non viene effettuata in modo costante, il thesaurus potrebbe perciò velocemente diventare una faticosa incombenza invece di un vantaggio. Per poter continuare ad essere utile, esso richiede costante aggiornamento. 182 | 5.3 Implementazione del prototipo 5.3.1 Architettura di sistema e componenti Il cuore della struttura multilayer del DesignNet Metadata Management System (Fig. 2) è costituito dal DesignNet framework, basato su una piattaforma J2EE e su una struttura dati che segue il profilo di applicazione del Dublin Core Qualified Schema definito nel progetto DesignNet, implementato per l’utilizzo dell’HTML e in previsione dell’eXstensible Mark-up Language. Il framework prevede la possibilità di importare differenti schemi metadati (come UNIMARC, MPEG-7 o IPTC) da altri archivi, mappandoli con Dublin Core. Il sistema opera su una connessione remota ad un server o ad una applicazione stand-alone. I contenuti vengono raccolti, selezionati e rielaborati attraverso la creazione e la validazione dei metadati (Fig. 3). Il Design Thesaurus funziona come uno strumento di gestione dei termini e di recupero dei documenti: viene utilizzato sia da chi effettua l’indicizzazione – come vocabolario controllato – e la compilazione dei record di catalogo, sia dagli utenti nelle operazioni di navigazione e richiamo dei documenti. Un’applicazione per la catalogazione secondo lo schema Dublin Core fornisce un template per la creazione dei record, che vengono conservati nel repository di un RDMBS, da cui vengono richiamati attraverso il processo di recupero tramite una Graphic User Interface (GUI) con una visualizzazione non solo testuale ma anche visuale. La visualizzazione viene consentita dalla selezione a priori di standard correnti (PDF, TIFF, VRLM, MP3, Real, QuickTime), per assicurare la portabilità su piattaforme diverse. Il DesignNet Metadata Management System presenta dei componenti che risiedono sia sul lato server che sul lato client. Sul lato server, un Web server invia richieste di contenuti statici e dinamici al client. La visualizzazione e la query sono basate su una tipica architettura client/server basata su quattro componenti principali: 1. open relational database management system (RDBMS); 2. Web server; 3. Web browser; 4. linguaggio Web-oriented dal lato server e communication software per richiamare dinamicamente i contenuti. Complessivamente, sono state impiegate: tecnologie per potenziare il server al di là della capacità di restituire pagine HTML; un RDBMS con driver compatibile JDBC 2.0; un application server WebObjects™ compatibile e un Apache 1.3.9 Web server. Il processo client-server è il seguente: il cliente invia una richiesta di informazioni al server http, utilizzando un browser HTML. Il Web server elabora la richiesta e invia dei dati staticamente o dinamica- Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 183 mente alla client station. In base al tipo di richiesta e al tipo di dati ricevuti, possono essere distinte quattro fasi: 1. identificazione; 2. query; 3. visualizzazione e navigazione; 4. manipolazione. Le informazioni richieste, in forma di un documento HTML, vengono visualizzate in HTML alla client station. 5.3.2 Catalogazione con Dublin Core La prima operazione effettuata è stata quella di effettuare delle prove di catalogazione, in cui sono stati riportati gli elementi e i qualificatori di Dublin Core identificati. Il concetto chiave è che i metadati raramente rimangono fissi: piuttosto essi si evolvono e si perfezionano durante l’intera vita del progetto, per conformarsi agli standard emergenti, adattarsi ai nuovi ambienti tecnici e aggiungere ulteriori funzionalità. Lo schema di metadati, definito nella fase di progettazione del sistema, nella fase prototipale è stato verificato con i partecipanti al progetto e perfezionato in corso d’opera, attraverso varie prove di catalogazione. La catalogazione è per sua natura un lavoro intensivo e consiste di un numero di passi complessi, il primo dei quali è la descrizione del documento che si sta catalogando: un oggetto tangibile, un insieme di oggetti o di dati digitali in un oggetto tangibile localmente posseduto o una risorsa remota come un sito Web. Una volta descritto l’item, si assegnano punti d’accesso a nomi e a titoli uniformi, intestazioni di soggetto e numeri di classificazione in accordo con regole standard e schemi di classificazione. Dublin Core permette una compilazione dei record semplificata rispetto al MARC, ma ciò non toglie che il processo di catalogazione richieda comunque una riflessione. Ogni partecipante ha indicato la disponibilità di un referente, con il quale la sottoscritta ha tenuto incontri settimanali per: Designet.Interface Designet Framework Dublin Core VRA MPEG-7 Unimarc Archive [Fig. 2] Architettura di sistema del prototipo nel progetto DesignNet (M. Boghetich) 184 | - definire le caratteristiche della scheda di catalogo delle raccolte; collaborare alla creazione di un prototipo di thesaurus; inserire almeno qualche decina di record dei documenti analogici e degli oggetti presenti nella raccolta di ogni partecipante, e dei relativi documenti digitali. Design community playground comprehensive interfaces digital interfaces [Design net web site] Video Production Lab Environ. Requirements Lab Materials and design Lab Marketable Goods Knowledge Lab Digital Media Lab Photography Lab specialized interfaces fisical interface [Design net Resource Center] practices repository access textual and visual navigation Dublin Core Unimarc MPEG 7 VRA categories Links and Relations Repository [LRR] (integrated system of relations) Unimarc Dublin Core sharing MPEG 7 VRA categories ... samples of materials process insert products/components projects thesis textual documents 3d models videos design thesaurus pictures use come up detect [Fig. 3] Workflow dei processi nel prototipo del progetto DesignNet (P. Ciuccarelli) Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 185 Il data-entry si è servito della scheda di catalogo precedentemente definita e del prototipo di thesaurus creato. I dati immessi sono stati quindi importati dal gruppo DesignNet in un’applicazione informatica elaborata nell’ambito del progetto. Durante le prove, effettuate dai partecipanti sia insieme a chi scrive che singolarmente, è stata fornita una prima bozza di linee guida per la compilazione e la sintassi e, in generale, si è raccomandato di porsi le seguenti domande prima e al termine dell’operazione di catalogazione: - il record di per sé e il contenuto in ogni elemento del record è utile per la scoperta del documento? - il contenuto di un elemento è noto con certezza e velocemente da una base dati già esistente o da altre fonti informative? se così non è, si possono fornire informazioni che non saranno fuorvianti? - sono stati inseriti termini controllati adatti/sufficienti? - se si enfatizzano gli attributi di un oggetto fisico, sono state incluse queste informazioni negli elementi corretti? Sono state incluse informazioni significative sulla versione digitale e sulle ‘pre-condizioni d’uso’? Sono state inserite sufficienti informazioni per un’intera collezione o per un documento individuale? Sono stati compilati un centinaio di record, scegliendo appositamente i documenti più disparati e complessi per avere un campione rappresentativo delle collezioni e delle raccolte di documenti presenti nei vari laboratori. Al termine delle prove è stato possibile effettuare alcune modifiche nello schema Dublin Core (riportato in appendice nel paragrafo 6.2), che è stato quindi utilizzato nel prototipo informatico creato (descritto nel paragrafo precedente) e reso disponibile nella Intranet del Dipartimento INDACO. Il prototipo (Fig. 4) permetteva di: 1. inserire ed importare i dati; 2. editare e aggiornare i record; 3. creare nuovi record; 4. effettuare il browsing; 5. permettere un processo di verifica per controllare la qualità dei record da parte di un’unità di supervisione. Gli elementi e i qualificatori erano visualizzabili con un indice a menù, e nella finestra del record erano mostrati sia gli schemi di codifica che i termini del Design Thesaurus (Fig. 4). Con il progressivo aumentare dei record, sono state aggiunte ulteriori funzionalità ritenute utili, come ad esempio l’inserimento di help in linea e di completamento automatico delle parole. 186 | 5.3.3 Design Thesaurus In base ai passaggi delineati nella fase di progettazione del sistema (paragrafo 4.4), la creazione del prototipo del Design Thesaurus è stata organizzata come segue: Preparazione La definizione della struttura e la compilazione del thesaurus è stata effettuata da chi scrive, come parte delle attività operative dell’assegno di ricerca. Sono stati utilizzati sia l’approccio top-down che quello bottom-up. Dopo lo studio delle norme e degli standard di riferimento e l’analisi di progetti rilevanti di thesauri online, sono state effettuate proficue riunioni con i responsabili operativi dei laboratori afferenti al Dipartimento INDACO del Politecnico di Milano; in particolare del Laboratorio MAST e Materiali e Design, che hanno contribuito con liste di termini e schemi di classificazioni. Le informazioni ottenute dall’Indexer’s Discussion Group si sono rivelate altresì utili. Raccolta, selezione e analisi dei termini La selezione delle risorse per la raccolta dei termini, aggiornata periodicamente durante il data-entry, è stata effettuata in base ai seguenti criteri, che hanno costituito le linee guide anche nella successiva fase di implementazione della versione 1.0 dell’applicazione del Design Thesaurus: [Fig. 4] Screenshot del prototipo del Design Catalogue Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 187 1. risorse pre-ordinate (richiedono minori difficoltà e spesso offrono relazioni): - altri thesauri già esistenti, sia offline che online 23: in particolare l’Art&Architecture Thesaurus del Getty, i Thesauri della Library of Congress, NASA Thesaurus, GeoScience Thesaurus, Thesaurus Regionale Toscano; - liste di descrittori, schemi di classificazione come la Classificazione Decimale Dewey e i Library of Congress Subject Headings; - nomenclature delle singole discipline; - trattati terminologici dei vari campi; - enciclopedie, lessici, dizionari e glossari; - indici di monografie e studi di rilievo delle varie discipline; - indici o abstract dei periodici. 2. risorse aperte (più aggiornate alla terminologia corrente e più specifiche): - descrizioni di progetti o attività di indicizzazione; - discussioni con specialisti dei vari settori; - siti Web; - periodici di settore e materiali della letteratura grigia; - indagine presso gli utenti; - conoscenze personali. Ogni partecipante del progetto DesignNet, così come per le attività di catalogazione, ha indicato la disponibilità di un referente, con il quale chi scrive ha tenuto incontri settimanali per collaborare alla creazione del prototipo. Per quanto riguarda la scelta terminologica operata, oltre ai termini più noti sono stati privilegiati in modo particolare quei termini appartenenti a linguaggi specialistici e di settore. Sebbene nel corso di questa fase siano stati contestualmente raccolti molteplici nomi propri e nomi di luoghi pertinenti al design, in loro inserimento non sono è stata previsto nel Design Thesaurus, bensì nella Design Directory. Raggruppamento e sviluppo delle classi di concetti I termini raccolti sono stati riuniti e organizzati in ordine alfabetico, eliminando i termini identici. Sono stati quindi uniti i sinonimi o i termini nella stessa classe di concetti, definendo ampi campi e sottocampi di soggetto e ordinando i termini nell’ambito di questi campi. Parallelamente, si è provveduto a selezionare i termini preferiti e ad unire le informazioni per i termini della stessa classe di concetto. Questi passaggi sono stati ripetuti finché tutti i termini non sono stati sufficientemente consolidati e i termini preferiti identificati. 188 | Struttura di classificazione La creazione delle faccette, avvenuta parallelamente alla fase precedente, ha implicato l’identificazione di cluster indipendenti di termini nell’ambito del vocabolario, e ha richiesto fondamentalmente due passaggi: 1. creazione di una lista di termini organizzata in un insieme di cluster che presentano affinità semantica o concettuale, derivata dal raggruppamento e sviluppo delle classi di concetti della fase precedente. Questi cluster sono stati analizzati per identificare le faccette e le subfaccette, per quanto possibili indipendenti l’una dall’altra. Il nome di ogni faccetta, ad esempio MATERIALI, è stato considerato come Top Term, di modo che la faccetta costituisce l’organizzazione gerarchica dei termini ad essa subordinati; 2. il secondo passaggio è stato quello di allocare quanti più termini possibili derivanti dalla fase precedente nelle facette così identificate. Si tratta di un processo iterativo, nel quale alcuni termini all’inizio sembrano non rientrare in nessuna o al contrario molteplici faccette. Questi termini sono stati messi temporaneamente da parte finché non è stato validato l’insieme delle faccette: pur così difficili da assegnare, essi si sono spesso rivelati molto utili nel processo di validazione, aiutando a definire l’indirizzo delle faccette che li avrebbero dovuti accogliere. Questo processo, inoltre, è servito anche a validare i Top Term. Le faccette identificate per il prototipo del Design Thesaurus sono state le seguenti: - AGENTI - ATTIVITÀ - ATTRIBUTI - CONCETTI - DISCIPLINE - FORME DI COMUNICAZIONE - LUOGHI - MATERIALI - PROCESSI - PRODOTTI - STILI E PERIODI - TECNICHE E TECNOLOGIE. L’ampia portata di ciascuna faccetta e la facile interferenza concettuale tra alcune di esse (ad esempio tra Attività e Discipline) è stato oggetto di numerose riflessioni e revisioni, che nello sviluppo dell’applicativo si sono concretizzati in un più sintetico elenco. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 189 Collazione e verifica delle informazioni In questa fase è stata ulteriormente affinata l’identificazione dei termini preferiti e si è predisposta una griglia con i codici notazionali standard (TT, ALT, UF, BT, NT, RT, SN). A questi codici sono stati aggiunti l’ID del termine e il campo della Fonte. Nella griglia i termini preferiti sono stati organizzati in una struttura logica di termini generici e termini più specifici, identificando gruppi di sinonimi, distinguendo gli omografi e inserendo le note d’ambito. Una volta pronta l’applicativo prototipale del Design Thesaurus (Fig. 5), sono stati importati i dati creando un record per ogni termine preferito. Il prototipo per la gestione del Design Thesaurus presenta una struttura classificatoria di tipo monogerarchico, ovvero una struttura nella quale un termine appartiene ad una sola gerarchia (ha un solo BT), che supporta le tre relazioni semantiche tipiche dei thesauri: di equivalenza, gerarchiche e associative. La lingua scelta per il thesaurus è stato l’italiano, a partire dalla terminologia realmente utilizzata dalla comunità scientifica del Dipartimento INDACO. La decisione di sviluppare un software in-house per la gestione del Thesaurus nell’ambito del progetto DesignNet è stata presa dopo un attento benchmarking dei programmi disponibili commercialmente. Tra le varie soluzioni software per thesauri (comunque creati manualmente, non automatizzati), l’attenzione è stata rivolta in particolare a software per la gestione e l’accesso online per thesauri e la personalizzazione dell’interfaccia utente, come MultiTes, Synaptica, Lexico, TermTree e IC Index. Le caratteristiche e i limiti dell’indicizzazione automatica sono state già analizzate in dettaglio in questo volume (paragrafo 2.2.6). Basti ricordare che l’indicizzazione automatica tipicamente consiste nella semplice derivazione di parole chiave da un documento, e nel fornire accesso a tutti queste parole, mentre i sistemi più complessi di indicizzazione automatica tentano di selezionare dei vocabolari controllati di termini, basati sui termini del documento. La classificazione automatica tenta di raggruppare automaticamente documenti simili, utilizzando sia un metodo di clustering completamente automatico, che uno schema di classificazione definito e un insieme di documenti già indicizzati secondo quello schema. 5.3.4 Graphic User Interface (GUI) Nell’interfaccia grafica del prototipo del progetto DesignNet la rappresentazione visuale prescelta è stata inizialmente quella di un bersaglio (Fig. 6), evoluto poi in una mappa sferica (Figg. 7-8). Da un punto di vista semiotico, comunicare significa interagire in uno spazio condiviso, servendosi di una mappa che può rappresentare un territorio reale in modo realistico (una carta topografica) o in modo simbolico (il grafo delle linee del metro), un territorio irreale (la mappa dell’Inferno di Dante) o un insieme di dati di diversa natura (la distribuzione del reddito su un planisfero). 190 | Ogni mappa è una semplificazione, una rappresentazione per difetto, ma è utile proprio in quanto presenta una visione limitata di un insieme di fenomeni e visualizza in modalità bidimensionali gli insiemi di risultati, permettendo di identificare determinati pattern semplicemente variando dei parametri. Questi approcci sono ben noti dell’area dell’Information Visualization, e consentono all’utente di scoprire in modo interattivo delle relazioni tra uno spazio infomativo in genere non noto e la formulazione della query. La scelta di una visualizzazione 2D, nella fase prototipale, è dovuta a due ragioni: da un lato, in termini di tempo di risposta della query, il carico computazionale per la visualizzazione dovrebbe essere mantenuto al minimo; dall’altro, per permettere un riconoscimento istantaneo dei pattern una visualizzazione 2D risulta più semplice di una generalmente più complessa visualizzazione 3D, che può causare problemi aggiuntivi, ad es. in termini di visibilità, gestione e orientamento dei dispositivi di interazione 3D. Nella visualizzazione dei risultati, la relazione tra i documenti (ad esempio il loro grado di equivalenza semantica) può essere espresso in vari modi. Nei tradizionali sistemi di Information Retrieval, l’insieme dei risultati viene rappresentato in forma di liste ordinate, ponendo i documenti che più soddisfano i criteri di ricerca [Fig. 5] Screenshot del prototipo del Design Thesaurus Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 191 [Fig. 6] Primo studio per l’interfaccia visuale del prototipo [Fig. 7] Secondo studio per l’interfaccia visuale del prototipo 192 | all’inizio della lista. Sebbene tali rappresentazioni favoriscano l’identificazione dei documenti ritenuti più appropriati nell’insieme dei risultati della query, viene persa ogni informazione di dettaglio relativa alle relazioni con gli altri documenti o tra i documenti e la corrente formulazione della query. La GUI del prototipo DesignNet fornisce tre distinti strumenti con cui interagire: - un applicativo di query, in cui la query può essere formulata con termini derivanti dal Design Thesaurus e parole a testo libero; - un applicativo di visualizzazione grafica, in cui i risultati vengono interattivamente mostrati all’utente in base ai parametri di ricerca selezionati; - un applicativo di visualizzazione testuale, in cui i risultati vengono interattivamente mostrati all’utente in forma di elenco testuale tradizionale. Tutti gli strumenti sopracitati sono importanti per il compito di valutazione dell’insieme di risultati e per il perfezionamento della definizione della query per l’iterazione successiva. 5.3.5 Design Directory [Fig. 8] Visualizzazione dei record nel l’interfaccia del prototipo Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 193 Le aree di queste liste di autorità sono state definite e organizzate (Figg. 9-11) come segue: - persone; - organizzazioni; - prodotti astratti; - marchi. Le operazioni identificate per la creazione della Design Directory sono state le seguenti: - la proposta di forme di intestazione autorevoli e omogenee, derivanti da documentazione formalizzata; - la creazione di una rete di termini e varianti tra loro collegati per agevolare la ricerca; - la pubblicazione online di liste periodiche di aggiornamento, per seguire l’evoluzione del mondo del design, in costante evoluzione. [Fig. 9] Screenshot della versione 1.0 della Design Directory: lista delle organizzazioni 194 | A livello della compilazione dei record del catalogo, l’utilizzo della Design Directory richiederà per esempio di legare titolo alla relativa registrazione nelle liste d’autorità. 5.3.6 Risultati e problemi incontrati Nella fase di implementazione del prototipo si è giunti alla: 1. definizione di un’architettura di sistema e dei relativi componenti e requisiti del prototipo; 2. inizio del coordinamento con laboratori e archivi partecipanti al progetto e stesura di bozza di linee guida per la compilazione dei record; realizzazione di un prototipo per la compilazione dei record secondo lo schema Dublin Core Qualified definito; 3. realizzazione di un prototipo per la gestione del Design Thesaurus; 4. realizzazione di un’interfaccia nella fase di richiamo dei documenti; 5. assegnazione di un finanziamento ‘Progetto Giovani Ricercatori’ del Politecnico di Milano per una ‘Metodologia di archiviazione e accesso in un sistema conoscitivo per il design: metadati e thesaurus’; 6. disseminazione dei risultati ottenuti in ambito interdipartimentale, nazionale e internazionale 24. L’operatività di base ha certamente consentito una migliore comprensione di alcune problematiche e dinamiche inerenti i processi sottesi al sistema progettato. Per quanto riguarda il rapporto con i partecipanti al progetto, in particolare, si è riscontrato un generale livello partecipazione e di entusiasmo, nonostante il fatto che le comunità di interesse formate attorno al progetto DesignNet siano costituite da individui che non possiedono esperienze specifiche in ambito catalografico. La necessità di adottare dei criteri che permettessero la visibilità e l’utilizzo di giacimenti documentali altrimenti poco o del tutto non visibili è stato uno stimolo determinante. La denominazione di alcuni elementi (di cui si è riportata la traduzione effettuata dall’ICCU, riportata nel paragrafo 2.2.3) e qualificatori (tradotti da chi scrive) dello schema è risultata di non immediata comprensione: per tale motivo, se nei qualificatori si è cercato di individuare termini più intuitivi, per gli elementi è stata prevista l’adozione di etichette user-friendly nell’interfaccia utente, sull’esempio di quanto già avviene negli OPAC con record in formato MARC e, nell’ambito di Dublin Core, in progetti come DSpace del MIT. Per quanto riguarda l’importazione di altri schemi di metadati, le discrepanze rilevate (nonostante modelli di crosswalk forniti da fonti autorevoli come l’Istituto Centrale per il Catalogo Unico e il Getty Information Institute) hanno ulteriormente comprovato l’ipotesi che la mappatura non sia un’operazione meramente meccanica. Per risolvere almeno in parte il problema è stata Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 195 prevista l’implementazione di un modulo informatico che segnali all’operatore le discordanze nei dati importati. Parallelamente alle prove di catalogazione con i laboratori, lo schema di metadati è stato verificato anche in una ipotesi di progetto di catalogazione e fruizione delle tesi di laurea della Facoltà del Design e dei materiali derivanti dall’OpenLab, la mostra didattica annuale allestita con i lavori degli studenti del Corso di Laurea in Disegno Industriale. Per quanto riguarda il prototipo del Design Thesaurus, la cui compilazione è stata effettuata e verificata con i partecipanti al progetto, si è riscontrata l’esigenza di utilizzare dei codici di notazione standard 25per la terminologia. Le relazioni dei termini di un thesaurus possono anche essere mostrate graficamente, sebbene vi sia il rischio che il diagramma risultante sia così complesso da risultare incomprensibile all’occhio inesperto. In genere i thesauri sul Web tendono a ricopiare il layout delle loro controparti cartacee, spesso contengono minori informazioni rispetto alla versione stampata e, nonostante i link ipertestuali, non sembrano fruttare pienamente le potenzialità del digitale. [Fig. 10] Screenshot della versione 1.0 della Design Directory: record vuoto della sezione ‘Persone’ 196 | È stata inoltre recepita l’importanza di una corretta gestione del thesaurus, che cresce e si evolve nel tempo con nuovi ambiti disciplinari, concetti e termini, tenendo comunque presente che diventando sempre più grande e complesso, la consistenza d’indicizzazione diminuirà: chi gestisce il thesaurus si trova sempre a dover affrontare un trade-off tra il perfezionamento terminologico e la facilità di localizzazione dei termini. In merito all’interfaccia grafica del prototipo, nella maggior parte dei casi la progettazione di una nuova interfaccia per applicazioni multimediali come le biblioteche digitali è ancora abbastanza arbitraria e imprevedibile. Con l’implementazione del sistema sono state previste modifiche e in particolare si è rilevata la necessità di ulteriori approfondimenti ed esperimenti per sviluppare molteplici visualizzazioni che consentano di utilizzare in modo efficace il sistema sia ai content provider che agli utenti. 5.4 Implementazione della versione 1.0 delle applicazioni 5.4.1 Architettura di sistema e componenti L’architettura di sistema e i componenti per i vari applicativi sono in sostanza rimasti quelli indicati nel paragrafo 4.3.1. [Fig. 11] Screenshot della versione 1.0 della Design Directory: record compilato della sezione ‘Persone’ Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 197 5.4.2 Design Thesaurus Struttura di classificazione Nell’implementazione della versione 1.0 il Design Thesaurus è stato reso accessibile sul Web e non più soltanto nella Intranet di Ateneo, e sono state nuovamente analizzate le faccette scelte per il prototipo, apportando alcune modifich. La faccetta FORME DI COMUNICAZIONE è risultata ambigua e concettualmente appartenente alla categoria degli oggetti, mentre la faccetta PRODOTTI è stata ridenominata come OGGETTI. La scelta del termine ‘prodotti’ era dovuta allo specifico contesto del disegno industriale, ma per evitare confusione si è scelto un termine più neutro. Le faccette sono perciò state definite come segue: 1. AGENTI 2. ATTIVITÀ 3. ATTRIBUTI 4. CONCETTI 5. DISCIPLINE 6. LUOGHI 7. MATERIALI 8. OGGETTI 9. PROCESSI E TECNICHE 10. STILI E PERIODI Concretizzando un’ipotesi presa in considerazione con il prototipo, e in base a quanto deciso per la Design Directory, nella faccetta LUOGHI è stato previsto l’inserimento di nomi geografici e delle loro varianti in inglese. Nel Design Thesaurus è cioè possibile, attraverso l’etichetta di nodo ‘nomi geografici’, accedere ad un elenco di nomi organizzati gerarchicamente per continente, stato, regione, città e quartiere. Tale scelta, che in qualche modo viene a creare un ibrido tra termini relativi a concetti e termini relativi a cose storicamente esistenti, è stata dettata da esigenze funzionali, ma non è escluso che in futuro i nomi geografici vadano a formare un thesaurus a sé stante, sull’esempio di quello – sviluppato su tutt’altra scala – del Thesaurus of Geographic Names del Getty 26. Per quanto riguarda le diverse possibili organizzazioni di un thesaurus in forma gerarchica, in modo da fornire strumenti aggiuntivi per navigarne la struttura, è stata decisa l’adozione delle etichette di nodo (Fig. 12), per indicare la caratteristica di divisione utilizzata per la classe (rappresentata dal termine più generale) nelle singole specie (rappresentate dai termini specifici). Le etichette mostrano la base logica sulla quale la gerarchia è stata organizzata, mentre i termini BT/NT da entrambe le parti dell’etichetta si riferiscono a concetti del medesimo tipo. Un’altra possibile funzione di etichetta è quello 198 | di introdurre diversi tipi di concetti, assicurando che questi vengono collocati, per comodità degli utenti, sotto i concetti con i quali vengono solitamente associati. In questi casi, il termine apparentemente generale serve unicamente a collocare i concetti associati introdotti dall’etichetta di nodo, che non sono quindi dei termini generici e specifici bensì dei termini associati. Mentre le classificazioni dei termini sono relativi alla struttura gerarchica BT/NT, le etichette di nodo deviano dalla gerarchia rigida per sviluppare raggruppamenti aggiuntivi e funzionali di termini. Le classificazioni variano da categorie appiattite (ampie classi con un singolo livello di elencazione dei termini inclusi nella classe, come nell’ERIC Thesaurus), a strutture complete di notazioni, come nella struttura ad albero del Medical Subject Headings (MeSH). Le etichette di nodo sono comunemente utilizzate per organizzare rappresentazioni gerarchiche, ad esempio: occhiali <per uso> occhiali da sole occhiali da vista occhiali sportivi <per tipo di montatura> montature face-à-main montature pieghevoli montature semicerchiate montature senza cerchio Questo accorgimento è molto utile quando vi è un grande numero di NT sotto uno specifico BT: una tale rappresentazione rende più facile comprendere l’organizzazione dei termini e identificare i termini utili senza dover leggere un’unica lunga lista. Le etichette di nodo non sono di per sé utilizzate nell’indicizzazione, il loro scopo è puramente di tipo organizzativo. Alcuni thesauri organizzati gerarchicamente, come ICONCLASS e l’Art & Architecture Thesaurus (AAT), usano una rigida relazione tra classi inferiori e superiori in una singola gerarchia. I termini possono essere classificati in molteplici modi, ad esempio per forma, per utilizzo ecc. L’AAT affronta questo problema attraverso la qualificazione di alcuni termini: ad esempio, il concetto di paesaggio è rappresentato dai due termini ‘landscape (representations)’ e ‘landscape (environments)’. Sebbene questa soluzione possa presentare alcuni svantaggi ( la distinzione tra due termini qualificati potrebbe non essere chiara all’utente ed è difficile decidere dove dovrebbero essere localizzati le sottoclasse di concetti), la si è ritenuta sufficientemente funzionale e ne è stato perciò previsto l’uso nel Design Thesaurus. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 199 Le relazioni RT rappresentano una classe di relazioni non gerarchiche, la cui applicazione spesso non risulta chiara nella costruzione di un thesaurus (Fig. 13). Semplificando, si potrebbe dire che le relazioni RT rappresentano una generica connessione ‘vedi anche’ tra due concetti: questo potrebbe portare ad una espansione incontrollata dei risultati dei termini della query e ad una potenziale perdita nella precisione a fronte di un incremento del richiamo, come è stato evidenziato in alcuni studi empirici 27. Lo standard ISO 2788 identifica innanzitutto due tipi di termini che possono essere correlati da una relazione associativa: quelli che appartengono alla stessa categoria e quelli che collegano categorie diverse all’interno del thesaurus. Vi sono poi una serie di ulteriori e diverse sub-relazioni (ad esempio la relazione ‘funzionalmente correlato a’). Nel Design Thesaurus si è scelto di dare priorità di compilazione agli altri campi del record di un termine, e di sottoporre la segnalazione delle relazioni associative al Gruppo di Lavoro sulla Terminologia del Design [Fig. 12] Screenshot della versione 1.0 del Design Thesaurus: esempio di gerarchia con etichetta di nodo 200 | Collazione e verifica delle informazioni Durante la revisione del corpus di termini raccolti e già in parte strutturati, si verificano le cross reference e si effettuano test di indicizzazione: assegnando i descrittori ad un set campione di nuovi documenti, in un numero sufficiente da avere un’idea delle possibili lacune nel thesaurus, è possibile verificare il richiamo usando delle domande-campione per vedere con quale efficacia il thesaurus conduce al descrittore appropriato. In vista della prima fase di catalogazione collettiva e consultazione sperimentale del catalogo del progetto DesignNet, prevista durante l’anno accademico 20042005, è stata inoltre attivata una iniziativa volta a creare un accordo stabile tra la comunità scientifica e chi compila il Design Thesaurus: l’istituzione di un Gruppo di Lavoro sulla Terminologia del Design. Tale gruppo di lavoro utilizzerà questo vocabolario come strumento di mediazione e punto di comune accordo linguistico-semantico tra gli esperti e i professionisti in questo ambito, [Fig. 13] Screenshot della versione 1.0 del Design Thesaurus: record compilato di un termine Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 201 per consentire una standardizzazione sulla quale è possibile costruire un consenso terminologico. In tal modo sarà possibile rendere il Thesaurus uno strumento efficace e funzionale per gli utenti del sistema, oltre che di valorizzazione del lavoro e delle competenze della comunità interdipartimentale. Obiettivi generali del Gruppo di Lavoro, che verrà coordinato da chi scrive e si incontrerà periodicamente, saranno: 1. l’identificazione e selezione dei termini relativi ai vari ambiti disciplinari dei Laboratori (ad es. materiali, colore, merceologia, fotografia, storia del design, video, requisiti ambientali, computergrafica, progettazione per l’infanzia), che verranno inseriti da chi scrive; 2. l’identificazione delle relazioni e delle gerarchie dei termini relativi ai vari ambiti disciplinari; 3. la disseminazione del proprio lavoro in ambito di ateneo e con altri enti ed istituzioni dedicate alla terminologia. Nel Gruppo di Lavoro è prevista la distinzione in tre categorie di membri: - commissione scientifica; - gruppo operativo; - partner istituzionali. Disseminazione della bozza del thesaurus In previsione della prima fase di catalogazione collettiva e consultazione sperimentale del catalogo del progetto DesignNet, prevista durante l’anno accademico 2004-2005, sono state analizzate e definite le sue possibili forme di rappresentazione del Design Thesaurus. Vi sono molti modi di rappresentare un thesaurus in formato digitale e cartaceo: la vista bidimensionale presenta i termini del thesaurus in ordine alfabetico, con i relativi dettagli e solo un livello di termini BT e NT (come nell’Eric Thesaurus), mentre in una presentazione ‘piatta’ – che fornisce tutte le relazioni per ogni termini del thesaurus – un utente che comincia con un termine che non fa parte dei termini formali del thesaurus potrebbe avere delle difficoltà. Questo può succedere quando il termini di ricerca è una parola che nel thesaurus non è un termine d’entrata (cross reference). Tuttavia, una lista di termini ‘ruotata’ o ‘permutata’ mostra tutte le parole utilizzate nel thesaurus, permettendo quindi a chi cerca di usare qualsiasi parola, che sia un termine formale del thesaurus o un sinonimo. Ad esempio il Thesaurus of Engineering and Scientific Terms elenca ogni parola in un formato keywordout-of-context: i termini formali del thesaurus e i sinonimi in cui la parola appare sono indentati sotto la parola chiave. Una presentazione multilivello e ad albero mostra tutti i livelli delle relazioni gerarchiche, come nel caso del già citato Art and Architecture Thesaurus, in cui una struttura gerarchica con 202 | faccette è suddivisa inizialmente da etichette di nodo (comprese tra <>) che indicano il tipo di relazione gerarchica. Due fattori decisivi del grado di flessibilità di un thesaurus sono inoltre la lunghezza e il numero dei campi: più specifico è il vocabolario di un thesaurus e maggiore sarà la necessità di campi oltre 50 caratteri; le note descrittive dovrebbero essere di lunghezza illimitata. Uguale importanza riveste la consistenza dei meccanismi di controllo, per prevenire: - entrate multiple dello stesso termine (duplicati); - relazioni multiple tra due termini (sia dello stesso tipo che di tipo diverso); - relazione incomplete: relazione da un termine ad un altro senza la reciprocità; relazione tra soltanto un fattore e un termine combinato. [Fig. 14] Screenshot della versione 1.0 del Design Thesaurus: record vuoto di un termine i termini non confermati sono raggruppati in un elenco di termini candidati, che l’amministratore provvede a validare Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 203 Nella definizione dei requisiti della versione 1.0 dell’applicativo sono stati identificati i seguenti aspetti e funzionalità, in parte già implementati: - ouput dei dati: a schermo, tramite stampante o salvataggio su file; - aggiornamento automatico dei dati inseriti nella struttura del thesaurus; - interfaccia Web intuitiva; - possibilità di poligerarchia; - assegnazione di uno status agli utenti (amministratore, partecipanti e utenti normali) e ai termini, in un’ottica di lavoro collaborativo: termini candidati (rimangono separati finché non approvati), termini approvati. [Fig. 15] Screenshot della versione 1.0 del Design Thesaurus: gestione delle fonti 204 | - - Questo approccio rientrerebbe in una sorta di rituale generale di ‘canonizzazione del termine’, di cui si verifica l’efficacia prima di inserirlo nella struttura definitiva del vocabolario (Fig. 14); gestione delle fonti dei termini in una sezione apposita (Fig. 15); numero di termini illimitato; hyperlink tra tutti gli elementi; report online; applicazione integrato nel database con livelli di accesso diversificati e consultabile in modo indipendente; data di ingresso del termine e data dell’ultima modifica; possibilità di spostare termini e sotto-rami; display online dei termini in ordine gerarchico (relazioni di equivalenza, relazioni gerarchiche, relazioni associative – mostrando ogni termine nel suo contesto gerarchico sia superiore che inferiore), alfabetico, KWOC, microthesauri, a seconda della selezione dell’utente; rappresentazioni grafiche delle relazioni; ricerca semplice (descrittori o parole chiave) o complessa (con filtri multipli); [Fig. 16] Screenshot della versione 1.0 del Design Catalogue: elenco dei record con anteprima Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 205 - pop-up con i dettagli dei termini; cluster concettuale di termini multipli. 5.4.3 Catalogazione con Dublin Core Un requisito previsto per l’applicativo di catalogazione, come già scritto, è che i campi della descrizione possono essere collegati al Design Thesaurus (Figg. 16-17). Si è previsto anche, in particolare per i documenti bibliografici e in vista delle connessioni con basi dati di questo tipo, la possibilità di riportare l’equivalente Classificazione Decimale Dewey. La compilazione dei record del catalogo dei siti Web è stato oggetto di alcune riflessioni. ‘Includere nel catalogo’ significa infatti ‘fornire accesso attraverso il catalogo’, sia che si tratti di record e documenti conservati fisicamente sull’hard disk del sistema che di siti Web. In quest’ultimo caso, ci si è interrogati su cosa rappresenti una unità (un sito Web per intero o una pagina Web?), se distinguere o meno tra documenti commerciali e non, come gestire documenti dinamici per sé e l’instabilità dei documenti presenti all’interno di un sito (disponibili per periodi limitati e poi rimossi), l’eventuale download e conservazione in locale delle informazioni ritenute utili, come eseguire l’indicizzazione di siti il cui contenuto specifico è soggetto a cambiamenti periodici. 5.4.4 Primi risultati e problemi Nella fase di implementazione della versione 1.0 delle applicazioni si è giunti ai seguenti risultati: 1. revisione dell’applicazione prototipale per la compilazione dei record secondo lo schema Dublin Core Qualified definito per il progetto DesignNet; 2. revisione dell’applicazione prototipale per la gestione del Design Thesaurus e realizzazione della versione 1.0; 3. approfondimento delle modalità di applicazione dello standard per interoperabilità OAI-PMH (che utilizza Dublin Core e XML) (cfr. paragrafo 6.4); 4. applicazione delle metodologie definite e dei software nella start-up di un Design Knowledge Centre (cfr. paragrafo successivo); 5. disseminazione dei risultati in ambito interdipartimentale e nazionale 28 e contatti con istituzioni rilevanti nel settore della documentazione, tra cui l’Istituto Centrale per il Catalogo e la Documentazione. Per quanto riguarda difficoltà incontrate nella catalogazione, si è verificato come i documenti audiovisuali e gli artefatti del design (prodotti, semilavorati) richiedano di norma tempi maggiori rispetto ai documenti bibliografici: si tratta spesso di prodotti corale, che presentano una pluralità di responsabilità. Negli standard catalografici tradizionali viene effettuata una distinzione tra ‘fonti interne’ ritenute 206 | più affidabili e stabili, nel caso di un documento audiovisuale raggiungibili mediante il dispositivo che ne consente la lettura, e ‘altre fonti’, leggibili a occhio nudo, come le etichette stampate sul supporto, il contenitore e la documentazione allegata, che presentano una minore curabilità e attendibilità dovuta spesso a motivi commerciali (basti pensare alle numerose versioni del packaging). Se l’assenza di fonti sicuri da cui derivare i record catalografici potrebbe costituire una remora al decollo di collezioni di questo tipo. Ai partecipanti al progetto DesignNet è stato suggerito di ricorrere principalmente alle fonti interne, riportando comunque gli altri dati a vantaggio di una maggiore ricchezza del record. Testando le modalità di recupero dei documenti nelle applicazioni prototipali e nelle versioni 1.0, si è riflettuto sull’efficacia dell’utilizzo di parole chiave provenienti dal Design Thesaurus e sull’eventualità di adottare anche fonti intermedie alternative di suggerimento dei termini per incrementare il richiamo di documenti testuali 29, nello specifico liste di co-occorenza dei termini generate automaticamente dal computer. Tali liste permetterebbero di poten- [Fig. 17] Screenshot della versione 1.0 del Design Catalogue: record di un documento Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 207 ziare l’efficacia del Design Thesaurus – che non copre tutti gli ambiti dello scibile umano o tutti i possibili sinonimi –, consentendo ad un utente non esperto di un determinato ambito di poter rintracciare i documenti servendosi sia dei termini del vocabolario utilizzati nell’indicizzazione dei documenti che dei termini suggeriti dalle liste di co-occorenza, e ad un utente esperto di recuperare documenti servendosi di termini leggermente diversi da quelli usati nell’indicizzazione, al di là dell’aiuto offerto dalle tecniche di stemming. In ogni caso, il Design Thesaurus rimane lo strumento principale e privilegiato di accesso e recupero, offrendo termini organizzati nell’ambito una precisa mappa mentale e riflettendo la semantica dei documenti ad un livello più generale e con una maggiore precisione concettuale, laddove le liste di cooccorrenza rifletterebbero dettagli più minuti ma spesso non accurati né sistematizzati, in quanto semplici risultati di calcoli statistici sulla compresenza di alcuni termini in specifici documenti. 5.5 Start-up di un Design Knowledge Centre Condividendo molti degli obiettivi e delle attività dei Learning Resource Centre (paragrafo 1.2.3) e centri di documentazione (paragrafo 4.4.7), il [Fig. 18] Interno della POLI.teca (Labfoto, Dipartimento INDACO, Politecnico di Milano) 208 | gruppo di progetto DesignNet e i laboratori partecipanti hanno dato vita ad struttura ispirata al modello di un design knowledge centre, ovvero un combinazione tra un centro di documentazione specificatamente pensato per il design e un design centre che intende essere complementare, per tipologia di documenti e servizi offerti, alle biblioteche già presenti nel Politecnico di Milano. Questa struttura, avviata nel giugno 2003 nell’edificio AR del Campus Bovisa, dopo una fase di start-up e sperimentazione, è oggi pienamente operativa con il nome di ‘POLI.teca’ (Figg.18-19), aperta a studenti, docenti e ricercatori di Ateneo con l’obiettivo di: - dare accesso a documenti analogici e digitali sul design, sia generali che di settore e utili alle diverse fasi del processo progettuale, ponendosi come interfaccia fisico del Design Gateway; - sperimentare strumenti innovativi per la condivisione e la manipolazione delle risorse documentali e lo sviluppo di conoscenza progettuale (la catalogazione e la restituzione online avverrà in base alle metodologie e agli strumenti sviluppati nell’ambito del progetto DesignNet); - ospitare occasioni di formazione e incontro che utilizzino i bacini documentali della POLI.teca. La struttura si pone perciò come un luogo d’incontro e d’integrazione dei laboratori, con obiettivi e compiti comuni: acquisizione di nuova documentazione, gestione, catalogazione e accesso dei documenti a supporto delle attività di didattica e di ricerca del design, applicando le metodologie definite nel progetto DesignNet con il coordinamento di chi scrive. Nella POLI.teca si integrano varie strutture interateneo, i cui patrimoni sono accessibili tramite uno sportello unico: 1. Laboratorio di Merceologia e Analisi Settoriale e Territoriale (MAST), laboratorio strumentale per l’acquisizione di informazioni e conoscenze funzionali al progetto di design (Dipartimento INDACO, Politecnico di Milano); 2. Laboratorio Materiali e Design, finalizzato al supporto dell’attività didattica nell’area dei materiali per il disegno industriale (Dipartimento di Chimica, Materiali e Ingegneria Chimica ‘Giulio Natta’, Politecnico di Milano); 3. Laboratorio Sistemi e componenti per l’edilizia, che raccoglie, elabora e offre informazioni su prodotti per l’edilizia (Dipartimento INDACO, Politecnico di Milano); 4. Laboratorio dei Requisiti Ambientali dei Prodotti Industriali (RAPI.labo); 5. IntEL (International Education Library), struttura promossa Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 209 dall’Ufficio Relazioni e progetti internazionali del Dipartimento INDACO e dal Centro Relazioni Internazionali di Ateneo come interfaccia e luogo di documentazione per gli studenti del programma Socrates; 6. DIScens (Centro Documentazione della Produzione Didattica Scientifica del Design), contenente le tesi e gli elaborati di laurea della Facoltà del Design e la produzione scientifica degli afferenti al Dipartimento INDACO; 7. Laboratorio MODA.contents ? Tremelloni, contenente il patrimonio documentale dell’Associazione Biblioteca Tremelloni del Tessile e della Moda (Dipartimento INDACO, Politecnico di Milano). E’ in via di attivazione una sezione (Media Centre) per l’osservazione dalla programmazione di emittenti satellitari, terrestri e via cavo e l’individuazione di contenuti audiovisivi d’interesse per i progettisti. I contenuti verranno inseriti nel catalogo attraverso DesignNet, integrati quindi con il resto del patrimonio documentale, e resi disponibili all’utenza interna per scopi didattici. I responsabili operativi delle strutture afferenti alla POLI.teca sono presenti in sede per fornire assistenza agli utenti nella consultazione dei patrimoni documentali. Per quanto riguarda il progetto degli spazi della sede che ospita la POLI.teca, [Fig. 19] Interno della POLI.teca: consultazione di documentazione di settore e campioni di materiali 210 | è stato previsto un ampliamento dello spazio disponibile, coerentemente con l’aumentare del numero e della capacità dei servizi offerti, attraverso l’utilizzo dei diversi piani dell’edificio: tali locali saranno dotato di spazi e strumentazioni adeguate a consentire sia le attività che richiedono il contatto diretto o telefonico con il pubblico (front-office), sia il contemporaneo svolgimento dei compiti e delle funzioni di supporto alla attività di documentazione e formazione, nonché alla progettazione ed alla realizzazione di iniziative di ricerca, monitoraggio, innovazione organizzativa e sviluppo telematico dei propri patrimoni documentali (back-office) e di iniziative culturali inerenti tematiche progettuali. Per quanto riguarda le risorse finanziarie, attualmente la POLI.teca si avvale di una parte dei fondi per la didattica dei laboratori e delle attività didattiche dei dipartimenti che si appoggiano ai laboratori integrati nella POLI.teca. Il patrimonio attuale e i servizi offerti sono riportati nelle tabelle 3-4. Dati i risultati già ottenuti con la struttura attualmente operativa, la formalizzazione istituzionale della POLI.teca non potrà che aumentare quantitativamente e qualitativamente il supporto già fornito alle attività didattiche e di ricerca delle diverse Facoltà dell’Ateneo, e accelerare quei processi di integrazione nella rete delle biblioteche, dei centri di documentazione e degli archivi del Politecnico di Milano. 5.5.1 Processi Per favorire l’operatività di base nella fase pilota del progetto e nella successiva messa a regime del sistema, sono stati segmentati e analizzati i processi rilevati, per ottimizzare più agevolmente le procedure. In un sistema di catalogazione ideale (in ambiente digitale e non), i record dovrebbero essere gestiti in modo tale che essi siano: 1. completi (nessuna delle parti di informazioni su un documento deve andare perduta, e che i documenti più importanti devono essere conservati) e recuperabili; 2. autentici e accessibili (significa che i record trovati o recuperati possono essere consultati velocemente da quelli che ne hanno bisogno e che hanno l’autoriz-zazione); 3. affidabili (i record possono essere localizzati) e utilizzabili (i record possono essere realmente letti). - ingresso o localizzazione dei documenti di interesse; - acquisizione: include scegliere se anche il documento verrà acquisito o meno insieme al record. Alla cattura si effettua l’inventariazione, cioè identificazione univoca di ciascun oggetto d’interesse e vengono acquisite le informazioni contestuali e i metadati preesistenti; Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 211 - - storage dei documenti, su un supporto informatico adatto. Il documento deve essere conservato in modo tale che il master file non si più alterabile. Un immagazzinamento affidabile è il prerequisito per il mantenimento del catalogo in un modo autentico e affidabile. La registrazione da sola non è sufficiente nell’ambiente digitale, poiché i documenti possono essere facilmente alterati; disposizione: creazione di file o definizione delle relazioni tra i documenti. In un sistema di catalogazione digitale, la disposizione e la descrizione sono correlate; Documentazione grigia Materiali informativi sulla produzione industriale: - circa 4000 cataloghi aziendali suddivisi in diversi settori merceologici relativi a produzioni industriali e architettoniche; - circa 1400 tra listini e depliant di aziende significative per la fornitura di materiali, la realizzazione di tecnologie di lavorazione e finitura, la produzione di oggetti, componenti e semilavorati; documentazione analogica e digitale di vario tipo - documentazione specializzata sui settori/comparti merceologici: aziende principali e marchi selezionati; quadri macroeconomici e tendenze Normative per il progetto: Raccolta di CD-ROM UNI aggiornati al 2001 - ISO 9000 e Vision 2000, 626 Sicurezza sul lavoro, UNIEDIL impianti, UNIEDIL strutture, rassegna di normative sulla grafica Archivio di campioni di materiali Oltre 600 campioni di materiali tradizionali ed innovativi corredati da documentazione tecnica per evidenziare specifiche caratteristiche e proprietà (tecnologie di lavorazione, finiture, proprietà fisico-meccaniche, proprietà estetico-funzionali) Collezione di prodotti finiti, semilavorati e componenti Oltre 700 tra prodotti finiti, semilavorati e componenti, a volte illustrati con prospetti, scomposti nei loro componenti e descritti nel ciclo tecnologico di produzione Emeroteca Oltre 100 testate di periodici di settore e specializzati Mediateca Circa 60 VHS, 50 CD-ROM, 15 DVD, centinaia di file audiovisuali e testuali, collezioni di immagini Fototeca Banca dati che documenterà i prodotti di design dal XVIII al XX secolo (in via di costituzione attraverso il laboratorio iconologico) Biblioteca Circa 200 monografie e materiali bibliografici inerenti la cultura progettuale e settoriale, tecnologie, innovazione, ecc. Elaborati didattici, tesi ed elaborati di laurea - dossier di ricerca settoriale elaborati da studenti, relativi a processi produttivi o dossier di indagine settoriale; circa 600 schede tecniche; - oltre 1000 tesi ed elaborati di laurea del corso di laurea in Disegno Industriale [Tab.3] Patrimonio documentale della POLI.teca al maggio 2004 212 | - - - - - descrizione essenziale: informazioni contestuali e metadati. I metadati giocano un ruolo primario, ma non esclusivo, nei sistemi automatizzati. Quando queste informazioni vengono prese allo stesso momento della cattura, descrizioni di base (ad esempio informazioni tecniche su file d’immagine) possono essere acquisite automaticamente. Tuttavia anche in un ambiente digitale la descrizione a livello della serie e ad altri livelli superiori dovrà essere effettuata manualmente; valutazione: determinazione di come i documenti dovrebbero essere conservati dal sistema. La valutazione è un processo continuativo. Infatti esso comincia già con il processo di cattura, quando si decide se un documento debba essere inserito o meno nel catalogo. L’immagazzinamento e la conservazione digitale sono costose e i soldi potrebbero essere invece impiegati per migliorare sistema; conservazione: molto più dinamica nell’ambiente digitale che in quello analogico. L’operazione di migrazione dei record da un ambiente software all’altro è complessa e oggi comporta comunque la perdita di alcuni attributi. Bisogna quindi determinare quale grado di perdita sia accettabile; accesso e delivery dei documenti: grazie al processo di conservazione i documenti rimangono leggibili e comprensibili, grazie al processo di ordinamento e di descrizione possono essere recuperati e compresi nel loro contesto, grazie alla selezione e alla disposizione i documenti non rilevanti non vengono inseriti nel catalogo; integrazione di più applicativi e servizi indipendenti; reference, cioè selezione delle opere d’interesse anche grazie a segnalazioni, valutazioni di esperti, graduatorie ed indicatori formali di rilevanza. 5.5.2 Risultati e problemi incontrati In questa fase di start-up si sono ottenuti i seguenti risultati: 1. avviamento della struttura della POLI.teca e definizione del regolamento e delle modalità di consultazione; 2. avviamento dei processi di catalogazione, indicizzazione e classificazione collettiva, tramite il coordinamento dei partecipanti al progetto DesignNet in prove di catalogazione, verifiche in itinere, selezione di termini di indicizzazione e definizione degli schemi di classificazione in base alle specificità di ognuno dei laboratori (cfr. paragrafo 6.6); 3. disseminazione in ambito interdipartimentale. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 213 Nella progettazione di questa struttura, come spesso capita in Italia (non solo per le biblioteche ma anche per i musei), è stata palese la contraddizione tra l’esigenza di elaborare un piano di fattibilità che tenesse conto delle finalità della POLI.teca, e i condizionamenti dovuti al fatto che essa abbia trovato sede in un edificio preesistente con altre destinazioni d’uso. Per quanto riguarda le attività di catalogazione e di gestione della struttura, con la release delle applicazioni 1.0 del Design Thesaurus, del Design Catalogue e delle Design Directory, è cominciato l’utilizzo operativo degli applicativi da parte dei partecipanti al progetto. Consultazione in sede Oltre ad una sala di consultazione con circa 30 posti, come supporto alla consultazione e all’acquisizione di informazioni la POLI.teca offre: - 8 postazioni informatizzate (PC) con accesso Internet - 1 postazione (PC) per la consultazione di materiale digitale (CD/DVD) e acquisizione immagini - 1 postazione (MAC) per l’acquisizione immagini - 1 fotocopiatrice self-service La prenotazione delle postazioni è prenotabile per e-mail. È possibile salvare su un supporto magnetico i propri lavori. Reference avanzato e Current Contents Reference in sede, per telefono e per e-mail; Current Contents per e-mail Document Delivery Nei limiti permessi dalla legge sul copyright, la POLI.teca invia i propri materiali, anche in formato digitale, alle strutture dipartimentali afferenti, per le attività di ricerca e didattica Sito Web e newsletter Segnalazione delle nuove acquisizioni, di siti web, di convegni, corsi, seminari, ecc. Prestito e fotocopie È consentito il prestito giornaliero dei materiali bibliografici. È permessa la riproduzione di alcuni documenti nei limiti permessi dalla legge sul copyright. Acquisizione documenti La POLI.teca si dedica attivamente all’incremento e all’aggiornamento della propria documentazione. È possibile avanzare richieste di desiderata per e-mail. [Tab.4] Servizi della POLI.teca 214 | «Performance Measures and Metrics», vol. 3, n. 1, 2002, pp. 5-9. Note [1] Il progetto POLI.teca è descritto in P. Ciuccarelli, P. Innocenti, F. Vidari, POLI.teca: a Design Knowledge Center at Politecnico di Milano. Case Study of a DesignNet pilot project, in Collina, L. e Simonelli, G., Designing Designers: Design Schools as Factories of Knowledge, atti del convegno internazionale Designing Designers, Milano 2003. [4] Nello specifico, i newsgroup della Dublin Core Metadata Initiative, dell’Open Archive Initiative, dello European Library Automation Group, Indexer’s discussione Group. [5] Distinguibili dai semplici Subject Gateway che offrono descrizioni succinte ed una organizzazione per soggetto poco strutturata. [2] [6] Cfr. Misurazione e valutazione delle biblioteche universitarie. Rapporto preliminare del gruppo di ricerca, MURST, gennaio 1999 <http://www.murst.it/osservatorio/rdr0199.rtf> T.D. Wilson, Human Information Behavior. Informing Science, 2000 <http://citeseer.nj.nec.com/cache/papers/cs/1 9561/http:zSzzSzinform.nuzSzArticleszSzVol 3zSzv3n2p49-56.pdf/wilson00human.pdf> [7] [3] In particolare M. Summerfield, C. Mandel, P. Kantor, The online books evalutation projects. Columbia University, Final report, December 1999, <http://www.columbia.edu/cu/libraries/d igital/olbdocs/finalreport.pdf>; A. Galluzzi, Strumenti di valutazione per i servizi digitali. Quali strategie in un contesto ibrido?, in «Biblioteche oggi», dicembre 2001, pp. 6-14; D. Greenstein, D. Troll, Usage, Usability and User Support. Report of a discussion group convened at the DLF Forum on 2 April 2000, Version 1.1, Digital Library Federation, 26 May 2000 <http://www.diglib.org/use/useframe.ht m>; P. Dixon, A. Pickard, H. Robson, Developing a criteria-based quality framework for measuring value, in Ciuccarelli, Innocenti | G.C. Bowker, S. Leigh Star, Sorting things out: classification and its consequences, MIT Press, Cambridge (Mass.), 1999, p. 287. [8] C. Lagoze, Keeping Dublin Core simple, in «D-Lib Magazine», January 2001 <http://www.dlib.org/dlib/january01/lagoze/01lagoze.html> [9] <http://www.getty.edu/gri/standard//intrometadata/3_crosswalks/index.htm>, <http://mapageweb.umontreal.ca/turner/m eta/english/metamap.html> <http://www.loc.gov/marc/marc2dc.html>, <http://www2.sub.uni-goettingen.de/metaform/crosswalks.html>, <http://www.schemas-forum.org/registry/registry.html>. Cfr. in particolare le crosswalk Dublin Core USMARC/GILS Sistemi conoscitivi per il design: una proposta metodologica | 215 <http://lcweb.loc.gov/marc/dccross.html>; Dublin Core - EAD/GILS/USMARC <http://www.oclc.org:5046/~emiller/DC/cr osswalk.html>; Dublin Core – UNIMARC <http://www.ukoln.ac.uk/metadata/interoperability/dc_unimarc.html>; MARC Dublin Core <http://www.loc.gov/marc/marc2dc.html> ze internazionali: atti del convegno internazionale, Firenze, 10-12 febbraio 2003, a cura di M. Guerrini, B.B. Tillett, con la collaborazione di L.Sardo, 2003 <http://www.unifi.it/universita/biblioteche/ac/relazioni/guerrini_ita.pdf> [ 16 ] Cfr. il documento dell’Open Society Institute, A guide to Institutional Repository Software, October 2003 <http://www.soros.org/openaccess/pdf/OS I_Guide_to_Institutional_Repository_Soft ware_v1.pdf> Nel progetto DesignNet queste tematiche sono state specificatamente affrontate da Mida Boghetich (architettura di sistema e componenti) e da Paolo Ciuccarelli e Federico Vidari (interfaccia): per tale motivo, in questo volume esse vengono solo sinteticamente descritte, allo scopo di fornire il quadro complessivo dell’intero progetto e di spiegare le conseguenze di tali soluzioni a livello delle attività di catalogazione, indicizzazione e restituzione dei documenti. [ 12 ] [ 17 ] <http://www.soros.org/openaccess/> Cfr. D.G. Dorner, A.M. Curtis, A comparative review of common user interface products, in «Library Hi Tech», vol. 22, n.2, 2004, pp.182-197. [ 10 ] <http://www.schemasforum.org/registry/desire/index.php3> [ 11 ] [ 13 ] Come ad esempio le già citate Engineering Information (Ei) Classification Codes per le scienze e l’ingegneria, e la Mathematics Subject Classification (MSC) per la matematica. [ 14 ] Cfr. le traduzioni della norma internationale ISO 5964. Prima edizione: 15-II1985. Traduzione in italiano con integrazione dell’apparato esemplificativo ed indice trilingue dei termini tecnici. Tr. M. Trigaré, Florence: Biblioteca di documentazione pedagogica, 1990. [ 15 ] M. Guerrini, Introduzione al convegno, in Authority Control: definizioni ed esperien- 216 | [ 18 ] <http://www.allegro-c.de>. Allegro C non conserva i metadati e presenta un’interfaccia in inglese e una documentazione tecnica ancora per la maggior parte in tedesco. [ 19 ] Cfr. E. R. Tufte, Envisioning information, Graphic press, Cheshire, 1990. [ 20 ] M. Schneider, Visual Retrieval in Learning Environments, in «CG topics», Special Edition, 2000, pp. 48-50 <http://www.inigraphics.net/press/topics/2000/SA_2000/S A00_a02.pdf>; S.K Card, G.G. Robertson, J.D Mackinlay,.The information visualizer: An information workspace, in Proceeding of ACM CHI `91 Conference on Human Factors in Computing Systems, New Orleans, Louisiana, 1991, Addison-Wesley, Reading (MA) 1999, pp. 181-188; R. Christ, Review and analysis of color-coding research for visual displays, in «Human Factors», n. 17, 1975. pp. 542-570; M. Hearst, User interfaces and visualization, in Modern Information Retrieval, R. Baeza-Yates, B. Ribeiro-Neto (eds.), Addison-Wesley, Reading (MA) 1999, pp. 257-325. [ 21 ] V. Arquilla, Design Center: esempi di gestione di Design Knowledge all’estero, in DesignNet. Knowledge e Information Management per il design, atti del seminario internazionale, a cura di P. Ciuccarelli e P. Innocenti, prefazione di G. Simonelli, Edizioni Poli.design, Milano 2002, pp. 149-169. [ 22 ] Documentazione e biblioteconomia : manuale per i servizi di informazione e le biblioteche speciali italiane, a cura di M.P. Carosella e M. Valenti, 8° ed., Franco Angeli, Milano 1997; K. Kreizman, Establishing an information center: a practical guide, Bowker-Saur, London 1999; J. Treffel, Les centres de documentation et les nouvelles technologies de l’information: guide d’implantation et d’extension des centres de ressources documentaires multimédias, La documentation française, Paris 1994; F. Diozzi, Documentazione, Associazione Italiana Biblioteche, Roma 1998; La documentazione in Italia: scritti in occasione del centenario della FID, a cura di A.M. Paci, Franco Angeli, Milano 1996. Ciuccarelli, Innocenti | [ 23 ] Elenchi di thesauri consultati in rete: Web Thesaurus Compendium <http://www.darmstadt.gmd.de/~lutes/the salpha.html>; Controlled vocabularies, thesauri and classification systems available in the WWW. DC Subject, compiled by Traugott Koch <http://www.lub.lu.se/metadata/subjecthelp.html>; Controlled Vocabulary Resource Guide della University of Queensland, <http://sky.fit.qut.edu.au/~middletm/cont _voc.html>; Internation Terminology Initiatives <http://www.mda.org.uk/internat.htm> [ 24 ] Vsmm2002. Creative Digital Culture. 8th International Conference on Virtual Systems and Multimedia, Corea, 25- 27 Settembre 200; DC-2002. Metadata for eCommunities. Supporting Diversity and Convergence, 2nd International Conference on Dublin Core and Metadata Applications, Firenze, 16-18 ottobre 2002; Convegno di AIDA a Bibliocom 2002, Roma Palazzo dei Congressi, ottobre 2002. [ 25 ] Cfr. paragrafo 6.5. [ 26 ] Consultabile online a <http://www.getty.edu/research/conducting_research/vocabularies/tgn/> [ 27 ] Cfr. Quelli riportati in D. Tudhope, H. Alani, C. Jones, Augmenting Thesaurus Relationships: Possibilities for Retrieval, in «Journal of Digital information», vol. 1, n. 8. Sistemi conoscitivi per il design: una proposta metodologica | 217 [ 28 ] P. Innocenti, Sistematizzare la documentazione di progetto. Una metodologia per un Quality-controlled Subject Gateway per il design, in Un accesso migliore è possibile...verso l’integrazione delle risorse informative per l’architettura e l’urbanistica. Atti delle VIII Giornate di Studio del CNBA, 28-31 maggio 2003. IUAV, Atti delle VIII giornate di Studio del CNBA, a cura di L. Casagrande, P. Piccotti e S. Sangiorgi, Casalini, Venezia 2005, pp. 5768 ; P. Bertola, L. Collina, P. Ciuccarelli, P. Innocenti, Design networks and knowledge management for supporting small and medium enterprises. Cases from Italy, in Techné: design wisdom. Proceedings of the 5th European Academy of Design 218 | Conference, Barcelona, 28-30 April 2003 <www.ub.es/5ead/PDF/13/Bertola.pdf>. M. Gaiani, P. Innocenti, Stato dell’arte, inquadramento metodologico e benefici; P. Innocenti, Catalogazione dei materiali; P. Innocenti, Bibliografia e documenti online, in Una metodologia per l’acquisizione e la restituzione dei giacimenti documentali dell’architettura. I materiali per lo studio di Andrea Palladio, a cura di G. Beltramini e M. Gaiani, Edizioni POLI.design, Milano 2003. [ 29 ] Come nel caso dell’interfaccia della versione prototipale della University of Illinois Digital Library Initiative (DLI). 6 Conclusioni e prospettive Paolo Ciuccarelli, Perla Innocenti Gli obiettivi che sono stati affrontati attraverso il progetto DesignNet si possono riassumere in: - obiettivi di servizio: a supporto delle attività di didattica della Facoltà del Design del Politecnico di Milano; - obiettivi di ricerca inerenti nuove metodologie di gestione, restituzione e manipolazione dei documenti coerenti con le attività e i processi stessi del design, fornendo un accesso unico integrato ad essi; - obiettivi di standardizzazione dei metodi e degli strumenti adottati; - obiettivi tecnologici di sviluppo in-house di applicazioni informatiche. I risultati ottenuti finora sono sostanzialmente positivi e ricchi di prospettive per il futuro: la generazione di record secondo lo schema di metadati Dublin Core e la creazione del Design Thesaurus permette non soltanto la progressiva sistematizzazione dei giacimenti documentali in oggetto e quindi la loro visibilità ed utilizzo, ma fornisce un’espressione tangibile delle potenzialità della catalogazione collaborativa in questo ambito e delle competenze presenti in ambito interdipartimentale. Inoltre consente la produzione di output multipli (per un utilizzo in ambito didattico, di ricerca, editoriale, di mostre e di comunicazione…), a partire da una base dati organizzata e resa disponibile in Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 219 digitale. Si è inoltre registrato l’interesse, da parte di varie organizzazioni pubbliche e private, della possibilità di applicazione e di utilizzo delle metodologie e dei software di DesignNet. Le conclusioni, in un progetto come questo, ad uno stadio ancora di sperimentazione, non possono che essere provvisorie e non definitive. Più interessanti forse sono le prospettive, che sono comunque fondate giocoforza sulle prime certezze che il programma di ricerca ha fatto emergere. Alcune prospettive sono di breve periodo, e coincidono con gli obiettivi di sviluppo del sistema che ci siamo già posti, come la possibilità di raccogliere l’esperienza dell’utente, i suoi percorsi all’interno degli archivi e dei documenti, per integrarla al patrimonio esistente. Il modo in cui gli utenti mettono in relazione e utilizzano i documenti può costituire in sostanza un ulteriore livello di conoscenza, da rendere disponibile insieme ai documenti e alle informazioni preesistenti. Altri obiettivi di breve periodo, molto tecnici, sono: l’integrazione delle tre applicazioni di gestione in un unico strumento; la possibilità di lavorare su finestre multiple; la possibilità di creare collezioni di documenti, la definizione delle regole di esportazione dei metadati, la creazione delle interfacce di navigazione visuale (visual browsing) dei documenti per il Design Gateway, delle quali si è parlato nel primo capitolo. Ad un livello intermedio, quello degli obiettivi di medio periodo, c’è la volontà di gettare un ponte verso l’e-learning, sfruttando la ‘didatticità’ di certe relazioni che gli strumenti DesignNet permettono di creare, con la convinzione che un certo tipo di navigazione all’interno di un sistema conoscitivo per il design possa essere parte integrante di un programma di didattica a distanza. In sintesi, buona parte degli sviluppi futuri del progetto DesignNet riguarderanno: implementazione dell’interfaccia grafica del sistema; personalizzazione e customizzazione dell’interfaccia utente; implementazione dell’architettura e dei servizi di un Quality-Controlled Subject Gateway per il design; ulteriori investigazioni sui sistemi content-based di Information Retrieval, identificatori in ambienti di rete, tecnologie di infomobility e di bar-code e microchip per la gestione delle movimentazioni nella POLI.teca. Allargando ancora l’orizzonte, proiettandoci sul medio-lungo periodo, crediamo che gli ingredienti chiave per il successo di un progetto come DesignNet siano i seguenti: - affrontare ogni problema in modo ‘progettuale’, organizzando il progetto in fasi che comprendono l’indagine preliminare sullo stato dell’arte dei metodi e degli strumenti utilizzati e il benchmarking, le verifica in itinere e il budget; - lavorare con un team interdisciplinare di specialisti che definiscano prioritariamente metodologie, strumenti, specifiche tecniche e modalità operative di base, ed effettuino verifiche periodiche durante il progetto; 220 | - creare un archivio digitale con le qualità sedimentarie, la capacità di integrazione di materiali eterogenei e diffusi, la capacità di restituzione dell’informazione tipica degli archivi analogici e i plusvalori tipici dei sistemi digitali, con contenuti intellettualmente ‘curati’, modellati e aggiornati sui bisogni degli utenti. Sul medio-lungo periodo la prospettiva più importante, allo stato attuale, è senz’altro quella legata all’estensione della validità delle metodologie e degli strumenti sviluppati nell’ambito di questo programma di ricerca. Ricordiamo come tutto il programma DesignNet avesse in origine lo scopo di rispondere alle esigenze specifiche della Facoltà del Design; tirando qualche conclusione, abbiamo visto come in realtà i metodi e gli strumenti sviluppati possano avere valore anche in altri casi, e, ad un livello più generale, possano essere utilizzati - in virtù della loro flessibilità e della possibilità di gestire separatamente terminologia e elementi di indicizzazione - per trattare i documenti progettuali in momenti diversi della ‘filiera del progetto’: dalla organizzazione dei documenti in uno studio di design, fino alla catalogazione dei prodotti industriali nel museo di imprese design-oriented. Già nelle fasi di avvio del progetto DesignNet era emersa l’intenzione di puntare alla interazione con soggetti del mondo del design esterni al Politecnico, auspicando la connessione dei bacini di documenti e informazioni interni con quelli esterni, con la convinzione che questo potesse dare maggiore valore agli uni e agli altri 1. Ora siamo nelle condizioni di dire che quell’intenzione può essere perseguita come obiettivo, ed abbiamo avviato per questo una serie di incontri con il mondo della gestione dei patrimoni documentali del design italiano (musei e archivi) e con gli studi professionali. Incontri che ci hanno rivelato una situazione di relativa verginità rispetto all’adozione di metodi e strumenti di catalogazione, soprattutto se paragonata a quella di ambiti del patrimonio culturale che da più tempo sono stati identificati e codificati e quindi si sono organizzati per la conservazione, la tutela, la valorizzazione dei propri documenti, o a quella di professioni più inclini a considerare il valore delle informazioni e della conoscenza e quindi della loro organizzazione e gestione. Una verginità che è in realtà una grande opportunità: quella di spostare da subito l’attenzione dal documento in sé, dal progetto, dal singolo elemento, al contesto, alle relazioni tra i documenti, al significato dei documenti e delle relazioni. Capita spesso di sentir lamentare la mancanza di una metodologia riconosciuta e validata per descrivere oggetti del design o i documenti del design, ammesso che si riesca a confinare questo dominio 2. L’idea dietro al progetto DesignNet è che prima di definire una scheda per catalogare gli oggetti di design può essere più utile concertare un metodo per far dialogare i diversi Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 221 giacimenti di documenti esistenti che possono essere utili al design. Con la convinzione che sia comunque possibile estendere il modello e considerare anche i documenti del design come documenti per il design, per poterli utilizzare da subito – insieme agli altri – come risorsa conoscitiva per nuovi processi progettuali. L’ampliamento di prospettiva, dalle esigenze della Facoltà a quelle del Sistema Design, pota con sé, per passare agli obiettivi futuri del programma, la necessità di una maggiore flessibilità nella creazione di pacchetti di contenuti, che può venire dalla piena adozione delle disposizione dell’OAI: uno standard che, come già detto in questo testo, «definisce un’infrastruttura tecnologica tesa a garantire l’integrazione e l’interoperabilità di archivi distribuiti» e «il cui approccio al metadata harvesting esemplifica la nozione di modularizzazione dei metadati, utilizzando lo schema semplice di DC per l’interoperabilità tra comunità diverse, supportando al tempo stesso metadati specifici delle singole comunità». Dietro questo allargamento al Sistema Design del programma di ricerca c’è anche una specie di sogno, o forse meglio un’ambizione: quella di dare alla comunità del design, che storicamente non ne ha create molte, una occasione di unificazione, attraverso la condivisione di una metodologia e alcuni strumenti per la gestione del proprio patrimonio informativo e documentale e quindi culturale. Una occasione per certi versi più tecnica e meno politica, e quindi forse più facilmente accettabile. Recentemente, sull’onda dell’accordo raggiunto da diversi soggetti del Sistema Design sull’istituzione del Museo del Design, l’idea di condividere uno standard di catalogazione unico ha trovato una via verso la concretizzazione nella istituzione di un "gruppo di lavoro per l’avvio e la realizzazione di un sistema catalografico del design finalizzato alla documentazione, conoscenza, tutela, conservazione e valorizzazione del patrimonio del design italiano" 3. In realtà più che un’ambizione, quello del rafforzamento della comunità è una necessità: se è vero che ogni progetto di integrazione va ricondotto alla comunità di riferimento e con essa continuamente confrontato, e che il differenziale tra informazione e conoscenza è nell’esperienza, che è sempre contestuale, la formazione di un sistema conoscitivo non può prescindere da un contesto e da una comunità che porti la sua esperienza all’interno del sistema conoscitivo e sia responsabile del suo mantenimento e delle sue regole. Per questo è importante che si lavori parallelamente alla formazione (riconoscimento, integrazione) della comunità di riferimento oltre che allo sviluppo di metodologie e strumenti. Anche nel caso del Sistema Design la possibilità di raccogliere e rendere utilizzabile l’intelligenza collettiva passa – come dice Rullani – dal «costruire e far fun222 | zionare una rete di persone e una rete di imprese che, mantenendo la loro autonomia, cooperino nella produzione e valorizzazione della conoscenza posseduta». E, ancora con Rullani, l’intelligenza collettiva, è tale solo se «la conoscenza che contiene ed elabora non può essere divisa in parti che possano essere sommate senza perdere qualcosa di essenziale. Ciò significa che il sapere rilevante deve stare non nei singoli nodi della rete cognitiva ma nel pattern che li congiunge e che – essendo in gran parte implicito – non è separabile da essi». A questo pattern abbiamo dedicato gli sforzi finora compiuti; alla possibilità che il Sistema Design in tutta la sua estensione sia in grado di riconoscerlo e valorizzarlo vorremmo dedicare il proseguimento del programma DesignNet, consapevoli, come ha ricordato Peter Hirtle della Cornell University, che «once you start a digital project, you are committed to it for life» 4. Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 223 Note [1] Si veda in proposito il capitolo 11 DesignNet: linee guida per il progetto, in DesignNet. Knowledge e Information Management per il design. Atti del seminario internazionale, Milano 8 febbraio 2002, Politecnico di Milano, a cura di P. Ciuccarelli e P. Innocenti, prefazione di G. Simonelli, Edizioni POLI.design, Milano 2002, pp. 183-208. [2] Quando si parla di ‘oggetti di design’, o anche di ‘prodotti di design’, di solito si intendono i prodotti ‘fisici’, gli arredi, le lampade, che è vero hanno fatto la storia del design, ma che rappresentano oggi solo una porzione – quantitativamente anche poco rappresentativa – dell’attività del design. Deviando il senso dei due concetti, si può dire che qualsiasi cosa, materiale o immateriale, può essere ‘oggetto di design’, inteso come destinatario di interventi di design, e diventare quindi, dopo il processo di trans-formazione, ‘prodotto di design’. [3] Del gruppo di lavoro fanno parte: Angelo Cappellini, Provincia di Milano, Settore Beni Culturali (Dirigente); Antonella Gradellini, Provincia di Milano, Settore Beni Culturali, Arti visive; Silvana Annicchiarico, Triennale di Milano; Claudia Donà, Fondazione ADI; Paolo Ciuccarelli, Politecnico di Milano Dipartimento INDACO; Roberto Rizzi, CLAC, Galleria del Design e dell’Arredamento; Enzo Minervini, Regione Lombardia, coordinamento del progetto; Elena Traverso, Regione 224 | Lombardia, Direzione Generale Culture, Identità e Autonomie della Lombardia, Unità Organizzativa Musei e Servizi; Alessandra Vertechy, Regione Lombardia, supporto al coordinamento del progetto. [4] P. B. Hirtle, Metadata for Asset Management, Cornell University, 1997 <http://cidc.library.cornell.edu/Pub_files/ass et%20mgmt%20metadata%20(REV).ppt> 7 Appendici Perla Innocenti 7.1 DCMES – Qualified Schema per il progetto DesignNet 7.1.1 Schema per il prototipo del sistema Elementi Qualificatori Note Tipo immagine statica immagine in movimento sito Web insieme di dati software suono testo oggetto fisico collezione > > > > > > > > > Titolo principale alternativo > testo libero > testo libero Creatore nome di persona indirizzo di persona ruolo di persona > testo libero > testo libero > dal Design Thesaurus Ciuccarelli, Innocenti | dal dal dal dal dal dal dal dal dal Design Design Design Design Design Design Design Design Design Thesaurus Thesaurus Thesaurus Thesaurus Thesaurus Thesaurus Thesaurus Thesaurus Thesaurus Sistemi conoscitivi per il design: una proposta metodologica | 225 nome di ente o impresa indirizzo di ente o impresa ruolo di ente o impresa > testo libero > testo libero > dal Design Thesaurus Autore di contributo subordinato nome di persona indirizzo di persona ruolo di persona nome di ente o impresa indirizzo di ente o impresa ruolo di ente o impresa > > > > > > testo libero testo libero dalla Design Directory testo libero testo libero dal Design Thesaurus Identificatore ISBN ISSN URI/URL segnatura altro > > > > > testo testo testo testo testo libero libero libero libero libero Relazione fa parte di comprende è una versione di è citato in si riferisce a richiede è un formato di > > > > > > > testo testo testo testo testo testo testo libero libero libero libero libero libero libero Soggetto Thesaurus del design Classificazione Decimale Dewey altro > dal Design Thesaurus > da Classificazione Decimale Dewey > testo libero Copertura spaziale temporale stile/periodo > testo libero > testo libero > testo libero abstract indice > testo libero > testo libero > testo libero Descrizione conservato presso esibito in bibliografia certificazioni > > > > testo testo testo testo Formato file dimensioni estensione supporto materiali e finiture colore tecniche e tecnologie variazioni/varianti successive altre caratteristiche > > > > > > > > > testo libero testo libero testo libero dal Design Thesaurus dal Design Thesaurus dal Design Thesaurus dal Design Thesaurus dal Design Thesaurus testo libero Editore nome indirizzo ruolo luogo di edizione luogo di produzione > > > > > testo libero testo libero dal Design Thesaurus testo libero testo libero Lingua 226 | libero libero libero libero Data creazione digitalizzazione pubblicazione anno accademico produzione modifica Fonte abstract AAAA-MM-GG (W3C-DTF basato su ISO 8601) con possibilità di scrivere 1998-2000 AAAA-MM-GG (W3C-DTF basato su ISO 8601) AAAA-MM-GG (W3C-DTF basato su ISO 8601) AAAA-AAAA > dal Design Thesaurus > testo libero editore titolo identificatore conservato presso materiale e finiture colore tecniche e tecnologie dimensioni estensione altre caratteristiche > riguarda altri record già esistenti o prodotti astratti > testo libero AAAA-MM-GG (W3C-DTF basato su ISO 8601) con possibilità di scrivere 1998-2000 AAAA-MM-GG (W3C-DTF basato su ISO 8601) con possibilità di scrivere 1998-2000 > testo libero > testo libero > testo libero > testo libero > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > testo libero > testo libero > testo libero Gestione dei diritti data del copyright nota del copyright restrizioni licenza proprietario watermark > > > > > > Compilatore nome di persona indirizzo di persona ruolo di persona nome di ente o impresa indirizzo di ente o impresa ruolo di ente o impresa Data creazione ultima modifica creatore data di creazione data di produzione testo testo testo testo testo testo libero libero libero libero libero libero Status Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 227 7.1.2 Schema per la versione 1.0 del sistema Elementi Qualificatori Note Tipo immagine statica immagine in movimento sito Web insieme di dati software suono testo oggetto fisico collezione > dal Design Thesaurus Titolo principale > testo libero, a meno che non sia un prodotto astratto alternativo Creatore nome di persona ruolo di persona nome di organizzazione ruolo di organizzazione > > > > dalla Design Directory dal Design Thesaurus dalla Design Directory dal Design Thesaurus Autore di contributo subordinato nome di persona ruolo di persona nome di organizzazione ruolo di organizzazione > > > > dalla Design Directory dal Design Thesaurus dalla Design Directory dal Design Thesaurus Editore produttore editore distributore luogo di pubblicazione > > > > dalla Design Directory dalla Design Directory dalla Design Directory dal Design Thesaurus Data creazione AAAA-MM-GG (W3C-DTF basato su ISO 8601) con possibilità di scrivere 1998-2000 AAAA-MM-GG (W3C-DTF basato su ISO 8601) AAAA-MM-GG (W3C-DTF basato su ISO 8601) pubblicazione acquisizione Identificatore URI/URL segnatura inventario ISBN ISSN codice prodotto > > > > > > Soggetto THEDES CDD > dal Design Thesaurus > da Classificazione Decimale Dewey > dalla Design Directory Copertura spaziale temporale stile/periodo > dal Design Thesaurus > testo libero > dal Design Thesaurus 228 | testo testo testo testo testo testo libero libero libero libero libero libero Descrizione abstract indice numero e volume collana edizione posseduto da conservato presso esibito in bibliografia certificazioni marcature > > > > > > > > > > > Lingua contenuto interfaccia hardware interfaccia software > da elenco sigle ISO 639.2 > da elenco sigle ISO 639.2 > da elenco sigle ISO 639.2 Formato tipo di file dimensioni > elenco Internet Media Type > menù a tendina per unità di misura (GB; MB; KB; m; cm; mm; Ø; pixel) + testo libero per valore numerico lunghezza > menù a tendina per unità di misura (hh:mm:ss; pp.) + testo libero per valore numerico 2 menù a tendina con termini del Thesaurus del Design 2 menù a tendina con termini del Thesaurus del Design 2 menù a tendina con termini del Thesaurus del Design 1 menù a tendina con termini del Thesaurus del Design > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > dal Design Thesaurus > testo libero proprietà fisiche caratteristiche espressivo-sensoriali proprietà meccaniche forma del campione tecnologie di formatura tecnologie di finitura materiali finiture requisiti ambientali tecniche colore supporto altre caratteristiche Relazione contenuto in testo libero testo libero testo libero testo libero testo libero dalla Design Directory dalla Design Directory dalla Design Directory dalla Design Directory dalla Design Directory menù a tendina: CE > riguarda altri record già esistenti o prodotti astratti comprende ha come supplemento è un supplemento di fa parte della serie è una versione di è citato in si riferisce a richiede è un formato di Fonte N° altra scheda Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 229 Gestione dei diritti data del copyright nota del copyright restrizioni proprietario dei diritti watermark Compilatore nome di persona indirizzo di persona ruolo di persona nome di ente o impresa indirizzo di ente o impresa ruolo di ente o impresa Data creazione ultima modifica AAAA-MM-GG (W3C-DTF basato su ISO 8601) > testo libero > testo libero > dalla Design Directory > testo libero Status N° Record 7.2 Crosswalk Dublin Core – IPTC 1 IPTC Object name Headline Byline Credit Byline title Caption Special instruction Keywords Source Date created City Province – state Country name Copyright Caption writer 230 | Dublin Core Titolo Autore.nomedipersona Autore.ruolo Descrizione.abstract Fonte.descrizionetestuale Soggetto Fonte Data.creazione Copertura.spaziale Gestionedeidiritti.notadelcopyright Autore della compilazione [campo che verrà inserito a parte, insieme a quella della data di compilazione, oltre i 15 elementi di DC] 7.3 Qualified DCMES + XML Secondo il modello astratto: - ogni record è costituito da una o più proprietà (aspetto specifico, caratteristica, attributo di una risorsa) e dai relativi valori associati; - ogni proprietà è un attributo della risorsa che viene descritta; - ogni proprietà deve essere alternativamente: uno dei 15 elementi di Dublin Core, uno degli altri elementi raccomandati dalla DCMI, uno dei qualificatori raccomandati dall DCMI; - le proprietà possono essere ripetute; - ogni valore è una stringa letterale; - ogni valore può avere associato uno schema di codifica; - ogni schema di codifica ha un proprio nome; - ogni valore della stringa letterale può avere associato un linguaggio; - gli spacenames degli elementi e dei qualificatori vanno espressi in lingua inglese. I qualificatori vanno trattati alla stregua delle altre proprietà. Il nome dell’elemento del XML dovrebbe essere un qualificatore XML (QName) che associa il nome del qualificatore con l’appropriato namespace della DCMI. Ad esempio: <dcterms:created>2003-07-25</dcterms:created> I qualificatori sono elementi a tutti gli effetti e vanno inseriti alla stregua degli altri elementi di Dublin Core. In particolare, vanno riportate anche le ulteriori specifiche dei qualificatori element refinements: ad esempio nella scheda del progetto DesignNet ‘proprietà meccaniche’ (ovvero ‘mechanical properties’) ha come ulteriore specifica ‘resistenza’ ovvero ‘endurance’). Non è necessario che i record del Qualified Dublin Core Metadata Schema includano informazioni esplicite tra i qualificatori e gli elementi che essi qualificano. Gli schemi di codifica devono essere sviluppati utilizzando l’attributo ‘xsi:type’ dell’elemento XML della proprietà. Al nome dello schema di codifica deve essere assegnato il valore di attributo sotto forma di qualificatore XML (QName), che associa il nome dello schema con quello dell’appropriato namespace. Ad esempio: <dc:identifier xsi:type=’dcterms:URL’> http://www.designnet.polimi.it/perlainnocenti.htm/</dc:identifier> I qualificatori e gli schemi di codifica devono utilizzare i nomi specificati dalla DCMI (Metadata Terms Recommendation). Come regola generale, i nomi degli elementi e i qualificatori possono presentare lettere maiuscole e minuscole ma la prima lettera dovrebbe sempre essere minuscola. Gli schemi di codifica possono presentare lettere maiuscole e minuscole Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 231 ma la prima lettera dovrebbe sempre essere maiuscola (spesso presentano tutte le lettere maiuscole). Ad esempio: <dcterms:isPartOf xsi:type=’dcterms:URL’> http://www.designnet.polimi.it/ </dcterms:isPartOf> <dcterms:Subject xsi:type=’dcterms:DDC’> 025 </dcterms:Subject> Quando viene indicato il valore della lingua, deve essere codificato utlizzando l’attributo ‘xml:lang’. Ad esempio: <dc:subject xml:lang=’ita’>arredamento</dc:subject> 7.4 Design Thesaurus Di seguito vengono riportate le relazioni presenti nel Design Thesaurus. Relazioni relazioni di equivalenza relazioni associative relazioni gerarchiche Campi della scheda del termine nella versione 1.0 Termine ID termine Termine alternativo Sinonimi e varianti Termini associati Faccetta Termine generico Fonte Nota Codice notazionale ID ALT UF RT F BT S SN Informazioni aggiuntive Nota dell’indicizzatore Nota degli utenti Data di creazione, aggiornamento, approvazione Status 232 | IN UN D ST 7.5 Schemi di classificazione per i laboratori partecipanti al progetto 7.5.1 Laboratorio di Merceologia e Analisi Settoriale (MAST) Di seguito è riportato lo schema di classificazione elaborato insieme al Laboratorio MAST, sulla scorta delle macroclassi merceologiche in precedenza individuate 2. Settore AR AR AR AR AR Subsettore Famiglie AR AR arredamento arredamento arredamento arredamento arredamento arredamento arredamento arredamento 01 01 01 01 01 01 01 02 arredo arredo arredo arredo arredo arredo arredo arredo casa casa casa casa casa casa casa contract A B C D E F Z A AR arredamento 02 arredo contract B AR arredamento 02 arredo contract C AR AR AR AR AR AR AR AR IL IL IL IL IL IL arredamento arredamento arredamento arredamento arredamento arredamento arredamento arredamento illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione illuminazione 02 02 03 03 03 03 04 99 01 01 01 01 01 01 01 01 02 02 02 02 02 02 arredo contract arredo contract componenti d’arredo componenti d’arredo componenti d’arredo componenti d’arredo arredo urbano miscellanea apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi residenziali apparecchi non residenziali apparecchi non residenziali apparecchi non residenziali apparecchi non residenziali apparecchi non residenziali apparecchi non residenziali D Z A B C Z Z mobili sedute in genere complementi d’arredo cucine bagni per esterni miscellanea aeroporti, alberghi, teatri, sale conferenze, spazi per comunità in genere ufficio (operativo, di rappresentanza e direzionale) interni per grandi trasporti (navi, aerei, ecc.) per esterni miscellanea ferramenta e meccanismi rubinetteria maniglie miscellanea miscellanea A B C D E F Y Z A B C D E Z a parete da terra incassati sistemi sospesi da tavolo componenti per impianti miscellanea per interni per esterni per uso industriale apparecchi di emergenza apparecchi professionali miscellanea IL IL IL IL IL IL IL Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 233 IL IL IL EL EL EL EL CA CA CA CA AB AB AB illuminazione illuminazione illuminazione elettrodomestici elettrodomestici elettrodomestici elettrodomestici casalinghi casalinghi casalinghi casalinghi abbigliamento abbigliamento abbigliamento 02 03 99 01 02 03 99 01 02 03 99 01 02 03 AB AB abbigliamento abbigliamento 04 05 AB abbigliamento 05 AB abbigliamento 05 AB AB CZ CZ CZ abbigliamento abbigliamento calzature calzature calzature 06 99 01 02 03 CZ VA VA VA VA OC OC OC OC GI OR OR OR OR OR AC AC AC AC calzature valigeria valigeria valigeria valigeria occhialeria occhialeria occhialeria occhialeria gioielleria orologeria orologeria orologeria orologeria orologeria accessori per accessori per accessori per accessori per 99 01 02 03 99 01 02 03 99 99 01 02 03 04 99 01 02 03 99 234 | la la la la moda moda moda moda apparecchi non residenziali sorgenti (lampade) miscellanea bianchi bruni piccoli miscellanea pentolame posateria utensili da cucina miscellanea abbigliamento casual abbigliamento formale abbigliamento intimo, calze e costumi da bagno abbigliamento per lo sport abbigliamento da lavoro e indumenti protettivi abbigliamento da lavoro e indumenti protettivi abbigliamento da lavoro e indumenti protettivi abbigliamento per l’infanzia miscellanea classiche sportive tecniche (anatomiche, professionali, protettive, ecc.) miscellanea borse valigie zaini miscellanea occhiali da sole occhiali protettivi componenti per occhiali miscellanea miscellanea orologi da polso orologi da tavolo orologi a parete componenti per orologeria miscellanea cappelleria pelletteria ombrelleria miscellanea Y Z componenti per impianti miscellanea Z Z Z miscellanea miscellanea miscellanea Z Z Z miscellanea miscellanea miscellanea Z Z miscellanea miscellanea Z Z miscellanea miscellanea A abbigliamento per cicli B abbigliamento per motocicli Z Z miscellanea miscellanea Z Z miscellanea miscellanea Z miscellanea Z Z Z miscellanea miscellanea miscellanea Z Z Z miscellanea miscellanea miscellanea Z Z Z Z Z miscellanea miscellanea miscellanea miscellanea Z Z Z miscellanea miscellanea miscellanea TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR TR IM IM IM IM IM IM IM IM CO AS PI MI trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti trasporti imballaggio imballaggio imballaggio imballaggio imballaggio imballaggio imballaggio imballaggio comunicazione attrezzature sportive prodotti per l’infanzia miscellanea 01 01 01 01 02 02 02 02 02 02 03 03 03 03 03 03 04 04 04 04 04 04 04 04 04 04 99 01 02 03 04 05 06 07 99 99 99 99 imbarcazioni imbarcazioni imbarcazioni imbarcazioni cicli cicli cicli cicli cicli cicli motocicli motocicli motocicli motocicli motocicli motocicli automobili automobili automobili automobili automobili automobili automobili automobili automobili automobili miscellanea in carta e cartone in materie plastiche poliaccoppiati in legno in alluminio in acciaio in vetro miscellanea miscellanea miscellanea miscellanea LI CO PR NO libri componenti prodotti normative A B Y Z A B C D Y Z A B C D Y Z A B C D E F G H Y Z a motore a vela componenti miscellanea MTB city bike da corsa elettrici e assistiti componenti miscellanea da strada enduro scooter ciclomotori componenti miscellanea aperte berline due volumi berline tre volumi coupé fuoristrada monovolumi multispazio station wagon componenti miscellanea Tipologie di documenti CA DO ST PE cataloghi documenti lavori studenti periodici Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 235 7.5.2 Materiali e Design (MeD) Di seguito è riportato lo schema di classificazione elaborato insieme alla struttura interdipartimentale Materiali e Design, sulla scorta della classificazione dei materiali precedentemente definita dai docenti interessati 3. A questa base è stata aggiunta una notazione decimale funzionale alla organizzazione spaziale dei documenti. 000 010 011 012 013 014 020 030 031 032 033 034 040 050 060 070 080 090 100 110 111 112 113 114 115 120 130 131 132 133 140 200 210 211 212 213 236 | METALLI ACCIAI ACCIAI DA COSTRUZIONE ACCIAI INOSSIDABILI ACCIAI SPECIALI ALTRI ACCIAI GHISA RAME (E LEGHE) RAME PURO OTTONI BRONZI ALTRE LEGHE DI RAME ALLUMINIO (E LEGHE) TITANIO (E LEGHE) MAGNESIO (E LEGHE) ZINCO (E LEGHE) A MEMORIA DI FORMA ALTRI METALLI CERAMICI CERAMICI TRADIZIONALI CEMENTI E CALCESTRUZZI TERRACOTTE PORCELLANE LATERIZI ALTRI CERAMICI TRADIZIONALI VETRI CERAMICI AVANZATI ALLUMINA ZIRCONIA ALTRI CERAMICI AVANZATI ALTRI CERAMICI NATURALI LAPIDEI MARMI GRANITI TRAVERTINI 214 215 216 220 221 222 223 224 225 230 240 300 310 311 311.1 311.2 311.3 311.4 312 312.1 312.2 312.3 312.4 313 314 320 330 340 350 PIETRE DA COSTRUZIONE RICOMPOSTI ALTRI LAPIDEI LEGNI DOLCI DURI DURI ESOTICI COMPOSITI ALTRI LEGNI CARTA E CARTONE ALTRI NATURALI COMPOSITI A MATRICE POLIMERICA A FIBRE CONTINUE STRATIFICATI SANDWICH NON STRATIFICATI ALTRI A FIBRE CONTINUE A FIBRE DISCONTINUE STRATIFICATI SANDWICH NON STRATIFICATI ALTRI A FIBRE DISCONTINUE PARTICELLARI ALTRI A MATRICE POLIMERICA A MATRICE METALLICA A MATRICE CERAMICA A MATRICE NATURALE ALTRI COMPOSITI 400 410 410.1 410.1.01 410.1.02 410.1.03 410.1.04 410.1.05 410.1.06 410.1.07 410.1.08 410.1.09 410.1.10 410.1.11 410.1.12 410.1.13 410.2 410.2.01 410.2.02 410.2.03 410.2.04 410.2.05 410.2.06 410.2.07 410.2.08 410.2.09 410.2.10 410.2.11 410.2.12 410.2.13 411 420 420.01 420.02 420.03 420.04 420.05 420.06 420.07 421 430 430.1 430.1.01 430.1.02 430.1.03 430.1.04 POLIMERI TERMOPLASTICI AMORFI ABS (acrilonitrile-butadiene-stirene) CA (acetato di cellulosa) PC (policarbonato) PEI (polieterimmide) PMMA (polimetilmetacrilato) PPO (polifenilenossido) PS (polistirene) PSU (polisolfone) PUR (poliuretano) PVA (polivinilacetato) PVC (polivinilcloruro) SAN (stirene-acrilonitrile) ALTRI POLIMERI AMORFI SEMICRISTALLINI PA (poliammidi) PBT (polibutilentereftalato) PE (polietilene) PEEK (polietereterchetone) PET (polietilentereftalato) PI (poliimmide) POM (acetalica) PP (polipropilene) PPS (polifenilensolfuro) PTFE (politetrafluoroetilene) PUR (poliuretano) PVDF (polivinildenfluoruro) ALTRI POLIMERI SEMICRISTALLINI ALTRI POLIMERI TERMOPLASTICI TERMOINDURENTI UP (poliestere insaturo) PUR (poliuretano) EP (epossidica) PF (fenolica) PI (poliimmide) MF (melamminica) UR (ureica) ALTRI POLIMERI TERMOINDURENTI GOMME RETICOLATE GOMMA NATURALE POLIISOPRENE SINTETICO POLIBUTADIENE POLIISOBUTILENE Ciuccarelli, Innocenti | 430.1.05 430.1.06 430.1.07 430.1.08 430.1.09 430.1.10 430.1.11 430.1.12 430.2 430.2.01 430.2.02 430.2.03 430.2.04 430.2.05 431 440 500 600 610 610.1 610.2 610.3 610.4 620 620.1 620.2 620.3 620.4 620.5 630 630.1 630.2 630.3 630.4 630.5 700 800 EPDM FLUORURATE SILICONICHE NITRILICHE POLICLOROPRENE SBR POLIURETANICHE ALTRE GOMME RETICOLATE TERMOPLASTICHE SBS POLIESTERE POLIURETANICHE POLIOLEFINICHE ALTRE TERMOPLASTICHE ALTRE GOMME ALTRI POLIMERI STRATIFICATI TESSILE FIBRE NATURALI ARTIFICIALI SINTETICHE INORGANICHE FILATI NATURALI ARTIFICIALI SINTETICHE INORGANICHE MISTI TESSUTI NATURALI ARTIFICIALI SINTETICI INORGANICI MISTI RICICLATI MISCELLANEA Sistemi conoscitivi per il design: una proposta metodologica | 237 7.5.3 Laboratorio Sistemi e componenti per l’edilizia 4 Settore Subsettore MP MP MP MP CP CP CP CP CP CP CP CP CP PS PS PS manufatti manufatti manufatti manufatti coperture coperture coperture coperture coperture coperture coperture coperture coperture manufatti manufatti manufatti PS PS RI RI RI RI RI RI RI RI RI RI RI RI RI RI RI RI RI II II II II II manufatti per pareti e solai manufatti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai rivestimenti per pareti e solai isolanti e impermeabilizzanti isolanti e impermeabilizzanti isolanti e impermeabilizzanti isolanti e impermeabilizzanti isolanti e impermeabilizzanti 238 | prefabbricati prefabbricati prefabbricati prefabbricati per pareti e solai per pareti e solai per pareti e solai 01 02 03 99 01 01 01 02 02 02 03 03 99 01 01 01 manufatti in cemento solai prefabbricati scale miscellanea tegole - coppi tegole - coppi tegole - coppi lastre lastre lastre lamiere lamiere miscellanea blocchi e mattoni blocchi e mattoni blocchi e mattoni 01 99 01 01 01 01 02 02 02 02 02 03 03 03 04 05 06 07 99 01 01 01 01 02 blocchi e mattoni miscellanea pareti tradizionali pareti tradizionali pareti tradizionali pareti tradizionali pavimenti tradizionali pavimenti tradizionali pavimenti tradizionali pavimenti tradizionali pavimenti tradizionali controsoffitti controsoffitti controsoffitti pavimenti sopraelevati pareti mobili facciate ventilate rivestimenti a cappotto miscellanea isolanti termoacustici isolanti termoacustici isolanti termoacustici isolanti termoacustici impermeabilizzanti Famiglie A B Z A B Z A Z laterizio cemento miscellanea fibrocemento materialile plastico miscellanea metallo miscellanea A B C Z laterizio calcestruzzo cellulare calcestruzzo vibrocompresso miscellanea A B C Z A B C D Z A B Z piastrelle doghe intonaci miscellanea piastrelle listelli (parquets) moquettes rivestimenti continui miscellanea pannelli doghe miscellanea A B C Z polistirene poliuretano lana minerale miscellanea II II SE SE SE SE SE SE SE SE IP IP isolanti e impermeabilizzanti isolanti e impermeabilizzanti serramenti serramenti serramenti serramenti serramenti serramenti serramenti serramenti impianti impianti 03 99 01 01 01 01 02 03 04 99 01 02 IP IP impianti impianti 03 04 IP IP CT CT CT CT CT CT MC MC MC MC MC MC CH CH CH CH AE AE AE AE CN CN CN ME ME ME ME impianti impianti complementi per esterno complementi per esterno complementi per esterno complementi per esterno complementi per esterno complementi per esterno malte e calcestruzzi malte e calcestruzzi malte e calcestruzzi malte e calcestruzzi malte e calcestruzzi malte e calcestruzzi prodotti chimici per edilizia prodotti chimici per edilizia prodotti chimici per edilizia prodotti chimici per edilizia prodotti in acciaio per edilizia prodotti in acciaio per edilizia prodotti in acciaio per edilizia prodotti in acciaio per edilizia cantiere cantiere cantiere materiali per edilizia materiali per edilizia materiali per edilizia materiali per edilizia 05 99 01 02 03 04 05 99 01 02 02 02 03 99 01 02 03 99 01 02 03 99 01 02 99 01 01 01 01 Ciuccarelli, Innocenti | materiali bituminosi miscellanea porte e serramenti porte e serramenti porte e serramenti porte e serramenti accessori per serramenti facciate continue sistemi oscuranti miscellanea impianto elettrico impianto di riscaldamento e condizionamento impianto idrosanitario impianto di movimentazione - automatismi impianto di sicurezza e controllo miscellanea arredo urbano e giardino pavimentazioni camineti - fornetti - barbecue reti e recinzioni smaltimento acqua piovana miscellanea aggregati leganti idraulici leganti idraulici leganti idraulici malte e betoncini premiscelati miscellanea additivi chimici adesivi e sigillanti pitture e vernici miscellanea manufatti in ghisa materiali ferrosi tuberie miscellanea attrezzature da cantiere legname d’opera miscellanea pietre pietre pietre pietre A B C Z alluminio legno PVC miscellanea A B Z calce cemento miscellanea A B C Z marmi graniti altre pietre miscellanea Sistemi conoscitivi per il design: una proposta metodologica | 239 ME ME ME ME MI MI MI materiali per materiali per materiali per materiali per miscellanea miscellanea miscellanea edilizia edilizia edilizia edilizia 02 03 04 99 01 02 03 legni polimeri metalli miscellanea architettura urbanistica interni CE SS DC CP PO NO LP certificazioni (copia di) schede di sicurezza dettagli costruittivi (in scala) capitolati prescrizioni per posa in opera riferimenti normativi listino prezzi dossier tecnico (di approfondimento) Tipologie di documenti CA ST PE LI CO DE SC DT 240 | cataloghi lavori studenti periodici libri componenti (materici) depliants informativi schede tecniche 7.5.4 Osservatorio Progetto Bambino (OPB) 5 Categoria Tipologie comprese EF Pubblicazioni effimere Adesivi; biglietti d’invito; cartoline pubblicitarie; comunicati stampa; manifesti; locandine; programmi di congressi. convegni. eventi; pie ghevoli e depliant; opuscoli e brochure; stampati pubblicitari vari PI Pubblicazioni di organizzazioni pubbliche Bandi di concorso; convenzioni; delibere; dossier di progetti e di ricerca; glossari; guide; libri bianchi; linee guida; normativa tecnica; opuscoli e note informative; ordini degli studi; organigrammi; proget ti; programmi economici e politici; raccolte di comunicati stampa; rapporti di argomento scientifico e tecnologico; rassegne stampa; relazioni ufficiali; repertori; resoconti; ricerche. indagini. studi e analisi PA Pubblicazione di organizzazioni e imprese private Cataloghi; dossier; glossari; istruzioni per l’uso; libri bianchi; linee guida; normativa tecnica; opuscoli informativi; organigrammi; raccolte di comunicati stampa; rapporti di argomento scientifico e tecnologi co; rassegne stampa; relazioni interne; relazioni ufficiali; repertori; ricerche di mercato; schede tecniche; studi di fattibilità DR Materiali di didattica e di ricerca Dossier di progetti; dossier di ricerca; dispense; tesi di laurea e di dottorato; tesine; ricerche; materiali di supporto alla didattica; pro getti e allegati EV Documentazione di eventi Relazioni. comunicazioni e relativi abstract. atti integrali di convegni. conferenze. mostre. prolusioni. seminari. tavole rotonde. purchè diffu si in modo non convenzionale LI Documenti bibliografici Monografie; atti; enciclopedie; PE Periodici Periodici a pubblicazione convenzionale LP Letteratura grigia a carattere periodico o seriale Collane di rapporti tecnici; estratti; notiziari; newsletter; bollettini AR Articoli Articoli di quotidiani; articoli di periodici BI bibliografie Bibliografie compilate per ambiti specifici CV Siti Web WE Curricula e contatti Curricula; biglietti da visita; elenchi con riferimenti MU Multimedia Audiocassette; CD-ROM; DV-ROM; diapositive; floppy disk; fotografie; VHS DA Documenti amministrativi e gestionali dell’OPB Comunicazioni; preventivi Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 241 7.6 Standard adottati A livello documentale, nel sistema del progetto DesignNet sono stati complessivamente adottati i seguenti standard e schemi di codifica di riferimento: - catalogazione: - Dublin Core: NISO Standard Z39.85 e ISO 15836:2003; - ISO 214-1976 per l’abstract; - ISO 3136 (Codes for the representation of names of countries) e ISO 639-2 (Codes for the representation of names of languages); - i criteri W3C (Encoding rules for dates and times); - il DCT1 (Dublin core type vocabulary); - l’IMT (Internet media type); - Design Thesaurus: UNI ISO 2788 Linee guida per la costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985. Metodi per l’analisi dei documenti; la determinazione del loro soggetto e la selezione dei termini di indicizzazione; Guidelines for the Costruction. Format. and Management of Monolingual Thesauri Document Number: ANSI/NISO Z39.19-2003. National Information Standards Organization. 28 August 2003; Guidelines for Indexes and Related Information Retrieval Devices Document Number: NISO TR-021997. National Information Standards Organization. 1 January 1997. 242 | Note [1] Mappatura definita da Perla Innocenti e Matteo Bergamini (LabFoto, Dipartimento INDACO, Politecnico di Milano). [2] Schema di classificazione definito in collaborazione con Luca Cosmai e Diego Speroni (Lab MAST, Dipartimento INDACO Politecnico di Milano). [3] Schema di classificazione definito in collaborazione con Barbara Del Curto e Valentina Rognoli (Materiali e Design, Dipartimento di Chimica, Materiali e Ingegneria Chimica ‘Giulio Natta’, Politecnico di Milano), sulla base di quanto già indicato dai docenti del dipartimento di Chimica, Materiali e Ingegneria Chimica ‘Giulio Natta’. [4] Schema di classificazione definito in collaborazione con Francesca Patti (Laboratorio Sistemi e Componenti per l’edilizia, Politecnico di Milano). [5] Schema di classificazione definito in collaborazione con Roberta Riboni dell’Osservatorio Progetto Bambino (Dipartimento INDACO, Politecnico di Milano). Ciuccarelli, Innocenti | Sistemi conoscitivi per il design: una proposta metodologica | 243