| Sistemi conoscitivi per il design: una proposta metodologica |
Il caso DesignNet
|
Paolo Ciuccarelli, Perla Innocenti
|
Sono passati 4 anni dall’avvio del programma di ricerca DesignNet, del quale
in questo volume vengono descritte le scelte operate e i principali risultati.
Il programma nasceva dall’esigenza di mettere a disposizione di studenti
e docenti della Facoltà del Design del Politecnico di Milano informazioni
e documenti per alimentare la didattica progettuale, e affrontava il problema
dei documenti per il design insieme a quello della raccolta, descrizione
e trasmissione dei documenti del design.
La ristampa coincide con uno degli obiettivi dichiarati: promuovere ed allargare
la rete del design identificata nel progetto, offrendo alla comunità del design
un’occasione di unificazione attraverso la condivisione di una metodologia
e di alcuni strumenti per la gestione del proprio patrimonio informativo,
documentale, e quindi culturale.
ISBN: 88-87981-60-4
© 2006 Edizioni POLI.design
Prima edizione: dicembre 2004
Ristampa: ottobre 2006
via Durando 38/A - 20158 Milano
Tel. 02-2399.7206 Fax 02-2399.5970
E-mail: edizioni.polidesign@polimi.it
internet: www.polidesign.net
Coordinamento editoriale
Michela Pelizzari
Sistema grafico editoriale
Art direction: d.com
Grafica e impaginazione:
Alessandra Albano, Lucia Oliosi
Stampa: ALLgrafic sas - Milano
I capitoli 2, 3, 4 e i paragrafi dal 5.2 al 5.5 sono stati scritti da Perla Innocenti;
il capitolo 1 e il paragrafo 5.1 sono stati scritti da Paolo Ciuccarelli; il capitolo 6
è stato scritto da entrambi gli autori.
Le immagini riprodotte in questo volume sono © dei rispettivi legittimi proprietari
e sono qui utilizzate senza fini di lucro. Si rimane a disposizione degli aventi diritto
con i quali non è stato possibile comunicare, nonché per eventuali involontarie
omissioni o inesattezze.
Tutti i diritti sono riservati; è vietata la riproduzione non autorizzata, con qualsiasi
mezzo effettuata, compresa la fotocopia, la memorizzazione elettronica o altro sistema
di registrazione.
Indice
1. Documenti del design, documenti per il design
Paolo Ciuccarelli
1.1 Dall informazione alla conoscenza per il design
1.2 L interfaccia tra il designer e la conoscenza
9
11
14
2. Evoluzione dei documenti e della biblioteca nell’era digitale
Perla Innocenti
19
2.1 L’universo biblioteche oggi: tendenze in atto
20
2.2 Le biblioteche universitarie dall’automazione alla trasformazione:
il contesto internazionale
23
2.3 La situazione in Italia
28
2.4 Sfide e scenari prossimi venturi
29
2.5 Spazi fisici: Learning Resource Centre e Information Commons
32
2.6 Spazi virtuali: biblioteche digitali e repository
35
2.6.1 Le biblioteche digitali in ambito universitario
36
2.6.2 Architettura, componenti e caratteristiche delle biblioteche digitali
2.6.3 Interoperabilità, standard, modelli organizzativi
40
2.6.4 Linee di sviluppo future
42
2.7 Knowledge Management e sistemi di organizzazione della conoscenza
3. Organizzazione e restituzione della conoscenza in ambienti di rete
Perla Innocenti
3.1 Standard di digitalizzazione
57
3.1.1 Conservazione del dettaglio più fine
59
3.1.2 Definizione della qualità dell immagine in funzione della finalità d’uso
38
44
55
60
3.1.3 Definizione del workflow, gestione delle caratteristiche dell’immagine
3.2 Standard di documentazione
62
3.2.1 Il mondo degli schemi di metadati: principi e questioni
65
3.2.2 Metadati descrittivi
76
3.2.3 Dublin Core Metadata Element Set (DCMES)
79
3.2.4 MPEG-7
89
3.2.5 Information Retrieval
90
3.2.6 Indicizzazione term-based, manuale e automatizzata
94
3.2.7 Vocabolari controllati: i thesauri
100
3.2.8 Authority control
107
3.2.9 Web semantico e ontologie
109
4. Un sistema conoscitivo per la didattica e la ricerca del design in ambito
universitario
125
Perla Innocenti
4.1 Introduzione
125
4.1.1. Restituzione online delle informazioni relative al design
127
4.1.2 I giacimenti documentali del design: il caso della Facoltà del Design
del Politecnico di Milano
130
4.1.3 Sistemi informativi e sistemi conoscitivi in ambienti di rete
134
4.1.4 Dal Cultural Heritage all’Industrial Design Knowledgebase
137
4.2 Ipotesi per una soluzione
140
5. Il progetto DesignNet
151
Paolo Ciuccarelli, Perla Innocenti
5.1 Bisogni e obiettivi
151
5.2 Analisi e progettazione del sistema
154
5.2.1 Un Quality-Controlled Subject Gateway per il design
156
5.2.2 Schemi di metadati: Dublin Core e OAI
157
5.2.3 Indicizzazione e Information Retrieval: il Design Thesaurus
5.2.4 Authority file: la Design Directory
171
5.2.5 Modalità di lavoro collaborativo
172
5.2.6 Management e visualizzazione di risorse eterogenee
176
5.2.7 Un Learning Resource Centre per il design
181
5.2.8 Risultati e problemi incontrati
183
5.3 Implementazione del prototipo
185
5.3.1 Architettura di sistema e componenti
185
5.3.2 Catalogazione con Dublin Core
187
5.3.3 Design Thesaurus
189
165
60
5.3.4 Graphic User Interface (GUI)
193
5.3.5 Design Directory
197
5.3.6 Risultati e problemi incontrati
197
5.4 Implementazione della versione 1.0 delle applicazioni
5.4.1 Architettura di sistema e componenti
200
5.4.2 Design Thesaurus
200
5.4.3 Catalogazione con Dublin Core
208
5.4.4 Primi risultati e problemi incontrati
209
5.5 Start-up di un Design Knowledge Centre
211
5.5.1 Processi
214
5.5.2 Risultati e problemi incontrati
217
6. Conclusioni e prospettive
Paolo Ciuccarelli, Perla Innocenti
7. Appendici
Perla Innocenti
200
223
229
7.1 DCMES Qualified Schema per il progetto DesignNet
229
7.1.1 Schema per il prototipo del sistema
229
7.1.2 Schema per la versione 1.0 del sistema
232
7.2 Crosswalk Dublin Core - IPTC
234
7.3 Qualified DCMES + XML
235
7.4 Design Thesaurus
236
7.5 Schemi di classificazione per i laboratori partecipanti al progetto
7.5.1 Laboratorio di Merceologia e Analisi Settoriale
237
7.5.2 Laboratorio Materiali e Design
240
7.5.3 Laboratorio Sistemi e componenti per l’edilizia
242
7.5.4 Osservatorio Progetto Bambino
245
7.5 Standard adottati
246
237
1
Documenti del design, documenti per il design
Paolo Ciuccarelli
L’esplorazione del mondo, anche quando è compiuta con mezzi razionali
(di razionalità strumentale), nasce da un processo di costruzione dell’identità che
ingloba materiali casuali, singolari, non giustificati razionalmente
e spesso non giustificabili, perché rimasti nell’ombra
Enzo Rullani
Il titolo di questo primo capitolo riassume le due anime del programma di
ricerca avviato nel 2001 1 con l’etichetta DesignNet, e del quale vengono
descritti in questo testo i principali risultati. Un programma che nasceva dall’esigenza di mettere a disposizione di studenti e docenti della Facoltà del
Design del Politecnico di Milano informazioni e documenti 2 per alimentare
la didattica progettuale, e affrontava dunque il problema dei documenti per il
design insieme a quello – più comune – della raccolta, descrizione e trasmissione dei documenti del design. Quella esigenza è stata declinata in tre obiettivi principali:
- sviluppare strumenti e metodi per gestire e restituire la complessità
del materiale informativo e documentale potenzialmente utile al processo progettuale 3, compresi i documenti e le informazioni prodotti
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
|9
nello svolgimento dello stesso processo progettuale, in particolare
all’interno della didattica;
- ri-metterlo a disposizione degli studenti-progettisti – più in generale
degli operatori del mondo del design 4 – in forma organizzata, per un
accesso integrato e personalizzabile (flessibile);
- raccogliere la nuova conoscenza generata dall’utilizzo (esperienza)
delle informazioni e dei documenti, integrando e amplificando così,
attraverso un nuovo livello (layer), il patrimonio originale.
Questi obiettivi – che sottolineano la scelta della centralità dell’utente, o
meglio delle sue azioni (dal designer-soggetto al design-processo) fin dalle fasi
di impostazione del progetto – nascono da una contaminazione: dall’incontro
tra il già citato bisogno della Facoltà del Design di fornire supporto informativo all’attività progettuale degli studenti e le ricerche già attive in seno al
dipartimento INDACO 5, sempre al Politecnico di Milano, intorno ai temi
del ‘designer lavoratore della conoscenza’ 6. A posteriori, possiamo dire che gli
elementi fondativi e i principi guida del progetto DesignNet sono proprio il
frutto della integrazione virtuosa tra due filoni di ricerca: quello che andava
declinando sul campo del design i temi più generali della società e dell’economia della conoscenza da una parte, e, dall’altra, quello sui metodi, gli standard e gli strumenti per la gestione e la catalogazione delle informazioni e dei
documenti nei processi creativi. Il secondo filone, avviato con il progetto
DesignNet, è diventato l’occasione per dare concretezza ed esiti strumentali
alle ricerche più teoriche sulla relazione tra design, informazione e conoscenza. Non poteva mancare in questo percorso una ricognizione accurata su
quanto già disponibile in termini di risorse informative e documentali per il
design. Un background importante, collante nella integrazione dei due filoni
di ricerca, costruito, coerentemente con gli obiettivi e le ipotesi del programma di ricerca, con un’attenzione particolare alle risorse disponibili in rete, via
Internet, come documentato nel terzo capitolo.
In questo libro sono descritte le scelte operate per cogliere gli obiettivi dichiarati, in particolare rispetto alle metodologie e agli strumenti per la catalogazione, indicizzazione, organizzazione dei documenti per il design. Si documenta la
creazione di una metodologia – nuova e diversa da quelle relative ad altri
ambiti disciplinari, didattici e di prassi professionale – fondata proprio sulle
specificità del design e del suo essere, ancor più di altre e con caratteri specifici
molto forti, attività knowledge intensive 7. Una metodologia che ha una prospettiva di servizio, di gestione dei documenti finalizzata al loro utilizzo, e che
ha portato il progetto DesignNet a seguire più le linee di sviluppo e innovazione tracciate dalla biblioteconomia che quelle della conservazione e dell’archivistica, e, ancora di più, quelle proprie della gestione della conoscenza (Fig. 1) 8.
10 |
1.1 Dall’informazione alla conoscenza per il design
Cosa significa organizzare i documenti per il design? Per capirlo è stato necessario riprendere in mano ed approfondire le riflessioni già fatte, all’interno del
dipartimento ma non solo, sul modo in cui il designer, studente o professionista, lavora in termini di flussi di informazioni e conoscenza. Stante la difficoltà di individuare un metodo/modello generale del processo progettuale,
soprattutto per le fasi iniziali (creative), da prendere come riferimento, l’unico
procedimento possibile era quello di cogliere i tratti salienti, i caratteri peculiari della relazione tra design, informazione e conoscenza, e quindi tra il
design e i documenti. Tra questi caratteri, uno dei più evidenti è che il designer si trova spesso nella situazione di reset informativo, a dover cioè ricominciare (quasi) da zero rispetto al proprio bagaglio di conoscenze, essendo
chiamato ad affrontare progetti in ambiti assai diversi tra loro 9. Proprio per
rispondere all’esigenza di acquisire rapidamente un quadro informativo sul
sistema industriale e sul settore nell’ambito del quale si è chiamati a sviluppare il progetto, era stato avviato nel 1998 il laboratorio di Merceologia e
conservazione
biblioteconomia
Knowledge
Management
archivistica
[Fig. 1] Ambiti disciplinari interconessi nel progetto DesignNet (P. Ciuccarelli)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 11
Analisi Settoriale, sempre in un’ottica di supporto all’attività didattica nei
corsi della Facoltà del Design. Ma la questione dell’azzeramento riguarda
soprattutto la sfera tecnico-operativa, spesso quantitativa, delle informazioni,
e non è l’unico bisogno espresso dal progettista: accanto alla necessità di
aggiornamento verticale su tematiche specifiche, che trova invero molte risposte già disponibili, il designer ha l’esigenza peculiare di alimentare il livello
più alto della conoscenza 10, fondato su elementi più qualitativi e sulla capacità
di mettere in relazione, attraverso quegli elementi, dati, informazioni e documenti eterogenei. Un’esigenza alla quale gli strumenti e i metodi di gestione
dei documenti e delle informazioni, sviluppati spesso per specifiche tipologie
di documenti o per obiettivi di informazione specialistici, non danno risposte
soddisfacenti: avevamo l’impressione che proprio in questo ambito si dovesse
e si potesse fare di più, fare un passo in avanti nella direzione di dare al
design strumenti e metodi più coerenti con il proprio modo di operare sul
terreno dell’informazione e, soprattutto, della conoscenza.
La necessità di affrontare insieme il livello dell’informazione e della conoscenza è ancora più evidente se si considera la fase di generazione del concept. Se
infatti è vero che in questa fase il designer può aver bisogno di trovare e utilizzare informazioni tecniche molto specializzate, o che può basarsi, ad esempio, sulle caratteristiche tecniche di un materiale, più spesso però, soprattutto
in assenza di brief focalizzati e richieste specifiche, il designer lavora digerendo quelle informazioni attraverso gli ‘stimoli culturali’ 11 di cui va continuamente nutrendosi e che funzionano proprio come ‘enzimi’. Stimoli che possono essere trovati ovunque 12, in qualsiasi tipo di documento o anche in frammenti, spesso superficiali e visivi – sensoriali e percettivi – di documenti 13; o,
ancora di più, nella connessione, ibridazione, integrazione, quasi mai logica e
lineare, di un certo numero di documenti o frammenti di essi. Stimoli che
vengono più dall’osservazione fisica del reale, dall’esperienza, e meno dall’applicazione di regole astratte 14. Una conferma di questo modo di procedere
può venire dall’osservazione di come a volte il designer – non richiesto –
tenda a rielaborare deliberatamente il brief, riportando il discorso progettuale
dalla sfera del problem solving a quella del problem setting o re-setting, spostando la questione informativa dal cercare il documento o l’informazione che
risolva quel problema all’esplorazione del mondo che può dargli senso: il designer predilige i processi di sense-making.
L’idea che il processo di generazione del concept, processo creativo, sia interpre tabile come ricombinazione di elementi che di solito sono separati, come
un «mettere vecchie cose in nuove combinazioni e nuove cose in vecchie
combinazioni» 15 non è certo nuova; manca però una traduzione sul piano
strumentale di questa visione, e mancano strumenti in grado di abilitare e
12 |
sostenere quei comportamenti connettivi, esplorativi e conoscitivi, attinenti
più al contesto che al testo, che ribadiscono l’azione culturale oltre che tecnica
del design.
Il rapporto del designer con le informazioni e i documenti non poteva dunque essere affrontato solo sul piano delle informazioni, dei documenti ‘ufficiali’, delle conoscenza codificate: bisognava necessariamente porsi il problema
della gestione di quei frammenti documentali, quelle eccedenze cognitive 16
che il progettista riorganizza creativamente in forma nuova integrandoli alle
informazioni e ai documenti più tecnici e verticali, generando innovazione
(nuova conoscenza) non inventando ma, appunto, ricombinando. Un processo che va sostenuto fornendo strumenti e metodi per la ricombinazione, per
la costruzione di relazioni significative tra i frammenti qualitativi, i documenti, le informazioni, e per argomentare quelle relazioni (Fig. 2).
[Fig. 2] Relazioni multiple tra documenti nell’ambito del design (P. Ciuccarelli)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 13
1.2 L’interfaccia tra il designer e la conoscenza
Abbiamo visto fin qui come il programma di ricerca DesignNet sia basato in
gran parte su una ipotesi: per supportare l’azione conoscitiva, fondativa di
qualsiasi processo progettuale, non è importante tanto l’informazione o il
documento in sé quanto il modo in cui quelle informazioni e quei documenti
stanno, o possono stare insieme, e il perché di quello stare e poter stare insieme. A questo prima ipotesi progettuale se n’è aggiunta nel tempo un’altra,
diventata oggi altrettanto rilevante: l’importanza del modo in cui i documenti
vengono messi a disposizione, del cosa viene rappresentato di un documento,
e del come vengono rappresentate le relazioni esistenti tra documenti diversi.
L’attività di ricerca e sviluppo è stata dunque allargata, per cogliere l’obiettivo
di definire le caratteristiche che devono avere le interfacce mediatrici del rapporto tra design, informazione e conoscenza. A queste problematiche, il progetto DesignNet non ha ancora fornito risposte esaustive: siamo ancora nella
fase di analisi del problema e di definizione delle principali linee guida. Il più
consistente tra i filoni di ricerca attivati in questo ambito si basa sull’ipotesi
che nelle fasi preliminari della ricerca per il progetto spesso i risultati più interessanti emergano esplorando (exploration vs. exploitation) la realtà o le risorse informative e documentali, o anche con le modalità tipiche della serendipity: trovo qualcosa di interessante mentre cercavo qualcos’altro, o più in generale, ‘stimoli culturali’ utili possono emergere in momenti e situazione in cui
non si sta cercando nulla, non c’è intenzione di ricerca, anche perché nel processo creativo è lecito anche non sapere cosa si sta cercando, mentre è più
facilmente noto, ad esempio, il contesto o il motivo della ricerca.
Pensando alle interfacce, dare supporto all’esplorazione conoscitiva, non negare l’accesso, nascondendole, alle eccedenze cognitive, può significare – è l’ipotesi alla quale stiamo lavorando – sostituire alla gerarchia dei risultati di una
ricerca à-la Google un territorio di stimoli, in cui sono possibili molti e diversi percorsi, e all’interno del quale diventa possibile – paradossalmente – anche
una specie di smarrimento programmato. Si potrebbe in questo modo coltivare quell’ozio creativo, quella improduttività solo apparente in cui a volte si
possono trovare i semi delle idee più interessanti.
Alle esigenze del designer – del design, meglio – rispetto alla gestione e alla
fruizione di giacimenti/patrimoni documentali si sono intrecciate, avanzando
il programma di ricerca, quelle di chi istituzionalmente si deve occupare di
gestire i documenti del design tradizionalmente intesi. Documenti ai quali da
qualche tempo, poco, è stata riconosciuta la dignità di ‘beni culturali’ 17. Il
focus del progetto e della ricerca si è allargato, a considerare la gestione dei
documenti prodotti durante il processo progettuale o che ne rappresentano
l’output diretto (documenti di progetto) e indiretto (prodotti industriali).
14 |
Coerentemente con quanto detto finora è ovvio che anche in questo allargamento l’obiettivo non può essere solo quello della descrizione e della conservazione del patrimonio – che pure deve essere garantita: la prospettiva dovrà
essere ancora quella di gestirli per farne patrimonio riutilizzabile (documenti
del design per il design), conoscenza già ‘masticata’ da mettere a scaffale per
essere più facilmente (ri)manipolata, ricombinata per produrre ancora nuovi
progetti e quindi nuova conoscenza.
Garantire questa possibilità, nel caso specifico del design, significa rispettare
alcune condizioni di fondo.
La prima è sicuramente la serialità del design, il fatto che il design presuppone sempre non un documento ma, appunto una serie di documenti – i prodotti industriali – che hanno uguali caratteristiche per definizione, hanno la
stessa origine, la stessa matrice, ma destini diversi: se è vero che da una parte
c’è una standardizzazione necessaria, normata, del singolo prodotto che può
semplificare la questione della descrizione, dall’altra c’è la estrema variabilità
del contesto, delle storie legate a quel prodotto, che tutte insieme costruiscono il significato di quel documento. Un’altra condizione è la necessità di prescindere dalla tendenza, già storica nel caso dell’architettura, a creare archivi
dei progetti. Il progetto è un filo conduttore tra gli altri, uno dei modi possibili per raccogliere e dare senso ad un insieme eterogeneo di documenti, ma
non è certo l’unico, né può esserlo se si vuole preservare il valore conoscitivo
del sistema che si costruisce. Se si vuole costruire un ‘archivio dei documenti
del design’, forse può essere sufficiente; un ‘sistema conoscitivo per il design’
dovrà viceversa considerare il progetto come documento tra gli altri, subordinato all’esperienza sociale e culturale legata a quel particolare esemplare del
prodotto industriale in questione.
Concludo questo capitolo, introduttivo, sottolineando come in realtà non esistano, in origine, i documenti per il design: esistono i documenti delle discipline codificate, esistono frammenti di documenti mai catalogati, esistono,
certo, i documenti del design – i progetti, le foto, i carteggi, gli oggetti – che
possono diventare materiale di nuovo utile per il design, e quindi documenti
per il design oltre che del design, se messi in relazione in modo significativo,
per essere fruiti in modo integrato.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 15
Note
[1]
L’ avvio ‘ufficiale’ del progetto è sancito dal
seminario internazionale organizzato per
sancire la necessità di un percorso di ricerca che indagasse la relazione tra design,
informazione e conoscenza con obiettivi
strumentali. Il seminario, dal titolo
DesignNet. Knowledge e Information
Management per il design si è tenuto presso la Facoltà del Design l’8 febbraio del
2002 (cfr.
http://www.designnet.polimi.it/Seminario/
presentazione.htm e DesignNet.
Knowledge e Information Management per
il design. Atti del seminario
internazionale, Milano 8 febbraio 2002,
Politecnico di Milano, a cura di P.
Ciuccarelli e P. Innocenti, prefazione di G.
Simonelli, Edizioni POLI.design, Milano
2002). Il gruppo di ricerca nel Politecnico
di Milano che sta portando avanti il progetto DesignNet è oggi composto da:
Paolo Ciuccarelli, Luca Cosmai, Perla
Innocenti, Federico Vidari. Mida
Boghetich ha partecipato fino al 2005 alla
progettazione e allo sviluppo del codice
delle applicazioni DesignNet. Allo sviluppo partecipa dal 2004 Daniele Galiffa, tutt’ora attivo soprattutto nella costruzione
dell’interfaccia di consultazione Design
Gateway.
[2]
Nel programma DesignNet l’accezione del
termine documento è la più ampia possibile, così come indicata nel paragrafo 2.1
di questo volume.
[3]
Complessità del materiale informativo e
documentale che è data dalla eterogeneità
16 |
- per formato, tipologia, modalità di
descrizione ecc. - dello stesso e dal potenziale (grande) numero di relazioni esistenti
tra i documenti
[4]
C’è implicita in questo obiettivo l’ipotesi
che, dal punto di vista dell’architettura dei
flussi di utilizzo e produzione di informazioni e conoscenza, i processi progettuali condotti per scopi didattici all’interno dei laboratori e quelli dei professionisti del design
siano assimilabili. Un’ipotesi avvalorata dalla
scelta della Facoltà del Design di coinvolgere
in modo diretto i professionisti nella didattica, con un apporto che sarà presumibilmente
un trasferimento di esperienza progettuale.
[5]
La sigla INDACO sta per Industrial
Design Arti, Comunicazione e Moda.
[6]
Quello indicato è il titolo di un saggio scritto da Paola Bertola, ricercatore del dipartimento INDACO, e contenuto in Didattica
&Design. Processi e prodotti formativi nell’università che cambia, a cura di A. Penati e
A. Seassaro, Edizioni POLI.Design, Milano,
2000. Altri lavori dello stesso autore sullo
stesso tema: Design as a Knowledge Agent.
How design as a knowledge process is embedded into organizations to foster innovation,
atti del convegno ADC2001, 5th Asian
Design Conference, Seoul, Korea, Settembre
2001, e Embedding meaning in products,
Proceedings of The International Conference
on Affective Human Factors Design, Asean
Academic Press, London, 2001. Cfr. Inoltre
P. Bertola, L. Collina, P. Ciuccarelli, P.
Innocenti, Design networks and knowledge
management for supporting small and
medium enterprises. Cases from Italy, in
Techné: design wisdom. Proceedings of the
5th European Academy of Design
Conference, Barcelona, 28-30 April 2003
<http://www.ub.edu/5ead/PDF/13/Bertola.
pdf>
[7]
Si discute molto oggi sul fatto che in realtà
quasi tutte le professioni contemporanee
siano, ad un certo livello, knowledge intensive. Sicuramente il design lo è, con la ulteriore specifica derivante dal fatto che gran
parte della conoscenza circolante è conoscenza tacita, non codificata. Si potrebbe
quindi meglio definire il design come attività knowledge intensive.
[8]
Testimonianza di questo orientamento
sono alcuni dei primi testi scritti nelle fasi
di avvio del programma DesignNet: P.
Ciuccarelli, Strumenti per il progetto tra
formazione e gestione della conoscenza:
ipotesi per un portale del design, in
Didattica &Design. Processi e prodotti formativi nell’università che cambia, a cura
di A. Penati e A. Seassaro, Edizioni
POLI.Design, Milano 2000, pp. 236-262;
DesignNet. Knowledge e Information
Management per il design. Atti del seminario internazionale, cit.
[9]
Per gli architetti si diceva ‘dal cucchiaio
alla città’. Nel caso del design da una parte
è vero che oggi, almeno guardando ai percorsi formativi, la situazione è cambiata, i
rispettivi ambiti di pertinenza sono stati
distinti, l’architettura e il design hanno
trovato - come dimostra anche l’organizzazione didattica del Politecnico di Milano le loro strade. Ulteriori e forti distinzioni e quindi riduzioni di campo - sono state
Ciuccarelli, Innocenti
|
operate anche nella Facoltà del Design, e
hanno portato a definire Corsi di Laurea
distinti per il progetto della comunicazione, della moda, degli interni ecc. Ed è
anche vero che una porzione di informazioni e conoscenza - quella più tecnica,
trasversale, o di metodo - acquisita nei
progetti precedenti può essere accumulata
e riutilizzata. Rimane però anche vero che
all’interno dei diversi ambiti di progetto,
settori merceologici, nelle macro aree del
prodotto, della comunicazione, degli interni rimane comunque una grande varietà,
soprattutto se si considerano gli scenari
culturali e sociali da controllare, e le ibridazioni tra queste aree sono ancora molto
frequenti.
[ 10 ]
Per questo motivo, tra gli altri, definiamo
DesignNet un ‘sistema conoscitivo’, come
recita anche il titolo di questo libro, e non
solo un archivio o un ‘sistema informativo’.
[ 11 ]
Traduzione non letterale di cultural seeds,
espressione utilizzata nella presentazione del
programma DesignNet, in occasione dell’incontro di lavoro Iniziative e progetti
digitali del Politecnico, Politecnico di
Milano, 1 ottobre 2004. La presentazione è
visibile sul sito
<http://www.biblio.polimi.it/progetti/
incontro_bibdig>
[ 12 ]
Non conosco l’esistenza di studi scientifici
sull’argomento, ma sembra incredibile
l’ipotesi che molti designer soffrano della
sindrome del collezionismo, della raccolta
di frammenti documentali che ‘potrebbero
essere utili’ - se (ri)contestualizzati o
(ri)combinati con altre risorse documentali
Sistemi conoscitivi per il design: una proposta metodologica
| 17
- per generare nuove soluzioni. Si pensi
all’armadietto nello studio Castiglioni,
all’interno del quale si trovano oggetti e
componenti della cui raccolta è difficile
immaginare la ragione (sarebbe anche difficile dare un nome a quell’armadietto:
archivio? di cosa?). Solo osservando gli
oggetti progettati dal designer - creando
quindi la connessione tra quell’oggetto,
quel frammento, e il prodotto industriale si può capirne (forse) il senso, capire cosa
ha generato quel seme.
poco o perché non abbiamo il tempo e la
voglia di scegliere tra i milioni di stimoli e
di informazioni che ci bombardano. È
vero, le eccedenze cognitive appaiono un
ingombro senza valore in un quadro di
scelte e di comportamenti dominato dalla
razionalità strumentale. Ma sono invece il
sale della ragione riflessiva. Per rendere
solido - riflessivamente solido - il terreno
in cui si vuole agire, serve, infatti, un lavoro di esplorazione della complessità che
non produce vantaggi immediati ma può
cambiare la posta in gioco» (pp. 395 ssg.).
[ 13 ]
Sempre per restare nel campo dei materiali, si parla qui, ad esempio, delle caratteristiche estetico-sensoriali contrapposte a
quelle tecnico-funzionali.
[ 14 ]
Insieme alla sindrome del collezionismo,
c’è un altro atteggiamento che sembra tipico del designer, anche questo (ancora) non
verificato scientificamente: l’uso della macchina fotografica digitale come bloccoappunti visuale (visual notebook) da portare sempre con sé.
[ 15 ]
K. Weick, The Social Psycology of
Organizations, Random House, London
1969, citato da E. Rullani, Economia della
conoscenza. Creatività e valore nel capitalismo
delle reti, Carocci, Firenze 2004, p.p. 400.
[ 16 ]
«Le eccedenze cognitive - dice Rullani non sono soltanto il sovrabbondante prodotto - senza costo e senza valore - che
risulta dalle capacità moltiplicative della
propagazione cognitiva. Non sono un ‘di
più’, un superfluo di cui potremmo fare a
meno, me che tolleriamo perché costano
18 |
[ 17 ]
Il 22 aprile 2004, con Decreto del
Ministero per i Beni e le Attività Culturali
- Soprintendenza Regionale per la
Lombardia, la Collezione Storica Premio
Compasso d’Oro ADI è diventata la prima
collezione di Design riconosciuta ‘patrimonio di eccezionale interesse artistico e storico’. Il decreto recita: (Omissis) «La serie di
651 oggetti di design costituenti la
Collezione Storica Compasso d’Oro ADI
(1954-2001) individuata nelle premesse è
dichiarata di eccezionale interesse artistico
e storico ai sensi degli artt 2, 1° co., lett. C,
e 6, 2° co., del D.L. 490/99 e, come tale, è
sottoposta a tutte le disposizioni di tutela
contenute nel citato Decreto Legislativo».
2
Evoluzione dei documenti e della biblioteca nell’era digitale
Perla Innocenti
This is not the Library, the Library is within
Iscrizione nella Yale University Library
Nel corso della loro storia le biblioteche 1 non sono certamente rimaste estranee ai cambiamenti: nuove tecnologie e nuovi tipi di utenti hanno richiesto
nel tempo un ripensamento dei metodi e degli strumenti. La differenza, oggi,
è nella scala e nella rapidità dei cambiamenti, nel passaggio dalle raccolte e
dai cataloghi alle persone e ai processi di tipo proattivo (Fig. 1) (cioè verso le
attività necessarie alla trasformazione delle risorse disponibili in elementi di
servizio), e nel rapporto con il sistema aperto della biblioteca 2. Questi processi – basati su nuove forme di cooperazione, collaborazione, elaborazione e
scambio delle conoscenze – sono sostenuti dall’uso delle nuove tecnologie
digitali, che permettono possibilità senza precedenti: la multimedialità (con
l’ingresso del digitale negli anni ‘70), la connettività (con la commutazione di
pacchetto) e la mobilità (con l’avvento del wireless).
Tuttavia, come ricorda Giovanni Di Domenico, «il problema rimane quello
di elaborare e trasmettere le conoscenze necessarie alla organizzazione di realtà, strategie e attività di servizio non attorno ai documenti, neanche attorno
alle tecnologie, ma attorno ai bisogni diversificati di apprendimento, di infor-
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 19
mazione e di conoscenza degli uomini (degli individui, come dei gruppi e
delle comunità). Il controllo dell’universo documentario, l’offerta informativa, le pratiche e gli strumenti della mediazione sono funzionali al soddisfacimento di questi bisogni» 3.
2.1 L’universo biblioteche oggi: tendenze in atto
Gli elementi distintivi dell’attuale Knowledge Society (che identifica la conoscenza come fattore produttivo dominante), altrimenti detta Learning Society (la
società dell’apprendimento permanente), sono sostanzialmente due: da un lato,
la profonda metamorfosi e riarticolazione del tradizionale sistema della produzione, circolazione e fruizione del sapere; dall’altro, una crescita vertiginosa della
produzione documentaria sia in formato analogico che, soprattutto, digitale.
Nell’era digitale, al di là delle nuove metafore coniate in questi anni (biblioteca elettronica, digitale, virtuale e, più recentemente, ibrida e diffusa 4), non
sono le funzioni della biblioteca in senso lato ad essere mutate, quanto piuttosto le modalità di gestione, l’organizzazione spaziale e i servizi (Fig. 2), grazie all’utilizzo di nuove tecnologie di fruizione per nuove tipologie di documenti e di informazioni (Fig. 3). Non più soltanto la semplice ‘forma libro’,
ma documenti digitali per loro natura instabili e complessi, da poter scambiare e manipolare. Utilizzo il termine ‘documenti digitali’ in luogo di ‘risorse
elettroniche’ perché mi sembra cogliere in modo più accurato gli aspetti
essenziali del problema.
Catena dei processi di una biblioteca
processi di realizzazione
START:
Esplicitazione
della mission
e della
politica
di offerta
A
Analisi
dei bisogni
informativi
e culturali
degli
utenti
K
Logistica/
Gestione spazi
e attrezzature
B
Progettazione
dell’offerta
culturale
L
Gestione
del sistema
informativo
C
Gestione
del
patrimonio
e delle
risorse
informative
M
D
E
Promozione
dell’offerta
di servizi
ed eventi
Gestione
di servizi
agli utenti
N
Amministrazione Gestione
e controllo
della
di gestione
Sicurezza
F
Gestione
di servizi
integrati
con altri
Soggetti
P
Gestione/
sviluppo
Risorse Umane
G
Verifica
di efficacia
dell’offerta
Q
Gestione
del Sistema
per la Qualità
processi di supporto
[Fig. 1] L’insieme dei processi di realizzazione e supporto attivi in una biblioteca (da Regione
Lombardia, IREF, Le professionalità operanti nel settore dei Servizi culturali, 2001)
20 |
Dal punto di vista concettuale, come ha evidenziato anche Riccardo Ridi, «il
termine ‘risorsa’ viene considerato troppo generico per indicare documenti
analogici e lo si abbina, in tal caso, ad aggettivi come ‘informativa’ o ‘documentaria’, mentre in ambito digitale (e soprattutto di rete) ‘risorsa’ e ‘documento’ vengono sostanzialmente utilizzati come sinonimi» 5.
Dal punto di vista tecnico, inoltre, l’informazione digitale può essere in principio rappresenta in forma non elettronica, per esempio utilizzando tecniche
ottiche o quantiche, laddove l’informazione elettronica può non essere necessariamente digitale. E come ha recentemente rilevato anche Barbara Tillett «il
termine ‘risorse elettroniche’ è artificioso – quando vado a incontri sulle
biblioteche digitali, ‘elettronico’ ha il significato di piccoli accessori, quali
asciugacapelli o forni a microonde» 6.
A questo proposito risultano interessanti le definizioni dei supporti ottici
riportate nella Deliberazione n. 42/2001 dell’Autorità per l’Informatica nella
Pubblica Amministrazione (AIPA). Con una valutazione più agile del mondo
in continua evoluzione dei supporti ottici, la deliberazione propone un’inedita classificazione del documento, distinto in analogico e digitale, facendo
rientrare il documento informatico, conforme al DPR 445/2000, nel più
ampio concetto di documento digitale 7.
Con i supporti analogici, ad esempio cartacei o audiovisuali, vi è una ‘analogia’ tra il processo e la forma: anche senza un’attrezzatura specifica di playback si può sostanzialmente simulare l’esperienza del supporto, mentre con il
digitale è necessario un dispositivo specifico che esegua delle operazioni logiche e di calcolo con quantità rappresentate dai digiti, generalmente in un
sistema binario. L’avvento dei documenti multimediali digitali ha reso questo
panorama ancora più variegato e complesso 8.
Modernizzazione (biblioteca elettronica)
Innovazione (biblioteca virtuale e digitale)
Trasformazione (learning resource center)
[Fig. 2] Evoluzione delle biblioteche (P. Innocenti)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 21
A differenza di un passato in cui i documenti delle biblioteche erano eminentemente di carattere alfanumerico e cartaceo, oggi dunque i contenuti e i supporti materiali dei documenti sono incredibilmente eterogenei e diversificati,
così come le tecniche e tecnologie necessarie per la loro produzione, distribuzione, conservazione, organizzazione e fruizione. La raccolta di una biblioteca
odierna può consistere di una o più di queste tipologie: documenti analogici
posseduti dalla biblioteca e aventi una precisa localizzazione fisica; documenti
digitali posseduti dalla biblioteca e disponibili per l’uso locale; documenti
analogici posseduti da altre biblioteche ma disponibili attraverso sistemi interbibliotecari di condivisione delle collezioni e cataloghi collettivi; documenti
digitali ad accesso riservato, che la biblioteca non possiede ma cui fornisce
accesso tramite contratti a pagamento.
Prima dell’avvento del Web, la biblioteca tradizionale imponeva la fruizione
on-site di documenti analogici di una collezione just-in-case. L’ambiente
informativo era relativamente stabile e costituito per la maggior parte da
materiali a stampa; le dimensioni delle collezioni erano un indicatore della
qualità della biblioteca, che poteva così soddisfare in modo adeguato i bisogni
informativi dei suoi utenti; gli acquisti erano predittivi.
Il contenuto era mantenuto attraverso la conservazione dell’oggetto fisico, costituito da materiali organici, e la conservazione era distinta dalle questioni relative
all’accesso, costituito da una serie di strumenti correlati ma non integrati. Gli
utenti si recavano in una biblioteca per accedere e utilizzare specifiche informazioni e, per via delle limitazioni spazio-temporali delle tecniche utilizzate per la
descrizione di documenti analogici (catalogo cartaceo per autore e per soggetto),
analogico
analogico
(documenti cartacei, fotografici e audiovisivi, registrazioni sonore, nastri magnetici)
analogico
(documenti digitalizzati)
analogico
analogico
(documenti digitali nativi)
analogico
[Fig. 3] Evoluzione delle modalità di trasmissione e fruizione dei documenti (P. Innocenti)
22 |
era dato per scontato che l’utente avesse già abbastanza informazioni in anticipo,
prima di andare in biblioteca, e che sapesse già cosa cercare.
Nel nuovo ambiente digitale si presenta un diverso panorama: la biblioteca
digitale va a completare ed integrare la biblioteca tradizionale, con una fruizione just-in-time delle risorse digitali native o digitalizzate, una nuova concezione
dei cataloghi e degli accessi e l’utilizzo di tecnologie digitali. Le procedure interne sono state automatizzate per una gestione integrata del ‘circuito del documento’ e il catalogo 9 costituisce una base di dati unica e non sequenziale, indicizzato per autore, per soggetto, per classe, ma recuperabile da qualsiasi elemento e con varie modalità. E, aspetto determinante, è possibile accedere in remoto
non più soltanto all’informazione sul documento, ma al documento stesso
(digitale o digitalizzato), disponibile contemporaneamente a più persone grazie
ad una sempre maggiore convergenza documentale, tecnologica, professionale 10.
Le novità, nello scenario sopra delineato, sono l’indipendenza dall’ubicazione
e la centralità dell’utente 11, in particolare in ambito universitario, dove le
biblioteche sono il principale centro servizi. In questo contesto possono risultare preziose le teorie del Knowledge Management, che riguarda propriamente
l’acquisizione, la creazione e il packaging (o l’applicazione o il riuso) della
conoscenza servendosi dei vantaggi offerti dalle Information Communication
Technologies e dalle sue estensioni Web-enabled: capacità di creazione, elaborazione, immagazzinamento e scambio in breve tempo di grandi quantità di
informazioni in tutte le loro forme, nuovo tipo di interazione e di disponibilità dell’informazione tramite teletrasferibilità a distanza, supporto di quasi
ogni tipo di informazione visuale, tramite i processi di vettorializzazione e/o
discretizzazione che permettono di rendere l’informazione richiamabile non
solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in base
a caratteristiche visuali.
Quando Jorge Louis Borges ne La biblioteca di Babele ipotizzò un sapere
indefinito, ma infinitamente grande e infinitamente connesso, decretandone
il senso nel contempo assoluto e surreale, per la prima volta ipotizzò, inconsapevolmente, ciò che la rivoluzione dell’era informatica dell’Internet Visual
Computing avrebbe reso reale.
2.2
Le biblioteche universitarie dall’automazione alla trasformazione:
il contesto internazionale
Peter Lyman ha evidenziato un processo a tre fasi degli effetti delle
Information Communication Technology (ICT) sulle biblioteche 12:
1. modernizzazione (fare ciò che si sta già facendo, ma in modo più
efficiente servendosi dell’automazione per la gestione di collezioni di
documenti, soprattutto cartacei);
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 23
2. innovazione (sperimentare le nuove possibilità offerte dalle ICT);
3. trasformazione (modificare la natura dell’organizzazione attraverso
le ICT).
Questo schema è utile per capire cosa le dinamiche in atto negli ultimi anni
nelle biblioteche universitarie, come parti di un contesto più ampio che
include il mercato dell’editoria e dell’informazione, le nuove modalità di
comunicazione del mondo accademico, e l’evoluzione in atto nella comunità
degli utenti. Le ICT hanno profondamente modificato tutti gli aspetti della
didattica universitaria e post-universitaria, e queste trasformazioni sono tuttora in corso 13.
Nella fase di modernizzazione, attraverso l’automazione, a partire dal mondo
anglossassone le biblioteche universitarie hanno utilizzato un’ampia gamma di
tecnologie dell’informazione per la gestione di collezione di documenti primariamente cartacei. Un primo periodo ha dato origine alla catalogazione
partecipata e all’automazione dei processi amministrativi, favorendo l’efficienza e il controllo dei costi. Questi sistemi hanno costituito un importante precedente nell’utilizzo dei computer e dei sistemi di rete per la collaborazione e
cooperazione interbibliotecaria. I consorzi bibliotecari americani degli anni
‘60 e ‘70, oggi consolidati in due principali sistemi di catalogazione partecipata – Online Computer Library Centre e Research Libraries Information
Network – sono stati i pionieri della catalogazione condivisa.
In un secondo momento della fase di modernizzazione vi è stata l’ascesa dell’accesso pubblico. A partire dagli anni ‘80, i database di catalogazione partecipata sono diventati sufficientemente consistenti dopo operazioni di catalogazione retrospettiva e di utilizzo per le nuove acquisizioni, e si è diffuso un
formato di record di catalogo leggibile al calcolatore, il MARC.
Parallelamente, come previsto dalla legge di Moore, i costi delle tecnologie
dell’informazione (in particolare dei sistemi interattivi) sono scesi e le potenze
computazionali sono aumentate, rendendo possibile l’utilizzo su più larga
scala di applicazioni informatiche. Questa nuova fase ha determinato dei drastici cambiamenti nei servizi visibili agli utenti: il primo risultato è stato quello dell’OPAC (Online Public Access Catalog), di cui il MELVYL della
University of Berkeley, California è il più importante esempio. L’OPAC andava a sostituire il più tradizionale catalogo cartaceo, permettendo operazioni
prima impensabili: possibilità di ricerche multiple con accesso su tutto il posseduto delle biblioteche di ricerca, tramite record bibliografici. Il diffondersi
dei network e dei consorzi universitari hanno stimolato la condivisione delle
risorse informative, dando luogo a collezioni virtualmente condivise. Con gli
sviluppi di Internet, i cataloghi delle biblioteche hanno cominciato ad essere
in rete, permettendo così l’accesso remoto. Tuttavia, il livello di granularità
24 |
offerto dai cataloghi era ancora irrilevante per molti utenti, in particolare per
quelli delle discipline scientifiche, poiché non permetteva di ricercare i singoli
articoli dei periodici ma soltanto le testate e le annate delle stesse. Servizi di
abstract e di indicizzazione degli articoli dei periodici come l’Index Medicus
(l’attuale MEDLINE) cominciarono a dar vita a database specializzati, alcuni
dei quali disponibili commercialmente anche online, molto costosi e progettati per essere utilizzati da utenti esperti. La possibilità di offrire ricerche su
vasta scala a persone diverse dei ricercatori che lavoravano per l’industria era
economicamente impensabile. Tra la fine degli anni ‘80 e gli inizi degli anni
‘90 questi database iniziarono però ad essere implementati per l’accesso pubblico interattivo, costituendo un impatto oggi forse non percepibile nell’ampliamento delle risorse disponibili per gli utenti e delle modalità di ricerca,
sebbene i costi si siano mantenuti abbastanza elevati e le biblioteche non
dispongano della proprietà dei database ma soltanto delle licenze d’uso.
Il risultato di questo passaggio dei cataloghi della biblioteca alla dimensione
del anytime, everywhere è stata la massiccia richiesta, da parte di un numero
sempre maggiore di utenti, non più soltanto di servizi bibliografici online ma
di contenuti disponibili sul Web. È importante rilevare anche il cambiamento
della prospettiva: dai sistemi altamente ottimizzati ma chiusi, progettati per
un utilizzo in loco su hardware speciale, a servizi online progettati per un utilizzo su computer di uso comune e basati su protocolli di rete standard utilizzati dall’industria. Lo stesso periodo ha visto notevoli investimenti nell’ambito delle risorse condivise: i grandi cataloghi nazionali come il nostro Servizio
Bibliotecario Nazionale (SBN) e gli sviluppi del prestito interbibliotecario ne
sono un esempio. Contestualmente sono emersi in modo sempre più critico
le restrizioni e i problemi legati al copyright e al diritto d’autore, che costituiscono un limite significativo allo scambio regolare di risorse di qualità tra istituzioni. Così se la rete è diventata sempre più ubiqua con la crescente digitalizzazione delle risorse, è evidente che la condivisione delle stesse risorse è tecnicamente possibile ma giuridicamente complessa da attuare.
Nell’ultimo periodo della modernizzazione, i cataloghi online hanno creato
una forte richiesta di contenuti da poter accedere sul Web. Tra la fine degli
anni ‘80 e l’inizio degli anni ‘90 il costo delle memoria e le tecnologie di visualizzazione con file bitmap di immagini o testi ASCII è notevolmente diminuito, e l’HTML ha offerto un’ulteriore alternativa a editori e società di database
per offrire il proprio materiale alle biblioteche. La convenienza dei contenuti
digitali era così impressionante che moltissimi utenti hanno cominciato ad
ignorare il materiale disponibile solo su carta, anche se a volte più appropriato,
e a considerare i motori di ricerca una fonte primaria di informazioni.
A partire dalla fine degli anni ‘80-inizio anni 90, forzate a reagire all’impatto
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 25
culturale ed economico delle ICT, il focus delle biblioteche si è progressivamente spostato dall’automazione alla definizione del loro ruolo e dei servizi
nell’era digitale, in cui sono stati determinanti la progressiva importanza del
World Wide Web alla metà degli anni ‘90 e l’ascesa della computer science e
del nuovo ruolo dei database in tutti i campi dell’istruzione.
I progressi delle ICT e la rivoluzione del Web hanno funzionato da catalizzatori per le innovazioni e le trasformazioni nel mondo della comunicazione,
della didattica e della ricerca universitaria. Nella ricerca, ad esempio, i ricercatori sono oggi in grado di lavorare continuamente a contatto con colleghi in
tutto il mondo, su progetti di ricerca e sviluppo collaborativi.
Nell’insegnamento in aula vi sono nuove modalità di didattica esperienziale,
hands-on, spesso focalizzati sull’interazione Web-based, che possono avvenire
sia nelle aule che nel cyberspazio. L’esperienza del campus non è più totalizzante ma diventa il crocevia di una serie di attività ed esperienze interdisciplinari spesso o in parte svolte al suo esterno, il che riflette l’atteggiamento dell’università stessa.
I cambiamenti che avvengono nell’università devono essere rispecchiati da
quelli nella sua infrastruttura informativa, che ha il suo cuore nella biblioteca
universitaria. Tra il fiorire di sperimentazioni innovative e creative, è emersa
l’idea di un ambiente informativo in rete che si presenta come una vasta
costellazione di contenuti e servizi digitali online, accessibili in ogni momento
da qualsiasi connessione remota, da poter essere utilizzate più volte, navigate,
manipolate, integrate, personalizzate per gli obiettivi e le esigenze di ogni
utente. L’identificazione delle risorse più appropriate ha posto il problema di
chi dovesse farsi carico della responsabilità dell’organizzazione di network di
risorse e le relazioni tra information provider e information user sono diventate più complesse, ma la condivisione di risorse a livello internazionale è
risultata certamente facilitata.
L’utilizzo del Web è diventato critico in molte forme di comunicazione universitaria: i pre-print e i report tecnici sono diventati ampliamente disponibili
online e attorno ad essi si è sviluppato il movimento dell’Open Access; monografie e testi di consultazione sono confluiti in database e siti Web e in particolare nel mondo scientifico, dalla fisica alle scienze naturali, dalla biologia
alla genetica, ma anche nell’ambito delle scienze sociali e in parte degli studi
umanistici.
All’inizio degli anni ‘90 in ambito anglosassone l’idea della biblioteca digitale è diventata molto popolare, in parte grazie ai programmi di finanziamento
ARPA/NSF/NASA. I contenuti digitali hanno anche facilitato la creazione di
e-reserves e hanno supportato i progetti di Online Distance Learning. Nel
frattempo le aspettative degli utenti hanno registrato una nuova svolta: per26 |
sonalizzazione della visualizzazione delle risorse informative, current awareness, sistemi di rating o selezione collaborativa sono stati sviluppati per gli
utenti del Web.
Questa impressionante mole di cambiamenti (nelle collezioni, nelle modalità
d’accesso, negli spazi fisici e virtuali della biblioteca, nella conservazione, nelle
attività), insieme alla coesistenza di nuovi supporti e dei processi ad essi legati
con i documenti di tipo tradizionale, ha sollevato questioni metodologiche e
strumentali: una così alta percentuale di contenuti si trova al di fuori del perimetro (fisico e concettuale) della biblioteca e dell’intero sistema editoriale tradizionale che non è chiaro quanta responsabilità possano o debbano assumersi le biblioteche in merito, e in che modo. Un aspetto rilevante di tale problematica è costituito dalla qualità dei documenti, che fa la differenza tra le collezioni e i servizi della biblioteca e l’enorme e caotico oceano informativo
disponibile sul Web.
Vi sono inoltre vari problemi di carattere economico, a fronte di budget sempre più ridotti. Il costo e l’ingombro delle pubblicazione scientifiche universitarie continua a crescere senza controllo, i documenti stampati tra la fine del
XIX e l’inizio del XX secolo, prevalentemente su carta acida, continuano a
disintegrarsi e richiederebbero investimenti in conservazione e/o digitalizzazione. Le spese per nuovi servizi vanno poi ad aggiungersi a quelli già esistenti: dalla descrizione dei documenti digitali multimediali alla loro archiviazione, dalla questione dell’autenticità, dell’integrità e della provenienza dei documenti (e quindi del copyright e dei diritti intellettuali e di sfruttamento) alla
creazione di strumenti che ne permettano la manipolazione sul proprio
desktop.
La rivoluzione dell’informazione in rete è solo all’inizio, e probabilmente
occorrerà ancora qualche decennio per perfezionare la tecnologia e raggiungere masse di contenuto sempre più consistenti 14.
Le biblioteche universitarie oggi sono delle organizzazioni in cui i professionisti dell’informazione (bibliotecari e documentalisti) lavorano per garantire
accessi mirati e selettivi agli artefatti informativi con valore aggiunto che
fanno parte delle collezioni della biblioteca, così come a informazioni, risorse
e sistemi disponibili altrove, nella logica dell’accesso anytime-anywhere 15. E
non soltanto offrono servizi Web-based, ma sono anche progressivamente
coinvolte nella gestione e nell’organizzazione di collaborazioni e consulenze su
aspetti informativi dei contenuti didattici e di ricerca. L’utente e i suoi bisogni diventano il focus dei servizi informativi, il cui valore aggiunto è nella
valutazione, nell’analisi, nel ‘confezionamento’ e nelle modalità di divulgazione e di fruizione attivamente operate dal bibliotecario/documentalista.
Dunque non una strategia del libro o della digitalizzazione o della tecnologia,
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 27
ma una strategia dell’informazione, creando valore aggiunto attraverso strumenti di accesso che collegano le risorse selezionate da fonti disparate, fornendo collegamenti tra diversi strumenti di accesso all’oggetto informativo
nella sua interezza, favorendo l’integrazione e lo scambio dei documenti.
Questo processo sarà al contempo molto più impegnativo, ma anche più stimolante dell’automazione, e sarà proattivo: i cambiamenti nella pratica dell’editoria e della comunicazione universitaria, le applicazione della tecnologia
didattica e gli sviluppi delle leggi sulla proprietà intellettuale plasmeranno
gran parte del futuro delle biblioteche universitarie.
2.3 La situazione in Italia
Nel panorama internazionale la posizione dell’Italia è parzialmente disallineata
ma comunque attiva. Negli ultimi anni le caratteristiche nelle biblioteche delle
università italiane hanno determinato un alto grado di frammentazione e dispersione dell’informazione scientifica 16, parallelo ad un ampio uso dell’informatica e
dei servizi di reti telematiche che attesta modalità e supporti del tutto differenti
da quelli che hanno caratterizzato i primi secoli di vita della biblioteca moderna.
Per fronteggiare questa situazione, i sistemi bibliotecari di ateneo hanno registrato un notevole incremento degli investimenti per lo sviluppo di servizi e di
progetti sperimentali nell’ambito delle ICT anche d’avanguardia 17, dimostrando un approccio dinamico ed una sempre maggiore consapevolezza dell’importanza della funzionalità e dell’efficienza. Sembra tuttavia ancora lunga la strada
da percorrere, a livello locale e nazionale, per raggiungere gli esempi del
mondo anglosassone. Eterogeneità e specificità dei sistemi bibliotecari delle
singole università, elevato numero delle strutture e livello dei servizi spesso
non adeguato, uniti alla sostanziale autonomia normativa rispetto allo Stato
ma non amministrativa rispetto all’ateneo, alla frammentazione organizzativa
ed economica, all’assenza o carenza di monitoraggio, evidenziano un quadro
non ancora sistemico e organico rispetto ad altre realtà internazionali 18.
La cooperazione inter-universitaria, che contribuisce al superamento dei particolarismi spesso riscontrati in ambito bibliotecario, si è manifestata intorno
ad obiettivi concreti e specifici: i consorzi per la condivisione delle risorse
elettroniche (CILEA, CIPE e CIBER), metodi e attività di monitoraggio dei
sistemi bibliotecari (GIM), la cooperazione e collaborazione tra biblioteche in
vari settori di attività ed in progetti innovativi (DAFNE); i network disciplinari (CNBA, ESSPER Matematica). Con l’anno accademico 2001/2002 è
inoltre entrata in vigore la riforma degli ordinamenti didattici con l’istituzione della laurea triennale, che ha determinato un ampliamento dell’offerta
didattica, ma anche l’incremento delle spese per le retribuzioni (legato all’aumento degli insegnamenti attivati). Ciò sembra aver prodotto una generaliz28 |
zata contrazione delle spese, tra cui quelle per l’acquisizione del materiale
librario, rimarcando ancora una volta un forte sbilanciamento fra l’offerta
didattica e l’offerta di servizi bibliotecari.
Il rapporto con l’utenza primaria dei docenti e degli studenti è caratterizzato
dall’assenza o dalla lentezza della cosiddetta ‘fidelizzazione’, che risulta in
un’occasione mancata di fruizione della biblioteca come laboratorio didattico
e scientifico e luogo di apprendimento interattivo e socializzato. Dal punto di
vista informatico, i pacchetti software utilizzati negli atenei per la gestione del
catalogo digitale sono eterogenei, spesso anche all’interno di una stessa università. Anche se la tendenza generale è quella di dotarsi di uno strumento di
gestione unitario, sembra utopistica l’idea di un software unico per le biblioteche di tutte le università italiane, visto anche che l’adesione al Servizio
Bibliotecario Nazionale (SBN) non è assolutamente generalizzata. Il
MetaOPAC Azalai italiano (MAI), che al momento offre una copertura solo
parziale dei cataloghi delle università, potrà forse in futuro rispondere alle
principali esigenze degli utenti di un catalogo nazionale.
Aspetti critici, oltre alla limitata capacità di sviluppo delle collezioni, risultano
essere la mancanza di una politica accademica e nazionale a sostegno dei sistemi bibliotecario universitari, oltre all’esistenza di un doppio livello di biblioteche universitarie, divise tra quelle più antiche, che appartengono al Ministero
per i Beni e le Attività Culturali e sono pertanto fuori dal controllo delle
rispettive università, e quelle moderne nate come servizio a istituti e dipartimenti, che costituiscono oggi il fulcro dei servizi bibliotecari degli atenei.
2.4 Sfide e scenari prossimi venturi
Come ha rilevato il sociologo Manuel Castells 19, il nuovo paradigma informativo della società in rete presenta cinque caratteristiche:
1. l’informazione è materiale grezzo sui cui agiscono le nuove tecnologie;
2. gli effetti delle nuove tecnologie sono pervasivi e stanno plasmando
tutti i processi delle nostre esperienze individuali e collettive;
3. la logica di networking ben si adatta alla sempre crescente complessità dell’interazione e agli imprevedibili percorsi di sviluppo, e può
essere implementata in tutti i tipi di processi e organizzazioni;
4. tutti i processi sono reversibili e possono essere riconfigurati, in una
società sempre più caratterizzata dal costante cambiamento e dalla
fluidità organizzativa;
5. è in atto una crescente convergenza di tecnologie specifiche in un
unico sistema altamente integrato.
Le ICT sono al tempo stesso un prodotto della Knowledge Economy e un
catalizzatore dei cambiamenti da essa apportati. Se le informazioni e la conoCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 29
scenza sono il carburante di questa economia, le biblioteche possono e devono essere i carburatori e le pompe di iniezione che rendono le informazioni
disponibili quando e dove esse sono richieste. Alcuni esperti del settore, tra
cui Clifford Linch 20, hanno identificato i seguenti elementi chiave per le
biblioteche universitarie del XXI secolo:
- creazione di una nuova definizione del canone dell’editoria e della
comunicazione universitaria e delle relazioni delle biblioteche universitarie in rapporto ad essa, in termini di acquisizione o selezione,
organizzazione, gestione, accesso e conservazione;
- problematiche legate all’acquisizione, alla gestione e alla conservazione di materiali ‘grezzi’ per la didattica e la ricerca, a mano a mano
che questi materiali diventano digitali e si diversificano e lo sviluppo
delle ICT prosegue a ritmi sostenuti;
- identificazione di un nuovo equilibrio tra azioni collettive e centralizzate e attività locali: in un mondo di risorse condivise su rete, si tenderà a centralizzare ulteriormente la gestione, l’organizzazione e la
descrizione e aumenteranno le convergenze tra biblioteche, centri
informativi e dipartimenti di informatica 21;
- progressivo sviluppo di applicazioni e sistemi in-house, in opposizione all’acquisto di software proprietari;
- le biblioteche dovranno sempre più occuparsi di questioni contabili,
finanziarie e legali (inerenti copyright e proprietà intellettuale), oltre
che rivedere il loro status giuridico e sostenere il riconoscimento della
biblioteca e dei bibliotecari universitari nella società;
- risoluzione dei sistematici problemi di finanziamenti, tramite l’introduzione di alcuni servizi a pagamento e la ricerca di sponsor;
- sviluppo di nuovi ruoli per le biblioteche nel contesto universitario,
abbracciando campi e raggiungendo comunità di utenti sempre più
ampie e diversificate, anche in relazione alla crescente competizione
tra gli atenei: insegnamento dei principi di base dell’information
retrieval e la valutazione delle risorse informative; progettazione e
gestione di prodotti didattici multimediali; partnership in progetti di
ricerca e programmi su temi specifici dell’informazione e della documentazione; supporto di programmi e prodotti per l’informazione a
distanza; fornitura di materiali didattici, in particolare di learning
object; gestione delle problematiche relative ai diritti e della proprietà
intellettuale, anche in una prospettiva di e-commerce; tirocini e consulenze nell’ambito della strutturazione, rappresentazione, organizzazione e conservazione dei dati. A tali scopi aumenterà anche l’utilizzo
di figure paraprofessionali esperte nelle ICT.
30 |
La cooperazione tra le biblioteche universitarie e la tendenza a creare a consorzi
regionali o disciplinari sarà uno dei fattori che influenzeranno di più la visione
della biblioteca universitaria, influenzando le politiche di gestione delle collezioni. A loro volta, i progressi delle ICT porteranno ad una sempre maggiore integrazione di diverse tipologie di supporti, e con la disponibilità futura di più
potenti larghezze di banda e di oggetti informativi multimediali sarà possibile
progettare, sviluppare e alimentare sistemi interattivi molto più sofisticati.
I software si stanno già evolvendo da applicazioni sul desktop o client-server ad
applicazioni online: La fase successiva di questa evoluzione consisterà nello sviluppo di sofisticati servizi Web, che facilitano un’interazione diretta tra i programmi senza bisogno dell’intervento dell’utente e costituiscono delle componenti funzionali che possono combinarsi dinamicamente con altri servizi, per
creare applicazioni più potenti ed efficaci. La biblioteca digitale del futuro offrirà smart media service che abbinano contenuti multimediali interattivi allo specifico contesto dell’utente, offrendo un’esperienza personalizzata cui accedere
tramite un’unica password. Una componente chiave per il successo del modello
dei servizi Web interoperabili sarà l’utilizzo dell’Extensible Markup Language
(XML) e dello Standard General Markup Language (SGML) 22.
Attraverso l’identificazione, la selezione e l’organizzazione dei servizi di accesso all’informazione, i bibliotecari universitari copriranno un ruolo sempre più
rilevante nel supporto alla didattica e alla ricerca universitaria 23, grazie anche
agli strumenti offerti dal Knowledge Management. Essi dovranno essere sempre più versatili, con ottime capacità comunicative e interpersonali, padronanza delle lingue e continuo aggiornamento professionale. La formazione
degli utenti, che presenteranno aspettative sempre maggiori, sarà uno dei più
importanti servizi della biblioteca user-oriented, perciò le capacità didattiche
saranno essenziali. Le competenze informatiche dei bibliotecari dovranno
comprendere, oltre l’utilizzo del computer, dei pacchetti applicativi del
desktop office e della conoscenza di Internet conoscenze avanzate dell’HTML
(e a breve del XML), progettazione di pagine Web e di sistemi informativi.
Oltre alle conoscenze biblioteconomiche, sarà utile la conoscenza di almeno
una delle discipline oggetto di insegnamento della didattica e della ricerca.
Infine, la valutazione dei bisogni degli utenti richiederà maggiori informazioni empiriche recuperabili attraverso la misurazione e valutazione, il monitoraggio e ricerca.
L’interazione tra i diversi protagonisti dello scenario delineato avverrà infine
in uno spazio sempre più condiviso:
1. tra biblioteche, con il progressivo ingresso e riorganizzazione funzionale in uno spazio condiviso digitale in rete e la digitalizzazione di
risorse e servizi;
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 31
2. nel campus dell’università, attraverso una biblioteca digitale, sistemi
di e-learning, il sito Web pubblico, la Intranet istituzionale, una
Intranet per gli studenti;
3. per il supporto della comunità universitaria, tramite la creazione di
repository istituzionali delle attività di ricerca e di didattica prodotte
dai membri. Oltre alle applicazioni commerciali come la Berkeley
Electronic Press (Bepress), sono attualmente disponibili varie applicazioni open-source, pronte per l’uso o in corso di implementazione, tra
cui E-prints 24 e D-Space 25;
4. nella gestione della didattica, come testimoniano gli esempi di MERLOT (Multimedia Educational Resource for learning and online teaching), E-science, Journal of Molecular Spectroscopy Supplementary
Material Archives, Advanced Computing Center for the Arts and
Design, Motion Capture Lab.
2.5 Spazi fisici: Learning Resource Centre e Information Commons
Con i cambiamenti nelle modalità di apprendimento e di insegnamento e
l’avvento dell’accesso remoto a sempre maggiori tipologie di documenti, la
qualità della consultazione e la concezione spaziale e temporale in cui essa
avviene ne risultano trasformate. Se anche il numero degli utenti che si reca
fisicamente in biblioteca diminuisse sensibilmente, chi vi andrà, come indicava Giovanni Solimine nel 1996, «avrà bisogno di più spazio, di una postazione di lavoro molto sofisticata e non solo di un posto di lettura» 26. Non
solo lo spazio per gli utenti, ma lo spazio per le risorse umane in generale,
per le operazioni di rielaborazione delle informazioni e per gli oggetti digitali
sarà maggiore.
La biblioteca universitaria, infatti, ospita progressivamente sempre più servizi e
attrezzature per sistemi informativi, per la comunicazione, per le risorse informative in rete, per lo sviluppo delle collezioni (ad esempio attrezzature per la
digitalizzazione o il post-processing), insieme a collezioni eterogenee di oggetti
analogici e digitali, e spazi di lavoro e di interrelazione per gli utenti, rappresentando un luogo d’incontro e di scambio per tutti i membri della comunità
accademica (per attività di information literacy, progressivamente inserite nel
curriculum universitario, e per eventi di vario tipo).
L’attenzione si muoverà sempre più dallo spazio e dal luogo alle persone e alle
attività nell’edificio, per offrire diversi tipi di spazio per un’ampia gamma di
attività e di servizi offerti dalla biblioteca, assicurando la massima flessibilità
per facilitare la riprogettazione in base ai nuovi bisogni degli utenti e ai cambiamenti tecnologici. È necessario una visione allargata del ruolo della biblioteca nell’ateneo, integrando funzioni aggiuntive orientate all’apprendimento
32 |
attraverso il continuo monitoraggio dei trend emergenti nell’educazione universitaria e l’analisi dell’impatto che essi avranno sui servizi della biblioteca e
sulle facility ad essa associata, in collaborazione con esperti di diverse aree 27.
Da alcune indagini completate nel 2000 28, sono emersi gli elementi che
influenzeranno la progettazione della biblioteca universitaria del futuro. In
primo luogo, le risorse a stampa saranno ancora necessarie e l’accesso al
mondo delle risorse in rete aumenterà sempre di più. L’equilibrio tra documenti analogici e documenti digitali varierà a seconda delle discipline, ma
certamente maggiore spazio sarà richiesto per la fruizione dei documenti digitali. Si continuerà a fare affidamento sulla possibilità di accedere e di usare
l’informazione dal campus, da casa e dal proprio spazio di lavoro, tramite le
postazioni della biblioteca o usando il proprio computer.
Gli utenti continueranno a studiare e a lavorare in modi diversi, in un’ottica
di life-long learning, richiederanno orari di apertura più lunghi, accesso 24
ore su 24 ai servizi di rete, sezioni di raccolte di documenti specializzate per
gli studenti post-laurea, incremento di sezioni a scaffale aperto, diversificazione delle postazioni. Le modalità di lavoro saranno spesso collaborative e si
serviranno di molteplici media, aspetti che influenzeranno lo spazio dello studio e il tipo di attrezzature necessarie. L’indipendenza tecnologica degli utenti
e la domanda per servizi self-service aumenteranno, ma sarà comunque necessaria l’assistenza nella scelta dei servizi e dei documenti disponibili 29.
Gli spazi di apprendimento dovranno essere flessibili, equipaggiati con varie
facility e network accessibili da gruppi di studio e di progetto, workstation
diversificate dotate di software per l’accesso online ma anche per la creazione
di risorse multimediali in una varietà di formati, e assistenza tecnica a portata
di mano. L’isolamento acustico sarà fondamentale in presenza di tali dispositivi, così come sarà sempre più importante che l’ambiente fisico sia ergonomicamente favorevole, esteticamente piacevole e sicuro. Crescente enfasi dovrà
essere posta sul potenziale sociale/di intrattenimento delle biblioteche universitarie con l’aggiunta di spazi espositivi e caffetterie.
Sarà perciò necessario che l’edificio sia sufficientemente flessibile per accomodare modifiche future portate dalla trasformazione delle modalità di insegnamento e apprendimento, non sottodimensionando gli spazi in fase di progetto.
La biblioteca universitaria assomiglierà sempre più di più ad un laboratorio,
dove gli studenti e i ricercatori integrano le informazioni da un’ampia gamma
di tipologie di media 30. Le implicazioni di questo cambiamento nella progettazione degli edifici non sono ancora state pienamente esplorate, e sono perciò necessari ulteriori studi sui nuovi comportamento degli utenti nel cercare,
selezionare e usare le informazioni, e su come questi potrebbero essere facilitati dalla progettazione e dalle attrezzature dello spazio fisico.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 33
Gli Information Commons 31 sono un primo tentativo di rispondere a questo
scenario, ponendosi come nuovo tipo di facility fisica specificatamente progettata per organizzare lo spazio di lavoro e i servizi in un ambiente digitale
integrato: sono caratterizzati da aree di workstation per uso individuale e collaborativo, con accesso ad un’ampia gamma di software oltre che di risorse
informative, assistenza da parte dello staff della biblioteca specializzato in
alcuni settori (computer, reference e nuovi media) che forniscono un servizio
senza soluzione di continuità, e spazi di lavoro di gruppo o individuali fisicamente vicini agli specialisti e alle tecnologie, secondo un approccio one-stop
shop. L’Information Commons della University of Southern California è stato
uno dei primissimi e più pubblicizzati tentativi di incorporare questo nuovo
tipo di spazio e di servizi, per fronteggiare ai nuovi bisogni dell’ambiente
digitale. L’esperienza ebbe un tale successo che raddoppiò gli spazi alla fine
del 1998 e da allora molte biblioteche nordamericane hanno adottato questo
modello 32.
In questo nuovo contesto Leighton e Weber 33 descrivono le due configurazioni di quella che chiamano la ‘meta-library’:
1. Integrated Facility: comprende sia la fornitura sia l’accesso all’informazione. Il risultato è un nuovo amalgama di funzioni e di spazi, che
riuniscono le risorse informative, le tecnologie, i servizi e professionisti dell’informazione di tutto il campus;
2. Learning Centre: si focalizza sul supporto alla didattica universitaria,
raccogliendo e riunendo sotto un unico tetto documenti, tecnologia,
studenti, docenti e professionisti dell’informazione. Gli studi universitari sono collegati ad altre attività educative e culturali ad hoc, in
uno spazio intellettualmente e socialmente integrato.
Questo modello di biblioteca universitaria, basato su una organizzazione
decentralizzata, è focalizzato sull’accesso distribuito ai servizi e continua ad
evolversi al di là delle sue mura. Anche in passato alcune collezioni della
biblioteca erano dislocate all’esterno, ma le tecnologie oggi consentono servizi
e consulenze ancora una volta distribuiti e riposizionati vicini agli utenti, nei
loro uffici e laboratori. Quali che siano le declinazioni di questo modello,
esso sarà guidato soprattutto dagli obiettivi didattici delle singole università,
dalla loro struttura organizzativa e istituzionale e dall’evoluzione dei comportamenti e delle richieste di una comunità di utenti sempre più eterogenea.
2.6 Spazi virtuali: biblioteche digitali e repository
Nonostante le molteplici riflessioni e gli sviluppi dell’ultimo decennio, non vi
è una definizione unica di biblioteca digitale e questo concetto viene inteso in
modo diverso dalle differenti comunità.
34 |
In questo volume si è adottata la famosa definizione utilizzata nel Workshop
on distributed knowledge environment di Santa Fé, secondo cui una biblioteca digitale «is not merely equivalent to a digitized collection with information management tools. It is rather an environment to bring together
collections, services, and people in support of the full life cycle of creation,
dissemination, use, and preservation of data, information, and knowledge»
34
. L’aspetto importante è che una biblioteca digitale possiede del materiale
digitalizzato e/o digitale nativo 35, conservato nel sistema di un computer in
una forma tale da poter essere manipolato e reso accessibile all’utente in
modi che non erano possibili con i materiali analogici. Una biblioteca automatizzata non è necessariamente una biblioteca digitale, poiché una biblioteca che consiste interamente di materiali analogici potrebbe anche essere
altamente automatizzata, ma questa automatizzazione non la rende ‘digitale’
nel senso indicato nel paragrafo 1.1. Tuttavia, è vero che una biblioteca
digitale deve essere automatizzata in alcune delle sue funzioni essenziali 36.
Da un punto di vista informatico, la biblioteca digitale viene costruita su
semplici componenti detti ‘oggetti digitali’. Un oggetto digitale è un modo
di strutturare in forma digitale l’informazione, in parte costituita da metadati. Le informazioni digitali però sono tutt’altro che semplici: una singola
opera potrebbe essere costituite da più parti parti, una struttura interna
complessa e una o più relazioni arbitrarie con altri lavori. Tutti gli oggetti
digitali hanno la stessa forma base, ma la struttura dell’insieme di oggetti
digitali dipende dal tipo di informazioni che essa rappresenta.
Da un punto di vista dell’utente, la biblioteca digitale è basata sul flusso
informativo e sull’organizzazione delle informazioni, con un modello a tre
livelli di distribuzione: fornitore dell’informazione (information provider), mediatore dell’informazione (information broker) e utente dell’informa-zione (information user). I fornitori dell’informazione tipicamente
producono contenuti digitali o digitalizzati di vari media e li conservano
in database con contenuti multimediali, oppure li acquistano da altri fornitori. Per facilitare il recupero dell’informazione da parte degli utenti, i
fornitori organizzano l’infor-mazione attaccando delle parole chiave al
contenuto (diverse tra fornitore e fornitore), mettendolo in sequenza e
così via, secondo percorsi di recupero tipici. Il secondo livello consiste di
mediatori dell’informazione, che creano dei database di link che puntano
ai contenuti dei fornitori di informazioni 37, secondo le modalità con cui
si ritiene che gli utenti vogliano accedere all’informazione. Un mediatore
d’informazione appare quindi agli utenti come un gigantesco fornitore di
contenuti. I mediatori possono anche fornire altri e vari servizi tra cui,
per esempio, filtro delle informazioni, mirroring dei database, gestione
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 35
del copyright e collezioni a pagamento degli information provider.
Infine, quando ci si riferisce alla biblioteca digitale in genere si maschera il fatto
che le biblioteche digitali esistono in forme diverse e con differenti funzioni,
priorità e obiettivi. I vari progetti sviluppati in tutto il mondo hanno ognuno la
propria personalità e riflettono le circostanze della loro nascita, le persone che se
ne sono occupate e i diversi responsabili. Le biblioteche digitali probabilmente
manteranno le loro caratteristiche distintive anche quando diventeranno maggiormente integrate e costruite su collezioni e servizi user-oriented. Ma vale la
pena di riflettere su dove porterà la traiettoria di sviluppo 38, e come verrà
descritto il patrimonio di documenti che viene progressivamente reso disponibile per la ricerca e la didattica attraverso l’impegno di istituzioni no-profit.
2.6.1 Le biblioteche digitali in ambito universitario
Il primo studio di quella che oggi sono definite ‘biblioteche digitali automatizzate’ venne effettuato al Massacchuttes Institute of Technology negli
anni ‘60 del secolo scorso, sotto la guida di J.C.R. Licklider 39. Negli anni
dei primissimi esperimenti di intelligenza artificiale, che alimentarono grandi speranze per l’imitazione dei processi umani tramite sofisticati algoritmi,
Licklider descrisse il progetto di quelli che chiamava ‘sistemi procognitivi’,
prevedendo che per l’anno 2000 si sarebbero superati i limiti fisici dei libri
e degli scaffali della biblioteca. Oggi molti dei risultati che egli aveva previsto sono diventati realtà, ma non tutti e non nei modi che egli si aspettava.
Lo sviluppo di sofisticati processi di elaborazione del linguaggio naturale è
stato più lento di quanto sperava, e i software di utilizzo generico sono
ancora lontani. Licklider e i suoi contemporanei avevano sottovalutato
quanto sarebbe stato possibile ottenere nella realizzazione delle biblioteche
digitali dalla sola forza computazionale, sfruttando le capacità di elaborazione di numerosi computer servendosi di algoritmi semplici, come è accaduto
in ambito universitario.
Lo sviluppo delle biblioteche digitali universitarie deve essere considerato nel
contesto complessivo delle iniziative volte a unificare le infrastrutture informatiche e tecnologiche nel campus e trasformare il processo di apprendimento attraverso tecnologie innovative. Negli ultimi anni la riduzione del costo
dell’hardware e la disponibilità di network a banda larga hanno reso accessibili all’istruzione un mix di sofisticati servizi digitali e Web-based, che stanno
rapidamente diffondendo contenuti digitali per il virtual learning environment di cui la biblioteca digitale è una delle componenti chiave.
Con il Web e le tecnologie telematiche i servizi della biblioteca si estendono
al di là del suo spazio fisico e si registra una sempre maggiore aspettativa per
servizi informativi personalizzati, veloci e sempre disponibili su dispositivi
36 |
fissi e mobili. Ma qual’è in generale il ruolo delle biblioteche universitarie
nello sviluppo delle biblioteche digitali? Al tempo dei primi progetti 40, si trattava di attività largamente sperimentali e sviluppate non dalle biblioteche
(come è il caso di SFX), ma dai centri di computer science e robotica
(Informedia), supercomputer (Internet Archive), laboratori di ricerca industriale (ResearchIndex), e si servono di staff altamente qualificato.
Successivamente, gli esperti di computer science hanno cominciato a collaborare con le biblioteche e varie organizzazioni sono state coinvolte nell’implementazione delle tecnologie delle biblioteche digitali, inclusa la Comunità
Europea, la Association for Computing Machinery (ACM), l’Institute of
Electrical and Electronics Engineers (IEEE), la International Federation of
Library Associations (IFLA), la American Library Association (ALA), the
Coalition for Networked Information (CNI) e la Digital Library Federation
(DLF). Anche le case produttrici di software per biblioteche hanno introdotto
i primi prodotti commerciali, destinati alle istituzioni didattiche che cercavano semplici soluzioni facili da installare e da manutere.
La maggior parte dei progetti di biblioteche digitali in ambito universitario
derivano da idee innovative sul futuro ruolo delle biblioteche in un ambiente didattico in rete, e sono stati finanziati grazie ad un sostanziale impegno
istituzionale. All’inizio degli anni ‘90 la biblioteca cerca di sfruttare Internet
per svolgere dei ruoli tradizionali, come ad esempio dare accesso ai cataloghi della biblioteca, ad alcuni materiali di reference e a periodici scientifici.
Con le successive sperimentazioni nella riformattazione digitale, accompagnate dalla retorica sull’accesso universale a tutta la conoscenza umana,
alcune biblioteche si sono focalizzate sull’accesso online a risorse selezionate. Giudicati alla luce delle aspettative iniziali, le prime collezioni sul Web
nella maggiore parte dei casi erano troppo piccole per supportare più di un
browsing casuale, troppo idiosincratiche per essere integrate in modo significativo in collezioni virtuali più ampie e troppo passive per mantenere l’interesse dell’utente a lungo.
L’ubiqua penetrazione delle tecnologie di rete oggi crea nuove opportunità
per forme più strette di associazione e condivisione delle risorse e il focus è
stato spostato sull’integrazione dei materiali digitali nella collezione della
biblioteca.
Le biblioteche digitali attuali sono più interessate ai sistemi di architetture
modulari e sono concepite come un complesso ambiente di servizi online
supportato da sistemi locali e globali, ognuno dei quali fornisce specifiche
funzioni e si interrala con gli altri in un modo rappresentabile attraverso
uno schema architettonico modulare. Questo modello non è solo sofisticato
ma anche pratico ed economico, permette maggiore libertà nella selezione
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 37
dei componenti di servizio e abilita la biblioteca a gestire e rispondere ai
cambiamenti tecnici con maggiore facilità, senza re-ingegnerizzare l’intero
ambiente di servizio.
2.6.2 Architettura, componenti e caratteristiche delle biblioteche digitali
Un ambiente completamente sviluppato di biblioteca digitale include le
seguenti componenti funzionali (Fig. 5):
- raccolta di documenti digitali nativi e/o di documenti da sottoporre a
digitalizzazione;
- estrazione o creazione di metadati o di informazioni di indicizzazione
che descrivono il contenuto, per facilitare la ricerca e la scoperta, così
come metadati amministrativi e strutturali per assistere nella visualizzazione, gestione e conservazione dell’oggetto;
- conservazione del contenuto digitale e dei metadati in un repository
multimediale appropriato, che includerà la gestione dei diritti e strumenti per l’e-commerce;
- servizi sul lato client per la query e il browsing;
- content delivery tramite trasferimento dei file o streaming media;
- accesso degli utenti attraverso un browser o un client dedicato;
- un network pubblico o privato.
1
Content
digitization/
acquisition
Network
6
Patron’s Browser
or Client
7
2
4
3
Rights Mgmt./
E-Commerce
File Transfer
Client Services
Streaming
Metadata
Extration
5
Multimedia
Content
Metadata
Content
Delivery
Repository
[Fig. 5] Componenti funzionali di una biblioteca digitale (da The digital library toolkit, 2000)
38 |
Queste componenti potrebbero anche non far tutte parti di un sistema di
biblioteca digitale, ma essere fornite da altri sistemi/ambienti correlati o multifunzionali.
Di conseguenza, l’integrazione è un tema essenziale: per interoperare con l’infrastruttura bibliotecaria esistente, la biblioteca digitale deve essere progettata per
lavorare con i cataloghi esistenti e per incorporare standard, formati e protocolli
bibliotecari. Per sua natura, le collezioni digitali richiedono un uso intensivo
delle tecnologie. Oggi i maggiori progetti di biblioteche digitali stanno mettendo
online collezioni di notevoli dimensioni (a volte milioni di oggetti digitali), che
richiederanno capacità di deposito misurate in Petabytes (1 Petabyte è l’equivalente di oltre 50.000 desktop computer con 20 Gigabytes di hard drive ciascuno).Poiché le biblioteche digitali variano in dimensioni e funzionalità, è
essenziale che le piattaforme tecnologiche sottostanti offrano le performance e
l’affidabilità richiesta. Inoltre gli utenti si aspettano servizi di alta qualità, il
che significa che non sono tollerabili tempi di attesa lunghi e risposte incomplete. Infine, poiché i costi sono sempre un aspetto critico, la scalabilità, l’efficienza e un’architettura di sistema aperta costituiscono dei requisiti chiave.
Anche le capacità di archiviazione devono essere scalabili per adattarsi alla
rapida crescita della domanda, e devono adattarsi a varie tipologia di media
che possono essere conservate in una biblioteca digitale:
- file di testo (relativamente stabili e non richiedono grandi quantità di
dati da archiviare);
- file di grafica (possono essere dinamici e richiedere grandi quantità di
dati da archiviare);
- file audio (altamente dinamici);
- file video (altamente dinamici e possono richiedere grandi quantità di
dati da archiviare).
L’uso di nuovi modelli computazionali, di Internet e dei portali, il crescente
numero di studenti al di fuori dal campus e la necessità di gestire meglio
risorse eterogenee in ambienti di rete hanno stimolato lo sviluppo di molte
applicazioni bibliotecarie. Per ottenere benefici reali e un modello economico
fattibile, le biblioteche digitali devono poter supportare la pratica non solo
didattica ma anche professionale dei vari ambiti disciplinari, da un lato sviluppando sistemi innovativi e dall’altro educando gli utenti al loro utilizzo 41.
L’accesso all’informazione dovrebbe essere inserito senza soluzione di continuità in un sistema integrato che superi le limitazioni dei materiali cartacei e
supporti il lavoro degli utenti, l’accesso alle informazioni e il loro utilizzo e
applicazione.
Alcuni esempi famosi in quest’ottica sono quelli dell’Art Museum Image
Consortium (AMICO) 42, della University of California at Berkeley 43, della
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 39
Cornell University 44, dell’Harvard University 45, di JSTOR 46 e della Stanford
University 47.
Gli applicativi realizzati in-house sono frequenti nei primi progetti di biblioteche digitali, principalmente perché le soluzioni commerciali adeguate
hanno cominciato ad essere disponibili in tempi relativamente recenti.
Questo approccio oggi presenta sia vantaggi che svantaggi. Tra i primi vi è la
possibilità di modellare l’applicazione sui bisogni specifici dell’utente, e di
spalmare il costo iniziale su un lungo periodo di utilizzo senza ulteriori spese
di licenze o di manutenzione. Lo sviluppo futuro è controllabile e prevedibile, e non vi dovrebbero essere dubbi sulla costante disponibilità del sistema.
Il costo dello sviluppo e del mantenimento di un ambiente complesso di
gestione di multimedia è tuttavia alto, e non sempre è possibile disporre di
un budget e di competenze tecniche adeguate. Varie aziende produttrici di
sistemi di automazione per biblioteche e sistemi di ricerca cross-database (tra
cui Endeavor Information Systems, Ex Libris e Millenium) offrono anche
soluzioni per biblioteche digitali, e altre società di tecnologie di gestione di
multimedia stanno cominciando ad orientarsi verso il mercato della didattica
e delle biblioteche.
In generale, la sfida è capire come passare dalle collezioni digitali isolate alle
biblioteche digitali interoperabili, e come trasportare nelle biblioteche digitali
i componenti della biblioteca tradizionale: infrastrutture, metadati robusti e
strategie di conservazione efficaci 48.
2.6.3. Interoperabilità, standard, modelli organizzativi
Nei primi progetti di biblioteche digitali l’utente doveva interagire con ogni
repository in modo indipendente, impararne la sintassi e installare sul proprio
computer le applicazioni necessarie per visualizzare i documenti digitali di ciascuno. Gli utenti di oggi chiedono presentazioni senza soluzione di continuità
delle collezioni e dei servizi, indipendentemente da dove, da chi e in quale formato esse sono gestite, cui accedere attraverso un’unica query (Fig. 6) e un
ambiente di ricerca da personalizzare in base alle loro esigenze. Gli sviluppi
degli OPAC sono stati un progresso in tal senso, i browser Web hanno dato
un aspetto unitario alle interfacce dei differenti database e i protocolli
Z39.50 hanno permesso agli utenti di impiegare una sintassi di ricerca
familiare. Ma quando si lascia il mondo degli OPAC e si entra in quello dei
repository digitali, l’interoperabilità è ancora lontana. Per ottenerla è necessario perfezionare la metrica per identificare e analizzare i bisogni degli
utenti, e aderire a processi e codifiche standard, che permettano alla biblioteca digitale di fornire una vista consistente e coerente di quanti più repository possibili: dagli standard per vari tipi di metadati (amministrativi, strut40 |
turali, di identificazione, di longevità) ai modi per rendere i metadati visibili a sistemi esterni (harvesting), alle architetture comuni per supportare l’interoperabilità (open archives).
Questi due aspetti hanno implicazioni rivoluzionarie per la biblioteca. Da un
lato l’integrazione in un network integrato di servizi informativi, sfidando la
sua tradizionale insularità organizzativa; dall’altro, la collocazione di parte delle
collezioni e dei servizi in nuovi contesti esterni alla biblioteca. La rapida penetrazione delle tecnologie di rete ha minato le fondamenta della forma fisica,
culturale, organizzativa, finanziaria e professionale delle biblioteche universitarie. In un mondo interconnesso, in cui l’accesso ad una larga parte dell’informazione non richiede più la prossimità al medium fisico su cui essa è trasportata, si potrebbero ipotizzare la seguente articolazione dei servizi informativi:
- punti di servizio (biblioteche universitarie) che gestiscono l’accesso
tramite la messa online, print-on-demand ecc.;
- repository per la gestione dei documenti digitali e loro disponibilità ai
diversi punti di servizio;
- repository per i documenti analogici, che li rendono disponibili a quegli
studiosi le cui ricerche richiedono la manipolazione e l’osservazione diretta.
-
Patron information
Favorite subjects
Saved searches
Personalized alerts
Course materials
- Ask a Librarian
- Online reference tools
- Search tools
My Library
Local Resources
-
Virtual Reference
Desk
Remote
Resources
- Other libraries
- Subscription databases
- E-content
Books
Journals
Databases
Digital collections
Library Information
Online Communities
[Fig. 6] Componenti di un portale per biblioteche (da The digital library toolkit, 2000)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 41
Si può anche immaginare una gamma di servizi essenziali di supporto ai
punti di servizio e ai repository, che includono cataloghi partecipati sul
posseduto, e servizi per la denominazione e l’identificazione persistente
dei file.
Ma se le tecnologie di rete permettono agli utenti di accedere alle informazioni indipendentemente dalla localizzazione delle informazioni, vi sono ancora
ostacoli significativi alla vera condivisione delle risorse, inclusi gli effetti della
competizione tra università sulla cooperazione bibliotecaria. La fornitura
coordinata di servizi informativi di rete è probabilmente la sfida maggiore che
le biblioteche affrontano oggi. Senza un approccio e una collaborazione tecnologica di tutto il campus con la biblioteca, che includa anche le risorse
digitali già disponibili, questi sistemi sono destinati ad essere ridondanti e con
risultati limitati, a fronte di budget già ridotti.
2.6.4
Linee di sviluppo future
Tra le tendenze che stanno emergendo e che continueranno ad affermarsi nel
contesto delle biblioteche digitali, è possibile identificare alcuni punti salienti 49.
In primis questioni relative alle architetture dei sistemi (query routing, interazione con il database e gestione della consistenza) e all’organizzazione dei network locali, così che questi possano cooperare e avvantaggiarsi del loro potenziale su una scala globale, dove i componenti sono gestiti da varie istituzioni
indipendenti con scopi e priorità diverse. Molti aspetti della ricerca crossdatabase (sicurezza, privacy, servizi a pagamento) sono tecnicamente difficili,
perchè i sistemi perdono la loro efficacia senza un sostanziale livello di standardizzazione e armonizzazione. Le attività relative ai metadati saranno sempre più finalizzate ad incrementare il livello di standardizzazione e conformità, permettendo al tempo stesso flessibilità per continuare a incoraggiare la
creazione di contenuto.
Assisteremo poi al progressivo passaggio dai sistemi testuali a quelli multimediali, grazie alla riduzione dei costi dei network a banda larga e ai miglioramenti delle tecnologie di streaming, ed emergeranno best practice comuni per
la digitalizzazione, la gestione dei diritti, la conservazione, la codifica dei
metadati e altri processi chiave della biblioteca digitale.
Il mondo delle biblioteche lavorerà sempre più al fianco delle organizzazioni
internazionali preposte alla creazione degli standard, che saranno recepiti nei
prodotti commerciali, e la prossima fase dello sviluppo delle biblioteche digitali si focalizzerà sulla standardizzazione, sulla personalizzazione e lo user
modeling, sull’usabilità, su spazi di lavoro collaborativi, fornendo maggiore
interoperabilità tra le collezioni digitali e scelte cost-effective per le istituzioni
che incominceranno a digitalizzare.
42 |
In questi ambiti nuovi servizi tecnologici potenzieranno il processo di comunicazione scientifica, insieme ai sistemi di rating e Web-feed, e l’accesso ai
materiali sarà integrato con quello agli strumenti necessari per elaborare e
presentare questi materiali: dalle strutture semantiche per supportare la ricerca e il recupero dei documenti, sia in modalità manuale che automatizzata,
alle tecniche di Natural Language Processing (inclusi i riassunti, l’estrazione
dell’informazione, traduzione e riconoscimento automatico del parlato) e
alla modelizzazione statistica e scientifica, dai rendering grafici alla visualizzazione. Per effettuare query attraverso database multipli verranno implementati i sistemi di Multimedia Information Retrieval, ambito nel quale si
cercheranno di risolvere le questioni relative a ranking unificato, eliminazione dei risultati doppione e delle inconsistenze, combinazione di dati strutturali, funzionali, sociali ed economici e utilizzo di tecniche di statistica e di
sistemi di intelligenza artificiale.
Per quanto riguarda le questioni economiche, la crescente dipendenza dalle
risorse digitali determinerà la creazione di soluzioni cooperative per la conservazione nel lungo periodo a costi contenuti. L’accesso ad alcune informazioni
potrebbe essere ristretto, ma anche quando l’informazione è gratuita, rimarrà
il problema della gestione e della protezione dei diritti e delle informazioni
personali. Inoltre il problema della digitalizzazione non è solo e tanto di
carattere economico o tecnologico, ma piuttosto giuridico, dato che i diritti
di riproduzione e di proprietà rimangono in vigore a lungo. Le biblioteche
digitali avranno bisogno di modelli economici sostenibili, poiché come hanno
già dimostrato molti progetti, l’eccellenza tecnica e intellettuale non garantiscono da sole il successo.
In generale, è chiaro come la tecnologia della biblioteca digitale stia diventando un essenziale abilitatore dei servizi delle biblioteche. Il termine stesso sta
già cominciando a diventare anacronistico, così come il termine electronic
banking oggi viene indicato semplicemente come banking. È certo che tutte
le biblioteche in futuro saranno caratterizzate da servizi informativi basati
sulle ICT, che estenderanno e potenzieranno la tradizionale missione delle
biblioteche nella nostra società.
2.7
Knowledge Management e sistemi di organizzazione
della conoscenza
La crescente concorrenza in un’economia globalizzata ha spinto le organizzazioni a un diverso genere di allocazione delle risorse e alla valorizzazione del
capitale umano. Il Knowledge Management (KM) è un approccio strategico
integrato, promosso principalmente attraverso la tecnologia (ma non esclusivamente attraverso di essa) e basato sulle attività di documentazione e di forCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 43
mazione. In sintesi esso tenta di teorizzare, acquisire, rielaborare, arricchire e
trasmettere il capitale umano, per modificare il comportamento e la struttura
dell’organizzazione e consentirle di capitalizzare e trasmettere conoscenza
esplicitata, rendendo quindi più efficiente la sua produttività e innovazione.
Ma i contenuti di valore di questo capitale per loro natura non sono direttamente percettibili, né operabili in un normale sistema informativo aziendale:
la scommessa del KM consiste perciò nel rendere rielaborabile in modo il più
possibile automatizzato questa conoscenza tacita e intangibile (Fig. 7). Poiché i
progressi dell’ingegneria dell’intelligenza artificiale sono ancora lontani dall’eguagliare il sistema cognitivo umano, occorre elaborare quelli che Bogliolo
definisce ‘sistemi differenziali di significato’, che costituiscono la base per
un’integrazione dinamica di universi semantici diversi 50. I Data Base
Management System (DBMS) vengono cioè sostuiti dai Knowledge Base
Management System (KBMS) per acquisire, rappresentare e gestire non più
solo dati e informazioni‚ ma conoscenza, tramite l’ausilio dell’information
retrieval.
Il ruolo dei professionisti dell’informazione in questi contesti non si limita più
alla raccolta delle informazioni, ma crea nuove conoscenze rielaborando criticamente il know-how dei singoli dipendenti, i valori dell’organizzazione e la
propria personale conoscenza del contesto, esplorando non solo i documenti
‘espliciti’, ma anche quelli ‘impliciti’ come i processi aziendali,
Information vs. Knowledge Systems
Organization’s knowledge system
Individual
knowledge’s system
Organization
information’s system
Disintermediated
approach
Author’s tacit
knowledge
Explicit knowledge
formalized into a document
Reader’s tacit
knowledge
[Fig. 7] Differenze tra un sistema informativo ed un sistema conoscitivo (da D. Bogliolo, 2002)
44 |
e le pratiche organizzative. La trasformazione dei centri di documentazione
aziendale è quindi riassumibile come l’evoluzione da un centro di costo ad un
centro di valore aggiunto, che non si limita a offrire servizi ma incontra proattivamente i bisogni degli utenti, cambiando il proprio ruolo da distributore
dell’informazione a partner di conoscenze, che supportano le attività di ricerca
e sviluppo della organizzazione, definiscono un legame tra informazioni esterne ed interne e contribuiscono a creare contatti fra i diversi settori dell’azienda.. L’organizzazione knowledge managed diventa quindi learning – o learned
– organization‚ similmente ad una università o ad un ente di ricerca.
Dal punto di vista del KM, le similitudini tra il gruppo di lavoro di un’azienda
e quello di un’università sono varie, dall’approccio collaborativi alla centralità
dell’utente come esperto di un certo ambito. Se le biblioteche universitarie
venissero percepite come un valido supporto all’attività di decision-making, i
dipartimenti, le facoltà e le università nel loro insieme agirebbero come
un’azienda e si potrebbero applicare i principi del KM. Una differenza si rileva
invece nei servizi di reference, che in ambito universitario vengono offerti in
modo generico a tutta la comunità come un insieme, mentre in un’azienda essi
vengono personalizzati per piccoli gruppi che condividono gli stessi sistemi
semantici e lavorano su progetti specifici. Poiché il KM lavora sulla condivisione della conoscenza tacita, questa attività potrebbe essere perseguita solo in
gruppi omogenei e coesi all’interno dell’università. Bogliolo sostiene che esso
possa essere adottato con successo in biblioteca solo se finalizzato al miglioramento della qualità dei servizi bibliotecari, cioè identificando la biblioteca
come una struttura organizzativa che apprende in continuo divenire, il cui
obiettivo è rendere più efficienti ed efficaci nei processi e nelle procedure.
Quando si va ad applicare praticamente l’approccio knowledge-based, una
delle trappole maggiori, come ricorda McDermott 51, riguarda l’utilizzo nell’utilizzo degli strumenti e concetti di gestione dell’informazione per progettare sistemi di gestione della conoscenza: conoscere un ambito o una disciplina
significa infatti essere in grado di pensare nel suo territorio, e per tale motivo
le idee sono significative solo in relazione agli ‘abiti mentali’ di una comunità.
Spesso chi implementa le tecnologie è talmente assorbito dall’aspetto gestionale che perde di vista gli obiettivi originali del loro utilizzo.
In ambito biblioteconomico, si è cominciato ad affrontare la questione dell’organizzazione e della condivisione della conoscenza in termini di sistematizzazione e di trasposizione in un nuovo contesto di strumenti ben noti nel
mondo delle biblioteche digitali, e durante la ACM Digital Libraries ‘98
Conference di Pittsburgh in Pennsylvania, è stato coniato il termine di
Knowledge Organization System (KOS) 52. I KOS includono tutti gli schemi
per organizzare, gestire e recuperare l’informazione, con la funzione primaria
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 45
di fornire accesso ai documenti per una specifica comunità secondo un
approccio knowledge-managed: ad esempio schemi di classificazione e categorizzazione che organizzano i materiali ad un livello generale, soggettari che
forniscono un accesso più dettagliato, e liste d’autorità che controllano le
varianti di nomi geografici e nomi propri, ma anche vocabolari altamente
strutturati come i thesauri, e schemi meno tradizionali come i network
semantici e le ontologie (cfr. i paragrafi 2.2.5 e 2.2.7). Essi rivestono un ruolo
importante nella costruzione delle collezioni, nella scoperta e nella ricerca,
nella navigazione, valutazione e visualizzazione: perciò per il successo dell’implementazione e dell’utilizzo di qualsiasi biblioteca digitale, è essenziale che
questa venga organizzata, direttamente o indirettamente, da uno o più sistemi
di organizzazione della conoscenza, e si può affermare che l’architettura di
una biblioteca digitale è costituita dalle sue collezioni, dai suoi KOS e dai servizi che essa mette a disposizione.
Vi sono molteplici modi per organizzare la conoscenza. A seconda dei contesti, i KOS possono essere presi in prestito da una biblioteca nazionale, da
un motore di ricerca, oppure sviluppati localmente; possono essere applicati
ai record di metadati di ogni risorsa, inseriti nei metatag, oppure separati
dalle risorse della biblioteca digitale come parte del meccanismo di accesso.
A fronte di queste diversità i KOS condividono le seguenti caratteristiche,
che influiscono profondamente sul modo in cui sono organizzate le biblioteche digitali:
- un KOS impone una particolare visione del mondo sulla collezione e
sui documenti che ne fanno parte, poiché modella un dominio della
conoscenza ed è progettato per un obiettivo specifico. Per tale motivo
ogni KOS possiede una sua metastruttura, la cui comprensione è
necessaria per l’interpretazione dei contenuti;
- la stessa entità può essere caratterizzata in modi diversi, a seconda del
KOS utilizzato;
- il valore di un KOS deriva dal riconoscimento e dalla validazione
della comunità di utenti (ad esempio organizzazioni di istruzione,
associazioni commerciali o gruppi di standard);
- vi deve essere sufficiente comunanza tra un concetto espresso in un
KOS e l’oggetto del mondo reale cui si riferisce quel concetto, cosicché una persona sia in grado di applicare il sistema con ragionevole
affidabilità.
Nel più ampio contesto dell’Internet Commons, i KOS sono degli strumenti
in grado di fornire chiavi di soggetto alternative, fornendo uno o più intestazioni aggiuntive che rendono i documenti della biblioteca digitale accessibili
ad audience diverse, che non condividono una terminologia comune. Inoltre
46 |
essi supportano un accesso multilingue, ad esempio tramite dizionari e thesauri quali il Generalized Multilingual Environmental Thesaurus (GEMET)
della European Environment Agency (EEA), e forniscono termini per espandere le ricerche testuali, in ambiti poco noti all’utente o in settore interdisciplinari. Uno dei modi possibili per superare queste difficoltà terminologiche è
quella di usare i KOS come supporti nella selezione di parole chiave a testo
libero, come evidenziano i vocabolari del Getty Vocabulary Project (Art and
Architecture Thesaurus, the Union List of Artists Names, and the Thesaurus
of Geographic Names). Infine, l’utilizzo dei KOS favorisce l’analisi dei bisogni degli utenti, fondamentale in ogni progetto di biblioteca digitale.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 47
Note
[1]
Il termine ‘biblioteca’ viene qui utilizzato
per indicare ogni organizzazione che fornisce servizi informativi, il cui scopo primario sia quello dell’acquisizione, organizzazione, preservazione e predisposizione dell’accesso all’informazione. Per ‘bibliotecari’
si intende chiunque svolga o diriga un
lavoro direttamente correlato alla missione
e ai servizi della biblioteca, come sopra
definita.
[2]
Per il concetto di biblioteca come sistema
aperto cfr. P. Traniello, La biblioteca tra
istituzione e sistema comunicativo,
Editrice Bibliografica, Milano 1986; G.
Tirelli, Il ‘sistema’ biblioteca, Editrice
Bibliografica, Milano 1990.
[3]
G. Di Domenico, Problemi e prospettive
della biblioteconomia in Italia, in
«Bibliotime», n. 2, luglio 2001,
<http://www.spbo.unibo.it/bibliotime/num
-iv-2/didomeni.htm#nota37>. Cfr. inoltre
Regione Lombardia, IREF, Le professionalità operanti nel settore dei Servizi culturali. Le Biblioteche lombarde, a cura di Satef,
Milano 2001, accessibile a <http://lombardiacultura.it/ricercaProfili.cfm>
[4]
Cfr. A. Salarelli, A.M. Tammaro, La biblioteca digitale, Editrice Bibliografica, Milano
2001, p.13 e vari interventi in La biblioteca
ibrida: verso un servizio informativo integrato, atti del convegno, Milano, Palazzo delle
Stelline, 14-15 marzo 2002, a cura di O.
Fogliani, Editrice Bibliografica, Milano
2003. Per le problematiche e le potenzialità
48 |
del Web nelle biblioteche cfr. inoltre C.
Basili, La biblioteca in rete, Editrice
Bibliografica, Milano 2000 e Risorse elettroniche, definizione, selezione e catalogazione,
Atti della Conferenza Internazionale, Roma
2001
<http://w3.uniroma1.it/ssab/ER/it/programma.htm>
[5]
R. Ridi, Il mondo come volontà e documentazione. Definizione, selezione e accesso alle risorse elettroniche remote (RER),
bozza dell’intervento in Risorse elettroniche, definizione, selezione e catalogazione,
cit., <http://w3.uniroma1.it/ssab/er/relazioni/ridi_ita.pdf>
[6]
B. Tillett, Gli aggiornamenti delle AACR2
per le risorse elettroniche. La risposta di un
codice di catalogazione multinazionale.
Un approfondimento, traduzione provvisoria, in ibidem
<http://w3.uniroma1.it/ssab/er/relazioni/ti
llett_ita.pdf>
[7]
Regole tecniche per la riproduzione e conservazione di documenti su supporto ottico
idoneo a garantire la conformità dei documenti agli originali - articolo 6, commi 1
e 2, del Testo unico delle disposizioni legislative e regolamentari in materia di documentazione amministrativa, di cui al
decreto del Presidente della Repubblica 28
dicembre 2000, n. 445, consultabile a
<http://www.interlex.it/testi/aipa0142.htm
>. La deliberazione dell’Autorità per
l’Informatica nella Pubblica
Amministrazione (AIPA) sui supporti ottici, approvata il 17 ottobre 2001, intendeva
risolvere i problemi di compatibilità tra la
precedente deliberazione n. 24/1998, il
DPCM 08/02/99 e il DPR 445/2000, che
disciplinava la riproduzione e la conservazione dei documenti.
copernicana non è più il lettore a girare
intorno al catalogo, bensì è il catalogo a
girare intorno al lettore.
[ 12 ]
[8]
Con il termine ‘audiovisuale’, si intende
ogni documento che presenta suoni registrati e immagini in movimento o ferme.
Con il termine ‘multimediale’, si intende
ogni medium che risiede in uno o più supporti fisici (ad es. un CD-ROM) oppure
in network o sistemi di computer. I multimedia interattivi dovrebbero presentare le
seguenti caratteristiche: essere controllati
dall’utente, con una navigazione non
lineare usando la tecnologia del computer;
la combinazione di due o più media
(suoni, testi, grafica, animazione e video)
che l’utente manipola per controllare l’ordine e/o la natura della presentazione.
[9]
Cfr. M. Guerrini, Il catalogo di qualità,
presentazione di L. Crocetti, Giunta regionale, Firenze 2002.
[ 10 ]
Convergence in the digital age. Challenges
for Libraries, Museums and Archives
Proceedings of the Seminar, CORDIS, 13
- 14 August 1998, Amsterdam,
<ftp://ftp.cordis.lu/pub/libraries/docs/proceedings.pdf>
[ 11 ]
Secondo la fortunata metafora di Weston
e Pernigotti (P.G. Weston, A. Pernigotti,
La biblioteca nel computer : come automatizzare?, con la collaborazione di M.
Ghera, presentazione di L.E. Boyle,
Biblioteca Apostolica Vaticana, Citta del
Vaticano 1990), come nella rivoluzione
Ciuccarelli, Innocenti
|
P. Lyman, The Social Impact of Digital
Libraries Technologies, in 2000 Kyoto
International Conference on Digital
Libraries: Research and Practice, Y.
Kambayashi et alii (eds.), 13-16
November 2000, Kyoto University Press,
Kyoto 2000, pp. 157-164.
[ 13 ]
Cfr. in merito Gateways to Knowledge.
The Role of Academic Libraries in
Teaching, Learning and Research,
Lawrence Dowler Editor, Cambridge,
Massachusetts and London, 1997; C.
Lynch, From automation to transformation. Forty years of libraries and information technology in higher education, in
«Educase Review», January February
2000, pp. 60- 68; B.L. Hawkins, P.
Battin (eds.), The Mirage of Continuity:
Reconfiguring Academic Information
Resources for the 21st Century, Council
on Library and Information Resources
and Association of American Universities,
Washington 1998; L. Hardesty, Do we
need academic libraries?, Position paper
of the Association of College and
Research Libraries (ACRL), American
Library Association (ALA), 2000
<http://www.ala.org/acrl/academiclib.html
>; P. Bellini, Struttura e infrastrutture
della biblioteca universitaria nell’era digitale: tendenze in atto, in «Bollettino
AIB», vol. 4, n. 3, settembre 2000,
pp.331-346; <http://www.ala.org/acrl/guides/college.html>; H.B Rader, Managing
academic and research libraries partnership, in Universities libraries and other
Sistemi conoscitivi per il design: una proposta metodologica
| 49
general research libraries workshop, 67th
IFLA Council and General Conference,
16-25 August 2001, Boston, USA; A.
Byrne, After the fireworks: Opportunities
and directions for university libraries, in
Virtual Libraries: Virtual Communities,
21st IATUL Conference, 3-7July 2000,
Brisbane, Australia.
<http://www.iatul.org/conference/qutpap/byrne_full.html>
[ 14 ]
C. Lynch, On the Threshold of
Discontinuity: The New Scholarly Genres
and the Role of the Research Library, in H.
Thompson (ed.), Racing toward Tomorrow.
Proceedings of the Ninth National
Conference of the Association of College and
Research Libraries, 8–11April 1999,
ACRL, Chicago 1999, pp. 410–18; cfr.
anche S. Foo, A.S. Chaudhry, S.M. Majid,
E. Logan, Academic libraries in transition:
Challenges ahead, in Proceedings of World
Library Summit, 22-26 April 2001,
National Library Board, Singapore.
[ 15 ]
Nelle Linee guida per la valutazione delle
biblioteche universitarie (edizione italiana
di Measuring quality, a cura della
Commissione nazionale Università ricerca.
Roma, Associazione Italiana Biblioteche,
1999) si afferma che il fine istituzionale di
una biblioteca universitaria è quello di
«scegliere, raccogliere, organizzare e consentire l’accesso all’informazione all’utenza,
in particolare all’utenza primaria, rappresentata dai membri dell’istituzione».
[ 16 ]
Osservatorio per la valutazione del sistema
universitario. Misurazione e valutazione
delle biblioteche universitarie, 1999
50 |
<http://www.miur.it/osservatorio/ricbibl.ht
m>. Cfr. inoltre L. Maffei, Alcuni nodi della
questione ‘informazione’ nell’università italiana di oggi, in «Bollettino AIB», 1997,
n.1, pp. 29-36 e D. Bogliolo, Knowledge
management in Italian Univeristy libraries
<http://www.uniroma1.it/documentation/G
eorgeATesoro.html#1>. Per una prospettiva
internazionale cfr. Bibliothèques universitaires : nouveaux bátiments… nouveaux services, sous la dir. de M.-F. Bisbrouck,
Ministère de l’Èducation nationale, de la
Recherche et de la Technologie, Direction
de l’Enseignement Supèrieur, Paris 1998;
Association of College and Research
Libraries, Guidelines for Media Resources in
Academic Libraries, 1999
<http://www.ala.org/acrl/guides/medresg.html>
[ 17 ]
Tra cui l’Università di Firenze per l’evoluzione dell’assetto organizzativo e per il
progetto innovativo della University
Press, il sistema bibliotecario
dell’Università di Padova per il servizio
Banche dati in rete, che viene erogato
anche ad enti terzi con una originale formula di partnership pubblico-privato;
l’Università di Bologna per il catalogo
nazionale dei periodici ACNP.
[ 18 ]
Cfr. Rapporto sulle biblioteche italiane
2001, a cura di V. Ponzani
<http://www.aib.it/aib/boll/rapp01.htm>
; L. Bardi, Le biblioteche di università
italiane: problemi strutturali e soluzioni
sistemiche, 21 giugno 2002, Roma
<http://www.cab.unipd.it/eventi/2002/
21602.ppt>; L. Bardi, Lo stato dell’arte
dei sistemi bibliotecari di Ateneo: risultati di una ricerca, Roma, Bibliocom,
ottobre 2001.
[ 19 ]
[ 24 ]
M. Castells,The rise of the network society,
in The information age: economy, society
and culture, vol. 1, Blackwell, Oxford
1996, pp. 61-62.
<http://www.eprints.org>
[ 20 ]
[ 26 ]
C. Linch, From automation to transformation, cit. e B.Feret, M. Marcinek, The
future of the academic library and the academic librarian: A Delphi study, in The
Future of Libraries in Human
Communication. 20th IATUL Conference,
17-21 May 1999, Chania, Greece,
<http://educate.lib.chalmers.se/IATUL/pro
ceedcontents/chanpap/feret.html>
G. Solimine, Spazio e funzioni nell’evoluzione della biblioteca: una prospettiva storica, in La biblioteca tra spazio e progetto.
Nuove frontiere dell’architettura e nuovi scenari tecnologici, V Conferenza Nazionale
per i Beni Librari, 7-8 marzo 1996, Editrice
Bibliografica, Milano 1998, p. 34.
[ 21 ]
L. Hardesty, Books Bytes and Bridges:
Libraries and Computer Centers in
Academic Institutions, American Library
Association, Chicago 2000.
[ 22 ]
SGML è uno standard internazionale per i
sistemi di markup testuali ampi e complessi, che descrive migliaia di differenti tipi di
documenti. XML è uno standard per la
descrizione di altri linguaggi, scritto in
SGML, che permette la progettazione di
linguaggi personalizzati di markup per tipi
illimitati di documenti, fornendo un modo
flessibile e semplici per scrivere applicazioni
Web-based. I principali standard che alimentano i servizi Web sono basati XML e
includono il Simple Object Access Protocol
(SOAP), la Universal Description,
Discovery and Integration (UDDI), il Web
Services Description Language (WSDL),
l’Electronic Business XML (ebXML).
[ 23 ]
[ 25 ]
<http://web.mit.edu/dspace>
[ 27 ]
M. Eisenberg et alii, Re-Envisioning the
Library: The Intellectual Commons of the
University, Washington University, 7
December 2000, <http://www.washington.edu/change/library/appb.pdf>
[ 28 ]
H.M. King, The academic library in the
21st century: What need for a physical
place? in Virtual Libraries: Virtual
Communities, 21st IATUL Conference, 37 July 2000, Brisbane, Australia,
<http://www.iatul.org/conference/proceedings/vol10/papers/king_full.html>;
Construire une bibliothèque universitaire.
De la conception à la réalisation, M.-F.
Bisbrouck, D. Renoult (eds.), Editions du
Cercle de la Librairie, Paris 1993; Les
bibliothèques universitaires. Evaluation
des nouveaux bâtiments (1992-2000), M.F. Bisbrouck (ed.), Ministère de l’éducation nationale, La Documentation française, Paris 2000. Per ulteriori approfondimenti cfr. anche i quaderni del Gruppo
LIBER, associazione europea delle biblioteche accademiche e di ricerca.
L. Hardesty, Do we need academic libraries?, cit.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 51
[ 29 ]
L. Hardesty, Do we need academic libraries?, cit.
[ 30 ]
B. Edwards, B. Fisher, Libraries and learning resource centres, Architectural Press,
Oxford 2002; A. Salarelli, A. M. Tammaro,
La biblioteca digitale, cit.; The multifunctional library, 20-24 April 1998, J.P.
Batalla, D.Osuna Paez (eds.), Universitat de
Barcelona, Barcelona 1999. Vari learning
resource centre sono stati premiati dallo
UKOLN negli ultimi anni
(cfr.<http://www.sconul.ac.uk/award.htm>).
through personalized systems as well as
through the services of information professionals» (in Digital Library Definition for
DLI2, 1998
<http://scholar.lib.vt.edu/DLI2/defineDL.
html>).
[ 35 ]
Nell’era digitale, l’informazione e il
medium su cui essa è registrata può essere
considerato in forma digitalizzata o
meno. Naturalmente vi sono anche altri
modi di categorizzare il materiale, ma la
leggibilità al computer è un criterio
importante.
[ 31 ]
[ 36 ]
Beagle D., Conceptualizing an
Information Commons, in «Journal of
Academic Librarianship», vol. 25, n. 2,
1999, pp. 82-89.
M. Halbert, Lessons from the Information
Commons frontier, in ibidem, pp. 90-91.
Cfr. W.Y. Arms, Automated Digital
Libraries. How Effectively Can Computers
Be Used for the Skilled Tasks of
Professional Librarianship?, in «D-Lib
Magazine», July/August 2000, vol. 6, n.
7/8,
<http://www.dlib.org/dlib/july00/arms/07
arms.html>
[ 33 ]
[ 37 ]
P.D. Leighton, D.C. Weber, Planning academic and research library buildings, 3rd
ed. American Library Association, Chicago
1999, p. 887.
Ad es. Infomine
<http://infomine.ucr.edu>, Infoseek
<http://infoseek.go.com>, Yahoo
<http:www.yahoo.com>
[ 34 ]
[ 38 ]
<http://www.si.umich.edu/SantaFe/>. Cfr.
inoltre la definizione di Seamans e
McMillan della Virginia Polytechnic
Institute and State University: «A digital
library should be a seamless extension of
the library that provides scholars with
access to information in any format that
has been evaluated, organized, archived,
and preserved. Access to this evolving collection of digital information is provided
Per una storia delle biblioteche digitali e dei
trend futuri cfr. Digital Library Technology
Trends, Sun Microsystems, Inc., USA 2002
<http://www.sun.com/products-nsolutions/edu/whitepapers/pdf/digital_library_tre
nds.pdf>
[ 32 ]
52 |
[ 39 ]
J.C.R. Licklider, Libraries of the Future,
MIT Press, Cambridge (Mass.) 1965.
[ 40 ]
D. Greenstein, S.E. Thorin, The Digital
Library: a Biography, Digital Library
Federation, Council on Digital Libraries
and Information Resources, September
2002 <http://www.clir.org>
[ 41 ]
Cfr. Special Theme: e-Government,
«ERCIM News», n. 48, January 2002,
<http://www.ercim.org/publication/Ercim_
News/enw48/>
[ 42 ]
<www.amico.org>
[ 43 ]
<http://elib.cs.berkeley.edu>
<http://sunsite.berkeley.edu>
Series of Joint NSF-EU Working Groups
on Future Directions for Digital Libraries
Research, P. Schäuble, A.F. Smeaton (eds.),
12 October 1998,
<http://www.iei.pi.cnr.it/DELOS/REPOR
TS/Brussrep.htm>; D. Soergel, A
Framework for Digital Library Research.
Broadening the vision, in «D-Lib
Magazine», vol. 8, n. 2, December 2002
<http://www.dlib.org/dlib/december02/soe
rgel/12soergel.html>; D. Stevenson,
Building Digital Libraries. Playing in the
Technology Sandbox, in «Computer in
Libraries», vol. 22, n. 9, October 2002,
<http://www.infotoday.com/cilmag/oct02/
stevenson.htm>; DELOS brainstorming
report, June 2001, San Cassiano, Italy,
ERCIM-02-W02, <http://delosnoe.iei.pi.cnr.it/activities/researchforum/Br
ainstorming/brainstorming-report.pdf>.
[ 44 ]
<http://campusgw.library.cornell.edu>
[ 45 ]
<http://lib.harvard.edu>
[ 46 ]
<http://www.jstor.org>
[ 47 ]
<http://www-sul.stanford.edu>
<http://highwire.stanford.edu>
[ 48 ]
H. Besser, The Next Stage: Moving from
Isolated Digital Collections to Interoperable
Digital Libraries, in «First Monday», vol. 7,
n. 6, June 2002, <http://firstmonday.org/
issues/issue7_6/besser/index.html>
[ 49 ]
Cfr. An International Research Agenda for
Digital Libraries. Summary Report of the
Ciuccarelli, Innocenti
|
[ 50 ]
Cfr. D. Bogliolo, Network Management in
un ente di ricerca, in DesignNet. Knowledge
e Information Management per il design,
atti del seminario internazionale, a cura di
P. Ciuccarelli e P. Innocenti, prefazione di
G. Simonelli, Edizioni Poli.design, Milano
2002, pp. 37-47; idem, Knowledge management in Italian university libraries, in
The American University of Rome - AIB
Regione Lazio, Distinguished Lecture Series,
10 November 2000, <http://www.uniroma1.it/Documentation/GeorgeATesoro.ht
ml>; idem, Gestione della conoscenza vs
gestione dell’informazione, in Incontro culturale su Modelli per l’uso
dell’Informazione nelle Scienze e nelle
Attività Economiche, Università degli Studi
di Roma ‘La Sapienza’, 8-9 Giugno 2000,
<http://www.uniroma1.it/Documentation/a
damsingo.html>; G. Walsham, Knowledge
Management: The Benefits and Limitations
Sistemi conoscitivi per il design: una proposta metodologica
| 53
of Computer Systems, in «European
Management Journal», vol. 19, n. 6,
December 2000, pp. 599-608; M.
Santarsiero, Un modello possibile: il knowledge management per i servizi informativi, 27 giugno 2001, <http://www.gidifrbm.it/Santarsiero_workshop01.ppt>; C.W.
Choo, Information Management for the
Intelligent Organization: Roles and
Implications for the Information
Professions, in 1995 Digital Libraries
Conference, March 27-28, 1995, Singapore
<http://128.100.159.139/FIS/ResPub/DLC
95.html>
[ 51 ]
R. McDermott, Why information technology inspired but cannot deliver knowledge
management, in E.L. Lesser, M.A.
Fontaine, J.A. Slusher, Knowledge and
communities, Butterworth Heinemann,
Boston 2001, pp. 21-35.
[ 52 ]
Sull’argomento cfr. G. Hodge, Systems of
Knowledge Organization for Digital
Libraries: Beyond Traditional Authority
Files, The Digital Library Federation,
Council on Library and Information
Resources, April 2000,
<http://www.clir.org/pubs/reports/pub91/c
ontents.html>; Challenges in Knowledge
Representation and Organization for the
21st Century. Integration of Knowledge
Across Boundaries: proceedings of the
Seventh International ISKO Conference,
10-13 July 2002, Granada, Spain, M.J.
López-Huertas (ed.), Ergon Verlag,
Würtzburg 2002.
54 |
3
Organizzazione e restituzione della conoscenza in ambienti
di rete
Perla Innocenti
The nice thing about standards is that you have so many to choose from.
Furthermore, if you do not like any of them, you can just wait for next year’s model
Andrew Tanenbaum
In un sistema di organizzazione dei documenti, la caratteristica più importante dell’informazione è che può essere usata fuori dal contesto. La conoscenza
riguarda invece la ricostruzione delle reti di relazioni, dei contesti.
Nell’ambito di questo volume, per documento si intende qualcosa che può
essere localizzato e manipolato sia attraverso l’attività umana che tramite un
sistema automatico come un’entità discreta. In generale tutti i documenti,
indipendentemente dalla forma fisica o intellettuale che essi assumono, possiedono tre caratteristiche: contenuto, contesto e struttura, le quali possono
essere ricomposte attraverso i metadati. Il contenuto stabilisce un nesso tra
ciò che il documento contiene in sé o nei suoi dintorni ed è intrinseco al
documento stesso. Il contesto indica il chi, cosa, perché, dove: tutti aspetti
associati con la creazione dell’oggetto e comunque estrinseci al documento
stesso. La struttura si riferisce all’insieme formale di associazioni situate all’inCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 55
terno o tra documenti, che possono essere intrinseche o estrinseche.
Un documento digitale, rispetto ad uno analogico, è un’entità complessa,
multiparte, costituito da contenuti originariamente digitali oppure derivanti
da riformattazione, codificati e integrati da metadati per supportare l’archiviazione, la scoperta e l’uso del documento 1. In ambito biblioteconomico la sua
natura pone una serie di questioni aggiuntive: ad esempio la questione delle
unità bibliografiche nelle strutture multi-parte in un contesto digitale 2 porta
a rivedere il concetto di unità bibliografica, la relazione tra record bibliografico e unità bibliografica e l’eventuale necessità di descrizioni ad un livello di
granularità più approfondito.
Da un punto di vista documentale, i problemi chiave riguardanti l’odierna
sistematizzazione e fruibilità di documenti digitali in ambienti di rete sono
sostanzialmente cinque, da affrontare in modo unitario:
- gli standard di digitalizzazione: ovvero la qualità della trasposizione dell’informazione analogica in digitale, tipicamente per un’immagine
esplicitabile in parametri come risoluzione, fedeltà del colore, capacità
di cogliere le sfumature, consistenza della procedura attraverso tutte le
sue fasi dall’acquisizione alla visualizzazione a schermo fino alla stampa;
- gli standard di documentazione: ovvero come strutturiamo e contestualizziamo l’informazione per permettere la condivisione e l’utilizzo
dei documenti in un ambiente informativo integrato;
- le modalità di conservazione: ovvero i metodi con cui preserviamo i
documenti digitali e affrontiamo il problema dell’obsolescenza tecnologica. Il rapido sviluppo delle tecnologie e il degrado dei mezzi di
archiviazione digitale rende infatti questi dati inaccessibili molto più
rapidamente dei dati su supporto cartaceo (Fig. 1);
- le modalità di accesso: ovvero i metodi con cui si affrontano i problemi di diritto d’autore e copyright, la risposta ai bisogni dell’utente e i
problemi tecnici di delivery. La loro risoluzione é essenziale laddove
molti utenti devono poter accedere a risorse in un ambiente di rete
come Internet;
- gli standard tecnici: cioè i formati e i metodi di gestione dell’informazione. Il loro utilizzo implica lunga durata e interoperabilità. In
un’accezione più ampia, interoperabilità significa efficace coesistenza
su vari livelli (operativi, semantici e linguistici) di diverse risorse
informative.
È chiaro come l’approccio metodologico sia quello che presenta la necessità di
maggiori riflessioni, perché rappresenta la base che consentirà di richiamare o
individuare o meno una data informazione. La soluzione delle tematiche
sopraelencate comporta infatti un lungo cammino, non risolvibile semplice56 |
mente impostando una procedura unificata a-priori ma chiarendo, a mano a
mano che il lavoro procede, singoli e specifici aspetti nell’ambito di un quadro unificante metodologico, basato sul riferimento agli standard. Non esiste
infatti attività che noi svolgiamo quotidianamente che non sia o non possa
essere regolamentata da uno standard 3, elaborato attraverso il consenso professionale ed approvato da uno o più enti riconosciuti 4.
Poiché il progetto descritto nel volume si propone lo scopo di operare entro
questo quadro, per cercare di definire una metodologia di base relativa al
secondo dei cinque punti fissati, nei paragrafi successivi verranno analizzate in
quest’ottica le tematiche relative all’organizzazione e alla gestione delle conoscenze in ambienti di rete.
3.1 Standard di digitalizzazione
Oggi, solitamente, a differenti tipologie di giacimenti documentali (che siano
archivi di preziosi manoscritti o letteratura grigia) corrispondono anche differenti strutture di conservazione, ubicate a volte in luoghi diversi e spesso
governate da sistemi, regole di conservazioni e gestori differenti.
Dal punto di vista dell’utente, ciò che contraddistingue la ricerca è proprio la
frammentazione ubicativa (se non addirittura sovente lo smembramento e la
perdita) che deriva da questa diaspora gestionale, l’impossibilità di ricerca statistica e quantitativa, la difficoltà di analisi comparativa.
surface
metadata
Metadata
(annotation/labeling)
Documentation
Explanation
Digital document
Operating System
Software
Emulator specification
Original software
digitization/acquisition
[Fig. 1] Schema logico di un documento digitale incapsulato (rielaborazione da J. Rothemberg,
1998)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 57
Dal punto di vista del bibliotecario – o meglio del documentalista 5 – i problemi
principali nella costruzione di un archivio, oltre alla già citata collocazione fisica, sono una classificazione del materiale che ne permette il ritrovamento e
una modalità di conservazione che si proponga di limitare nel tempo il degrado
dovuto alla manipolazione e a varie cause di deterioramento e degradazione.
La creazione di archivi di giacimenti documentali analogici ha permesso, nel
tempo, la possibilità di conservazione in forma semi-ordinata dei materiali accumulati, con forme di deterioramento più o meno controllate. Questi archivi, tuttavia, hanno mantenuto un livello di accesso alle fonti estremamente
ridotto e parziale (se non altro per la trasportabilità limitata e la difficoltà di
manipolazione), che sono rimaste, in ogni caso, di difficile recupero. Ciò è
tanto più problematico per discipline come l’architettura e il design, in cui
accanto a documenti testuali coesistono anche documenti visuali e materici
come disegni e fotografie, che presentano proprietà quali il colore, le tessiture,
le sfumature, le dimensioni fisiche, modelli e maquette, artefatti di vario tipo
(prodotti, semilavorati, componenti ecc.).
La formazione di un archivio digitale d’architettura e di design, oggi, è quindi
al tempo stesso un tema e una problematica che si muove in questo contesto,
cioè la necessità di fornire una proposta di soluzione ai tipici problemi che
l’archiviazione fisica, per limiti intrinseci, non è riuscita a risolvere 6.
La replica di un oggetto fedelmente a se stesso – approccio che offre la possibilità di fruizione del documento digitale con tutti i suoi attributi cromatici,
grafici, dimensionali – è un problema concettualmente semplice, che oggi
può fruire di una tecnologia ormai avanzata ad un livello definibile come professionale e non più di laboratorio di ricerca (i tempi del progetto di digitalizzazione dei manoscritti della Biblioteca Vaticana da parte di IBM sembrano
incredibilmente lontani, pur essendo passati meno di dieci anni). Tuttavia,
l’attuale tecnologia presenta una serie di problematiche che non rendono
immediata tale soluzione:
- una sostanziale incapacità da parte degli addetti ai lavori (bibliotecari
e archivisti in primis) a realizzare il lavoro di acquisizione in prima
persona, e conseguenti forti limiti di base in ogni operazione non
squisitamente catalografica o archivistica;
- un conseguente livello dei costi di digitalizzazione estremamente elevato
per la necessità di servirsi di specialisti, cosicché le uniche operazioni in
pratica realizzabili (anche in presenza di meccanismi di sovvenzione rilevanti) sono quelle che riguardano opere d’arte ad elevato valore aggiunto;
- una sovente considerevole eterogeneità dei materiali, che impedisce la
definizione per ogni archivio di una singola metodologia, ma impone
la pluralità di strumenti e metodiche;
58 |
-
una sostanziale difficoltà a definire gli usi fondamentali di questi prodotti digitali, i caratteri della loro integrazione (essenziali, ad esempio, per definire le metodologie di profilatura del colore) e, infine, a
gestire la loro fruizione in forma strutturata;
- l’assenza di progettualità nel settore, perché da un lato rifiutata dai
tecnici, interessati di solito esclusivamente allo sviluppo di algoritmi;
e dall’altro dai fruitori, che non la ritengono necessaria (in ciò
dimenticando la natura intrinsecamente progettuale di ogni costruzione che pure l’architettura tanto chiaramente insegna), confondendo l’automazione con il meccanicismo.
Inoltre, poiché le tecnologie consentono ormai un tale tipo di conversione, è
indispensabile definire di standard riferiti al materiale originale, e non autoreferenziali al sistema digitale o all’output previsto. Occorre anche definire la
scelta dell’utilizzo delle tecnologie e dei dispositivi, scegliere la qualità migliore all’interno della gamma prefissata attraverso un benchmarking delle caratteristiche dei prodotti disponibili.
I fattori che concorrono a formare i contenuti informativi digitalizzati includono principalmente:
1. conservazione: la salvaguardia dell’originale all’operazione di acquisizione;
2. fattori economici: maggiore risoluzione, profondità in bit, o elaborazioni possono causare maggiori costi di acquisizione e di archiviazione;
3. tecnologia: definizione del livello tecnologico di ogni singola operazione e globale dall’acquisizione alla visualizzazione. Livelli troppo
alti possono semplicemente aumentare i costi, livelli troppo bassi
possono causare perdita di informazione, incoerenze lungo tutto il
processo possono causare colli di bottiglia che accoppiano alti costi a
risultati marginali;
4. necessità degli utenti: i requisiti richiesti dagli utenti possono causare
variazioni nel processo di acquisizione.
I passaggi fondamentali nella progettazione di ogni operazione di acquisizione
riguardano gli aspetti riportati di seguito.
3.1.1 Conservazione del dettaglio più fine
Viene realizzata attraverso un esame visuale di campioni rappresentativi.
Se gli oggetti sono disegnati o dipinti, l’indagine deve includere misure
dell’ampiezza delle linee più fini. Se gli oggetti sono stampe fotografiche
o negativi l’indagine riguarderà la misura della grana del film. Quindi la
frequenza di campionamento spaziale dovrà essere selezionata per preservare adeguatamente tutti i dettagli rilevanti nelle immagini destinate alla
qualità più elevata; buona regola vuole che sia normalmente almeno il
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 59
doppio dell’inverso dell’ampiezza del dettaglio più fine. Tuttavia, per
motivi di spazio d’archiviazione e di tempi di acquisizione (proporzionali
al quadrato della frequenza spaziale) occorre trovare un compromesso tra
conservazione del livello di dettaglio e costi di archiviazione, trasmissione
e acquisizione.
3.1.2 Definizione della qualità dell’immagine in funzione della finalità d’uso
È ormai generalizzata la suddivisione delle immagini digitali secondo tre
famiglie principali, soluzione che si adatta perfettamente anche al progetto
descritto in questo volume:
- l’immagine digitale è utilizzata soltanto come un riferimento visuale
nel database elettronico. La qualità dell’immagine digitale richiesta è
limitata sia in dimensioni che in risoluzione luminosa. La visualizzazione è di solito per uno schermo o ad una stampante a bassa risoluzione e la riproduzione esatta del colore non è fondamentale. Le
immagini posso essere compresse per risparmiare spazio di archiviazione e tempo di visualizzazione;
- l’immagine digitale è utilizzata per la riproduzione e la visualizzazione. I requisiti di qualità dipendono dalla definizione della riproduzione desiderata. Lo stesso vale per le tonalità di riproduzione.
Attualmente, la maggior parte dei sistemi di digitalizzazione permette
soltanto un output di colore a 8 bit per colore primario che, se mappato non correttamente, non consente una precisa riproduzione
tonale e cromatica dell’originale;
- l’immagine digitale rappresenta una ‘sostituzione’ dell’originale sia
in termini spaziali che di contenuti di informazioni tonali. Questo
obiettivo è il più impegnativo da raggiungere, poiché il contenuto
di informazioni in termini di equivalenza di pixel varia da originale a originale.
3.1.3 Definizione del workflow, gestione delle caratteristiche dell’immagine
La produzione di un’immagine fedele all’originale richiede una gestione del
colore end-to-end. Un fattore chiave è certamente definire se l’operazione di
digitalizzazione può avvenire direttamente od occorra procedere tramite
supporti intermediari. Le due pipeline di lavoro risultano infatti abbastanza
differenti e necessitano di definizione di parametri qualitativi, modalità
attuative e tecniche di controllo di qualità diversi. I passi fondamentali
sono dati da:
- acquisizione dell’immagine: occorre definire le caratteristiche fondamentali dello strumento di acquisizione, condizioni di illuminazio-
60 |
-
-
-
-
-
ne, parametri di acquisizione (risoluzione, profondità di colore,
parametri di camera, ecc.);
definizione del formato digitale e compressione dell’immagine: la
definizione dei formati grafici deve essere tale da consentire la conservazione senza perdita di informazioni; la compressione deve rendere
possibile la visualizzazione in condizioni di larghezza di banda e
risorse computazionali limitate;
visualizzazione dell’immagine: la visualizzazione accurata di un’immagine sullo schermo di un computer richiede l’applicazione di procedure di calibrazione e profilatura per correggere le caratteristiche di
dimensione, colore e luminosità dello specifico monitor, servendosi
di vari parametri sul dispositivo;
stampa dell’immagine: così come è necessario conoscere le caratteristiche del monitor per la visualizzazione di un’immagine, la sua stampa fedele richiede la conoscenza delle caratteristiche della stampante e
della sua calibrazione;
watermarking e protezione dell’immagine: un watermark è un’immagine secondaria che viene sovrapposta sull’immagine primaria,
per proteggere la proprietà intellettuale o per permettere l’autenticazione e la validazione delle immagini (cfr. anche il paragrafo
2.4.3). Una valida alternativa al watermarking fisico è l’accesso
selettivo alle immagini. Un esempio di accesso selettivo ai documenti visuali senza l’ausilio dei watermark è quello di SPIRO,
l’OPAC della Architecture Visual Resources Library della
University of California, Berkeley. La visione delle immagini derivate di dimensioni maggiori (un patrimonio di oltre 55.000 documenti) è consentita soltanto all’interno della Intranet del campus di
Berkeley, mentre gli utenti esterni accedono alle immagini thumbnail e al record dei documenti 7;
controllo di qualità: il controllo di qualità sull’intero sistema di
acquisizione si compone di due momenti distinti:
- valutazione delle prestazioni dei sistemi utilizzati: il riferimento normativo è quello della ANSI/AIMM MS441988 (R1993). Recommended practice for Quality Control
of Image Scanners;
- verifica della rispondenza delle acquisizioni ai parametri di
progetto: questa operazione consiste nello sviluppo di un
insieme di procedure per verificare il risultato dell’acquisizione. Per far sì che queste procedure costituiscano un vero e
proprio controllo di qualità, occorre identificare: tempi, pasCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 61
saggi e durata dell’ispezione; strumenti hardware e software
necessari all’ispezione e le unità di misura; valori per cui un
prodotto risulta inaccettabile.
3.2 Standard di documentazione
Quello degli standard di documentazione rappresenta il punto nodale di
qualsiasi progetto per la gestione e restituzione dei documenti digitali.
L’odierna situazione documentale è caratterizzata da una grande varietà di
entità disponibili offline e online, un’esplosione di informazioni e di formati
non organizzati e non controllati, che si evolvono nel tempo dando luogo a
numerose e complesse interrelazioni. A fronte di questa eterogeneità, c’è una
esigenza di tipo unificante: accedere alle risorse digitali indipendentemente
dalla loro natura e tipo, area disciplinare e localizzazione, tramite degli strumenti che le descrivano e le controllino.
Gli strumenti che si hanno a disposizione possono essere in modo generale
suddivisi fra quelli di tipo tecnologico e quelli di tipo intellettuale. Nella
prima categoria rientrano reti e protocolli di comunicazione evoluti, linguaggi
di marcatura e strumenti standard per lo scambio di informazioni, standard
per la digitalizzazione. Della seconda categoria fanno parte essenzialmente sia
gli schemi di metadati, che sono elaborati e attribuiti sulla base elle caratteristiche specifiche degli oggetti da descrivere e gestire in rete, sia i sistemi di
classificazione e indicizzazione. Entrambi sono utilizzati dai fornitori di informazione e dei relativi servizi di accesso, per descrivere i documenti; dai sistemi di ricerca e successivamente dagli utenti nel recupero di informazioni.
Tra l’ampia gamma di standard disponibili, vi è una speciale categoria utilizzata per la documentazione e il recupero delle informazioni: gli standard di
dati, che la natura interconnettiva del Web ha reso ancora più necessari per
facilitare l’usabilità delle risorse attraverso ambiti e comunità diverse. Gli
standard sono cioè fondamentali per poter trasformare collezioni digitali isolate in biblioteche digitali interoperabili.
Vi sono quattro tipi di standard di dati, che usati insieme migliorano in
modo sostanziale l’accesso all’informazione:
1. standard di struttura dei dati: definiscono le categorie in cui l’informazione deve essere suddivisa. Essi stabiliscono gli elementi che verranno
inclusi nei record dei database, ad esempio una categoria per un nome o
per una data. Alcune strutture di dati funzionano anche come linee
guida, come le Categories for the Description of Works of Art (CDWA)
e le Core Categories for Visual Resources (VRA) 2.0. Altre, come il formato MARC e la Encoded Archival Description (EAD) 8, funzionano
sia come strutture di dati che come standard di comunicazione dei dati;
62 |
2. standard di comunicazione dei dati: facilitano lo scambio di informazioni tra la struttura dei dati e il modo in cui il valore dei dati individuali viene codificato, o etichettato in una certa struttura. I formati
MARC ed EAD possiedono entrambi queste qualità;
3. standard di contenuti dei dati: sono delle linee guida che regolano
l’ordine, la sintassi, la forma in cui i valori dei dati vengono immessi
nelle categorie strutturali. Le RICA e le AACR2 sono degli standard
di contenuti usati rispettivamente in Italia e negli Stati Uniti;
4. standard del valore dei dati: regolano i termini o le parole che
saranno inserite nelle categorie definite dalla struttura dei dati. I
vocabolari controllati e le liste di autorità regolarizzano e standardizzano la terminologia. Ad esempio, una lista di autorità indicherà le varianti del nome di un autore; un vocabolario controllato
collegherà i sinonimi.
La struttura dei dati è un contenitore in cui i valori dei dati (i termini) sono
collocate in base al contenuto dei dati (le regole). L’utilizzo di questi strumenti, uniti a potenti capacità di elaborazione e di scambio delle informazioni,
risulta in una documentazione e in un accesso migliore ai patrimoni informativi, in una maggiore qualità, consistenza delle informazioni e compatibilità
delle strutture informative, anche tramite delle mappature tra standard diversi
che favoriscono l’interoperabilità.
Gli standard della documentazione esistono da molto prima dell’avvento dei
computer e del Web: in un ambiente digitale, l’adozione di formati standard
e di vocabolari assicura la conservazione dei dati per applicazioni future, facilita l’Information Retrieval, permette e favorisce l’interscambio delle informazioni. Ad esempio, la capacità di fornire accesso remoto ai record della biblioteca non sarebbe possibile senza l’adozione del formato MARC accettato
come standard di comunicazione dei dati. Ma se gli standard sono la chiave
per l’effettiva condivisione delle risorse e per l’interoperabilità dei sistemi, gli
standard di ambito bibliotecario quali Z39.50 (lo standard internazionale per
la ricerca e il recupero tra siti) non sono stati incorporati nei browser o nei
motori di ricerca di Internet. Sebbene siano in corso ricerche per far sì che lo
Z39.50 possa supportare la ricerca cross-database in sistemi Web-based, uno
sviluppo sufficiente per supportare i sistemi bibliotecari è ancora al di là da
venire. Al tempo stesso, sono in corso di implementazione standard tradizionali quali il MARC, e si stanno affermando il Dublin Core e l’Encoded
Archival Description.
A questa situazione in divenire vanno aggiunti i differenti approcci alla documentazione e le diverse tradizioni di gestione delle informazioni. Le metodologie e le pratiche della documentazione dipendono dalla natura, dal ruolo e dalle
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 63
prospettive di chi possiede le informazioni. Vi sono in generale quattro approcci principali, che si sono evoluti nel tempo in seguito a nuove sfide e contesti:
- approccio archivistico: implica l’organizzazione e la descrizione dei
record, di carte personali e di manoscritti, enfatizzando la funzione e
la provenienza dei materiali d’archivio. Si applica a documenti, immagini, artefatti, registrazioni sonore, immagini in movimento, record
elettronici ed è basato sulla creazione di finding aid, ovvero di documenti che elencano o descrivono un insieme di record nell’archivio,
fornendo accesso all’utente. Questo approccio descrive collezioni, serie
e gruppi di materiali, invece di focalizzasi su item individuali; è basato
su standard ben definiti, come il formato MARC, RAD, APPM e
EAD e include metodologie per la creazione di record di catalogo,
inventari e registri e l’uso di vocabolari controllati come LCSH e AAT.
Il concetto di base è che la propria collezione sia costituita da materiale unico. Questo metodo non è ancora completamente informatizzato,
ma è sempre più orientato verso iniziative di condivisione dei dati;
- approccio biblioteconomico (anche noto come catalogazione e classificazione bibliografica): implica la catalogazione e la classificazione
di libri e di altri materiali testuali pubblicati. È basato sul concetto
che vi sono molteplici item per una stessa opera, e per questo motivo la condivisione dei dati è particolarmente vantaggiosa (ad esempio la catalogazione partecipata). È guidato da principi e da pratiche
che hanno origine da istituzioni guida nazionali (Biblioteca
Nazionale Centrale, Library of Congress) e viene insegnato nelle
scuole di biblioteconomia e pone una grande importanza sull’accesso
per soggetto. Questo metodo è facilitato da una lunga tradizione di
condivisione dei dati, ora gestita da associazioni e consorzi nazionali,
ed è basato su standard ben definiti, come il formato MARC e le
RICA, e continua a sviluppare nuovi standard (Z39.50). Include
metodologie per il lavoro d’autorità e l’uso di vocabolari controllati;
la sua informatizzazione è cominciata negli anni ‘70 per fornire
accesso pubblico ai materiali catalogati; è basato su una catalogazione a livello dell’item, ovvero viene creato un record catalografico per
ogni item, invece che ogni collezione; è potenziato dall’utilizzo di
servizi analitici di riassunti e indicizzazione (come Avery Index);
- approccio museografico: implica la documentazione di oggetti
museali (opere d’arte, artefatti, specimen). È un metodo complesso
che incorpora diversi argomenti informativi sull’oggetto (ad es. la
descrizione fisica, la provenienza, la conservazione, la documentazione fotografica, dati di ricerca) ed è basato sul concetto di esemplare
64 |
unico. Negli ultimi ha visto un incremento delle iniziative di condivisione dei dati; vengono utilizzati schemi di classificazione spesso
basati su divisioni disciplinari o su tassonomie e il controllo d’autorità sta diventando la pratica base. Questo approccio si è rivelato prezioso perché può essere riadattato per sistemi informativi pubblici, in
particolare per presentare le informazioni sulle proprie collezioni
attraverso Internet;
- approccio delle risorse visuali: include la catalogazione, classificazione e indicizzazione di immagini; fornisce accesso a immagini che
arricchiscono l’esperienza didattica e descrive sia i singoli esemplari
che insiemi di immagini, con livelli di descrizione complessi che
coinvolgono sia l’esemplare che il contenuto dell’immagine. È in
corso l’adozione di standard come il MARC, e al momento si utilizzano sia vocabolari controllati istituzionali che liste locali, ponendo un grande importanza sull’accesso per soggetto. Questo approccio ha uno stretto collegamento con la tradizionale documentazione
museale nella descrizione di immagini di oggetti museali, e usa
sistemi di classificazione altamente sviluppati sebbene non standardizzati. Un esempio di rilievo è quello del database di risorse visuali
SPIRO della University of California, Berkeley, degli Archivi
Alinari di Firenze e del RomeDAI - Guide for the photographs
degli archivi del Deutsches archäologisches Institute a Roma.
In base all’approccio scelto tra quelli sopraelencati, l’interoperabilità può essere raggiunta a livello tecnico, contenutistico o organizzativo, oppure per una
combinazione di questi. Questa situazione certamente rappresenta una sfida e
un’opportunità, poiché l’interoperabilità è necessaria per poter garantire la
compatibilità tra i diversi livelli che compongono la biblioteca digitale ma al
tempo stesso la diversità del Web ha anche fornito un’occasione unica per la
personalizzazione e la specializzazione.
3.2.1 Il mondo degli schemi di metadati: princìpi e questioni pratiche
Il termine metadati, letteralmente ‘dati strutturati riguardo altri dati’, é sempre più ubiquamente adottato, secondo modalità diverse, da differenti comunità professionali addette alla progettazione di sistemi documentali. Una definizione puntuale é quella di Anne J. Gilliland-Swetland del Getty Research
Institute, secondo cui i metadati sono «the sum total of what one can say
about any information object – at any level of aggregation» 9 (per information
object si intende un’entità digitale, singola o aggregata, indipendentemente
dal tipo e dal formato, che può essere identificata e manipolata dall’uomo o
da un computer come un’entità discreta). I metadati sono cioè serie struttura-
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 65
te di informazioni relative ad un documento costituito da un insieme di dati.
Essi non soltanto identificano, descrivono e localizzano entità (digitali e analogiche) in un sistema distribuito di rete, ma ne documentano il comportamento, le funzioni e l’utilizzo, le relazioni con altre entità e le modalità di
gestione e di accesso, facilitandone il recupero.
Nell’era dell’ICT, queste caratteristiche rendono i metadati sempre più
importanti nella messa a punto di sistemi efficaci, interoperabili, scalabili e
longevi. È importante ricordare che l’idea dei metadati è nata da un nuovo
concetto sorto al di fuori della tradizionale arena bibliografica: a mano a
mano che venivano creati dati scientifici in forma digitale, in particolar modo
dati geospaziali, divenne evidente la necessità di surrogati per fornire informazioni sui contenuti degli insiemi digitali. Un numero sempre maggiore di tipi
e di quantità di oggetti divenne progressivamente disponibile in forma digitale, ma si capì che i dati grezzi non avevano valore senza informazioni sul
modo e l’obiettivo in cui erano stati raccolti, sui formati, le piattaforme per
visualizzarli e manipolarli, le restrizioni sulla riproduzione e sul riuso, oltre
naturalmente ad informazioni per l’identificazione più convenzionali come
l’autore o il produttore il titolo, il soggetto e l’abstract. Inoltre il valore dei
metadati è limitato, se non vi è accordo comune su quali elementi o contenuti dovrebbero possedere: la loro affidabilità e la loro intelligibilità verrebbero
meno senza una buona dose di standardizzazione.
Tutte le ragioni per cui l’indicizzazione e la catalogazione sono necessarie per i
documenti analogici si applicano in modo ancora maggiore ai metadati per i
documenti digitali. E come nel mondo della catalogazione e indicizzazione
tradizionale, servono diversi livelli di metadati, a seconda del tipo di documento e dell’utilizzo che se ne intende fare. Il concetto è determinante sia per
gli autori di documenti che per chi cerca informazioni: usati in modo efficace, nel cyberspazio rendono l’informazione visibile e accessibile etichettando i
suoi contenuti in modo consistente. Le risorse il cui valore è effimero potrebbero richiedere solo un livello minimo di descrizione, mentre i documenti
con un valore di ricerca o commerciale più duraturo potrebbero avere descrizioni più complete.
I bibliotecari e gli indicizzatori hanno prodotto e standardizzato metadati per
secoli, ma è importante rilevare che al di fuori dell’ambito biblioteconomico
il termine assume significati molto ampi. I computer, ad esempio, catalogano
i loro dati interni per tenere traccia di differenti oggetti discreti e funzionare
correttamente: questo tipo di catalogo di dati è conservato dal computer
come una relazione ricorsiva che è stata definita ‘metadati’. Nel mondo dei
database il termine viene utilizzato per fare riferimento a informazioni strutturate che ne descrivono l’organizzazione: ad esempio il modo in cui i dati
66 |
sono organizzati le tabelle e i campi di un database, inclusi i tipi di dati, la
gamma di valori accettabili e il modo in cui questa viene trasformata.
Inoltre vi sono alcune incomprensioni comuni sul termine. Ad esempio, si
suppone che i metadati facciano riferimento ad informazioni codificate
secondo uno schema specifico e non alla tecnologia che le gestisce, e nemmeno agli spazi concettuali che controllano il valore degli elementi dell’informazione. In questo senso MARCXML o DCMES non sono metadati,
ma schemi di metadati, XML è solo uno strumento tecnologico e i linguaggi di indicizzazione, gli schemi di classificazione, ecc., non sono metadati in se stessi, ma valori o regole per trovare il giusto valore da dare a elementi di metadati.
Tipologie di metadati
Fino ad oggi i bibliotecari hanno focalizzato la loro attenzione su metadati in
associazione ad attività di descrizione o catalogazione. Oltre alla funzione
descrittiva, tuttavia, per essere efficace uno schema di metadati deve anche
stabilire un struttura e una terminologia standard, in modo che i vari campi
possano essere mappati ad un unico concetto e i termini inseriti abbiano una
codifica chiara (in contrasto, la maggior parte dei contesti non catalografici
affronta il problema della struttura dei dati piuttosto che dei loro contenuti).
L’obiettivo di base è quello di cercare di comprendere e di affrontare l’universo documentale, semplificandolo attraverso la categorizzazione e la classificazione, che creano delle realtà artificialmente ordinate. Queste classificazioni
servono ad ignorare le idiosincrasie delle entità individuali e a manipolarle
attraverso le caratteristiche collettive più generali. L’emergenza del Web e la
crescita esplosiva di contenuti online hanno ulteriormente stimolato questo
compito ordinativo e l’interesse nei metadati si è evoluto in risposta alle sfide
del nuovo contesto. Pur condividendo alcuni degli obiettivi delle biblioteche,
i metadati svolgono tuttavia un ruolo in qualche modo diverso, dovuto al
fatto che il Web si differenzia dalle modalità di catalogazione tradizionali 10.
L’ambiente in cui esiste il catalogo e i suoi standard è relativamente indipendente e controllato, la creazione e il mantenimento di un catalogo di record sono
svolti da una comunità di esperti e l’interfaccia del catalogo è in genere ristretta
ai sistemi bibliotecari integrati. Infine, lo scambio di record catalografici è regolamentato in forma di download di record in formato MARC da enti autorizzati come il nostro Servizio Bibliotecario Nazionale (SBN) o l’americano Online
Computer Library Center (OCL). In contrasto, il Web assomiglia ad una specie
di Far West informativo, in cui il mantenimento di informazioni è perseguito
da diverse comunità con una grande varietà di standard descrittivi. I contenuti
e i servizi forniti da queste comunità coesistono nello stesso spazio e il loro uso
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 67
di frequente attraversa i confini delle diverse comunità, dando origine a quello
che Stuart Weibel ha definito Internet Commons.
Ottenere il consenso sui metadati e su altri standard è importante per gestire
e conservare i documenti digitali nel tempo, per permettere l’interoperabilità
e la ricerca attraverso database multipli. Gli insiemi di metadati finora creati,
conformi per quanto possibile agli standard nazionali e internazionali, sono
diventati strumenti che i professionisti dell’informazione stanno usando per
sfruttare queste opportunità, e affrontare numerose questioni relative alla
gestione di grandi quantità di dati: l’aumentata accessibilità attraverso collezioni multiple o collezioni virtuali dai materiali che sono distribuiti attraverso
numerosi repository; la contestualizzazione del documento; molteplici modi
di ricercare le informazioni, presentare i risultati e manipolare gli oggetti
informativi, senza compromettere l’integrità dei questi oggetti; la multiversionalità; questioni legali relative ai diritti di proprietà e di riproduzione di un
documento e delle sue diverse versioni; la conservazione nel lungo periodo;
modelli economici sostenibili per la loro creazione e gestione.
I metadati possono essere distinti in base ai loro attributi, quali la fonte da cui
provengono, i metodi di creazione (automatica, semiautomatica, manuale), i
tempi di creazione (insieme al documento o aggiunti in seguito), la qualità (se
creati o meno da esperti), la staticità, la struttura standard o meno, la conformità semantica e il livello di riferimento (collezioni o singola entità). Certamente
sono entità mutevoli nel tempo e nello spazio e continuano ad accrescersi entro
il sistema entro cui dimorano, durante il ciclo di vita del documento con il
quale si relazionano. I metadati non possono essere considerati come ‘definitivi’,
perché una volta creati non rimangono statici, ma vanno incontro a modifiche
(a volte ad eliminazioni) e a localizzazioni diverse nel corso del tempo.
Certo anche l’adozione dei metadati non è esente da problemi. Uno dei
detrattori più noti, Michael Gorman, li ritiene «un tentativo sconsiderato di
trovare una sorta di terza via tra il deserto dei motori di ricerca e della ricerca a testo libero e la grande architettura del controllo bibliografico che i
bibliotecari hanno sviluppato negli ultimi centocinquant’anni», prodotti da
«quelli che, senza alcuna conoscenza della catalogazione, né riguardo per
essa, come alchimisti bibliografi, cercano la pietra filosofale che ci offrirà
una catalogazione efficace senza spese e accesso efficace senza vocabolari
controllati» 11. Ma la realtà dei fatti ne sta dimostrando l’importanza e l’utilità, tanto che stanno avendo un ruolo sempre più importante nel mondo
della catalogazione.
Con la parcellizzazione delle conoscenze, anche le specificità degli stessi metadati sono andate via via differenziandosi a seconda delle condizioni in cui essi
si muovono insieme agli oggetti cui si riferiscono. L’esistenza di una moltepli68 |
cità tipologica di metadati sarà il nodo cruciale per la continuità di accesso e
di utilizzo, fisico e intellettuale ai documenti digitali. I metadati sono spesso
suddivisi in tre categorie concettuali (Tab. 1) indicate dal Working Group on
Preservation Metadata e adottate come modello della CAL Digital Library
(anche se alcune istituzioni, come il Getty Institute, distinguono però in 5
categorie):
1. metadati descrittivi: facilitano l’identificazione e il recupero della
risorsa (ad es. metadati bibliografici) e rappresentano il tentativo di
affrontare la proliferazione delle differenti versioni ed edizioni di
documenti digitali. Nel mondo dei documenti a stampa, il ciclo di
pubblicazione solitamente rinforza il processo editoriale e crea degli
intervalli tra l’uscita delle diverse pubblicazioni. Ma per un’opera
digitale, che è di per sé altamente mutevole, spesso i processi e gli
intervalli vengono eliminati e le varianti sono create velocemente e
senza troppo pensare all’impatto sul controllo bibliografico;
2. metadati amministrativi: supportano la gestione del documento all’interno di una collezione, facilitandone l’accesso e la conservazione.
Possono descrivere il visualizzatore o il player necessario, oppure attributi come la risoluzione dell’immagine, le dimensioni del file, la velocità di campionamento, fornire dati su come e quando un oggetto
digitale è stato creato e archiviato e sulla gestione dei diritti. I metadati amministrativi conservano le informazioni necessarie per mantenere
un lavoro digitale accessibile nel tempo: nel caso di un libro, ad esempio, indicano che sono necessari tutti i file individuali per ottenere il
volume, la loro localizzazione e quali applicazioni e formati sono
necessari per la visualizzazione. Sono particolarmente importanti
quando si spostano i file su un nuovo server, oppure si effettua il refreshing o la migrazione dei file a scopo conservativo;
3. metadati strutturali: collegano fra loro i componenti di oggetti informativi complessi, fornendo le indicazioni tecniche necessarie, descrivono le associazioni all’interno di o tra oggetti informativi individuali
interrelati tra loro. In un libro, composto di capitoli e paragrafi, i metadati strutturali spiegano come le immagini delle singole pagine formano i singoli capitoli, e come i capitoli costituiscono il libro. I metadati
strutturali aiutano cioè l’utente a navigare tra i singoli componenti di
un oggetto composito, evidenziando che, per molti lavori in forma
digitale, non è sufficiente la semplice visualizzazione del documento,
poiché l’utente deve poter navigare attraverso esso e si aspettano un
certo comportamento, in particolare quando ha di fronte la versione
digitale di un documento cartaceo 12.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 69
Tipo
Definizione
Metadati
descrittivi
Metadati che descrivono e identificano
il contenuto (intellettuale) di un documento, come il MARC e Dublin Core
Metadata Element Schema
- Record catalografici
- Finding aid per il recupero dei
documenti
- Indici su database specializzati
- Link ipertestuali tra risorse Web
- Annotazioni degli utenti
- Metadati generati automaticamente
in sistemi di archiviazione
Metadati
amministrativi
Metadati utilizzati nella gestione
e nell’ammnistrazione dei documenti,
includono informazioni sulla proprietà
e sulla gestione dei diritti
- Informazioni sulle modalità
di acquisizione
- Regesto dei diritti di proprietà
intellettuale e di riproduzione
- Documentazione dei requisiti
di accesso legale
- Informazioni sulla reperibilità
- Controllo delle versioni
- Informazione sulla fonte originale
(URN, handle)
- Informazioni su chi ha digitalizzato
e come
- Informazioni su chi è responsabile
del documento
Metadati
strutturali
Metadati che indicano come mostrare
e navigare tra i documenti digitali
- Descrizione delle relazioni tra file
digitali multipli, come l’ordine delle
pagine in un libro digitale
Metadati
di conservazione
(Getty Institute)
Metadati relativi alla conservazione
dei documenti
Documentano:
- Requisiti hardware e software per
la conservazione
- Status conservativo
- Azioni per la conservazione della
versione digitale o fisica del
documento (ad es. refreshing
e migrazione)
Metadati tecnici
(Getty Institute)
Metadati che descrivono le funzionalità
di un sistema e il comportamento dei
metadati
- Informazioni di digitalizzazione
(risoluzione, dimensioni dei pixel,
compressione ecc.)
- Dati di autenticazione e sicurezza
(dati criptati, password)
Metadati di uso
(Getty Institute)
Metadati relativi al livello e al tipo
di utilizzo dei documenti
- Regesto dell’uso e del
comportamento dell’utente
- Gestione profilo utente
- Riutilizzo del contenuto
- Informazioni relative all’esistenza
di versioni multiple
- Informazioni relative alle
registrazioni di visualizzazione
[Tab.1] I diversi tipi di metadati e le loro funzioni
70 |
Esempi
La ‘piramide descrittiva’ dei dati 13 continuerà a crescere sempre di più con
il progressivo sviluppo di nuove modalità di combinazioni di metadati e
con il crescente bisogno da parte degli utenti di conoscenze più dettagliate
sulle similarità e differenze dei documenti. Come ricorda Carl Lagoze della
Cornell University, i metadati non sono monolitici, ma rappresentano
piuttosto «multiple views that can be projected from a single information
object» 14: implicano perciò un approccio modulare nell’architettura come
il Resource Description Framework (RDF) 15, che permette a differenti
comunità di associare e mantenere pacchetti di metadati multipli per le
risorse Web, o l’OAI (Open Archive Initiative) che definisce un’infrastruttura tecnologica tesa a garantire l’integrazione e l’interoperabilità di archivi
distribuiti.
Princìpi e questioni pratiche
I metadati sono un importante collegamento nella catena di valore dell’econo-mia
della conoscenza, ma vi è ancora molta confusione su come dovrebbero essere integrati nei sistemi di gestione dei documenti. In un articolo 16 stilato dai responsabili
di due prominenti iniziative, Dublin Core Metadata Initiative (DCMI) e Institute
for Electrical and Electronics Engineers (IEEE) Learning Object Metadata (LOM)
Working Group, sono state affrontate queste questioni in modo puntuale e comprensivo, suddividendole in princìpi e questioni di carattere pratico.
Princìpi
Modularità
È la chiave principale per ambienti caratterizzati da fonti di contenuto profondamente diverse. La modularità permette di creare nuovi insiemi basati su
schemi di metadati preesistenti. La dimensione modulare inoltre gioca un
ruolo importante nella scoperta dei documenti perché gli utenti di solito
cominciano la ricerca usando termini semplici e perfezionano le query nei
passaggi successivi. Le descrizioni più complesse permettono agli utenti di
effettuare ricerche più granulari, specifiche di un certo ambito e di alcuni
aspetti delle risorse, o fornendo informazioni essenziali per la conservazione e
gestione dell’accesso alla risorsa.
Namespace
Un namespace è una collezione formale di termini, gestiti secondo un criterio
logico o un algoritmo, che permette l’identificazione univoca degli elementi e
rappresenta una parte fondamentale dell’infrastruttura del W3C (e in particolare dello schema XML). Il protocollo di base del Web, ad esempio, è http,
un namespace che garantisce che un dato URL sia unico a livello globale.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 71
Ogni elemento di un metadato è un namespace regolato da regole e da convenzione determinate dall’ente che lo ‘registra’ e lo mantiene. Le dichiarazioni
di namespace permettono di definire il contesto di un particolare termine,
assicurando in tal modo che esso abbia una definizione unica nei confini di
quel dichiarato namespace. Ad esempio il Dublin Core Metadata Element Set
viene definito da una collocazione Web specificata da un URI, e tutti gli elementi Dublin Core nell’ambito dell’obiettivo di questa dichiarazione di
namespace sono riconoscibili dal prefisso ‘dc.’. Altri esempi di schemi di
namespace sono il Biblink e il ROADS Template. Usando questa infrastruttura, chi progetta i metadati può selezionare gli elementi da metadati già esistenti, identificando chi li gestisce.
Estensibilità
Le architetture di metadati devono facilmente accogliere la nozione di uno
schema di base, con elementi aggiuntivi che personalizzano una certa applicazione ai bisogni locali o a quelli di un contesto specifico, senza compromettere l’interoperabilità fornita dallo schema di base.
Refinement
Il mondo delle applicazioni si differenzia in base al livello di dettaglio necessario o desiderabile. Gli standard di metadati dovrebbero consentire di scegliere il livello di dettaglio appropriato per una certa applicazione. Poiché
popolare i database di metadati è costoso, vi sono forti incentivi economici a
creare metadati con sufficienti dettagli. Vi sono due nozioni da refinement da
considerare: la prima è l’aggiunta di qualificatori che rifiniscono o rendono
più specifico il significato di un termine (ad es. ‘data di creazione’, ‘data di
modifica’ sono attributi dell’elemento ‘data’), la seconda implica le specifiche
di schemi particolari o di insiemi di valori che definiscono la gamma di valori
di un dato elemento. In questo modo si può incrementare l’interoperabilità
semantica attraverso le applicazioni, facendo riferimento ad un insieme di
valori comune.
Multilinguismo
È uno degli aspetti più ampi del multiculturalismo, che include, ad esempio,
il modo in cui le date vengono rappresentate su calendari diversi, la direzione
in cui il testo viene visualizzato e letto, le connotazioni culturali di certe icone
e pittogrammi, le pratiche standard (l’ordine dei nomi, standard di collazione,
standard sugli articoli). Molti di questi aspetti, ovviamente, vanno al di là del
contesto dei metadati. Tuttavia è importante che i metadati possano descrivere le caratteristiche rilevanti, e che facciano questo rispettando le differenze
culturali e linguistiche a livello globale e locale.
72 |
Questioni pratiche
Profili di applicazione
Poiché nessun singolo insieme di elementi di metadati soddisferà mai i requisiti
funzionali di tutti i sistemi, i profili di applicazione permettono di mescolare e
armonizzare gli schemi nel modo più appropriato ai bisogni di una specifica
comunità 17. Un profilo di applicazione è un assemblaggio di elementi di metadati selezionati da uno o più schemi di metadati e combinati in uno schema composito. L’obiettivo è quello di adattare o combinare schemi esistenti in base ai
requisiti funzionali di una particolare applicazione, conservando al tempo stesso
l’interoperabilità con gli schemi base originali. I profili di applicazione raggiungono questa modularità attraverso una serie di meccanismi e di documentazione
volti ad armonizzare ed identificare i diversi elementi di metadati: la dichiarazione del numero di elementi obbligatori di un insieme, la specifica delle relazioni e
dell’indipendenza degli elementi, la restrizione dello spazio di valore degli elementi e la dichiarazione dei namespace selezionati, fonte/autorità responsabile
della creazione e della manutenzione dei profili stessi, regole d’uso, vocabolari
controllati utilizzati. Esempi di profili di applicazione sono il Biblink Core 18, il
DC Education Working Group, i ROADS Document Template, il CIMI Profile
for Cultural Heritage Information e il Bath Profile for Library Application and
Resource Discovery. In realtà il concetto non è nuovo: da diverso tempo molte
applicazioni combinano elementi provenienti da più schemi, definendo determinati elementi come ‘locali’, aggiungendone di nuovi o modificando la semantica
di schemi esistenti (ad es. i vari formati MARC, e l’uso tipico del numero 9 del
formato UNIMARC per denotare un dato locale).
Sintassi e semantica per l’interoperabilità
La semantica riguarda il significato e la sintassi la forma: sono necessari accordi su entrambe perché due comunità possano condividere i metadati, ovvero
occorre una convenzione condivisa sui valori di identificazione e di codifica.
Tuttavia è importante mantenere la sintassi e la semantica il più separate possibile. La mancanza di stabilità nel mondo dei linguaggi di markup enfatizza
la necessità di mantenere l’indipendenza tra la semantica degli elementi di
metadati e la loro rappresentazione sintattica. Il linguaggio XML, che oggi
rappresenta ancora una piccola parte dei markup sul Web, è il linguaggio
ideale per la codifica e lo scambio di dati strutturati. La possibilità di creare
namespace in XML fornisce capacità strutturali che HTML non possiede,
rendendo più facile raggiungere i principi di modularità e di estendibilità. Le
specifiche di schema XML definiscono un linguaggio che consente la specificazione dei profili di applicazione, che aumenteranno le prospettive di interoCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 73
perabilità. Infine, deve essere notato che vi è un terzo requisito per l’interoperabilità, al di là della sintassi e della semantica: i vocabolari di contenuto, che
potrebbero essere illimitati come un linguaggio naturale. Gli schemi di metadati si differenziano in contenuti e struttura, che è particolarmente difficile da
mappare. È possibile combinare questa interoperabilità semantica, supportata
da un framework comune e flessibile come XML, con mappe semantiche
create o potenziate dalle persone (ad esempio mappature di metadati) per sviluppare delle applicazioni di metadati human-understandable 19.
Modelli di associazione
Vi sono vari modi di associare i metadati alle risorse. I metadati inseriti all’interno del linguaggio di markup di una risorsa. Questo implica che i metadati
vengano creati insieme alla risorsa, spesso dall’autore. Non è chiaro se siano
migliori i metadati creati dagli autori stessi o quelli creati da professionisti,
ma in termini pratici la descrizione delle risorse è costosa e non sistematica, e
quindi ogni investimento da parte degli autori nella descrizione dei loro lavori
intellettuali è comunque preziosa. I metadati interni possono anche essere
soggetti ad harvesting, e il presunto incremento in visibilità che potrebbe
derivarne è un incentivo per la loro creazione 20. I metadati associati sono
invece mantenuti in file strettamente collegati alla risorsa che descrivono e
possono essere o meno essere soggetti ad harvesting. Il vantaggio deriva dalla
relative facilità di gestione dei metadati senza associare il contenuto della
risorsa stessa, ma questo beneficio è acquisito a costo della semplicità, poiché
è necessaria la co-gestione dei file delle risorse e dei file dei metadati. Infine i
metadati third-party sono mantenuti in un repository separato da una organizzazione che può avere o meno il diretto controllo o l’accesso ai contenuti
delle risorse. Tipicamente, questi metadati sono mantenuti in un database che
non è accessibile agli harvester. Tuttavia la Open Archives Initiative propone
un sistema che incoraggia l’apertura dei repository di metadati tra server che
utilizzano l’Open Archives Initiative Metadata Harvesting Protocol (OAIPMH)21. Le questioni di sintassi e i modelli associativi vengono spesso confusi. Ognuno di questi tre idiomi sintattici può essere facilmente inserito nel
markup di una risorsa digitale o gestito come un’entità separata. Una data
risorsa informativa spesso avrà record di metadati multipli che riflettono i vari
obiettivi e prospettive delle organizzazioni che li creano e che li gestiscono.
Identificazione e denominazione degli elementi di metadati
Lo scopo dei namespace URI sul Web è quello di far sì che ogni elemento di un
insieme di elementi possa essere rappresentato da un nominativo di indirizzo
globale, il suo URI. Identificatori globali invarianti rendono molto più facile
74 |
l’elaborazione informatica dei metadati attraverso linguaggi e applicazioni , ma
non sono facilmente letti dalle persone. La denominazione persistente rimane
una questione fondamentale nella costruzione di biblioteche digitali: sebbene il
Web abbia portato ad un incremento dell’accesso ai contenuti, la sua architettura ha violato la tradizione di fornire informazioni di localizzazione relative ad
un lavoro, indicando invece la localizzazione precisa. Il sistema di localizzazione
precisa, cioè l’URL, porta spesso ai messaggi di errore (404 - File Not Found)
che risultano nella maggior parte di casi dalla normale manutenzione dei siti
Web (ridenominazione di cartelle, di directory, riorganizzazione delle localizzioni dei file). Negli ultimi anni è stato fatto molto lavoro sulla denominazione
indiretta (PURL, URN e handle), ma oltre ad esservi disaccordi sulla forma di
denominazione indiretta migliore, vi sono anche controversie se il nome persistente dovrebbe essere semanticamente leggibile o meno.
Registri di metadati
Con il progressivo aumento del numero di metadati e di profili di applicazioni,
l’importanza della gestione e dei ruoli dei registri è destinata ad aumentare 22.
Con diversi gradi di funzionalità, essi assumeranno le caratteristiche di un
dizionario digitale, disponibile in consultazione per i progettisti di applicazioni,
i creatori e i gestori dei metadati, le applicazioni e gli utenti finali. Poiché ogni
schema di metadati o profilo di applicazione è soggetto a evoluzioni, i registri
manteranno le relazioni tra le diverse versioni degli schemi, in modo da promuovere l’interope-rabilità semantica e informatica .
Completezza della descrizione
Non tutti gli elementi dello schema di metadati di un sistema sono necessariamente appropriati per ogni tipo di risorsa, ma vanno selezionati in base al
valore appropriato e alle best practice dell’ente creatore dei metadati.
Descrizioni di metadati dettagliate possono migliorare la precisione della
ricerca, ma richiedono un maggiore investimento e rendono più difficile promuovere la consistenza. Di contro le descrizioni semplici sono più facili e
meno costose da generare, ma possono generare maggiore ‘rumore’ nei risultati della ricerca.
Oggettività vs. soggettività
Il processo di creazione dei metadati può implicare un input sia soggettivo
che obiettivo. Alcuni metadati sono chiaramente oggettivi e possono anche
essere generati in modo automatico; altri metadati possono essere soggettivi,
sia perché alcuni elementi sono soggetti a differenti punti di vista (assegnazione di parole chiave, riassunti del contenuto in un abstract), o perché sono
specificatamente intesi a rappresentare una valutazione soggettiva (la recensioCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 75
ne di un libro o una presentazione). Anche elementi più formali di metadati
diventano soggettivi quando usati in un contesto culturale o disciplinare che
dipende dall’interpre-tazione locale. Il requisito primario della progettazione
dei metadati è quello, per quanto possibile, di rendere esplicito il contesto.
Generazione automatica
Prima del Web, la maggior parte dei metadati per il recupero dei documenti
erano creati manualmente, con un’attività intensa e onerosa di catalogazione
bibliotecaria che risulta costosa e poco pratica per molti dei materiali disponibili su Internet. I motori di ricerca oggi indicizzano una significativa porzione del
Web e offrono accesso indicizzato a basso costo, generalmente secondo criteri
pubblicitari. Tra questi due estremi vi è un’ampia gamma di modalità di creazione di metadati che possono essere rese automatiche, e che probabilmente
diventeranno sempre più importanti a mano a mano che le tecniche di elaborazione del linguaggio naturale, il data mining, gli algoritmi di riconoscimento
dei profili e dei pattern diventano più efficaci. Sarà più facile ed economico
combinare metadati già forniti dalle applicazioni (ad es. data di creazione, elementi con tag strutturali, formati di file e informazioni correlate), metadati forniti dal creatore (keyword, autori, affiliazioni, ecc.) e metadati basati sulla deduzione (es. classificazione basata su algoritmi di classificazione automatici).
Da quanto evidenziato sopra, è chiaro come i metadati siano un componente
chiave dell’infrastruttura informativa, necessaria per aiutare a creare l’ordine nel
caos documentale in ambienti di rete. Essi forniscono descrizioni, classificazioni
e organizzazioni di differente qualità e organizzate in base a differenti scopi che
rispecchieranno obiettivi, e modelli di business dei fornitori delle informazioni.
Ma perché queste opportunità possano realizzarsi saranno necessarie alcune
convergenze di formati di codifica e di semantiche approvate universalmente.
Nei prossimi paragrafi verròà analizzata la categoria dei metadati descrittivi
alla luce di quegli schemi nati per facilitare l’identificazione e il recupero dei
documenti digitali online.
3.2.2 Metadati descrittivi
I metadati descrittivi non sono una novità, essendo stati elaborati da tempo in
ambito bibliografico per consentire l’accesso a vari tipi di documenti. Essi
includono schemi di classificazione (Classificazione Decimale Dewey, Library
of Congress Classification, Classificazione Decimale Universale, ecc.), regole di
catalogazione (Regole Italiane di Catalogazione per Autore, Anglo-American
Cataloguing Rules, Regeln für die Alphabetische Katalogisierung, ecc.) e formati bibliografici (MARC e tutte le sue declinazioni locali: UNIMARC,
USMARC, ecc.). La strutturazione dei dati é sempre stata importante nello
sviluppo dell’organizzazione e della rappresentazione delle informazioni, ma
76 |
l’avvento di nuovi media informativi con potenti capacità di elaborazione e
l’ampliarsi degli orizzonti in varie discipline hanno determinato nuove problematiche nella catalogazione e nella restituzione dei documenti. La descrizione
potrebbe costituire un impedimento alla scoperta dei documenti, anche se le
tecnologie di rete hanno diminuito le barriere spazio-temporali: questo perchè
la scoperta dei documenti varia in base alla struttura, al tipo e al contenuto del
documento, e allo scopo di chi cataloga. Inoltre bisogni informativi complessi
richiedono che sia possibile effettuare query parallele in sistemi informativi
specifici, per permettere l’accesso ad archivi informativi distribuiti.
In particolare, la rapida crescita di documenti digitali disponibili sul Web ha
comportato in questi ultimi anni una serie di sforzi da parte di una molteplicità di attori della catena documentaria per garantirne l’identificazione e la
localizzazione, sia seguendo tecniche e strumenti consolidati delle biblioteche,
che adottando un approccio più snello, che sfrutta direttamente la codifica e
le informazioni interne agli oggetti-documenti.
Gli standard descrittivi correnti, basati su un modello bibliografico, sono progettati per entità analogiche, statiche e materiali, con caratteristiche relativamente semplici e definite. Essi si trovano in difficoltà di fronte alla descrizione
di materiali digitali, temporalmente instabili e interrelati in modi complessi e
diversificati e non riescono a tenere il passo con le trasformazioni tecnologiche,
distinguendo inoltre ancora tra risorse elettroniche e audiovisive piuttosto che
tra documenti analogici e digitali 23. La situazione attuale richiede un ripensamento di questi standard: l’ISBD NBM (Non Book Materials) venne concepito nel 1977 come una semplice categoria ‘diversa’ rispetto ai documenti a
stampa, mentre il più recente ISBD ER (Electronic Resources) tende a specializzarsi sulle cosiddette ‘risorse elettroniche remote’ e ad abbracciare sempre
più tipologie di documenti che rientrano negli audiovisivi.
I metadati descrittivi si pongono l’obiettivo di permettere la scoperta di collezioni e di documenti attraverso l’uso di strumenti di ricerca, e forniscono un
contesto sufficiente a capire cosa è stato recuperato. Ma quando le collezioni
sono molto ampie o si cerca attraverso collezioni multiple, come succede sul
Web, scoprire i documenti che ci interessano diventa come cercare un ago in
un pagliaio. Senza standard e una costante verifica e conservazione dei metadati descritti, queste grandi collezioni sarebbero inutili.
Uno standard di metadati descrittivi e al tempo stesso di standard strutturale
molto conosciuto per le biblioteche è il MARC (MAchine-Readable Catalog),
utilizzato per catalogare entità bibliografiche. Il MARC assegna nomi ai campi
e sottocampi del record leggibile da una macchina, senza specificare i dati che
devono essere inseriti in quei campi e sottocampi, indicazione che proviene
dagli standard di contenuto, come le RICA, le AACR2, gli schemi di classifiCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 77
cazione e le liste di voci di soggetto. Negli ultimi anni, parallelamente alla
creazione degli OPAC Web e dell’ISBD (ER), il MARC si è evoluto per
rispondere alle sfide degli ambienti di rete aggiungendo campi specifici obbligatori per la descrizione delle risorse sul Web (ad esempio il campo 538 per i
requisiti di sistema e le modalità di accesso, i campi 256 e 516 per le caratteristiche dei file, il campo 856 per la localizzazione elettronica e accesso) 24 ed è
stato creato uno standard MARC XML 25. Il successo che hanno incontrato
nuovi tipi di metadati dimostra che il MARC funziona certamente molto bene
nella biblioteca tradizionale, ma non è stato progettato per descrivere immagini, file audio e altri nuovi tipi di media ed è carente a livello di granularità
semantica e di strutturazione tecnica dei dati 26.
Se il MARC non è in grado di fornire la flessibilità richiesta in quest’ambito, ciò
non significa che non verrà più utilizzato. Vi sono miliardi di record in formato
MARC nei cataloghi online: in termini di tempo, energie e risorse, il costo di una
conversione in altri formati sarebbe improponibile. Piuttosto, lo scenario attuale
indica che sarà necessario mantenere l’interoperabilità con altri schemi di metadati per il Web. L’ultimo decennio del ‘movimento dei metadati’ ha incluso lo sviluppo di schemi di metadati generali come Dublin Core (cfr. paragrafo 2.2.3),
GILS (Government Information Locator Service) 27, e schemi di metadati per
ambiti più specifici come MPEG-7 (cfr. paragrafo 2.2.4), TEI (Text Encoding
Initiative), EAD (Encoded Archival Description) 28, CIMI (Consortium for the
Interchange of Museum Information), VRA (Visual Resources Association) 29,
Categories for the Description of Works of Art (CDWA) 30, Content Standard for
Digital Geospatial Metadata (CSDGM) 31 e molti altri che hanno in comune una
sintassi machine-readable.
Le numerose crosswalk o mappature tra diversi schemi di metadati 32(cfr. paragrafo precedente) denotano lo sforzo di stabilire un raccordo fra i formati
bibliografici strutturati e i metadati dei documenti digitali, per garantire l’interoperabilità tra sistemi e database multipli 33.
Il mondo dei metadati sta diventando ogni giorno più complesso, a seconda
degli standard creati dalle diverse comunità: un giardino, secondo la fortunata
metafora di Priscilla Caplan, in cui nascono e crescono mille fiori, dove esistono molte differenze, ma anche diverse affinità 34. I metadati descrittivi si
distinguono per livello di specificità, struttura, maturità, tipo di utenza e di
utilizzo, orientamento o meno a funzioni bibliografiche sulla linea tracciata
dal modello FRBR 35, risorse descritte, sintassi usata (alcuni schemi come
l’EAD o MPEG-7 sono molto articolati mentre altri, come ad esempio
Dublin Core o le VRA Core Categories, esprimono delle semplici categorie
semantiche). Il loro scopo comune rimane comunque quello di descrivere,
identificare e usare risorse in rete.
78 |
3.2.3 Dublin Core Metadata Element Set (DCMES)
Breve storia
La Dublin Core Metadata Initiative (DCMI) è un’organizzazione nata nel 1995
a Dublin, nell’Ohio, nell’ambito di un workshop della OCLC (Online
Computer Library Center) che ha riunito bibliotecari, ricercatori sulla biblioteca
digitale, fornitori di contenuto ed esperti di linguaggi di markup con l’obiettivo
di migliorare gli standard per la scoperta delle risorse informative in ambienti di
rete 36.
Le biblioteche, come osservato, hanno tradizionalmente adottato l’approccio che
impiega un singolo schema omnicomprensivo per tutti i tipi di documenti e tutti i
gruppi di utenti. In presenza di nuovi tipi di documenti, vengono aggiunti nuovi
campi a questo framework, oppure si modificano le regole di campi già esistenti; e
quando le comunità mostrano il bisogno di nuovi metadati, anche questi vengono
incorporati nello schema esistente. Le critiche a questo approccio rilevano che lo
schema è diventato così complesso che soltanto degli esperti altamente specializzati
(i catalogatori di biblioteca) sono in grado di assegnare i metadati, che il sistema è
troppo lento nell’adattarsi a nuovi di tipi di documenti e molti utenti hanno bisogno di specifici metadati che non vengono contemplati nel mondo del MARC. Le
metodologie di catalogazione delle biblioteche erano e continuano ad essere troppo
complesse e costose per fornire una base ragionevole per la descrizione di contenuti
Web, e sono nella maggior parte dei casi inappropriati per gli ambienti in rete, che
hanno un contenuto effimero e disseminato in una varietà di fonti che spesso non
coincidono con enti autorevoli e riconosciuti.
Questa situazione ha portato alla creazione del Dublin Core Metadata
Element Set (DCMES, o più semplicemente Dublin Core o DC) 37, come
schema di metadati di scoperta che permettesse agli utenti di ricercare attraverso diversi documenti, catalogati sia in modo approfondito (spesso ereditati
dai sistemi tradizionali di catalogazione) che generico (nuovi o in forma digitale) sia dai professionisti che dagli autori.
L’obiettivo iniziale della DCMI è stato quello di fornire descrizione di uno
specifico tipo di risorsa: semplici documenti Web in HTML, non interrelati
con altre risorse e con un ciclo di vita molto semplice, indicati come
Document-Like Object o DLO. Questi DLO sono stati utilizzati per facilitare
la scoperta interdisciplinare e intertipologica, utilizzando due metafore:
- DC come linguaggio pidgin (coniata da Tom Baker, membro della
DCMI) ovvero come un linguaggio grezzo e con una sintassi ridotta
usato per comunicazione di base tra individui che hanno linguaggi e
background diversi;
- metafora del turista digitale (coniata da Ricky Erway of Research
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 79
Libraries Group), che viaggia in un paese con un linguaggio che non
conosce e si porta con sé un insieme di frasi base per comunicare
durante la sua visita.
La chiave della semplicità è costituita da un vocabolario limitato e da una
struttura semplice, ovvero senza construtti sintattici e utilizzando principalmente verbi al presente e frasi dichiarative che appiattiscono eventi ed entità. Progressivamente è aumentato l’interesse per arricchire questo schema e
creare dei record catalografici più ricchi con versioni, linguaggi e codifiche
multipli.
L’approccio alternativo della comunità Dublin Core si basa su contenitori e
pacchetti di metadati interconnessi, ognuno dei quali sono mantenuti da una
specifica comunità. In base a questo approccio, ogni gruppo di utenti può
supportare i pacchetti di metadati di cui ha bisogno per i suoi usi specifici,
continuando al tempo stesso a interoperare con quelli di altre comunità.
Rispetto agli oltre 800 campi del MARC, lo schema originario di Dublin
Core proposto nel dicembre 1996 presentava soltanto 15 elementi di base
(Fig. 2), definiti usando un set di 10 attributi ricavati dalla norma ISO
11179. Ciascun elemento è a sintassi indipendente e opzionale, ripetibile e
senza ordine prefissato, in modo da permettere sia a professionisti delle
biblioteche sia a non esperti una descrizione comune del materiale catalogato.
Il set minimo si è attualmente esteso anche a sottoelementi o qualificatori,
implementati in modi diversi dalle varie comunità di utenti, ma il nucleo originario della descrizione, che oggi conta 15 descrittori, è rimasto stabile.
15 Elementi di Dublin Core
Contenuto
Proprietà
Istanza
Titolo
Creatore
Data
Soggetto
Altro responsabile
Tipo di risorsa
Descrizione
Editore
Formato
Fonte
Diritti
Identificatore
Lingua
Relazione
Copertura
[Fig. 2] Dublin Core semplice: gli elementi base nella traduzione di Antonio Scolari
80 |
Oggi il Dublin Core è diventato uno standard diffuso in tutto il mondo
(ANSI/NISO Z39.85 – 2001 e standard ISO nel 2003) 38 e tradotto in oltre 20
lingue, consentendo la descrizione di un’ampia gamma di oggetti digitali e facilitando al tempo stesso l’integrazione e l’interoperabilità tra diversi sistemi cognitivi.
Lo schema è in progressiva via di sviluppo verso una forma più allargata e dettagliata,
anche per consentire una migliore mappatura con altri metadati (Fig. 3), e d’altronde
il nome stesso (core) indica l’assunto che DC coesisterà con altri set di metadati.
La versione aggiornata del formato, che ha visto focalizzare l’interesse di
musei, agenzie ed organizzazioni commerciali, si caratterizza per:
- semplicità di utilizzo, in quanto si rivolge sia a non catalogatori che a
specialisti (permette infatti a ciascun autore di autocatalogare i documenti nello stesso header dell’HTML o XML);
- interoperabilità semantica, poiché stabilisce una rete comune di dati
concordati nel loro significato e valore;
- interdisciplinarietà;
- flessibilità ed estensibilità, in quanto permette di integrare e sviluppare
Dublin Core
Unimarc
Title
200
200
517
700
701
710
711
200
610
606
675
676
680
686
330
210
701
711
200
210
608
336
Creator
Subject
Description
Publisher
Contribution
Date
Type
Format
$a Title proper
$e Other Title information (for subtitle)
$a Other Variant Titles (for other titles)
$a Personal Name - Primary Intellectual Responsability, or if more than one:
$a Personal Name - Alternative Intellectual Responsability
$a Corporate Body Name - Primary Intellectual Responsability, or:
$a Corporate Body Name - Alternative Intellectual Responsability
$f First Statement of Responsability
$a Uncontrolled Subject Terms
Tropical Name Used as Subject (for LCSH and MeSH)
UDC
DDC
ICC
Other Classification Systems
$a Summary or Abstract
$a Name of Publisher, Distributor, etc.
$a Personal Name - Alternative Intellectual Responsability
$a Corporate Body Name - Alternative Intellectual Responsability
$g Subsequent Statement of Responsability (if role know)
$d Date of Publication, Distribution, etc.
$a Form, Genre or Physical Characteristics Heading
$a Type of Computer File (provisional)
[Fig. 3] Mappatura di Dublin Core con UNIMARC della Dublin Core Metadata Initiative
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 81
la struttura dei dati con significati semantici diversi ed appropriati al
contesto di applicazione;
- modularità, grazie alla natura della sua struttura;
- consenso internazionale in oltre 30 nazioni: attualmente DC viene
utilizzato come base di sistemi descrittivi di molteplici comunità di
interesse, tra cui istituzioni educative, biblioteche, istituzioni governative, settore della ricerca scientifica, autori di pagine Web, e-business, Knowledge Management.
Queste caratteristiche ne fanno una potenziale alternativa per il materiale
digitale rispetto a formati più elaborati di catalogazione bibliografica, applicabile al tempo stesso alla descrizione di documenti diversi, indipendentemente
dal formato, dall’area disciplinare o culturale.
I formati MARC sono progettati per accogliere tutte le più minute informazioni bibliografiche, ma non sempre sono appropriati per la creazione di finding
aid o per inventari museali. Forse con Dublin Core si perde la specificità di un
certo tipo di materiale, ma si guadagna in trasparenza dell’informazione di base,
ed è a questo livello che può avvenire una cooperazione interdisciplinare.
Ad oggi questo schema di metadati è stato adottato dalla European
Committee for Standardization / Information Society Standardization System
(CEN/ISSS), è uno standard officiale del W3C ed è formalmente approvato
dai governi di alcune nazioni per promuovere la scoperta delle informazioni
governative in forma elettronica (ad es. la National Library Helsinki lo ha
adottato come standard informativo nazionale ed è diventata il primo affiliato
nazionale della DCMI). Il potenziale incremento di visibilità delle risorse di
una collezione attraverso settori e ambiti disciplinari diversi, ad un basso costo,
è certamente invitante. Il Dublin Core prende infatti in considerazione l’intero
ciclo di vita di una risorsa informativa, ovvero la sequenza di eventi che ne
segnano lo sviluppo e l’uso (ad esempio la creazione, l’elaborazione di una
bozza, la revisione di un articolo, la pubblicazione di un libro, la trascrizione
su un altro supporto, la traduzione, la derivazione di una nuova opera). I servizi che necessitano di descrizioni semanticamente più ricche continueranno ad
utilizzarle, ma usando Dublin Core potranno offrire anche strumenti di scoperta interdisciplinari.
La metafora del turista digitale è appropriata in questo senso: i viaggiatori su
Internet che cercano informazioni in discipline straniere possono usare il
ristretto vocabolario di Dublin Core per individuare risorse che altrimenti
sarebbero passate inosservate.
Dublin Core non intende sostituire altri standard di metadati, ma piuttosto
coesistere – spesso nella medesima descrizione – con altre semantiche come
supporto aggiuntivo ai metodi esistenti per la ricerca e l’indicizzazione di
82 |
metadati Web-based in ambiti disciplinari diversi 39, indipendentemente dal
fatto che le corrispondenti risorse sia documenti analogici o digitali.
La semplicità di Dublin Core può essere al tempo stesso la sua forza e la sua
debolezza: la semplicità abbassa i costi di creazione dei metadati e promuove
l’interoperabilità, ma non riesce ad accomodare la semantica e la ricchezza
funzionale supportata da altri schemi di metadati più complessi. In effetti, il
Dublin Core acquista visibilità al costo della ricchezza semantica; tuttavia, la
natura stessa di questo schema incoraggia l’utilizzo di più ricchi schemi di
metadati in combinazione con esso.
Indipendentemente da quale di questi due approcci si scelga, ogni collezione
dovrà affrontare il problema pratico di come rendere i propri metadati disponibili alle altre collezioni e ai software di ricerca esterni (harvesting). Per le
biblioteche, questo potrebbe significare estrarre record più semplici in formato Dublin Core dai record in formato MARC ed esportarli.
Un altro principio base della descrizione che utilizza Dublin Core è quello del
‘principio 1:1’ (one-to-one rule): in ogni singolo record di metadati può essere
descritto soltanto un unico oggetto o risorsa o istanza. Anche i surrogati delle
risorse devono essere descritti separatamente dall’oggetto originale, in modo che
il record di metadati della fotografia di una sedia contenga metadati sulla fotografia e non sulla sedia e l’autore sarà l’autore della fotografia, non della sedia –
un criterio opposto ad esempio a quello adottato nelle soprintendenze italiane.
Sono state infine elaborate delle bozze di schemi redatte dal W3C per le
convenzioni di codifica del XML, descritte nelle linee guida per l’implementazione di Dublin Core in XML 40. Questi schemi hanno un approccio
modulare per offrire possibilità, in particolare cercano di permettere un’applicazione per selezionare vari sottoinsiemi di termini di Dublin Core in
combinazione.
Come ha scritto Stuart L. Weibel, coordinatore del gruppo di standardizzazione dei metadati dell’OCLC, «Dublin Core is probably our best hope for a
common meeting ground between a collection of metadata standards that is
evocative of the Tower of Babel. Although the DC is not large enough (it is a
core, after all), nor granular enough, or adequately qualified (yet) for many
metadata uses, we can all ‘numb down’ our metadata enough to contribute
records into a common pot. And sometimes that makes all the difference in
the world. So with this progress report we finally see DC coming into its
own. NISO passed it as ANSI Standard Z39.85 (albeit by the skin of its
teeth). But more importantly, the Open Archives initiative adopted it as the
only required metadata element set OAI-compliant archives must support.
This development alone may be enough to solidify the position of the DC at
the center of disparate communities with metadata to share» 41.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 83
Dublin Core semplice
La definizione ‘Dublin Core’ in genere si riferisce allo schema di base (simple): i 15 elementi descrittivi semantici del Dublin Core (Fig. 2) e un limitato
insieme di qualificatori opzionali verificati e approvati dalla DCMI. Dal 1995
la DCMI si è impegnata a perfezionare lo schema e a fornire informazioni
semanticamente più specifiche sulle risorse Web.
Altri risultati della DCMI sono il Warwick Framework 42 e la maggior parte
del lavoro sull’utilizzo del Resource Description Framework (RDF) per i
metadati descrittivi.
L’obiettivo è quello di descrivere la risorsa e le sue relazioni con altre risorse
(ad esempio con il campo ‘Relazioni’) che a loro volta possono essere o meno
descritte dal DCMES. Non ci sono limiti di lunghezza di campo in Dublin
Core, l’ordine degli elementi nello schema è irrilevante e ogni elemento è
indipendente dall’altro, opzionale e ripetibile.
Il cosiddetto principio di numb-down significa semplicemente che in qualsiasi utilizzo degli elementi, i qualificatori dovrebbero poter essere eliminati e i
valori dell’elemento dovrebbero essere in ogni caso utili per la scoperta del
documento. L’idea base è che i qualificatori dovrebbero migliorare la precisione di una parte dei metadati, ma i metadati dovrebbero essere utili anche
senza questa precisione.
Baker 43 definisce Dublin Core un ‘piccolo linguaggio’ per effettuare una particolare classe di affermazioni sulle risorse. Come i linguaggi naturali, esso ha
un suo vocabolario di termini simili alle parole, le cui due classi (elementi e
qualificatori) funzionano con affermazioni quali nomi e aggettivi, e presenta
una sintassi per organizzare gli elementi e i qualificatori in affermazioni.
Ognuno dei 15 elementi possiede:
- un’etichetta descrittiva intesa a fornire una comprensione semantica
comune dell’elemento;
- un nome unico costituito da una sola parola comprensibile al calcolatore, inteso per fare una specificazione sintattica degli elementi più
semplice per gli schemi di codifica.
Tecnicamente parlando, un elemento o un qualificatore di Dublin Core è un
identificatore unico formato da un nome (ad esempio ‘Titolo’) preceduto dal
prefisso di un URI nel namespace in cui viene definito.
Dublin Core qualificato e i profili di applicazione
I primi lavori sul DCMES si erano focalizzati sul requisito di semplicità, in
modo che utenti non specializzati fossero in grado di formulare record descrittivi
basati su uno schema relativamente semplice di 15 elementi a testo libero. Negli
ultimi anni nell’ambito della comunità della DCMI, è nata una corrente detta
84 |
‘strutturalista’ (in opposizione alla corrente ‘minimalista’ che sostiene l’uso di un
DCMES semplice) che ha affermato la necessità di creare meccanismi per arricchire le capacità descrittive del DCMES di base, sostenendo che i soli elementi
sono insufficienti per la descrizione di una risorsa reale e non metaforica.
Il risultato di questi tentativi hanno dato luogo al Dublin Core qualificato
(qualified), che utilizza i qualificatori aggiuntivi per rifinire ulteriormente il
significato della risorsa e permettere di aumentare la specificità o la precisione
della descrizione. La DCMI ha invitato le varie comunità d’uso ad elaborare
dei qualificatori specifici per i propri bisogni di complessità e particolarità, e i
loro record in teoria dovrebbero essere interoperabili con altri record che contengono qualificatori scelti da altre comunità e anche con gli schemi DCMS
non qualificati, grazie al principio di numb-down e all’uso di vocabolari controllati o di regole di codifica. Tuttavia la DCMI non funziona esattamente
come un’autorità di controllo, e l’assenza di linee guida chiare e di motivazioni hanno dato origine in passato alla proliferazione di schemi di Dublin Core
qualificato che rendono l’interoperabilità un miraggio. È stato un passo utile
in questo senso l’istituzione di una commissione per la revisione e approvazione dei qualificatori e di un registro di conformità ai principi dell’interoperabilità e per verificare la conformità agli standard.
I 15 elementi del DCMES sono le caratteristiche che definiscono Dublin
Core come linguaggio, mentre i qualificatori modificano le proprietà delle
affermazioni di Dublin Core specificando ‘che tipo’ di autore, di titolo, di
soggetto, di data, di relazione ecc. I qualificatori comprendono due classi:
- qualificatori di valori: conservano un identificare per un vocabolario, una codifica o un linguaggio del valore e indicano informazioni
contestuali o regole di apparizione che aiutano nell’interpretazione
del valore di un elemento. Sono basati su standard esterni quali la
DDC e su regole di codifica (ad es. ISO 8601 per data, ISO 639/1
per la lingua);
- qualificatori degli elementi (type), che sono utilizzati per rifinire ulteriormente il significato semantico di un elemento.
In questo contesto, è emerso il concetto di profilo di applicazione 44 come un
modo di dichiarare quali elementi dei namespace sono utilizzati in una particolare applicazione o progetto. I profili di applicazione sono definiti come
schemi che consistono di elementi di dati derivati da uno o più namespace,
combinati insieme dagli implementatori e ottimizzati per particolari usi locali. Il DCMI-Libraries Working Group ha ipotizzato vari possibili utilizzi del
DCMES e dei profili di applicazione in ambito bibliotecario:
- utilizzo come formato di interscambio tra sistemi diversi che usano
standard di metadati o formati differenti;
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 85
-
harvesting dei metadati da fonti nell’ambito e al di fuori della biblioteca;
supporto della creazione di record catalografici semplici per le risorse
in tipi diversi di sistemi;
possibilità di esporre i dati in formati MARC ad altre comunità tramite la conversione nel formato DCMS;
permettere l’acquisizione di metadati di scoperta delle risorse da creatori non bibliotecari che utilizzano il Dublin Core.
Aspetti critici e potenzialità
Alcuni esperti, tra cui Carl Lagoze 45, sostengono che il Dublin Core non sia
semanticamente attrezzato per un utilizzo spinto dei qualificatori, e che si
dovrebbe optare per la modularità quando si trova di fronte ad una varietà di
requisiti descrittivi. Il punto è che tale descrizione è specifica di un contesto,
e né lo schema né il vocabolario di DCMES secondo Lagoze sono comunque
sufficienti per questa descrizione. Mentre i 15 elementi sono rimasti sostanzialmente invariati nel corso degli anni, la questione dei qualificatori ha dato
luogo ad una serie di interpretazioni e di modelli difformi, nel tentativo di
creare degli strumenti per accomodare la complessità e l’estensibilità del
Dublin Core con la semplicità del Dublin Core base.
Lagoze suggerisce di non ignorare gli scopi originari di DCMES, ma piuttosto
di definire dei framework per la creazione di descrizioni più complesse che
possano co-esistere insieme ai pacchetti separati, e che siano in grado di descrivere le entità in modo più complesso. Molte comunità, tra cui quella delle
biblioteche, hanno cercato di capire come rendere ciò possibile. FRBR 46, il
framework dell’IFLA, ad esempio riconosce i vari aspetti del ciclo di vita di un
contenuto intellettuale e distingue tra opere astratte, le loro manifestazioni e
gli item che sono prodotti da queste manifestazioni. Il progetto Harmony 47
afferma che la consapevolezza degli eventi è vitale per la comprensione ed
espressione di maggiori dettagli descrittivi delle risorse.
Descrizioni più ricche dovrebbero non dovrebbero essere basate sulla qualificazione degli elementi di Dublin Core, ma costruite su modelli di dati più
espressivi: questo è stata una della maggiori considerazioni dell’Open Archive
Initiative (OAI), il cui approccio al metadata harvesting esemplifica la nozione di modularizzazione dei metadati, utilizzando lo schema semplice di
Dublin Core per l’interoperabilità tra comunità diverse, supportando al
tempo stesso metadati specifici delle singole comunità. Lo sviluppo di un
modello di qualificazione con uno scopo ben chiaro ha definito una nicchia
importante per Dublin Core nell’ampia ecologia dei metadati. Altrettanto
importante per la comunità della DCMI è il completamento della documen-
86 |
tazione di supporto per renderlo utilizzabile con strumenti Web comunemente diffusi. In tal modo la DCMI sposterà il focus delle sue attività dai 15 elementi alle partnership e interazioni con schemi di metadati multipli.
I critici di Dublin Core sostengono inoltre che DCMES 1.1 fornisce soltanto
una generica descrizione delle categorie semantiche, non ci sono regole per
determinare o rappresentare il contenuto ma soltanto linee guida generali in
stato di bozza sul sito della DCMI. Di conseguenza i progetti che usano
DCMES per la descrizione delle risorse devono sviluppare le proprie convenzioni, uno sforzo difficile e che richiede molto tempo. Forse è la natura stessa
di questo standard a non richiedere delle linee guida canoniche e l’aspettativa
è che le comunità che condividono le stesse risorse svilupperanno insieme
delle regole per uno specifico settore, un compito tuttavia arduo.
Si critica poi il fatto che DCMES sia nato come un movimento dal basso, in
modo indipendente dalle organizzazione esistenti e senza una struttura formale per gestirlo. Tuttora la grande diversità degli implementatori di Dublin
Core rende difficile raggiungere il consenso sulle questioni più complesse e la
partecipazione all’iniziativa, tranne la struttura direttiva, è basata principalmente sull’impegno di volontari.
Inoltre, in seno allo DCMI, chi emette gli standard è preoccupato di identificare un approccio comune e condiviso per assicurare l’interoperabilità e le
economie di scala, mentre gli implementatori, che in parte usano gli standard, in più vogliono poter descrivere aspetti specifici di quella risorsa in un
modo ‘speciale’. La separazione tra chi crea gli standard e tra gli implementatori può essere considerata una falsa dicotomia (molte delle persone attualmente coinvolte nel mondo dei metadati prendono parte ad entrambe le attività, il che costituisce uno dei punti di forza della DCMI), tuttavia i due
gruppi hanno priorità differenti 48.
Sia gli elementi che i qualificatori possono essere espressi in lingue diverse
dall’inglese. La vaghezza che caratterizza le modalità di riempimento dei 15
elementi è intenzionale: Internet è un luogo caotico in cui un approccio più
disciplinato, top-down verso la standardizzazione è irrealistico, specialmente
per un utilizzo in ambiti e linguaggi multipli.
Un modo per risolvere questo problema è offerto dal più ampio framework
dei profili di applicazione, paragonabili ad idiomi regionali. Gli implementatori che hanno bisogno di un linguaggio applicativo più espressivo di un pidgin possono combinare degli elementi e dei qualificatori di Dublin Core con
altri elementi di altri namespace, formando un più ricco vocabolario o inserendoli in un modello di dati sintatticamente più sofisticato. Questa soluzione è ritenuta ragionevole dai più, fintanto che gli implementatori rispettano
la distinzione tra i namespace, in cui agli elementi e ai qualificatori sono date
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 87
definizioni, e i profili, in cui elementi di namespace multipli vengono soltanto riutilizzati, combinati, adattati e limitati 49.
Il profilo è dunque il focus naturale per descrizioni complete, il pacchetto di
metadati preso come un insieme. Alcuni gruppi di lavoro della DCMI stanno sviluppando profili specifici di alcuni ambiti, verificando i bisogni
descrittivi in ambito didattico e governativo per determinare quale sia l’appropriato mix di elementi di Dublin Core con elementi di altri namespace,
creando magari nuovi elementi aggiuntivi non contemplati dagli standard
esistenti.
Il Dublin Core è stato adottato in numerosi progetti internazionali, che ne
hanno favorito ulteriormente la diffusione. Il Nordic Metadata Project,
inteso a promuovere l’adozione del Dublin Core nei paesi nordici, ha sviluppato strumenti per la creazione, l’harvesting e l’indicizzazione di metadati basati su DC. Uno dei risultati più interessanti è il generatore di URN
(Universal Resource Name), un’applicazione fornita di linee guida sviluppata seguendo una sintassi di URN basata sui numeri bibliografici nazionali,
che sta avendo un ampio successo nel nord Europa.
Lo UKOLN ha promosso il progetto Resource Organisation and Discovery
in Subject-based Services (ROADS) 50, progettato e implementato come un
sistema user-oriented di scoperta delle risorse. Tra le varie funzionalità, vi è
un elenco di mappature tra formati di metadati. Il Consortium for the
Computer Interchange of Museum Information (CIMI) è stato uno dei
principali sperimentatori e implementatori del DCMES, includendo un
livello di descrizione più dettagliato per soddisfare requisiti come la ricerca
sui diritti di proprietà e le modalità d’uso 51. Ha definito un DTD XML
per DCMES e ha creato un ampio numero di record utilizzando DC non
qualificato, verificandone l’utilità nella scoperta di risorse ad un livello
generale.
Il progetto di Instructional Management Systems (IMS) è il frutto di una
collaborazione tra EDUCOM e il National Institute for Standards and
Technology’s Information Technology Laboratory ed è uno degli schemi di
metadati più altamente sviluppati per un dominio specifico. Mathematics
Subject Classification è uno dei sistemi di classificazione previsti da
Dublin Core, ed è utilizzata per il motore di ricerca sviluppato nel progetto dell’Unione Europea European Libraries and Electronic Resources in
Mathematical Science (EULER) 52. L’obiettivo principale di EULER è la
realizzazione di un one-stop shop per la ricerca di risorse informative per la
matematica quali libri, pre-print, pagine Web, abstract, collezioni di articoli e recensioni, periodici, rapporti tecnici e tesi. Il risultato è una metainterfaccia Web per interrogazioni parallele dirette a una collezione etero88 |
genea di database. Una strategia simile potrebbe essere messa in campo per
la connessione delle classificazioni: le descrizioni degli oggetti identificati a
partire da diverse classificazioni, opportunamente codificate, potrebbero
entrare a far parte dei metadati gestiti dal motore di ricerca.
In ambito italiano 53 l’Istituto Centrale per il Catalogo Unico ha redatto un
elenco di progetti finalizzati prevalentemente all’ambito dei beni culturali,
che utilizzano i metadati per fini in prevalenza di accesso, per risorse prevalentemente testuali, poi immagini e quindi audiovisivi.
3.2.4 MPEG-7
Secondo Peter Lyman e Hal R. Varian dell’University di California a Berkeley
«the world’s total yearly production of print, film, optical, and magnetic content would require roughly 1.5 billion gigabytes (1.5 Exabytes) of storage» 54. Il
bisogno di accedere a questa incredibile quantità di materiali audiovisuali eterogenei richiede degli strumenti standard, veloci ed efficaci per il recupero e la
selezione di vari tipi di materiali multimediali (ad esempio trovare documenti
con query non testuali ma visuali o tramite entrambi i modi) sia da archivi
digitali (applicazioni ‘pull’) sia da broadcast audiovisuali in streaming sul Web
(applicazioni ‘push’).
Gli standard MPEG, creati dal Moving Picture Coding Experts Group
(MPEG) 55, sono standard di descrizione di contenuti multimediali che cercano di rispondere alle esigenze di interazione uomo-computer fornendo ricche
descrizioni dei contenuti multimediali. Si basano sugli standard ISO/IEC
(International Standards Organization/International Electrotechnical
Committee 56 per la compressione, decompressione e rappresentazione codificata di immagini in movimento, audio, e file audiovisuali. Sono stati formalizzati vari tipi di MPEG:
- MPEG-1: per l’immagazzinamento e il recupero di immagini in
movimento e audio su supporti di conservazione;
- MPEG-2: per la televisione digitale, satellitare e via cavo;
- MPEG-4: per la codifica del contenuto come oggetto digitale manipolabile individualmente o collettivamente;
- MPEG-7: approvato nel 2001 come standard ISO #15938 per permetter di recuperare il contenuto multimediale. L’approccio di
MPEG-7 è quello di fornire una descrizione di informazioni audiovisuali digitali (incluse immagini statiche, modelli 3D, audio, video,
multimedia) attraverso il campionamento (sampling) e l’utilizzo di
termini di ricerca testuali, e indipendentemente dalla codifica, dalla
trasmissione, dal supporto, dall’immagazzinamento o dalla tecnologia
(Fig. 4). Viene fornito: un core di descrittori (Ds) per varie caratteri-
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 89
stiche del contenuto multimediale; una struttura predefinita di
descrittori e delle loro relazioni, chiamati Description Schemes (DSs).
Le descrizioni sono di carattere bibliografico (autore, titolo), semantico
(informazioni sul chi, cosa, come dove degli oggetti ed eventi rappresentati) e
strutturale (istogramma di colore, misurazioni del totale di colore associato ad
un’immagine, o del timbro di uno strumento musicale).
Si basano sulle rappresentazioni di dati definite da MPEG-1,2,4. MPEG-7
mira ad aumentare l’uso degli schemi di metadati come Dublin Core, nella
descrizione e nel recupero di materiali audiovisuali: incorpora nella sua struttura ogni forma di metadati, sia proprietari che pubblici, in modo da espandere la capacità per la ricerca e la condivisione dei dati. Ad esempio, Il
MPEG -7 Working Group del Department of Canadian Heritage ha in corso
due progetti sulle possibili applicazioni di questo standard nei National
Archives, nella Canadian Heritage, nella National Film Board of Canada e
nella Canadian Broadcasting Corporation (CBC), mappato con Dublin Core
(Fig. 6) 57.
Tuttavia MPEG-7 non standardizza l’estrazione automatica di descrizioni o
caratteristiche di documenti audiovisuali, né specifica le caratteristiche necessarie per i motori di ricerca o per i programmi che intendano utilizzare queste
descrizioni che vengono lasciate alla creatività degli sviluppatori.
Vi sono varie tecniche per cercare contenuti visuali utilizzando le caratteristiche intrinseche di un oggetto digitale: ad esempio gli strumenti di
annotazione e ricerca video sviluppati dalla IBM, AudioID – del
Fraunhofer IIS, Fingerprinting Audio Clips, i vari metodi per l’estrazione
degli attributi, la segmentazione, la classificazione, l’analisi e dell’Audio
Retrieval e le interfacce grafiche utente 3D e interattive sviluppati da
George Tzanetakis della University of British Columbia, o l’accesso B2B a
streaming media del motore di ricerca SingigFish.com.
Le definizioni (schemi di descrizione e descrittori) sono esprimibili in XML,
che offre la soluzione ideale a livello di sintassi, struttura, cardinalità e limitazioni del tipo di dati.
3.2.5 Information Retrieval
Nel mondo attuale, caratterizzato da un oceano di documenti virtualmente
disponibili e dalla creazione e interconnessione di basi dati, le tecnologie informatiche offrono capacità di elaborazione e di memoria sempre più potenti. Le
conoscenze depositate, tuttavia, hanno valore soltanto se accompagnate da
sistemi di recupero efficaci ed efficienti, che forniscono cioè accesso solamente
a tutti quei documenti di una collezione che sono rilevanti per l’utente. I problemi che si pongono riguardano quindi:
90 |
-
il sistema di rappresentazione di documenti spesso complessi, come i
multimedia e i rich media (l’adozione di un vocabolario controllato e
aggiornato, di un alto livello di specificità terminologica e di relazioni
semantiche);
- il sistema di accesso ai documenti (e quindi il problema del richiamo
e della precisione, ossia la capacità di recuperare interamente e soltanto la documentazione pertinente e rilevante).
Se non trovare nulla è frequente nelle ricerche online, come ha osservato
Foskett ancora più fuorviante è trovare qualcosa e credere di avere recuperato tutte le informazioni disponibili 58. È stato infatti evidenziato che
la ricerca per soggetto negli attuali cataloghi sul Web risulta in un basso
grado di richiamo e di precisione, che mette a dura prova il livello di
futility point (la quantità massima di documenti tra i quali un utente è
disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative). In queste circostanze vi è un reale bisogno di descrizioni consistenti e sistematiche e di appropriate classificazioni, in particolar modo per le risorse eterogenee e complesse. L’insieme dei sistemi di
Information Retrieval rappresentano una nuova strategia di recupero dei
documenti in rete, le cui metodologie sviluppate seguono due diversi
approcci 59:
Collection and
Classification
Content organization
Media
Information
Creation
Information
Usage
Information
Content Management
Content Description
Spatio-temporal
Structures
Datatypes
and Structures
Audio and
Visual Features
Semantic
Structures
Link and Media
Locations
Basic
Elements
User
Interaction
Models
Navigation
and Access
Users
Preferences
Summaries
Partitions and
Decompositions
Usage
History
Variations
Root and TopLevels Elements
Schema
Tools
Packages
[Fig. 5] Il contesto in cui si muove MPEG-7 in D. Dale, R. Rog, 2002)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 91
Dublin Core Element
Definition
MPEG-7 Descriptor
Title
A name given to the resource
CreationInformation/Creation/Title(@type”original”)
Creator
An entity primarily responsible
for making the content of the
resource
CreationInformation/Creation/Creator
Subject
The topic of the content of the
resource
CreationInformation/Classification/Subject
Description
An account of the content of
the resource
An entity responsible for
making the resource available
Creation/Abstract
ContentDescription/Creation/Abstract
CreationInformation/Creation/Creator
(Role/@term-”Publisher”)Note: (No distinct
Publisher element exists in MDS, with the
exception of the publisher element in the
SourcePreferences DS.) (This may have
been corrected in a later version)
Contributor
An entity responsible for
making contributions to the
content of the Resource
CreationInformation/Creation/Creator
(Role/@term-”Contributor”)
Date
A date associated with an
event in the life cycle of the
resource
The nature or genre of the
content of the resource
CreationInformation/Creation/CreationCoordi
nates/CreationDate
Publisher
Type
CreationInformation/Classification/Genre
File format or mirne type [MPEG1, QuickTime, RealVideo...]
An unambiguos reference to the
resource within a given context
MediaInformation/MediaProfile/MediaFormat/
FileFormat
MediaInformation/MediaProfile/MediaIstance/
IstanceIdentifier
Source
A Reference to a resource from
which the present resource is
derived
MediaInformation/MediaIdentification/EntityI
dentifier (the “reality”)
Language
A language of the intellectual
content of the resource
CreationInformation/Classification/Language
Relation
A Reference to a related resource
Coverage
The extent or scope of the
content of the resource
CreationInformation/RelatedMaterial/MediaLocator
CreationInformation/Creation/Abstract or
CreationInformation/Creation/CreationCoordi
nates/CreationLocation or
CreationInformation/Classification/TargetCountry
Rights
Information about rights held in
and over the resource
Format
Identifier
UsageInformation/Rights/RightsID
(Currently, RightsID is simply a
UniqueIDType. Further identification of the rights
holder awaits MPEG-7 IPMP development.)
[Fig. 6] Dublin Core to MPEG-7 Descriptors Mapping (rielaborazione da D. Dale, R. Rog,
2002)
92 |
-
retrieval term-based, ovvero indicizzazione dei dati realizzabile tramite:
- termini estratti dal linguaggio naturale dei documenti (basso
livello di consistenza);
- classificazioni e soggettazioni (relazioni precoordinate rigide, non
aggiornate in alcuni campi del sapere);
- thesauri (vocabolari controllati e strutturati che consentono maggiore esaustività e specificità flessibilità);
- retrieval content-based, che comprende:
- visual retrieval: sistemi di ricerca visuale per il recupero di file
d’immagine 2D e 3D, basati su robusti algoritmi che analizzano
le caratteristiche visive degli oggetti digitali quali ad esempio la
distribuzione del colore, le proprietà della texture ovvero l’omogeneità dei pattern visuali, la forma, l’orientamento e la distribuzione spaziale, l’illuminazione, la ripetitività 60;
- video retrieval: sistemi di recupero che utilizzano algoritmi che
analizzano le caratteristiche audiovisive dei documenti, quali i
frame, il movimento degli oggetti nelle inquadrature, gli stacchi
di montaggio, le tracce audio e i sottotitoli;
- audio retrieval: sistemi per il recupero di informazioni sonore in
base all’analisi delle proprietà e caratteristiche relative alla dimensione temporale e alla frequenza.
Il primo approccio implica molto lavoro manuale di annotazione e si
dimostra insufficiente nell’ambito di documentazione visuale, le cui proprietà sono difficili o quasi impossibili da descrivere testualmente. Il
secondo approccio, adatto ai documenti multimediali, invece di annotare
manualmente con parole chiave di testo indicizza i documenti attraverso
il loro contenuto audiovisuale, servendosi degli strumenti della computer
vision, pattern recognition e query audiovisuali. Gli indirizzi di ricerca in
questo approccio riguardano la definizione di algoritmi di recupero più
potenti e precisi e di criteri di multi-indicizzazione, la velocità di recupero dei dati anche attraverso l’interazione uomo-computer, l’elaborazione
di query basate sulla percezione visiva umane e su criteri di valutazione
personalizzabili.
Tra gli esempi più significativi, il Visual Information Technology Group del
National Research Council del Canada ha sviluppato sistema basato sulla
ricerca in modo automatico di oggetti tridimensionali 61.
3.2.6 Indicizzazione term-based, manuale e automatizzata
È fondamentale che le diverse comunità dei professionisti dell’informazione
(bibliotecari, documentalisti, knowledge worker,…) siano consapevoli delle
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 93
reciproche discipline, standard e bisogni. Spesso, infatti, vengono usati vecchi termini con definizioni e utilizzi nuovi, interpretati in modi anche
molto diversi.
Il termine ‘indice’, ad esempio, ha un significato diverso per un bibliotecario,
un informatico, un utente che cerca documenti online e un editore, e tutti
hanno ragione nell’ambito delle proprie comunità d’uso. L’indicizzazione è
l’atto di produrre una descrizione a soggetto, composta di termini (etichette
di valori) che rappresentano concetti (tipi di valori) coordinati da faccette
(tipi di attributi). L’idea di base è che i concetti esistono in uno spazio concettuale e che il significato di un concetto è la sua estensione in tale spazio.
L’indicizzazione consiste in pratica in procedure codificate per esaminare un
documento: viene creato un ordinamento sistematico di entrate, scelte su
misura secondo il grado di specificità richiesto, che permettono all’utente di
identificare un documento in termini di contenuto di soggetto, grazie agli
appropriati termini di indice da utilizzare come punti di accesso nel catalogo.
Rispetto agli archivi analogici, quelli digitali permettono non solo una fruizione dei documenti non limitata da vincoli spazio-temporali, ma anche il
pragmatico
discorsivo
semantico
sintattico
lessicale
morfologico
fonologico
[Fig. 7] I diversi livelli dell’analisi linguistica in E. Liddy, 1998
94 |
recupero delle informazioni tramite accessi multipli, ottenute con un’accurata
operazione di mediazione semantica che fa da ‘filtro’ alle informazioni. Le
informazioni vengono cioè organizzate e ordinate secondo indici di parole
chiave estratte dal documento stesso o assegnate secondo un linguaggio prefissato, un vocabolario controllato o un thesaurus.
Come ogni linguaggio, anche quello di indicizzazione consiste di un vocabolario
e di regole sintattiche. Vi sono due tipi principali di linguaggi di indicizzazione:
- linguaggi che usano termini o parole estratte dal linguaggio naturale
(thesauri, sistemi di intestazione di soggetto);
- linguaggi che usano simboli: numeri, lettere o una combinazione di
entrambi (classificazione bibliografica).
Strumenti di accesso appropriati sono essenziali per orientarsi nella enorme
massa di informazioni disponibili online: se esse non vengono indicizzate,
l’utente non è in grado di rintracciarle e quindi ‘non esistono’. Ma occorre
ricordare che da quello fonologico a quello pragmatico, vi sono vari livelli di
analisi linguistica (Fig. 7), che riflettono una crescente complessità e difficoltà
del linguaggio.
Molti motori di ricerca oggi utilizzano sistemi di Information Retrieval basati
sulle modalità elementari di ricerca linguistica (troncamento automatico,
identificazione automatica dei nomi, identificazioni delle frasi, identificazione
del concetto). La ricerca per parole presenta dei difetti intrinseci, perchè le
parole non sono estratte da un vocabolario controllato e sono quindi prive di
contesto e di relazioni con altri termini. Inoltre al di fuori delle scienze tradizionalmente consolidate, la terminologia è ben lungi dall’essere precisa e
accurata. I livelli più alti del linguaggio presuppongono la comprensione sia
dei livelli inferiori, sia delle teorie impiegate per spiegare i dati, che devono
necessariamente spostarsi nel campo della psicologia cognitiva e dell’intelligenza artificiale. Come risultato, la mancanza di mediazione semantica influisce in modo ancora determinante sulle prestazioni dei motori di ricerca 62.
Le tecnologie digitali non sono ancora in grado di risolvere questo ‘caos
semantico’: il lavoro redazionale umano è perciò essenziale nell’estrazione
delle informazioni ritenute più significative e nell’organizzazione tassonomica
dei contenuti 63. L’esatta descrizione dei concetti, della rete di relazioni e dei
fenomeni sovrasegmentali significa efficienza nella comunicazione linguistica,
sia all’interno della cerchia degli addetti ai lavori, sia all’esterno, sotto forma
di divulgazione più o meno specifica, permettendo una comunicazione non
ambigua. Risulta quindi fondamentale individuare i concetti cardine dei termini relativi al documento da indicizzare, relazionati attraverso la costruzione
di una mappa ad hoc, una rete concettuale tessuta attorno alla parola, per
assicurare la pertinenza nel recupero delle informazioni.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 95
L’aspetto linguistico si articola in due diversi problemi, che danno origine ad
un minor grado di precisione e di richiamo:
1. il problema del linguaggio naturale, poca consistente, poiché le persone utilizzano parole diverse per riferirsi alle medesime cose;
2. il problema del linguaggio di indicizzazione: caratterizzato spesso da
poca esaustività e specificità.
La soluzione auspicata dagli esperti è quella dell’analisi delle faccette unita ad
un vocabolario di controllo e la specificazione dei termini preferiti (per migliorare la consistenza), delle relazioni sintagmatiche e paradigmatiche (per migliorare sia la consistenza che l’esaustività). I metodi di indicizzazione possono
essere di vario tipo: manuali o automatici; assegnati o derivati; con linguaggio
derivante da vocabolari controllati o dal linguaggio naturale; pre-coordinati o
post-coordinati; frasi oppure parole; testo parziale oppure full-text.
Oltre ad una buona struttura sindetica e pre-coordinata, che facilita sia la specificità che l’esaustività, l’indicizzazione di un sistema di recupero efficace e
qualitativamente raffinato presenta:
- un alto livello di specificità (e quindi di precisione): ogni termine è
preciso, non generico e questo aumenta la proporzione dei documenti recuperati che sono rilevanti;
- un alto livello di esaustività (e quindi di richiamo): ogni descrizione
di soggetto è approfondita, non superficiale e questo aumenta la proporzione di documenti rilevanti recuperati e la precisione;
- un alto grado di consistenza: una buona indicizzazione dipende dall’abilità dell’indicizzatore e dalla qualità del linguaggio.
Nella progettazione di sistemi di Information Retrieval è determinante il livello di specificità, correlato al concetto di futility point, cioè la quantità massima
di documenti tra i quali un utente è disposto a cercare quelli che effettivamente corrispondono alle sue esigenze informative. Mentre il 100% del richiamo
significa che vengono recuperati tutti i documenti rilevanti insieme a documenti non rilevanti, il 100% della precisione indica che verranno recuperati
solo e soltanto i documenti rilevanti. Quindi in pratica una maggiore percentuale di richiamo equivale ad una minore percentuale di precisione, e viceversa. Tenendo ben presente che chi cerca presenta bisogni diversi di richiamo e
di precisione e ha un diverso livello di futility point, un buon sistema di recupero dovrebbe ottimizzare di entrambi i valori 64.
Indubbiamente, il più grande vantaggio dei sistemi di recupero automatici è la
riduzione dei costi: la potenza computazionale è progressivamente sempre più
economica della competenza umana. Ma quando risorse economiche e tempo
sono ugualmente disponibili, i professionisti esperti non hanno pari 65. Il problema è che i sistemi automatici non hanno problemi ad essere comprensivi;
96 |
essi hanno piuttosto difficoltà a cercare di essere selettivi. La loro debolezza è la
mancanza di precisione – quello che, in termini umani, verrebbe definito
come una capacità di giudizio molto limitata. I risultati dei motori di ricerca
sono influenzati da algoritmi, operatori booleani, agenti intelligenti, cookies e
profili inseriti dagli utenti per cercare di migliorare la precisione, ma continuano a riportare ancora troppi risultati errati o non rilevanti 66. Un altro aspetto
che spesso resta nascosto all’utente, inoltre, è l’influenza di alcune forma di
pagamento sul contenuto di indici e motori. Un problema che risulta accentuato quando la ricerca viene effettuata con un metamotore di ricerca.
Ciò che fa la differenza tra un motore di ricerca e un indicizzatore umano
sono sostanzialmente due aspetti: la considerazione dell’audience di un documento (che sia un libro o una pagina Web) e l’avere in mente una ‘struttura
sindetica’ o mappa mentale quando un documento viene indicizzato.
Conoscere il pubblico cui è diretto un certo documento permette di dedurre
quale linguaggio deve essere utilizzato per essere ricercabile da quel pubblico,
mentre la struttura sindetica permette di fornire un indice con riferimenti
incrociati. A volte anche i motori di ricerca li presentano, ma con troppi
significati decontestualizzati.
Quelli che vengono definiti come sistemi di classificazione, categorizzazione e
indicizzazione automatica, ad esempio, si servono di operatori booleani, funzioni bayesiane, modelli di co-occorenza e sistemi di linguaggio naturale.
In un primo passaggio, il sistema viene addestrato allo specifico soggetto o
area tematica, selezionando un lista di parole chiave approvata e costruendo
delle semplici regole attraverso accoppiamenti e sinonimi, oppure utilizzando
algoritmi fraseologici, grammaticali, sintattici, semantici, di uso, di prossimità, di localizzazione ecc. per elaborare regole complesse. Nei sistemi che utilizzano le funzioni bayesiane prima si seleziona una lista approvata di parole
chiave, con la quale il sistema viene educato a riconoscere le parole chiave
giuste in un insieme di circa 50-60 documenti: si crea così uno scenario per
l’occorrenza delle parole. Alcuni sistemi usano una combinazione di funzioni
bayesiane e di logica booleana (gli operatori logici consentono la combinazione di più criteri di ricerca tramite delle operazioni logiche) per raggiungere i
risultati di indicizzazione finale.
Il linguaggio naturale, analizzato con le tecniche di Natural Language
Processing, è spesso usato in modo diverso in contesti differenti, pur avendo
a volte la stessa pronuncia ed etimologia (ad esempio ‘plasma’ in medicina e
in fisica). Inoltre, prima di iniziare l’analisi contestuale, è opportuno servirsi
di una tassonomia o di un thesaurus o di un sistema di classificazione, poiché le parole chiavi selezionate saranno tanto più efficaci quanto sarà consistente la loro fonte.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 97
La misurazione dell’accuratezza del sistema è basata su risposte corrette (hits),
risposte sbagliate (misses), parole chiave selezionate dal computer che una persona non avrebbe selezionato (rumore). Il cut-off dovrebbe essere 85% di hits, il
che significa che il rumore e i misses dovrebbero insieme costituire meno del
15%. Attualmente un buon sistema è in grado di fornire una percentuale di
accuratezza iniziale del 60%, che può essere migliorata fino l’85% con un addestramento specifico: il che significa che rimane un certo margine di errore e che
il sistema può migliorare con la revisione umana. Naturalmente questo ha un
costo economico e organizzativo non indifferente, perciò spesso si preferisce
ricorrere a due forme di indicizzazione automatica per migliorare i risultati:
le viste tassonomiche, ovvero delle liste gerarchiche di parole chiave che
hanno un apprendimento notevole in alcune aree disciplinari, anche oltre 10
livelli. Un termine può così essere analizzato e applicato soltanto al livello
finale, perciò il suo uso è inserito in un’applicazione circoscritta; gli elenchi di
parole chiave possono essere ristretti soltanto ai termini il più generico possibile, non superando i tre livelli della gerarchia usata. Questo è l’approccio
preferito nell’am-biente Web, dove alcune ricerche sui comportamenti degli
utenti e un’opinione diffusa indicano che gli utenti si annoiano dopo tre click
del mouse e non andranno comunque oltre il terzo livello della gerarchia.
Nella pratica molti sistemi usano una combinazione di questi metodi per raggiungere i risultati desiderati.
Nel mondo degli operatori booleani, i metadati fanno sì che possiamo trovare
le informazioni senza troppo ‘rumore’ e, tuttavia, sono stati ampiamente
ignorati: l’utilizzo di metadati nell’ambito di motori di ricerca statistici, come
le intranet aziendali, hanno il merito di combinare la precisione degli operatori booleani, con la fuzziness della ricerca statistica (per occorrenza) o della
ricerca tramite linguaggio naturale. I motori di ricerca statistici usano algoritmi complessi e proprietari che assegnano parametri e valori alle varie parole.
Quando viene calcolata la rilevanza, questi fattori si sommano insieme e il
documento con il punteggio maggiore appare primo nella lista. Se all’equazione si aggiungono i metadati, gli algoritmi che pesano le parole devono
essere ricalibrati: i metadati appropriati dovrebbero descrivere gli argomenti
chiave di un documento, perciò si dovrebbe assegnare un peso alto se alcuni
termini appaiono nel full-text del documento. Inoltre potrebbero essere sviluppati nuovi metodi che mappano i metadati e i termini di query in un cluster di parole correlate tra loro. Il clustering è già stato sperimentato con
diversi livelli di successo. Alcuni motori di ricerca del Web effettuano delle
‘ricerche concettuali’ che si basano sulla co-occorrenza dei termini in un database. In altre parole, se un termine continua ad apparire vicino ad un altro, vi
dovrebbe essere qualche sorta di relazione tra i due e quindi l’utente dovrebbe
98 |
essere interessato a selezionare quei documenti che li contengono entrambi o
almeno uno. Oppure se un termine ambiguo (perché spesso è assente l’indicazione dell’accento acuto o grave) come ‘pesca’ ricorre in un contesto non ittico, allora per il motore di ricerca esso non si riferisce ad un’attività ittica ma
ortofrutticola. Ma se l’utente sta cercando informazioni sull’utilizzo di antiparassitari per gli alberi di pesco, un documento che contiene ‘antiparassitari di
alberi da frutta’ potrebbe risultare parimenti interessante. I metadati aiutano a
stabilire con precisione il tipo di pesca di cui si sta parlando, usando termini
specifici per descrivere i differenti significati. Il motore di ricerca partirebbe
da questo significato base e aggiungerebbe i termini correlati per introdurre
termini nuovi, ma comunque pertinenti.
Il problema di base di questo approccio è che la comunicazione è più efficace
se si usa un linguaggio comune che entrambi le parti accettano. Il nostro linguaggio può essere ambiguo o fuorviante a causa del modo in cui è usato,
anche se di solito la quantità e il feedback dei messaggi scambiati permette
alle parti di comunicare l’una con l’altra. Nel mondo delle informazioni registrate invece, non c’è la stessa opportunità per una interazione immediata. Gli
autori, inoltre, non sono consistenti nell’uso delle parole che potrebbero
descrivere o riferirsi ad un argomento, cosicché chi cerca scansiona in full text
un documento deve includere in una ricerca tutti i sinonimi, i termini correlati e tutti i livelli di dettagli che l’autore potrebbe avere usato. Chi cerca non
parla direttamente all’autore, ma al documento stesso, cioè ad uno strumento
statico. Per questo motivo vi è bisogno di un sostituto dello scambio parlato
con una persona: un linguaggio di indicizzazione controllato che l’indicizzatore usa per interpretare e rappresentare tematiche e concetti, il linguaggio
dell’autore e di quello di chi cerca.
In passato, per risparmiare, molti provider di database online hanno scelto di
non utilizzare i thesauri: i costi per progettare e mantenere un thesaurus sembravano alti e ingiustificati a fronte delle dimensioni dei database e del minor
costo dei sistemi di ricerca full-text. Ma questi dubbi risultarono infondati: i
database raggiunsero presto dimensioni quasi ingestibili e il costo di cercare
titoli e abstract superava di gran lunga quello che sarebbe stato l’investimento
nello sviluppo e nell’uso di un linguaggio controllato di indicizzazione 67. È
vero che nel primo caso sono disponibili più termini per la ricerca rispetto a
quelli dei linguaggi di indicizzazione controllati, e quindi teoricamente includono più termini precisi. Ma chi cerca deve sperare che l’autore abbia incluso
tutti i termini necessari per descrivere l’argomento: vi sono casi in cui un
autore potrebbe non usare mai i principali termini di una certa materia.
Questo significa che gli sforzi, il tempo e i costi risparmiati inizialmente nella
costruzione del database passano all’utente che ricerca le informazioni.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 99
Da quanto scritto sopra è chiaro che vi sono delle differenze notevoli sulle
modalità in cui i contenuti possono essere organizzati. In termini semplici, il
problema è quello di ridurre le distanze tra le domande degli uomini e le
risposte dei sistemi. Nonostante le funzionalità miracolose annunciate da vari
sistemi commerciali, l’onere nel recupero delle informazioni potrebbe passare
dall’autore all’indicizzatore, dal progettista del linguaggio di indicizzazione
all’utente: il carico potrebbe essere condiviso in proporzioni diverse, ma
comunque non sparirà. Una volta compreso questo, e tenendo conto che i
sistemi di intelligenza artificiale sono ancora lontani dal potersi sostituire agli
intermediari umani, si è in grado di percepire nella loro interezza la ricchezza
(e lo spreco) dei sistemi di gestione dei documenti digitali 68.
3.2.7 Vocabolari controllati: i thesauri
I vocabolari costituiscono un corpus di conoscenze rappresentate da un linguaggio specifico di un particolare argomento o area disciplinare. Essi sono
necessari perché il linguaggio è in continua evoluzione, e presenta molte sfaccettature e sfumature: le caratteristiche che lo rendono espressivo (gli stili, le
differenze disciplinari, regionali e nazionali, i termini del linguaggio parlato e
i nomi propri tradotti in varie lingue, i termini attuali e quelli storici) costituiscono anche una possibile causa di ambiguità e confusione nella documentazione e, in ultima analisi, impediscono l’accesso ai materiali registrati in una
base dati.
Controllare o gestire un vocabolario ai fini dell’indicizzazione e/o della ricerca
fornisce una soluzione nota come ‘vocabolario controllato’. I vocabolari controllati sono collezioni di parole e di frasi, chiamate terminologie, strutturate
in modo da mostrare le relazioni tra termini e concetti. Essi soddisfano due
criteri specifici: essere usati per facilitare l’analisi dei documenti e il loro conseguente recupero; offrire un ricco insieme di relazioni semantiche tra i termini.
Il processo che conduce al vocabolario controllato permette sia all’indicizzatore
che a chi cerca di accedere ai medesimi concetti attraverso termini autorizzati,
noti come ‘descrittori’. In questa categoria non sono comprese: le semplici liste
di termini, con o senza relazioni di equivalenza; liste di termini la cui unica
relazione sia la co-occorenza nei documenti; liste di termini il cui scopo primario è quello di fornire definizione (ad esempio dizionari e glossari).
I vocabolari controllati sono progettati specificatamente per identificare e
creare queste connessioni tra termini, attraverso la gestione dei sinonimi e la
disambiguazione degli omografi, migliorando i risultati della ricerca e funzionando come un knowledge-base. Risultano ancora più efficaci quando vengono utilizzati insieme ad altri standard, specialmente standard sulle strutture di
dati e sui contenuti.
100 |
Vi sono diverse tipologie di vocabolari controllati (molti dei quali creati da
istituti di ricerca nazionali e internazionali, enti statali e associazioni professionali e culturali) che rispondono a diversi bisogni e sistemi locali:
1. soggettari: compilazioni di intestazioni di soggetto di solito presentate in ordine alfabetico. Raccolgono parole, frasi, o combinazioni di
parole e modificatori che combinano concetti separati in quelle che
vengono definite stringhe di soggetto. Tra gli esempi più noti: il
Soggettario di Firenze, la Library of Congress List of Subject
Headings (LCSH), il Medical Subject Headings (MeSH);
2. thesauri: vocabolari strutturati di termini che rappresentano singoli
soggetti e organizzati secondo relazioni semantiche (come l’Art and
Architecture Thesaurus);
3. schemi di classificazione: organizzano insiemi di conoscenza in categorie concettuali. Sono intesi come schemi organizzativi per le collezioni, ma a volte vengono usati anche per estrarre termini individuali e
usarli come valori al di fuori del contesto dello schema di classificazione. Tra gli esempi più noti vi è la multidisciplinare Classificazione
Decimale Dewey (DDC), la Universal Decimal Classification (UDC)
e la Library of Congress Classification (LCC) Scheme per l’ambito
bibliografico, ICONCLASS 69 per le discipline storico-artistiche, la
National Library of Medicine (NML) Classification per la medicina 70,
Engineering Information (Ei) Classification Codes per le scienze e
l’ingegneria 71, la Mathematics Subject Classification (MSC) per la
matematica 72, la Computing Classification System per l’informatica
della Association for Computing Machinery (ACM) 73. La principale
differenza tra la classificazione della conoscenza e la classificazione
bibliografica è che entrambe, sia che siano specifiche come la NML o
INSPEC o generali come la DDC, la LCC o la UDC, sono sistemi di
indicizzazioni progettati per trattare la conoscenza registrata nei documenti 74, il modo in cui essa viene registrata, il linguaggio con cui
viene presentata e molte caratteristiche relative all’istanziazione di un
particolare soggetto in un documento. La classificazione della conoscenza può essere, e spesso è, tassonomica, come le classificazioni della
zoologia, del mondo vegetale o degli elementi chimici: un concetto
verrà elencato una sola volta in un solo posto all’interno della classificazione. Invece le classificazioni bibliografiche, ad esempio quelle utilizzate per descrivere i documenti reali, non sono e non possono essere
tassonomiche, poiché sono classificazioni disciplinari: ciò significa che
un concetto sarà elencato in tutte le discipline e in tutti i campi in cui
può essere studiato;
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 101
4. liste d’autorità: sono spesso create da singole organizzazioni e riflettono lo scopo della collezione dell’istituzione. Molte di queste liste
includono termini provenienti da altri vocabolari controllati e possono essere una risorsa preziosa per terminologie uniche, regionali, storiche o molto specifiche.
In base al tipo di termini trattati, i vocabolari controllati si possono inoltre
distinguere in vocabolari di:
- nomi propri: (ad esempio l’Union List of Artist Names (ULAN) del
Getty Research Institute);
- nomi di luoghi geografici: (ad es. Getty Thesaurus of Geographic
Names);
- nomi di società e aziende (ad es. Library of Congress Name
Authority File);
- nomi di oggetti (ad es. Art & Architecture Thesaurus, Thesaurus
Multilingue del Corredo Ecclesiastico dell’ICCD, Fig. 8);
- soggetti e temi iconografici (ad es. ICONCLASS);
[Fig. 8] Thesaurus Multilingue del Corredo Ecclesiastico dell’Istituto Centrale per il Catalogo e
la Documentazione: rappresentazione dei termini secondo la struttura gerarchica
102 |
-
termini di tipologie (Thesaurus for Graphic Materials II);
termini multilingue: (Thesauri Database della European
Commission’s Directorate General for Information Technologies and
Industries, and Telecommunications (DG XIII); Multilingual
Egyptological o il CHIN Religious Objects Collections Database).
I browser dei vocabolari controllati sono applicazioni che permettono agli
utenti di accedere al vocabolario in un ambiente di rete, fornendo una vista
unitaria di tutto il contenuto, indipendentemente dalla fonte, e di effettuare
ricerche molto specializzate. Ad esempio l’Art & Architecture Thesaurus
Browser (Fig. 9) 75, mantenuto dal J. Paul Getty Trust, contiene la terminologia dell’AAT terminology e permette di cercare i termini sia nel campo del
termine che nella nota d’ambito. ICONCLASS Browser 76 è uno strumento
sviluppato dall’ICONCLASS Research & Development Group (IRDG) delle
Università di Utrecht e Leida per quanti sono coinvolti in ricerche iconografiche o nella documentazione di immagini. Sostanzialmente, la differenza tra i
diversi tipi di vocabolari controllati consiste nei due tipi di relazioni possibili
tra i termini: semantiche e sintattiche 77. Le relazioni semantiche denotano
concetti come ‘acqua’, ‘mare’ e ‘fiume’ che sono per definizione delle relazioni
permanenti: esse derivano dalle definizioni dei soggetti coinvolti, e non sono
dipendenti dal particolare contenuto in un documento. Le relazioni sintattiche, invece, denotano concetti altrimenti non correlati che vengono uniti
insieme come soggetti compositi nei documenti indicizzati. Queste relazioni
non sono permanenti, ma piuttosto specifiche di un dato documento.
Dei diversi tipi di vocabolari controllati elencati sopra, i thesauri 78 negli ultimi anni hanno progressivamente attirato l’attenzione nel recupero di documenti in ambienti di rete. Gli standard ANSI/NISO e ISO 79 definiscono un
thesaurus come un ‘vocabolario controllato strutturato secondo un certo ordine’, un sottoinsieme del linguaggio naturale, consistente in termini preferiti e
non preferiti con specifiche tipologie di relazioni. Gli scopi principali di un
thesaurus sono identificabili nella promozione della consistenza nell’indicizzazione di documenti e nel facilitare la ricerca dei documenti.
Nel contesto dell’Information Retrieval, specialmente nel caso di software
utilizzati per la ricerca full-text, il termine ‘thesaurus’ è talvolta utilizzato con
un’accezione più limitata, per indicare un dizionario di termini equivalenti,
precostituiti o costruiti dall’utente. Si tratta di strumenti comunque utili, ma
lontani dalla ricchezza di un vero thesaurus, che oltre ai termini equivalenti
contiene relazioni gerarchiche e associative e informazioni di autorità sui termini. Perciò, per gli obiettivi di questo volume, un ‘thesaurus’ è un vocabolario controllato come definito dagli standard sopracitati.
La struttura del thesaurus riflette rigorose relazioni semantiche e riflette i princiCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 103
pi della post-coordinazione dei termini: ciò significa che i termini del thesaurus
vengono combinati al momento della ricerca (tramite operatori booleani) piuttosto che al momento dell’indicizzazione, come nelle stringhe di soggetto. La
post-coordinazione offre maggiore flessibilità nella costruzione di strategia di
ricerca ma spesso riduce la precisione dell’indicizzazione perché la natura della
relazione tra i termini rimane inespressa. Rigorose relazioni semantiche invece
permettono all’utente di accedere al thesaurus e di identificare i termini di ricerca più appropriati. I thesauri contengono tre tipi di relazioni semantiche:
1. relazioni di equivalenza: sinonimi, varianti fonetiche preferite, acronimi, abbreviazioni, traduzioni ecc.;
2. relazioni gerarchiche: di tre tipi: generico-specifico, istanza, e partetutto. Più perfezionate sono le relazioni gerarchiche e più accurate
sono le inferenze. Alcuni termini del thesaurus potrebbero appartenere ad un’unica gerarchia o ad una struttura ad albero. Tuttavia, in
alcuni casi un termine potrebbe avere due termini BT o due differenti relazioni gerarchiche e il thesaurus dovrebbe accomodare queste
‘poliarchie’;
Relazioni di equivalenza
CAD (used for)
computer-aided design
Relazioni associative
CAD (see also)
computer-aided engineering
computer-aided manufacturing
Relazioni gerarchiche
Processes and Techniques
......<image-making processes and techniques>
......<computer image-making processes and techniques>
......computer graphics
......raster graphics
......vector graphics
......computer-aided design
[Fig. 9] Art&Architecture Thesaurus del Getty Institute: esempi di relazioni
104 |
3. relazioni associative: coordinazione, genetica, co-occorrenza, causaeffetto, strumentale, materiale ecc. per termini che hanno significati
associabili.
Lo scopo dei thesauri é quello di assicurare consistenza nell’indicizzazione, e
risultano essere uno strumento prezioso nei sistemi di gestione e recupero per
descrivere, organizzare e fornire accesso all’enorme quantità di dati presenti
sul Web, poiché consentono non soltanto di utilizzare un termine più corretto per la ricerca (con le varianti fonetiche, i sinomini e i termini correlati),
ma anche di organizzare un insieme di concetti, funzionando come mappe
che guidano l’utente all’informazione attraverso la visualizzazione delle relazioni semantiche. Rispetto alla soggettazione e alla classificazione, un thesaurus presenta termini controllati e strutturati gerarchicamente per soggetto,
con relazioni tra i termini chiaramente esplicitate che consentono un coordinamento semantico più specifico e al tempo stesso flessibile di quello offerto
dal soggettario e dagli schemi di classificazione 80.
Nella struttura del thesaurus, infatti, cluster di concetti che condividono
caratteristiche comuni sono organizzati in famiglie (‘faccette’) e rappresentati
da termini del linguaggio naturale utili nel contesto in cui il thesaurus è utilizzato. Faccette e sottofaccette sono quindi disposte come semplici gerarchie
di termini, dal generale allo specifico. Questa procedura presenta molti vantaggi: organizzando i termini in gruppi più piccoli correlati tra loro, ogni
gruppo può essere esaminato più facilmente. L’approccio a faccette è anche
utile per la sua flessibilità nella gestione di nuovi termini e nuove relazioni:
poiché ogni faccetta è indipendente, i cambiamenti in genere possono essere
effettuati senza alterare l’architettura generale del thesaurus. Definendo un
linguaggio di identificazione dei documenti, il thesaurus impedisce una valutazione soggettiva degli stessi e svolge dunque una funzione di mediazione
determinante tra la ricerca dell’uten-te e l’informazione vera e propria.
Per tale motivo i thesauri sono utili:
- nella fase di data entry, per la descrizione e la catalogazione;
- come online search assistant in sistemi di rete 81 fornendo sinonimi,
varianti lessicali, inversioni, nomi in diverse lingue, nomi storici,
forme alternate (singolare/plurale, varianti grammaticali), omografi;
- come knowledge base, mostrando relazioni gerarchiche tra termini articolati secondo uno schema di classificazione delle conoscenze relative al settore 82.
Un thesaurus può essere disponibile in formato cartaceo, o digitale, o entrambi (come l’AAT), ma data la difficoltà di formulazione della richiesta e l’inerente ambiguità della parola nel linguaggio naturale, in ambito informatico i
thesauri sono particolarmente utili perché a differenza dei cataloghi cartacei i
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 105
record sono letteralmente invisibili all’occhio finché non vengono recuperati.
Il compito dell’indicizzatore, quindi, è quello di decostruire l’informazione
derivata dai documenti e ricostruirla in una forma semantica che permette a
chi cerca l’informazione di recuperare, nel modo più accurato possibile, lo
specifico dato richiesto.
Ma se per i materiali bibliografici ogni concetto viene ‘atomizzato’ in differenti parti sulla base di categorie sintattiche, nel caso di materiali visuali
ogni termine rappresenta un concetto indipendente, non finalizzato alla
creazione di una struttura sintattica. Si comprende bene il ruolo critico dei
vocabolari strutturati nell’archiviazione dei materiali usuali: se un’immagine (statica o, ancor di più, in movimento) vale mille parole, la sua descrizione non è un’operazione meramente tecnica, perché i termini utilizzati
sono influenzati dall’universo culturale cui apparteniamo e dal nostro vissuto. Lo schema concettuale delle immagini implica inoltre tre ulteriori
livelli di analisi (preiconografico, iconografico e iconologico), che presentano numerose variabili di interpretazione. Gli standard di documentazione
comuni e i vocabolari (come l’Art & Architecture Thesaurus (Fig. 9), la
Union List of Artist Names e il Getty Thesaurus of Geographic Names 83;
l’UNESCO Thesaurus, il Thesaurus of Engineering and Scientific Terms
(TEST), il Transportation Research Thesaurus (TRT) gestito dal
Transportation Research Board of the National Research Council, ERIC
Thesaurus on education, il Thesaurus Regionale Toscano) sono dunque
componenti importanti per permettere ai singoli utenti e alle istituzioni di
condividere e arricchire le informazioni, aumentandone l’utilizzo, il valore
e la durata nel tempo.
Lo sviluppo dei thesauri tuttavia non è privo di problemi sia per la specificità
di uno strumento di questo tipo che per la sua creazione che, se effettuata
manualmente, è onerosa in termini di tempo. Anche il loro utilizzo nella
ricerca potrebbe costituire una barriera per l’utente, se ad esempio non è integrato oppure se il suo browser è disponibile solo come lista alfabetica nell’interfaccia di ricerca. Tuttavia, è stato dimostrato che i thesaurus migliorano il
recupero dei dati 84, e come ha scritto Patricia Harpring, Managing Editor del
Getty Vocabulary Program, «it is clear that vocabularies are the key to navigating and retrieving meaningful results from the massive amount of largely
inchoate information now potentially available in digital form» 85.
3.2.8 Authority control
L’operazione di verifica e validazione dei termini e dei nomi è una parte critica del lavoro di documentazione: l’applicazione di vocabolari controllati standard è un risultato significativo di questo lavoro. Il concetto originario della
106 |
catalogazione bibliografica ai tempi del catalogo cartaceo era quello di una
rigida consistenza, necessaria per l’accesso minimo: l’uso di una forma controllata di intestazione consentiva alle biblioteche di evitare l’acquisizione o la
catalogazione involontaria e costosa di materiali già posseduti, permettendo
inoltre all’utente di risparmiare tempo e fatica grazie alla esplicitazione dei
rinvii alle forme controllate delle intestazioni e al raggruppamento delle opere
sotto una sola forma.
Oggi questa operazione si è estesa ad altre comunità di gestione delle informazioni e le procedure che hanno largamente beneficiato dell’informatizzazione e del Web sono le seguenti:
- liste d’autorità (authority file): compilazioni di termini o di intestazioni autorizzate utilizzate da una singola organizzazione o da un
consorzio per la catalogazione, l’indicizzazione o la documentazione.
Le liste d’autorità sono gestite in modo estremamente accurato e
spesso includono anche informazioni associate al termine o all’intestazione di soggetto (ad esempio sinonimi, termini correlati o associati), e fonti originali del termine. Una lista d’autorità è un vocabolario
controllato, ma non tutti i vocabolari controllati sono liste d’autorità,
perché l’obiettivo principale di una lista d’autorità è quello di regolare l’utilizzo dei termini in una specifica base di dati. Spesso le liste
d’autorità utilizzano molteplici vocabolari strutturati come fonte e la
maggior parte includono anche termini locali nati nell’ambito dell’organizzazione stessa. Esse sono parte integrante della maggior parte
dei sistemi informativi automatizzati, sebbene con diversi livelli di
implementazione, in base al sistema;
- controllo d’autorità (authority control): un sistema di procedure che
conserva informazioni consistenti nel record di un database. Le procedure includono la registrazione dei termini e la loro validazione utilizzando liste d’autorità, con l’obiettivo di consentire a chi cerca di collegare tra loro termini simili. Il controllo d’autorità è, tra le attività
bibliotecarie, forse quella più strettamente legata alla cultura generale,
ed è particolarmente importante nell’ambiente Web, per facilitare la
ricerca e migliorare la precisione dei risultati della query. Può essere
automatizzato, ma i processi intellettuali necessari per creare delle liste
d’autorità qualitativamente valide sono ancora quelli effettuati
manualmente, come già evidenziato. Questo lavoro può includere:
verifica dei termini o dei nomi proposti in fonti autorevoli come
dizionari, monografie o fonti storiche; ricerca di sinonimi come
varianti fonetiche; definizione di relazioni tra termini o nomi; creazione di record di autorità da poter essere inseriti nella base di dati.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 107
Poichè si tratta di un lavoro spesso costoso e lungo, e che si cerchi
quindi, nell’ottica della condivisione dei dati si cerca in genere di condividere anche le liste di autorità.
L’intestazione è costituita da una registrazione, non solo da un nome, chiamata authority record, comprensiva della forma standard, delle forme varianti e
delle forme correlate in altre lingue, dell’ambito culturale e delle osservazioni
del catalogatore, secondo quanto stabilisce GARE 86. Ciascun authority record
è abbinato a uno o a più record bibliografici: in tal modo il catalogo digitale
consente di accedere alle registrazioni delle opere di un autore da qualsiasi
forma correlata e da qualsiasi ordine di combinazione. A differenza dei record
bibliografici, che hanno una certa ‘stabilità’, gli authority record sono però
soggetti a cambiamenti continui determinati da necessità di modifica nelle
forme varianti, dall’introduzione di forme parallele o di forme correlate, dall’introduzione di nuove fonti bibliografiche, dalla necessità di disambiguazione con altri nuovi record, dal cambiamento del nome di un autore o semplicemente dalla necessità di variare le informazioni biografiche. Tutti elementi
che ovviamente complicano notevolmente il problema dell’allineamento dei
cataloghi e dello scambio dei record.
L’authority control in un contesto universitario, come ha recentemente indicato Guido Badalamenti, è una scelta obbligata 87. Il controllo e la normalizzazione degli accessi catalografici è sempre stato molto presente nell’organizzazione dei servizi delle biblioteche universitarie, sia nel contesto della catalogazione – data l’ampia tipologia delle raccolte che interessano i loro utenti istituzionali, che comprendono opere di autori locali, nazionali ed esteri e che
abbracciano vari ambiti disciplinari – sia ai fini della predisposizione di
OPAC coerenti ed adeguati per gli utenti, in grado di orientare in modo semplice ed efficace studenti e ricercatori verso un uso più approfondito delle collezioni bibliografiche. La crescita dei servizi offerti dalle biblioteche, la loro
crescente complessità, la necessità di dedicare risorse umane adeguate per l’integrazione dei servizi tradizionali di biblioteca con quelli offerti dalle risorse
digitali, la nascita della biblioteca digitale hanno posto seri problemi all’organizzazione degli uffici di catalogazione nelle biblioteche universitarie, soprattutto in un contesto di generale contrazione delle risorse economiche.
La funzione principale svolta dall’authority file non comprende più soltanto
la procedura della catalogazione, ma anche quella della ricerca. Si avverte
sempre più infatti la necessità di poter definire strumenti che aiutino gli
utenti a tracciare dei percorsi di ricerca personalizzati e controllati, che
sfuggano alle logiche commerciali dei grandi editori o dei motori di ricerca.
Barbara Tillett 88 suggerisce l’idea che, a partire dall’esistenza di authority
file internazionali, reali o virtuali, in cui siano registrate le varianti del
108 |
nome di ciascuna entità e le forme parallele nelle diverse lingue e nei diversi
alfabeti, si possano sviluppare delle interfacce adatte alle esigenze e alle scelte di ciascun utente.
Il Web rende possibili nuovi utilizzi per gli authority record e nuove funzioni, in aggiunta alle funzioni tradizionali: ad esempio la condivisione del carico di lavoro riduce i costi di catalogazione, ma a condizione di utilizzare
standard catalografici, formati di scambio e di rendere i dati elaborati facilmente accessibili in rete. Per il momento non sono molti, anche in ambito
internazionale, gli authority file disponibili in rete ed accessibili attraverso il
protocollo Z39.50. Un punto di riferimento importante in questo contesto,
in grado di dare una risposta ai problemi aperti, è il progetto europeo LEAF
(Linking and Exploring Authority Files), che ha come obiettivo la creazione
di un sistema centralizzato in cui saranno localizzati i record relativi ad autori persona ed enti presenti nei database di piccole e grandi biblioteche di
diversi paesi. I record saranno raccolti attraverso procedure periodiche di
harvesting dei diversi database, in modo da assicurare un costante aggiornamento dei dati.
3.2.9 Web semantico e ontologie
Un’ontologia definisce i termini utilizzati per descrivere e rappresentare un’area
della conoscenza 89. Le ontologie sono utilizzate dalle persone, dai database e
dalle applicazioni che hanno bisogno di condividere le informazioni di un
ambito tematico specifico. Esse includono le definizioni (utilizzabili dal computer) di concetti base e le relazioni tra questi concetti: in pratica cioè le ontologie codificano la conoscenza di un certo ambito e quella trasversale ad altri
ambiti, rendendole in tal modo riutilizzabile.
Sebbene vi sia un generale consenso su cosa sia un’ontologia e cosa dovrebbero fare, alcune definizioni esprimono significati differenti 90. I filosofi hanno
spesso costruito le ontologie con un approccio top-down omnicomprensivo, i
programmatori invece tendono a lavorare in una modalità bottom-up. Per sviluppare database e sistemi di Intelligenza Artificiale, spesso partono con ontologie limitate o micromondi, che hanno un numero limitato di concetti e
sono modellate per una specifica applicazione: questo tipo di prototipi è
popolare nell’ambito della robotica, della progettazione, della machine vision
e machine learning.
Alcuni temi comuni emergono nelle varie interpretazioni del termine:
1. un’ontologia è una rappresentazione formale che ha lo scopo di precisare, esplicitare e rendere non ambiguo uno specifico ambiente conoscitivo che richiede un modello chiaramente definito (ad es. alcune
ontologie sono basate su modelli derivanti dalla rappresentazione
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 109
della conoscenza). Questi modelli ontologici, vere e proprie metaontologie sono tutte basate sull’ipotesi che gli aspetti più rilevanti
della concettualizzazione di un dominio possano essere catturati
usando solo pochi semplici costrutti 91;
2. un’ontologia descrive le entità e i concetti rilevanti di un dominio specifico. Se si vuole completare lo sviluppo di un’ontologia, lo scopo e
gli obiettivi devono essere chiaramente definiti. Un’ontologia universale si estenderebbe in modo infinito e richiederebbe risorse illimitate;
3. un’ontologia rappresenta una visione soggettiva di un certo ambito,
che potrebbe essere descritto in modi diversi da differenti ontologie.
Questo aspetto riporta ad un’importante questione filosofica sulla
possibilità o meno di concettualizzazioni multiple della realtà. Le
divergenze potrebbero emergere semplicemente come il risultato di
descrizioni di differenti ambiti o aspetti dello stesso ambito, ma queste differenze sono in un certo senso triviali poiché non portano a
fondamentali disaccordi. Tuttavia ontologie incompatibili ma ugualmente plausibili potrebbero emergere in quei casi in cui il dominio è
rigorosamente identico, suggerendo così che le concettualizzazioni di
fondo non sono le stesse (ad esempio in questioni teoretiche o religiose). Questo porta all’importante conseguenza che unire una o più
ontologie divergenti in alcuni casi potrebbe risultare concettualmente
impossibile, sebbene le ontologie, come esplicite rappresentazioni formali, possono avere un ruolo utile aiutando a rivelare e a chiarire differenze concettuali che altrimenti rimarrebbero nascoste dalla terminologia comune o simile.
Nell’attuale gergo dell’informatica, le ontologie sono delle risorse che rappresentano delle semantiche condivise a più ambiti. A differenza dei modelli di
dati, il fondamentale assetto delle ontologie è la loro relativa indipendenza da
una particolare applicazione, cioè un’ontologia consiste di una conoscenza
relativamente generica che può essere riutilizzata per differenti applicazioni e
compiti. Il termine ontologia è stata usato per descrivere artefatti con un
diverso grado di struttura, dalle semplici tassonomie come di Yahoo agli schemi di metadati come Dublin Core e alle teorie logiche.
In sintesi 92, le ontologie sul Web sono utilizzabili per:
- la comunicazione (tra sistemi computazionali implementati, tra esseri
umani, tra esseri umani e sistemi computazionali);
- l’inferenza computazionale (per rappresentare e manipolare internamente piani e per pianificare l’informazione e analizzare le strutture
interne, gli algoritmi, gli input e gli output dei sistemi implementati
in termini concettuali e teoretici);
110 |
-
il riuso (e l’organizzazione) della conoscenza per la strutturazione e
l’organizzazione di biblioteche digitali e repository.
Il Web semantico ha bisogno di ontologie con un significativo grado di struttura, che devono specificare descrizioni per i seguenti tipi di concetti: classi
(cose generali) nei tanti ambiti di interesse; relazioni esistenti tra le classi; proprietà (o attributi) che queste cose hanno. Le ontologie sono generalmente
espresse in un linguaggio di base, in modo che si possano effettuare distinzioni accurate, consistenti e significative tra classi, proprietà e relazioni. Esse vengono utilizzate da sistemi automatizzati per la ricerca e recupero
concettuale/semantico, agenti intelligenti, supporto alle decisioni, comprensione del parlato e del linguaggio naturale, Knowledge Management, database
intelligenti, commercio elettronico.
Per ottenere l’interoperabilità tra numerosi schemi sviluppati e gestiti in
modo autonomo, è necessaria una semantica più ricca di quelle attualmente
disponibili.
Tim Berners-Lee, l’inventore del Web, ha recentemente affermato che «most
of the Web’s content today is designed for humans to read, not for computer
programs to manipulate meaningfully» 93. Il contenuto è comprensibile al calcolatore se viene collegato ad una qualche descrizione formale del contenuto
stesso, ad esempio con i metadati. Affinché il Web semantico funzioni, i computer devono avere accesso a collezioni strutturate di informazioni e di insiemi di regole di inferenza, che possano essere utilizzati per effettuare ragionamenti automatici servendosi dell’XML, dello schema RDF, delle ontologie e
degli agenti intelligenti.
Costruire ontologie è un’operazione difficile, lunga e costosa, in particolar
modo se l’obiettivo è la progettazione di un’ontologia sufficientemente formale
da supportare l’inferenza automatica. Ciò è dovuto in parte al fatto che le ontologie richiedono consenso attraverso una comunità i cui membri potrebbero
avere versioni radicalmente differenti del dominio in considerazione. Inoltre vi
sono al momento poche tecniche di valutazione. Ma quando le ontologie saranno maggiormente condivise, il Web semantico entrerà nel nostro mondo fisico:
gli URI infatti possono puntare a qualsiasi cosa, inclusi gli oggetti, che potranno in tal modo cercare automaticamente ed impiegare servizi e attivare altri
dispositivi per aggiungere informazioni o funzionalità.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 111
Note
[1]
Cfr. California Digital Library, Digital
Object Standard: Metadata, Content and
Encoding, 18 May 2001,
<http://www.cdlib.org/news/pdf/CDLObj
ectStd-2001.pdf>
[2]
G. Jonsson, The bibliographic unit in digital context, how to define it?, in IFLA
Meeting of Experts on an International
Cataloguing Code, 2003, Frankfurt,
Germany,
<http://www.ddb.de/news/pdf/papers_jonsson.pdf>
[3]
G. Tassey, The roles of standards as
technology infrastructure, in Standards,
Innovation and Competitiveness: The
Politics and Economics of Standards in
Natural and Technical Environments, R.
Hawkins (ed.), Edward Elgar, Brookfield
1995; W. Lehr, Compatibility standards
and interoperability: Lessons from the
Internet, in Standards Policy for
Information Infrastructure, B. Kahin, J.
Abbate (eds.), MIT Press, Cambridge
1995, pp. 121-147; P.A. David,
Standardization policies for network
technologies: the flux between freedom
and order revisited, in Standards,
Innovation and Competitiveness: The
Politics and Economics of Standards in
Natural and Technical Environments, R.
Hawkins, J. Skea (eds.), Edward Elgar,
Brookfield 1995, pp. 15.35
[4]
I due enti più noti nell’ambito della
biblioteconomia e dell’information Science
112 |
sono la International Standard Association
(ISO) e la National Information Standards
Organization (NISO), accreditata
dall’American National Standards
Institute. A differenza degli standard ISO,
quelli NISO sono volontari: non vi sono
cioè politiche per rafforzare la conformità
agli standard, che vengono emessi con lo
scopo di rappresentare delle linee guide e
di raccomandazioni di best practice piuttosto che come requisiti.
[5]
Per il profilo del documentalista cfr.
Euroguida I&D. Competenze dei professionisti europei dell’informazione e della documentazione, realizzata con supporto
Commissione UE, versione italiana di M.P.
Carosella, D. Bogliolo, Casalini Libri, Roma
2000 e V. Couzinet, Médiations hybrides.
Le documentaliste et le chercheur en sciences
de l’information, ADBS, Paris, 2001.
[6]
Per un’analisi delle problematiche in un
progetto di digitalizzazione cfr. il volume
Una metodologia per l’acquisizione e la
restituzione dei giacimenti documentali
dell’architettura. I materiali per lo studio
di Andrea Palladio, a cura di G.
Beltramini e M. Gaiani, Edizioni
POLI.design, Milano 2003.
[7]
Cfr. <http://mip.berkeley.edu/spiro/>
[8]
EAD è uno standard per la codifica di
archival finding aids mantenuto dal
Network Development and MARC
Standards Office della Library of Congress,
in partnership con la Society of American
Archivists.
[9]
[ 11]
T. Gill, A. Gilliland-Swetland, M. Baca,
Introduction to Metadata, Getty Information
Institute, 2000 <www.getty.edu/research/conducting_research/standards/intrometadata>;
J. Milstead, S. Feldman, Metadata:
Cataloging by Any Other Name ..., in
«Online», January 1999, vol. 23, n. 1,
<http://www.infotoday.com/online/OL1999/
milstead1.html>; T. Gill, Metadata and the
World Wide Web, 2000
<http://www.getty.edu/research/institute/standards/intrometadata/2_articles/gill/index.htm
l; G. Mura, Nel labirinto dei metadati, in
«Biblioteche oggi», settembre 2001, pp.3842. Per una riflessione sugli standard di catalogazione cfr. T. Franco, Do we sill need cataloging stantards?, in OSS 97 Global Security
& Global Competitiveness: Open Source
Solutions, 1997
<http://www.dtic.mil/cendi/presentations/oss
9_97/franco/index.html>; R. Wendler,
Branching Out: Cataloging Skills and
Functions in the Digital Age, in «Journal of
Internet Cataloging», n. 2, 1999, pp. 43-54;
H. Besser, The Next Stage: Moving from
Isolated Digital Collections to Interoperable
Digital Libraries, in «First Monday», volume
7, number 6 (June 2002), <http://firstmonday.org/issues/issue7_6/besser/index.html>
M. Gorman, Le risorse elettroniche.
Quali vale la pena di conservare e qual’è il loro ruolo nelle raccolte della
biblioteca?, bozza dell’intervento, in
International Conference on Electronic
Resources, cit.,
<http://w3.uniroma1.it/ssab/er/relazioni/gorman_ita.pdf>
[ 10 ]
In questo contesto verrà usato il termine
‘catalogazione tradizionale’ per fare riferimento a descrizioni delle risorse basate su
un insieme d regole che includono le
ISBD, le RICA e AACR2, i vari soggettari
nazionali (Soggettario di Firenze e Library
of Congress Subject Headings), formati
MARC per i dati bibliografici. Il termine
non riflette un valore negativo, ma è solo
esemplificativo.
Ciuccarelli, Innocenti
|
[ 12 ]
Cfr. A. De Robbio, Metadati per la comunicazione scientifica, ICCU 2001
<http://www.iccu.sbn.it/Derobbio.rtf>; A.
Scolari, M. Messina, C. Leombroni, G.
Cirocchi, G. Bergamin, Appunti per la
definizione di un set di metadati gestionali-ammnistrativi e strutturali per le risorse
digitali, 2000
<http://www.iccu.sbn.it/metaAG1.pdf>
[ 13 ]
The digital library toolkit, Sun Microsystems,
Palo Alto 2000 (2nd ed.), p. 175.
[ 14 ]
C. Lagoze, Keeping Dublin Core Simple.
Cross Domain Discovery or Resource
Description?, in «D-Lib Magazine», n. 1,
January 2001
<http://www.dlib.org/dlib/january01/lagoze/01lagoze.html>
[ 15 ]
D. Brickley, R.V. Guha, Resource
Description Framework (RDF) Schema
Specification, World Wide Web
Consortium, 2000
<http://www.w3.org/TR/rdf-schema>; O.
Lassilla, R.R. Swick, Resource Description
Framework (RDF). Model and Syntax
Specification, 1999
<http://www.w3.org/TR/PR-rdf-syntax>
Sistemi conoscitivi per il design: una proposta metodologica
| 113
[ 16 ]
[ 20 ]
E. Duval, W. Hodgins, S. Sutton, S.L.
Weibel, Metadata Principles and
Practicalities, in «D-Lib Magazine», vol. 8,
n. 4, April 2002,
<http://www.dlib.org/dlib/april02/weibel/04weibel.html>
J. Greenberg, M. Pattuelli, B. Parsia, W.
Robertson, Author-generated Dublin Core
Metadata for Web Resources: A Baseline
Study in an Organization, in Journal of
Digital Information, vol. 2, n. 2
(November 2001)
<http://jodi.ecs.soton.ac.uk/Articles/v02/i0
2/Greenberg>
[ 17 ]
Cfr. R. Heery, M. Patel, Application profiles:
mixing and matching metadata schemas The
idea of application profiles grew out of
UKOLN’s work on the DESIRE project, in
«Ariadne», issue 25
(http://www.ariadne.ac.uk/issue25/app-profiles/); S. Peruginelli, I profili di applicazione,
ICCU,
<http://www.iccu.sbn.it/PDF/Peruginelli.pdf>
[ 21]
The Open Archives Initiative Protocol for
Metadata Harvesting, Protocol Version
1.1 of 2001-07-02, Document Version
2001-06-20,
<http://www.openarchives.org/OAI/openarchivesprotocol.htm>
[ 22 ]
[ 18 ]
Work Package 8. BIBLINK Core Field
Semantics,
<http://hosted.ukoln.ac.uk/biblink/wp8/fs
/bc-semantics.html>
Cfr. ad esempio il Metadata Schema
Registry (<http://metadata.net>), o il sito
dell’inglese Office for Library and
Information Networking
(<http://ukoln.bath.ac.uk/metadata/interoperability>).
[ 19 ]
L.C. Howarth, Creating a MetadataEnabled Framework for Resource Discovery
in Knowledge Bases, in CAIS 2000:
Dimensions of a Global Information Science,
Canadian Association for Information
Science, Proceedings of the 28th Annual
Conference, 2000, <http://www.slis.ualberta.ca/cais2000/howarth.htm>; M. Day,
Metadata Mapping between metadata formats, UKOLNl, last updated 2004,
<http://www.ukoln.ac.uk/metadata/interoperability/>; M.St. Pierre, W.P. LaPlant Jr.,
Issues in Crosswalking Content Metadata
Standards, in National Information
Standard Organization, 15 October 1998,
<http://www.niso.org/press/whitepapers/crss
walk.html>
114 |
[ 23 ]
Cfr. le osservazioni di A. Scolari, UNIMARC, AIB, Roma 2000 e G. Cirocchi,
S. Gatta, L. Panciera, E. Seta, Metadati,
informazionidi qualità e conservazione
delle risorse digitali, in «Bollettino AIB»,
n. 40, 2000, pp. 397-409.
[ 24 ]
Cfr. N. Medeiros, Making Room for
MARC in a Dublin Core World, in
«Online», November 1999,
<http://www.onlinemag.net/OL1999/med
eiros11.html>
[ 25 ]
<http://www.loc.gov/standards/marcxml/>
[ 26 ]
R. Tennant, Marc Must Die, in «Library
Journal», 2002, <http://www.libraryjournal.com/article/CA250046>
[ 27 ]
Il Government Information Locator Service
(GILS) è uno strumento per l’identificazione delle risorse informative del governo
americano. Come parte del suo compito,
GILS ha sviluppato un formato di metadati
complesso, influenzato dal MARC e progettato per un’architettura client-server basata
sullo standard Z39.50 (cfr.
<http://www.access.gpo.gov/su_docs/gils/>).
[ 28 ]
La versione alfa della Encoded Archival
Description (EAD) è stata emessa nel
1996 (cfr. Encoded Archival Description
(EAD), Official EAD Version 2002 Web
Site <http://www.loc.gov/ead/>).
per gli studiosi e gli esperti d’arte e i
ricercatori universitari, permettono la
descrizione di opere d’arte e delle loro
rappresentazioni digitali. La versione 2.0
è uscita nel 2000
(<http://www.gii.getty.edu/index/cdwa.
html>).
[ 31 ]
I Content Standard for Digital Geospatial
Metadata (CSDGM) sono stati sviluppati
dalla Federal Geographical Data
Committee (FGDC) con lo scopo di un
insieme comune di termini e definizioni
per la documentazione dei dati digitali
geospaziali. Definiscono l’informazione
necessaria per gli utenti dei dati geospaziali
per determinare la disponibilità di un
insieme di dati, la sua appropriatezza per
un dato scopo, le modalità di accesso e
quelle di trasferimento.
[ 32 ]
[ 29 ]
Core Categories delle Visual Resources,
versione 2.0, rilasciate dalla Visual
Resources Association nel 1997. Gli elementi del Core, che prevedono l’integrazione con altri elementi per completare le
descrizioni, sono stati progettati per facilitare la condivisione delle informazioni tra
collezioni di risorse visuali. La versione
3.0, un progetto della Visual Resources
Association Data Standards Committee, è
uscita nel 2002.
[ 30 ]
Categories for the Description of Works
of Art (CDWA), sviluppate dalla Art
Information Task Force, con la sponsorizzazione del Getty Information
Institute e della College Art Association.
Le CDWA, molto dettagliate e pensate
Ciuccarelli, Innocenti
|
Cfr. M. Woodley, Crosswalks: the paths to
universal access ?, 2000
<http://www.getty.edu/research/institute/st
andards/intrometadata/2_articles/woodley/index.html>; M. Day, Metadata:
Mapping between Metadata Formats, cit.
[ 33 ]
D. Bearman, G. Rust., S. Weibel., E.
Miller, J. Trant, A Common Model to
Support Interoperable Metadata, in «DLib Magazine», n.1, 1999
<http://www.dlib.org/dlib/january99/bea
rman/01bearman.html>. Queste sono
anche le tematiche base del V programma quadro della Comunità Europea, nell’ambito dell’Information Society
Technologies Programme (1998-2002),
che intende promuovere un nuovo
approccio integrato alle informazioni,
Sistemi conoscitivi per il design: una proposta metodologica
| 115
che venga incontro alle esigenze dell’utenza, che offra servizi e tecnologie a
tutte le attività e che tra le sue strategie
stabilisca un consenso necessario per la
standardizzazione a tutti i livelli
<http://www.cordis.lu/ist/>
[ 34 ]
P. Caplan, International metadata initiatives: lessons in bibliographic control, in
Bicentennial Conference on Bibliographic
Control for the New Millennium, 2001,
<http://www.loc.gov/catdir/bibcontrol/cap
lan_paper.html>; R. Wendler, Musings on
Priscilla Caplan’s, in Bicentennial
Conference on Bibliographic Control for
the New Millennium, 2001,
<http://www.loc.gov/catdir/bibcontrol/we
ndler_paper.html>
[ 37 ]
<http://dublincore.org/index.shtml>.
Cfr. Inoltre A. Powel, Metadata for the
web: RDF and Dublin Core, 1998
<http://www.ukoln.ac.uk/metadata/presentations/ukolug98/paper/intro.html>.
Per le potenzialità dei metadati in ambito commerciale cfr. G. Rust, Metadata:
the right approach : an integrated model
for descriptive and rights metadata in
E-commerce, in «D-Lib magazine», JulyAugust 1998
<http://www.dlib.org/dlib/july98/rust/0
7rust.html>
[ 38 ]
The Dublin Core Metadata Element Set,
ANSI/NISO Z39.85-2001 e ISO
15836:2003 <http://www.niso.org/standards/resources/Z39-85.pdf>
[ 35 ]
Per il modello bibliografico proposto
dall’IFLA. Cfr. IFLA, Functional
Requirements for Bibliographic Records Final Report, 2000
<http://www.ifla.org/VII/s13/frbr/frbr1.h
tm#1>; Seminario FRBR : Functional
Requirements for bibliographic records.
Requisiti funzionali per record bibliografici, 27-28 gennaio 2000, Roma, AIB,
Roma 2000; C. Fasella, IL modello
bibliografico FRBR e il Dublin Core, in
Seminario Nazionale sui Metadati, 3
aprile 2001 <http://www.iccu.sbn.it/semimeta.htm>
[ 36 ]
Per risorsa informativa si intende qui ‘tutto
ciò che possiede un’identità’, secondo la definizione di Tim Berners-Lee et alii, Internet
RFC 2396 - Uniform Resource Identifiers
(URI): Generic Syntax, August 1998,
<http://www.faqs.org/rfcs/rfc2396.html>
116 |
[ 39 ]
E. Miller, D. Brickley, R. Dornfest, DCMI
Architecture: Metadata Entities and
Relationships, presentation in Dublin Core
8 Workshop, 10 April 2000, National
Library of Canada, Ottawa,
<http://dublincore.org/workshops/dc8/DC
MIArchitecture2/>
[ 40 ]
Rispettivamente
<http://www.w3c.org/XML/Schema> e
<http://www.ukoln.ac.uk/metadata/dcmi/
dc-xml-guidelines/>. Cfr. anche A. Powell,
P. Johnston, Guidelines for implementing
Dublin Core in XML, 2 April 2003,
<http://dublincore.org/documents/dc-xmlguidelines/index.shtml>
[ 41 ]
Current Cites annotation of latest DCMI
report (61 lines) di S. Weibel,
weibel@OCLC.ORG, 01 March 2002
00:37,<http://www.jiscmail.ac.uk/cgibin/wa.exe?A2=ind0203&L=dcgeneral&F=&S=&P=53>
[ 42 ]
L. Dempsey, S. Weibel, The Warwick
Metadata Workshop, in «D-Lib
Magazine», July/August 1996,
<http://www.dlib.org/dlib/july96/07weibel.html>
Associations and Institutions, March 1998
<http://www.ifla.org/VII/s13/frbr/frbr.pdf>
[ 47 ]
The Harmony Project,
<http://www.ilrt.bris.ac.uk/discovery/harmony/>; D. Brickley, J. Hunter, C.
Lagoze, ABC: A Logical Model for
Metadata Interoperability, Harmony
Project, Working Paper, 1999
<http://www.ilrt.bris.ac.uk/discovery/harmony/docs/abc/abc_draft.html>
[ 43 ]
T. Baker, A Grammar of Dublin Core, in
«D-Lib Magazine», October 2000, vol. 6,
n. 10, <http://www.dlib.org/dlib/october00/baker/10baker.html>
[ 44 ]
R. Guenther, Library Application Profile,
Dublin Core Metadata Initiative, DCMI,
24 September 2002,
<http://dublincore.org/documents/libraryapplication-profile/>
[ 48 ]
D. Bearman, E. Miller, G. Rust, J. Trant,
S. Weibel, A Common Model to Support
Interoperable Metadata. Progress report on
reconciling metadata requirements from
the Dublin Core and INDECS/DOI
Communities, in «D-Lib Magazine»,
January 1999, vol. 5, n. 1,
<http://www.dlib.org/dlib/january99/bearman/01bearman.html>
[ 49 ]
[ 45 ]
C. Lagoze, Accommodating Simplicity
and Complexity in Metadata: Lessons
from the Dublin Core Experience, in
Seminar on Metadata Organized by
Archiefschool, Netherlands Institute for
Archival Education and Research June 8,
2000, <http://www.cs.cornell.edu/lagoze/Papers/dc.pdf>.; C. Lagoze, Keeping
Dublin Core Simple. Cross-Domain
Discovery or Resource Description?, in
«D-Lib Magazine», January 2001, vol. 7
n. 1, <http://www.dlib.org/dlib/january01/lagoze/01lagoze.html>
[ 46 ]
R. Heery, M. Patel, Application Profiles:
Mixing and Matching Metadata Schemas,
in «Ariadne», Issue 25, September 2000,
<http://www.ariadne.ac.uk/issue25/appprofiles/intro.html>
[ 50 ]
<http://www.ukoln.ac.uk/metadata/roads/>
[ 51 ]
Cfr. Guide to Best Practice: Dublin Core,
Version 1.1, Consortium for the Computer
Interchange of Museum Information
(CIMI), 21 April 2000, version 1.1,
<http://www.cimi.org/public_docs/meta_b
estprac_v1_1_210400.pdf>
Functional Requirements for Bibliographic
Records, International Federation of Library
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 117
[ 52 ]
<http://www.emis.de/projects/EULER/>
[ 53 ]
C. Parmeggiani, Il questionario e il suo
sviluppo: i progetti censiti, le metodologie
e le tematiche relative alle diverse tipologie di progetti, in I METADATI seminario nazionale, Roma, 3 aprile 2001,
<http://www.iccu.sbn.it/Parmeggiani.ppt
>; Questionario sull’utilizzo dei metadati,
in ibidem, <http://www.iccu.sbn.it/quesmeta.htm>; Lista dei progetti che utilizzano i metadati in Italia, in ibidem,
<http://www.iccu.sbn.it/metaprog.htm>
[ 54 ]
P. Lyman, H.R. Varian, How Much
Information Study 2000, School of
Information Management and Systems at
the University of California at Berkeley,
<http://www.sims.berkeley.edu/research/pr
ojects/how-much-info/how-muchinfo.pdf> (nel sito è disponibile anche l’aggiornamento del 2003).
Multimedia description schemes, m3705,
in 54th MPEG meeting, La Baule,
October 2000,
<http://metadata.net/harmony/MW200
2_paper.pdf>; J. Hunter, J. Martinez, E.
Oltmans, Rehm, C. Jörgensen, MPEG-7
Harmonization with Dublin Core:
Current Status and Concerns, m6160,
53rd MPEG meeting, Beijing, July
2000.
[ 56 ]
<http://www.itscj.ipsj.or.jp/sc29/>
[ 57 ]
D. Dale, R. Rog, The Need for a Meta-Tag
Standard for Audio and Visual Materials,
in Proc. Int. Conf. on Dublin Core and
Metadata for e-Communities, Florence
University Press, Florence 2002, pp. 205206.
[ 58 ]
A.C. Foskett, The subject approach to information, Library Association, London 1996.
[ 55 ]
[ 59 ]
<http://www.mpeg-7.com>. Sullo standard MPEG-7 e le sue applicazioni cfr.
N. Day, MPEG-7: Solutions for Rich
Content Management, in «ONLINE»,
September 2001 <http://www.onlinemag.net/pdf2001/article#_01.pdf>; J.
Hunter, MPEG-7 Behind the Scenes, in
«D-Lib Magazine», September 1999,
vol. 5, n. 9,
<http://www.dlib.org/dlib/september99/hunter/09hunter.html>; J.
Hunter, Combining the CIDOC CRM
and MPEG-7 to Describe Multimedia in
Museums; ISO/IEC CD 15938-5
Information technology - Multimedia
content description interface - Part 5
Cfr. Multimedia Information Retrieval, a
cura di R. Raieli, P. Innocenti, AIDA,
Roma, 2004.
118 |
[ 60 ]
Ad esempio il sistema sviluppato dal gruppo Visual Information Technology del
National Research Council of Canada
<http://www.vit.iit.nrc.ca/VIT.html>, di
cui fa parte Eric Paquet.
[ 61 ]
E. Paquet, M. Rioux, Content-based
Access of VRML Libraries, in IAPRInternational Workshop on Multimedia
Information Analysis and Retrieval, in
«Lecture Notes in Computer Sciences»,
vol. 1464, 1998, Springer, pp. 20-32; E.
Paquet, M. Rioux, A Content-based
Search Engine for CAD and VRML
Databases, in Dedicated Conference on
Robotics, Motion and Machine Vision in
the Automotive Industries. Proceesfings of
ISATA 31, Dusseldorf, Germany 1998,
pp. 427-434.
[ 62 ]
Cfr. E.D. Liddy, Enhanced Text Retrieval
Using Natural Language Processin, in
«Bulletin of the American Society for
Information Science», n. 4, 1998
<http://www.asis.org/Bulletin/Apr98/liddy.html> e idem, Text Mining, in
«Bulletin of American Society for
Information Science & Technology»,
2000 <http://www.asis.org/Bulletin/Oct00/liddy.html>; Natural Language
Processing, in Encyclopedia of Library
and Information Science, 2nd ed., Marcel
Decker Inc., 2001 New York.
[ 63 ]
K. Hagedorn, Extracting value from
automated classification tools. The role of
Manual involvement and controlled vocabularies, White Paper, Argus Center for
Information Architecture, 2001
<http://argus-acia.com/white_papers/classification.pdf>
Computers Be Used for the Skilled Tasks
of Professional Librarianship?, in «DLib Magazine», vol. 6, n. 7/8,
July/August 2000,
<http://www.dlib.org/dlib/july00/arms/
07arms.html>; N.K. Humphreys, Mind
Maps: Hot New Tools Proposed for
Cyberspace Librarians, in «The
Searcher», Volume 7, No. 6, June 1999,
<http://www.infotoday.com/searcher/jun
99/humphreys.htm>
[ 66 ]
M.M. Hlava, Automatic Indexing: A
Matter of Degree, in «Bulletin of the
American Society for Science and
Information Technology», vol. 29, n. 1,
October-November 2002,
<http://www.asis.org/Bulletin/Oct02/hlava.html>
[ 67 ]
Cfr. ad esempio D.C. Blair and M.E.
Maron, An evaluation of retrieval effectiveness for a full-text document-retrieval
system, in Communications of the ACM,
March 1985, 28:3, pp. 289-299; G.
Salton, in «Communications of the
ACM», July 1986, vol. 29, n. 7, pp. 648656; D.C. Blair, M.E. Maron, in
«Information Processing and
Management», 1990, 26:3, pp. 437- 447.
[ 68 ]
[ 64 ]
La prassi di alcune autorevoli istituzioni
bibliotecarie, tra cui la Library of
Congress, continuano invece a privilegiare
il richiamo.
D. Batty, WWW - Wealth, Weariness or
Waste. Controlled vocabulary and thesauri
in support of online information access, in
«D-Lib Magazine», November 1998
<http://www.dlib.org/dlib/november98/11batty.html>
[ 65 ]
Cfr. W. Arms, Automated Digital
Libraries: How Effectively Can
Ciuccarelli, Innocenti
|
[ 69 ]
Il sistema decimale ICONCLASS
Sistemi conoscitivi per il design: una proposta metodologica
| 119
(<http://iconclass.let.uu.nl/>) è stato ideato
da Henri van der Waal fra il 1948 e il ‘50
presso l’Istituto di Storia dell’arte
dell’Università di Leida ed applicato per
ordinare iconograficamente la locale fototeca. Attualmente viene adottato quale standard catalografico internazionale per il settore iconografico. ICONCLASS è composto da 10 grandi classi nelle quali sono
comprese oltre 22.000 raffigurazioni che
descrivono i temi principale dell’iconografia
storico-artistica occidentale. Questa classificazione è stata scelta dall’Istituto Centrale
per il Catalogo e la Documentazione
(ICCD) del nostro Ministero per i Beni e le
Attività Culturali quale supporto terminologico per la descrizione iconografica del
soggetto. L’ICCD ha tradotto integralmente
il Sistema e in accordo con il Iconclass
Research & Development Group (IRDG)
ha publicato il sistema in italiano e prodotto un CD-ROM per la ricerca in automatico dei soggetti.
[ 70 ]
La NML è utilizzata dal servizio OMNI
(Organising Medical Networked
Information) <http://www.omni.ac.uk/>
[ 71 ]
I codici di classificazione Ei sono usati dalla
svedese Engineering Electronic Library
(EELS) <http://eels.lub.lu.se/> e dall’inglese
Edinburgh Engineering Virtual Library
(EEVL) <http://eevl.icbl.hw.ac.uk/>
[ 72 ]
<http://www.zblmath.fizkarlsruhe.de/class/index.html>
[ 73 ]
<http://www.acm.org/>
120 |
[ 74 ]
Alcuni di questi schemi di classificazione
hanno una struttura gerarchica, come la
DDC o la UDC, altri invece elencano sia
concetti singoli che composti e in pratica
enumerano tutti i possibili soggetti che si
prevede possano essere studiati nei documenti, come la LLC. Qualche schema,
come la UDC, permette l’espressione di
un numero virtualmente infinito di combinazione di soggetti nei documenti utilizzando delle faccette.
[ 75 ]
<http://www.getty.edu/research/tools/vocabulary/aat/>
[ 76 ]
<http://www.iconclass.nl/>
[ 77 ]
Cfr. A. Maple, Faceted access: a review of
literature, BCC95/WG FAM/2, MLA
Clearinghouse, 1995
<http://theme.music.indiana.edu/tech_s/m
la/facacc.rev> e Foskett, cit., capitoli 5-6.
[ 78 ]
Cfr. il manuale di J. M. Aitchinson, NISO
Z39.19: Standard for Structure and
Organization of Information Retrieval
Thesauri, 1998
<http://www.jelem.com/z39.htm>; F.
Brown, Vocabulary Links:// Thesaurus
Design for Information Systems - seminar
by Dr. Bella Hass Weinberg, 1998,
<http://www.allegrotechindexing.com/article02.htm>. Bella Hass è autrice della
prima bozza del NISO National Standard
on Thesaurus Construction, pubblicato
nel 1994.
[ 79 ]
[ 83 ]
UNI ISO 2788 Linee guida per la
costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985. Metodi
per l’analisi dei documenti, la determinazione del loro soggetto e la selezione
dei termini di indicizzazione;
Guidelines for the Construction, Format,
and Management of Monolingual
Thesauri Document Number:
ANSI/NISO Z39.19-2003, National
Information Standards Organization, 28
August 2003; Guidelines for Indexes and
Related Information Retrieval Devices
Document Number: NISO TR-02-1997,
National Information Standards
Organization, 1 January 1997.
<http://www.getty.edu/research/tools/vocabulary/>
[ 80 ]
La differenza tra i thesauri e gli schemi di
classificazione non è nella loro rappresentazione. I thesauri progettati in modo appropriato avranno sia una rappresentazione
come elenco alfabetico che come classificazione, e ogni classificazione bibliografica
definisce relazioni tra i concetti e una sorta
di indice alfabetico per soggetto.
[ 84 ]
M. Hearst, User interfaces and visualization, in R. Baeza-Yates & B. Ribeiro-Neto
(Eds.), Modern Information Retrieval,
Addison-Wesley, MA, 1999, pp. 257-325.
[ 85 ]
P. Harpring, How Forcible are Right
Words!: Overview of Applications and
Interfaces Incorporatine the Getty
Vocabularies, paper, Museum and the Web
Conference,1999, <http://www.archimuse.com!mw99/papers/harpring/harpring.ht
ml>. Cfr. inoltre P. Harpring, User’s Guide
to the AAT Data Releases, J. Paul Getty
Trust, 2000 e M. Doerr, Semantic
Problems of Thesaurus Mapping, in
«Journal of Digital Information», 2001
<http://jodi.ecs.soton.ac.uk/Articles/v01/i0
8/Doerr/#_Toc497798905>
[ 86 ]
Cfr. ad esempio SPIRO Online Visual
Database
(<http://www.lib.berkeley.edu/ARCH>)
The University of California at Berkeley
Architecture Slide Library’s SPIRO Online
Visual Database.
Guidelines for Authority and Reference
Entries, recommended by the Working
Group on and International Authority
System, approved by the Standing
Committee of the IFLA Section on
Cataloguing and the IFLA Section on
International Technology, IFLA
International Office for UBC, London
1984.
[ 82 ]
[ 87 ]
Come nel caso dell’Image Directory
(<http://www.imagedir.com/>) che presenta
link diretti a AAT e ULAN web browsers, o
il National Graphic Design Image Database
(http://ngda.cooper.edu/), che utilizza l’AAT
per descrivere gli attribute dei documenti.
G. Badalamenti, L’authority control in un
contesto universitario: una scelta
obbligata, presentato a The authority control in the Academic context: a Hobson’s
choice, in Proceedings International
Conference Authority Control: Definition
[ 81 ]
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 121
and International Experiences, Florence,
Italy, <http://eprints.rclis.org/archive/00000339/02/badalamenti_ita.pdf>
[ 88 ]
B. Tillett, International shared resource
record for controlled access, in Authority
control in the 21st century: an invitational
conference, March 31-April 1, 1996
<http://www.oclc.org/oclc/man/authconf/t
illett.htm>
[ 89 ]
Cfr. J.F. Sowa, Building, Sharing, and
Merging Ontologies, 18 July 2003,
<http://www.jfsowa.com/ontology/ontoshar.htm>; N. Crofts, P. Le Bœuf, O.
Artur, Ontology, Semantic Web and
Libraries, in Semantic Web and Libraries.
26 Library Systems Seminar, ELAG,
Rome, 17-19 April 2002,
<http://www.ifnet.it/elag2002/papers/pap9
.html>; C. Behrens, V. Kashyap, The
‘Emergent’ Semantic Web: A Consensus
Approach for Deriving Semantic
Knowledge on the Web, Telcordia
Technologies, 2001,
<http://lsdis.cs.uga.edu/~kashyap/publications/SWWS01.pdf>
[ 90 ]
Thomas R. Gruber: «An ontology is an
explicit specification of a conceptualization» (una concettualizzazione, in qeusto
contesto, si riferisce ad un modello astratto
di come le persone pensano circa le cose
del mondo, di solito ristretto ad una particolare area tematica) Una specificazione
esplicita significa che ai concetti e alle relazioni del modello atratto vengono dati termini e definizioni specifiche; Nicola
Guarino: «An ontology is a logical theory
accounting for the intended meaning of a
122 |
formal vocabulary»; James Hendler: «An
ontology is a formal definition of a body
of knowledge»; John F. Sowa: «An ontology is a catalog of the types of things that
are assumed to exist in a domain of interest D from the perspective of a person
who uses a language L for the purpose of
talking about D».
[ 91 ]
A. Lozano-Tello, A. Gómez-Pérez, E. Sosa,
Selection of Ontologies for the Semantic
Web, in «Lecture Notes in Computer
Science», Springer-Verlag Heidelberg, vol.
2722 / 2003, pp. 413 – 416.
[ 92 ]
M. Gruninger, J. Lee, Ontology applications and design: Introduction, in
«Communications of the ACM», vol. 45,
n. 2, 2002, pp. 39-41.
[ 93 ]
T. Berners-Lee, J. Hendler, O. Lassila, The
semantic Web, in «Scientific American», n.
284, May 2001, pp. 34–43.
4
Un sistema conoscitivo per la didattica e la ricerca del design
in ambito universitario
Perla Innocenti
A library, to modify the famous metaphor of Socrates,
should be the delivery room for the birth of ideas
Norman Cousins
4.1 Introduzione
Il presente capitolo si propone di affrontare le problematiche relative alla formazione di un knowledge base, come strumento di supporto al progetto di
Disegno Industriale. Si tratta di un tema particolarmente complesso poiché, a
fronte di una operatività ampiamente riconosciuta, e che in ogni caso segue
percorsi le cui procedure vanno progressivamente affinandosi sulla base di
uno schematismo generalmente evidente e chiaro, il progetto vive la permanente scissione tra il sistema delle informazioni e delle conoscenze. Tale sistema info-conoscitivo costituisce la condizione a priori dell’atto creativo ed esecutivo e la definizione del progetto, che però raramente si riesce ad appoggiare ad esso.
Ciò che caratterizza il problema è la forte differenziazione tipologica di dati, informazioni e conoscenze 1 relative ai prodotti, ai processi e ai progetti – siamo infatti
solitamente in presenza di modelli, immagini, video, disegni, testi … –, e la loro
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 123
sostanziale disomogeneità, che non ne permette la fruibilità immediata e la facile
trasferibilità. Inoltre, mentre le informazioni e le conoscenze cui si appoggia il
progetto di Disegno Industriale sono prevalentemente di tipo manipolativo-visuale, le tradizionali metodologie di catalogazione e di accesso ai dati seguono indicizzazioni prevalentemente di tipo testuale.
Come risultato, i materiali del Disegno Industriale giacciono frammentati e
poco visibili, giacenti in stato di materiale passivo e difficilmente utilizzabile
come supporto ad ogni ulteriore elaborazione (di progetto e/o di studio).
L’obiettivo in questa sede è dunque quello di mostrare i passaggi metodologici
atti a creare una possibile struttura di un sistema informativo e conoscitivo in
quest’ambito.
L’ipotesi principale alla base di questo capitolo – certo fortemente parzializzante ma, a mio avviso, necessaria per definire una procedura circoscritta e
circoscrivibile – è il riferimento non al progetto in senso ampio, ma alla fase
metaprogettuale, «individuata nella predisposizione di strumenti e modelli
che operano su risorse concettuali e conoscitive, nell’individuazione di una
metodologia, e nell’organizzazione – attraverso strumenti e risorse – di nuove
possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di
offerta didattica» 2, obiettivi perseguibili proprio attraverso un’attività di ricerca, acquisizione, sistematizzazione di dati, informazioni, conoscenze.
La seconda ipotesi è quella dell’adozione di sistemi online, grazie alle loro
caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità tipologie di
documenti, di formati e di linguaggi.
Il filo rosso seguito è quello che fa uso dei sistemi in ambienti di rete come
strumento di archiviazione, restituzione, disseminazione dell’informazione sul
design. Punto di partenza sono le modalità di restituzione di ciò che è oggi
identificabile come il sistema conoscitivo per il design, così come sono presentate nei percorsi accademici e percorsi professionali. Una prima area di
ricerca riguarda invece la tipologia dei dati che il progetto di design produce
quotidianamente e di cui fa uso, a fronte della quale si tenterà di esporre il
procedimento con cui si realizzano oggi i knowledge base online per altri
campi affini della conoscenza. Infine, si cercherà di mostrare una prima serie
di ipotesi di intersezioni, prefigurando i caratteri di un sistema conoscitivo
per il design. Il testo non tratterà dei sistemi informatici utilizzati per due
motivi fondamentali: non sono il nostro campo di competenze, e neppure
pensiamo sia prospettabile un sistema informatico – che è un progetto di
breve periodo – in assenza del progetto della struttura informativa. Ciò che
risulta evidente, infatti, è che un sistema conoscitivo deve essere sviluppato
innanzitutto in termini di metodologie, procedure ed infine di tecnologie: la
124 |
rete come si sa è volatile, la tecnologia soggetta a rapida obsolescenza, è facile
terminare nel nulla... e l’efficacia di un sistema di accesso all’informazione e
alle conoscenze è direttamente proporzionale all’intelligenza impiegata per
organizzarlo.
4.1.1 Restituzione online delle informazioni relative al design
A fronte delle enormi potenzialità della rete, come è stato più volte osservato
é facile perdersi nell’oceano del Web senza un’organizzazione dell’enorme
massa di risorse che ogni giorno vengono ad aggiungersi e a stratificarsi a
quelli già presenti. Un primo tentativo di progressiva articolazione e circolazione dell’informazione online oltre il semplice accumulo è quello del portale,
che rappresenta, secondo un’efficace descrizione di Howard Strauss un «hub
from which users can locate all the Web content they commonly need» 3.
Verticali-specializzati oppure orizzontali-generali 4, organizzati in directory, i
portali cercano di rispondere alla necessità di una qualche forma elementare
di stabilità, di sicurezza trasmissiva e di catalogazione, che permetta il veloce
ritrovamento delle informazioni: nient’altro che l’antico concetto di catalogo
cartaceo, sfruttando però uno dei maggiori vantaggi del Web, cioè la possibilità di collegare nuove risorse con materiali retrospettivi e ampliare costantemente la rete dei documenti collegati.
Soprattutto in tempi recenti, e in ambiti disciplinari in cui le informazioni e
le conoscenze non sono direttamente e unicamente letterarie (ad esempio per
tutte le arti visuali, o per quelli legati alla costruzione in senso lato, o per le
discipline scientifiche che fanno ampio uso di sistemi documentali visuali), al
problema dell’accumulo e della catalogazione si è affiancato però quello della
modalità di restituzione dell’informazione, che non si limita a semplici stringhe bibliografiche o ad apparati testuali ma che richiede la compresenza di
immagini, disegni, video, modelli, articolati secondo una struttura che organizzi modi e forme di questa trasmissione e di questa fruizione.
Questo ha portato innanzi due nuove problematiche:
- il modo di veicolare le informazioni attraverso specifici media;
- il modo di richiamare le informazioni non partendo soltanto da indicizzazioni di materiali testuali ma anche visuali (cfr. paragrafo 2.2.5).
Nel caso del design, possiamo tranquillamente affermare che in questo panorama stiamo vivendo un’epoca delle origini, ancora con poca informazione
accumulata, di solito marginalmente rappresentata (anche se spesso ben presentata). In ogni caso la tipologia di informazione offerta è quella della sintesi
a-priori estratta o anche completa replica, semplicemente restituita in forma
sequenziale navigabile e mancante di qualunque forma di strutturazione, relativa sia all’informazione di base che alla sua rielaborazione.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 125
Le informazioni sul design si esauriscono dunque in quanto viene oggi
mostrato sul Web? Evidentemente no, trattandosi di conoscenze di carattere
manipolativo-visuale strettamente collegate all’esperienza e in quanto tali difficilmente proceduralizzabili, oltre che provenienti da forme di apprendimento diversificate. Ciò che, infatti, è presentato è in forma marginale materiale
per il metaprogetto, non essendo il prodotto del processo progettuale, ma di
solito semplicemente la sua ‘demo’ o una sua fotografia da lontano.
Su questi siti Web e portali manca la gestione delle risorse presenti secondo
schemi di metadati coerente e organizzato, l’individuazione delle chiavi di
accesso (catalogazione sistematica secondo categorie e problematiche trasversali; indicizzazione, thesauri) per le varie tipologie di utenti e di bisogni informativi identificati, la coordinazione con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali.
Scorrendo rapidamente le principali tipologie espositive e contenutistiche
secondo cui viene articolata sul Web l’informazione sul design, si possono
attualmente circoscrivere per fini esemplificativi due grandi bacini di fornitori. Da un lato, associazioni di categoria e grandi organizzazioni istituzionali o
consorzi no-profit internazionali (ad esempio il canadese Design Exchange,
l’inglese Design-Council, il Korean Institute of Design Promotion, le americane ICSID e Corporate Design Foundation), con finalità educative e di
ricerca e forti legami con le istituzioni, si fanno carico della promozione e diffusione culturale e di sensibilizzazione sul design, sull’innovazione e sulla produzione nazionale. Queste realtà hanno dato vita a portali verticali di riferimento per aziende, professionisti e persone interessate al design, la cui caratteristica é quella di essere infrastrutture informative specializzate in una specifica categoria di informazione, offrendo una serie di servizi connessi: organizzazione di seminari, corsi di formazione, eventi e concorsi; realizzazione di
indagini economico-scientifiche sul design e consulenze; promozioni; spazi di
lavoro virtuali; pubblicazioni. I contenuti, a volte suddivisi per categorie merceologiche o per tematiche inerenti al progetto, spaziano da fonti di informazioni ed eventi ad interviste, da virtual gallery e virtual space a portfolio e
case study.
A fronte della gestione centralizzata di questi operatori, in Italia, dove vi é
una importante cultura progettuale, manca una realtà istituzionale di coordinamento nel veicolamento dell’informazione relativa al metaprogetto di
design. Sono invece presenti portali di carattere commerciale come Design
Italia, e-magazine come Designboom, siti specializzati come E-interiors o
comunità virtuali come Design Villane 5.
L’organizzazione delle informazioni in questi siti e portali avviene secondo
sequenze lineari di dati, non strutturati secondo gli standard catalografici
126 |
internazionali. La consultazione avviene in genere attraverso un elenco alfabetico di intestazioni o un menu di opzioni presenti nella videata. Laddove vengono adottate, le tecniche di information retrieval riportano le imprecisioni
dei motori di ricerca nei livelli più complessi del linguaggio.
In un’indagine su circa cento siti Web di facoltà e dipartimenti nazionali e
internazionali nell’ambito del design, svolta da chi scrive nel 2001 con
l’obiettivo di individuare la presenza di forme organizzate di esposizione di
varie tipologie di dati nell’ambito delle attività didattiche e di ricerca, é stato
rilevato come non siano presenti veri e propri sistemi di informazioni strutturate, ma collezioni di immagini e di dati spesso multimediali. Vengono in
particolare privilegiate alcune forme specifiche di presentazione come ad
esempio raccolte tematiche oppure portfolio individuali dei lavori di studenti
e docenti, che negli ultimi anni hanno raggiunto una crescente popolarità e
che costituiscono un incentivo al miglioramento della didattica e agli obiettivi
della facoltà. Una tendenza che ha peraltro portato alla nascita degli electronic
institutional portfolio 6, sia come interfaccia di dialogo (interattivo, evidenziale, visuale) interno e con i diversi stakeholder, che come mezzo per focalizzare
i propri obiettivi e le aree di competenze accademiche.
La maggior parte delle facoltà e dei dipartimenti presentano delle virtual gallery collettive, relative ai lavori e ai progetti realizzati da studenti e vari membri della comunità accademica: le immagini sono accompagnate da una serie
di informazioni cha vanno dal nome dell’autore al programma utilizzato
all’anno di corso. Nel caso dei portfolio un esempio interessante é quello della
School of Industrial Design della University of Montreal, che espone ogni
anno i progetti presentati dagli studenti al termine del corso di studi, e consultabili on-line tramite una navigazione ipertestuale. Gli studenti hanno
inoltre la possibilità di inserire on-line anche precedenti lavori, la loro fotografia e dei riferimenti per un eventuale contatto.
Ad eccezione dell’Electronic Visualization Laboratory-EVL della University of
Illinois di Chicago e dell’Istituto Superiore per le Industrie Artistiche di Firenze,
i materiali didattici e di ricerca non sono sistematicamente archiviati. Un tentativo significativo di strutturazione delle informazioni secondo finalità didattiche
è quello del Taubman College of Architecture and Urban Planning della
University of Michigan, che lavora in tandem con un’unità della biblioteca di
ateneo, la Digital Library Production Service. Il College crea le immagini digitali, le archivia in un database e le conserva su CD-ROM: una copia dei lavori
viene inviata ogni mese alla Digital Library, che si occupa di inserire i dati
appropriatamente rielaborati sul server del College, nel sito della Union Library
Visual Resources Collection, con accesso parzialmente limitato. In tal modo gli
utenti che utilizzano i computer dell’Università possono effettuare ricerche onCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 127
line e visualizzare sia la stringa di catalogazione, opportunamente elaborata dai
bibliotecari, che l’immagine stessa. Poiché tuttavia «just as artists are reluctant
to ‘put their work on the web’, students too are timid about it» 7, è prevista la
videoregistrazione in digitale delle fasi di progettazione dei lavori degli studenti.
4.1.2 I giacimenti documentali del design: il caso della Facoltà del
Design del Politecnico di Milano
In base a questa veloce ricognizione il panorama documentale sembrerebbe
sostanzialmente indicare degli output modesti, ma se andiamo ad osservare
con più di attenzione, ad esempio, che cosa si produce oggi come materiali
nell’ambito della didattica e della ricerca nella Facoltà del Design del
Politecnico, le categorie dei materiali individuati da chi scrive indicano:
- una netta prevalenza della documentazione visuale rispetto a quella
testuale. Le informazioni visuali nella didattica e nella ricerca occupano un posto sempre più rilevante: archivi multimediali, video di conferenze, seminari ed incontri dedicati a temi specifici (lezioni di specialisti, scambi tra i docenti e il pubblico), educazione e tirocinio a
distanza (corsi on-demand, lezioni di tipo hands-on, classi virtuali);
- una quasi totalità di materiale prodotto in forma digitale (solo talvolta successivamente stampato o prototipizzato, in ogni caso a partire da file) (Fig. 1);
- una straordinaria ricchezza di forme di rappresentazione che corrispondono ad altrettante tipologie di risorse per il progetto:
- materiali grafici e multimediali (disegni 2D e 3D, video, movie,
siti Web, immagini fisse e in movimento, walk-through, VRML,
interviste…);
- materiali testuali (prevalentemente documenti della cosiddetta
‘letteratura grigia’, che possono includere, ma non sono limitati
a, i seguenti tipi di materiali: report (pre-print, report preliminari
e di avanzamento, report tecnici, report statistici, memoranda,
report sullo stato dell’arte, report su ricerche di mercato, ecc.),
tesi di laurea e di dottorato, atti di conferenze, documentazione
tecnica e standard, traduzioni non commerciali, bibliografie,
documentazione tecnica e commerciale, documenti ufficiali non
pubblicati, ricerche e studi di settore, case study, presentazioni,
materiale informativo, normative);
- campioni, oggetti e semilavorati;
- eterogeneità di formati di file grafici (.3ds; .ai; .avi; .dgn; .dwg; .dxf;
.e2; .e3; .eps; .gif;.html; .iges; .jpg; .lp; .ma; .max; .mov; .mpg; .mts;
.obj; .pdf; .ppt; .psd; .rtf; .swf; .tiff; .wire; .wrl; doc; dxf;...);
128 |
-
un’altrettanto ricca varietà di modalità di produzione (seppure
sempre all’interno del desktop computer), collocabili nelle
macrocategorie di documenti prodotti per utilizzo interno oppure on demand per usi esterni;
- una tipologia diversificata di fornitori e utenti di dati e conoscenze:
studenti, docenti, ricercatori, professionisti, aziende....;
- modalità di acquisizione e conservazione che non presentano attualmente una procedura standardizzata, di modo che la maggior parte
dei materiali risulta spesso ‘invisibile’ alla consultazione e senza una
collocazione definita e organizzata nel tempo.
Il contesto di tale panorama documentale è quello della Classe delle lauree
specialistiche in Disegno Industriale del Politecnico di Milano, il cui obiettivo
è la formazione di una figura di progettista di alto profilo culturale capace, di
confrontarsi sia con le dinamiche di innovazione che attengono il prodotto
finale (negli aspetti tecnico-produttivi, tecnico-funzionali e formali), il prodotto intermedio (materiali, semilavorati, componenti) e i processi che ne
accompagnano il ciclo di vita (progettuali, produttivi, distributivi, d’uso); sia
con le innovazioni socio-culturali, di consumo e di mercato che hanno diretta
influenza sulle strategie produttive, comunicative, distributive che concorrono
[Fig. 1] Esempi di output digitali prodotti nell’ambito della Facoltà del Design, Politecnico di Milano
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 129
alla definizione dell’identità dell’impresa (dalla progettazione di sistemi di servizio a quella dei luoghi e delle modalità di vendita); sia infine di intervenire
progettualmente sul ‘contesto’ fisico di produzione e d’uso dei prodotti (dagli
aspetti qualitativi che contribuiscono a migliorare la percezione e la fruizione
di un ambiente ai requisiti ambientali di prodotti, processi produttivi e di
consumo finalizzati a strategie di ‘sostenibilità’). Ciò comporta una solida formazione, che raccolga e finalizzi al progetto oltre agli aspetti metodologicooperativi e teorico-scientifici della cultura del disegno industriale, anche gli
ambiti interdisciplinari (dalla programmazione e organizzazione della produzione al marketing, dall’analisi settoriale e intersettoriale all’economia aziendale, dalla ingegneria dei materiali all’elettrotecnica ed elettronica, dall’ingegneria meccanica e delle tecnologie di lavorazione alla ricerca operativa dalla
ricerca artistica e morfologica alla semiotica e linguistica, dall’estetica alle
scienze dell’informazione, dalla psicologia cognitiva alle discipline dell’interattività sensoriale fra uomo e sistema artificiale).Questa ricca articolazione di
dati è dunque notevolmente maggiore di ciò che solitamente ‘presentano’ i
portali, e proprio per la sua complessità richiede forme di archiviazione, catalogazione, restituzione, ‘illustrazione’ che devono necessariamente non solo
attingere a tutte le metodologie e potenzialità attuali, ma in più cercare di svilupparne capacità e qualità al fine di poter richiamare informazioni di una
certa natura con metodi di ricerca ed esposizione dotati di un grado di iconicità e similarità appartenenti a quella stessa natura.
La documentazione nel design presenta quindi un’ampia gamma di tipologie
di materiale, variabile a seconda del contesto, che comprende le forme più
diverse. Ogni archivio o giacimento documentale possiede un ‘tassello’ diverso
della galassia della documentazione del design, che è funzionale agli interessi e
al campo di indagine che gli sono propri. Le differenze tra le varie raccolte,
inoltre, non derivano soltanto dalle diversità disciplinari o tematiche ma sono
spesso determinate anche dalle diversa finalità con cui sono state costituite. Vi
sono archivi e giacimenti documentali che si definiscono all’interno di un progetto di ricerca: la selezione dei documenti raccolti ma anche la struttura delle
schede catalografiche e la definizione delle chiavi di ricerca è determinata dagli
obiettivi stessi d’indagine; sono spesso interessati al processo, dunque anche
alla documentazione di preparazione, di studio, di analisi, e/o alle varie fasi di
elaborazione; altre volte ricostruiscono singole vicende di progettazione, raccogliendo anche documentazione grafica e normativa correlata. Esistono poi gli
archivi di consultazione presso centri di documentazione universitari, che svolgono la funzione di supporto e reference alle attività didattiche e di ricerca:
dovendo provvedere ad una documentazione fattuale di riferimento, spesso
non hanno interesse per la fase preliminare o di elaborazione. Infine gli archivi
130 |
o fondi storici, che nella maggioranza dei casi conservano l’insieme dei documenti raccolti nel corso della loro attività da designer e architetti famosi: vi si
troverà a volte un’ampia documentazione della fase di elaborazione per i progetti da loro curati, corredati da sporadici e incompleti documenti sugli strumenti a partire da cui e per cui tali progetti sono stati elaborati.
La documentazione del design assume quindi forme molteplici: complessi e
diversificati sono i documenti che costituiscono un progetto, così come gli
interessi e le finalità degli archivi del design e le logiche di catalogazione e di
ricerca di questo tipo di documentazione, che in ambito bibliotecario rientra
spesso nel settore della letteratura grigia.
In generale, le pubblicazioni della letteratura grigia sono di tipo non convenzionale, fuggevole, a volte effimero, e per loro natura ai bibliotecari risultano
di difficile acquisizione e messa a disposizione al pubblico.
In questo quadro così complesso si è tentato di far luce sulle differenze e sui
bisogni informativi comuni verso la definizione di un progetto di catalogazione
per questo settore.
I giacimenti documentali del design sono insieme fortemente virtuali (il knowhow, i processi, l’organizzazione, input e output digitali) e materiali (i prodotti
di design, i materiali del design), a metà tra le collezioni bibliografiche, raccolte di letteratura grigia, collezioni museali e archivi. Dal punto di vista di chi si
occupa della gestione di tali giacimenti, i tratti in comune con la documentazione d’archivio sono molteplici, dalla genesi dei documenti alla specificità del
catalogo. «L’archivio – come ha scritto Ezio Lodolini – è un complesso organico di documenti prodotti nel corso di un’attività pratica, amministrativa, giuridica; il documento, singolarmente considerato, è privo di autonomia e ha scarsissimo valore, mentre ne ha uno grandissimo come parte di un complesso,
come anello di una catena; lo scopo giuridico, amministrativo e pratico è
determinante per la formazione dell’archivio. L’archivio è l’antitesi di una raccolta o collezione» 8. Anche la «spontaneità di formazione dell’archivio», come
l’ha definita Giuseppe Plessi 9, è un elemento che non è possibile ravvisare in
altri ambiti, data la volontarietà della formazione di una biblioteca, di un
museo o di altri tipi di collezioni 10. La redazione dell’inventario di un archivio
quindi non può mai essere una mera somma di documenti.
Spesso negli archivi, così come nella documentazione di progetto, non è possibile o è difficile ricondurre la documentazione ad una organizzazione originaria, capire i meccanismi di creazione. Ma nel design vi è la necessità vitale
di riutilizzare i documenti e le conoscenze creati e accumulati nelle varie attività di progetto. Una volta compresi i nuovi attori e i processi della catena
documentaria, la creazione di strutturazione ampia e la compilazione di ricchi
indici rappresenta una notevole possibilità di accedere a giacimenti documenCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 131
tali eterogenei e complessi come quelli descritti all’inizio di questo paragrafo.
Il comportamento nell’utilizzo delle informazioni (user modeling 11) per l’apprendimento universitario può essere identificato applicando le teorie educative. L’interattività è stata indicata come una componente rilevante della
didattica e dell’insegnamento del design 12: l’approccio learning-by-doing di
John Dewey 13, adottato come metodologia didattica del Corso di Laurea in
Disegno Industriale, è spesso utilizzato per fornire nelle teorie pedagogiche
all’uso dei computer per progettare ambienti didattici interattivi.
Wilson definisce quelli di apprendimento interattivo degli ambienti che permettono «the electronically integrated display and user control of a variety of
media formats and information types, including motion video and film, still
photographs, text, graphics, animation, sound, numbers and data. The resulting interactive experience for the user is a multidimensional, multisensory
interweave of self-directed reading, viewing, listening, and interacting,
through activities such as exploring, searching, manipulating, writing, linking, creating, juxtaposing, and editing» 14.
L’interattività è altresì emersa come idea unificante e collante in diversi progetti di biblioteche digitali in ambito universitario 15: Arms ha per esempio
notato che le biblioteche «have always supported interactions with the fund
of knowledge, interactions that come in many shapes and sizes... Interacting
with knowledge is what life-long learning is all about» 16. Nelle biblioteche
digitali, inoltre, le interattività hanno il potenziale di operare a vari livelli:
l’utente e il documento digitale, l’utente e le collezioni digitali, l’utente e i
servizi, l’utente e la biblioteca come entità, l’utente e un altro utente.
4.1.3 Sistemi informativi e sistemi conoscitivi in ambienti di rete
Genericamente, sotto la categoria di sistemi informativi 17si possono classificare tutti i sistemi tecnologici che manipolano, conservano, processano e distribuiscono un’informazione che ha o si aspetta possa avere un impatto sul comportamento umano, organizzato all’interno di un contesto reale di azione.
Essi sono essenzialmente implementati per mettere a disposizione di una particolare classe di utenti una serie di servizi informativi con i quali interagire
per il soddisfacimento dei loro più svariati bisogni informativi 18. La maggior
parte dei sistemi informativi attualmente in uso sono stati sviluppati in accordo con una serie di modelli normativi tesi a descrivere i processi cognitivi di
problem solving e decision making 19. L’assunzione implicita alla base di questi
sistemi é che i bisogni informativi degli utenti siano statici e che il processo di
accesso alle informazioni consista nella capacità di esternalizzare la loro mancanza di informazione e di ridefinire successivamente la domanda iniziale,
prima di recuperare ciò di cui si ha bisogno.
132 |
In molti ambiti universitari tecnico-scientifici sono stati elaborati dei sistemi
informativi d’area disciplinare, che si stanno evolvendo verso una sempre
maggior integrazione transnazionale. L’affermazione di strategie di Knowledge
Management – in ambito aziendale ma anche in organizzazioni come le università (cfr. paragrafo 1.7) – e gli studi e le indicazioni provenienti dalle scienze cognitive suggeriscono di tentare la trasformazione di questi sistemi informativi in sistemi cognitivi d’area disciplinare.
Tutte le organizzazioni creano conoscenza. Nella maggior parte dei casi, però,
questo processo è casuale, stocastico e come tale imprevedibile 20. È però senz’altro possibile modificare le cose affinché la creazione e la diffusione (o disseminazione) della conoscenza escano dall’accidentale, dal fortunoso e dall’episodico per sistematizzarsi in organizzazioni e in processi più razionali ed
efficaci, e che nel medesimo tempo riescano a salvare libertà di espressione e
di creazione insieme con la stabilità e la sicurezza trasmissiva di un sistema di
comunicazione omogeneo e controllabile.
Nel passaggio di informazione e di conoscenza che avviene fra autore e lettore, come ha più volte puntualmente osservato Bogliolo 21, è possibile e può
essere vantaggioso frapporre una struttura cognitiva che organizzi modi e
forme di questa trasmissione e di questa fruizione.
Le biblioteche e i centri di documentazione da tempo si basano su un rapporto triadico tra documenti, meccanismi di mediazione semantica e utenti,
ponendo l’enfasi sugli ultimi due elementi del rapporto. L’intermediazione
delle scienze dell’informazione, operata dai bibliotecari-documentalisti, nei
confronti e in collaborazione con gli utenti, allo scopo di creare una struttura
cognitiva (la learning library 22) capace di facilitare l’apprendimento di tutti i
suoi membri e di trasformare se stessa continuamente, come struttura e come
organizzazione, con il modificarsi delle esigenze cognitive dei suoi membri.
La letteratura sui sistemi cognitivi è molto ampia. Nati nell’ambito dell’intelligenza artificiale, sono usciti dalle stanze dei ricercatori quando l’industria ha
avuto bisogno di nuovi strumenti per far fronte a nuove sfide del mercato. I
tempi sono più che maturi perché queste realizzazioni, sperimentate nel mondo
del profitto, tornino al mondo universitario e della ricerca, per la progettazione
di nuovi e migliori servizi per le sue produzioni scientifiche e culturali.
Un sistema cognitivo ha l’obiettivo di fornire mezzi e strumenti (logici e tecnologici) per generare interpretazioni dirette del mondo reale, piuttosto che
delle sue interpretazioni tramite i documenti. Come ha acutamente osservato
Bogliolo il compito di un sistema cognitivo è quello di «gestire il corto-circuito fra autore e lettore, mediante un’organizzazione del lavoro che integra le
attività dell’autore e quelle del bibliotecario-documentalista. Succede, così,
che la conoscenza tacita che è posseduta dall’autore, e che è fonte creatrice del
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 133
documento, non possa essere integralmente trasferita in quest’ultimo: il documento rinvierà, alluderà, in misura maggiore o minore, a quella fonte, ma la
natura stessa del documento, sia pur multimediale, non potrà offrirne una
registrazione esplicita e completa» 23.
L’organizzazione è ancora e sempre quella della biblioteca o del centro d’infor-mazione e documentazione, non importa quanto tecnologicamente avanzato. Il professionista dell’informazione rimane comunque un intermediario,
ma su un piano superiore di ricchezza ontologica e di efficacia cognitiva, e
dunque anche informativa: non si limita a moltiplicare le porte di accesso
semantico e semiotico a una base di dati statica, ma a creare chiavi interpretative del pensiero che fluisce dai fornitori dei documenti agli utenti.
Il problema nella realizzazione e nell’utilizzo di questi sistemi non è tanto
strumentale, giacché le tecnologie ICT forniscono un aiuto rilevante nel perseguimento di questi obiettivi, grazie alle loro caratteristiche intrinseche di
capacità di creazione, elaborazione, immagazzinamento e scambio in breve
tempo di grandi quantità di informazioni in tutte le loro forme (dati, suoni,
immagini, multimedia). Le ICT e le loro estensioni Web-enabled permettono
un nuovo tipo di interazione e di disponibilità dell’informazione: la sua teletrasferibilità a distanza. Infine, sono in grado di supportare quasi completamente ogni tipo di informazione visuale, permettendo tramite i processi di
vettorializzazione e/o discretizzazione di rendere l’informazione richiamabile
non solo con le tradizionali tecniche di indicizzazione testuale, ma proprio in
base a caratteristiche visuali (colori, geometrie, texture, ecc.). Il Web stesso sta
vivendo una profonda autoriflessione in senso semantico ad opera del suo
creatore, Tim Berners Lee 24, al fine di creare sistemi aperti di accesso all’informazione che siano non solo semplicemente navigabili, ma completamente
strutturabili e richiamabili tramite l’utilizzo del XML.
Come spesso capita, si tratta di un problema di mentalità, poiché i sistemi
knowledge-based sono accompagnati da una fama non positiva dovuta ad
un approccio ingegneristico che ne ha appiattito e banalizzato la pluridimensionalità e pluridirezionalità. Per costruire un sistema cognitivo orientato a una disciplina, in pratica occorrono un progetto, un finanziamento,
delle risorse tecnologiche e un gruppo di lavoro organizzato, interdisciplinare, composto da esperti del dominio (docenti e ricercatori della materia),
esperti dell’informazione (bibliotecari e documentalisti), e esperti della tecnologia dell’informazione (ingegneri ed esperti d’intelligenza artificiale): in
sostanza, le tre componenti della ‘piramide di conoscenza dell’organizzazione intelligente’ di Choo Chun Wei 25.
Il metodo lavoro è indicato dalle nozioni di Knowledge Management elaborate da Nonaka, di processi di creazione di conoscenza top-down, bottom-up
134 |
e middle-up-down. Quest’ultimo approccio presenta un modello iterativo di
lavoro comune continuo (di cui non sempre gli attori sono consapevoli)
attraverso il quale la conoscenza viene realmente creata. I diversi attori di
questo modello tendono a trattare tali materiali secondo svariate logiche ed
esigenze: gli autori per disseminare e condividere conoscenze e informazioni,
i bibliotecari e i documentalisti per creare un universo di informazioni correlate tra loro, gli utenti per recuperare documenti e/o informazioni a partire
da esigenze di studio e di ricerca oppure ragioni professionali. Le loro azioni
raramente si configurano come interazioni: pertanto, seppur inconsapevolmente, questi soggetti contribuiscono ad aumentare il ‘disordine’, l’entropia
nell’universo catalografico. Il loro coordinamento in un sistema conoscitivo
equivale a riunire sinergie positive e a potenziarle. Tale meccanismo, che
rispecchia alcune modalità di lavoro tipiche del design, applicato alla sua
documentazione potrebbe essere in grado di operare profondamente sull’informazione del disegno industriale con finalità progettuali, e molto di più
perché la catalogazione di solito si riferisce a sistemi analogici, mentre tipicamente il dato di design è digitale.
4.1.4 Dal Cultural Heritage all’Industrial Design knowledgebase
Gli output tipici finali dei processi di design risultano spesso in prodotti
matrici, che costituiscono la rappresentazione del progetto stesso. Le manifestazioni più alte di tali progetti, in quanto documenti di una cultura progettuale che nell’ultimo secolo si è sempre più velocizzata, rientrano a pieno titolo nella categoria di Beni Culturali da conservare e tutelare. In Italia i musei
del design e gli archivi d’impresa sono, infatti, testimonianza di una civiltà
progettuale raffinata e radicata nel territorio insieme ai distretti industriali. La
loro specificità ha peraltro dato luogo ad interessanti riflessioni museografiche
e museologiche 26, intervenendo nel dibattito sui musei ‘cimiteri’ e i musei
‘vivi’: gli oggetti di design possono rimanere vitali e comunicare emozioni se
utilizzati direttamente dai visitatori (far vedere solo l’oggetto e la sua fisicità è
limitativo, inoltre molti oggetti del design sono ancora vivi nella nostra
memoria quotidiana, a differenza di tanti artefatti di un passato remoto 27).
Ciò implica un rinnovamento costante del museo o dell’archivio di impresa, e
la necessità di ricostruire la storia e il contesto di oggetti di cui tipicamente
non si registrano informazioni: anche in questo ambito emergono quindi problematiche relative alla sistematizzazione e alla restituzione di giacimenti
documentali ‘altri’ rispetto ai tradizionali documenti bibliografici.
Negli ultimi anni, in particolare in esperienze museali internazionali, sono
stati applicati con successo molte delle metodologie e degli strumenti di sistematizzazione documentale descritti nei precedenti capitoli di questo volume:
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 135
da specifici metadati come le CDWA elaborate dal Getty Institute e le VRA
Core Categories, a thesauri costruiti sullo specifico vocabolario di discipline
particolari (dal più famoso Art & Architecture Thesaurus del Getty a quello
messo appunto dall’Istituto Centrale per il Catalogo e la Documentazione di
Roma relativo agli arredi e alle suppellettili religiose), a portali ‘per studiosi’ di
tipo verticale per facilitare una ricerca approfondita offrendo contenuti di alta
qualità e permettendo la ricerca su collezioni multiple, come lo Humanities
Web Portal della University of California di Los Angeles. Molti portali relativi
a discipline umanistiche 28 sembrano peraltro sempre più ispirarsi al modello
dei cosiddetti enterprise information portal 29.
Nel panorama italiano dei Beni Culturali, caratterizzato in modo imprescindibile dalla necessità di conservazione, tutela e fruizione, le possibilità offerte
dalle ICT hanno offerto nuove possibili soluzioni alla secolare e spinosa questione della catalogazione complessiva del patrimonio sul territorio nazionale.
Un recente rapporto della Corte dei Conti sullo stato della catalogazione statale ha infatti nuovamente ricordato come le schede di beni archeologici, artistici, architettonici, storici e demo-etno-antropologici redatte dall’Istituto
centrale per il catalogo e la documentazione sono fino ad oggi momento circa
4.100.000 (tra schede di catalogo, pre-catalogo e inventario), delle quali oltre
la metà sono già informatizzate. A queste devono essere aggiunte quelle curate
dalle Regioni, per i beni di proprietà regionale e degli enti locali, e quelle a
cura delle diocesi, per i beni ecclesiastici. «Nonostante la grande massa di dati
acquisiti – si nota nella relazione della Corte dei Conti – il lavoro da compiere è ancora molto perché le più recenti stime indicano in oltre dieci milioni
[Fig. 2] Sistema multimediale SIGEC dell’ICCD: diagramma del workflow (da Il Sistema
Informativo Generale del Catalogo, 2002)
136 |
di beni il patrimonio complessivo italiano da censire. Una indicazione ‘dinamica’ ed in continua crescita per nuove analisi critiche, nuovi ritrovamenti,
nuovi scavi e nuove acquisizioni. Ancora oggi non si ha una conoscenza esaustiva dei beni che costituiscono il patrimonio pubblico. Una lacuna grave che
necessita di essere colmata» 30. Quanto ai finanziamenti destinati alla catalogazione, per la Corte dei Conti «la somma spesa complessivamente nel settore
negli ultimi quindici anni non è indifferente: 830 miliardi di vecchie lire di
stanziamenti che non sempre hanno dato risultati positivi».
Negli ultimi anni, l’Istituto Centrale per il Catalogo e la Documentazione
(ICCD) del Ministero per i Beni e le Attività Culturali ha definito e avviato
lo sviluppo di un progetto per la costruzione del Sistema Informativo
Generale del Catalogo (SIGEC), che si fonda sul concetto, consolidato nel
tempo dall’ICCD, del patrimonio come ‘sistema’ 31.
La ricchezza del patrimonio italiano diffuso su un territorio connotato da
beni di inestimabile rilevanza culturale, contestualmente al complesso dei
beni musealizzati, rendono la sistematicità una condizione necessaria a garantire l’organica e integrata conoscenza del patrimonio.
In passato, il rapporto degli enti locali con l’ICCD e il Ministero si è tradotto
nella maggior parte dei casi nell’adozione dei tipi di schede e degli standard di
catalogazione ministeriali; tuttavia, su questo terreno molte sono state le
innovazioni prodotte a livello locale, soprattutto per tipologie specifiche di
oggetti (come l’architettura industriale, il design, i beni demo-etno-antropologici, ecc.). D’altronde proprio sul piano degli standard fissati dal ministero
si registrano diffuse tensioni, soprattutto per le persistenti carenze degli ‘standard di descrizione’ o di sintassi compilativa delle voci, nonché per la lentezza
della strutturazione informatica delle schede, che ha già costretto in passato
alcune regioni ad anticipare per proprio conto la conversione informatica
delle schede ministeriali, in assenza di direttive specifiche dall’ICCD.
L’evoluzione operata dal SIGEC è notevole, poiché si passa da una visione
puntuale identificativa del singolo bene a una concezione unitaria e complessa del patrimonio, e quindi a una maggiore consapevolezza del rilievo che
hanno assunto le relazioni tra i beni e le interazioni significative all’interno
del patrimonio artistico e culturale.
L’innovazione sia metodologica che tecnologica investe non solo il modo di
concepire la catalogazione informatizzata, e la comunicazione di contenuti
informativi ad essa riferiti, ma promuove anche una rete di rapporti più
ampia e differenziata con gli enti che operano per l’organizzazione sistematica
e la diffusione delle conoscenze. Il SIGEC si presenta pertanto come sistema
multimediale di banche dati distribuite sul territorio nazionale (Fig. 2): una
conoscenza capillare ed esaustiva del territorio è infatti realizzabile solo coinCiuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 137
volgendo una pluralità di soggetti fra i quali le Regioni e gli Enti Ecclesiastici,
ma anche di organizzazioni come l’università o enti privati che si vogliano
correlare con l’ICCD, allineando i dati con le normative di riferimento. Dal
punto di vista informatico, l’interoperabilità dei record viene resa possibile
attraverso la mappatura di schemi di metadati diversi, tra cui anche – dato
non indifferente per la sua diffusione e facilità d’uso – il Dublin Core.
4.2 Ipotesi per una soluzione
Lo scenario sopra descritto sembra particolarmente attuale e rilevante nell’ambito del metaprogetto nella Facoltà del Design del Politecnico di Milano,
«individuato nella predisposizione di strumenti e modelli che operano su
risorse concettuali e conoscitive, nell’individuazione di una metodologia, e
nell’organiz-zazione – attraverso strumenti e risorse – di nuove possibili geometrie di conoscenza, e a partire da queste, di nuovi sistemi di offerta» 32.
Obiettivi perseguibili proprio attraverso un’attività di ricerca, acquisizione e
catalogazione di dati, informazioni e conoscenze, tesa ad ampliare e ridefinire
gli strumenti del flusso di conoscenze e d’informazione della Facoltà del
Design tramite la codifica di una serie di procedure sistematiche, secondo
standard e criteri condivisi.
Il progetto è un modo molto potente di comprendere un artefatto, ma per sua
natura (il progetto si trasforma nello spazio e nel tempo) risulta difficile da
visualizzare. Fino all’avvento del Visual Computing e della Realtà Virtuale, nel
nostro bagaglio di rappresentazioni visive non sono state operate molte modifiche rispetto alla rappresentazione ‘per esploso’, che perciò non riesce a restituire la complessa ecologia del progetto, a rappresentare cioè simultaneamente gli
artefatti del design e le persone attorno ad esso, le conoscenze in esso applicate
e i problemi incontrati, in un sistema ibrido che coniuga soggettività e oggettività. Il design opera infatti una ri-progettazione del composito ambiente che lo
circonda 33, producendo degli artefatti attraverso una serie di interazioni e di
compromessi secondo una traiettoria spaziale, temporale e sociale. Per tale
motivo, una sistematizzazione documentale del design e la sua rappresentazione non possono prescindere dal contesto degli artefatti del progetto.
Siamo in una fase, nell’evoluzione delle modalità di archiviazione dei documenti, in cui abbiamo la possibilità di archiviare documenti digitali nativi in
sistemi ancora digitali, sfruttando appieno il potenziale interattivo e relazionale
delle ICT per proporre al mondo accademico e professionale del design uno
strumento di studio e di lavoro ad alto valore aggiunto. Il grado d’elaborazione
attuale dei personal computer e l’introduzione del concetto di visual computing, strettamente connesso a quello di visualizzazione scientifica, come target
di riferimento dell’evoluzione del sistema hardware e software, stanno veloce138 |
mente conducendo verso la possibilità di realizzare non solo operazioni di ricodifica di documenti fisici in documenti digitali, ma una loro trascrizione in
forma integrale unita ad un loro facile collegamento reciproco, alla possibilità
di creazione di relazioni tra ambiti distinti, alla facilità di accostamento e
all’accesso unificato e integrato di tipologie eterogenee, con processi di graduale standardizzazione tra differenti protocolli. Da un punto di vista della formazione di un archivio digitale e della sua fruizione, le caratteristiche distintive
dei trend tecnologici attuali, che consentono di concepire uno scenario completamente nuovo e di dimensioni prima sconosciute nell’archiviazione e
nell’Information Retrieval delle informazioni, sono sintetizzabile in sei punti:
1. il desktop fisico è stato completamente sostituto da un desktop virtuale. I
sistemi operativi di nuova generazione (Windows XP, Mac OS X), sono
destinati a realizzare una nuova rivoluzione del modo di lavorare degli
utenti: il desktop virtuale può, infatti, permettere di costruire una soluzione specifica in forma completamente digitale per realizzare una determinata procedura nella sua completezza. Le implicazioni di questa sostituzione sono profonde e sostanziali: il PC non fornisce più solamente
strumenti di ausilio, ma tutto il ragionamento e la sua visualizzazione
sono trasferiti in forma digitale su un supporto unificante capace di
metodi, più potenti e di accesso più immediato, in grado di integrare
istantaneamente molteplici tecniche di rappresentazione (disegno tecnico, disegno concettuale, modellazione, fotografia, ipertestualità, animazione, filmati, testi, ecc.), che quindi possono essere sfruttate rapidamente, a basso costo, e con risultati immediatamente fruibili e fortemente
stabili. Inoltre, per la semplicità delle interfacce, il lavoro sul computer
oggi non costituisce più un mestiere per operatori specializzati, destinati
a fungere da tramite tra il professionista e la macchina, ma una metodologia che presenta un’operatività e una facilità d’uso del tutto simile a
quella degli strumenti analogici e quindi è l’esperto della singola disciplina (designer, fotografo, architetto, archivista, documentalista …) a potersi rioccupare direttamente del problema, con evidente possibilità di notevole miglioramento qualitativo e di controllo del processo;
2. i formati digitali sono sempre più standardizzati. Uno dei più grandi
problemi dei sistemi computerizzati è sempre stato quello della codifica dei dati, in particolar modo nel caso dei formati grafici, di cui
neanche la rappresentazione analogica è univocamente determinata
(anche per la sua natura intrinseca di sistema ad alto simbolismo).
Inizialmente si è assistito ad una proliferazione iniziale di miriadi di
standard differenti incapaci di dialogare fra loro, con l’effetto – molto
più grave di quanto può accadere per i mezzi tradizionali – non solo
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 139
di impedire letture di confronto, ma di negare l’accesso stesso ai dati.
Oggi la problematica sembra arrivata ad una svolta radicale con la
comparsa di formati di gran lunga ‘migliori’, che stanno rapidamente
soppiantando i precedenti formati in virtù della loro semplicità, completezza, possibilità di lettura anche in assenza del software nativo che
li ha generati. XML per il Web, Quick Time e Windows Media per il
video, Open GL per la grafica 3D real-time e soprattutto Acrobat
PDF e formati quali il TIFF e il JPEG per i documenti 2D (disegni,
immagini, testi, ecc.) descrivono formati universalmente riconosciuti
e distribuibili su tutte le piattaforme oggi in commercio (UNIX,
Apple, Windows), rendendo la standardizzazione un de facto, fino ad
oggi assolutamente impensabile;
3. nell’universo digitale i documenti testuali e grafici sono divenuti
nient’altro che casi particolari di un bagaglio di strumenti ben più
articolato e nel contempo facilmente integrabile di quello cui siamo
abituati per la figurazione del progetto (rappresentazioni 2D o al
massimo maquette 3D statiche). Il disegno non è altro che una delle
tante facce di un sovrainsieme dato da un sistema multimediale completo, in grado di distribuire a partire da una medesima piattaforma e
dai medesimi materiali testi, immagini, disegni vettoriali, modelli tridimensionali animabili e renderizzabili in tempo reale, animazioni
grafiche, filmati, documenti formattati per la stampa o per la visualizzazione attraverso Internet. La diffusione di strumenti come Java,
una tecnologia basata sulle potenzialità della rete, e sull’idea che lo
stesso software può funzionare su differenti tipi di computer e periferiche, permetterà di avere ipermedialità, animazione 2D e 3D semplicemente visualizzabili con un Web browser;
4. il modo di lavorare dell’utente prevede la possibilità, accanto al tipico
modo in serie, anche quello della parallelizzazione dei processi. Il
mondo del multitask (più applicazioni che funzionano contemporaneamente sulla stessa macchina) e del multi-user (più utenti che possono accedere alle stesse risorse) fino a poco tempo fa era confinato
alle workstation e ai server professionali, ovvero pochi strumenti dall’accessibilità limitata alle grandi masse di utenti. Il tipico modo di
lavorare su un Personal Computer era quello di realizzare un solo
lavoro alla volta, di una sola tipologia, condotto da un unico utente
che eseguiva processi necessariamente uno dopo l’altro, con tempi e
limitazioni espressive e produttive assai elevati, rendendo in pratica
impossibile effettuare analisi comparative non rigidamente precostituite. Oggi le potenze di calcolo, la diffusione dei sistemi di reti locali
140 |
e globali, la possibilità di gestire grosse quantità di dati da parte di un
PC, hanno consentito l’introduzione di metodi di gestione dello strumento tali da rendere possibile la compresenza di più azioni: più operazioni realizzate contemporaneamente, oggetti trasportati da un’applicazione all’altra, condivisione dei file di lavoro, per cui il singolo
operatore può usare più strumenti contemporaneamente e più operatori possono usare lo stesso strumento sullo stesso progetto. I tempi e
la qualità del lavoro sono marginalmente influenzati da limitazioni
del mezzo, mentre sono assai più spiccatamente dipendenti, dalle
capacità concettuali e figurative dell’operatore;
5. negli ultimi due anni il costo delle memorie di massa si è enormemente ridotto, peraltro rendendo accessibile a basso costo operazioni che
fino a poco tempo fa erano di fatto impossibili per soggetti a basso
valore aggiunto e ad alto dispendio di memoria per l’archiviazione e la
manipolazione, come sono fondamentalmente le trasposizioni digitali
dei documenti che compongono gli archivi di architettura. La legge di
Moore del raddoppio ogni 18 mesi è applicabile anche alle memorie
di massa, sostituendo il termine ‘capacità’ a ‘potenza’. I costi sono passati dai 3 Euro per Megabyte di dieci anni fa a quelli di 3 Euro per
Gigabyte attuali (2003). L’unità di massa mobile per eccellenza, il
DVD, può contenere nella soluzione più utilizzata oggi (4,7 Gigabyte
di spazio disponibile per pochi Euro) oltre 400 immagini fotografiche
in bianco e nero di dimensioni A4 stampabili in formato non compresso, mentre i costi d’acquisto di un server dati da qualche Terabyte
è circa un decimo di quello di tre anni fa, appartenendo ormai alla
categoria di poche migliaia di Euro;
6. il partner di lavoro del ricercatore o del progettista non è più solo l’archivista o il documentalista, ma l’intera comunità scientifica. Il tradizionale
approccio al Personal Computer ha sempre individuato il nostro modo di
lavorare come quello di un operatore che legge e scrive informazioni sul
proprio hard disk, che quindi è sostanzialmente l’unico contenitore su cui
andare a depositare e attingere forme della conoscenza. La movimentazione delle informazioni tra un operatore e l’altro è stata inizialmente assai
difficoltosa, solitamente legata alla movimentazione fisica di interi dispositivi capaci di trasportare quantità di dati sempre più crescenti ma sempre
in modo discreto. La definizione anche in questo campo di standard universali di trasporto dati attraverso una rete via cavo, la possibilità di visualizzazione di ‘finestre’ comuni tra operatori diversi, ma soprattutto il vorticoso incremento delle prestazioni del trasporto del flusso delle informazioni attraverso il network (lo standard è ormai 1 Gb/sec per le reti locali,
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 141
cioè circa tre fotografie a colori stampabili in formato A4 al secondo, e 2
Mbit/secondo per reti globali) ha condotto al necessario ripensamento di
tutta la filosofia del sistema. L’hard disk non è che uno dei contenitori di
banche dati a disposizione, cui aggiungere ciò che rendono disponibile in
risorse dati e computazionali altri computer che lavorano nel nostro stesso
ambito di lavoro e, soprattutto, ciò che restituiscono su Internet, ormai in
tempo reale, tutti i server collegati. Non siamo più soli, né possiamo lavorare da soli: oggi è il mondo intero che ci aiuta e ci guida nel nostro lavoro. E lo è molto di più perché i laptop portatili, per la prima volta, possono sostituire in tutto i PC da tavolo.
L’ipotesi di maggior interesse da esplorare attualmente, nell’ambito in oggetto, è dunque quella di un sistema di diffusione dell’informazione e delle
conoscenze dall’interno verso l’esterno e viceversa, un sistema con interfacce
analogiche e digitale volto a costituire e implementare un knowledge network
universitario per l’acquisizione, la sistematizzazione e la visualizzazione di
risorse eterogenee distribuite, creando una struttura conoscitiva e di erogazione di servizi: vale a dire un Quality-Controlled Subject Gateway e un
Learning Resource Centre per il design. Non sono, infatti, le funzioni della
biblioteca odierna intesa in senso lato ad essere mutate, come è stato osservato nei primi capitoli di questo volume, quanto piuttosto lo spazio e i servizi
in virtù dell’utilizzo di nuove tecnologie di visione per nuove tipologie di
documenti e di informazioni: non più la semplice ‘forma libro’ ma documenti
digitali per loro natura instabili e complessi da poter scambiare e manipolare.
La novità, nello scenario sopra delineato, sono l’indipendenza dall’ubicazione
e la centralità dell’utente, in particolare in ambito universitario, dove le
biblioteche sono il principale centro servizi. Si prospettano quindi specifiche
tematiche da affrontare:
1. predisposizione di strumenti che permettano un’efficiente gestione e
recupero dell’informazione all’interno dei sistemi di catalogazione e
di descrizione che utilizzano metadati e standard riconosciuti;
2. possibilità di rendere questi strumenti un ponte fra universi informativi contigui (biblioteche, archivi, musei, raccolte in genere);
3. qualificazione ed arricchimento di contenuti conoscitivi i sistemi
informativi, attraverso la ricostruzione e l’intreccio di contesti.
Le risposte individuate, al fine di provvedere una operatività di base, sono le
seguenti:
- metodi di archiviazione dei dati e formazione di schemi di metadati
per la descrizione e il recupero dei documenti;
- metodi di esposizione dei dati (quality-controlled subject gateway);
- metodi di accesso ai dati (learning resource centre).
142 |
Un knowledge base per il design dovrebbe saper restituire ed evocare quell’intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui
si origina il progetto: l’interdisciplinarietà che caratterizza il design offre,
infatti, una ricchezza incredibile di punti di vista, di diverse realtà conoscitive
da esplicitare e far dialogare tra loro, secondo categorie e tematiche trasversali.
Un sistema così metodologicamente definito potrebbe divenire punto di
incontro tra studenti, docenti e professionisti del settore, finalizzato alla
costruzione di un ambiente innovativo di collaborazione, d´interazione e di
discussione a supporto della didattica e della ricerca online e offline, attraverso l´accesso Web a contenuti e servizi realizzati e alimentati dalla comunità.
Il modello del Gateway to Cornell University Library 34sembra rappresentare
un sistema informativo che promette grandi potenzialità e flessibilità in
ambienti di rete, certamente perfettibile e implementabile (Fig. 3).
L’interazione e il coinvolgimento dell’utente sono certamente da favorire e da
stimolare, per esempio tramite la creazione di una comunità virtuale interattiva e di uno spazio digitale di lavoro e di servizi personalizzati. Tuttavia, l’approccio prettamente top-down di un archivio digitale dinamico 35, se da un
[Fig. 3] Screenshot dell’homepage del Gateway to Cornell University Library
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 143
lato mette a proprio agio sia studenti che designer offrendo una piattaforma
di scambio di esperienze e di informazioni, in differenti contesti e a differenti
livelli, pone non trascurabili difficoltà per un’evoluzione strutturata e logica
del sistema, come rilevato dagli stessi autori.
È certamente importante predisporre strumenti per un’efficiente gestione e
visualizzazione dei dati e renderli un ponte fra patrimoni conoscitivi contigui,
attraverso l’interoperabilità tra diversi tipi di risorse. Non esiste, infatti, un
unico formato standard di metadati, ma piuttosto numerosi schemi nati da
esigenze specifiche, che è fondamentale far dialogare tra loro.
In tal senso, la messa a punto di un thesaurus, secondo un rigoroso lavoro di
controllo e compilazione, rappresenta un mezzo potente ed efficace di accesso
e condivisione delle conoscenze, in particolar modo se è previsto complementare ed integrato ad un sistema di Visual Retrieval come quello già citato realizzato dal gruppo di Visual Information Technology del National Research
Council of Canada.
Ciò che risulta evidente, in ogni caso, è che un sistema conoscitivo deve essere sviluppato innanzitutto in termini di metodologie, procedure ed infine di
software. La ricchezza di un sistema conoscitivo per il design dovrebbe saper
restituire ed evocare quell’intreccio di contesti e di relazioni concettuali, quella visione del mondo da cui si origina e si alimento il progetto.
Tuttavia, se l’accesso istantaneo all’informazione digitale è forse la caratteristica
più significativa dell’era dell’informazione, frutto di elaborati meccanismi di
recupero prodotti dalla tecnologia, la tecnologia non è sufficiente. L’efficacia di
un sistema di accesso all’informazione e alla conoscenza è infatti direttamente
proporzionale all’intelligenza e ai metodi impiegati per organizzarlo.
144 |
Note
[1]
Si intende qui per ‘dato’ la registrazione in
un codice di un aspetto della realtà; per
‘informazione’ la percezione di un insieme
di dati, attraverso un processo di interpretazione; per ‘conoscenza’ il processo cognitivo di rielaborazione delle informazioni e
delle esperienze.
generali. I portali offrono un’ampia
gamma di opzioni per la personalizzazione
e di servizi e di funzioni.
[5]
Rispettivamente < www.design-italia.it/>,
<http://www.designboom.com/>,<http://w
ww.designboom.com/>, < www.e-interiors.net/>, <www.designvillage.it>
[6]
[2]
P. Ciuccarelli, Strumenti per il progetto tra
formazione e gestione della conoscenza:
ipotesi per un portale del design,in
Didattica &Design. Processi e prodotti formativi nell’università che cambia, A.
Penati, A. Seassaro, (a cura di), Edizioni
POLI.Design, Milano 2000, p. 254. Cfr.
anche W. Warkoski, I sistemi informativi:
il ruolo dei fattori umani nel processo di
design, CNUCE – C.N.R. 2001,
<http://giove.cnuce.cnr.it/simposioHCI01
/054.pdf>
Si tratta di un progetto inaugurato nel
1998 da sei università americane, finalizzato a diventare strumento di supporto e
continuo miglioramento degli atenei: The
Urban University Portfolio Project:
Linking Learning, Improvement and
Accountability, International Conference
on Assessing Quality in Higher Education,
2000, <ww.imir.iupui.edu/portfolio/>
[7]
E-mail del 25 settembre 2001.
[8]
[3]
H.Strauss, What Is a Portal, Anyway?,
CREN (Corporation for Research and
Educational Networking) Tech Talk, January
2000
<http://www.cren.net/know/techtalk/events/
portals.html>
[4]
Un portale é, per definizione, un sito Web
che é o si propone di essere un importante
punto di accesso per altre destinazioni, e
può essere a carattere generale o di nicchia,
cioé dedicato ad una precisa tematica. Vi
sono centinaia di portali verticali (specializzati in una categoria dell’informazione,
come una disciplina, o un utente, come
quelli universitari) o di portali aperti,
Ciuccarelli, Innocenti
|
E. Lodolini, Organizzazione e legislazione
archivistica in Italia. Dall’unità d’Italia
alla costituzione del Ministero per i beni
culturali e ambientali, Pàtron, Bologna
1989 (IV ed.), pp. 345-358.
[9]
G. Plessi, L’archivio, Pàtron, Bologna
1972, pp.11-12.
[ 10 ]
A questo proposito cfr. A. Petrucci, Sui
rapporti fra archivi e biblioteche, in
«Bollettino di informazioni
dell’Associazione Italiana Biblioteche»,
1964, IV, pp.213-219; G. Orlandi,
Archivi e biblioteche, in «Archivi e cultura», 1980, pp. 217-230; M.A. Quesada,
Sistemi conoscitivi per il design: una proposta metodologica
| 145
Due istituti a confronto. Intervista a Ezio
Lodolini sui rapporti tra archivi e biblioteche, in «Biblioteche Oggi», maggio-giugno
1985, vol. 2, n. pp.11-15.
[ 11 ]
Cfr. M. Budhu, A. Coleman, The Design
and Evaluation of Interactivities in a
Digital Library, in «D-Lib Magazine»,
November 2002, vol. 8, n. 11
<http://www.dlib.org/dlib/november02/col
eman/11coleman.html>
[ 12 ]
Cfr. Didattica e design, cit.
[ 13 ]
J. Dewey, Democracy and Education: An
Introduction to the Philosophy of Education,
Macmillan, New York 1916
<http://140.211.62.101/dewey/contents.html>
Bicentennial Conference on Bibliographic
Control for the New Millennium:
Confronting the Challenges of Networked
Resources and the Web, Library of
Congress Directorate, 15 -17 November
2000, Washington
<http://lcweb.loc.gov/catdir/bibcontrol/ar
ms_paper.html>
[ 17 ]
Cfr. D.A. Norman, Things that make us
smart. Defending human attributes in the
age of the machine, Addison Wesley, New
York 1993; F. Rizzo, W. Warkoski, I sistemi
informativi: il ruolo dei fattori umani nel
processo di design, CNUCE – C.N.R.
2001,
<http://giove.cnuce.cnr.it/simposioHCI01/
054.pdf>
[ 18 ]
K. Wilson, Discussion on two multimedia
R & D projects: The Plaenque Project and
the Interactive Video Project of the
Museum Education Consortium, in
Interactive Multimedia Learning
Environments, M. Giardina (ed.),
Springer-Verlag, Berlin 1992, pp.186-196.
Cfr. N.J. Belkin, Anomalous states of knowledge as a basis for information retrieval,
in «Canadian Journal of Information
Science», 5, 1980, pp. 133-143; T.D.
Wilson, Human Information Behavior, in
«Informing Science», 2000, vol. 3, n. 2, pp.
49-56; G. Marchionini, Information seeking in electronic environments, Cambridge
University Press, Cambridge (Eng.) 1995.
[ 15 ]
[ 19 ]
[ 14 ]
Cfr. ad esempio MIT OpenCourseWare
<http://ocw.mit.edu/index.html> e le Open
Knowledge Initiatives
<http://web.mit.edu/oki/> per gli ambienti
didattici virtuali. Esiste anche un «Journal of
Interactive Learning Research»
<http://www.aace.org/pubs/jilr/default.htm>
A.H. Marti, User interface and visualization, in R. Baeza-Yates, B. Rebeiro-Neto,
Modern Information Retrieval, ACM
Press, Addison Wesley, New York 1999
<http://www.sims.berkeley.edu/~hearst/irb
ook/10/node1.html>.
[ 20 ]
[ 16 ]
C.R. Arms, Some Observations on
Metadata and Digital Libraries, in
146 |
I. Nonaka, H. Takeuchi, The KnowledgeCreating Company, Oxford University Press,
1995. (trad. it., The knowledge creating com-
pany. Creare le dinamiche dell’innovazione,
a cura di U. Frigelli e K. Inumaru, Guerini e
Associati, Milano, 1997).
[ 23 ]
[ 21 ]
[ 24 ]
Bogliolo ha affrontato il tema in diversi
articoli introduttivi apparsi fra il 1998 e
il 2000 su «AIDA Informazioni»,
<http://www.aidainformazioni.it>:
2/1998, pag. 18-22; 3/1998, pag. 8-14;
4/1998, pag. 16-25; 1/1999, pag. 8-15, e
nella rubrica Schegge sul medesimo periodico, apparsa finora sui numeri 1/2000,
pag. 24-28; 2/2000, pag. 13-16. Cfr.
inoltre dello stesso autore Sistemi informativi e sistemi cognitivi, in SINM 2000:
un modello di sistema informativo nazionale per aree disciplinari, IV Seminario
Sistema Informativo Nazionale per la
Matematica, Lecce, 4 ottobre 2000
<http://siba2.unile.it/sinm/4sinm/interventi/sinmingo.html> e tra gli altri autori: C. W. Choo, Information management for the intelligent organization:
roles and implications for the information
profession, in Digital Libraries
Conference, March 27-28, 1995,
Singapore
<http://128.100.159.139/FIS/ResPub/D
LC95.html>; P.H. Hendriks, The organisational impact of knowledge-based
systems: a knowledge perspective, in
«Knowledge-based systems», 12, 1999,
pp. 159-169.
Il Web Semantico «is an extension of the
current web in which information is given
well-defined meaning, better enabling
computers and people to work in cooperation» (da T. Berners-Lee, J. Hendler, O.
Lassila, The Semantic Web, in «Scientific
American», 2001 <http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html >).
D. Bogliolo, Sistemi informativi e sistemi
cognitivi, cit.
[ 25 ]
C.W. Choo, Information management for
the intelligent organization, cit.
[ 26 ]
Cfr. Musei e archivi d’impresa: il territorio,
le imprese, gli oggetti e i documenti, atti del
convegno di studi di Assolombarda,
Assolombarda, Milano 2001.
[ 27 ]
Il Museo Ducati
(<http://www.ducati.com>), ad esempio,
cerca di valorizzare il prodotto attraverso il
suo impatto emozionale (ponendosi non
come una fabbrica di moto ma una comunità), creando identità tra prodotto e
museo, aspetto emozionale dell’oggetto
moto e del museo in quanto tale.
[ 28 ]
[ 22 ]
G. di Domenico, La biblioteca apprende:
qualità organizzativa e qualità di servizio
nella società cognitiva, comunicazione al
convegno La qualità nel sistema biblioteca,
Milano, Palazzo delle Stelline, 9-10 marzo
2000, pubblicata in «Biblioteche oggi»,
maggio 2000, pp. 16-25.
Ciuccarelli, Innocenti
|
Per una definizione dei portali accademici e
degli information gateway cfr. S. E.
Thomas, L’impiego del portale per l’individuazione di risorse elettroniche specialistiche, in Risorse elettroniche, definizione,
selezione e catalogazione, cit.
<http://w3.uniroma1.it/ssab/er/relazioni/th
Sistemi conoscitivi per il design: una proposta metodologica
| 147
omas_ita.pdf>; H. Strass, What Is a Portal,
Anyway?, CREN (Corporation for
Research and Educational Networking)
Tech Talk, January 2000
<http://www.cren.net/know/techtalk/events
/portals.html>; UCLA Humanities Web
Portal Home Page
<http://www.humnet.ucla.edu/index2.htm
>; J.D. Campbell, The Case for Creating a
Scholars Portal to the Web: a White Paper,
in «Portal: Libraries and the Academy»,
January 2001, pp. 15-21,
<http://muse.jhu.edu/demo/pla/>; M.
Looney, P. Lyman, Portals in Higher education: What Are They and What is Their
Potential?, in ««Educause Review»,
July/August 2000, pp. 28-35 e
<http://www.educause.edu/pub/er/erm00/a
rticles004/looney.pdf>
zione del patrimonio culturale nazionale,
ICCD, Roma 14 febbraio 2002
<http://www.iccd.beniculturali.it/download/polichetti.pdf>; A. Di Lorenzo, Dai
dati catalografici alle informazioni sui
Beni Culturali: i Metadati, ICCD, Roma
14 febbraio 2002, <http://www.iccd.beniculturali.it/download/atti/36_2-di.pdf>
[ 32 ]
Cfr. i volumi Didattica & Design. Processi
e prodotti formativi nell’università che
cambia, cit. e Giovane è il design. Nodi
contemporanei della didattica per il progetto, a cura di A. Penati, Edizioni
Poli.design, Milano 2001. Un esempio
significativo delle potenzialità del Web in
quest’ambito proviene da A. Andia,
Internet Studios Consortium, 2001
<http://miami00.tripod.com>
[ 29 ]
Secondo un’indagine effettuata nell’ambito
dell’Academic Portal Initiative/Project di
TERENA <http://www.terena.nl>
[ 30 ]
Corte dei Conti – Sezione Centrale di
Controllo sulla gestione delle
Amministrazioni dello Stato,
Deliberazione n. 2/2003/G del 13 gennaio
2003. Relazione concernente l’attività di
catalogazione dei beni culturali. Per l’indagine e i relativi documenti legislativi
consultare
<http://www.corteconti.it/Ricerca-e-1/GliAtti-d/Controllo-/Documenti/Sezionece1/Anno-2003/Secondo-co/index.asp>
[ 31 ]
Cfr. M.L. Polichetti, Beni culturali e
Innovazione Tecnologica. Il Sistema informativo Generale del Catalogo: strumento
per la conoscenza, la tutela e la valorizza-
148 |
[ 33 ]
Cfr. a questo proposito G. Simonelli, S.
Maffei, I territori del design: made in Italy
e sistemi produttivi locali, IlSole24Ore,
Milano, 2002.
[ 34 ]
<http://campusgw.library.cornell.edu/>
[ 35 ]
Come quello creato da Ann Heylighen
(prototipo DINAMO consultabile al sito
<http://www.asro.kuleuven.ac.be/dynamo>
5
Il progetto DesignNet
Paolo Ciuccarelli, Perla Innocenti
The real challenge is creating appropriate organisational contexts for action
Paul Conway
5.1 Bisogni e obiettivi
Per una esigenza come quella manifestata dalla Facoltà del Design, che a fronte di quanto detto nei capitoli precedenti, possiamo riassumere nel doppio
bisogno di azzeramento rispetto a dati e informazioni, e di supporto per operazioni esperienzial-conoscitive sui documenti, non esiste tout-court una soluzione unica e compiuta. Non è possibile pensare di codificare a priori il processo conoscitivo del design, che abbiamo visto essere basato prevalentemente
sull’esperienza, né immaginare di organizzare in un archivio completo e preordinato l’universo infinito dei possibili frammenti documentali, degli stimoli
culturali, utili ad alimentare la creatività e il design. Si può però analizzare
attentamente quella esigenza, come abbiamo cercato di fare, per trarne delle
indicazioni di metodo e sviluppare strumenti e metodi di gestione delle informazioni e dei documenti più coerenti con il processo progettuale. Ci siamo
quindi concentrati sulle regole del gioco, mettendo da parte il risultato: è difficile, impossibile, anzi, inutile, dire cosa debba contenere un sistema conoscitivo per il design, mentre è utile e anzi necessario restituire la geografia e il
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 149
significato di ogni singolo documento selezionato, e delle sue relazioni con
altri, infiniti, documenti. In luogo di una selezione ridotta dei documenti da
trattare, per ridurre la complessità del problema abbiamo viceversa rinunciato
a definire categorie preliminari, esplorando quanti più scenari informativi
possibile, per mantenere alto il livello di flessibilità del sistema.
A partire da queste condizioni abbiamo agito da un lato (quello della struttura del contenitore) sui possibili denominatori comuni dei diversi documenti,
sulla flessibilità, la più alta possibile, in modo che qualsiasi documento potesse essere trattato; dall’altro (quello dei contenuti che descrivono il documento
e le relazioni che gli danno significato) la flessibilità diventa la più bassa possibile, in modo che, almeno all’interno della comunità di riferimento, il senso
di quel documento sia compreso senza ambiguità e in modo univoco. Questo
è il motivo principale della prima grande scelta operata nel progetto
DesignNet, l’identificazione di tre moduli strumentali distinti ma integrati
(Fig. 1), che rispecchiano le esigenze sopra descritte: uno strumento di gestione della terminologia, per costruire il vocabolario del design
(DesignThesaurus) attraverso il quale dar corpo al linguaggio comune neces-
Thesaurus
terminologia
+
Directory
persone, organizzazioni,
brands, locations
Catalogue
+
documenti/metadati
DESIGN KNOWLEDGE CENTRES
PLACES for accessing, sharing and using information
and knowledge in design activities
DESIGN GATEWAYS
WEB INTERFACES fto access design knowledge
[Fig. 1] I tre moduli del progetto DesignNet (Thesaurus, Directory e Catalogue) e l’interazione
con l’ interfaccia digitale (design gateways) e fisica (design knowledge centres) (P. Ciuccarelli)
150 |
sario a descrivere i documenti in modo significativo; una directory del design
(DesignDirectory) che permettesse l’identificazione univoca degli specifici elementi di indicizzazione: persone, organizzazioni, marche (brands), locations,
eventi; uno strumento di catalogazione che utilizzasse uno standard il più
possibile aperto e pensato già in origine per far stare insieme in modo coerente risorse documentali eterogenee. Ognuno di questi moduli è stato declinato
per il design: per il catalogo ad esempio è stato sviluppato uno specifico ‘profilo di applicazione’ dello standard scelto, Dublin Core; nella definizione
degli authority file della Design Directory emergono specificità che sono tipiche della produzione industriale, come la distinzione tra marca e produttore
(organizzazione-azienda) e la possibilità di stabilire una relazione temporale
tra i due elementi oltre che attraverso il prodotto.
In sintesi il nodo principale del progetto DesignNet sta proprio nel fatto che
la tipologia dei documenti da gestire non è identificabile a priori, sia nella
organizzazione dei documenti per il design, sia, estendendo il discorso, nella
gestione dei documenti del design. Qualsiasi documento può essere preso in
considerazione, se, e solo se, si dispone di un metodo per contestualizzarlo,
dargli significato, posizionarlo (mapparlo) attraverso le relazioni con termini,
elementi di indicizzazione, altri documenti. Se pensiamo ai documenti del
design, quelli più tradizionali come i prodotti fisici, è evidente come il loro
racconto assuma significato proporzionalmente all’estensione della trama delle
relazioni intessute con altri documenti all’interno del contesto sociale e culturale, della cultura materiale soprattutto, di riferimento.
Per questo motivo non ci siamo interessati in prima battuta delle singole
schedature (ad esempio quella dell’oggetto di design), spostandoci invece
subito al livello metadescrittivo (dal metadato al meta-metadato), al modo di
mettere insieme qualsiasi documento perdendo il meno possibile delle singole
descrizioni, e cogliendo però contemporaneamente l’obiettivo strategico di
farli dialogare tra loro, attraverso relazioni e termini unificati e normati.
La stessa visione, lo stesso approccio integrativo e metaprogettuale, sono stati
applicati, oltre che nella definizione del metodo e degli strumenti DesignNet,
anche nella sperimentazione degli stessi all’interno della Facoltà del Design: si
è deciso che non serviva tanto creare un nuovo giacimento di documenti
quanto piuttosto organizzare quelli esistenti in un insieme integrato (un sistema), organizzato per il design(er). La stessa integrazione poi è stata declinata
sia sul piano immateriale che su quello materiale: gli archivi/laboratori informativi esistenti all’interno del Politecnico di Milano sono integrati, da una
parte attraverso l’utilizzo dei metodi e degli strumenti DesignNet, dando vita
quindi, almeno potenzialmente ad un catalogo unico; dall’altra, fisicamente,
attraverso l’individuazione di un luogo e la attivazione di un servizio che
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 151
costituisce un punto di accesso unico, con regole uniche, ad archivi che
rimangono comunque autonomi per quanto riguarda i contenuti.
L’integrazione anche fisica degli archivi informativi per il design, come possibile ulteriore momento di attribuzione di significato a documenti eterogenei,
è alla base del concetto di ‘Design Knowledge Centre’, del quale la POLI.teca
costituita al Politecnico di Milano è un primo, sperimentale, esempio. La
POLIteca si costituisce come centro di documentazione locale, e insieme possibile nodo di una rete di giacimenti di documentazione e conoscenza per il
design, attivabile attraverso la condivisione da parte di altri centri di documentazione, musei, biblioteche, dei metodi e degli strumenti sviluppati nell’ambito di DesignNet 1.
5.2 Analisi e progettazione del sistema
All’inizio della fase di ricerca del progetto DesignNet, si è effettuato un processo comune ai professionisti dell’informazione, dai bibliotecari ai documentalisti: la codifica, tramite ricerca nelle mappe mentali degli utenti, dello specifico territorio informativo di un ambito disciplinare. Una ricognizione statistica sul Web dei siti delle università, associazioni, fondazioni e società collegate al design nel contesto nazionale e internazionale, è stata funzionale a
comprendere come il patrimonio informativo accademico si serve delle
potenzialità della Rete e a rilevare la presenza e le caratteristiche dei servizi e
delle informazioni di altri portali e siti internazionali dedicati al design (cfr.
capitolo 3). L’analisi è avvenuta in concomitanza con lo studio dell’evoluzione
del concetto di biblioteca e di archiviazione dei documenti, e con l’analisi
degli standard di catalogazione, indicizzazione e visualizzazione delle informazioni in ambienti di rete (cfr. capitolo 1 e 2). Sono stati inoltre esaminati i
modelli e gli strumenti di Knowledge Management e delle attività e servizi di
documentazione applicabili in ambito universitario.
Parallelamente, allo scopo di identificare le caratteristiche della documentazione
per il design e i bisogni informativi degli utenti locali, è stata effettuata una
mappatura dei giacimenti esistenti attraverso un’indagine a campione sulla
forma degli elaborati informatici prodotto di ricerca e/o didattica della Facoltà
del Design del Politecnico, e la somministrazione di un questionario di rilevazione sulle raccolte documentarie e materiche dei laboratori e degli archivi qui
presenti, modellato sull’esempio della ben più dettagliata Rilevazione sulle
biblioteche delle università italiane preparato dal MURST nel 1997 2 e di una
serie di questionari e rilevazioni in ambito internazionale 3. Il questionario è
stato compilato da 9 tra laboratori e archivi (Archivio Materiali da Costruzione,
Laboratorio Colore, Laboratorio di Analisi Merceologica e Settoriale (MAST),
Laboratorio di Requisiti Ambientali per i Prodotti Industriali (RAPI),
152 |
Laboratorio Fotografia, Laboratorio Media Digitali, Laboratorio Produzione
Video, Materiali e Design (MeD), Laboratorio Modelli).
In questa prima fase di ricerca sono stati inoltre presi numerosi contatti con i
responsabili dei più rilevanti progetti di biblioteche digitali online di università e istituti, responsabili tecnici di progetti di archiviazione ad alta informatizzazione e di produzione software (tra cui ICCD del Ministero per i Beni e le
Attività Culturali, il Getty Research Institute, la University of California a
Berkeley, la Cornell University). L’analisi di tecnologie hardware e software
funzionali al progetto è stata effettuata in base alla documentazione richiesta
ai fornitori e alla rapportistica tecnica di università ed istituti internazionali. I
software possibili sono stati selezionati tra decine di esemplari italiani e internazionali, in base alle esigenze di gestione di documenti non solo testuali ma
soprattutto multimediali (immagini, audio e video), utilizzo di schemi di
metadati più semplici e flessibili di UNIMARC, modalità di visualizzazione
delle risorse, relativa facilità di inserimento, interoperabilità.
Le attività sopradescritte sono risultate nella evidenza di molteplici e sostanziali conoscenze e informazioni sul design – di carattere manipolativo-visuale
strettamente collegate all’esperienza, difficilmente proceduralizzabili e provenienti da forme di apprendimento diversificate – che non si esauriscono a
quanto viene oggi mostrato sul Web e che non sono ancora sistematizzate.
L’identificazione di tipologie documentarie, formati e modalità di acquisizione/archiviazione eterogenee e complesse ha permesso la contestualizzazione e
definizione degli scenari operativi e di riferimento del progetto nell’ambito
dell’evoluzione delle biblioteche e dei documenti, e la definizione di standard
di catalogazione, indicizzazione restituzione e di visualizzazione online delle
risorse e dei documenti per il design. Informazioni preziose sono state anche
reperite attraverso newsgroup e gruppi discussione internazionali 4.
In questa fase è emersa la necessità di gestione delle risorse secondo schemi di
metadati coerenti e organizzati, l’individuazione delle chiavi di lettura per le
varie tipologie di utenti e bisogni informativi identificati, la coordinazione
con altre risorse disponibili, la loro restituzione attraverso visualizzazioni funzionali. In particolare, sono stati identificati i seguenti elementi:
- schemi di metadati funzionali per la loro interoperabilità, modularità
e flessibilità;
- un protocollo per lo scambio dei record;
- struttura e caratteristiche di un thesaurus monolingue per il design;
- tecnologie hardware e software necessarie.
L’obiettivo di DesignNet é quello di soddisfare i bisogni informativi e conoscitivi della comunità universitaria, e al tempo stesso di alimentare lo scambio
e la creazione di risorse ed esperienze progettuali, fornendo strumenti che
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 153
permettono un’efficace gestione, recupero e visualizzazione di documenti 3D
e 2D in un framework in rete collaborativo e integrato. Per raggiungere tale
obiettivo si è cercato di definire un sistema knowledge-based per il disegno
industriale: un tema particolarmente complesso poiché, come è stato scritto
nei paragrafi precedenti, il progetto vive la permanente scissione tra il sistema
delle informazioni e delle conoscenze che costituiscono la condizione a priori
dell’atto creativo ed esecutivo e la definizione del progetto, ma che raramente
si riesce ad appoggiare ad essi.
5.2.1 Un Quality-controlled Subject Gateway per il design
I sistemi di archiviazione, restituzione, disseminazione delle risorse online,
grazie alle loro caratteristiche di ipertestualità e multimedialità, coinvolgimento di un maggior numero di attori e capacità di supporto di una pluralità
tipologie di documenti, di formati e di linguaggi, si propongono oggi come
un potente strumento a supporto delle attività di didattica e di ricerca in
ambito universitario. Tuttavia (come è stato già osservato nel paragrafo 3.1.2),
la ricca articolazione delle risorse del design è notevolmente maggiore di ciò
che solitamente ‘presentano’ i siti Web o i portali.
Se adeguatamente implementati, i Quality-controlled Subject Gateway
(QCSG) 5, basati su un’ampia e dettagliata descrizione di risorse distribuite in
ambiente di rete (o accessibili tramite Internet) e sull’adozione di standard,
rappresentano certamente uno degli approcci più efficaci in questo senso.
Un’ampia gamma di metodologie, linguaggi e tecnologie adottati nei QCSG
risultano rilevante nella didattica del design e nello sviluppo dei progetti. Un
QCSG è qualcosa di più di un semplice punto di accesso unico ad un determinato campo del sapere: esso vuole costituire un portale di ingresso a praticamente tutte le informazioni e i documenti rilevanti in uno specifico ambito, indipendentemente dalla loro forma (analogica o digitale) e dalla collocazione fisica del documento. Solo la rilevanza del contenuto è importante. I
servizi di organizzazione e delivery dei contenuti sono implementati in modo
da soddisfare i bisogni degli utenti.
Nel progetto DesignNet i vari partecipanti cooperano insieme in un unico
framework coordinato da DesignNet: il Design Gateway.
Nei paragrafi successivi vengono perciò brevemente analizzati gli aspetti cruciali e i componenti dei QCSG, contestualizzati nell’ambito di una sistematizzazione delle risorse relative al disegno industriale:
1. schemi metadati standard e descrizione dei contenuti (paragrafo 4.4.2);
2. accesso per soggetto tramite vocabolario controllato e liste di autorità
(paragrafo 4.2.3 e 4.2.4);
3. selezione qualitativa e descrizione dei documenti ad opera di risorse
154 |
umane specializzate; sviluppo, aggiornamento e gestione delle collezioni con il continuo monitoraggio del gateway (paragrafo 4.2.5)
4. adozione di standard per l’interoperabilità con altri servizi e basi dati
e progettazione di servizi aggiuntivi (paragrafo 4.2.6).
Nella user modeling del QCSG per il progetto DesignNet, sono stati distinti
quattro tipi di comportamenti informativi:
- serendipity: trovare informazioni non cercate e impreviste. Nella
ricerca scientifica si tratta anche della capacità di individuare e valutare correttamente dati o risultati imprevisti rispetto ai presupposti
teorici di partenza;
- information seeking: essere alla ricerca di informazioni con uno scopo
deliberato;
- information searching: microlivello di informazione usato da chi
cerca mentre interagisce con sistemi di vario tipo;
- information use: atto fisico e mentale di incorporare l’informazione
trovata nel proprio patrimonio conoscitivo 6.
Questi diversi comportamenti presuppongono diversi livelli di ricerca attraverso i documenti disponibili in un QCSG, ed evidenziano l’importanza della
granularità dell’informazione, ovvero del livello di dettaglio reso disponibile.
5.2.2 Schemi di metadati e protocolli: Dublin Core e OAI
Come osservato nel paragrafo 2.2.1, l’interoperabilità migliora la qualità di
un sistema info-conoscitivo e le possibilità di usare documenti provenienti da
fonti diverse, riduce i costi, permettendo il riutilizzo delle informazioni e
delle risorse una loro gestione in parte automatica. Affinché si possa realizzare
questo libero flusso di informazioni, è però necessario che l’interoperabilità
non dipenda dai media e dal sistema utilizzati, dal contesto amministrativo,
da contenuto o dal tipo di informazione: perché ciò avvenga è fondamentale
utilizzare dei metadati standard.
La situazione ideale sarebbe quella di avere a priori un modello di schema di
metadati completo e un framework definito, entrambi riconosciuti come standard internazionali e utilizzati dagli utenti. Nella realtà, esistono soltanto alcuni
modelli parziali, spesso non coordinati (cioè mappati) tra loro, non utilizzati su
larga scala dagli attuali sistemi e poco conosciuti. Nessuno singolo schema di
metadati soddisferà tutti i requisiti funzionali di tutte le applicazioni. È inoltre
importante ricordare che le «categories are historically situated artifacts, and like
all artifacts, are learned as part of membership in a community of practice» 7: il
contenuto, la semantica e la sintassi di uno schema di metadati dipenderà dal
contesto che lo promuove, dalle funzioni o dagli scopi dello schema e dal livello
di aggregazioni, dal tipo di oggetto e di entità a cui esso si correla.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 155
Carl Lagoze esprime lucidamente questo problema: «The Web environment
[...] is massively distributed, involving an arbitrary number of schemas, many
of which will be not known. The querying of semi-structured and imperfectly
understood data in such a diverse environment is a topic of research, not a
readily deployable technology» 8.
Per il progetto DesignNet è stata scelta la creazione e lo sviluppo collaborativo di un catalogo di documenti eterogenei per il design, utilizzando lo standard internazionale Dublin Core e l’expertise disponibile nella Facoltà del
Design come punto di partenza. L’obiettivo complessivo è quello di definire
livelli di interoperabilità con minori barriere e metadati più ricchi, utilizzando
standard emergenti che intendono facilitare una efficace disseminazione questo ambito. Negli ultimi anni, come analizzato nei primi due capitoli di questo volume, sono emersi nuovi approcci alla descrizione dei documenti digitali, e al tempo stesso standard consolidati come il formato UNIMARC e le
RICA (e in ambito anglosassone USMARC e le AACR2) sono state applicate
a documenti digitali.
In base ad una verifica preliminare, è emerso che i partecipanti al progetto
DesignNet, ma anche, più in generale, chi si occupa della documentazione di
design, adottano una varietà di approcci quasi sempre non allineati agli standard attualmente disponibili. Gli standard che un’organizzazione adotta
dipendono da una serie di fattori, inclusi le tipologie di materiali posseduti,
lo scopo del progetto di fruizione/conservazione, gli utenti potenziali, la
conoscenza e l’esperienza dello staff di progetto e le infrastrutture tecniche
disponibili per l’istituzione. I livelli di dettaglio variano da istituzione a istituzione; inoltre, alcune informazioni potrebbero essere riservate.
Questa fase è quindi partita da alcune domande:
- Di che livello di standardizzazione abbiamo bisogno?
- Chi è responsabile della creazione di metadati?
- Quanto costa la creazione e la gestione dei metadati nel medio e
lungo periodo?
- Quali sono i limiti dei diversi tipi di formati di file?
- Quali sono gli strumenti per l’estrazione dei metadati?
- È possibile riutilizzare i metadati provenienti da altre fonti?
- Quali saranno le scelte, le procedure, i manuali e gli standard per
l’implementazione?
Per la catalogazione di documenti eterogenei analogici e digitali per il design,
online e offline, in DesignNet si è scelto di non adottare le metodologie catalografiche convenzionali, a favore di uno schema di metadati adatto ai vari
ambiti del design e finalizzato allo scambio delle informazioni e alla ricerca da
parte dell’utente.
156 |
In seguito ad una verifica nella fase 1 del progetto, il Dublin Core Metadata
Element Set (cfr. paragrafo 2.2.3) è stato selezionato in quanto standard (è sia
ANSI/NISO Z39.85-2001 che ISO 15836) semplice e flessibile, che gode di
un largo in ambito internazionale e che consente la descrizione adeguata di
un’ampia gamma di documenti di diverse comunità diversamente dislocate,
facilitando al tempo stesso l’integrazione e l’interoperabilità tra vari sistemi
cognitivi. Dublin Core è uno standard aperto che permette il coinvolgimento
di diverse comunità, senza escludere gruppi di utenti, come farebbe lo standard MARC. Tuttavia, per le istituzioni legate al formato MARC, Dublin
Core offre comunque sufficienti equivalenze e un’adeguata mappatura
MARC-Dublin Core. Inoltre è ormai diventato uno standard riconosciuto,
semplice da imparare e da utilizzare anche per persone che non sono dei catalogatori professionisti. E il core dei suoi elementi fornisce le informazioni
essenziali.
Come schema per la descrizione, Dublin Core è stato scelto con gli specifici
obiettivi di:
1. facilitare la scoperta dei documenti di design;
2. assistere nella gestione delle risorse;
3. permettere l’interoperabilità tra differenti strutture di metadati attraverso un semplice formato;
4. sviluppare un framework di metadati conforme con altri standard da
tempo consolidati, come il MARC, ed emergenti, come MPEG-7;
5. codificare i metadati utilizzando il protocollo della Open Archive
Initiative (OAI) e l’Extensible Markup Language (XML).
In particolare, per quanto riguarda l’interoperabilità semantica, sono stati
analizzati vari schemi di equivalenza o crosswalk già realizzati e pubblicati sul
Web che hanno permesso di accertare, per i diversi settori presi in esame,
l’esistenza di problemi riguardanti la granularità e la semantica dei dati, nonché l’importanza di definire una struttura che, dando adeguato rilievo alle
specificità degli stessi, eviti l’appiattimento e quindi la perdita di efficacia del
sistema di ricerca così prodotto 9. A livello sperimentale, nel corso di questa
fase e in collaborazione con il Laboratorio di Fotografia della Facoltà del
Design è stata anche effettuata una crosswalk tra Dublin Core e IPTC (cfr.
paragrafo 6.2).
Oltre alla creazione di metadati di qualità, per il tipo di documentazione per
il design, è necessario anche poter raccogliere in modo facile ma selettivo
informazioni provenienti da un’ampia gamma di content-provider e utenti in
differenti localizzazioni. Con l’evolversi del progetto inoltre si evolvono anche
i bisogni: non è realistico aspettarsi che gli utenti specifichino in modo accurato e in anticipo le loro necessità informative. All’esterno ma anche nella
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 157
stessa comunità di pratica, il mancato riconoscimento della realtà del design,
che si basa su una metodologia progettuale, creativa e programmatica al
tempo stesso, è spesso causa di trappole tecnologiche per i progetti di catalogazione: i fornitori commerciali offrono soluzioni tecnologiche spesso basate
su generalità vaghe e idee incerte. Quando infine viene sviluppata qualche
soluzione tecnica che supera le precedenti, o la tecnologia è diventata obsoleta
o i requisiti sono cambiati e quindi il progetto fallisce. Un approccio più
pragmatico è quello di monitorare i progressi tecnologici e – quando le risorse e le competenze sono limitate – mantenere tutto il più semplice e modulare possibile.
In questo senso, il sottoprogetto di catalogazione e indicizzazione si è posto
quattro obiettivi principali:
- raccogliere la conoscenza degli individui che potrebbero influenzare il
life-cycle di un documento, incanalandole nei metadati;
- rendere questi contenuti disponibili per le attività di didattica e di
ricerca in ambito di dipartimento e facoltà, controllando e supportando il flusso informativo;
- generare record catalografici basati sullo standard Dublin Core, per
poter scambiare metadati con altre organizzazioni e iniziative;
- creare un vocabolario controllato per il design, come strumento di
supporto all’attività catalografica ma anche didattica e di ricerca, come
specchio del know-how e degli interessi della comunità del design.
I documenti digitali sono spesso caratterizzati dalla possibilità di essere restituiti in formati multipli. Si è quindi deciso di non seguire il modello catalografico centrato sull’item o sul formato, per abbracciare invece l’approccio
basato sul modello, in cui i documenti sono espressi in vari generi o eseguiti
molte volte e potrebbero essere prodotti in numerose manifestazioni. Dublin
Core ha permesso di sviluppare gli elementi di metadati predefiniti, e al
tempo stesso di condurre esperimenti su qualificatori ed elementi extra per
rifinire il modello.
Implementare standard e protocolli di catalogazione in un contesto come
quello del progetto DesignNet non è un’operazione banale, in parte perché vi
sono una miriade di piccole comunità (laboratori, unità di ricerca, singoli)
che devono essere persuasi a usare gli stessi standard e protocolli, in parte perché queste persone non si occupano normalmente di catalogazione, e per
questo motivo è necessario che capiscano alcuni elementi base della gestione
documetale e che vengano forniti loro degli strumenti semplici da usare in
modo che siano più disponibili a cooperare e che il loro lavoro sia così facilitato. La cooperazione di tante micro-comunità poneva il problema di condividere i record: in base alle analisi dei requisiti, come già osservato, è emerso
158 |
che nella maggior parte dei casi i documenti non venivano catalogati, e quando lo erano i metodi adottati non erano conformi agli standard.
Relativamente alla strategia e alla metodologia adottata per definire i metadati, sono state intraprese specifiche azioni per:
- sviluppare una mappa concettuale dei differenti tipi di documenti
usati in questo contesto;
- valutare standard e pratiche descrittive comunemente utilizzate nell’ambito del design;
- focalizzarsi sulla descrizione dei documenti, partendo da quelli non
bibliografici e concentrandosi in particolare sui rich media;
- sviluppare uno specifico profilo d’applicazione per la descrizione di
tali documenti, basato sugli attributi raccomandati dalla Dublin Core
Metadata Initiative (DCMI) e da qualificatori selezionati in base alle
esigenze dei partecipanti al progetto.
Si è ritenuto che il modo migliore di analizzare i documenti del design sia in
termini di vari livelli di granularità (o livelli di dettaglio).
La strategia e la metodologia sopraindicate sono state adottate in una modalità progressivamente partecipata con tutti i partecipanti a DesignNet, cui è
stato proposta ogni volta, sotto la supervisione di chi scrive, uno schema di
metadati iterativamente modellato sulle loro esigenze. La catalogazione è
cominciata partendo dallo schema di metadati descrittivi di Dublin Core
semplice, effettuando delle prove su file di Excel con diverse tipologie di
documenti, verificando l’efficacia dei record nel recupero del documento, e
identificando progressivamente una serie di qualificatori aggiuntivi utili
rispetto ai 15 elementi di base. In questo processo si sono parallelamente analizzate le attività del Sistema Bibliotecario di Ateneo del Politecnico di
Milano, prevedendo la possibilità di interazione con l’OPAC di Ateneo (il
sovrainsieme istituzionale di riferimento) tramite la mappatura dei metadati
da esso utilizzati. Dopo circa un centinaio di record compilati e di verifica
progressivo dello schema con i partecipanti, gli elementi e i qualificatori di
Dublin Core sono diventati sufficientemente più specifici e più complessi
nelle relazioni reciproche, rendendo possibile definire un profilo di applicazione del progetto DesignNet.
Il processo di numb down ai soli 15 elementi, così come è inteso dalla
DCMI, è rimasto certamente un’importante pietra di paragone per le nostre
attività collaborative, poiché appunto fornisce un core di elementi essenziali.
Se si cerca di rendere più ricca la descrizione, infatti, lo schema di DC rischia
di perdere in semplicità e vi è bisogno di un grande numero di qualificatori,
di schemi di codifica e di regole. Ciò nonostante, i profili di applicazione
stanno progressivamente diventando il metodo preferito di rappresentazione
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 159
dei principi sottesi al progetto di uno spazio informativo e sono condivisibili
attraverso registri di metadati in cui chi crea nuovi profili si assume la responsabilità di dichiararli e mantenerli per la comunità degli utenti della rete 10.
Nel progetto DesignNet il profilo d’applicazione prodotto, che al termine
della fase di sperimentazione verrà inserito nei registri creati, include:
- elementi obbligatori;
- elementi opzionali;
- qualificatori opzionali;
- elementi o qualificatori aggiuntivi provenienti da altri profili di applicazione;
- elementi utilizzati da altri namespace;
- schemi e valori permessi, che nel progetto includono schemi di codifica, un thesaurus per il design e delle liste di autorità;
- specifica delle definizioni (poiché in DesignNet si utilizza un linguaggio specifico di un certo ambito disciplinare);
- specifica dell’utilizzo (cioè delle opzioni, sottoinsieme e parametri di
valutazione lasciati aperti) di un particolare standard o gruppo di
standard per supportare un determinata applicazione, funzione (ad
es. la ricerca per autore, per titolo, per soggetto ecc.), comunità (ad
es. la comunità del design in ambito universitario, i designer professionisti, ecc.) o contesto (ad es. il Web, l’Italia, l’Europa).
Nell’elaborazione del profilo di applicazione sono stati presi in considerazione
anche i possibili metadati amministrativi, strutturali e di conservazione (cfr.
paragrafo 2.2.1). I metadati amministrativi previsti includono informazioni su
chi ha digitalizzato e come (hardware e software usati, modalità di compressione), chi è responsabile del documento e informazioni più dettagliate sulla
gestione dei diritti: ad esempio lo schema MAG, definito dall’Istituto Centrale
per il Catalogo Unico del Ministero per i Beni e le Attività Culturali.
Per gli scopi del progetto DesignNet, sono stati selezionati 8 elementi obbligatori per la descrizione dei documenti, mentre gli altri elementi sono considerati opzionali ma desiderabili (Tab. 1).
Alcuni partecipanti sceglieranno di compilare soltanto gli elementi obbligatori, qualcuno potrebbe usare elementi facilmente mappabili con o da il formato MARC e altri potrebbero scegliere di descrivere le loro risorse in modo più
approfondito, utilizzando tutti gli elementi a disposizione.
Le linee guida definite per il progetto descrivono i campi obbligatori e quelli
opzionali, indicazioni di compilazione per ogni campo.
I molteplici input e la raccolta di informazioni e competenze hanno reso evidente l’importanza, nella creazione di metadati per documenti del design, di
riportare questa operazione il più possibile vicino al luogo di creazione o di
acquisizione del documento, poiché lì è dove si coagula maggiore conoscenza
160 |
su di esso. Si è perciò scelto l’approccio che vede gli autori stessi e i gestori dei
documenti compilare il più possibile i metadati dei documenti, mentre si è
previsto che informazioni ulteriori (ad esempio di conservazione), revisioni
e/o correzioni siano effettuate da una unità di coordinamento del processo di
catalogazione. È stato inoltre previsto di condividere in partenza lo stesso
schema di metadati di base, e in seguito di entrare in contatto con schemi più
approfonditi mappabili con Dublin Core.
Come supporto a queste attività, è stato elaborato un documento che contiene il profilo di applicazione in forma di una tabella testuale, lo schema del
thesaurus e i criteri di catalogazione, un manuale di compilazione con esempi
per ogni tipo di documento e un glossario dei termini più utilizzati nel sistema (cfr. le appendici nel capitolo 7).
Il manuale di compilazione è finalizzato a favorire la consistenza dei record del
catalogo, e riporta una scheda descrittiva di ognuno degli elementi e dei qualificatori, di cui vengono forniti: la definizione, l’indicazione di obbligatorietà o
opzionalità, l’indicazione degli standard e schemi di codifica da adottare, esempi di compilazione per ogni tipo di documento. L’elaborazione del manuale
rappresenta una cartina di tornasole dei processi iterativi di verifica effettuati
con i partecipanti al progetto DesignNet, e riporta una serie di commenti a
margine dell’applicazione dello schema di Dublin Core.
Innanzitutto, le diverse rielaborazioni del manuale hanno evidenziato la difficoltà della spiegazione secondo un linguaggio user-friendly dei 15 elementi di
Dublin Core, così come sono stati tradotti dall’Istituto Centrale per il
Catalogo Unico. Nell’ambito del design ‘Creatore’ e ‘Autore di contributo
subordinato’ hanno dato luogo a numerose discussioni, così come il campo
‘Relazioni’. Inoltre, il manuale riporta i diversi tentativi di traduzione dei
qualificatori raccomandati dalla DCMI (non tradotti dall’Istituto Centrale
per il Catalogo Unico-ICCU) e di altri qualificatori utilizzati in diversi progetti di biblioteche digitali, dal Colorado Digitazion Project alla Cornell
University.
In base all’esperienza effettuata nelle prove di compilazione con i partecipanti,
in contrasto con la convenzione di cominciare il record con il campo del
‘Titolo’ si è consigliato di cominciare con il ‘Tipo’, poiché la conoscenza di
quello che si sta descrivendo aiuta a chiarire i valori degli altri elementi.
L’elemento ‘Formato’, in cui la DCMI raccomanda l’uso dell’Internet Media
Types (MIME), non contempla tutti i tipi di file: ad esempio non include i file
di Flash, per non parlare di molti formati di file di computergrafica (sebbene
nella comunità DCMI siano in corso di definizione delle proposte di aggiornamento. L’elemento ‘Relazioni’ e i suoi qualificatori, così come indicati dalla
DCMI, hanno dato origine a qualche confusione. In generale, è stato più volte
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 161
ricordato ai partecipanti che solo l’interpretazione e l’applicazione consistente
degli elementi è significativa, non le etichette degli elementi di per sé.
Un’altra questione affrontata è stata quella del’adozione di un protocollo di
interoperabilità, che andrebbe a vantaggio dell’editoria scientifica per il settore del design. Ad oggi infatti questo ambito non possiede, ad esempio, una
propria lista di periodici equivalente ai periodici ISI, e mentre a livello internazionale vi sono molti progetti già in atto, in Italia la ricerca scientifica universitaria ha pochissima visibilità, anche a causa dei strumenti che permettono di documentare le attività all’esterno. Spesso le pubblicazioni vengono
cedute ad editori commerciali senza vantaggi per gli atenei. Gli strumenti
software a disposizione oggi sono molteplici, e in particolare nel settore
dell’Open Source i costi sono ridotti 11. Tuttavia, le funzionalità di questi software non sono molto sviluppate, e se per l’avvio è necessaria una professionalità medio/bassa, per l’implementazione di questi programmi occorrono professionalità più elevate, sia in termini di sviluppo software che di raccordo
con le realtà istituzionali. Alcuni programmi come E-prints sono semplici da
installare ma gli autori vanno poi incentivati, servono politiche istituzionali
precise e un supporto tecnologico avanzato con servizi integrati con le altre
collezioni. Per tali motivi si stanno investigando le modalità di applicazione
nel progetto DesignNet del protocollo della Open Archives Initiative (OAI)
Progetto DesignNet - Dublin Core
Elementi obbligatori
Elementi opzionali
Autore
Autore di contributo subordinato
Data
Copertura
Diritti
Descrizione
Editore
Fonte
Formato
Lingua
Identificatore
Relazione
Soggetto
Tipo
Titolo
[Tab.1] Elementi definiti obbligatori e opzionali nello schema Dublin Core del Progetto
DesignNet
162 |
(il termine Open indica l’interoperabilità, mentre per Archives si intendono
dei depositi di lavori scientifici e altri materiali digitali). OAI si basa sul concetto di Open Access: accesso libero (senza barriere tecnologiche, legali, finanziarie) e utilizzo aperto (per scopi legittimi e legali). In tal modo l’autore del
documento mantiene tutti i diritti, ad esclusione di quelli commerciali.
Laddove tale strategia venga applicata sia agli Open Archives che agli Open
Access Journals, come nel caso di BOAI (Budapest Open Archives) 12, si può
permettere un accesso aperto a tutta la letteratura scientifica peer-reviewed,
con un notevole aumento dell’impatto in termini di download e citazioni.
5.2.3 Indicizzazione e information retrieval: il Design Thesaurus
Come è stato osservato nel paragrafo 2.2.7, per chi compila i record del catalogo e per l’utente che effettua la ricerca un thesaurus è sia uno strumento di
inserimento che di recupero dei dati. Il suo utilizzo risulta particolarmente
utile nel caso in cui un’organizzazione possieda grandi quantità di documenti
e di informazioni non strutturate e ‘atipiche’, e necessiti di controllare e di
fornire accesso a queste informazioni. Un thesaurus rappresenta uno strumento efficace di knowledge representation per l’inserimento dati (in fase di indicizzazione come vocabolario di termini, di relazioni semantiche, varianti e
sinonimi) e il loro recupero (nell’interfaccia utente come supporto alla navigazione) in ambienti di rete.
La selezione di uno strumento di indicizzazione ad hoc per il progetto è stata
preceduta da alcune riflessioni . Nel corso della fase di analisi dei requisiti del
progetto DesignNet, è stato osservato che mentre gli OPAC di biblioteche
generali si basano fondamentalmente sullo schema di Classificazione
Decimale Dewey per la classificazione e sulle liste nazionali di intestazioni di
soggetto per la soggettazione, i database specializzati sono dotati di vocabolari
specifici quali schemi di classificazione disciplinare o thesauri. Dopo un’indagine sui vocabolari attualmente disponibili online e offline, ad eccezione
dell’Art&Architecture Thesaurus del Getty Information Institute, è emerso
che in ambito nazionale e internazionale non risulta disponible un thesaurus
progettato esplicitamente per il design, un ambito interdisciplinare nel quale
è ben più difficile applicare schemi come la DDC e per il quale non esistono
schemi di classificazione di riferimento come quelli in uso nelle discipline
scientifiche 13. Inoltre è stata spesso segnalata la mancanza di identità metodologica e soprattutto di rigore terminologico nel linguaggio del design, che
spesso utilizza in modo specialistico vocaboli di uso comune.
Il concetto di granularità è stato applicato anche nella scelta del thesaurus
come strumento di indicizzazione, ritenuto efficace per migliorare la precisione
delle descrizione della tipologia di documenti del design, poichè una maggiore
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 163
esaustività, precisione e flessibilità rispetto alle classificazioni e ai soggettari esistenti. Le risposte che si ricevono nell’interrogazione di un catalogo dipendono
infatti dalle domande poste e dalla specifica struttura del catalogo: un thesaurus consente sia a chi si occupa della compilazione di un record, sia all’utente
che effettua una query, di muoversi in un continuum di concetti dal generale
allo specifico. Se si utilizzassero soltanto termini specifici, si perderebbero fonti
utili che non riportano quei termini; se al contrario ci servissimo solamente di
termini generali, otterremmo molti cosiddetti false drop. Questo processo riveste altresì una funzione conoscitiva preziosa in un contesto didattico, sia per
l’indicizzatore che per l’utente, favorendo la disseminazione di concetti relativi
al design e del loro significato ed utilizzo in una specifica comunità d’uso.
La progettazione di questo thesaurus in lingua italiana sulle discipline e tematiche inerenti il design, denominato Design Thesaurus, è avvenuto secondo i
seguenti criteri:
- conformità ai seguenti standard: UNI ISO 2788 Linee guida per la
costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985.
Metodi per l’analisi dei documenti, la determinazione del loro soggetto
e la selezione dei termini di indicizzazione; Guidelines for the
Construction, Format, and Management of Monolingual Thesauri
Document Number: ANSI/NISO Z39.19-2003, National Information
Standards Organization, 28 August 2003; Guidelines for Indexes and
Related Information Retrieval Devices Document Number: NISO TR02-1997, National Information Standards Organization, 1 January
1997;
- riferimento a esempi rilevanti di progetti di thesauri esistenti, in particolar modo all’Art&Architecture Thesaurus del Getty;
- sviluppo in-house di un software per la gestione del Design
Thesaurus, concepito come un database con struttura gerarchica,
consultabile a <www.designthesaurus.polimi.it>.
Oltre ad essere integrato nel catalogo del progetto DesignNet, è previsto l’utilizzo
indipendente del Design Thesaurus come banca dati terminologica sul design, in
continuo aggiornamento. Nelle implementazioni successive del sistema, si ipotizza
l’integrazione del sistema term-based del Design Thesaurus con un sistema content-based di Visual Retrieval per file 2D e 3D, che permette di effettuare query in
base al colore, alla forma, alla texture e alle relazioni spaziali di un oggetto digitale.
Da un punto di vista organizzativo, le attività relative alla creazione del thesaurus sono state programmate come segue:
1. preparazione: chi si occupa della compilazione del thesaurus deve
possedere ottime capacità analitiche e una conoscenza generale degli
argomenti trattati. Da un punto di vista concettuale, vi sono due
164 |
approcci distinti nella costruzione di un thesaurus, anche se nella
pratica, tuttavia, per la maggior parte dei thesauri si utilizzano
entrambi: il metodo top-down e quello bottom-up. Il metodo topdown consiste nel creare un gruppo di esperti nelle aree disciplinari
del thesaurus, per decidere lo scopo e l’ampiezza delle categorie dei
termini che verranno inclusi. Per decidere i termini da selezionare e
le loro relazioni vengono utilizzati dei dizionari e dei thesauri: l’insieme preliminare dei termini viene revisionato e organizzato decidendo
i termini preferiti, per passare poi alla selezione delle varianti e dei
sinomini e quindi alla costruzione delle relazioni associative tra i termini preferiti. La bozza di thesaurus che ne deriva viene quindi verificata e nuovamente revisionata. Nel metodo bottom-up, attraverso
una serie di fonti diverse i termini vengono selezionati e organizzati,
facendo riferimento ad un gruppo di esperti per termini il cui significato risulta ambiguo e per l’indicazione delle varianti e dei sinonimi
da preferire. La bozza di thesaurus che ne deriva viene quindi verificata e nuovamente revisionata. Sia scegliendo l’approccio top-down
che bottom-up, chi si occupa della compilazione deve inoltre possedere una capacità di comunicazione e coordinamento con interlocutori
di diverso livello, poiché la compilazione implica un’ampia quantità
di discussioni e di confronti;
2. raccolta, selezione e analisi dei termini. Lo stadio successivo nel
nostro progetto è stato quello di effettuare una investigazione preliminare della propria organizzazione e delle sue attività, attraverso:
- l’analisi della documentazione interna e delle diverse pubblicazioni dei membri dell’organizzazione;
- interviste campione del personale, per identificare i termini utilizzati dalle
persone e validare/potenziare le informazioni già raccolte dalle fonti documentali. Come operazione introduttiva alla raccolta delle informazioni,
somo stati identificati dei referenti chiavi che possano collaborare alla verifica dei termini raccolti nelle fasi successive;
- revisione delle liste di titoli e di parole chiave.
3. raggruppamento e sviluppo delle classi di concetti, utilizzando le funzioni, le attività, le transazioni e la terminologia individuate nella
seconda fase;
4. struttura di classificazione. I termini analizzati vengono organizzati in
uno schema di classificazione generale che includa e/o preveda:
- funzioni e le attività documentate dall’organizzazione;
- funzioni e le attività inerenti agli ambiti disciplinari trattati;
- terminologia non ambigua;
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 165
- classi discrete di termini;
- gerarchie organizzate dal generale allo specifico;
- termini verificate consultandosi con gli utenti del thesaurus.
5. collazione delle informazioni. Questa fase implica:
- vocabulary control: un processo di organizzazione delle liste dei termini indicizzati, indicando i termini preferiti e i gruppi di sinonimi, e distinguendo tra gli omografi (dallo standard Z39.19-1993);
- organizzazione dei termini preferiti in una struttura logica di termini generici e termini più specifici;
- elaborazione delle note d’ambito, con la descrizione di ogni termine e il modo in cui dovrebbe essere utilizzato, e
definizione/verifica dei termini associati.
6. compilazione: il tempo varia a seconda delle dimensioni dell’organizzazione, dell’esperienza dei compilatori e della loro disponibilità parttime o full-time al progetto;
7. verifica dei termini funzionali. In questa fase i termini selezionati
vengono verificati con le liste di parole chiave precedentemente raccolte, per assicurarsi che non vi siano duplicati o sovrapposizioni;
8. collazioni e verifica dei dati in un software per la gestione di un thesaurus,
controllando le inconsistenze, errori di battitura e di compilazione;
9. disseminazione della bozza del thesaurus nell’organizzazione, cosicché i
vari membri (sia gli alti quadri che i potenziali utenti) possano esprimere
commenti e suggerimenti al riguardo. Si effettua quindi la revisione della
bozza del thesaurus, incorporando in essa il feedback più rilevante;
10. verifica finale del thesaurus prodotto;
11. disseminazione del thesaurus completo. Questa fase implica l’accertamento che il thesaurus risponda ai requisiti dell’organizzazione e
agli standard in uso, e l’individuazione delle modalità e degli ambiti
in cui il thesaurus viene reso accessibile. Sulle versioni a stampa e in
digitale del thesaurus verrà indicata la data della release, e per completezza, riporterà le date di modifica di ogni termine del thesaurus;
12. implementazione. In questa fase si organizza la presentazione del thesaurus completo e si programma la sua implementazione futura. Si
tratta probabilmente di una delle fasi più complesse, poiché implica la
previsione delle politiche di sviluppo nella terminologia e nel software,
dell’integrazione tra il thesaurus e il database del catalogo, degli output previsti, dei fondi a disposizione, dei tempi di realizzazione. Prima
della release della versione implementata il thesaurus viene verificato
con un gruppo di testing, e parallelamente l’implementazione includerà il tirocinio degli utenti e l’analisi dei feedback degli utenti;
166 |
13. pianificazione della manutenzione. Molti problemi riguardanti il thesaurus e il suo utilizzo diventano manifesti solo quanto esso viene
applicato nella pratica quotidiana: occorre perciò pianificare un’accurata implementazione ogni 6-12 mesi, oltre a verifiche periodiche che
permettano di aggiornare il thesaurus all’evoluzione delle funzioni e dei
processi dell’organizzazione, e alle modifiche del linguaggio utilizzato.
Da un punto di vista concettuale, la progettazione del linguaggio di indicizzazione del Design Thesaurus (che si compone di una semantica degli attributi, una
semantica dei valori e una sintassi), è stata definita nei seguenti quattro passaggi:
1. analisi a faccette: specificazione della semantica degli attributi, consistente in un insieme di attributi e di relazioni sintagmatiche tra i vari
tipi di attributi, noto anche come ordine di citazione;
2. analisi del vocabolario: specificazione della semantica dei valori, riguarda un insieme di relazioni paradigmatiche tra tipi di versi di valori
(come avviene in un thesaurus che presenta relazioni di equivalenza,
gerarchiche e associative);
3. specificazione della sintassi: specificazione del formato, consistente in
sintassi del record (forma grammaticale della descrizione di un oggetto) e sintassi del campo (forma grammaticale della descrizione di una
proprietà);
4. organizzazione della classe (opzionale).
Sono state inoltre adottate le seguenti distinzioni:
- cose vs. simboli (cose: nel mondo esterno; simboli: utilizzati in un
linguaggio per rappresentare una cosa);
- elementi vs. insiemi (elemento: qualcosa di indivisibile; insieme:
qualcosa costituita da un certo numero di elementi);
- istanze/item/particolari vs. classi/tipi/universali (istanza: una particolare occorrenza di una cosa di un certo tipo; classe: un insieme universale di cose di un certo tipo).
È opportuno soffermarsi sull’articolazione a faccette, che assorbono l’intero
dominio concettuale espresso dal Design Thesaurus. Una faccetta indica un
gruppo di termini che condividono una singola, principale caratteristica (anche
se i termini potrebbero condividerne altre). Ad esempio, ‘legno’, ‘lana’, ‘polipropilene’, ‘rame e ‘acciaio’ condividono tutti la caratteristica di essere di essere dei
MATERIALI, sebbene alcuni di loro hanno in comune altre caratteristiche
come la combustibilità. Nell’ambito della faccetta, i termini possono essere suddivisi in un ulteriori subfaccette con caratteristiche secondarie: ad esempio nella
faccetta dei MATERIALI il legno e la lana appartengono ai materiali organici,
mentre l’acciaio e il rame ai materiali inorganici e specificatamente ai metalli.
Ogni gerarchia di termini necessita di un meccanismo per conservare l’ordine
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 167
e il livello di subordinazione dei propri contenuti, e per rappresentare i termini
stessi tramite un insieme di codici univoco e non ambiguo, che possa collegare
l’ordine gerarchico con l’ordine alfabetico o con la rappresentazione grafica. I
codici notazionali previsti nel Design Thesaurus utilizzano l’alfabeto romano: i
termini in lettere maiuscole indicano la faccetta o Top Term, e quelli in lettere
minuscole indicano i dettagli nella gerarchia. Inoltre i codici notazionali standard 14 (UF per i Sinonimi, BT per Termine Generico, NT per i Termini
Specifici, RT per i Termini Associati, SN per la Nota d’Ambito), permettono
la manipolazione efficace di un ampio numero di termini, consentendo ai software di effettuare verifiche di consistenza automatiche.
I codici notazionali facilitano anche la manipolazione dei termini per produrre
delle liste dai termini del thesaurus, organizzabili in una varietà di ordini e formati, e l’elaborazione del thesaurus finale mostrandone tutte le sue relazioni.
L’analisi a faccette permette dunque di organizzare i termini in piccoli gruppi
interrelati tra loro, in modo che ogni gruppo possa essere esaminato facilmente e efficacemente per quanto riguarda la consistenza, l’ordine, le relazioni
gerarchiche e associative e la loro accettabilità o meno nel linguaggio specifico
usato nei termini.
Essa fornisce anche la possibilità di designare in modo ordinato le relazioni
tra i termini, eliminando la necessità di assegnare relazioni BT e NT in modo
intuitivo, operazione che nei vocabolari di grandi dimensioni non è scevra di
errori ed omissioni. L’articolazione a faccette risulta essere utile anche per la
flessibilità che consente nel gestire l’aggiunta di nuovi termini e di nuove relazioni. Poiché ogni faccetta è indipendente, i cambiamenti possono in genere
essere operati facilmente senza bisogno di alterare il resto del thesaurus.
Un ulteriore beneficio di questo approccio è risultato evidente nella fase di
utilizzo sperimentale del thesaurus. Sia per chi compila i record di catalogo,
che per l’utente che ricerca un documento, un insieme di faccette gerarchicamente organizzate risulta più semplice comprendere, costituendo una mappa
concettuale che mostra il livello e insieme di associazioni di un termine, sia
negli output a stampa o a schermo di differenti formati del thesaurus che per
la rappresentazione nell’interfaccia di ricerca del catalogo online.
5.2.4 Authority file: la Design Directory
La comunità bibliotecaria ha da tempo definito gli standard sia per la descrizione
di entità bibliografiche, che per l’identificazione univoca di individui ed enti.
Tuttavia, per tradizione i bibliotecari si sono concentrati sul controllo dei nominativi e non sulla descrizione delle persone e organizzazioni corrispondenti. In altre
parole, gli standard dell’authority control biblioteconomico sono utili alla descrizione bibliografica tramite il controllo delle intestazioni o delle registrazioni usate.
168 |
Il controllo archivistico si differenzia da quello biblioteconomico poiché
necessita non solo di un controllo di autorità o di intestazione, ma anche di
una dettagliata descrizione biografica e storica delle entità nominate: le registrazioni archivistiche infatti hanno funzione di testimonianza sia legale che
storica, perciò documentare il contesto della creazione della registrazione è
essenziale. Quando l’organizzazione e la descrizione sono basate sulla provenienza, c’è una corrispondenza 1:1 tra la descrizione dell’unità archivistica e
l’entità produttrice, che rende logico documentare nello stesso apparato
descrittivo sia il creatore che i documenti creati.
A livello informatico, attraverso i linguaggi di mark-up e i database relazionali, la sfida di rappresentare queste informazioni in modo efficace ed economico ha imposto una analisi della logica e della struttura della descrizione, ed
una conseguente crescente differenziazione e definizione formale dei componenti della descrizione e delle loro relazioni.
In generale, partendo dall’assunto che «senza authority control la struttura
relazionale e la struttura sindetica del catalogo hanno fondamenta di argilla»
15
, si può affermare che promuovere il controllo dei punti di accesso attualmente è una attività indispensabile soprattutto in un contesto di network globale e di biblioteche digitali. Gli attuali sviluppi nel W3C sul Web semantico
stanno reinventando i concetti dell’authority control al fine di migliorare l’uso
del Web. Così come vengono posti in relazione con le descrizioni della documentazione archivistica prodotta, gli authority record di persone e di organizzazioni possono infatti essere connessi con risorse informative ad essi relative,
presenti in banche dati online.
La standardizzazione della descrizione del soggetto produttore offre sostanziali
benefici economici, dato che la descrizione degli individui, delle famiglie e delle
organizzazioni è una operazione onerosa in termini di tempo e di risorse umane
specializzate, il cui costo si va ad aggiungere alla descrizione dei documenti.
Tornando al caso specifico affrontato in questo volume, l’ampia interdisciplinarietà riscontrabile in un catalogo accademico richiede un’attenta selezione di
forme di intestazione standard. Il contesto e le esigenze della documentazione
del design sono per molti versi simili a quelli degli archivisti: descrivere il contesto, le circostanze della progettazione di un prodotto, i protagonisti primari e
secondari è importante per comprenderne le caratteristiche.
Per tale motivo, nel progetto DesignNet è prevista la creazione di una lista di
autorità specifica il mondo del design, denominata Design Directory e organizzata come un insieme di authority file di persone, organizzazioni e nomi commerciali di prodotti, secondo intestazioni omogenee e controllate. Insieme al
Design Thesaurus, con la Design Directory l’utente potrà passare senza soluzione di continuità da un thesaurus testuale di concetti, al catalogo dei documenti,
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 169
ai documenti stessi – se presenti in forma digitale e accessibili in base al copyright –, alle descrizioni dei produttori, stimolando così nuove costellazioni di
relazioni. Come il Design Thesaurus, la Design Directory crea una rete di sinomini e varianti collegati tra loro, sfruttando l’ipertestualità e le caratteritiche del
database relazionale. Inoltre, anche qui, è prevista la consultazione indipendente
delle liste di autorità dei produttori, che verranno così a costituire delle risorse
biografiche e storiche di cui è possibile registrare l’evoluzione nel tempo.
5.2.5 Modalità di lavoro collaborativo
Nella biblioteconomia viene espressa l’idea che non tutta l’informazione sia
conoscenza, ma diventi tale solo quando viene mappata ad una struttura
cognitiva, ad esempio organizzata in modo tale da diventare accessibile e
comprensibile agli utenti. Di fatto potrebbero esistere molte strutture cognitive per organizzare lo stesso tipo di informazioni, a riprova del fatto che il
contesto e lo scopo sono essenziali per trasformare le informazioni in conoscenza. Ciò implica anche l’importanza di identificare la cosiddetta ‘comunità
di interesse’ sia per i produttori che per i consumatori di informazioni.
Il termine ‘comunità’ sta diventando sempre più ubiquo, in particolare in
relazione ai servizi personalizzati su Internet, ma con varie accezioni. Una
definizione culturalmente sofisticata è quella di una comunità i cui membri,
in aggiunta alle due precedenti condizioni, condividono lo stesso vocabolario,
semantica e teoria di organizzazione delle informazioni. Per i membri di questa comunità esistono degli obiettivi comuni e concetti con cui condividere
idee ed esperienze.
L’analisi del consenso è basata su semplici assunti: la conoscenza è sia distribuita che condivisa in un dato ambito, e ogni gruppo di esperti delle aree di
questo ambito possiede esperienze diverse. La condivisione delle informazioni
facilita la disponibilità di un bacino di informazioni con una distribuzione di
conoscenza non uniforme attraverso i vari gruppi. Il processo di mappare le
informazioni su tale consenso rappresenta l’essenza della creazione della conoscenza culturale, tema che permette di identificare quattro aree di ricerca
principali: acquisizione dell’informazione, derivazione della conoscenza, rappresentazione della conoscenza, riutilizzo della conoscenza.
Il sistema DesignNet è stato progettato come il punto di raccordo dei dati
descrittivi e terminologici, e più in generale dei flussi informativi, che vengono validati dopo una fase di normalizzazione su base collettiva. Si prevede il
coinvolgimento attivo della comunità dei fornitori di contenuto e degli utenti, che plasmano il sistema attraverso una catalogazione e indicizzazione partecipata, resa possibile tramite istruzione dell’utenza e continui interfacciamenti
con essa. A vari livelli gli utenti si affiancano alla unità di documentazione
170 |
nelle attività di selezione, indicizzazione e catalogazione delle risorse disponibili; per garantire il controllo sulla qualità, le attività di catalogazione e indicizzazione sono accessibili tramite password con diversi livelli di autorizzazione. Il sistema richiede che i partecipanti al progetto imparino a collaborare, a
condividere le risorse e ad adottare un livello catalografico standard.
L’obiettivo è quello di coinvolgere l’intera la comunità dipartimentale e di facoltà
nel sistema: essendo costituita non soltanto da docenti strutturati, ma da un alto
numero di docenti a contratto e di collaboratori spesso professionisti, per ricchezza
ed eterogeneità di argomenti trattati e attività in corso essa sembra infatti costituire
un buon campione rappresentativo del mondo del design. In molti modi, si tratta
del paradigma del Web in opera: più la rete (nel nostro caso il catalogo, il Design
Thesaurus e la Design Directory) cresce, e più essa diventa utile. Consolidata l’adesione interna, è previsto il rafforzamento del coinvolgimento di istituzioni esterne
(in particolare i musei d’impresa e gli archivi del design), con l’obiettivo di istituire
un network regionale (e in prospettiva nazionale e internazionale) per il design.
Il livello comune di catalogazione dovrebbe essere minimo, con informazioni
essenziali ritenute sufficienti a individuare e a caratterizzare il documento.
L’adozione di un eventuale livello più analitico è demandato alla disponibilità
dei singoli partecipanti, ed è giustificato dalla necessità di descrivere in modo
più dettagliato specifici materiali.
Un’unità di documentazione dedicata collabora con i fornitori di contenuto
per l’implementazione di un Thesaurus per il Design e per l’identificazione e
la selezione di nuove risorse e servizi da includere nel gateway. L’unità valida
le proposte, verifica direttamente in rete i relativi record (compilati, secondo
un’estensione del principio di catalogazione partecipata, sia da fornitori di
contenuto riconosciuti che da utenti), provvede ad una loro eventuale integrazione e li valida includendoli nel database. Questo tipo di workflow e l’architettura di sistema che lo supporta consentono di effettuare velocemente
modifiche di informazioni sul lato server e di renderle immediatamente
disponibili agli utenti (Tab. 2). Durante il processo di formazione e di verifica, i dati possono essere consultati solo da parte degli utenti abilitati ad operare nei rispettivi ambiti di competenza. I dati che hanno superato l’intero
processo descritto ottengono lo status di ‘dati validati’ e possono essere resi
disponibili per la fruizione alle diverse tipologie d’utenza.
Le esperienze maturate in vari progetti catalografici negli ultimi anni hanno
evidenziato l’onerosità e l’inadeguatezza del controllo e della correzione condotti a posteriori (come ad esempio lo schiacciamento dei dati catalografici
duplicati), spingendo sempre più a favore di un forte impegno nella definizione di conoscenze diffuse e di competenze decentrate. Per tale motivo nel progetto DesignNet si è scelta la strada del decentramento, formazione continua e
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 171
tutoraggio, con tirocinio e assistenza durante le attività di routine.
Il passaggio finale nel processo di creazione dei metadati prevede l’intervento
di un esperto che verifichi il record finale con i metadati, e individui eventuali inconsistenze nei metadati o delle possibili integrazioni dei record. I metadati verosimilmente non saranno statici ma cambieranno nel tempo: per tale
motivo la loro creazione non è un’operazione che avviene una sola volta ma
piuttosto un processo iterativo, che richiederà verifiche periodiche.
Documentare manualmente i passaggi di elaborazione degli insiemi di dati
individuali è generalmente riconosciuto come non fattibile e oneroso. Queste
operazioni possono essere tracciate più facilmente con strumenti di estrazione
dedicati, e i principali passaggi cumulativi di elaborazione si possono riservare
ai metadati. Tra gli elementi previsti per i metadati strutturali, vi sarà un
campo specifico per questo scopo: una data programmata di revisione.
L’obiettivo successivo al conseguimento della validazione qualitativa dei dati
catalografici è quello della loro uniformità di presentazione sul Web, per
poter costituire un patrimonio unico, condiviso e omogeneo organizzato
attraverso una architettura informativa multilivello, personalizzabile in base
Proposta di,
catalogazione,
indicizzazione
Data entry
Coordinamento,
revisione,
validazione
Consultazione
Manipolazione
Selezione
risorse
utenti
generici
- unità di
documentazione
- content provider
- utenti autorizzati
unità di
documentazione
utenti
generici
utenti
autorizzati
Catalogazione
con Dublin
Core
utenti
generici
- unità di
documentazione
- content provider
- utenti autorizzati
unità di
documentazione
utenti
generici
utenti
autorizzati
Indicizzazione
con Thesaurus
del Design
utenti
generici
- unità di
documentazione
unità di
documentazione
+ Gruppo di
Studio sulla
Terminologia
del Design
utenti
generici
utenti
autorizzati
Directory
del Design
utenti
generici
- unità di
documentazione
- content provider
- utenti autorizzati
unità di
documentazione
utenti
generici
utenti
autorizzati
[Tab.2] Definizione del workflow e delle modalità di accesso dei servizi nel progetto DesignNet
172 |
alle esigenze degli utenti. I dati possono cioè essere organizzati secondo esplicite richieste, oppure in base alle indicazioni dedotte dal monitoraggio, dalla
bonifica e dall’analisi statistica sull’utilizzo del sistema da parte degli utenti,
secondo una modalità iterativa che beneficia dell’effettivo coinvolgimento
degli utenti nella fruizione.
5.2.6 Management e visualizzazione di risorse eterogenee complesse
Una biblioteca digitale può funzionare solo se viene gestito in modo rigoroso
l’intero ciclo di vita degli oggetti digitali, e per fare ciò il sistema deve essere
sufficientemente versatile per descrivere in modo appropriato i documenti,
supportare formati presenti e futuri, essere in grado di migrare i contenuti tra
i diversi tipi di documenti, essere accessibile all’esterno e contenere le informazioni necessarie di copyright e di autorizzazioni.
Un problema fondamentale delle collezioni di risorse eterogenee complesse
come multimedia e rich media in applicazioni Web-based, spesso conservate
in repository diversi secondo standard e formati differenti, è quello della loro
gestione e visualizzazione con un’interfaccia di ricerca unica e omogenea 16.
Le varie soluzioni offerte dal mercato variano a seconda della complessità,
della performance e dei costi. La soluzione ideale dipende dai propri specifici
bisogni: ad esempio dimensioni del database, volume ipotizzato della domanda, volatilità dei dati, disponibilità delle risorse tecniche. Altri elementi da
considerare sono l’accesso ad un vocabolario controllato, la flessibilità nella
progettazione del database, la lunghezze di vita prevista per i dati, il potenziale per la migrazione, l’aderenza agli standard dei database e agli standard di
contenuti di dati. Oggi si possono identificare tre classi di sistemi di gestione
di documento testuali e audiovisuali:
1. applicazioni generiche di database (desktop e client/server);
2. programmi specializzati di gestione delle immagini (desktop e
client/server);
3. soluzioni basate su SGML e XML.
I più comuni programmi desktop del primo gruppo sono MS Access,
Filemaker Pro; le applicazioni più comuni client/server sono Oracle, Informix
(incluso Illustra), 4th Dimension e applicazioni object-oriented. I vantaggi dei
programmi desktop riguardano i bassi costi iniziali, la relativa facilità di programmazione e utilizzo, la semplicità dei moduli di data import ed export e la
crescente disponibilità di aggiunte commerciali, specialmente di strumenti
Web. Tuttavia essi presentano poca scalabilità, poche strutture standard di
dati, la necessità di personalizzare l’interfaccia Web e gli alti costi della programmazione, espliciti con le grandi applicazioni e nascosti ma comunque
presenti con le applicazioni desktop.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 173
Del secondo gruppo fanno parte soluzioni desktop commerciali: ad esempio
Cumulus della Canto, ImageAXS, Portfolio (già Fetch), Luna Imagining
Insight, ContentDm. I vantaggi di gestione, nelle immagini in particolare,
sono certamente la struttura predefinita dei dati, i link costruiti dentro le
immagini, la funzionalità cross-platform e link inseriti dentro per il Web di
alcuni di essi, e una minore capacità di programmazione richiesta per l’implementazione. Di contro, gli svantaggi riguardano proprio la struttura fissa dei
dati, strutture proprietarie di database, una possibilità di personalizzazione
limitata e l’accesso Web possibile principalmente tramite script. I programmi
specializzati di gestione delle immagini client e server sono principalmente
software per biblioteche per biblioteche digitali, programmi destinati ai
musei, applicativi per la gestione dei documenti e per i multimedia.
Analizzando l’ambito oggetto di questo volume, ovvero i sistemi automatizzati per le biblioteche, gli applicativi che gestiscono anche immagini includono
VTLS, CARL OCLC Sitesearch, Voyager ed Encompass della Endeavor, prodotti che in generale presentano ancora un’integrazione parziale tra immagini
e testi, l’assenza di standard comuni per i repository e per l’utilizzo dei metadati, difficoltà nella gestione delle attività amministrative.
L’ultimo gruppi dei sistemi in esame utilizza un nuovo approccio: l’uso di
metadati codificati con SGML o XML, basandosi sulla definizione del tipo di
documento (DTD: Document Type Definition). Tra gli esempi vi sono il
California Heritage Project, che archivia le immagini utilizzando l’Encoded
Archival Description (EAD), i testi che usano Ebind (un DTD di rilegatura
elettronico), e il completo sistema di gestione Agora. I motivi per prendere in
considerazione l’uso del SGML sono molteplici: innanzitutto questo linguaggio di marcatura è basato su uno standard internazionale, e i DTD stessi
potrebbero diventare degli standard (basti pensare al MOA2). Inoltre SGML
potrebbe essere più appropriato per una descrizione orientata al testo, ed è
possibile creare dei link tra altre risorse codificate in SGML o XML. Ma esso
presenta anche degli svantaggi: pochi client nativi supportano SGML, i
motori che lo utilizzano potrebbero non essere potenti come i database relazionali, i database in XML sono attualmente ancora in fase di sviluppo, i software nativi in SGML tendono ad essere piuttosto costosi, e spesso è più facile
immagazzinare i dati in un database e scriverlo senza i tag SGML o XML per
lo scambio o l’export.
Gli attuali software di ricerca cross-database attualmente sembrano rappresentare una buona soluzione per un accesso unificato soprattutto per la scoperta
di informazioni generiche. Questi strumenti non soltanto ricercano i cataloghi di biblioteca ma anche per database commerciali di abstract e indici,
motori di ricerca e una varietà di altri database, spesso effettuando la riunione
174 |
e l’eliminazione dei risultati doppioni (de-duping). Varie biblioteche internazionali utilizzano software come MuseGlobal, EnCompass, WebFeat,
MetaLib, MetaStar e Millennium 17. I prodotti sul mercato variano abbastanza
per caratteristiche, stabilità e facilità di implementazione: in alcuni casi
potrebbe essere necessario solo un minimo di configurazione alle interfacce
utenti di questi prodotti, mentre in altri occorrerà effettuare ulteriori implementazioni e potenziamenti dei sistemi, sempre che i vincoli tecnologici e le
restrizioni imposte dalle software house lo consentano.
Bisognerà in ogni caso mettere in conto modifiche continue al database, alle
interfacce e ai metadati, al tempo stesso monitorando attentamente lo sviluppo degli standard dei database di immagini nella propria area di interesse. Nel
caso di biblioteche universitarie, verosimilmente, l’implementazione e la
manutenzione necessaria per questi software sembra tuttora notevole, e
rimangono aperte le questioni del protocollo di ricerca e della efficace eliminazione dei risultati doppioni.
Un altro problema non indifferente è quello del relevance ranking: ottenere
dei risultati di ricerca da una varietà di fonti è assai elencarle in ordine di rilevanza. Per calcolare la rilevanza, il sistema deve supporre che alcuni documenti siano relativi ai bisogni degli utenti, e deve anche cercare di determinare
quali item soddisferanno meglio i bisogni degli utenti, spesso disponendo
solo di informazioni molto ridotte. Con i record MARC ad esempio non è
possibile, e poiché le biblioteche usano sempre di più sistemi basati
sull’OpenURL (come SFX di Ex Libris), è difficile o quasi impossibile conoscere in anticipo se una dato risultato di ricerca può essere accessibile online.
Alcuni progetti degli ultimi anni, tra cui quello della California Digital
Library, hanno indicato che:
- non sempre i migliaia di risultati ottenuti attraverso ricerche crossdatabase sono utili;
- non sempre le soluzioni che comprendono tutti i database soddisfano
i bisogni fondamentali degli utenti;
- se da un lato della scala degli utenti vi sono gli studenti non laureati,
che tipicamente hanno bisogno solo di un qualche documento da
citare nei loro lavori, all’altro capo della scala vi sono gli studenti laureati o i membri della facoltà che richiedono documenti molto più
dettagliati su una certa disciplina o un dato problema. Una soluzione
a misura unica che vada bene per tutti non accontenta nessuna di
queste due categorie.
I risultati del benchmarking tra i diversi applicativi – unitamente ad alcuni
vincoli di tipo economico – hanno portato alla scelta di sviluppare internamente al Dipartimento INDACO gli applicativi per il progetto DesignNet.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 175
La soluzione identificata è stata quella di associare i metadati alle risorse
dentro un Relational Database Management System (RDBMS) con interfaccia Web appositamente creato. Questa soluzione permette di utilizzare
sistemi di Information Retrieval e di manipolazione delle risorse attraverso
l’utilizzo di Java e dell’eXtensible Markup Language (XML), che consentono l’accesso non soltanto ai metadati ma alle risorse stesse (utilizzando una
chiara codifica degli standard di archiviazione per le risorse digitali).
Sebbene i RDBMS possano presentare limitazioni dovute a restrizioni di
lunghezza e problemi relativi ai campi multipli (e in Dublin Core tutti i
campi sono ripetibili), un sistema object-oriented come allegro-C 18, attualmente in utilizzo in alcuni progetti tedeschi sui metadati, non è sembrata
un’alternativa migliore.
Per quanto riguarda i risultati della query, la tradizionale visualizzazione di
dati è in genere focalizzata su un approccio descrittivo testuale piuttosto che
visuale. Una soluzione alternativa potrebbe essere quella della restituzione
accurata dei dati testuali, cercando però al tempo stesso di evidenziare percorsi significativi attraverso l’utilizzo di elementi grafici codificati. Questo
approccio di ‘visualizzazione semantica’ 19 introduce una valutazione sul significato e la rilevanza dei dati nel processo evocativo di visualizzazione.
Nell’ambito del design (come anche in altri settori) ciò consentirebbe di soddisfare alcuni bisogni specifici, quali ad esempio la possibilità di recuperare
materiali (soprattutto visuali) che altri membri della comunità hanno valutato
come interessanti, ottenere i risultati della ricerca filtrati o elencati in base a
regole basate sulla qualità delle risorse, conoscere le modalità di utilizzo di
alcune risorse da parte di altri utenti. Inoltre attraverso una visualizzazione
grafica dei risultati delle query, il surfing – considerato negativamente come
una perdita di tempo che abbassa la qualità dei risultati ottenuti – viene trasformato nel più positivo concetto di serendipity.
Dal punto di vista catalografico, si prevede che tutti i documenti catalogati
confluiscano in un OPAC arricchito (comprensivo di risorse possedute in
locale e di risorse ad accesso remoto), strumento di accesso unico e omnicomprensivo, dotato di filtri incrociabili, ad esempio per restringere la ricerca alle
sole risorse analogiche, oppure solo a quelle consultabili a distanza secondo
accessi diversificati.
Nel sistema così definito, una collezione tipicamente includerà documenti
digitali e riproduzioni digitali di documenti analogici (contenuti) e supporti di accesso coerenti (tipicamente, un insieme di record descrittivi e
dei finding aid). Un documento potrebbe rappresentare un gruppo di
documenti fisici che vengono descritti, identificati e presentati come un
insieme. Un link a livello di documento punta ad un singolo oggetto digi176 |
tale, singolo o più spesso multiparte. I collegamenti tra i finding aid e i
documenti saranno allo stesso livello della descrizione, normalmente per
un documento o un gruppo di documenti collegati che viene descritto
come un insieme. Perciò, un link da un record descrittivo dovrebbe puntare ad una rappresentazione Web-based di un oggetto digitale corrispondente al documento descritto, e questa rappresentazione potrebbe a sua volta
costituire un documento di per sé: la copertina di un libro sarà cioè presente nel record del volume in oggetto, ma, se ritenuta utile come esempio
di grafica, avrà un proprio record. Se un gruppo di item fisici viene
descritto come insieme, il record descrive il gruppo e possiede un link ad
una presentazione del gruppo visualizzato come una sequenza di thumbnail (che sarà visibile come un multi-view object, ovvero come immagini
multiple di un documento), un indice dei contenuti o qualche altra forma
di anteprima che fornisca dei link ai documenti individuali, o al primo
documento con opzioni di navigazione. La scelta varierà con il tipo di
documento e le preferenze degli utenti.
È prevista la distinzione fra la presentazione del record destinata all’utente e
quello ad uso di chi si effettua la compilazione: il primo conterrà solo gli
elementi funzionali alla ricerca, mentre nel secondo verranno visualizzati i
dati gestionali e amministrativi (come il numero di inventario, i software e
le procedure necessarie alla conservazione) e le notizie di servizio (come il
tracciato).
Contestualmente, è stato analizzato il processo di recupero dei documenti,
tipicamente reiterativo, sotteso all’interfaccia grafica prevista e i relativi
processi di valutazione e di perfezionamento della query. Nel progetto
DesignNet sono stati adottati approcci consolidati nell’area
dell’Information Visualization: incorporare la visualizzazione e l’interazione nella funzione di recupero dell’infor-mazione può migliorare in modo
notevole la performance di richiamo dei documenti 20. La rappresentazione
grafica dei risultati e il recupero dei risultati intermedi da un lato stimola il
processo di valutazione sfruttando la capacità umana di valutare facilmente
le informazioni visuali, dall’altro permette all’utente di controllare interattivamente il processo di perfezionamento delle ricerche, identificando
insiemi di documenti rilevanti. Perciò, oltre ad una rappresentazione lineare, DesignNet si pone l’obiettivo di una visualizzazione di relazioni più
dettagliate tra i risultati della ricerca e la formulazione, ribadendo l’importanza di restituzione del contesto. Nella GUI le relazioni tra differenti
documenti, scelte in base a parametri che possono variare dalla tipologia
dei documenti al tipo di file di un documento digitale (sfruttando cioè
tutte le informazioni dei vari campi della scheda di catalogo), vengono
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 177
mappate con differenti proprietà visive come il colore e la forma. Questo
approccio permette di mostrare differenti dimensioni usando proprietà
distinte, in modo che un osservatore umano possa immediatamente riconoscere pattern importanti che gli permetteranno un eventuale perfezionamento della query. Nel processo di richiamo dei documenti sono stati
distinti quattro differenti subcompiti:
1. formulare una ricerca che descrive il tipo di documenti che si stanno
cercando;
2. effettuare la ricerca e ottenere un insieme di risultati;
3. rappresentazione dell’insieme di risultati;
4. valutazione dell’insieme di risultati.
La formulazione della query viene di volta in volta adattata alle intenzioni di
recupero e ai risultati intermedi precedenti la sua esecuzione. Infine quando
l’iterazione converge, viene generata una query ritenuta adatta a recuperare il
risultato migliore: l’insieme di risultati ottenuti con questa ricerca contiene
cioè i documenti che soddisfano al meglio i criteri di selezione. La visualizzazione grafica permette all’utente di individuare meglio dei percorsi specifici
nella valutazione della query e trasforma quindi la sua percezione nella sua
riformulazione: la capacità umana di riconoscere dei pattern o certe composizioni geometriche e di associarle instantaneamente a determinate interpretazioni permette un incremento nella performance della valutazione dei risultati. Inoltre incorporare metodi e tecniche di interazione come la manipolazione diretta o indiretta e meccanismi di feedback può facilitare il perfezionamento della ricerca.
Per essere realmente efficace, tuttavia, pur favorendo quel concetto di serendipity
che abbiamo visto essere funzionale alle modalità di apprendimento e di lavoro
nel design, il processo di recupero dovrebbe essere integrato da specifici logaritmi
di recupero, sia per il recupero term-based che, in prospettiva, per quello content-based (cfr. il paragrafo 2.2.5). Tali logaritmi, in particolare, saranno necessari nella gestione di un repository di grandi dimensioni, poiché la quantità di
documenti recuperati nei risultati può raggiungere dimensioni notevoli.
5.2.7 Un Learning Resource Centre per il design
Dai processi di design, basati su modalità di lavoro collaborative, come si è
visto derivano una molteplicità di output e documenti eterogenei. Ad un’interfaccia digitale, costituita da un Quality-Controlled Subject Gateway e dalle
sue componenti descritte nei paragrafi precedenti, occorre allora far corrispondere un’interfaccia analogica, un luogo di accesso e consultazione dei
documenti analogici, di incontro della comunità di didattica e di ricerca e di
occasione di attività di vario tipo. Tale luogo dovrebbe presentare spazi colla178 |
borativi per attività basate sulla circolazione della conoscenza, nei quali l’ambiente fisico e quello virtuale non siano contrapposti ma integrati sinergicamente per una compenetrazione degli strumenti di lavoro.
Nell’ambito del design, ad oggi si è tentato di dare una risposta a questa esigenza attraverso tre diverse soluzioni: i cosiddetti design centre, i centri di
documentazione e gli archivi per il design.
I design centre 21 sono delle strutture pubbliche finalizzati alla promozione,
sensibilizzazione e diffusione delle tematiche inerenti il design e delle politiche industriali nazionali, puntando sull’organizzazione di manifestazioni,
mostre ed eventi come strumento di diffusione delle cultura del design sia
per le aziende che per il pubblico in generale, erogando servizi specifici in
base alle necessità delle aziende e alla particolare tipologia di centro. In
Europa e nel mondo il modello dei design centre ha riscosso successo (si
pensi, solo per citarne alcuni, al Design Exchange, all’Internation Council
of Industrial Design o al Centre Design Rhone-Alpes), mentre in Italia
non si è ancora diffusamente affermato a causa in parte della specificità del
variegato e frammentato tessuto industriale italiano, e dell’impegno statale,
che ha attribuito alle tematiche del design una scarsa importanza nel raggiungimento degli obiettivi sia aziendali che dell’intero sistema produttivo
nazionale. Uno dei compiti dei design centre è quello di diffondere informazioni e attraverso queste sviluppare la cultura del design: in questa ottica, essi si occupano tangenzialmente anche di attività documentali e di
banche dati.
I centri di documentazione, da parte loro, si dedicano ad attività ad elevato
contenuto specialistico, selettivo e aggiornato, a supporto di attività di didattica, ricerca e formazione, che sembrano soddisfare le esigenze di una struttura di questo tipo 22. Specificatamente, le finalità dei centri documentazione
comprendono:
- la trasformazione e la riduzione del documento a unità informative,
la creazione di lessici documentari e di thesauri, lo sviluppo di sistemi
informativi, l’archiviazione, il recupero e la circolazione delle informazioni;
- la promozione di attività di formazione per favorire l’utenza e l’utilizzazione più adeguata dei servizi di documentazione ed informazioni;
- l’organizzazione, il supporto e/o la consulenza per ricerche di vario
tipo e organizzazione di attività culturali quali convegni, mostre ecc.
A fronte di queste esperienze, nel mondo delle biblioteche, e di quelle universitarie in particolare, negli ultimi anni si è affermato sempre più una visione
sistemica della biblioteca come nodo di una rete, e prima di tutto luogo di
incontro, di socializzazione, è un luogo capace di trasmettere, citando Michel
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 179
Melot, un ‘sentimento di comunità provvisoria’. È proprio in ambito didattico e universitario, come si è visto (paragrafo 1.2.3) che è in corso la definizione di nuovi modelli concettuali e progettuali, quali ad esempio i learning
resource centre, concepiti come centri funzionali e flessibili di risorse e luogo
di molteplici attività di studio, di ricerca e di interazione sociale.
Dagli aspetti tipici dei centri di documentazione, un learning resource centre per
il design può derivare l’alta specializzazione delle attività di catalogazione e indicizzazione, collezioni documentali selezionate e aggiornate, il focus su attività di
formazione, ricerca e information literacy. Dai design centre, esso può trarre un
approccio proattivo e propositivo, orientato alla ricerca e alla sperimentazione,
alla collaborazione con istituzioni e aziende, all’organizzazione di eventi culturali
e mostre, alla disseminazione in varie forme della propria attività. Allo stesso
tempo, andrebbe dedicata speciale attenzione ad un approccio personalizzato in
base ai bisogni e alle esigenze dei content provider e degli utenti.
Il principio alla base di una tale struttura, così come è stata ideata per il progetto DesignNet, è una concezione del design come processo di ricombinazione creativa. Seguendo il modello di biblioteca a tre livelli di Heinz
Hemunds, a livello architettonico un learning resource centre per il design
dovrebbe comprendere:
- un settore d’ingresso, provvisto di guardaroba, libreria, servizio di
ristorazione, banco informazioni, materiali informativi sulla biblioteca e generali, postazioni informatiche utilizzabili in piedi e in modo
diretto e rapido. Con la tessera magnetica di riconoscimento il lettore
può controllare la sua situazione di utente o avere informazioni nell’ambito delle proprie specifiche aree di interesse;
- la collocazione integrata del patrimonio: la distribuzione dei documenti non può essere effettuata in base al tipo di supporto. L’utente
deve poter accedere a qualsiasi tipo di informazione in modo integrato, servendosi di tag elettronici;
- zona di reference, zona di lettura (in biblioteca non si va solo per
prendere in prestito opere ma per studiare, per leggere, per informarsi, per lavorare in gruppo), zone pluriuso (la biblioteca come luogo di
accrescimento culturale individuale e collettivo, quindi servono spazi
da adibire a rotazione a diversi tipi di attività).
Le fasi di progettazione si conformano a quelle già identificate per le biblioteche:
- il funzionamento generale della struttura (programmazione del servizio);
- il dimensionamento, i requisiti e l’assetto distributivo degli spazi e
degli arredi per un corretto svolgimento delle funzioni previste;
- l’immagine della biblioteca, la sua qualità formale, i materiali, i colori, gli impianti ecc. nel rispetto del vigente regolamento edilizio per i
180 |
locali pubblici e del modello dimensionale precedentemente elaborato (progetto architettonico);
- la scelta degli arredi e dei complementi di arredi (progetto di arredo).
L’uso delle tecnologie digitali dovrebbe avvenire a diversi livelli:
- automazione dei servizi (catalogazione, reference, document delivery,
prestito interbibliotecario…) e le attività amministrative;
- gestione in rete dei rapporti tra partner e fornitori;
- collegamento con Intranet e Internet;
- produzione di un proprio sito Internet e possibilità di accesso ai servizi in linea non solo in sede ma anche a terminali remoti;
- postazioni con terminali in rete e senza terminali ma cablati, per chi
volesse recarsi in biblioteca con il proprio portatile. Poter usufruire
dalla propria postazione di un terminale consente un nuovo tipo di
lettura ‘contaminata’, ovvero consultazione non solo di tradizionali
materiali cartacei ma contemporaneamente anche di documenti multimediali, per effettuare una ricerca incrociata senza limiti di supporto e favorire un processo associativo di conoscenze e nuove idee.
5.2.8 Risultati e problemi incontrati
Nella fase di progettazione del sistema si è giunti alla definizione di:
1. definizione del workflow e delle modalità di accesso dei servizi messi
a disposizione nel progetto DesignNet;
2. uno schema di metadati ad hoc per l’ambito del design, suscettibile
di ulteriori perfezionamenti nelle successive fasi di testing e di messa
a regime;
3. strumenti di indicizzazione specifici per il design in forma di un
vocabolario controllato e strutturato e degli authority file;
4. modalità di gestione, restituzione e visualizzazione dei documenti dal
punto di vista informatico;
5. un modello di riferimento per la creazione di un’interfaccia fisica (un
learning resource centre per il design) dell’interfaccia digitale del
sistema delineato;
6. disseminazione dei risultati ottenuti in ambito dipartimentale e di
facoltà.
Per quanto riguarda gli schemi di metadati, si è riscontrata l’assenza di
uno standard catalografico unico nella gestione di giacimenti documentali
del mondo del design, sia a livello nazionale che internazionale. La scelta
di Dublin Core non è stata indolore, poiché la mappatura di metadati
non è una mera operazione automatica. Al tempo stesso, anche i vari profili di applicazione di Dublin Core si presentano come diversi dialetti,
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 181
con la presenza di differenti elementi e qualificatori e a volte una interpretazione dissimile dei medesimi elementi e qualificatori. I qualificatori,
come già evidenziato nel paragrafo 2.2.3, permettono di aumentare la
specificità della descrizione ma al tempo stesso rischiano di comprometterne l’interoperabilità. Per tale motivo è stato ritenuto fondamentale conformarsi per quanto possibile a standard e schemi di codifica, dichiarando
esplicitamente i riferimenti adottati. È state altresì effettuata una crosswalk di verifica con Dublin Core dell’unico standard formalizzato utilizzato nei laboratori del Dipartimento INDACO: lo standard americano
IPTC (cfr. paragrafo 6.2).
Per quanto riguarda gli identificatori, è stato preso in considerazione il DOI
(Digital Object Identifier), un identificatore persistente delle entità su cui
insistono diritti di proprietà intellettuale, non solo (qualsiasi forma di) oggetti
digitali, ma qualsiasi ‘IP entity’, inclusi i libri e le opere dell’ingegno. Nell’ecommerce dei contenuti, lo standard DOI riveste un ruolo simile di quello
del codice a barra nel commercio di oggetti fisici: facilita l’interoperabilità tra
i sistemi informativi delle parti, utilizzando schemi di metadati esistenti. Per
tale motivo più complessa è la catena di valore e maggiore sarà l’importanza
del DOI, che però non è un accorgimento tecnico di protezione del
copyright, né una tecnologia di ricerca dei contenuti.
Per quanto riguarda il Design Thesaurus e la Design Directory, si è ritenuto opportuno pianificare un sistema ampio e più comprensivo, flessibile e suscettibile di successive e periodiche implementazioni, piuttosto che
un sistema di dimensioni ridotte, che potrebbe diventare rapidamente
inadeguato con il progressivo incremento della base dati. Lo sviluppo di
un buon thesaurus richiede uno sforzo intellettuale non indifferente,
equivalente al relativo data entry manuale e all’elaborazione di liste di
classi. Il data entry si prospetta certamente oneroso nella prima fase di
inserimento e di raggiungimento di un nucleo consistente di voci (la creazione di termini normalizzati e di authority record implica rigoroso lavoro
di controllo e compilazione), ma nel lungo periodo, se metodologicamente bene impostato e avviato, risulterà economica e vantaggiosa. Infine, va
tenuto in considerazione che un thesaurus non è mai finito, a meno che
esso non venga più utilizzato in un database o non venga più aggiornato:
nuove scoperte, reinterpetazioni e nuovi ambiti disciplinari richiedono
l’aggi-unta di nuovi termini, la loro modifica e occasionalmente la loro
eliminazione. Se la manutenzione non viene effettuata in modo costante,
il thesaurus potrebbe perciò velocemente diventare una faticosa incombenza invece di un vantaggio. Per poter continuare ad essere utile, esso
richiede costante aggiornamento.
182 |
5.3
Implementazione del prototipo
5.3.1 Architettura di sistema e componenti
Il cuore della struttura multilayer del DesignNet Metadata Management
System (Fig. 2) è costituito dal DesignNet framework, basato su una piattaforma J2EE e su una struttura dati che segue il profilo di applicazione del
Dublin Core Qualified Schema definito nel progetto DesignNet, implementato per l’utilizzo dell’HTML e in previsione dell’eXstensible Mark-up
Language. Il framework prevede la possibilità di importare differenti schemi
metadati (come UNIMARC, MPEG-7 o IPTC) da altri archivi, mappandoli
con Dublin Core. Il sistema opera su una connessione remota ad un server o
ad una applicazione stand-alone.
I contenuti vengono raccolti, selezionati e rielaborati attraverso la creazione e la
validazione dei metadati (Fig. 3). Il Design Thesaurus funziona come uno strumento di gestione dei termini e di recupero dei documenti: viene utilizzato sia
da chi effettua l’indicizzazione – come vocabolario controllato – e la compilazione dei record di catalogo, sia dagli utenti nelle operazioni di navigazione e
richiamo dei documenti. Un’applicazione per la catalogazione secondo lo schema Dublin Core fornisce un template per la creazione dei record, che vengono
conservati nel repository di un RDMBS, da cui vengono richiamati attraverso il
processo di recupero tramite una Graphic User Interface (GUI) con una visualizzazione non solo testuale ma anche visuale. La visualizzazione viene consentita dalla selezione a priori di standard correnti (PDF, TIFF, VRLM, MP3, Real,
QuickTime), per assicurare la portabilità su piattaforme diverse.
Il DesignNet Metadata Management System presenta dei componenti che
risiedono sia sul lato server che sul lato client. Sul lato server, un Web server
invia richieste di contenuti statici e dinamici al client. La visualizzazione e la
query sono basate su una tipica architettura client/server basata su quattro
componenti principali:
1. open relational database management system (RDBMS);
2. Web server;
3. Web browser;
4. linguaggio Web-oriented dal lato server e communication software
per richiamare dinamicamente i contenuti.
Complessivamente, sono state impiegate: tecnologie per potenziare il server al
di là della capacità di restituire pagine HTML; un RDBMS con driver compatibile JDBC 2.0; un application server WebObjects™ compatibile e un
Apache 1.3.9 Web server. Il processo client-server è il seguente: il cliente invia
una richiesta di informazioni al server http, utilizzando un browser HTML.
Il Web server elabora la richiesta e invia dei dati staticamente o dinamica-
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 183
mente alla client station. In base al tipo di richiesta e al tipo di dati ricevuti,
possono essere distinte quattro fasi:
1. identificazione;
2. query;
3. visualizzazione e navigazione;
4. manipolazione.
Le informazioni richieste, in forma di un documento HTML, vengono visualizzate in HTML alla client station.
5.3.2 Catalogazione con Dublin Core
La prima operazione effettuata è stata quella di effettuare delle prove di catalogazione, in cui sono stati riportati gli elementi e i qualificatori di Dublin Core identificati. Il concetto chiave è che i metadati raramente rimangono fissi: piuttosto
essi si evolvono e si perfezionano durante l’intera vita del progetto, per conformarsi agli standard emergenti, adattarsi ai nuovi ambienti tecnici e aggiungere
ulteriori funzionalità. Lo schema di metadati, definito nella fase di progettazione
del sistema, nella fase prototipale è stato verificato con i partecipanti al progetto e
perfezionato in corso d’opera, attraverso varie prove di catalogazione.
La catalogazione è per sua natura un lavoro intensivo e consiste di un numero
di passi complessi, il primo dei quali è la descrizione del documento che si sta
catalogando: un oggetto tangibile, un insieme di oggetti o di dati digitali in
un oggetto tangibile localmente posseduto o una risorsa remota come un sito
Web. Una volta descritto l’item, si assegnano punti d’accesso a nomi e a titoli
uniformi, intestazioni di soggetto e numeri di classificazione in accordo con
regole standard e schemi di classificazione. Dublin Core permette una compilazione dei record semplificata rispetto al MARC, ma ciò non toglie che il
processo di catalogazione richieda comunque una riflessione.
Ogni partecipante ha indicato la disponibilità di un referente, con il quale la
sottoscritta ha tenuto incontri settimanali per:
Designet.Interface
Designet Framework
Dublin Core
VRA
MPEG-7
Unimarc
Archive
[Fig. 2] Architettura di sistema del prototipo nel progetto DesignNet (M. Boghetich)
184 |
-
definire le caratteristiche della scheda di catalogo delle raccolte;
collaborare alla creazione di un prototipo di thesaurus;
inserire almeno qualche decina di record dei documenti analogici e
degli oggetti presenti nella raccolta di ogni partecipante, e dei relativi
documenti digitali.
Design community playground
comprehensive interfaces
digital interfaces
[Design net web site]
Video Production Lab
Environ. Requirements Lab
Materials and design Lab
Marketable Goods Knowledge Lab
Digital Media Lab
Photography Lab
specialized interfaces
fisical interface
[Design net Resource Center]
practices repository
access
textual and visual navigation
Dublin
Core
Unimarc
MPEG 7
VRA
categories
Links and Relations Repository [LRR]
(integrated system of relations)
Unimarc
Dublin
Core
sharing
MPEG 7
VRA
categories
...
samples of materials
process
insert
products/components
projects
thesis
textual documents
3d models
videos
design thesaurus
pictures
use
come up
detect
[Fig. 3] Workflow dei processi nel prototipo del progetto DesignNet (P. Ciuccarelli)
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 185
Il data-entry si è servito della scheda di catalogo precedentemente definita e
del prototipo di thesaurus creato. I dati immessi sono stati quindi importati
dal gruppo DesignNet in un’applicazione informatica elaborata nell’ambito
del progetto.
Durante le prove, effettuate dai partecipanti sia insieme a chi scrive che singolarmente, è stata fornita una prima bozza di linee guida per la compilazione
e la sintassi e, in generale, si è raccomandato di porsi le seguenti domande
prima e al termine dell’operazione di catalogazione:
- il record di per sé e il contenuto in ogni elemento del record è utile
per la scoperta del documento?
- il contenuto di un elemento è noto con certezza e velocemente da
una base dati già esistente o da altre fonti informative? se così non è,
si possono fornire informazioni che non saranno fuorvianti?
- sono stati inseriti termini controllati adatti/sufficienti?
- se si enfatizzano gli attributi di un oggetto fisico, sono state incluse
queste informazioni negli elementi corretti? Sono state incluse informazioni significative sulla versione digitale e sulle ‘pre-condizioni
d’uso’? Sono state inserite sufficienti informazioni per un’intera collezione o per un documento individuale?
Sono stati compilati un centinaio di record, scegliendo appositamente i documenti più disparati e complessi per avere un campione rappresentativo delle
collezioni e delle raccolte di documenti presenti nei vari laboratori. Al termine delle prove è stato possibile effettuare alcune modifiche nello schema
Dublin Core (riportato in appendice nel paragrafo 6.2), che è stato quindi
utilizzato nel prototipo informatico creato (descritto nel paragrafo precedente) e reso disponibile nella Intranet del Dipartimento INDACO.
Il prototipo (Fig. 4) permetteva di:
1. inserire ed importare i dati;
2. editare e aggiornare i record;
3. creare nuovi record;
4. effettuare il browsing;
5. permettere un processo di verifica per controllare la qualità dei record
da parte di un’unità di supervisione.
Gli elementi e i qualificatori erano visualizzabili con un indice a menù, e
nella finestra del record erano mostrati sia gli schemi di codifica che i termini
del Design Thesaurus (Fig. 4). Con il progressivo aumentare dei record, sono
state aggiunte ulteriori funzionalità ritenute utili, come ad esempio l’inserimento di help in linea e di completamento automatico delle parole.
186 |
5.3.3 Design Thesaurus
In base ai passaggi delineati nella fase di progettazione del sistema (paragrafo 4.4),
la creazione del prototipo del Design Thesaurus è stata organizzata come segue:
Preparazione
La definizione della struttura e la compilazione del thesaurus è stata effettuata
da chi scrive, come parte delle attività operative dell’assegno di ricerca. Sono
stati utilizzati sia l’approccio top-down che quello bottom-up. Dopo lo studio
delle norme e degli standard di riferimento e l’analisi di progetti rilevanti di
thesauri online, sono state effettuate proficue riunioni con i responsabili operativi dei laboratori afferenti al Dipartimento INDACO del Politecnico di
Milano; in particolare del Laboratorio MAST e Materiali e Design, che
hanno contribuito con liste di termini e schemi di classificazioni. Le informazioni ottenute dall’Indexer’s Discussion Group si sono rivelate altresì utili.
Raccolta, selezione e analisi dei termini
La selezione delle risorse per la raccolta dei termini, aggiornata periodicamente durante il data-entry, è stata effettuata in base ai seguenti criteri, che
hanno costituito le linee guide anche nella successiva fase di implementazione della versione 1.0 dell’applicazione del Design Thesaurus:
[Fig. 4] Screenshot del prototipo del Design Catalogue
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 187
1. risorse pre-ordinate (richiedono minori difficoltà e spesso offrono
relazioni):
- altri thesauri già esistenti, sia offline che online 23: in particolare
l’Art&Architecture Thesaurus del Getty, i Thesauri della Library
of Congress, NASA Thesaurus, GeoScience Thesaurus,
Thesaurus Regionale Toscano;
- liste di descrittori, schemi di classificazione come la Classificazione
Decimale Dewey e i Library of Congress Subject Headings;
- nomenclature delle singole discipline;
- trattati terminologici dei vari campi;
- enciclopedie, lessici, dizionari e glossari;
- indici di monografie e studi di rilievo delle varie discipline;
- indici o abstract dei periodici.
2. risorse aperte (più aggiornate alla terminologia corrente e più specifiche):
- descrizioni di progetti o attività di indicizzazione;
- discussioni con specialisti dei vari settori;
- siti Web;
- periodici di settore e materiali della letteratura grigia;
- indagine presso gli utenti;
- conoscenze personali.
Ogni partecipante del progetto DesignNet, così come per le attività di catalogazione, ha indicato la disponibilità di un referente, con il quale chi scrive ha
tenuto incontri settimanali per collaborare alla creazione del prototipo.
Per quanto riguarda la scelta terminologica operata, oltre ai termini più noti
sono stati privilegiati in modo particolare quei termini appartenenti a linguaggi specialistici e di settore.
Sebbene nel corso di questa fase siano stati contestualmente raccolti molteplici nomi propri e nomi di luoghi pertinenti al design, in loro inserimento non
sono è stata previsto nel Design Thesaurus, bensì nella Design Directory.
Raggruppamento e sviluppo delle classi di concetti
I termini raccolti sono stati riuniti e organizzati in ordine alfabetico, eliminando i termini identici. Sono stati quindi uniti i sinonimi o i termini nella
stessa classe di concetti, definendo ampi campi e sottocampi di soggetto e
ordinando i termini nell’ambito di questi campi. Parallelamente, si è provveduto a selezionare i termini preferiti e ad unire le informazioni per i termini della stessa classe di concetto. Questi passaggi sono stati ripetuti finché tutti i termini non sono stati sufficientemente consolidati e i termini
preferiti identificati.
188 |
Struttura di classificazione
La creazione delle faccette, avvenuta parallelamente alla fase precedente, ha
implicato l’identificazione di cluster indipendenti di termini nell’ambito del
vocabolario, e ha richiesto fondamentalmente due passaggi:
1. creazione di una lista di termini organizzata in un insieme di cluster
che presentano affinità semantica o concettuale, derivata dal raggruppamento e sviluppo delle classi di concetti della fase precedente. Questi
cluster sono stati analizzati per identificare le faccette e le subfaccette,
per quanto possibili indipendenti l’una dall’altra. Il nome di ogni faccetta, ad esempio MATERIALI, è stato considerato come Top Term, di
modo che la faccetta costituisce l’organizzazione gerarchica dei termini
ad essa subordinati;
2. il secondo passaggio è stato quello di allocare quanti più termini possibili derivanti dalla fase precedente nelle facette così identificate. Si
tratta di un processo iterativo, nel quale alcuni termini all’inizio sembrano non rientrare in nessuna o al contrario molteplici faccette.
Questi termini sono stati messi temporaneamente da parte finché non
è stato validato l’insieme delle faccette: pur così difficili da assegnare,
essi si sono spesso rivelati molto utili nel processo di validazione, aiutando a definire l’indirizzo delle faccette che li avrebbero dovuti accogliere. Questo processo, inoltre, è servito anche a validare i Top Term.
Le faccette identificate per il prototipo del Design Thesaurus sono state le
seguenti:
- AGENTI
- ATTIVITÀ
- ATTRIBUTI
- CONCETTI
- DISCIPLINE
- FORME DI COMUNICAZIONE
- LUOGHI
- MATERIALI
- PROCESSI
- PRODOTTI
- STILI E PERIODI
- TECNICHE E TECNOLOGIE.
L’ampia portata di ciascuna faccetta e la facile interferenza concettuale tra
alcune di esse (ad esempio tra Attività e Discipline) è stato oggetto di numerose riflessioni e revisioni, che nello sviluppo dell’applicativo si sono concretizzati in un più sintetico elenco.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 189
Collazione e verifica delle informazioni
In questa fase è stata ulteriormente affinata l’identificazione dei termini preferiti e si è predisposta una griglia con i codici notazionali standard (TT, ALT,
UF, BT, NT, RT, SN). A questi codici sono stati aggiunti l’ID del termine e il
campo della Fonte. Nella griglia i termini preferiti sono stati organizzati in
una struttura logica di termini generici e termini più specifici, identificando
gruppi di sinonimi, distinguendo gli omografi e inserendo le note d’ambito.
Una volta pronta l’applicativo prototipale del Design Thesaurus (Fig. 5), sono
stati importati i dati creando un record per ogni termine preferito.
Il prototipo per la gestione del Design Thesaurus presenta una struttura classificatoria di tipo monogerarchico, ovvero una struttura nella quale un termine appartiene ad una sola gerarchia (ha un solo BT), che supporta le tre relazioni semantiche tipiche dei thesauri: di equivalenza, gerarchiche e associative. La lingua scelta
per il thesaurus è stato l’italiano, a partire dalla terminologia realmente utilizzata
dalla comunità scientifica del Dipartimento INDACO. La decisione di sviluppare
un software in-house per la gestione del Thesaurus nell’ambito del progetto
DesignNet è stata presa dopo un attento benchmarking dei programmi disponibili commercialmente. Tra le varie soluzioni software per thesauri (comunque creati
manualmente, non automatizzati), l’attenzione è stata rivolta in particolare a software per la gestione e l’accesso online per thesauri e la personalizzazione dell’interfaccia utente, come MultiTes, Synaptica, Lexico, TermTree e IC Index. Le caratteristiche e i limiti dell’indicizzazione automatica sono state già analizzate in dettaglio in questo volume (paragrafo 2.2.6). Basti ricordare che l’indicizzazione automatica tipicamente consiste nella semplice derivazione di parole chiave da un
documento, e nel fornire accesso a tutti queste parole, mentre i sistemi più complessi di indicizzazione automatica tentano di selezionare dei vocabolari controllati
di termini, basati sui termini del documento. La classificazione automatica tenta
di raggruppare automaticamente documenti simili, utilizzando sia un metodo di
clustering completamente automatico, che uno schema di classificazione definito
e un insieme di documenti già indicizzati secondo quello schema.
5.3.4 Graphic User Interface (GUI)
Nell’interfaccia grafica del prototipo del progetto DesignNet la rappresentazione visuale prescelta è stata inizialmente quella di un bersaglio (Fig. 6), evoluto poi in una mappa sferica (Figg. 7-8). Da un punto di vista semiotico,
comunicare significa interagire in uno spazio condiviso, servendosi di una
mappa che può rappresentare un territorio reale in modo realistico (una carta
topografica) o in modo simbolico (il grafo delle linee del metro), un territorio
irreale (la mappa dell’Inferno di Dante) o un insieme di dati di diversa natura
(la distribuzione del reddito su un planisfero).
190 |
Ogni mappa è una semplificazione, una rappresentazione per difetto, ma è
utile proprio in quanto presenta una visione limitata di un insieme di fenomeni e visualizza in modalità bidimensionali gli insiemi di risultati, permettendo di identificare determinati pattern semplicemente variando dei parametri. Questi approcci sono ben noti dell’area dell’Information Visualization, e
consentono all’utente di scoprire in modo interattivo delle relazioni tra uno
spazio infomativo in genere non noto e la formulazione della query. La scelta
di una visualizzazione 2D, nella fase prototipale, è dovuta a due ragioni: da
un lato, in termini di tempo di risposta della query, il carico computazionale
per la visualizzazione dovrebbe essere mantenuto al minimo; dall’altro, per
permettere un riconoscimento istantaneo dei pattern una visualizzazione 2D
risulta più semplice di una generalmente più complessa visualizzazione 3D,
che può causare problemi aggiuntivi, ad es. in termini di visibilità, gestione e
orientamento dei dispositivi di interazione 3D. Nella visualizzazione dei risultati, la relazione tra i documenti (ad esempio il loro grado di equivalenza
semantica) può essere espresso in vari modi. Nei tradizionali sistemi di
Information Retrieval, l’insieme dei risultati viene rappresentato in forma di
liste ordinate, ponendo i documenti che più soddisfano i criteri di ricerca
[Fig. 5] Screenshot del prototipo del Design Thesaurus
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 191
[Fig. 6] Primo studio per l’interfaccia visuale del prototipo
[Fig. 7] Secondo studio per l’interfaccia visuale del prototipo
192 |
all’inizio della lista. Sebbene tali rappresentazioni favoriscano l’identificazione
dei documenti ritenuti più appropriati nell’insieme dei risultati della query,
viene persa ogni informazione di dettaglio relativa alle relazioni con gli altri
documenti o tra i documenti e la corrente formulazione della query.
La GUI del prototipo DesignNet fornisce tre distinti strumenti con cui interagire:
- un applicativo di query, in cui la query può essere formulata con termini derivanti dal Design Thesaurus e parole a testo libero;
- un applicativo di visualizzazione grafica, in cui i risultati vengono interattivamente mostrati all’utente in base ai parametri di ricerca selezionati;
- un applicativo di visualizzazione testuale, in cui i risultati vengono interattivamente mostrati all’utente in forma di elenco testuale tradizionale.
Tutti gli strumenti sopracitati sono importanti per il compito di valutazione
dell’insieme di risultati e per il perfezionamento della definizione della query
per l’iterazione successiva.
5.3.5 Design Directory
[Fig. 8] Visualizzazione dei record nel l’interfaccia del prototipo
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 193
Le aree di queste liste di autorità sono state definite e organizzate (Figg. 9-11)
come segue:
- persone;
- organizzazioni;
- prodotti astratti;
- marchi.
Le operazioni identificate per la creazione della Design Directory sono state le
seguenti:
- la proposta di forme di intestazione autorevoli e omogenee, derivanti
da documentazione formalizzata;
- la creazione di una rete di termini e varianti tra loro collegati per agevolare la ricerca;
- la pubblicazione online di liste periodiche di aggiornamento, per
seguire l’evoluzione del mondo del design, in costante evoluzione.
[Fig. 9] Screenshot della versione 1.0 della Design Directory: lista delle organizzazioni
194 |
A livello della compilazione dei record del catalogo, l’utilizzo della Design
Directory richiederà per esempio di legare titolo alla relativa registrazione
nelle liste d’autorità.
5.3.6 Risultati e problemi incontrati
Nella fase di implementazione del prototipo si è giunti alla:
1. definizione di un’architettura di sistema e dei relativi componenti e
requisiti del prototipo;
2. inizio del coordinamento con laboratori e archivi partecipanti al progetto e stesura di bozza di linee guida per la compilazione dei record;
realizzazione di un prototipo per la compilazione dei record secondo
lo schema Dublin Core Qualified definito;
3. realizzazione di un prototipo per la gestione del Design Thesaurus;
4. realizzazione di un’interfaccia nella fase di richiamo dei documenti;
5. assegnazione di un finanziamento ‘Progetto Giovani Ricercatori’ del
Politecnico di Milano per una ‘Metodologia di archiviazione e accesso in un sistema conoscitivo per il design: metadati e thesaurus’;
6. disseminazione dei risultati ottenuti in ambito interdipartimentale,
nazionale e internazionale 24.
L’operatività di base ha certamente consentito una migliore comprensione di
alcune problematiche e dinamiche inerenti i processi sottesi al sistema progettato. Per quanto riguarda il rapporto con i partecipanti al progetto, in particolare, si è riscontrato un generale livello partecipazione e di entusiasmo,
nonostante il fatto che le comunità di interesse formate attorno al progetto
DesignNet siano costituite da individui che non possiedono esperienze specifiche in ambito catalografico. La necessità di adottare dei criteri che permettessero la visibilità e l’utilizzo di giacimenti documentali altrimenti poco o del
tutto non visibili è stato uno stimolo determinante.
La denominazione di alcuni elementi (di cui si è riportata la traduzione effettuata dall’ICCU, riportata nel paragrafo 2.2.3) e qualificatori (tradotti da chi
scrive) dello schema è risultata di non immediata comprensione: per tale motivo, se nei qualificatori si è cercato di individuare termini più intuitivi, per gli
elementi è stata prevista l’adozione di etichette user-friendly nell’interfaccia
utente, sull’esempio di quanto già avviene negli OPAC con record in formato
MARC e, nell’ambito di Dublin Core, in progetti come DSpace del MIT.
Per quanto riguarda l’importazione di altri schemi di metadati, le discrepanze
rilevate (nonostante modelli di crosswalk forniti da fonti autorevoli come
l’Istituto Centrale per il Catalogo Unico e il Getty Information Institute)
hanno ulteriormente comprovato l’ipotesi che la mappatura non sia un’operazione meramente meccanica. Per risolvere almeno in parte il problema è stata
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 195
prevista l’implementazione di un modulo informatico che segnali all’operatore le discordanze nei dati importati.
Parallelamente alle prove di catalogazione con i laboratori, lo schema di metadati è stato verificato anche in una ipotesi di progetto di catalogazione e fruizione delle tesi di laurea della Facoltà del Design e dei materiali derivanti
dall’OpenLab, la mostra didattica annuale allestita con i lavori degli studenti
del Corso di Laurea in Disegno Industriale.
Per quanto riguarda il prototipo del Design Thesaurus, la cui compilazione è
stata effettuata e verificata con i partecipanti al progetto, si è riscontrata l’esigenza di utilizzare dei codici di notazione standard 25per la terminologia. Le
relazioni dei termini di un thesaurus possono anche essere mostrate graficamente, sebbene vi sia il rischio che il diagramma risultante sia così complesso
da risultare incomprensibile all’occhio inesperto. In genere i thesauri sul Web
tendono a ricopiare il layout delle loro controparti cartacee, spesso contengono minori informazioni rispetto alla versione stampata e, nonostante i link
ipertestuali, non sembrano fruttare pienamente le potenzialità del digitale.
[Fig. 10] Screenshot della versione 1.0 della Design Directory: record vuoto della sezione
‘Persone’
196 |
È stata inoltre recepita l’importanza di una corretta gestione del thesaurus,
che cresce e si evolve nel tempo con nuovi ambiti disciplinari, concetti e termini, tenendo comunque presente che diventando sempre più grande e complesso, la consistenza d’indicizzazione diminuirà: chi gestisce il thesaurus si
trova sempre a dover affrontare un trade-off tra il perfezionamento terminologico e la facilità di localizzazione dei termini.
In merito all’interfaccia grafica del prototipo, nella maggior parte dei casi la
progettazione di una nuova interfaccia per applicazioni multimediali come le
biblioteche digitali è ancora abbastanza arbitraria e imprevedibile. Con l’implementazione del sistema sono state previste modifiche e in particolare si è
rilevata la necessità di ulteriori approfondimenti ed esperimenti per sviluppare
molteplici visualizzazioni che consentano di utilizzare in modo efficace il
sistema sia ai content provider che agli utenti.
5.4
Implementazione della versione 1.0 delle applicazioni
5.4.1 Architettura di sistema e componenti
L’architettura di sistema e i componenti per i vari applicativi sono in sostanza
rimasti quelli indicati nel paragrafo 4.3.1.
[Fig. 11] Screenshot della versione 1.0 della Design Directory: record compilato della sezione
‘Persone’
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 197
5.4.2 Design Thesaurus
Struttura di classificazione
Nell’implementazione della versione 1.0 il Design Thesaurus è stato reso
accessibile sul Web e non più soltanto nella Intranet di Ateneo, e sono state
nuovamente analizzate le faccette scelte per il prototipo, apportando alcune
modifich. La faccetta FORME DI COMUNICAZIONE è risultata ambigua
e concettualmente appartenente alla categoria degli oggetti, mentre la faccetta
PRODOTTI è stata ridenominata come OGGETTI. La scelta del termine
‘prodotti’ era dovuta allo specifico contesto del disegno industriale, ma per
evitare confusione si è scelto un termine più neutro.
Le faccette sono perciò state definite come segue:
1. AGENTI
2. ATTIVITÀ
3. ATTRIBUTI
4. CONCETTI
5. DISCIPLINE
6. LUOGHI
7. MATERIALI
8. OGGETTI
9. PROCESSI E TECNICHE
10. STILI E PERIODI
Concretizzando un’ipotesi presa in considerazione con il prototipo, e in base a
quanto deciso per la Design Directory, nella faccetta LUOGHI è stato previsto
l’inserimento di nomi geografici e delle loro varianti in inglese. Nel Design
Thesaurus è cioè possibile, attraverso l’etichetta di nodo ‘nomi geografici’, accedere ad un elenco di nomi organizzati gerarchicamente per continente, stato,
regione, città e quartiere. Tale scelta, che in qualche modo viene a creare un ibrido tra termini relativi a concetti e termini relativi a cose storicamente esistenti, è
stata dettata da esigenze funzionali, ma non è escluso che in futuro i nomi geografici vadano a formare un thesaurus a sé stante, sull’esempio di quello – sviluppato su tutt’altra scala – del Thesaurus of Geographic Names del Getty 26.
Per quanto riguarda le diverse possibili organizzazioni di un thesaurus in
forma gerarchica, in modo da fornire strumenti aggiuntivi per navigarne la
struttura, è stata decisa l’adozione delle etichette di nodo (Fig. 12), per indicare la caratteristica di divisione utilizzata per la classe (rappresentata dal termine più generale) nelle singole specie (rappresentate dai termini specifici).
Le etichette mostrano la base logica sulla quale la gerarchia è stata organizzata, mentre i termini BT/NT da entrambe le parti dell’etichetta si riferiscono a
concetti del medesimo tipo. Un’altra possibile funzione di etichetta è quello
198 |
di introdurre diversi tipi di concetti, assicurando che questi vengono collocati, per comodità degli utenti, sotto i concetti con i quali vengono solitamente
associati. In questi casi, il termine apparentemente generale serve unicamente
a collocare i concetti associati introdotti dall’etichetta di nodo, che non sono
quindi dei termini generici e specifici bensì dei termini associati.
Mentre le classificazioni dei termini sono relativi alla struttura gerarchica
BT/NT, le etichette di nodo deviano dalla gerarchia rigida per sviluppare raggruppamenti aggiuntivi e funzionali di termini. Le classificazioni variano da
categorie appiattite (ampie classi con un singolo livello di elencazione dei termini inclusi nella classe, come nell’ERIC Thesaurus), a strutture complete di
notazioni, come nella struttura ad albero del Medical Subject Headings
(MeSH). Le etichette di nodo sono comunemente utilizzate per organizzare
rappresentazioni gerarchiche, ad esempio:
occhiali
<per uso>
occhiali da sole
occhiali da vista
occhiali sportivi
<per tipo di montatura>
montature face-à-main
montature pieghevoli
montature semicerchiate
montature senza cerchio
Questo accorgimento è molto utile quando vi è un grande numero di NT
sotto uno specifico BT: una tale rappresentazione rende più facile comprendere l’organizzazione dei termini e identificare i termini utili senza dover leggere un’unica lunga lista. Le etichette di nodo non sono di per sé utilizzate
nell’indicizzazione, il loro scopo è puramente di tipo organizzativo. Alcuni
thesauri organizzati gerarchicamente, come ICONCLASS e l’Art &
Architecture Thesaurus (AAT), usano una rigida relazione tra classi inferiori e
superiori in una singola gerarchia. I termini possono essere classificati in molteplici modi, ad esempio per forma, per utilizzo ecc. L’AAT affronta questo
problema attraverso la qualificazione di alcuni termini: ad esempio, il concetto di paesaggio è rappresentato dai due termini ‘landscape (representations)’ e
‘landscape (environments)’. Sebbene questa soluzione possa presentare alcuni
svantaggi ( la distinzione tra due termini qualificati potrebbe non essere chiara all’utente ed è difficile decidere dove dovrebbero essere localizzati le sottoclasse di concetti), la si è ritenuta sufficientemente funzionale e ne è stato perciò previsto l’uso nel Design Thesaurus.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 199
Le relazioni RT rappresentano una classe di relazioni non gerarchiche, la cui
applicazione spesso non risulta chiara nella costruzione di un thesaurus (Fig.
13). Semplificando, si potrebbe dire che le relazioni RT rappresentano una
generica connessione ‘vedi anche’ tra due concetti: questo potrebbe portare ad
una espansione incontrollata dei risultati dei termini della query e ad una
potenziale perdita nella precisione a fronte di un incremento del richiamo,
come è stato evidenziato in alcuni studi empirici 27. Lo standard ISO 2788
identifica innanzitutto due tipi di termini che possono essere correlati da una
relazione associativa: quelli che appartengono alla stessa categoria e quelli che
collegano categorie diverse all’interno del thesaurus. Vi sono poi una serie di
ulteriori e diverse sub-relazioni (ad esempio la relazione ‘funzionalmente correlato a’). Nel Design Thesaurus si è scelto di dare priorità di compilazione
agli altri campi del record di un termine, e di sottoporre la segnalazione delle
relazioni associative al Gruppo di Lavoro sulla Terminologia del Design
[Fig. 12] Screenshot della versione 1.0 del Design Thesaurus: esempio di gerarchia con etichetta di nodo
200 |
Collazione e verifica delle informazioni
Durante la revisione del corpus di termini raccolti e già in parte strutturati, si
verificano le cross reference e si effettuano test di indicizzazione: assegnando i
descrittori ad un set campione di nuovi documenti, in un numero
sufficiente da avere un’idea delle possibili lacune nel thesaurus, è possibile
verificare il richiamo usando delle domande-campione per vedere con quale
efficacia il thesaurus conduce al descrittore appropriato.
In vista della prima fase di catalogazione collettiva e consultazione sperimentale
del catalogo del progetto DesignNet, prevista durante l’anno accademico 20042005, è stata inoltre attivata una iniziativa volta a creare un accordo stabile tra
la comunità scientifica e chi compila il Design Thesaurus: l’istituzione di un
Gruppo di Lavoro sulla Terminologia del Design. Tale gruppo di lavoro utilizzerà questo vocabolario come strumento di mediazione e punto di comune
accordo linguistico-semantico tra gli esperti e i professionisti in questo ambito,
[Fig. 13] Screenshot della versione 1.0 del Design Thesaurus: record compilato di un termine
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 201
per consentire una standardizzazione sulla quale è possibile costruire un consenso terminologico. In tal modo sarà possibile rendere il Thesaurus uno strumento efficace e funzionale per gli utenti del sistema, oltre che di valorizzazione del
lavoro e delle competenze della comunità interdipartimentale.
Obiettivi generali del Gruppo di Lavoro, che verrà coordinato da chi scrive e
si incontrerà periodicamente, saranno:
1. l’identificazione e selezione dei termini relativi ai vari ambiti disciplinari dei Laboratori (ad es. materiali, colore, merceologia, fotografia,
storia del design, video, requisiti ambientali, computergrafica, progettazione per l’infanzia), che verranno inseriti da chi scrive;
2. l’identificazione delle relazioni e delle gerarchie dei termini relativi ai
vari ambiti disciplinari;
3. la disseminazione del proprio lavoro in ambito di ateneo e con altri
enti ed istituzioni dedicate alla terminologia.
Nel Gruppo di Lavoro è prevista la distinzione in tre categorie di membri:
- commissione scientifica;
- gruppo operativo;
- partner istituzionali.
Disseminazione della bozza del thesaurus
In previsione della prima fase di catalogazione collettiva e consultazione sperimentale del catalogo del progetto DesignNet, prevista durante l’anno accademico 2004-2005, sono state analizzate e definite le sue possibili forme di rappresentazione del Design Thesaurus.
Vi sono molti modi di rappresentare un thesaurus in formato digitale e cartaceo: la vista bidimensionale presenta i termini del thesaurus in ordine alfabetico, con i relativi dettagli e solo un livello di termini BT e NT (come
nell’Eric Thesaurus), mentre in una presentazione ‘piatta’ – che fornisce tutte
le relazioni per ogni termini del thesaurus – un utente che comincia con un
termine che non fa parte dei termini formali del thesaurus potrebbe avere
delle difficoltà. Questo può succedere quando il termini di ricerca è una parola che nel thesaurus non è un termine d’entrata (cross reference). Tuttavia, una
lista di termini ‘ruotata’ o ‘permutata’ mostra tutte le parole utilizzate nel thesaurus, permettendo quindi a chi cerca di usare qualsiasi parola, che sia un
termine formale del thesaurus o un sinonimo. Ad esempio il Thesaurus of
Engineering and Scientific Terms elenca ogni parola in un formato keywordout-of-context: i termini formali del thesaurus e i sinonimi in cui la parola
appare sono indentati sotto la parola chiave. Una presentazione multilivello e
ad albero mostra tutti i livelli delle relazioni gerarchiche, come nel caso del
già citato Art and Architecture Thesaurus, in cui una struttura gerarchica con
202 |
faccette è suddivisa inizialmente da etichette di nodo (comprese tra <>) che
indicano il tipo di relazione gerarchica.
Due fattori decisivi del grado di flessibilità di un thesaurus sono inoltre la
lunghezza e il numero dei campi: più specifico è il vocabolario di un thesaurus e maggiore sarà la necessità di campi oltre 50 caratteri; le note descrittive
dovrebbero essere di lunghezza illimitata. Uguale importanza riveste la consistenza dei meccanismi di controllo, per prevenire:
- entrate multiple dello stesso termine (duplicati);
- relazioni multiple tra due termini (sia dello stesso tipo che di tipo diverso);
- relazione incomplete: relazione da un termine ad un altro senza la
reciprocità; relazione tra soltanto un fattore e un termine combinato.
[Fig. 14] Screenshot della versione 1.0 del Design Thesaurus: record vuoto di un termine i
termini non confermati sono raggruppati in un elenco di termini candidati, che l’amministratore provvede a validare
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 203
Nella definizione dei requisiti della versione 1.0 dell’applicativo sono stati
identificati i seguenti aspetti e funzionalità, in parte già implementati:
- ouput dei dati: a schermo, tramite stampante o salvataggio su file;
- aggiornamento automatico dei dati inseriti nella struttura del thesaurus;
- interfaccia Web intuitiva;
- possibilità di poligerarchia;
- assegnazione di uno status agli utenti (amministratore, partecipanti e
utenti normali) e ai termini, in un’ottica di lavoro collaborativo: termini
candidati (rimangono separati finché non approvati), termini approvati.
[Fig. 15] Screenshot della versione 1.0 del Design Thesaurus: gestione delle fonti
204 |
-
-
Questo approccio rientrerebbe in una sorta di rituale generale di ‘canonizzazione del termine’, di cui si verifica l’efficacia prima di inserirlo
nella struttura definitiva del vocabolario (Fig. 14);
gestione delle fonti dei termini in una sezione apposita (Fig. 15);
numero di termini illimitato;
hyperlink tra tutti gli elementi;
report online;
applicazione integrato nel database con livelli di accesso diversificati e
consultabile in modo indipendente;
data di ingresso del termine e data dell’ultima modifica;
possibilità di spostare termini e sotto-rami;
display online dei termini in ordine gerarchico (relazioni di equivalenza, relazioni gerarchiche, relazioni associative – mostrando ogni
termine nel suo contesto gerarchico sia superiore che inferiore), alfabetico, KWOC, microthesauri, a seconda della selezione dell’utente;
rappresentazioni grafiche delle relazioni;
ricerca semplice (descrittori o parole chiave) o complessa (con filtri
multipli);
[Fig. 16] Screenshot della versione 1.0 del Design Catalogue: elenco dei record con anteprima
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 205
-
pop-up con i dettagli dei termini;
cluster concettuale di termini multipli.
5.4.3 Catalogazione con Dublin Core
Un requisito previsto per l’applicativo di catalogazione, come già scritto, è
che i campi della descrizione possono essere collegati al Design Thesaurus
(Figg. 16-17). Si è previsto anche, in particolare per i documenti bibliografici
e in vista delle connessioni con basi dati di questo tipo, la possibilità di riportare l’equivalente Classificazione Decimale Dewey.
La compilazione dei record del catalogo dei siti Web è stato oggetto di alcune
riflessioni. ‘Includere nel catalogo’ significa infatti ‘fornire accesso attraverso il
catalogo’, sia che si tratti di record e documenti conservati fisicamente sull’hard disk del sistema che di siti Web. In quest’ultimo caso, ci si è interrogati
su cosa rappresenti una unità (un sito Web per intero o una pagina Web?), se
distinguere o meno tra documenti commerciali e non, come gestire documenti dinamici per sé e l’instabilità dei documenti presenti all’interno di un
sito (disponibili per periodi limitati e poi rimossi), l’eventuale download e
conservazione in locale delle informazioni ritenute utili, come eseguire l’indicizzazione di siti il cui contenuto specifico è soggetto a cambiamenti periodici.
5.4.4 Primi risultati e problemi
Nella fase di implementazione della versione 1.0 delle applicazioni si è giunti
ai seguenti risultati:
1. revisione dell’applicazione prototipale per la compilazione dei record secondo lo schema Dublin Core Qualified definito per il progetto DesignNet;
2. revisione dell’applicazione prototipale per la gestione del Design
Thesaurus e realizzazione della versione 1.0;
3. approfondimento delle modalità di applicazione dello standard per interoperabilità OAI-PMH (che utilizza Dublin Core e XML) (cfr. paragrafo 6.4);
4. applicazione delle metodologie definite e dei software nella start-up
di un Design Knowledge Centre (cfr. paragrafo successivo);
5. disseminazione dei risultati in ambito interdipartimentale e nazionale
28
e contatti con istituzioni rilevanti nel settore della documentazione,
tra cui l’Istituto Centrale per il Catalogo e la Documentazione.
Per quanto riguarda difficoltà incontrate nella catalogazione, si è verificato come i
documenti audiovisuali e gli artefatti del design (prodotti, semilavorati) richiedano di norma tempi maggiori rispetto ai documenti bibliografici: si tratta spesso di
prodotti corale, che presentano una pluralità di responsabilità. Negli standard
catalografici tradizionali viene effettuata una distinzione tra ‘fonti interne’ ritenute
206 |
più affidabili e stabili, nel caso di un documento audiovisuale raggiungibili
mediante il dispositivo che ne consente la lettura, e ‘altre fonti’, leggibili a occhio
nudo, come le etichette stampate sul supporto, il contenitore e la documentazione allegata, che presentano una minore curabilità e attendibilità dovuta spesso a
motivi commerciali (basti pensare alle numerose versioni del packaging). Se l’assenza di fonti sicuri da cui derivare i record catalografici potrebbe costituire una
remora al decollo di collezioni di questo tipo. Ai partecipanti al progetto
DesignNet è stato suggerito di ricorrere principalmente alle fonti interne, riportando comunque gli altri dati a vantaggio di una maggiore ricchezza del record.
Testando le modalità di recupero dei documenti nelle applicazioni prototipali
e nelle versioni 1.0, si è riflettuto sull’efficacia dell’utilizzo di parole chiave
provenienti dal Design Thesaurus e sull’eventualità di adottare anche fonti
intermedie alternative di suggerimento dei termini per incrementare il richiamo di documenti testuali 29, nello specifico liste di co-occorenza dei termini
generate automaticamente dal computer. Tali liste permetterebbero di poten-
[Fig. 17] Screenshot della versione 1.0 del Design Catalogue: record di un documento
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 207
ziare l’efficacia del Design Thesaurus – che non copre tutti gli ambiti dello
scibile umano o tutti i possibili sinonimi –, consentendo ad un utente non
esperto di un determinato ambito di poter rintracciare i documenti servendosi sia dei termini del vocabolario utilizzati nell’indicizzazione dei documenti
che dei termini suggeriti dalle liste di co-occorenza, e ad un utente esperto di
recuperare documenti servendosi di termini leggermente diversi da quelli
usati nell’indicizzazione, al di là dell’aiuto offerto dalle tecniche di stemming.
In ogni caso, il Design Thesaurus rimane lo strumento principale e privilegiato di accesso e recupero, offrendo termini organizzati nell’ambito una precisa
mappa mentale e riflettendo la semantica dei documenti ad un livello più
generale e con una maggiore precisione concettuale, laddove le liste di cooccorrenza rifletterebbero dettagli più minuti ma spesso non accurati né sistematizzati, in quanto semplici risultati di calcoli statistici sulla compresenza di
alcuni termini in specifici documenti.
5.5 Start-up di un Design Knowledge Centre
Condividendo molti degli obiettivi e delle attività dei Learning Resource
Centre (paragrafo 1.2.3) e centri di documentazione (paragrafo 4.4.7), il
[Fig. 18] Interno della POLI.teca (Labfoto, Dipartimento INDACO, Politecnico di Milano)
208 |
gruppo di progetto DesignNet e i laboratori partecipanti hanno dato vita ad
struttura ispirata al modello di un design knowledge centre, ovvero un combinazione tra un centro di documentazione specificatamente pensato per il
design e un design centre che intende essere complementare, per tipologia di
documenti e servizi offerti, alle biblioteche già presenti nel Politecnico di
Milano. Questa struttura, avviata nel giugno 2003 nell’edificio AR del
Campus Bovisa, dopo una fase di start-up e sperimentazione, è oggi pienamente operativa con il nome di ‘POLI.teca’ (Figg.18-19), aperta a studenti,
docenti e ricercatori di Ateneo con l’obiettivo di:
- dare accesso a documenti analogici e digitali sul design, sia generali
che di settore e utili alle diverse fasi del processo progettuale, ponendosi come interfaccia fisico del Design Gateway;
- sperimentare strumenti innovativi per la condivisione e la manipolazione delle risorse documentali e lo sviluppo di conoscenza progettuale (la catalogazione e la restituzione online avverrà in base alle
metodologie e agli strumenti sviluppati nell’ambito del progetto
DesignNet);
- ospitare occasioni di formazione e incontro che utilizzino i bacini
documentali della POLI.teca.
La struttura si pone perciò come un luogo d’incontro e d’integrazione dei
laboratori, con obiettivi e compiti comuni: acquisizione di nuova documentazione, gestione, catalogazione e accesso dei documenti a supporto delle attività di didattica e di ricerca del design, applicando le metodologie definite nel
progetto DesignNet con il coordinamento di chi scrive.
Nella POLI.teca si integrano varie strutture interateneo, i cui patrimoni sono
accessibili tramite uno sportello unico:
1. Laboratorio di Merceologia e Analisi Settoriale e Territoriale
(MAST), laboratorio strumentale per l’acquisizione di informazioni e
conoscenze funzionali al progetto di design (Dipartimento INDACO, Politecnico di Milano);
2. Laboratorio Materiali e Design, finalizzato al supporto dell’attività
didattica nell’area dei materiali per il disegno industriale
(Dipartimento di Chimica, Materiali e Ingegneria Chimica ‘Giulio
Natta’, Politecnico di Milano);
3. Laboratorio Sistemi e componenti per l’edilizia, che raccoglie, elabora
e offre informazioni su prodotti per l’edilizia (Dipartimento INDACO, Politecnico di Milano);
4. Laboratorio dei Requisiti Ambientali dei Prodotti Industriali
(RAPI.labo);
5. IntEL (International Education Library), struttura promossa
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 209
dall’Ufficio Relazioni e progetti internazionali del Dipartimento
INDACO e dal Centro Relazioni Internazionali di Ateneo come
interfaccia e luogo di documentazione per gli studenti del programma Socrates;
6. DIScens (Centro Documentazione della Produzione Didattica
Scientifica del Design), contenente le tesi e gli elaborati di laurea
della Facoltà del Design e la produzione scientifica degli afferenti al
Dipartimento INDACO;
7. Laboratorio MODA.contents ? Tremelloni, contenente il patrimonio
documentale dell’Associazione Biblioteca Tremelloni del Tessile e
della Moda (Dipartimento INDACO, Politecnico di Milano).
E’ in via di attivazione una sezione (Media Centre) per l’osservazione dalla
programmazione di emittenti satellitari, terrestri e via cavo e l’individuazione
di contenuti audiovisivi d’interesse per i progettisti. I contenuti verranno
inseriti nel catalogo attraverso DesignNet, integrati quindi con il resto del
patrimonio documentale, e resi disponibili all’utenza interna per scopi didattici. I responsabili operativi delle strutture afferenti alla POLI.teca sono presenti in sede per fornire assistenza agli utenti nella consultazione dei patrimoni documentali.
Per quanto riguarda il progetto degli spazi della sede che ospita la POLI.teca,
[Fig. 19] Interno della POLI.teca: consultazione di documentazione di settore e campioni di materiali
210 |
è stato previsto un ampliamento dello spazio disponibile, coerentemente con
l’aumentare del numero e della capacità dei servizi offerti, attraverso l’utilizzo
dei diversi piani dell’edificio: tali locali saranno dotato di spazi e strumentazioni adeguate a consentire sia le attività che richiedono il contatto diretto o
telefonico con il pubblico (front-office), sia il contemporaneo svolgimento dei
compiti e delle funzioni di supporto alla attività di documentazione e formazione, nonché alla progettazione ed alla realizzazione di iniziative di ricerca,
monitoraggio, innovazione organizzativa e sviluppo telematico dei propri
patrimoni documentali (back-office) e di iniziative culturali inerenti tematiche progettuali. Per quanto riguarda le risorse finanziarie, attualmente la
POLI.teca si avvale di una parte dei fondi per la didattica dei laboratori e
delle attività didattiche dei dipartimenti che si appoggiano ai laboratori integrati nella POLI.teca. Il patrimonio attuale e i servizi offerti sono riportati
nelle tabelle 3-4. Dati i risultati già ottenuti con la struttura attualmente operativa, la formalizzazione istituzionale della POLI.teca non potrà che aumentare quantitativamente e qualitativamente il supporto già fornito alle attività
didattiche e di ricerca delle diverse Facoltà dell’Ateneo, e accelerare quei processi di integrazione nella rete delle biblioteche, dei centri di documentazione
e degli archivi del Politecnico di Milano.
5.5.1 Processi
Per favorire l’operatività di base nella fase pilota del progetto e nella successiva
messa a regime del sistema, sono stati segmentati e analizzati i processi rilevati, per ottimizzare più agevolmente le procedure. In un sistema di catalogazione ideale (in ambiente digitale e non), i record dovrebbero essere gestiti in
modo tale che essi siano:
1. completi (nessuna delle parti di informazioni su un documento deve
andare perduta, e che i documenti più importanti devono essere conservati) e recuperabili;
2. autentici e accessibili (significa che i record trovati o recuperati possono essere consultati velocemente da quelli che ne hanno bisogno e
che hanno l’autoriz-zazione);
3. affidabili (i record possono essere localizzati) e utilizzabili (i record
possono essere realmente letti).
- ingresso o localizzazione dei documenti di interesse;
- acquisizione: include scegliere se anche il documento verrà
acquisito o meno insieme al record. Alla cattura si effettua l’inventariazione, cioè identificazione univoca di ciascun oggetto
d’interesse e vengono acquisite le informazioni contestuali e i
metadati preesistenti;
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 211
-
-
storage dei documenti, su un supporto informatico adatto. Il
documento deve essere conservato in modo tale che il master file
non si più alterabile. Un immagazzinamento affidabile è il prerequisito per il mantenimento del catalogo in un modo autentico e
affidabile. La registrazione da sola non è sufficiente nell’ambiente
digitale, poiché i documenti possono essere facilmente alterati;
disposizione: creazione di file o definizione delle relazioni tra i
documenti. In un sistema di catalogazione digitale, la disposizione e la descrizione sono correlate;
Documentazione grigia
Materiali informativi sulla produzione industriale:
- circa 4000 cataloghi aziendali suddivisi in diversi settori merceologici
relativi a produzioni industriali e architettoniche;
- circa 1400 tra listini e depliant di aziende significative per la fornitura
di materiali, la realizzazione di tecnologie di lavorazione e finitura, la produzione di oggetti, componenti e semilavorati; documentazione analogica
e digitale di vario tipo
- documentazione specializzata sui settori/comparti merceologici: aziende
principali e marchi selezionati; quadri macroeconomici e tendenze
Normative per il progetto:
Raccolta di CD-ROM UNI aggiornati al 2001 - ISO 9000 e Vision 2000, 626
Sicurezza sul lavoro, UNIEDIL impianti, UNIEDIL strutture, rassegna
di normative sulla grafica
Archivio di campioni
di materiali
Oltre 600 campioni di materiali tradizionali ed innovativi corredati da
documentazione tecnica per evidenziare specifiche caratteristiche e proprietà
(tecnologie di lavorazione, finiture, proprietà fisico-meccaniche, proprietà estetico-funzionali)
Collezione di prodotti
finiti, semilavorati
e componenti
Oltre 700 tra prodotti finiti, semilavorati e componenti, a volte illustrati
con prospetti, scomposti nei loro componenti e descritti nel ciclo tecnologico
di produzione
Emeroteca
Oltre 100 testate di periodici di settore e specializzati
Mediateca
Circa 60 VHS, 50 CD-ROM, 15 DVD, centinaia di file audiovisuali e testuali,
collezioni di immagini
Fototeca
Banca dati che documenterà i prodotti di design dal XVIII al XX secolo
(in via di costituzione attraverso il laboratorio iconologico)
Biblioteca
Circa 200 monografie e materiali bibliografici inerenti la cultura progettuale
e settoriale, tecnologie, innovazione, ecc.
Elaborati didattici, tesi
ed elaborati di laurea
- dossier di ricerca settoriale elaborati da studenti, relativi a processi
produttivi o dossier di indagine settoriale; circa 600 schede tecniche;
- oltre 1000 tesi ed elaborati di laurea del corso di laurea in Disegno
Industriale
[Tab.3] Patrimonio documentale della POLI.teca al maggio 2004
212 |
-
-
-
-
-
descrizione essenziale: informazioni contestuali e metadati. I
metadati giocano un ruolo primario, ma non esclusivo, nei sistemi automatizzati. Quando queste informazioni vengono prese
allo stesso momento della cattura, descrizioni di base (ad esempio informazioni tecniche su file d’immagine) possono essere
acquisite automaticamente. Tuttavia anche in un ambiente digitale la descrizione a livello della serie e ad altri livelli superiori
dovrà essere effettuata manualmente;
valutazione: determinazione di come i documenti dovrebbero
essere conservati dal sistema. La valutazione è un processo continuativo. Infatti esso comincia già con il processo di cattura,
quando si decide se un documento debba essere inserito o meno
nel catalogo. L’immagazzinamento e la conservazione digitale
sono costose e i soldi potrebbero essere invece impiegati per
migliorare sistema;
conservazione: molto più dinamica nell’ambiente digitale che in
quello analogico. L’operazione di migrazione dei record da un
ambiente software all’altro è complessa e oggi comporta comunque la perdita di alcuni attributi. Bisogna quindi determinare
quale grado di perdita sia accettabile;
accesso e delivery dei documenti: grazie al processo di conservazione i documenti rimangono leggibili e comprensibili, grazie al processo di ordinamento e di descrizione possono essere recuperati e
compresi nel loro contesto, grazie alla selezione e alla disposizione i
documenti non rilevanti non vengono inseriti nel catalogo;
integrazione di più applicativi e servizi indipendenti;
reference, cioè selezione delle opere d’interesse anche grazie a
segnalazioni, valutazioni di esperti, graduatorie ed indicatori formali di rilevanza.
5.5.2 Risultati e problemi incontrati
In questa fase di start-up si sono ottenuti i seguenti risultati:
1. avviamento della struttura della POLI.teca e definizione del regolamento e delle modalità di consultazione;
2. avviamento dei processi di catalogazione, indicizzazione e classificazione collettiva, tramite il coordinamento dei partecipanti al progetto
DesignNet in prove di catalogazione, verifiche in itinere, selezione di
termini di indicizzazione e definizione degli schemi di classificazione
in base alle specificità di ognuno dei laboratori (cfr. paragrafo 6.6);
3. disseminazione in ambito interdipartimentale.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 213
Nella progettazione di questa struttura, come spesso capita in Italia (non solo
per le biblioteche ma anche per i musei), è stata palese la contraddizione tra
l’esigenza di elaborare un piano di fattibilità che tenesse conto delle finalità
della POLI.teca, e i condizionamenti dovuti al fatto che essa abbia trovato
sede in un edificio preesistente con altre destinazioni d’uso. Per quanto
riguarda le attività di catalogazione e di gestione della struttura, con la release
delle applicazioni 1.0 del Design Thesaurus, del Design Catalogue e delle
Design Directory, è cominciato l’utilizzo operativo degli applicativi da parte
dei partecipanti al progetto.
Consultazione in sede
Oltre ad una sala di consultazione con circa 30 posti, come supporto
alla consultazione e all’acquisizione di informazioni la POLI.teca offre:
- 8 postazioni informatizzate (PC) con accesso Internet
- 1 postazione (PC) per la consultazione di materiale digitale (CD/DVD)
e acquisizione immagini
- 1 postazione (MAC) per l’acquisizione immagini
- 1 fotocopiatrice self-service
La prenotazione delle postazioni è prenotabile per e-mail. È possibile salvare
su un supporto magnetico i propri lavori.
Reference avanzato
e Current Contents
Reference in sede, per telefono e per e-mail; Current Contents per e-mail
Document Delivery
Nei limiti permessi dalla legge sul copyright, la POLI.teca invia i propri
materiali, anche in formato digitale, alle strutture dipartimentali afferenti,
per le attività di ricerca e didattica
Sito Web e newsletter
Segnalazione delle nuove acquisizioni, di siti web, di convegni, corsi,
seminari, ecc.
Prestito e fotocopie
È consentito il prestito giornaliero dei materiali bibliografici. È permessa la
riproduzione di alcuni documenti nei limiti permessi dalla legge sul copyright.
Acquisizione
documenti
La POLI.teca si dedica attivamente all’incremento e all’aggiornamento
della propria documentazione. È possibile avanzare richieste di desiderata
per e-mail.
[Tab.4] Servizi della POLI.teca
214 |
«Performance Measures and Metrics»,
vol. 3, n. 1, 2002, pp. 5-9.
Note
[1]
Il progetto POLI.teca è descritto in P.
Ciuccarelli, P. Innocenti, F. Vidari,
POLI.teca: a Design Knowledge Center
at Politecnico di Milano. Case Study of
a DesignNet pilot project, in Collina, L.
e Simonelli, G., Designing Designers:
Design Schools as Factories of
Knowledge, atti del convegno internazionale Designing Designers, Milano
2003.
[4]
Nello specifico, i newsgroup della Dublin
Core Metadata Initiative, dell’Open Archive
Initiative, dello European Library Automation
Group, Indexer’s discussione Group.
[5]
Distinguibili dai semplici Subject Gateway
che offrono descrizioni succinte ed una organizzazione per soggetto poco strutturata.
[2]
[6]
Cfr. Misurazione e valutazione delle
biblioteche universitarie. Rapporto preliminare del gruppo di ricerca, MURST,
gennaio 1999
<http://www.murst.it/osservatorio/rdr0199.rtf>
T.D. Wilson, Human Information Behavior.
Informing Science, 2000
<http://citeseer.nj.nec.com/cache/papers/cs/1
9561/http:zSzzSzinform.nuzSzArticleszSzVol
3zSzv3n2p49-56.pdf/wilson00human.pdf>
[7]
[3]
In particolare M. Summerfield, C.
Mandel, P. Kantor, The online books
evalutation projects. Columbia
University, Final report, December
1999,
<http://www.columbia.edu/cu/libraries/d
igital/olbdocs/finalreport.pdf>; A.
Galluzzi, Strumenti di valutazione per i
servizi digitali. Quali strategie in un
contesto ibrido?, in «Biblioteche oggi»,
dicembre 2001, pp. 6-14; D.
Greenstein, D. Troll, Usage, Usability
and User Support. Report of a discussion
group convened at the DLF Forum on 2
April 2000, Version 1.1, Digital Library
Federation, 26 May 2000
<http://www.diglib.org/use/useframe.ht
m>; P. Dixon, A. Pickard, H. Robson,
Developing a criteria-based quality framework for measuring value, in
Ciuccarelli, Innocenti
|
G.C. Bowker, S. Leigh Star, Sorting things
out: classification and its consequences, MIT
Press, Cambridge (Mass.), 1999, p. 287.
[8]
C. Lagoze, Keeping Dublin Core simple,
in «D-Lib Magazine», January 2001
<http://www.dlib.org/dlib/january01/lagoze/01lagoze.html>
[9]
<http://www.getty.edu/gri/standard//intrometadata/3_crosswalks/index.htm>,
<http://mapageweb.umontreal.ca/turner/m
eta/english/metamap.html>
<http://www.loc.gov/marc/marc2dc.html>,
<http://www2.sub.uni-goettingen.de/metaform/crosswalks.html>, <http://www.schemas-forum.org/registry/registry.html>. Cfr.
in particolare le crosswalk Dublin Core USMARC/GILS
Sistemi conoscitivi per il design: una proposta metodologica
| 215
<http://lcweb.loc.gov/marc/dccross.html>;
Dublin Core - EAD/GILS/USMARC
<http://www.oclc.org:5046/~emiller/DC/cr
osswalk.html>; Dublin Core – UNIMARC
<http://www.ukoln.ac.uk/metadata/interoperability/dc_unimarc.html>; MARC Dublin Core
<http://www.loc.gov/marc/marc2dc.html>
ze internazionali: atti del convegno internazionale, Firenze, 10-12 febbraio 2003, a
cura di M. Guerrini, B.B. Tillett, con la
collaborazione di L.Sardo, 2003
<http://www.unifi.it/universita/biblioteche/ac/relazioni/guerrini_ita.pdf>
[ 16 ]
Cfr. il documento dell’Open Society
Institute, A guide to Institutional
Repository Software, October 2003
<http://www.soros.org/openaccess/pdf/OS
I_Guide_to_Institutional_Repository_Soft
ware_v1.pdf>
Nel progetto DesignNet queste tematiche
sono state specificatamente affrontate da
Mida Boghetich (architettura di sistema e
componenti) e da Paolo Ciuccarelli e
Federico Vidari (interfaccia): per tale motivo, in questo volume esse vengono solo
sinteticamente descritte, allo scopo di fornire il quadro complessivo dell’intero progetto e di spiegare le conseguenze di tali
soluzioni a livello delle attività di catalogazione, indicizzazione e restituzione dei
documenti.
[ 12 ]
[ 17 ]
<http://www.soros.org/openaccess/>
Cfr. D.G. Dorner, A.M. Curtis, A comparative review of common user interface
products, in «Library Hi Tech», vol. 22,
n.2, 2004, pp.182-197.
[ 10 ]
<http://www.schemasforum.org/registry/desire/index.php3>
[ 11 ]
[ 13 ]
Come ad esempio le già citate
Engineering Information (Ei)
Classification Codes per le scienze e
l’ingegneria, e la Mathematics Subject
Classification (MSC) per la matematica.
[ 14 ]
Cfr. le traduzioni della norma internationale ISO 5964. Prima edizione: 15-II1985. Traduzione in italiano con integrazione dell’apparato esemplificativo ed indice trilingue dei termini tecnici. Tr. M.
Trigaré, Florence: Biblioteca di documentazione pedagogica, 1990.
[ 15 ]
M. Guerrini, Introduzione al convegno, in
Authority Control: definizioni ed esperien-
216 |
[ 18 ]
<http://www.allegro-c.de>. Allegro C non
conserva i metadati e presenta un’interfaccia in inglese e una documentazione tecnica ancora per la maggior parte in tedesco.
[ 19 ]
Cfr. E. R. Tufte, Envisioning information,
Graphic press, Cheshire, 1990.
[ 20 ]
M. Schneider, Visual Retrieval in Learning
Environments, in «CG topics», Special
Edition, 2000, pp. 48-50 <http://www.inigraphics.net/press/topics/2000/SA_2000/S
A00_a02.pdf>; S.K Card, G.G. Robertson,
J.D Mackinlay,.The information visualizer:
An information workspace, in Proceeding
of ACM CHI `91 Conference on Human
Factors in Computing Systems, New
Orleans, Louisiana, 1991, Addison-Wesley,
Reading (MA) 1999, pp. 181-188; R.
Christ, Review and analysis of color-coding
research for visual displays, in «Human
Factors», n. 17, 1975. pp. 542-570; M.
Hearst, User interfaces and visualization,
in Modern Information Retrieval, R.
Baeza-Yates, B. Ribeiro-Neto (eds.),
Addison-Wesley, Reading (MA) 1999, pp.
257-325.
[ 21 ]
V. Arquilla, Design Center: esempi di
gestione di Design Knowledge all’estero, in
DesignNet. Knowledge e Information
Management per il design, atti del seminario internazionale, a cura di P.
Ciuccarelli e P. Innocenti, prefazione di
G. Simonelli, Edizioni Poli.design,
Milano 2002, pp. 149-169.
[ 22 ]
Documentazione e biblioteconomia :
manuale per i servizi di informazione e le
biblioteche speciali italiane, a cura di M.P.
Carosella e M. Valenti, 8° ed., Franco
Angeli, Milano 1997; K. Kreizman,
Establishing an information center: a practical guide, Bowker-Saur, London 1999; J.
Treffel, Les centres de documentation et les
nouvelles technologies de l’information:
guide d’implantation et d’extension des centres de ressources documentaires
multimédias, La documentation française,
Paris 1994; F. Diozzi, Documentazione,
Associazione Italiana Biblioteche, Roma
1998; La documentazione in Italia: scritti
in occasione del centenario della FID, a cura
di A.M. Paci, Franco Angeli, Milano 1996.
Ciuccarelli, Innocenti
|
[ 23 ]
Elenchi di thesauri consultati in rete: Web
Thesaurus Compendium
<http://www.darmstadt.gmd.de/~lutes/the
salpha.html>; Controlled vocabularies,
thesauri and classification systems available
in the WWW. DC Subject, compiled by
Traugott Koch
<http://www.lub.lu.se/metadata/subjecthelp.html>; Controlled Vocabulary
Resource Guide della University of
Queensland,
<http://sky.fit.qut.edu.au/~middletm/cont
_voc.html>; Internation Terminology
Initiatives <http://www.mda.org.uk/internat.htm>
[ 24 ]
Vsmm2002. Creative Digital Culture. 8th
International Conference on Virtual
Systems and Multimedia, Corea, 25- 27
Settembre 200; DC-2002. Metadata for eCommunities. Supporting Diversity and
Convergence, 2nd International Conference
on Dublin Core and Metadata
Applications, Firenze, 16-18 ottobre 2002;
Convegno di AIDA a Bibliocom 2002,
Roma Palazzo dei Congressi, ottobre 2002.
[ 25 ]
Cfr. paragrafo 6.5.
[ 26 ]
Consultabile online a
<http://www.getty.edu/research/conducting_research/vocabularies/tgn/>
[ 27 ]
Cfr. Quelli riportati in D. Tudhope, H.
Alani, C. Jones, Augmenting Thesaurus
Relationships: Possibilities for Retrieval, in
«Journal of Digital information», vol. 1, n. 8.
Sistemi conoscitivi per il design: una proposta metodologica
| 217
[ 28 ]
P. Innocenti, Sistematizzare la documentazione di progetto. Una metodologia per un
Quality-controlled Subject Gateway per il
design, in Un accesso migliore è possibile...verso l’integrazione delle risorse informative per l’architettura e l’urbanistica.
Atti delle VIII Giornate di Studio del
CNBA, 28-31 maggio 2003. IUAV, Atti
delle VIII giornate di Studio del CNBA, a
cura di L. Casagrande, P. Piccotti e S.
Sangiorgi, Casalini, Venezia 2005, pp. 5768 ; P. Bertola, L. Collina, P. Ciuccarelli, P.
Innocenti, Design networks and knowledge
management for supporting small and
medium enterprises. Cases from Italy, in
Techné: design wisdom. Proceedings of the
5th European Academy of Design
218 |
Conference, Barcelona, 28-30 April 2003
<www.ub.es/5ead/PDF/13/Bertola.pdf>.
M. Gaiani, P. Innocenti, Stato dell’arte,
inquadramento metodologico e benefici; P.
Innocenti, Catalogazione dei materiali; P.
Innocenti, Bibliografia e documenti
online, in Una metodologia per l’acquisizione e la restituzione dei giacimenti documentali dell’architettura. I materiali per lo
studio di Andrea Palladio, a cura di G.
Beltramini e M. Gaiani, Edizioni
POLI.design, Milano 2003.
[ 29 ]
Come nel caso dell’interfaccia della versione prototipale della University of Illinois
Digital Library Initiative (DLI).
6
Conclusioni e prospettive
Paolo Ciuccarelli, Perla Innocenti
Gli obiettivi che sono stati affrontati attraverso il progetto DesignNet si possono riassumere in:
- obiettivi di servizio: a supporto delle attività di didattica della Facoltà
del Design del Politecnico di Milano;
- obiettivi di ricerca inerenti nuove metodologie di gestione, restituzione e manipolazione dei documenti coerenti con le attività e i processi
stessi del design, fornendo un accesso unico integrato ad essi;
- obiettivi di standardizzazione dei metodi e degli strumenti adottati;
- obiettivi tecnologici di sviluppo in-house di applicazioni informatiche.
I risultati ottenuti finora sono sostanzialmente positivi e ricchi di prospettive
per il futuro: la generazione di record secondo lo schema di metadati Dublin
Core e la creazione del Design Thesaurus permette non soltanto la progressiva sistematizzazione dei giacimenti documentali in oggetto e quindi la loro
visibilità ed utilizzo, ma fornisce un’espressione tangibile delle potenzialità
della catalogazione collaborativa in questo ambito e delle competenze presenti
in ambito interdipartimentale. Inoltre consente la produzione di output multipli (per un utilizzo in ambito didattico, di ricerca, editoriale, di mostre e di
comunicazione…), a partire da una base dati organizzata e resa disponibile in
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 219
digitale. Si è inoltre registrato l’interesse, da parte di varie organizzazioni pubbliche e private, della possibilità di applicazione e di utilizzo delle metodologie e dei software di DesignNet.
Le conclusioni, in un progetto come questo, ad uno stadio ancora di sperimentazione, non possono che essere provvisorie e non definitive. Più interessanti forse sono le prospettive, che sono comunque fondate giocoforza sulle
prime certezze che il programma di ricerca ha fatto emergere.
Alcune prospettive sono di breve periodo, e coincidono con gli obiettivi di
sviluppo del sistema che ci siamo già posti, come la possibilità di raccogliere
l’esperienza dell’utente, i suoi percorsi all’interno degli archivi e dei documenti, per integrarla al patrimonio esistente. Il modo in cui gli utenti mettono in
relazione e utilizzano i documenti può costituire in sostanza un ulteriore livello di conoscenza, da rendere disponibile insieme ai documenti e alle informazioni preesistenti. Altri obiettivi di breve periodo, molto tecnici, sono: l’integrazione delle tre applicazioni di gestione in un unico strumento; la possibilità di lavorare su finestre multiple; la possibilità di creare collezioni di documenti, la definizione delle regole di esportazione dei metadati, la creazione
delle interfacce di navigazione visuale (visual browsing) dei documenti per il
Design Gateway, delle quali si è parlato nel primo capitolo. Ad un livello
intermedio, quello degli obiettivi di medio periodo, c’è la volontà di gettare
un ponte verso l’e-learning, sfruttando la ‘didatticità’ di certe relazioni che gli
strumenti DesignNet permettono di creare, con la convinzione che un certo
tipo di navigazione all’interno di un sistema conoscitivo per il design possa
essere parte integrante di un programma di didattica a distanza.
In sintesi, buona parte degli sviluppi futuri del progetto DesignNet riguarderanno: implementazione dell’interfaccia grafica del sistema; personalizzazione
e customizzazione dell’interfaccia utente; implementazione dell’architettura e
dei servizi di un Quality-Controlled Subject Gateway per il design; ulteriori
investigazioni sui sistemi content-based di Information Retrieval, identificatori in ambienti di rete, tecnologie di infomobility e di bar-code e microchip per
la gestione delle movimentazioni nella POLI.teca.
Allargando ancora l’orizzonte, proiettandoci sul medio-lungo periodo, crediamo che
gli ingredienti chiave per il successo di un progetto come DesignNet siano i seguenti:
- affrontare ogni problema in modo ‘progettuale’, organizzando il progetto in fasi che comprendono l’indagine preliminare sullo stato dell’arte dei metodi e degli strumenti utilizzati e il benchmarking, le
verifica in itinere e il budget;
- lavorare con un team interdisciplinare di specialisti che definiscano prioritariamente metodologie, strumenti, specifiche tecniche e modalità
operative di base, ed effettuino verifiche periodiche durante il progetto;
220 |
-
creare un archivio digitale con le qualità sedimentarie, la capacità di
integrazione di materiali eterogenei e diffusi, la capacità di restituzione dell’informazione tipica degli archivi analogici e i plusvalori tipici
dei sistemi digitali, con contenuti intellettualmente ‘curati’, modellati
e aggiornati sui bisogni degli utenti.
Sul medio-lungo periodo la prospettiva più importante, allo stato attuale, è
senz’altro quella legata all’estensione della validità delle metodologie e degli
strumenti sviluppati nell’ambito di questo programma di ricerca. Ricordiamo
come tutto il programma DesignNet avesse in origine lo scopo di rispondere
alle esigenze specifiche della Facoltà del Design; tirando qualche conclusione,
abbiamo visto come in realtà i metodi e gli strumenti sviluppati possano avere
valore anche in altri casi, e, ad un livello più generale, possano essere utilizzati
- in virtù della loro flessibilità e della possibilità di gestire separatamente terminologia e elementi di indicizzazione - per trattare i documenti progettuali
in momenti diversi della ‘filiera del progetto’: dalla organizzazione dei documenti in uno studio di design, fino alla catalogazione dei prodotti industriali
nel museo di imprese design-oriented.
Già nelle fasi di avvio del progetto DesignNet era emersa l’intenzione di puntare alla interazione con soggetti del mondo del design esterni al Politecnico,
auspicando la connessione dei bacini di documenti e informazioni interni con
quelli esterni, con la convinzione che questo potesse dare maggiore valore agli
uni e agli altri 1. Ora siamo nelle condizioni di dire che quell’intenzione può
essere perseguita come obiettivo, ed abbiamo avviato per questo una serie di
incontri con il mondo della gestione dei patrimoni documentali del design
italiano (musei e archivi) e con gli studi professionali. Incontri che ci hanno
rivelato una situazione di relativa verginità rispetto all’adozione di metodi e
strumenti di catalogazione, soprattutto se paragonata a quella di ambiti del
patrimonio culturale che da più tempo sono stati identificati e codificati e
quindi si sono organizzati per la conservazione, la tutela, la valorizzazione dei
propri documenti, o a quella di professioni più inclini a considerare il valore
delle informazioni e della conoscenza e quindi della loro organizzazione e
gestione. Una verginità che è in realtà una grande opportunità: quella di spostare da subito l’attenzione dal documento in sé, dal progetto, dal singolo elemento, al contesto, alle relazioni tra i documenti, al significato dei documenti
e delle relazioni.
Capita spesso di sentir lamentare la mancanza di una metodologia riconosciuta e validata per descrivere oggetti del design o i documenti del design,
ammesso che si riesca a confinare questo dominio 2. L’idea dietro al progetto
DesignNet è che prima di definire una scheda per catalogare gli oggetti di
design può essere più utile concertare un metodo per far dialogare i diversi
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 221
giacimenti di documenti esistenti che possono essere utili al design. Con la
convinzione che sia comunque possibile estendere il modello e considerare
anche i documenti del design come documenti per il design, per poterli utilizzare da subito – insieme agli altri – come risorsa conoscitiva per nuovi processi progettuali.
L’ampliamento di prospettiva, dalle esigenze della Facoltà a quelle del Sistema
Design, pota con sé, per passare agli obiettivi futuri del programma, la necessità di una maggiore flessibilità nella creazione di pacchetti di contenuti, che
può venire dalla piena adozione delle disposizione dell’OAI: uno standard
che, come già detto in questo testo, «definisce un’infrastruttura tecnologica
tesa a garantire l’integrazione e l’interoperabilità di archivi distribuiti» e «il cui
approccio al metadata harvesting esemplifica la nozione di modularizzazione
dei metadati, utilizzando lo schema semplice di DC per l’interoperabilità tra
comunità diverse, supportando al tempo stesso metadati specifici delle singole
comunità».
Dietro questo allargamento al Sistema Design del programma di ricerca c’è
anche una specie di sogno, o forse meglio un’ambizione: quella di dare alla
comunità del design, che storicamente non ne ha create molte, una occasione
di unificazione, attraverso la condivisione di una metodologia e alcuni strumenti per la gestione del proprio patrimonio informativo e documentale e
quindi culturale. Una occasione per certi versi più tecnica e meno politica, e
quindi forse più facilmente accettabile. Recentemente, sull’onda dell’accordo
raggiunto da diversi soggetti del Sistema Design sull’istituzione del Museo del
Design, l’idea di condividere uno standard di catalogazione unico ha trovato
una via verso la concretizzazione nella istituzione di un "gruppo di lavoro per
l’avvio e la realizzazione di un sistema catalografico del design finalizzato alla
documentazione, conoscenza, tutela, conservazione e valorizzazione del patrimonio del design italiano" 3.
In realtà più che un’ambizione, quello del rafforzamento della comunità è
una necessità: se è vero che ogni progetto di integrazione va ricondotto alla
comunità di riferimento e con essa continuamente confrontato, e che il differenziale tra informazione e conoscenza è nell’esperienza, che è sempre contestuale, la formazione di un sistema conoscitivo non può prescindere da un
contesto e da una comunità che porti la sua esperienza all’interno del sistema
conoscitivo e sia responsabile del suo mantenimento e delle sue regole. Per
questo è importante che si lavori parallelamente alla formazione (riconoscimento, integrazione) della comunità di riferimento oltre che allo sviluppo di
metodologie e strumenti.
Anche nel caso del Sistema Design la possibilità di raccogliere e rendere utilizzabile l’intelligenza collettiva passa – come dice Rullani – dal «costruire e far fun222 |
zionare una rete di persone e una rete di imprese che, mantenendo la loro autonomia, cooperino nella produzione e valorizzazione della conoscenza posseduta».
E, ancora con Rullani, l’intelligenza collettiva, è tale solo se «la conoscenza
che contiene ed elabora non può essere divisa in parti che possano essere
sommate senza perdere qualcosa di essenziale. Ciò significa che il sapere rilevante deve stare non nei singoli nodi della rete cognitiva ma nel pattern che li
congiunge e che – essendo in gran parte implicito – non è separabile da essi».
A questo pattern abbiamo dedicato gli sforzi finora compiuti; alla possibilità
che il Sistema Design in tutta la sua estensione sia in grado di riconoscerlo e
valorizzarlo vorremmo dedicare il proseguimento del programma DesignNet,
consapevoli, come ha ricordato Peter Hirtle della Cornell University, che
«once you start a digital project, you are committed to it for life» 4.
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 223
Note
[1]
Si veda in proposito il capitolo 11
DesignNet: linee guida per il progetto, in
DesignNet. Knowledge e Information
Management per il design. Atti del seminario internazionale, Milano 8 febbraio
2002, Politecnico di Milano, a cura di P.
Ciuccarelli e P. Innocenti, prefazione di G.
Simonelli, Edizioni POLI.design, Milano
2002, pp. 183-208.
[2]
Quando si parla di ‘oggetti di design’, o
anche di ‘prodotti di design’, di solito si
intendono i prodotti ‘fisici’, gli arredi, le
lampade, che è vero hanno fatto la storia
del design, ma che rappresentano oggi solo
una porzione – quantitativamente anche
poco rappresentativa – dell’attività del
design. Deviando il senso dei due concetti,
si può dire che qualsiasi cosa, materiale o
immateriale, può essere ‘oggetto di design’,
inteso come destinatario di interventi di
design, e diventare quindi, dopo il processo di trans-formazione, ‘prodotto di
design’.
[3]
Del gruppo di lavoro fanno parte: Angelo
Cappellini, Provincia di Milano, Settore
Beni Culturali (Dirigente); Antonella
Gradellini, Provincia di Milano, Settore
Beni Culturali, Arti visive; Silvana
Annicchiarico, Triennale di Milano;
Claudia Donà, Fondazione ADI; Paolo
Ciuccarelli, Politecnico di Milano Dipartimento INDACO; Roberto Rizzi,
CLAC, Galleria del Design e
dell’Arredamento; Enzo Minervini,
Regione Lombardia, coordinamento del
progetto; Elena Traverso, Regione
224 |
Lombardia, Direzione Generale Culture,
Identità e Autonomie della Lombardia,
Unità Organizzativa Musei e Servizi;
Alessandra Vertechy, Regione Lombardia,
supporto al coordinamento del progetto.
[4]
P. B. Hirtle, Metadata for Asset
Management, Cornell University, 1997
<http://cidc.library.cornell.edu/Pub_files/ass
et%20mgmt%20metadata%20(REV).ppt>
7
Appendici
Perla Innocenti
7.1
DCMES – Qualified Schema per il progetto DesignNet
7.1.1 Schema per il prototipo del sistema
Elementi
Qualificatori
Note
Tipo
immagine statica
immagine in movimento
sito Web
insieme di dati
software
suono
testo
oggetto fisico
collezione
>
>
>
>
>
>
>
>
>
Titolo
principale
alternativo
> testo libero
> testo libero
Creatore
nome di persona
indirizzo di persona
ruolo di persona
> testo libero
> testo libero
> dal Design Thesaurus
Ciuccarelli, Innocenti
|
dal
dal
dal
dal
dal
dal
dal
dal
dal
Design
Design
Design
Design
Design
Design
Design
Design
Design
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Thesaurus
Sistemi conoscitivi per il design: una proposta metodologica
| 225
nome di ente o impresa
indirizzo di ente o impresa
ruolo di ente o impresa
> testo libero
> testo libero
> dal Design Thesaurus
Autore di contributo
subordinato
nome di persona
indirizzo di persona
ruolo di persona
nome di ente o impresa
indirizzo di ente o impresa
ruolo di ente o impresa
>
>
>
>
>
>
testo libero
testo libero
dalla Design Directory
testo libero
testo libero
dal Design Thesaurus
Identificatore
ISBN
ISSN
URI/URL
segnatura
altro
>
>
>
>
>
testo
testo
testo
testo
testo
libero
libero
libero
libero
libero
Relazione
fa parte di
comprende
è una versione di
è citato in
si riferisce a
richiede
è un formato di
>
>
>
>
>
>
>
testo
testo
testo
testo
testo
testo
testo
libero
libero
libero
libero
libero
libero
libero
Soggetto
Thesaurus del design
Classificazione Decimale Dewey
altro
> dal Design Thesaurus
> da Classificazione Decimale Dewey
> testo libero
Copertura
spaziale
temporale
stile/periodo
> testo libero
> testo libero
> testo libero
abstract
indice
> testo libero
> testo libero
> testo libero
Descrizione
conservato presso
esibito in
bibliografia
certificazioni
>
>
>
>
testo
testo
testo
testo
Formato
file
dimensioni
estensione
supporto
materiali e finiture
colore
tecniche e tecnologie
variazioni/varianti successive
altre caratteristiche
>
>
>
>
>
>
>
>
>
testo libero
testo libero
testo libero
dal Design Thesaurus
dal Design Thesaurus
dal Design Thesaurus
dal Design Thesaurus
dal Design Thesaurus
testo libero
Editore
nome
indirizzo
ruolo
luogo di edizione
luogo di produzione
>
>
>
>
>
testo libero
testo libero
dal Design Thesaurus
testo libero
testo libero
Lingua
226 |
libero
libero
libero
libero
Data
creazione
digitalizzazione
pubblicazione
anno accademico
produzione
modifica
Fonte
abstract
AAAA-MM-GG (W3C-DTF basato
su ISO 8601) con possibilità di
scrivere 1998-2000
AAAA-MM-GG (W3C-DTF basato
su ISO 8601)
AAAA-MM-GG (W3C-DTF basato
su ISO 8601)
AAAA-AAAA
> dal Design Thesaurus
> testo libero
editore
titolo
identificatore
conservato presso
materiale e finiture
colore
tecniche e tecnologie
dimensioni
estensione
altre caratteristiche
> riguarda altri record già
esistenti o prodotti astratti
> testo libero
AAAA-MM-GG (W3C-DTF basato
su ISO 8601) con possibilità
di scrivere 1998-2000
AAAA-MM-GG (W3C-DTF basato
su ISO 8601) con possibilità
di scrivere 1998-2000
> testo libero
> testo libero
> testo libero
> testo libero
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> testo libero
> testo libero
> testo libero
Gestione dei diritti
data del copyright
nota del copyright
restrizioni
licenza
proprietario
watermark
>
>
>
>
>
>
Compilatore
nome di persona
indirizzo di persona
ruolo di persona
nome di ente o impresa
indirizzo di ente o impresa
ruolo di ente o impresa
Data
creazione
ultima modifica
creatore
data di creazione
data di produzione
testo
testo
testo
testo
testo
testo
libero
libero
libero
libero
libero
libero
Status
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 227
7.1.2 Schema per la versione 1.0 del sistema
Elementi
Qualificatori
Note
Tipo
immagine statica
immagine in movimento
sito Web
insieme di dati
software
suono
testo
oggetto fisico
collezione
> dal Design Thesaurus
Titolo
principale
> testo libero, a meno che non
sia un prodotto astratto
alternativo
Creatore
nome di persona
ruolo di persona
nome di organizzazione
ruolo di organizzazione
>
>
>
>
dalla Design Directory
dal Design Thesaurus
dalla Design Directory
dal Design Thesaurus
Autore di contributo
subordinato
nome di persona
ruolo di persona
nome di organizzazione
ruolo di organizzazione
>
>
>
>
dalla Design Directory
dal Design Thesaurus
dalla Design Directory
dal Design Thesaurus
Editore
produttore
editore
distributore
luogo di pubblicazione
>
>
>
>
dalla Design Directory
dalla Design Directory
dalla Design Directory
dal Design Thesaurus
Data
creazione
AAAA-MM-GG (W3C-DTF basato
su ISO 8601) con possibilità
di scrivere 1998-2000
AAAA-MM-GG (W3C-DTF basato
su ISO 8601)
AAAA-MM-GG (W3C-DTF basato
su ISO 8601)
pubblicazione
acquisizione
Identificatore
URI/URL
segnatura
inventario
ISBN
ISSN
codice prodotto
>
>
>
>
>
>
Soggetto
THEDES
CDD
> dal Design Thesaurus
> da Classificazione Decimale Dewey
> dalla Design Directory
Copertura
spaziale
temporale
stile/periodo
> dal Design Thesaurus
> testo libero
> dal Design Thesaurus
228 |
testo
testo
testo
testo
testo
testo
libero
libero
libero
libero
libero
libero
Descrizione
abstract
indice
numero e volume
collana
edizione
posseduto da
conservato presso
esibito in
bibliografia
certificazioni
marcature
>
>
>
>
>
>
>
>
>
>
>
Lingua
contenuto
interfaccia hardware
interfaccia software
> da elenco sigle ISO 639.2
> da elenco sigle ISO 639.2
> da elenco sigle ISO 639.2
Formato
tipo di file
dimensioni
> elenco Internet Media Type
> menù a tendina per unità di
misura (GB; MB; KB; m; cm; mm;
Ø; pixel) + testo libero per valore
numerico lunghezza
> menù a tendina per unità
di misura (hh:mm:ss; pp.) +
testo libero per valore numerico
2 menù a tendina con termini
del Thesaurus del Design
2 menù a tendina con termini
del Thesaurus del Design
2 menù a tendina con termini
del Thesaurus del Design
1 menù a tendina con termini
del Thesaurus del Design
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> dal Design Thesaurus
> testo libero
proprietà fisiche
caratteristiche espressivo-sensoriali
proprietà meccaniche
forma del campione
tecnologie di formatura
tecnologie di finitura
materiali
finiture
requisiti ambientali
tecniche
colore
supporto
altre caratteristiche
Relazione
contenuto in
testo libero
testo libero
testo libero
testo libero
testo libero
dalla Design Directory
dalla Design Directory
dalla Design Directory
dalla Design Directory
dalla Design Directory
menù a tendina: CE
> riguarda altri record già
esistenti o prodotti astratti
comprende
ha come supplemento
è un supplemento di
fa parte della serie
è una versione di
è citato in
si riferisce a
richiede
è un formato di
Fonte
N° altra scheda
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 229
Gestione dei diritti
data del copyright
nota del copyright
restrizioni
proprietario dei diritti
watermark
Compilatore
nome di persona
indirizzo di persona
ruolo di persona
nome di ente o impresa
indirizzo di ente o impresa
ruolo di ente o impresa
Data
creazione
ultima modifica
AAAA-MM-GG (W3C-DTF basato
su ISO 8601)
> testo libero
> testo libero
> dalla Design Directory
> testo libero
Status
N° Record
7.2
Crosswalk Dublin Core – IPTC 1
IPTC
Object name
Headline
Byline
Credit
Byline title
Caption
Special instruction
Keywords
Source
Date created
City
Province – state
Country name
Copyright
Caption writer
230 |
Dublin Core
Titolo
Autore.nomedipersona
Autore.ruolo
Descrizione.abstract
Fonte.descrizionetestuale
Soggetto
Fonte
Data.creazione
Copertura.spaziale
Gestionedeidiritti.notadelcopyright
Autore della compilazione [campo che verrà inserito
a parte, insieme a quella della data di compilazione,
oltre i 15 elementi di DC]
7.3 Qualified DCMES + XML
Secondo il modello astratto:
- ogni record è costituito da una o più proprietà (aspetto specifico,
caratteristica, attributo di una risorsa) e dai relativi valori associati;
- ogni proprietà è un attributo della risorsa che viene descritta;
- ogni proprietà deve essere alternativamente: uno dei 15 elementi
di Dublin Core, uno degli altri elementi raccomandati dalla
DCMI, uno dei qualificatori raccomandati dall DCMI;
- le proprietà possono essere ripetute;
- ogni valore è una stringa letterale;
- ogni valore può avere associato uno schema di codifica;
- ogni schema di codifica ha un proprio nome;
- ogni valore della stringa letterale può avere associato un linguaggio;
- gli spacenames degli elementi e dei qualificatori vanno espressi in
lingua inglese.
I qualificatori vanno trattati alla stregua delle altre proprietà. Il nome
dell’elemento del XML dovrebbe essere un qualificatore XML (QName)
che associa il nome del qualificatore con l’appropriato namespace della
DCMI. Ad esempio: <dcterms:created>2003-07-25</dcterms:created>
I qualificatori sono elementi a tutti gli effetti e vanno inseriti alla stregua
degli altri elementi di Dublin Core. In particolare, vanno riportate anche
le ulteriori specifiche dei qualificatori element refinements: ad esempio
nella scheda del progetto DesignNet ‘proprietà meccaniche’ (ovvero
‘mechanical properties’) ha come ulteriore specifica ‘resistenza’ ovvero
‘endurance’).
Non è necessario che i record del Qualified Dublin Core Metadata
Schema includano informazioni esplicite tra i qualificatori e gli elementi
che essi qualificano. Gli schemi di codifica devono essere sviluppati utilizzando l’attributo ‘xsi:type’ dell’elemento XML della proprietà. Al
nome dello schema di codifica deve essere assegnato il valore di attributo
sotto forma di qualificatore XML (QName), che associa il nome dello
schema con quello dell’appropriato namespace. Ad esempio:
<dc:identifier xsi:type=’dcterms:URL’>
http://www.designnet.polimi.it/perlainnocenti.htm/</dc:identifier>
I qualificatori e gli schemi di codifica devono utilizzare i nomi specificati
dalla DCMI (Metadata Terms Recommendation). Come regola generale,
i nomi degli elementi e i qualificatori possono presentare lettere maiuscole e minuscole ma la prima lettera dovrebbe sempre essere minuscola.
Gli schemi di codifica possono presentare lettere maiuscole e minuscole
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 231
ma la prima lettera dovrebbe sempre essere maiuscola (spesso presentano
tutte le lettere maiuscole). Ad esempio:
<dcterms:isPartOf xsi:type=’dcterms:URL’>
http://www.designnet.polimi.it/
</dcterms:isPartOf>
<dcterms:Subject xsi:type=’dcterms:DDC’>
025
</dcterms:Subject>
Quando viene indicato il valore della lingua, deve essere codificato utlizzando
l’attributo ‘xml:lang’. Ad esempio:
<dc:subject xml:lang=’ita’>arredamento</dc:subject>
7.4 Design Thesaurus
Di seguito vengono riportate le relazioni presenti nel Design Thesaurus.
Relazioni
relazioni di equivalenza
relazioni associative
relazioni gerarchiche
Campi della scheda del termine nella versione 1.0
Termine
ID termine
Termine alternativo
Sinonimi e varianti
Termini associati
Faccetta
Termine generico
Fonte
Nota
Codice notazionale
ID
ALT
UF
RT
F
BT
S
SN
Informazioni aggiuntive
Nota dell’indicizzatore
Nota degli utenti
Data di creazione, aggiornamento, approvazione
Status
232 |
IN
UN
D
ST
7.5
Schemi di classificazione per i laboratori partecipanti al progetto
7.5.1 Laboratorio di Merceologia e Analisi Settoriale (MAST)
Di seguito è riportato lo schema di classificazione elaborato insieme al
Laboratorio MAST, sulla scorta delle macroclassi merceologiche in precedenza individuate 2.
Settore
AR
AR
AR
AR
AR
Subsettore
Famiglie
AR
AR
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
01
01
01
01
01
01
01
02
arredo
arredo
arredo
arredo
arredo
arredo
arredo
arredo
casa
casa
casa
casa
casa
casa
casa
contract
A
B
C
D
E
F
Z
A
AR
arredamento
02
arredo contract
B
AR
arredamento
02
arredo contract
C
AR
AR
AR
AR
AR
AR
AR
AR
IL
IL
IL
IL
IL
IL
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
arredamento
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
illuminazione
02
02
03
03
03
03
04
99
01
01
01
01
01
01
01
01
02
02
02
02
02
02
arredo contract
arredo contract
componenti d’arredo
componenti d’arredo
componenti d’arredo
componenti d’arredo
arredo urbano
miscellanea
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi residenziali
apparecchi non residenziali
apparecchi non residenziali
apparecchi non residenziali
apparecchi non residenziali
apparecchi non residenziali
apparecchi non residenziali
D
Z
A
B
C
Z
Z
mobili
sedute in genere
complementi d’arredo
cucine
bagni
per esterni
miscellanea
aeroporti, alberghi, teatri,
sale conferenze, spazi per
comunità in genere
ufficio (operativo,
di rappresentanza
e direzionale)
interni per grandi
trasporti (navi, aerei, ecc.)
per esterni
miscellanea
ferramenta e meccanismi
rubinetteria
maniglie
miscellanea
miscellanea
A
B
C
D
E
F
Y
Z
A
B
C
D
E
Z
a parete
da terra
incassati
sistemi
sospesi
da tavolo
componenti per impianti
miscellanea
per interni
per esterni
per uso industriale
apparecchi di emergenza
apparecchi professionali
miscellanea
IL
IL
IL
IL
IL
IL
IL
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 233
IL
IL
IL
EL
EL
EL
EL
CA
CA
CA
CA
AB
AB
AB
illuminazione
illuminazione
illuminazione
elettrodomestici
elettrodomestici
elettrodomestici
elettrodomestici
casalinghi
casalinghi
casalinghi
casalinghi
abbigliamento
abbigliamento
abbigliamento
02
03
99
01
02
03
99
01
02
03
99
01
02
03
AB
AB
abbigliamento
abbigliamento
04
05
AB
abbigliamento
05
AB
abbigliamento
05
AB
AB
CZ
CZ
CZ
abbigliamento
abbigliamento
calzature
calzature
calzature
06
99
01
02
03
CZ
VA
VA
VA
VA
OC
OC
OC
OC
GI
OR
OR
OR
OR
OR
AC
AC
AC
AC
calzature
valigeria
valigeria
valigeria
valigeria
occhialeria
occhialeria
occhialeria
occhialeria
gioielleria
orologeria
orologeria
orologeria
orologeria
orologeria
accessori per
accessori per
accessori per
accessori per
99
01
02
03
99
01
02
03
99
99
01
02
03
04
99
01
02
03
99
234 |
la
la
la
la
moda
moda
moda
moda
apparecchi non residenziali
sorgenti (lampade)
miscellanea
bianchi
bruni
piccoli
miscellanea
pentolame
posateria
utensili da cucina
miscellanea
abbigliamento casual
abbigliamento formale
abbigliamento intimo,
calze e costumi da bagno
abbigliamento per lo sport
abbigliamento da lavoro
e indumenti protettivi
abbigliamento da lavoro
e indumenti protettivi
abbigliamento da lavoro
e indumenti protettivi
abbigliamento per l’infanzia
miscellanea
classiche
sportive
tecniche (anatomiche,
professionali, protettive, ecc.)
miscellanea
borse
valigie
zaini
miscellanea
occhiali da sole
occhiali protettivi
componenti per occhiali
miscellanea
miscellanea
orologi da polso
orologi da tavolo
orologi a parete
componenti per orologeria
miscellanea
cappelleria
pelletteria
ombrelleria
miscellanea
Y
Z
componenti per impianti
miscellanea
Z
Z
Z
miscellanea
miscellanea
miscellanea
Z
Z
Z
miscellanea
miscellanea
miscellanea
Z
Z
miscellanea
miscellanea
Z
Z
miscellanea
miscellanea
A
abbigliamento per cicli
B
abbigliamento per motocicli
Z
Z
miscellanea
miscellanea
Z
Z
miscellanea
miscellanea
Z
miscellanea
Z
Z
Z
miscellanea
miscellanea
miscellanea
Z
Z
Z
miscellanea
miscellanea
miscellanea
Z
Z
Z
Z
Z
miscellanea
miscellanea
miscellanea
miscellanea
Z
Z
Z
miscellanea
miscellanea
miscellanea
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
TR
IM
IM
IM
IM
IM
IM
IM
IM
CO
AS
PI
MI
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
trasporti
imballaggio
imballaggio
imballaggio
imballaggio
imballaggio
imballaggio
imballaggio
imballaggio
comunicazione
attrezzature sportive
prodotti per l’infanzia
miscellanea
01
01
01
01
02
02
02
02
02
02
03
03
03
03
03
03
04
04
04
04
04
04
04
04
04
04
99
01
02
03
04
05
06
07
99
99
99
99
imbarcazioni
imbarcazioni
imbarcazioni
imbarcazioni
cicli
cicli
cicli
cicli
cicli
cicli
motocicli
motocicli
motocicli
motocicli
motocicli
motocicli
automobili
automobili
automobili
automobili
automobili
automobili
automobili
automobili
automobili
automobili
miscellanea
in carta e cartone
in materie plastiche
poliaccoppiati
in legno
in alluminio
in acciaio
in vetro
miscellanea
miscellanea
miscellanea
miscellanea
LI
CO
PR
NO
libri
componenti
prodotti
normative
A
B
Y
Z
A
B
C
D
Y
Z
A
B
C
D
Y
Z
A
B
C
D
E
F
G
H
Y
Z
a motore
a vela
componenti
miscellanea
MTB
city bike
da corsa
elettrici e assistiti
componenti
miscellanea
da strada
enduro
scooter
ciclomotori
componenti
miscellanea
aperte
berline due volumi
berline tre volumi
coupé
fuoristrada
monovolumi
multispazio
station wagon
componenti
miscellanea
Tipologie di documenti
CA
DO
ST
PE
cataloghi
documenti
lavori studenti
periodici
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 235
7.5.2 Materiali e Design (MeD)
Di seguito è riportato lo schema di classificazione elaborato insieme alla struttura interdipartimentale Materiali e Design, sulla scorta della classificazione
dei materiali precedentemente definita dai docenti interessati 3. A questa base
è stata aggiunta una notazione decimale funzionale alla organizzazione spaziale dei documenti.
000
010
011
012
013
014
020
030
031
032
033
034
040
050
060
070
080
090
100
110
111
112
113
114
115
120
130
131
132
133
140
200
210
211
212
213
236 |
METALLI
ACCIAI
ACCIAI DA COSTRUZIONE
ACCIAI INOSSIDABILI
ACCIAI SPECIALI
ALTRI ACCIAI
GHISA
RAME (E LEGHE)
RAME PURO
OTTONI
BRONZI
ALTRE LEGHE DI RAME
ALLUMINIO (E LEGHE)
TITANIO (E LEGHE)
MAGNESIO (E LEGHE)
ZINCO (E LEGHE)
A MEMORIA DI FORMA
ALTRI METALLI
CERAMICI
CERAMICI TRADIZIONALI
CEMENTI E CALCESTRUZZI
TERRACOTTE
PORCELLANE
LATERIZI
ALTRI CERAMICI TRADIZIONALI
VETRI
CERAMICI AVANZATI
ALLUMINA
ZIRCONIA
ALTRI CERAMICI AVANZATI
ALTRI CERAMICI
NATURALI
LAPIDEI
MARMI
GRANITI
TRAVERTINI
214
215
216
220
221
222
223
224
225
230
240
300
310
311
311.1
311.2
311.3
311.4
312
312.1
312.2
312.3
312.4
313
314
320
330
340
350
PIETRE DA COSTRUZIONE
RICOMPOSTI
ALTRI LAPIDEI
LEGNI
DOLCI
DURI
DURI ESOTICI
COMPOSITI
ALTRI LEGNI
CARTA E CARTONE
ALTRI NATURALI
COMPOSITI
A MATRICE POLIMERICA
A FIBRE CONTINUE
STRATIFICATI
SANDWICH
NON STRATIFICATI
ALTRI A FIBRE CONTINUE
A FIBRE DISCONTINUE
STRATIFICATI
SANDWICH
NON STRATIFICATI
ALTRI A FIBRE DISCONTINUE
PARTICELLARI
ALTRI A MATRICE POLIMERICA
A MATRICE METALLICA
A MATRICE CERAMICA
A MATRICE NATURALE
ALTRI COMPOSITI
400
410
410.1
410.1.01
410.1.02
410.1.03
410.1.04
410.1.05
410.1.06
410.1.07
410.1.08
410.1.09
410.1.10
410.1.11
410.1.12
410.1.13
410.2
410.2.01
410.2.02
410.2.03
410.2.04
410.2.05
410.2.06
410.2.07
410.2.08
410.2.09
410.2.10
410.2.11
410.2.12
410.2.13
411
420
420.01
420.02
420.03
420.04
420.05
420.06
420.07
421
430
430.1
430.1.01
430.1.02
430.1.03
430.1.04
POLIMERI
TERMOPLASTICI
AMORFI
ABS (acrilonitrile-butadiene-stirene)
CA (acetato di cellulosa)
PC (policarbonato)
PEI (polieterimmide)
PMMA (polimetilmetacrilato)
PPO (polifenilenossido)
PS (polistirene)
PSU (polisolfone)
PUR (poliuretano)
PVA (polivinilacetato)
PVC (polivinilcloruro)
SAN (stirene-acrilonitrile)
ALTRI POLIMERI AMORFI
SEMICRISTALLINI
PA (poliammidi)
PBT (polibutilentereftalato)
PE (polietilene)
PEEK (polietereterchetone)
PET (polietilentereftalato)
PI (poliimmide)
POM (acetalica)
PP (polipropilene)
PPS (polifenilensolfuro)
PTFE (politetrafluoroetilene)
PUR (poliuretano)
PVDF (polivinildenfluoruro)
ALTRI POLIMERI SEMICRISTALLINI
ALTRI POLIMERI TERMOPLASTICI
TERMOINDURENTI
UP (poliestere insaturo)
PUR (poliuretano)
EP (epossidica)
PF (fenolica)
PI (poliimmide)
MF (melamminica)
UR (ureica)
ALTRI POLIMERI TERMOINDURENTI
GOMME
RETICOLATE
GOMMA NATURALE
POLIISOPRENE SINTETICO
POLIBUTADIENE
POLIISOBUTILENE
Ciuccarelli, Innocenti
|
430.1.05
430.1.06
430.1.07
430.1.08
430.1.09
430.1.10
430.1.11
430.1.12
430.2
430.2.01
430.2.02
430.2.03
430.2.04
430.2.05
431
440
500
600
610
610.1
610.2
610.3
610.4
620
620.1
620.2
620.3
620.4
620.5
630
630.1
630.2
630.3
630.4
630.5
700
800
EPDM
FLUORURATE
SILICONICHE
NITRILICHE
POLICLOROPRENE
SBR
POLIURETANICHE
ALTRE GOMME RETICOLATE
TERMOPLASTICHE
SBS
POLIESTERE
POLIURETANICHE
POLIOLEFINICHE
ALTRE TERMOPLASTICHE
ALTRE GOMME
ALTRI POLIMERI
STRATIFICATI
TESSILE
FIBRE
NATURALI
ARTIFICIALI
SINTETICHE
INORGANICHE
FILATI
NATURALI
ARTIFICIALI
SINTETICHE
INORGANICHE
MISTI
TESSUTI
NATURALI
ARTIFICIALI
SINTETICI
INORGANICI
MISTI
RICICLATI
MISCELLANEA
Sistemi conoscitivi per il design: una proposta metodologica
| 237
7.5.3 Laboratorio Sistemi e componenti per l’edilizia 4
Settore
Subsettore
MP
MP
MP
MP
CP
CP
CP
CP
CP
CP
CP
CP
CP
PS
PS
PS
manufatti
manufatti
manufatti
manufatti
coperture
coperture
coperture
coperture
coperture
coperture
coperture
coperture
coperture
manufatti
manufatti
manufatti
PS
PS
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
RI
II
II
II
II
II
manufatti per pareti e solai
manufatti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
rivestimenti per pareti e solai
isolanti e impermeabilizzanti
isolanti e impermeabilizzanti
isolanti e impermeabilizzanti
isolanti e impermeabilizzanti
isolanti e impermeabilizzanti
238 |
prefabbricati
prefabbricati
prefabbricati
prefabbricati
per pareti e solai
per pareti e solai
per pareti e solai
01
02
03
99
01
01
01
02
02
02
03
03
99
01
01
01
manufatti in cemento
solai prefabbricati
scale
miscellanea
tegole - coppi
tegole - coppi
tegole - coppi
lastre
lastre
lastre
lamiere
lamiere
miscellanea
blocchi e mattoni
blocchi e mattoni
blocchi e mattoni
01
99
01
01
01
01
02
02
02
02
02
03
03
03
04
05
06
07
99
01
01
01
01
02
blocchi e mattoni
miscellanea
pareti tradizionali
pareti tradizionali
pareti tradizionali
pareti tradizionali
pavimenti tradizionali
pavimenti tradizionali
pavimenti tradizionali
pavimenti tradizionali
pavimenti tradizionali
controsoffitti
controsoffitti
controsoffitti
pavimenti sopraelevati
pareti mobili
facciate ventilate
rivestimenti a cappotto
miscellanea
isolanti termoacustici
isolanti termoacustici
isolanti termoacustici
isolanti termoacustici
impermeabilizzanti
Famiglie
A
B
Z
A
B
Z
A
Z
laterizio
cemento
miscellanea
fibrocemento
materialile plastico
miscellanea
metallo
miscellanea
A
B
C
Z
laterizio
calcestruzzo cellulare
calcestruzzo
vibrocompresso
miscellanea
A
B
C
Z
A
B
C
D
Z
A
B
Z
piastrelle
doghe
intonaci
miscellanea
piastrelle
listelli (parquets)
moquettes
rivestimenti continui
miscellanea
pannelli
doghe
miscellanea
A
B
C
Z
polistirene
poliuretano
lana minerale
miscellanea
II
II
SE
SE
SE
SE
SE
SE
SE
SE
IP
IP
isolanti e impermeabilizzanti
isolanti e impermeabilizzanti
serramenti
serramenti
serramenti
serramenti
serramenti
serramenti
serramenti
serramenti
impianti
impianti
03
99
01
01
01
01
02
03
04
99
01
02
IP
IP
impianti
impianti
03
04
IP
IP
CT
CT
CT
CT
CT
CT
MC
MC
MC
MC
MC
MC
CH
CH
CH
CH
AE
AE
AE
AE
CN
CN
CN
ME
ME
ME
ME
impianti
impianti
complementi per esterno
complementi per esterno
complementi per esterno
complementi per esterno
complementi per esterno
complementi per esterno
malte e calcestruzzi
malte e calcestruzzi
malte e calcestruzzi
malte e calcestruzzi
malte e calcestruzzi
malte e calcestruzzi
prodotti chimici per edilizia
prodotti chimici per edilizia
prodotti chimici per edilizia
prodotti chimici per edilizia
prodotti in acciaio per edilizia
prodotti in acciaio per edilizia
prodotti in acciaio per edilizia
prodotti in acciaio per edilizia
cantiere
cantiere
cantiere
materiali per edilizia
materiali per edilizia
materiali per edilizia
materiali per edilizia
05
99
01
02
03
04
05
99
01
02
02
02
03
99
01
02
03
99
01
02
03
99
01
02
99
01
01
01
01
Ciuccarelli, Innocenti
|
materiali bituminosi
miscellanea
porte e serramenti
porte e serramenti
porte e serramenti
porte e serramenti
accessori per serramenti
facciate continue
sistemi oscuranti
miscellanea
impianto elettrico
impianto di riscaldamento
e condizionamento
impianto idrosanitario
impianto di movimentazione
- automatismi
impianto di sicurezza e controllo
miscellanea
arredo urbano e giardino
pavimentazioni
camineti - fornetti - barbecue
reti e recinzioni
smaltimento acqua piovana
miscellanea
aggregati
leganti idraulici
leganti idraulici
leganti idraulici
malte e betoncini premiscelati
miscellanea
additivi chimici
adesivi e sigillanti
pitture e vernici
miscellanea
manufatti in ghisa
materiali ferrosi
tuberie
miscellanea
attrezzature da cantiere
legname d’opera
miscellanea
pietre
pietre
pietre
pietre
A
B
C
Z
alluminio
legno
PVC
miscellanea
A
B
Z
calce
cemento
miscellanea
A
B
C
Z
marmi
graniti
altre pietre
miscellanea
Sistemi conoscitivi per il design: una proposta metodologica
| 239
ME
ME
ME
ME
MI
MI
MI
materiali per
materiali per
materiali per
materiali per
miscellanea
miscellanea
miscellanea
edilizia
edilizia
edilizia
edilizia
02
03
04
99
01
02
03
legni
polimeri
metalli
miscellanea
architettura
urbanistica
interni
CE
SS
DC
CP
PO
NO
LP
certificazioni (copia di)
schede di sicurezza
dettagli costruittivi (in scala)
capitolati
prescrizioni per posa in opera
riferimenti normativi
listino prezzi
dossier tecnico (di approfondimento)
Tipologie di documenti
CA
ST
PE
LI
CO
DE
SC
DT
240 |
cataloghi
lavori studenti
periodici
libri
componenti (materici)
depliants informativi
schede tecniche
7.5.4 Osservatorio Progetto Bambino (OPB) 5
Categoria
Tipologie comprese
EF
Pubblicazioni effimere
Adesivi; biglietti d’invito; cartoline pubblicitarie; comunicati stampa;
manifesti; locandine; programmi di congressi. convegni. eventi; pie
ghevoli e depliant; opuscoli e brochure; stampati pubblicitari vari
PI
Pubblicazioni di
organizzazioni pubbliche
Bandi di concorso; convenzioni; delibere; dossier di progetti e di
ricerca; glossari; guide; libri bianchi; linee guida; normativa tecnica;
opuscoli e note informative; ordini degli studi; organigrammi; proget
ti; programmi economici e politici; raccolte di comunicati stampa;
rapporti di argomento scientifico e tecnologico; rassegne stampa;
relazioni ufficiali; repertori; resoconti; ricerche. indagini. studi e analisi
PA
Pubblicazione di
organizzazioni
e imprese private
Cataloghi; dossier; glossari; istruzioni per l’uso; libri bianchi; linee
guida; normativa tecnica; opuscoli informativi; organigrammi; raccolte
di comunicati stampa; rapporti di argomento scientifico e tecnologi
co; rassegne stampa; relazioni interne; relazioni ufficiali; repertori;
ricerche di mercato; schede tecniche; studi di fattibilità
DR
Materiali di didattica e
di ricerca
Dossier di progetti; dossier di ricerca; dispense; tesi di laurea e di
dottorato; tesine; ricerche; materiali di supporto alla didattica; pro
getti e allegati
EV
Documentazione di eventi
Relazioni. comunicazioni e relativi abstract. atti integrali di convegni.
conferenze. mostre. prolusioni. seminari. tavole rotonde. purchè diffu
si in modo non convenzionale
LI
Documenti bibliografici
Monografie; atti; enciclopedie;
PE
Periodici
Periodici a pubblicazione convenzionale
LP
Letteratura grigia a
carattere periodico o seriale
Collane di rapporti tecnici; estratti; notiziari; newsletter; bollettini
AR
Articoli
Articoli di quotidiani; articoli di periodici
BI
bibliografie
Bibliografie compilate per ambiti specifici
CV
Siti Web
WE
Curricula e contatti
Curricula; biglietti da visita; elenchi con riferimenti
MU
Multimedia
Audiocassette; CD-ROM; DV-ROM; diapositive; floppy disk; fotografie; VHS
DA
Documenti amministrativi
e gestionali dell’OPB
Comunicazioni; preventivi
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 241
7.6 Standard adottati
A livello documentale, nel sistema del progetto DesignNet sono stati complessivamente adottati i seguenti standard e schemi di codifica di riferimento:
- catalogazione:
- Dublin Core: NISO Standard Z39.85 e ISO 15836:2003;
- ISO 214-1976 per l’abstract;
- ISO 3136 (Codes for the representation of names of countries) e
ISO 639-2 (Codes for the representation of names of languages);
- i criteri W3C (Encoding rules for dates and times);
- il DCT1 (Dublin core type vocabulary);
- l’IMT (Internet media type);
- Design Thesaurus: UNI ISO 2788 Linee guida per la costruzione e sviluppo di thesauri monolingue; UNI ISO 5963/1985. Metodi per l’analisi dei documenti; la determinazione del loro soggetto e la selezione dei
termini di indicizzazione; Guidelines for the Costruction. Format. and
Management of Monolingual Thesauri Document Number:
ANSI/NISO Z39.19-2003. National Information Standards
Organization. 28 August 2003; Guidelines for Indexes and Related
Information Retrieval Devices Document Number: NISO TR-021997. National Information Standards Organization. 1 January 1997.
242 |
Note
[1]
Mappatura definita da Perla Innocenti e
Matteo Bergamini (LabFoto, Dipartimento
INDACO, Politecnico di Milano).
[2]
Schema di classificazione definito in collaborazione con Luca Cosmai e Diego
Speroni (Lab MAST, Dipartimento
INDACO Politecnico di Milano).
[3]
Schema di classificazione definito in collaborazione con Barbara Del Curto e
Valentina Rognoli (Materiali e Design,
Dipartimento di Chimica, Materiali e
Ingegneria Chimica ‘Giulio Natta’,
Politecnico di Milano), sulla base di quanto già indicato dai docenti del dipartimento di Chimica, Materiali e Ingegneria
Chimica ‘Giulio Natta’.
[4]
Schema di classificazione definito in collaborazione con Francesca Patti (Laboratorio
Sistemi e Componenti per l’edilizia,
Politecnico di Milano).
[5]
Schema di classificazione definito in collaborazione con Roberta Riboni
dell’Osservatorio Progetto Bambino
(Dipartimento INDACO, Politecnico di
Milano).
Ciuccarelli, Innocenti
|
Sistemi conoscitivi per il design: una proposta metodologica
| 243