La classificazione a faccette per la gestione documentale #2

di

Articolo precedente: La classificazione a faccette per la gestione documentale #1 Abstract Alla luce delle discussioni intercorse con Claudio Gnoli e Aida Slavic, l’articolo illustra come sia possibile integrare uno schema di metadati di tipo descrittivo (come il Dublin Core Element Set) con uno schema di classificazione a faccette. (L’articolo rettifica e aggiorna le considerazioni […]


Articolo precedente: La classificazione a faccette per la gestione documentale #1

Abstract

Alla luce delle discussioni intercorse con Claudio Gnoli e Aida Slavic, l’articolo illustra come sia possibile integrare uno schema di metadati di tipo descrittivo (come il Dublin Core Element Set) con uno schema di classificazione a faccette. (L’articolo rettifica e aggiorna le considerazioni pubblicate il 24 novembre 2003).

Panoramica

Tutti i documenti della intranet Tidysoft saranno organizzati secondo un sistema a faccette. Ogni documento, cioè, verrà catalogato secondo un insieme di più parametri, rappresentanti ciascuno una proprietà persistente dei documenti.

Per la scelta dello schema, si è scelto di integrare lo standard Dublin Core Metadata Element Set (DCES), versione 1.1 (già usato nella Intranet attuale) con le categorie del Classification Research Group (CRG).

Schema

Il Dublin Core Metadata Element Set indica semplicemente un sistema di metadati descrittivi per indicizzare un documento (autore, titolo etc.) e non una classificazione propriamente detta. Per parlare di classificazione, infatti, è necessario che il sistema preveda una forma di indicizzazione semantica (relativa cioè al contenuto o Subject).

Per ottenere una classificazione di tipo semantico, si è deciso di integrare il DCES con le categorie fondamentali elaborate dal Classification Research Group (CRG), secondo una procedura ormai consolidata di schema dentro lo schema. Il DCES funge così da schema di primo livello; all’interno di questo, l’elemento Subject viene rimpiazzato da un secondo schema, quello del CRG. Entro uno schema esterno di tipo descrittivo, viene inserito così un secondo schema di classificazione di tipo semantico.

Per entrambi gli schemi (DCES e CRG), sono stati mantenuti solo gli elementi o categorie ritenuti pertinenti al caso in analisi.

DCES

Questi sono i metadati definiti nel Dublin Core Metadata Element Set che abbiamo scelto e utilizzato come elementi primarie del nostro sistema di gestione documentale (fra parentesi quadre il termine originale inglese).

  • Autore [Creator]: autore del documento (può essere estratto in automatico dai metadati del file o inserito a mano)
  • Subject [Subject & Keywords]: costituisce il cuore della classificazione semantica del documento e viene a coincidere con un secondo schema (a faccette) inserito dentro il primo –> CRG (v. paragrafo seguente)
  • Abstract [Description ]: generato in automatico dal sistema estraendo alcune parole del documento)
  • Data [Date]: ultima data di modifica del documento
  • Tipo di documento [Type]: ovvero, tipo di commessa a cui il documento fa riferimento – consulenza, prodotti etc. –> categoria Tipo del CRG
  • Formato[Format]: estratto automaticamente dal sistema una volta effettuato l’upload del file
    • doc
    • rtf
    • pdf
    • etc.
  • Identificatore unico[Identifier]
    • URI
    • protocollo del progetto
  • Fonte [Source]: dipartimento aziendale che ha creato il file e/o che gestisce le attività la descritte: progettazione, area commerciale etc. –> categoria Agenti del CRG
  • Documenti correlati [Relation]: documenti correlati a quello corrente in modo puramente manuale, per evidenziare relazioni ulteriori e/o indipendenti rispetto a quelle stabilite tramite le faccette del CRG
  • Diritti[Rights Management]
    • amministrazione
    • area marketing
    • area commerciale
    • etc.

Schema dentro lo schema: le categorie del CRG come espansione dell’elemento Subject

Tra parentesi quadre sono indicate le categorie presenti nello schema del CRG ma non usate nel caso specifico perché implicite o non significative.

  • [Oggetti = documenti]: essendo documenti tutti gli oggetti della collezione, la categoria oggetto è implicita
  • Tipi: ambito di pertinenza del contenuto del documento rispetto all’offerta dell’azienda: architettura dell’informazione, soluzioni vocali, etc.
  • [Parti]
  • Proprietà: fase della commessa a cui è relativo il documento: analisi, sviluppo etc.
  • [Materiale]
  • [Processo]
  • [Operazione]
  • [Prodotto]
  • Pazienti: tipologia di cliente/target cui fa riferimento il documento: pubblica amministrazione, settore public utilities etc.
  • Agenti: team aziendale che svolge l’attività descritta in Tipi: progettisti, programmatori, etc.
  • Strumenti: tecnologie e formalismi utilizzati per l’attività descritta in Tipi
  • [Spazio]
  • [Tempo].

12.10.2004