informatica per le discipline umanistiche cosè un thesaurus ontologie e thesauri
TRANSCRIPT
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
Ontologie e Thesauri
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Ontologie
Insieme dei termini che, in un particolare ambito o
dominio applicativo, denotano in modo univoco
una particolare conoscenza e fra i quali non esiste
ambiguità in quanto gli stessi sono condivisi ed
accettati dall’intera comunità degli utenti dell’
ambito e/o dominio.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Ontologie
• È la mappa dei percorsi che portano da un
oggetto ad un altro.
• Descrive i collegamenti esistenti tra oggetti
e/o documenti.
• Presenta forti somiglianze con un thesaurus
rispetto al quale oltre alle relazioni tra i termini
viene fornita una ulteriore quantità di conoscenza
concettuale.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Ontologie: un esempio
• Problema: costruzione di una ontologia a
supporto dell’archiviazione di documenti.
•Soluzione: costruzione di una struttura di
concetti che descriva l’archiviazione e sia
accettata e condivisa nell’ambito di
riferimento.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Ontologie: un esempio
• Determinazione del dominio/ambito
• Determinazione del vocabolario
• Verifica della presenza di un thesaurus
• Determinazione del concetto principale/classe
• Determinazione degli attributi
• Eventuale disambiguazione
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
Il Thesaurus è un vocabolario controllato nel quale
il controllo semantico si esercita attraverso:
• l’inserimento del termine in un reticolo sistematico
di sovra e sottordinati semantici;
• l’inserimento del termine in un reticolo di rapporti
associativi su base semantica.
• l’univocità di significato del termine preferenziale è
irrealizzabile al di fuori di un’area concettuale
specifica.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
ISO 2788/1986
Vocabolario di un linguaggio di indicizzazione
controllato organizzato in maniera formalizzata in
modo che le relazioni a priori tra i concetti siano
rese esplicite.
Finalità: funzioni di controllo della struttura
semantica del linguaggio controllato finalizzate
al recupero dell’informazione.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Metodologie di sviluppo ISO 2788/96
Deduttivo:
costruzione della terminologia partendo da uno schema
che è dato dai termini indicanti le categorie generali e le
loro specificazioni.
Induttivo:
rilevazione della terminologia usata nella indicizzazione
libera di un campione significativo di documenti nonché
nella domanda dell’utenza del servizio di
documentazione
INFORMATICA PER LE DISCIPLINE UMANISTICHE
ANSI/NISO Z39.19-2005
Guidelines for the Construction, Format, and
Management of Monolingual Controlled
Vocabularies
• Standard applicabile a thesauri tradizionali in
ambito cartaceo e digitale;
• Amplia il concetto di Documento definendolo
“content object”
INFORMATICA PER LE DISCIPLINE UMANISTICHE
ANSI/NISO Z39.19-2005
• Content object primario: il documento in forma
fisica (es: rivista, DVD) o in forma digitale;
• Content object secondario: metadati che
descrivono il content object primario;
• Non si occupa solo di Thesauri ma dei vocabolari
controllati;
• Segnala alcune soluzioni per l’interoperabilità;
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
Vocabolario Uso di tecnologie
1. Fini di indicizzazione
2. Aiuto all’utente per individuare
i termini per formulare la
domanda
3. Fonti di termini per altri
vocabolari controllati
4. Vocabolari intermedi per la
traduzione da un linguaggio ad
un altro.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Variabili formali
Simboli delle relazioni
di un thesaurus:
Inglese standard
Nota d’ambito SN
Termine preferito USE
Termine non preferito UF
Top term TT
Termine generico BT
Termine generico (generico ) BTG
Termine generico (partitivo) BTP
Termine specifico NT
Termine specifico (generico ) NTG
Termine specifico (partitivo) NTP
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Cos’è un Thesaurus
INFORMATICA PER LE DISCIPLINE UMANISTICHE
La strutturazione del campo
• Classificazione tematico disciplinare: un
campo viene diviso in sotto-temi che ne
rappresentano ciascuno una specificazione.
• Classificazione per faccette: un campo viene
tagliato sulla base di categorie fondamentali dette
faccette che possono essere applicate a qualsiasi
tema e/o settore.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Classificazione tematico - disciplinare
Arti decorative
arte del cuoio
borsa, bulino, conciatura, cuoio grezzo, sella,
sellaio
arte del legno
cornice, doratura, ebanista, intaglio, legno pregiato
arte vetraria
artigiano del vetro, cristallo, lampadario, molatura
ecc.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Classificazione per faccette
Arti decorative: Tipologie - borsa, bulino, conciatura, cuoio grezzo, sella, sellaio- Materiali - cristallo, cuoio grezzo, legno pregiato- Strumenti - bulino, traforo, ecc.- Persone - artigiano del vetro, ebanista, sellaio, ecc.- Tecniche - conciatura, doratura, molatura, ecc.- Prodotti - cornice, borsa, lampadario, ecc.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Limiti della classificazione
CLASSIFICAZIONE TEMATICA
Raccolta di termini eterogenei all’interno dei sottocampi
senza categorizzarli e privi di informazioni semantiche.
CLASSIFICAZIONE PER FACCETTE
Una suddivisione esclusiva per faccette in un campo
complesso fà perdere articolazioni e specificazioni
concretamente presenti nell’esperienza dell’utente
e quindi importanti.
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche
Equivalenza Use-UF
• termini sinonimi ai fini dell’indicizzazione
es: educazione linguistica/insegnamento della lingua
• termini quasi sinonimi trattati come sinonimi
es: platino USE
oro USE metalli nobili
argento USE
Metalli nobili UF platino
oro
argento
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche
Gerarchiche
Genere – specie
Rilievo
NT Bassorilievo
Parte – tutto
Corpo Umano
NT Testa
Esemplificative
Illustratore
NT Rossi Francesco
(NT = narrower term –
termine più specifico)
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Le relazioni semantiche
Note d’ambito
Selezionano tra i significati di un termine
polisemico quello valido nello specifico contesto.
es: TONDINO (Thesaurus archeologia)
Motivo decorativo architettonico e non ferro
da costruzione
(sn scope note – nota d’ambito)
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Thesaurus Monolingua e Multilingue
• Lingua originale delle fonti e finalità di
utilizzo del Thesaurus spingono alla creazione
del monolingua
• Internazionalizzazione del Thesaurus
fanno optare per la creazione del
multilingue
INFORMATICA PER LE DISCIPLINE UMANISTICHE
Thesaurus Ex Novo
• Raccolta e selezione dei termini
• Loro selezione e normalizzazione
• Costruzione delle relazioni fondamentali
• Organizzazione delle forme di presentazione
• Sperimentazione
• Validazione e pubblicazione