informatica per le discipline umanistiche cosè un thesaurus ontologie e thesauri

23
INFORMATICA PER LE DISCIPLINE UMANISTICHE Cos’è un Thesaurus Ontologie e Thesauri

Upload: detta-bosco

Post on 02-May-2015

218 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

Ontologie e Thesauri

Page 2: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Ontologie

Insieme dei termini che, in un particolare ambito o

dominio applicativo, denotano in modo univoco

una particolare conoscenza e fra i quali non esiste

ambiguità in quanto gli stessi sono condivisi ed

accettati dall’intera comunità degli utenti dell’

ambito e/o dominio.

Page 3: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Ontologie

• È la mappa dei percorsi che portano da un

oggetto ad un altro.

• Descrive i collegamenti esistenti tra oggetti

e/o documenti.

• Presenta forti somiglianze con un thesaurus

rispetto al quale oltre alle relazioni tra i termini

viene fornita una ulteriore quantità di conoscenza

concettuale.

Page 4: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Ontologie: un esempio

• Problema: costruzione di una ontologia a

supporto dell’archiviazione di documenti.

•Soluzione: costruzione di una struttura di

concetti che descriva l’archiviazione e sia

accettata e condivisa nell’ambito di

riferimento.

Page 5: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Ontologie: un esempio

• Determinazione del dominio/ambito

• Determinazione del vocabolario

• Verifica della presenza di un thesaurus

• Determinazione del concetto principale/classe

• Determinazione degli attributi

• Eventuale disambiguazione

Page 6: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

Il Thesaurus è un vocabolario controllato nel quale

il controllo semantico si esercita attraverso:

• l’inserimento del termine in un reticolo sistematico

di sovra e sottordinati semantici;

• l’inserimento del termine in un reticolo di rapporti

associativi su base semantica.

• l’univocità di significato del termine preferenziale è

irrealizzabile al di fuori di un’area concettuale

specifica.

Page 7: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

ISO 2788/1986

Vocabolario di un linguaggio di indicizzazione

controllato organizzato in maniera formalizzata in

modo che le relazioni a priori tra i concetti siano

rese esplicite.

Finalità: funzioni di controllo della struttura

semantica del linguaggio controllato finalizzate

al recupero dell’informazione.

Page 8: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Metodologie di sviluppo ISO 2788/96

Deduttivo:

costruzione della terminologia partendo da uno schema

che è dato dai termini indicanti le categorie generali e le

loro specificazioni.

Induttivo:

rilevazione della terminologia usata nella indicizzazione

libera di un campione significativo di documenti nonché

nella domanda dell’utenza del servizio di

documentazione

Page 9: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

ANSI/NISO Z39.19-2005

Guidelines for the Construction, Format, and

Management of Monolingual Controlled

Vocabularies

• Standard applicabile a thesauri tradizionali in

ambito cartaceo e digitale;

• Amplia il concetto di Documento definendolo

“content object”

Page 10: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

ANSI/NISO Z39.19-2005

• Content object primario: il documento in forma

fisica (es: rivista, DVD) o in forma digitale;

• Content object secondario: metadati che

descrivono il content object primario;

• Non si occupa solo di Thesauri ma dei vocabolari

controllati;

• Segnala alcune soluzioni per l’interoperabilità;

Page 11: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

Vocabolario Uso di tecnologie

1. Fini di indicizzazione

2. Aiuto all’utente per individuare

i termini per formulare la

domanda

3. Fonti di termini per altri

vocabolari controllati

4. Vocabolari intermedi per la

traduzione da un linguaggio ad

un altro.

Page 12: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Variabili formali

Simboli delle relazioni

di un thesaurus:

Inglese standard

Nota d’ambito SN

Termine preferito USE

Termine non preferito UF

Top term TT

Termine generico BT

Termine generico (generico ) BTG

Termine generico (partitivo) BTP

Termine specifico NT

Termine specifico (generico ) NTG

Termine specifico (partitivo) NTP

Page 13: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

Page 14: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Cos’è un Thesaurus

Page 15: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

La strutturazione del campo

• Classificazione tematico disciplinare: un

campo viene diviso in sotto-temi che ne

rappresentano ciascuno una specificazione.

• Classificazione per faccette: un campo viene

tagliato sulla base di categorie fondamentali dette

faccette che possono essere applicate a qualsiasi

tema e/o settore.

Page 16: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Classificazione tematico - disciplinare

Arti decorative

    arte del cuoio

        borsa, bulino, conciatura, cuoio grezzo, sella,

sellaio

    arte del legno

        cornice, doratura, ebanista, intaglio, legno pregiato

    arte vetraria

        artigiano del vetro, cristallo, lampadario, molatura

ecc.

Page 17: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Classificazione per faccette

Arti decorative: Tipologie -    borsa, bulino, conciatura, cuoio grezzo, sella, sellaio- Materiali -    cristallo, cuoio grezzo, legno pregiato- Strumenti -    bulino, traforo, ecc.- Persone -    artigiano del vetro, ebanista, sellaio, ecc.- Tecniche -    conciatura, doratura, molatura, ecc.- Prodotti -    cornice, borsa, lampadario, ecc.

Page 18: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Limiti della classificazione

CLASSIFICAZIONE TEMATICA

Raccolta di termini eterogenei all’interno dei sottocampi

senza categorizzarli e privi di informazioni semantiche.

CLASSIFICAZIONE PER FACCETTE

Una suddivisione esclusiva per faccette in un campo

complesso fà perdere articolazioni e specificazioni

concretamente presenti nell’esperienza dell’utente

e quindi importanti.

Page 19: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Le relazioni semantiche

Equivalenza Use-UF

• termini sinonimi ai fini dell’indicizzazione

es: educazione linguistica/insegnamento della lingua

• termini quasi sinonimi trattati come sinonimi

es: platino           USE

      oro                USE metalli nobili

      argento         USE

Metalli nobili     UF      platino

                                oro

                                 argento

Page 20: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Le relazioni semantiche

Gerarchiche

Genere – specie

        Rilievo

        NT Bassorilievo

Parte – tutto

        Corpo Umano

        NT Testa

Esemplificative

Illustratore

NT Rossi Francesco

(NT = narrower term –

termine più specifico)

Page 21: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Le relazioni semantiche

Note d’ambito

Selezionano tra i significati di un termine

polisemico quello valido nello specifico contesto.

es:     TONDINO (Thesaurus archeologia)

           Motivo decorativo architettonico e non ferro

da costruzione

(sn scope note – nota d’ambito)

Page 22: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Thesaurus Monolingua e Multilingue

• Lingua originale delle fonti e finalità di

utilizzo del Thesaurus spingono alla creazione

del monolingua

• Internazionalizzazione del Thesaurus

fanno optare per la creazione del

multilingue

Page 23: INFORMATICA PER LE DISCIPLINE UMANISTICHE Cosè un Thesaurus Ontologie e Thesauri

INFORMATICA PER LE DISCIPLINE UMANISTICHE

Thesaurus Ex Novo

• Raccolta e selezione dei termini

• Loro selezione e normalizzazione

• Costruzione delle relazioni fondamentali

• Organizzazione delle forme di presentazione

• Sperimentazione

• Validazione e pubblicazione