Formato dei Dati
Come è memorizzato un documento su disco
Ogni documento è una sequenza di byte, cioè di numeri interi compresi tra 0 e 255, detti anche caratteri
07967656665
Cosa è un formato
Un formato è una regola, o legge, che spiega come interpretare la sequenza di numeri binari
Una stessa sequenza di numeri può avere diverso significato a seconda del formato di interpretazione.
Esempi di formato/1
Formato ASCII: ogni numero corrisponde ad un carattere
07967656665
NLOCABA
Esempi di formato/2
Formato “Intero 2 byte Senza Segno”: ogni coppia di numeri corrisponde ad un numero
intero positivo (i = primo + secondo * 256 )
761721716961
07967656665
Esempi di formato/3
Formato bitmap “semplificato”: - ogni numero preso in binario corrisponde ad una
riga di pixel in b/n, ex. un immagine 8 x 6
124816
32
64
128
07967656665
Formato e informazione
Il formato dei dati è il modo con cui un informazione è codificata nel documento.Viceversa, data una informazione, la scelta del formato stabilisce quanta informazione tenere dell’informazione stessa Es: dato un suono, se lo salvo in formato wav memorizzo
tutta l’informazione disponibile, mentre se uso il formato mp3 perdo un po’ di informazione per risparmiare sullo spazio utilizzato
Es: se salvo un documento word in formato ASCII perdo tutta l’informazione relativa alla formattazone del testo, altrimenti presente se uso il formato doc
Esempi di formato
Testo: txt, doc, rtf, swx, c, javaImmagine: jpeg, gif, bmp, tiffSuono: mp3, wav, pcm, ram, oggVideo: avi, wma, divx, vdcTabelle: csv, xlsDatabases: mdb, db3Eseguibile: exe, com, pif, sh, class, dll
Gestione dei formati in Windows
Windows interpreta il formato di un file attraverso l’estensione del nome (<name>.<ext>)L’estensione del file e quindi il (presunto) formato indicano al S.O. quale programma èin grado di interpretarlo.Se l’estensione viene cambiata, i dati del file rimangono invariati ma vengono interpretati da un programma diverso e quindi in maniera diversa.
Gestione dei formati in Windows
Windows, una volta identificata l’estensione del nome del file, usa una tabella interna per recuperare il programma corretto.
AccessmdbInternet Explorerhtml
ExcelxlsWorddocNotepadtxt
Gestione dei formati in Unix
In ambiente Unix il formato dei file non èdefinito in maniera univoca per ogni file come in Windows.Spetta all’utente comunicare di volta in volta in che formato sono espressi i dati (cioè quale programma è in grado di interpretarli)Spesso il formato dei dati è codificato nei primi due byte del file (detti MAGIC NUMBER)
Metadati
Cosa sono i Metadati
I Metadati di un documento sono delle informazioni aggiuntive che non fanno parte dei dati memorizzati nel documento stesso ma ne descrivono qualche caratteristica, o attributo
I Metadati possono essere quindi modificati senza cambiare il contenuto del documento
Esempi di Metadati
Nome, estensioneData creazione e/o modifica ProprietarioPermessi di Accesso Commenti…
Dati e informazione, organizzazione di dati
Esempi di dati organizzati
Fogli elettronici Microsoft Excel
Basi di dati Microsoft Access Oracle DB3 IBM
Dati e informazione, organizzazione di dati
Quando occorre memorizzare una grossa quantità di dati più o meno correlati tra loro occorre trovare un modo per organizzarli
Esempi di basi di dati
Anagrafe Schede contenenti: nome, cognome, indirizzo,
data di nascita, …
Elenco del telefono Righe contenenti: nome, cognome, numero di
telefono..
Lista della spesa Righe contenenti: tipo di cibo, quantità desiderata
Banca dati CDDB Entry contenenti: artista, titolo dell’album, elenco
delle canzoni…
Gerarchie di dati
Dati simili possono essere raggruppati ed organizzati in vari modi: L’albero genealogico Una lista di lavori da eseguire I file in una directory o di un file
system Gli indirizzi postali (le case) I vestiti nei cassetti
Gerarchia flat (piatta)
Tutti i dati sono raggruppati tutti allo stesso livelloVantaggi: Facilità di memorizzazione, consultazione,
modifica, poco spazio usato la gestione interna del sistema
Utile quando: I dati sono pochi. Si hanno poche risorse di calcolo a disposizione. Si vuole risparmiare memoria disco
Gerarchia flat: esempi
La lista della spesa. Pane Zucchero Uova …
I Numeri delle case in una via.I nomi di file in una directory.I calzini dentro un cassetto.
Gerarchia ad albero
I dati sono ordinati con uno schema ad albero Ogni dato (escluso il dato radice) ha un nodo
padre Ogni dato può avere dei dati figli
Vantaggi: Facilità di ricerca delle informazioni.
Svantaggi: Più elaborata la gestione interna del sistema
Utile quando: I dati sono tanti. I dati hanno già una struttura gerarchica.
Gerarchia ad albero: esempi
Le directory in un file sistem
L’albero genealogico.Gli indirizzi di posta.
\
myfolder windows
immagini suoni
-cane-casa
-tamburo-tromba
Record e Campi
Tutti gli esempi visti sopra hanno in comune due cose:Ogni base di dati è una collezione di oggetti simili, detti record : Schede, righe, entry, ….Ogni record è costituito sempre dagli stessi sotto-componenti, detti campi : nome, cognome, artista, quantità,…
Tabelle di dati
…possiamo quindi considerare ogni base di dati come una grande tabella (o più) in cui le righe sono i Record ed ogni riga contiene dei Campi organizzati per colonne.
2kgZucchero1kgPane
QuantitàTipoLista della spesa
record campi
Tabelle di dati: ridondanza
A volte una tabella contiene ridondanze Spreco di memoria disco. Difficoltà di modifica
La SolitudineLaura Pausini
CanzoneArtista
Dune MosseZucchero
Baila MorenaZucchero
DB Musicale
ridondanza
Relazioni tra dati
… possiamo pensare di dividere la tabella in due e mettere in collegamento tra loro i vari record
Zucchero
Laura Pausini
Artista
Dune rosseLa solitudine
Baila Morena
Canzone
DB Musicale
Relazioni
Tipi di relazioni
Studenti corsimolti - uno
Studenti esamimolti - molti
Studenti Codice fiscaleuno - uno
i DataBase
Facilitano la gestione di grosse moli di datiEvitano la ridondanza nei datiGarantiscono l’integrità tra i dati
ModelloEntità-Relazioni-Attributi
Entità Qualcosa di concreto che sta in relazione con altre
entità: studenti, libri, autori..
Attributi Proprietà delle entità: nome, età, dipartimento
Relazioni Collegamento tra entità: studente-esame, esame-
corso di laurea, ..
Entità-Attributi
Studenti
DataDiNascita
Matricola
Cognome
Nome
Attributi
Entità
Entità-Attributi vs Tabelle
Studenti
DataDiNascita
Matricola
Cognome
Nome
02/05/1973LuigiVerdi456721
01/07/1972MarioRossi436855
datadinascita
nomecognomematricola
Studenti
Relazioni
Studenti
DataDiNascita
Matricola
Cognome
Nome
Esame
DataEsameMatricola
Voto
uno - molti
Relazioni vs Tabelle
Studenti
DataDiNascita
Matricola
Cognome
Nome
Esame
DataEsameMatricola
Voto
uno - molti
02/05/1973LuigiVerdi456721
01/07/1972MarioRossi436855
datadinascita
nomecognome
matricola
Studenti
02/07/2005Mat22456721
01/07/2005Bio24436855
DataEsame
TipoEsame
votomatricola
Esame
TipoEsame