fizičko modeliranje podataka - mathos.unios.hrjklobuca/baze.j.pdf · fizičko modeliranje podataka...
TRANSCRIPT
Fizičko modeliranje podataka
Klobučar Josipa, 979 Šarić Marija, 964
Šarić Martina, 1028 Viljevac Slaven, 991
Uvod
• Polazi od logičkog modela, a rezultira izrađenim fizičkim modelom
• Fizički model je opis stvarne fizičke organizacije podataka
• Model ima oblik unutarnje sheme baze podataka
• Fizički slog
Uređaji i mediji za memoriranje podataka
Primarna memorija
• koristi se kao radna memorija za memoriranje programa i potrebnih podataka u vrijeme izvršavanja programa
Sekundarna memorija
• služi za trajno memoriranje podataka
• Podaci se uvijek mijenjaju u radnom području u primarnoj memoriji, a zatim se tako promijenjeni prenose u bazu podataka na sekundarnu memoriju.
Mediji sa serijskim pristupom
• Slogovi se obrađuju serijski, u redosljedu u kojim su memorirani na mediju
• Tipični predstavnik je magnetska vrpca
• Slogovi se grupiraju u blokove
• Blok je jedinica podataka koja se kao cjelina prenosi između primarne i sekundarne memorije
Mediji s direktnim pristupom
• Direktan pristup bilo kojem slogu
• Tipični predstavnik je disk (meki, tvrdi, magnetski, optički)
Principi fizičkog modeliranja podataka
• Cilj fizičkog modeliranja podataka:
→ fizička organizacija podataka
→ brz pristup slogovima
• Aktivnosti fizičkog modeliranja:
→ Modeliranje strukture slogova
→ Segmentiranje i grupiranje slogova
→ Izbor metode pristupa slogovima
→ Optimizacija pristupnih puteva
Modeliranje strukture slogova
• Struktura sloga u računalu definirana je formatiranjem
• Načini formatiranja:
→Pozicija polja fiksne duljine – strogi redoslijed
→Pozicija polja varijabilne duljine – duljina prethodnih polja
→Pozicija polja varijabilne duljine – indeksima
→Pozicija polja varijabilne duljine – oznakama
Način formiranja sloga
• Za smanjivanje potrebnog prostora za smještaj podataka koriste se tehnike kompresije podataka
• Tehnike:
→Korištenje kratica (EUR,USD, CHF...)
→Izbacivanje nula
→Zamjena sekvenci znakova koje se često pojavljuju
→Statističko sažimanje
Segmentiranje i grupiranje slogova
• Segmentiranje slogova –različiti dijelovi dugih slogova mogu se smjestiti na razl. fizičkim lokacijama
• Grupiranje slogova
→istog tipa:
smještanje u datoteku- za sustav datoteka
→razl. tipa:
- smještanje u bazu podataka-za područje ili prostor
- grupirati slogove koji se često zajedno obrađuju,tj.
grupe ili klastere
Metode pristup slogova
• Slogovi u datoteci obrađuju se jednom od slijedećih operacija:
→Unos novog sloga u datoteku (WRITE NEXT/KEY)
→Čitanje sloga u datoteci (READ NEXT/KEY)
→Brisanje sloga iz datoteke (DELETE)
→Promjena sadržaja sloga u datoteci (REWRITE)
Sekvencijalna metoda pristupa
• U sekvencijalno organiziranim datotekama slogovi se određuju sekvencijalnio ili serijski
Direktna metoda pristupa
• Slogovima se pristupa izravno
• Adresa sloga se “izračunava” iz ključa sloga
Adresa=f(ključ sloga)
• Prostor kojeg zauzima adresa = blok, zona, interval
• Kapacitet bloka je jedan ili više slogova
Direktna datoteka
Statička
• Podijeljena je na N blokova veličine L znakova
• Prostor se popunjava sekvencijalno
• Nedostaci:velik broj preljevnih slogova
Dinamička
• Ostvaruje se brz pojedinačni pristup slogovima, ali ostaje problem uređenog pristupa slogovima ili pristupa slogovima unutar zadanog raspona ključa
Indeksirana metoda pristupa
• Indeksna datoteka stoga sastoji se od:
• Indeksno područje
• Područje podataka
• Gradi se veći indeks s više razina na principu B stabla
• Datoteka koja koristi B-stablo može se organizirati na više načina, uobičajena su 2:
→ Slogovi se nalaze u neuređenoj sekvencijalnoj dat., a zasebno se organizira sortiran gust indeks u obliku B-stabla
→ Slogovi se nalaze u uređenoj sekvencijalnoj dat., a zasebno ili u sklopu slogova s podacima organizira se rijedak sortiran indeks u obliku B-stabla
Povezivanje slogova pokazivačima
• Pokazivač je polje u slogu koje sadrži fizičku adresu sljedećeg sloga
• Lista slogova povezana pokazivačima predstavlja logičku sekvencijalnu datoteku
Distribuiranje podataka
• Distribuirani informacijski sustav se sastoji od mreže računala u kojoj se obavlja distribuirana obrada ili postoji distribuiranost podataka
• Distribuirana baza pobataka također može biti:
• Homogena – sve lokalne baze podataka su upravljane istim SUBP-om
• Heterogena – lokalne baze podataka mogu biti upravljane različitim SUBP-ovima
• Četiri pristupa distribuciji podataka:
→Centralizirani – jedna kopija locirana u jednom čvoru
→Podjeljeni – jedna kopija podjeljena na disjunktne skupove smještena u različitim čvorovima
→Replicirani – više kopija čiji se komplementi nalaze u pojedinom čvoru
→Hibridni – kombinacija prethodnih pristupa
Literatura
• Mladen Varga – Baze podataka: Konceptualno, logičko i fizičko modeliranje podataka, DRIP, 1994.