podatkovna skladišča

42
PODATKOVNE BAZE Modul: Podatkovna skladišča ©Laboratorij za podatkovne tehnologije - 1 - Podatkovna skladišča

Upload: xuxa

Post on 14-Jan-2016

47 views

Category:

Documents


4 download

DESCRIPTION

Podatkovna skladišča. Podatkovno skladišče. Kaj si bomo pogledali?. Namen podatkovnih skladišč Evolucija podatkovnih skladišč Lastnosti podatkovnih skladišč OLTP Problemi pri uvajanju podatkovnih skladišč Arhitektura podatkovnega skladišče Orodja, ki uporabljajo podatkovna skladišča. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Podatkovna skladišča

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 1 -

Podatkovna skladišča

Page 2: Podatkovna skladišča

Podatkovno skladišče

- 2 -

Kaj si bomo pogledali?

Namen podatkovnih skladišč Evolucija podatkovnih skladišč Lastnosti podatkovnih skladišč OLTP Problemi pri uvajanju podatkovnih skladišč Arhitektura podatkovnega skladišče Orodja, ki uporabljajo podatkovna skladišča

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 3: Podatkovna skladišča

- 3 -

Zakaj podatkovna skladišča?...

Za odločanje potrebni podatki:– iz različnih aplikacij informacijskega sistema, ne

glede na uporabljeno platformo in fizično lokacijo aplikacije;

– ki omogočajo pregled nad zgodovino vrednosti, ne le trenutne vrednosti podatkov in kazalnikov

– ki omogočajo pregled nad trendi, kot so rast, padanje, stagnacija itn.

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 4: Podatkovna skladišča

- 4 -

Zakaj podatkovna skladišča?

Podatkovna skladišča omogočajo realizacijo podpore odločanju. Za te potrebe hranijo:

– podatke iz več različnih podatkovnih virov– zgodovinske podatke– sumarizirane podatke

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 5: Podatkovna skladišča

- 5 -

Evolucija podatkovnih skladišč…

V sedemdesetih aplikativni sistemi avtomatizacija procesov na operativnem nivoju

Posledica: akumulacija velikih količin podatkov v PB transakcijskih sistemov

Danes poudarek različnim načinom uporabe teh podatkov za podporo odločitvenim procesom z namenom pridobiti strateško prednost pred konkurenco!

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 6: Podatkovna skladišča

- 6 -

Evolucija podatkovnih skladišč…

Podpora odločanju na operativnem in taktičnem nivoju tudi v nekaterih transakcijskih IS poročila, sumarni pregledi, grafi, …

Problem več transakcijskih IS. Področja obravnavana ločeno, po svoje…

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 7: Podatkovna skladišča

- 7 -

Evolucija podatkovnih skladišč

Potrebujemo podatkovno skladišče, ki:– predstavlja arhiv vseh podatkov na enem mestu, – predstavlja vir znanja in – omogoča enoten in hkrati uporabniku prilagojen in

konsolidiran pogled na (sumarizirane, zgodovinske, ..) podatke.

Podatkovna skladišča predstavljajo vir podatkov za različna orodja za podporo odločanju:– Relacijska orodja,– OLAP orodja, – Data Mining orodja, …

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 8: Podatkovna skladišča

- 8 -

Podatkovno skladišče kot vir podatkov

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Primer: Data Warehouse Architect

Page 9: Podatkovna skladišča

- 9 -

Lastnosti podatkovnega skladišča

Definicija:– Podatkovno skladišče je vsebinsko organizirana,

integrirana, časovno odvisna in nespremenljiva zbirka podatkov za namene podpore odločitvenim procesom.

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 10: Podatkovna skladišča

- 10 -

Vsebinska organizacija podatkov

Organizacija podatkovnega skladišča temelji na glavnih entitetah podjetja, npr.: – stranka, – izdelek, – regija, – račun,…

Ne temelji na funkcionalnih področjih oz. področjih, ki jih pokrivajo posamezni transakcijski sistemi!

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 11: Podatkovna skladišča

- 11 -

Integriranost

Podatkovno skladišče integrira podatke iz več aplikativnih sistemov v okviru IS podjetja.

Podatki večkrat nekonsistentni. Naloga skladišča je, da omogoči konsistenten pogled na podatke!

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 12: Podatkovna skladišča

- 12 -

Časovna odvisnost

Podatki v skladišču veljavni za določen čas oziroma interval.

Za podatek v podatkovnem skladišču moramo poznati čas prenosa in čas veljavnosti.

Časovna odvisnost večkrat prikazana v razširjenem časovnem formatu (poleg leta še kvartal, četrtletje)

Časovna odvisnost omogoča opazovanje trendov

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 13: Podatkovna skladišča

- 13 -

Nespremenljivost

Podatki v podatkovnem skladišču niso podvrženi spremembam v realnem času s strani aplikacij!

Osveževanje (iz transakcijskih sistemov in ostalih virov) z neko (smiselno) frekvenco

– Osveževanje: večinoma le dodajanje novih podatkov v podatkovno skladišče.

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 14: Podatkovna skladišča

- 14 -

DW in OLTP..

Podatkovno skladišče: DW – Data Warehouse

OLTP – On Line Transaction Processing

Praviloma imamo za DW in OLTP različne instance podatkovne baze

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 15: Podatkovna skladišča

DW in OLTP..

- 15 -PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Vir: Connolly, str. 1153

Page 16: Podatkovna skladišča

DW in OLTP…

Primeri vprašanj za OLTP…– Kakšen je bil celoten prihodek podjetja v prvem

kvartalu 2011? – Kakšen je bil celoten prihodek iz prodaje nepremičnin

za vsak tip nepremičnine v Veliki Britaniji v letu 2003?

– Katera so tri najbolj popularna področja v velikih mestih za najem nepremičnin v 2004 in kako je to v primerjavi s preteklimi tremi leti.

– Kakšen bi bil učinek na prodajo nepremičnin v različnih regijah Velike Britanije če bi cene nepremičnin, dražjih od 100.000 funtov povečali za 3,5% obenem pa zmanjšali davke za 1,5%. £100,000?

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 16 -

Page 17: Podatkovna skladišča

DW in OLTP

Primeri vprašanj za OLTP– Katere vrste nepremičnin se prodajajo s ceno, ki je

večja od povprečne cene nepremičnin v glavnih mestih Velike Britanije in v kakšni korelaciji je to z demografskimi podatki?

– Ali obstaja signifikantna povezava med celotnim prihodkom, generiranim v posamezni nepremičninski agenciji, in številom agentov v tej agenciji?

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 17 -

Page 18: Podatkovna skladišča

- 18 -

Problemi z uvajanjem pod. skladišč..

Podcenjevanje potrebnega časa in resursov za polnjenje podatkovnih skladišč (čiščenje)

Skriti problemi transakcijskih in drugih sistemov, ki predstavljajo podatkovni vir (Izvorni sistemi)

Manjkajoči podatki: v izvornih sistemih se nekateri pomembni podatki niso zajemali

Večja zahtevnost s strani končnih uporabnikov ali nerealne zahteve

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 19: Podatkovna skladišča

- 19 -

Problemi z uvajanjem pod. skladišč

Homogenizacija podatkov in problemi pri integraciji– Načrtovalec DW ima včasih probleme pri združevanju

podatkov iz različnih izvornih sistemov in pri tem lahko prihaja do napak

Velika poraba diskovnega prostora Lastništvo podatkov Zahtevno vzdrževanje Izgradnja in vzpostavitev DW praviloma

dolgotrajen projekt

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 20: Podatkovna skladišča

- 20 -

Arhitektura DW…

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 21: Podatkovna skladišča

Arhitektura DW..

Izvorni sistemi (Operational Data Sources):– Podatkovne baze transakcijskih aplikativnih sistemov– Internet– Ostali viri

Repozitorij (Operational Data Store):– Repozitorij podatkov podatkovnega skladišča– Večkrat vmesni člen pri prenosu podatkov v DW– Vzpostavljen predvsem v primerih, ko so med

izvornimi sistemi stari sistemi, do katerih DW ne more direktno dostopati

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 21 -

Page 22: Podatkovna skladišča

- 22 -

Arhitektura DW…

Upravljalec prenosa podatkov (Load Manager):– Izvaja vse operacije vezane na ekstrakcijo podatkov

in prenos podatkov v DW: transformacije in čiščenje podatkov

– Podatke prenaša bodisi direktno iz izvornih sistemov bodisi preko Repozitorija

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 23: Podatkovna skladišča

- 23 -

Arhitektura DW…

Upravljalec DW (Warehouse Manager):– Upravlja s podatki v DW– Izvaja operacije nad podatki:

Analizira podatke za zagotavljanje konsistentnosti Transformira podatke iz izvornih sistemov in jih združuje

(integrira) Kreira indekse in poglede nad tabelami Generira (odkriva in kreira) denormalizacije (če je

potrebno) Generira agregacije (če je potrebno) Izvaja arhiviranje podatkov in izdelovanja varnostnih kopij

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 24: Podatkovna skladišča

- 24 -

Arhitektura DW…

Upravljalec poizvedb (Query Manager):– Izvaja vse operacije vezane na poizvedbe

uporabnikov– Izdeluje plane izvajanja poizvedb in urnike za

izvajanje poizvedb– Izdeluje profile poizvedb, kar omogoča Upravljalcu

DW, da določi, katere indekse in agregacije potrebuje

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 25: Podatkovna skladišča

- 25 -

Arhitektura DW…

Različni nivoji “agregiranosti” podatkov:– Podrobni oz. transakcijski podatki (Detailed Data), ki

predstavljajo vir za višja dva nivoja– Delno in visoko agregirani podatki (Lightly and Highly

Summarized Data), ki jih generira Upravljalec DW. Cilj agregiranih podatkov je pohitritev izvajanja poizvedb. Ta del DW se spreminja glede na spremembe profilov poizvedb

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 26: Podatkovna skladišča

- 26 -

Arhitektura DW…

Arhivski podatki in varnostne kopije (Archive/Backup Data):– Za arhiviranje/hranjenje podrobnih in agregiranih

podatkov– Pomembno je izdelati varnostno kopijo agregiranih

podatkov, če ne bomo arhivirali podrobne podatke

Meta podatki (Metadata):– Gre za ekvivalent podatkovnega slovarja oz.

sistemskega kataloga pri SUPB oz. instanci podatkovne baze

– Meta podatki so podatki o podatkih, so opisi (definicij) podatkov v DW

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 27: Podatkovna skladišča

- 27 -

Arhitektura DW

Meta podatki se uporabljajo:– Pri ekstrakciji in polnjenju DW (polnjenje DW)– Pri izdelavi agregiranih tabel (upravljanje DW)– Pri poizvedbah, ko na podlagi meta podatkov

Upravljalec poizvedb določi najprimernejši podatkovni vir in uporabo najprimernejšega indeksa (delovanje DW)

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 28: Podatkovna skladišča

- 28 -

Podatkovni tokovi…

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 29: Podatkovna skladišča

- 29 -

Orodja za dostop do DW

DW mora podpirati učinkovite ad-hoc in rutinske analize. – Visoka učinkovitost dosežena s pred-planiranjem

povezav, agregacij, periodičnih poročil itn.

Tipična orodja končnih uporabnikov:– Orodja za poročila in poizvedovanje,– Razvojna orodja,– Direktorski IS,– OLAP orodja,– Data mining orodja.

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 30: Podatkovna skladišča

Generatorji poročil

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 30 -

Priprava in generiranje poročil – različna orodja za pripravo standardnih poročil (navadno desktop aplikacije) ter generatorji poročil (strežnike aplikacije).

Page 31: Podatkovna skladišča

Orodja za poizvedovanje

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 31 -

Orodja za poizvedovanje – orodja za poizvedovanje po relacijskih DW sprejmejo SQL na vhodu ali generirajo SQL. QBE stil. za kompleksne poizvedbe manj primerna.

Page 32: Podatkovna skladišča

Razvojna okolja

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 32 -

Razvojna okolja – če uporabniških zahtev ni moč realizirati z orodji za generiranje poročil ali poizvedovalnimi orodji, potrebno razviti uporabniško aplikacijo.

Na voljo mnoga razvojna okolja. Večina omogoča povezavo s poljubnimi SUPB ter OLAP mnogimi orodji.

Page 33: Podatkovna skladišča

Direktorski informacijski sistemi

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 33 -

Direktorski informacijski sistemi – inicialno razviti za potrebe najvišjega vodstva in podporo strateškemu odločanju. Danes podpirajo odločanje na vseh ravneh.

Page 34: Podatkovna skladišča

OLAP orodja

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 34 -

OLAP orodja – zasnovana na konceptu več-dimenzionalnih PB. Izkušenim uporabnikom omogočajo analiziranje podatkov s pomočjo kompleksnih več-dimenzijskih pogledov.

Primeri poizvedb: merjenje učinkovitosti marketinške akcije, napovedovanje prodaje, planiranje virov ipd.

Kot vir za OLAP orodja potrebujemo podatke, organizirane v posebne več-dimenzijske modele.

Page 35: Podatkovna skladišča

Data mining

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 35 -

Data mining – proces odkrivanja korelacij med podatki, vzorcev in trendov z analizo velike količine podatkov in uporabo matematičnih in statističnih metod ter tehnik umetne inteligence.

V primerjavi z OLAP orodji data mining ponuja tudi predikcijo in ne le restrospektive!

Page 36: Podatkovna skladišča

Orodja in tehnologije področja DW

Pri izgradnji in vpeljavi DW pogosto uporaba orodij različnih proizvajalcev dodaten element v kompleksnosti procesa razvoja in vpeljave DW

Doseči “sodelovanje” več orodij je večkrat velik izziv

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 36 -

Page 37: Podatkovna skladišča

- 37 -

SUPB za DW…

Standardni SUPB imajo posebne dodatne funkcionalnosti za potrebe DW.

Karakteristike polnjenja– Visoke zahteve za polnjenje, zahteva po sposobnosti

polnjenja več milijonov vrstic na uro– Brez omejitev navzgor

Procesiranje pri polnjenju– Konverzije tipov, transformiranje, filtriranje,

preverjanje konsistentnosti (lokalne in globalne)– Indeksiranje– Ažuriranje meta podatkov

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 38: Podatkovna skladišča

- 38 -

SUPB za DW

Odzivnost poizvedb Upravljanje z enormnimi količinami

podatkov– SUPB ne sme imeti omejitev za količino podatkov

Možnost sočasne uporabe s strani veliko uporabnikov

DW kot distribuirana PB Podpora več-dimenzionalnim podatkovnim

strukturam (za potrebe OLAP orodij) Razširjen nabor funkcionalnosti pri

poizvedbah

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 39: Podatkovna skladišča

Data Mart…

Data mart je del (podmnožica) DW, ki pokriva zahteve določenega oddelka ali funkcionalnega področja – področno podatkovno skladišče (PPS)

Značilnosti PPS:– Fokusiran na zahteve določenega oddelka ali

funkcionalnega področja– Praviloma ne vsebuje podrobnih transakcijskih

podatkov, le sumarne podatke

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 39 -

Page 40: Podatkovna skladišča

- 40 -

Data Mart…

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

Page 41: Podatkovna skladišča

Data Mart…

Razlogi za kreiranje PPS:– Dati uporabnikom na voljo le podatke, ki jih

najpogosteje analizirajo– Omogočiti posameznikom ali skupinam, da opazujejo

podatke (oddelka ali funkcionalnega področja) formatirane na način, na katerega so navajeni

– Izboljšati odzivne čase zaradi manjše količine podatkov

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 41 -

Page 42: Podatkovna skladišča

Data Mart - primer

PODATKOVNE BAZEModul: Podatkovna skladišča©Laboratorij za podatkovne tehnologije

- 42 -