tema 3: skladi štenje podataka i inteligentni agenti

33
Tema 3: Skladištenje podataka i inteligentni agenti SISTEMI ZA PODRŠKU ODLUČIVANJU doc dr Vladislav Miškovic Fakultet za informatiku i menadžment 2009/2010

Upload: chin

Post on 27-Jan-2016

50 views

Category:

Documents


0 download

DESCRIPTION

Tema 3: Skladi štenje podataka i inteligentni agenti. SISTEMI ZA PODRŠKU ODLUČIVANJU doc dr Vladislav Mi š kovic Fakultet za informatiku i menadžment 2009/2010. Tema 3 : Skladištenje podataka i inteligentni agenti. Uvod Skladišta podataka Razvoj skladišta podataka - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Tema 3:  Skladi štenje podataka i inteligentni agenti

Tema 3: Skladištenje podataka i inteligentni agenti

SISTEMI ZA PODRŠKU ODLUČIVANJUdoc dr Vladislav Miškovic

Fakultet za informatiku i menadžment

2009/2010

Page 2: Tema 3:  Skladi štenje podataka i inteligentni agenti

Tema 3: Skladištenje podataka i inteligentni agenti

1. Uvod

2. Skladišta podataka

3. Razvoj skladišta podataka

4. Zaštita i administracija

5. Inteligentni agenti

6. Primeri

Page 3: Tema 3:  Skladi štenje podataka i inteligentni agenti

1. UVOD

• Poslovna inteligencija

• Skladište podataka – Osnovna svojstva– Struktura i komponente

Page 4: Tema 3:  Skladi štenje podataka i inteligentni agenti

Poslovna inteligencija (business intelligence)

• Sastoji se od – skladišta podataka (data warehouse, DW) i – skupa korisničkih alata za kreiranje upita i

izveštaja i njihovu analizu i vizualizaciju (business analytics, BA)

– metoda za otkrivanje netrivijalnih relacija u podacima (data mining i Web mining)

– metoda i alata za upravljanje performansama poslovanja (business performance management, BPA)

Page 5: Tema 3:  Skladi štenje podataka i inteligentni agenti

Skladište podataka

• skup podataka proizvedenih radi podrške odlučivanju

• mesto prikupljanja tekućih i istorijskih podataka, potencijalno od interesa za različite menadžere u organizaciji– podaci su strukturisani na način pogodan za

različite analitičke obrade

Page 6: Tema 3:  Skladi štenje podataka i inteligentni agenti

Osnovna svojstvaskladišta podataka

• neophodni za analitičko procesiranje (OLAP), koje omogućava korisniku udobnije, manje formalne načine postavljanja složenih upita– različito od klasičnog procesiranja transakcija (OLTP)– suprotstavljeni ciljevi izgradnje operativnih baza i

analitičkih baza podataka (neefikasnost)

• skladište proizvedenih informacija– informacije iz više izvora (baza podataka)

• neophodne za održavanje tržišne prednosti– primena u izgradnji brendova, lojalnosti mušterija, ...

Page 7: Tema 3:  Skladi štenje podataka i inteligentni agenti

Struktura i komponente skladišta podataka

Page 8: Tema 3:  Skladi štenje podataka i inteligentni agenti

2. SKLADIŠTA PODATAKA

• Osnovne definicije

• Proces skladištenja

• Arhitekture skladištenja

• Integracija podataka

Page 9: Tema 3:  Skladi štenje podataka i inteligentni agenti

Osnovne definicije

• Skladište podataka (Data Warehouse)– integrisana, pojmovno orijentisana, vremenski

promenljiva i neizbrisiva kolekcija podataka, koja pruža podršku odlučivanju

– Data Mart• mali podskup skladišta posvećen nekoj tematici i namenjen

određenoj grupi ljudi

– Operational Data Store (ODS)• dinamička, privremena skladišta, za brzo donošenje odluka

– Enterprise Data Warehouses (EDW)• velika skladišta podataka, za celu organizaciju

Page 10: Tema 3:  Skladi štenje podataka i inteligentni agenti

Proces skladištenja

• Osnovne komponente– izvori podataka (data sources) - transakcione

baze, datoteke, eksterni izvori– ekstakcija– punjenje– baza podataka– metapodaci– middleware

Page 11: Tema 3:  Skladi štenje podataka i inteligentni agenti

Arhitekture skladištenja

• dvoslojna ili troslojna, prema tome kako su raspoređeni– podaci i softver skladišta– softver za prikupljanje podataka (ekstrakciju,

konsolidaciju, sumiranje i punjenje skladišta)– klijent

• Web sistemi• postoje različite varijante arhitekture skladišta,

od centralizovanih do decentralizovanih rešenja, gde se samo dele različiti pogledi (DataMarts)

Page 12: Tema 3:  Skladi štenje podataka i inteligentni agenti

Različite arhitekture skladištenja

a) centralizovano

c) decentralizovanob) Web

Page 13: Tema 3:  Skladi štenje podataka i inteligentni agenti

Integracija podataka

• priprema podataka za upotrebu od strane drugih alata za skladištenje (DW)– pristup (access) različitim izvorima podataka– objedinjavanje (federation) podataka iz različitih

izvora/sistema - internih i eksternih– izdvajanje promena (change capture)

• Tehnologije koje se koriste u integraciji– Enterprise application integration (EAI)

• Service-oriented architecture (SOA)

– Enterprise information integration (EII)– Extract, transformation and load (ETL)

Page 14: Tema 3:  Skladi štenje podataka i inteligentni agenti

ETL proces

• Ekstrakcija - čitanje više baza (transakcione baze podataka, fajlovi, elektronske tabele, lične baze podataka)

• Transformacija - promena oblika podataka• Punjenje (load) - smeštanje u skladište

– Koristi se pomoćna, privremena baza podataka– Poslovna pravila su smeštena centralizovano, kao

metapodaci– Koriste se namenski alati (Microsoft, Oracle, IBM,

Informatica, Tibco) ili se pišu se posebni programi

Page 15: Tema 3:  Skladi štenje podataka i inteligentni agenti

ETL proces

Page 16: Tema 3:  Skladi štenje podataka i inteligentni agenti

3. RAZVOJ SKLADIŠTA

• Primer

• Poznati proizvođači softvera

• Različiti pristupi razvoju

• Struktura skladišta (zvezda)

• Implementacija

• Masivna skladišta

• Skladištenje u realnom vremenu

Page 17: Tema 3:  Skladi štenje podataka i inteligentni agenti

Primer

• avioprevoznik u finansijskim problemima (7. u svetu)– 2300 letova dnevno– 227 destinacija– problem organizacije i zadovoljenja potreba putnika– više različitih baza podataka i nasleđenih zastarelih sistema,

spori upiti

• izgrađeno integrisano skladište podataka kompanije (EDW)– informacije u realnom vremenu (putnici, osoblje, bezbednost,

proces letenja)

• osim redukcije troškova, eliminisane i zloupotrebe• investicija od 30 miliona (u toku 6 godina), povećanje

prihoda 500 miliona

Page 18: Tema 3:  Skladi štenje podataka i inteligentni agenti

Poznati proizvođači softvera

• Computer Associates (www.ca.com)• Hyperion Solutions (www.hyperion.com)• IBM (www.ibm.com)• Informatica (www.informatica.com)• Microsoft (www.microsoft.com)• Oracle (PeopleSoft, Siebel) www.oracle.com• SAS Institute (www.sas.com)• Sybase (www.sybase.com)• Teradata (www.teradata.com)

Page 19: Tema 3:  Skladi štenje podataka i inteligentni agenti

Različiti pristupi razvoju

• Centralizovani pristup (EDW)– jedinstven pogled na celu organizaciju– koristi metode i alate za razvoj baza podataka (ERD,

spiralni razvoj)

• Decentralizovani pristup (Data Mart)– "planirati celinu, graditi postupno"– podaci se prvo organizuju prema problematici

pojedinih organizacionih celina– često prvi korak ka razvoju centralizovanog skladišta

(EDW)

Page 20: Tema 3:  Skladi štenje podataka i inteligentni agenti

Struktura skladišta (zvezda)

• modeliranje dimenzija - sistem pristupa podacima velikog obima

• struktura zvezde je način implementacije modela dimenzija– centralna tabela - posmatrani poslovni podaci i njihovi

atributi, analitički (mere performansi), deskriptivni, ključevi

– tabele dimenzija (klasifikacija i agregacija informacija o podacima)

• granulacija - nivo detaljnosti (optimizuje se)

Page 21: Tema 3:  Skladi štenje podataka i inteligentni agenti

Primer

Page 22: Tema 3:  Skladi štenje podataka i inteligentni agenti

Implementacija

• poseban projekt, veliki broj različitih pristupa

• niz faktora i kriterijuma (na vežbama)

• osnovni alati za integraciju podataka su deo softvera poznatih proizvođača DBMS/BI alata, npr.– SSIS - SQL Server Integration Services

Page 23: Tema 3:  Skladi štenje podataka i inteligentni agenti

SSISSQL Server Integration Services

Page 24: Tema 3:  Skladi štenje podataka i inteligentni agenti

Masivna skladišta

• performanse opadaju porastom veličine skladišta

• veličina skladišta podataka raste eksponencijalno (danas petabajti)

• skalabilnost skladišta je svojstvo da vreme pristupa linearno zavisi od veličine skladišta

Page 25: Tema 3:  Skladi štenje podataka i inteligentni agenti

Skladištenje u realnom vremenu

• tradicionalna skladišta podataka se ažuriraju periodično (npr. nedeljno)

• važni aspekti poslovanja zahtevaju donošenje odluka u realnom vremenu

• za potrebe korisnika koji direktno komuniciraju s kupcima i dobavljačima, EDW su evoluirali u real time data warehousing (RTDW) ili active warehousing (ADW)

• omogućena je upotreba skladišta podataka i na taktičkom nivou

Page 26: Tema 3:  Skladi štenje podataka i inteligentni agenti

4. ZAŠTITA I ADMINISTRACIJA

• Metodi zaštite i administracije informacionih sistema i baza podataka

• Administrator skladišta podataka– komunikacija sa donosiocima odluka– potrebno znanje iz informacionih sistema,

baza podataka, mreža i sistema za podršku odlučivanju

Page 27: Tema 3:  Skladi štenje podataka i inteligentni agenti

5. INTELIGENTNI AGENTI

• Inteligentni agent - računarski program koji pomaže korisniku u obavljaju rutinskih poslova na osnovu utvrđenih pravila i baze znanja [1]– agent - osoba koja sarađuje s drugim licima

radi obavljajnja određenih poslova– softverski agent (software daemon, software

agent), čarobnjak (wizzard)= softverski robot (softbot, chatterbot, shopbot,

knowbot, mailbot, spambot)

Page 28: Tema 3:  Skladi štenje podataka i inteligentni agenti

Podela prema primeni

• autonomni agenti1. biološki agenti

2. robotski agenti

3. računarski agenti1. softverski agenti

1. određene namene

2. za zabavu

3. virusi

2. veštački živi agenti

Page 29: Tema 3:  Skladi štenje podataka i inteligentni agenti

Podela prema svojstvima (dimenzijama)

1. agencija - stepen autonomije (asinhronost)

2. inteligencija - stepen zaključivanja i sposobnost učenja

3. mobilnost - sposobnost premeštanja u mrežnom okruženju

– učestvuju u procesima i u vreme kad korisnik nije na mreži (npr. višednevne aukcije)

Page 30: Tema 3:  Skladi štenje podataka i inteligentni agenti

Internet agenti

• e-mail agenti (mailbot)• web browsing asistenti• inteligentni pretraživači

– indeksiranje informacija, robots, spiders, wanderers• softboti (pronalaženje informacija)

– google.com, hotjobs.yahoo.com• agenti za upravljanje i nadzor• e-commerce agenti

– bestwebbuys.com, ebay.com• ostali agenti (inteligentni interfejsi, učenje,

preporučivanje, profilisanje, Web mining, ...)

Page 31: Tema 3:  Skladi štenje podataka i inteligentni agenti

6. PRIMERI

Primeri projekata na sajtovima• Oracle www.oracle.com • Microsoft www.microsoft.com • IBM www.ibm.com • Hyperion www.hyperion.com • Harvard Bussines School Case Collection

www.harvardbussinesonline.hbsp.harvard.eduInteligentni agenti i interfejsi• www.botspot.com

Page 32: Tema 3:  Skladi štenje podataka i inteligentni agenti

Literatura

1. Nastavni materijali (prezentacije i uputstva)2. Turban E., Aronson J.E., Liang T., Sharda R.,

Decision Support and Business Intelligence Systems, 8th Ed, Pearson Education,Inc, 2007

3. Seref M., Ahuja R.,Winston W., Developing Spreadsheet-based Decision Support Systems, Dynamic Ideas, 2007

4. Adam F., Humphreys P., Encyclopedia of Decision Making and Decision Support Technologies, IGI Global, 2008

Page 33: Tema 3:  Skladi štenje podataka i inteligentni agenti

SISTEMI ZA PODRŠKU ODLUČIVANJU Tema 3: Skladištenje podataka i inteligentni agenti

KRAJ