metode pretraživanja web

9
METODE PRETRAŽIVANJA WEB-A 1. UVOD Umjetna inteligencije – disciplina koja se bavi oblikovanjem inteligentnih sustava, implementirenja ljudskog ponašanja koje se smatra inteligentnim. Zamišljena je kao kombinacija znanosti i inženjerstva kako bi se izgradili strojevi koji bi bili sposobni koristiti inteligenciju. Područja koja se bave: info, mat, filoz, ekon, psiho, lingv. UI dijeli se na slabu (sustavi kojima se dodaju samo određena svojstva ljudskog ponašanja), jaku (sustavi koji će u potpunosti moći replicirati sve svojstva ljudskog ponašanja koja se smatraju inteligentnim), primjenjivu (komercijonalni pametni sustavi, sig sust prepoznavanje lica) i kongitivnu. U današnje vrijeme nastaje i proučava se veliki broj sustava koji pokazuju značajke ljudske intel, razumjevanje i obrada prirod jezika, automatsko zaključivanje, učenje, izražavanje osjećaja. Neki ljudi zabrinuti zbog davanja prevelike moći račiunalima i ovisnosti o njima. World wide web jedna od najkorištenijih usluga interneta koja omogućuje dohvaćanje hipertekst dokumenata. To je prostor prepun sadržaja koji su u potpunosti neorganizirani, pa je treženje određene informacije tesko. Riješavanje tog probelma u području umjetne inteligencije može se okarakterizirati kao sistematičko pretraživanje mkgućih ishoda u svrhu pronalaska rješenja. Najčešće pomoću algoritma za pretraživanje. Niz akcija koje iz početnog stanja vode u ciljno stanje. Algoritam na ulazu dobije problem, aizlaz saje u obliku niza akcija.

Upload: josip-vazgec

Post on 17-Jan-2016

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Metode Pretraživanja Web

METODE PRETRAŽIVANJA WEB-A

1. UVOD

Umjetna inteligencije – disciplina koja se bavi oblikovanjem inteligentnih sustava,

implementirenja ljudskog ponašanja koje se smatra inteligentnim. Zamišljena je kao

kombinacija znanosti i inženjerstva kako bi se izgradili strojevi koji bi bili sposobni koristiti

inteligenciju. Područja koja se bave: info, mat, filoz, ekon, psiho, lingv.

UI dijeli se na slabu (sustavi kojima se dodaju samo određena svojstva ljudskog ponašanja),

jaku (sustavi koji će u potpunosti moći replicirati sve svojstva ljudskog ponašanja koja se

smatraju inteligentnim), primjenjivu (komercijonalni pametni sustavi, sig sust prepoznavanje

lica) i kongitivnu.

U današnje vrijeme nastaje i proučava se veliki broj sustava koji pokazuju značajke ljudske

intel, razumjevanje i obrada prirod jezika, automatsko zaključivanje, učenje, izražavanje

osjećaja. Neki ljudi zabrinuti zbog davanja prevelike moći račiunalima i ovisnosti o njima.

World wide web jedna od najkorištenijih usluga interneta koja omogućuje dohvaćanje

hipertekst dokumenata. To je prostor prepun sadržaja koji su u potpunosti neorganizirani, pa

je treženje određene informacije tesko. Riješavanje tog probelma u području umjetne

inteligencije može se okarakterizirati kao sistematičko pretraživanje mkgućih ishoda u svrhu

pronalaska rješenja. Najčešće pomoću algoritma za pretraživanje. Niz akcija koje iz početnog

stanja vode u ciljno stanje. Algoritam na ulazu dobije problem, aizlaz saje u obliku niza

akcija. Prema količini informacija koje algoritam dobiva iz trnuto aktivnog čvora metode

pretraživanja dijele se na slijepe (nemaju nikakvih informacija o broju koraka ili vrijednosti

putanje) i usmjerene (ima dodatne informacije o cilju, cijeni putanje ili broju koraka).

Kriteriji… i vremenska složenost…

2. SLIJEPE METODE PRETRAŽIVANJA

Slijepo ili neinformirano pretraživanje je vrsta pretraživanja u kojemu su jedine raspoložive

informacije početno stanje, dozvoljene operacije nad stanjima i test na riješenje problema.

Slijepi algoritmi se mogu poopćiti tj. na isti način mogu se primijeniti na široko područje

problema. Nisu učinkoviti za male primjere. Slijepo pretraživanje napreduje sistematski kroz

prostor pretraživanja pretraživajući čvorve u nekom prethodno zadanom redoslijedu. Razlika

između slijepih metoda – međusobni način obilaženja čvorova.

Page 2: Metode Pretraživanja Web

2.1 Pretraživanje po dubini

Način pretraž u kojem se koristi stog kao struktura podataka u koju ćemo pohranjivati one

vrhove koje smo posjetili. Stog radi na principu LIFO tj. zadnji podatak koji je stavljen na

stog će prvi biti obrisan.

Objasniti algoritam, odn sliku primjer grafa…Početno stanje A ciljno L. A pohranjujemo u

stog, budući da to nije ciljni čvor briše se iz stoga i na početak se stavljaju svi njegovi susjedni

čvorovi djeca B, C, D, E i F vratimo se na korak 2. prvi element je B nje ciljni briše se i

stavljaju njegova djeca G i H, prvi element G, nije ciljni briše se i stavljaju njegova djeca Q,

isto nije briše se, kako on nema djecu vraćamo se na prvi neistraženi čcor, H, itd dok se ne

pronađe ciljni čvor. Pogodno je kada ima puno ciljnih čvorova, ali kada se radi o konačnim

prostorima ne garantira pronalazak riješenja.

2.2 Pretraživanje po širini

Način pretr u kojem se koristi red kao struktura podataka u koju ćemo pohranjivati one

vrhove kone smo posjetili. Jedna od najčešće korištenih metoda, radi na principu FIFO tj prvi

element koji je stavljen u rec prvi se i briše.

Objasniti algoritam, odn sliku primjer grafa…Početno A ciljno L. A pohranjujemo u red,

kako prvi elementi nije ciljni A se briše iz reda i na kraj reda se stavljaju njegovi susjedni

čvorovi djeca B, C, D, E i F vratimo se na korak 2. prvi element je b nije ciljni, briše se iz

reda i na kraj reda se stavljaju njegova djeca G i H, pa ide C kako nije briše se, na kraj reda se

stavljaju njegova djeca I i J…postupak se ponavlja dok L ne bude na početku reda.

2.3 Pretraživanje s jednolikom cijenom

Slično kao pretraživanje po širini, razlika je što se kod ove metode čvorovi koji se dodaju u

red sortiraju po cijeni putanje(udaljenosti od početnog čvora) i tek onda uklanjaju iz reda.

Objasni sliku…najkraći put od S do G, kada bi se gledalo po širini bilo bi to S-A-G, ali

možemo bidjeti po cijeni putanje da se najkraći put S-B-G…Početno S nije ciljno stavljaju se

A-B-C po cijeni putanje a1 b5 c15, pa ide A kako nije briše se na kraj se dodaje G11 po cijeni

putanja ali nije konačni jer ima čvorova s manjom putanjom, pa B kako nije dodaje se G10,

tako da je G10 s najmanjom putanjom odn ciljno stanje.

Page 3: Metode Pretraživanja Web

2.4 Pretraživanje do određene dubine

Je vrsta pretraživanja po dubini, tehnika je ista, ali za razliku od tog pretraživanja dubina je

ograničena. Čak i ako se pretraživanje može nastaviti ono se neće izvršiti i tako dubina

pretraživanja neće ići u beskonačno.

Objasni sliku…Početno A ciljno L dubina 2 odn ne pretražuju se čvorovi na većoj dubini od

2. A pohranjujemo u stog, kako nije ciljno stanje, briše se iz sto ga dodaju njegova djeca, onda

je prvi B nije ciljni pa se dodaju njegova djeca, pa ide G kako on nije brise se ali ne ide na

njegovu djecu jer je dubina ograničena nego se vraća na H, dok se ne dode do ciljnog čvora L.

2.5 Iterativno pretraživanje po dubini

Vrsta pretraživanja koja kombinira svojstva pretraživanja po dubini i širini. Pretraživanje do

određene dubine se pokreće više puta uz povećanje granice dubine, dok se ne dosegne

najkraća dubina do ciljnog stanja.

Objasnit slike odn nivoe…Početno A ciljno L…nivoi 0, 1, 2…dok se ne pronade riješenje…

Nivo 0 početni A priširen i izbrisan iz reda, kako je nivo dubine 0 slijedi iteracija broja 1. A je

proširen i izbrisan iz reda, dodaju se njegova djeca, pa ide B, proširen i uklonjen iz reda, ide

slijeceći čvor na nivou 1 C proširen i izbrisan iz reda, tako sve dok ne budu posjećeni svi na

nivou 1. slijedi iteracija rednog broja 2…Počinje sa A izbrisan, djeca njegova, nivo 1..B

posjećen idu njegova djeca G i H, ide G pa H, pa se ide na C..I i J …D …K i konačni cilj L.

3. USMJERENE METODE PRETRAŽIVANJA

Usmjerene metode koriste dodatne informacije o problemu koje bitno mogu ubrzati riješenja,

sto je više podataka dostupno metodi, to je pretraživnaje učinkovitije. Odn vise informacija

kraći put do riješenja. Informacije o naravi stanja, o cijeni prijelaza iz jednog stanja u drugo,

osobinama cilja itd. to su heurističke informacije, temelje se na iskustvenim pravilima

prosuđivanja, ali nužno ne osiguravaju pronalaženje riješenja.

Koristi se heuristička funkcija f(n) dobivena zbrajanjem vrijednoti h(n) (procjena udaljenosti

čvora n do cilja) i g(n) (udaljenost čvora n od početnog čvora). G(n) se koristi smao u A*

pretraživanju. Ovi algoritmi ne pretražuju čvorove po redu nego za svaki obiđeni čvor

izračunavaju vrij heurist fnkcije te pretraživanje usmere prema čvoru s najmanjom

vrijednošću funkcije. Nedostatak je ovisnost o odabiru heurističke funkcije, ukoliko je dobro

odabrana brzo ćemo doći do riješenja, ukoliko nije pretraživanje će biti vrlo neučinkovito.

Page 4: Metode Pretraživanja Web

3.1 Pretraživanje najboljim prvim

Usmjereno pretraživanje koje optimizira pretraživanje po širini, funk heuristike procjenjuju se

čvorovi u grafu i odabire se najbolje procjenjeni čvor za daljnje pretraživanje.

Objasniti sliku…Početno A ciljno P, brojevi su udaljenosti čvorova od cilja. A% se

pohranjuje u red, nije ciljni briše se i dodaju njegova djeca u red, redoslijedom B4, C4, D6,

kako B4 nije ciljni briše se u red se dodaju njegova djeca E5 i F5, stanje reda je C4, E5, F5,

D6. kako C4 nije ciljni dodaju se njegova djeca G4 i H3, stanje u redu je H3, G4, E5, F5,

D6…H nije ciljni briše se dodaju se njegova djeca, stanje u redu je O2, P3, G4, E5, F5, D6,

kako O2 nije ciljni briše se, prvi element u redu je ciljni čvor P3 nađeno je riješenje.

3.2 Pretraživanje penjanjem

Metoda uspona na vrh slična metodi pretraživanja po dubini, širi se onaj čvor koji je

najpogodniji prema heurističkoj funkciji, dok se informacije o ostalim čvorovima brišu.

Najpogodniji čvor je onaj s minimalnom vrijednošću.

Objasni sliku…Od A do E…prvi slijedeći koji se proširuje je B ima najmanju vrijednost,

zatim se pretražuje D potom čvor C i pretraživanje je završeno dolaskom do E, riješenje je

pronađeno ali nije optimalno. Optimalno je A-C-E…nedostatak je u tome što se ne održava

stanje o svim čvorovima, za pretraživanje je važno samo trenutno stanje.

3.3 A* pretraživanje

Poseban slučaj pretraživanja najboljim prvim. Uključuje postupak računanja udaljenosti n od

početnog čvora. Što je procjenjena udaljenost do cilja manja to smo bliže cilju, ali kako A*

pretraživanje računa udaljenost od početnog stanja to još vise skraćiva pretraživanje, jer

ukoliko su dva čvora jednako udaljena od ciljnog čvora, algoritam će odabrati onaj koji je

bliže početnom čvoru, tako da se u što manje pokušaja dođe do rješenja.

3.4 Ograničeno pretraživanje po širini

Pretraživanje snopom zraka, posebna vrsta A* pretraživanja,provodi se pretraživanje na samo

n odabranih najboljih čvorova, pretraživanje se onda priširuje na susjedne čvorove, ukoliko

niti jedan od susjednih nije ciljni, algoritam od svih odabire n najboljih za daljnje

pretraživanje i postupak se ponavlja, na svakoj razini se odabiru najbolji čvrovi ( u smislu

heurističke funkcije).

Page 5: Metode Pretraživanja Web

3.5 IDA* pretraživanje

Iterativno A* pretraživanje po dubini, posebna vrsta A* pretraživanja. Ova metoda postavlja

graničnu vrijednost tj dubinu do koje se pretražuje, ako nije pronađeno na postavljanoj dubini,

dubinase povećava i odabire najmanja vrijednost heurističke funkcije, pretraživanje se

ponavlja dok se ne dođe do ciljnog stanja. Granična vrijednost se određuje prema heurističkoj

funkciji.

4. PRIMJER PRETRAŽIVANJA WEB-a

Programi koji koriste metode pretraživanja odn njihove algoritme su inteligentni agenti,

posjeduju određen stupanj inteligencije. Imaju različite nivoe samostalnosti u izvršavanju

zadataka, tako neki od njih mogu prikupljati informacije, drugi razvrstavati poruk, surađivati s

drugim agentima, te obavljati vrlo složene zadatke. Izgradnja jednostavnog agenta za pretra

Weba treba definirati sl parametre: cilj (ključna riječ ili izraz), početna lokacija (URL adresa),

broj ponavljanja, vremensko ograničenje, metoda pretraživnja.

Za svako pretraživanje weba agentom, mora se inicijalizirati odn definirati cilj i ustanoviti

metu. Pretraživanje počinje po ključnoj riječi, pa je sigurno da će korisnik htjeti više stranica

sa ključnom riječi, te će očekivati povratnu informaciju. Ukoliko je agent fleksibilan pa

dopušta odabir metode pretraživanja, treba ustanoviti koju metodu odabrati. Karakteristike

pojedinih metoda predstavljaju ponašanje agenta odn koliko brzo će korisnik dobiti povratne

informacije. Nakon inicijalizacije i definiranja metode počinje samo pretraživanje.

Nakon sto agent na HTTP portu za neku web stranicu uspostavi vezu, naredba get poziva

server da ispostavi tražnu stranicu, dobivena stranica se analizira radi pronalaženja linkova

koji se poredaju u čvorove kako bi se ustanovilo je li pronađena meta.

Kada agent preuzme web straicu i iz nje izvadi važne informacije, te ukoliko je cilj postignut,

pronađen borj web stranica pretraživanje je uspješno završeno, ukoliko nije postignut broj

traženih stranica slijedi donošenje odluke o sl koraku odn izbor algoritma pretraživanja. U red

se stavljaju čvorovi (linkovi) iz tekućeg dokumenta. Metoda pretraživanja određuje kojim

redoslijedom i na koji način će se posjećivati čvorovi.

Nakon što metoda doda ili izbriše čvorove može ih sortirati po cijeni ili heuristici, izbor

algoritma sortiranja nije toliko važan ali će skratiti vrijme pretraživanja. Ukoliko je prostor

pretraživanja iscrpljen i ema čvorova u redu, agent može dobiti novu vrijednost i ponovo

Page 6: Metode Pretraživanja Web

početi pretraživanje ili poslati povratnu inform i završiti s radom. Ako je završio s radom daje

povratnu informaciju, ukoliko nije premješta se u fazu inicijalizacije, definiranja cilja i

ponavlja se pretraživanje dok se ne postigne cilj, ili ustanovi da se nemože pronaći tražena

informacija.