metode pretraživanja web
TRANSCRIPT
METODE PRETRAŽIVANJA WEB-A
1. UVOD
Umjetna inteligencije – disciplina koja se bavi oblikovanjem inteligentnih sustava,
implementirenja ljudskog ponašanja koje se smatra inteligentnim. Zamišljena je kao
kombinacija znanosti i inženjerstva kako bi se izgradili strojevi koji bi bili sposobni koristiti
inteligenciju. Područja koja se bave: info, mat, filoz, ekon, psiho, lingv.
UI dijeli se na slabu (sustavi kojima se dodaju samo određena svojstva ljudskog ponašanja),
jaku (sustavi koji će u potpunosti moći replicirati sve svojstva ljudskog ponašanja koja se
smatraju inteligentnim), primjenjivu (komercijonalni pametni sustavi, sig sust prepoznavanje
lica) i kongitivnu.
U današnje vrijeme nastaje i proučava se veliki broj sustava koji pokazuju značajke ljudske
intel, razumjevanje i obrada prirod jezika, automatsko zaključivanje, učenje, izražavanje
osjećaja. Neki ljudi zabrinuti zbog davanja prevelike moći račiunalima i ovisnosti o njima.
World wide web jedna od najkorištenijih usluga interneta koja omogućuje dohvaćanje
hipertekst dokumenata. To je prostor prepun sadržaja koji su u potpunosti neorganizirani, pa
je treženje određene informacije tesko. Riješavanje tog probelma u području umjetne
inteligencije može se okarakterizirati kao sistematičko pretraživanje mkgućih ishoda u svrhu
pronalaska rješenja. Najčešće pomoću algoritma za pretraživanje. Niz akcija koje iz početnog
stanja vode u ciljno stanje. Algoritam na ulazu dobije problem, aizlaz saje u obliku niza
akcija. Prema količini informacija koje algoritam dobiva iz trnuto aktivnog čvora metode
pretraživanja dijele se na slijepe (nemaju nikakvih informacija o broju koraka ili vrijednosti
putanje) i usmjerene (ima dodatne informacije o cilju, cijeni putanje ili broju koraka).
Kriteriji… i vremenska složenost…
2. SLIJEPE METODE PRETRAŽIVANJA
Slijepo ili neinformirano pretraživanje je vrsta pretraživanja u kojemu su jedine raspoložive
informacije početno stanje, dozvoljene operacije nad stanjima i test na riješenje problema.
Slijepi algoritmi se mogu poopćiti tj. na isti način mogu se primijeniti na široko područje
problema. Nisu učinkoviti za male primjere. Slijepo pretraživanje napreduje sistematski kroz
prostor pretraživanja pretraživajući čvorve u nekom prethodno zadanom redoslijedu. Razlika
između slijepih metoda – međusobni način obilaženja čvorova.
2.1 Pretraživanje po dubini
Način pretraž u kojem se koristi stog kao struktura podataka u koju ćemo pohranjivati one
vrhove koje smo posjetili. Stog radi na principu LIFO tj. zadnji podatak koji je stavljen na
stog će prvi biti obrisan.
Objasniti algoritam, odn sliku primjer grafa…Početno stanje A ciljno L. A pohranjujemo u
stog, budući da to nije ciljni čvor briše se iz stoga i na početak se stavljaju svi njegovi susjedni
čvorovi djeca B, C, D, E i F vratimo se na korak 2. prvi element je B nje ciljni briše se i
stavljaju njegova djeca G i H, prvi element G, nije ciljni briše se i stavljaju njegova djeca Q,
isto nije briše se, kako on nema djecu vraćamo se na prvi neistraženi čcor, H, itd dok se ne
pronađe ciljni čvor. Pogodno je kada ima puno ciljnih čvorova, ali kada se radi o konačnim
prostorima ne garantira pronalazak riješenja.
2.2 Pretraživanje po širini
Način pretr u kojem se koristi red kao struktura podataka u koju ćemo pohranjivati one
vrhove kone smo posjetili. Jedna od najčešće korištenih metoda, radi na principu FIFO tj prvi
element koji je stavljen u rec prvi se i briše.
Objasniti algoritam, odn sliku primjer grafa…Početno A ciljno L. A pohranjujemo u red,
kako prvi elementi nije ciljni A se briše iz reda i na kraj reda se stavljaju njegovi susjedni
čvorovi djeca B, C, D, E i F vratimo se na korak 2. prvi element je b nije ciljni, briše se iz
reda i na kraj reda se stavljaju njegova djeca G i H, pa ide C kako nije briše se, na kraj reda se
stavljaju njegova djeca I i J…postupak se ponavlja dok L ne bude na početku reda.
2.3 Pretraživanje s jednolikom cijenom
Slično kao pretraživanje po širini, razlika je što se kod ove metode čvorovi koji se dodaju u
red sortiraju po cijeni putanje(udaljenosti od početnog čvora) i tek onda uklanjaju iz reda.
Objasni sliku…najkraći put od S do G, kada bi se gledalo po širini bilo bi to S-A-G, ali
možemo bidjeti po cijeni putanje da se najkraći put S-B-G…Početno S nije ciljno stavljaju se
A-B-C po cijeni putanje a1 b5 c15, pa ide A kako nije briše se na kraj se dodaje G11 po cijeni
putanja ali nije konačni jer ima čvorova s manjom putanjom, pa B kako nije dodaje se G10,
tako da je G10 s najmanjom putanjom odn ciljno stanje.
2.4 Pretraživanje do određene dubine
Je vrsta pretraživanja po dubini, tehnika je ista, ali za razliku od tog pretraživanja dubina je
ograničena. Čak i ako se pretraživanje može nastaviti ono se neće izvršiti i tako dubina
pretraživanja neće ići u beskonačno.
Objasni sliku…Početno A ciljno L dubina 2 odn ne pretražuju se čvorovi na većoj dubini od
2. A pohranjujemo u stog, kako nije ciljno stanje, briše se iz sto ga dodaju njegova djeca, onda
je prvi B nije ciljni pa se dodaju njegova djeca, pa ide G kako on nije brise se ali ne ide na
njegovu djecu jer je dubina ograničena nego se vraća na H, dok se ne dode do ciljnog čvora L.
2.5 Iterativno pretraživanje po dubini
Vrsta pretraživanja koja kombinira svojstva pretraživanja po dubini i širini. Pretraživanje do
određene dubine se pokreće više puta uz povećanje granice dubine, dok se ne dosegne
najkraća dubina do ciljnog stanja.
Objasnit slike odn nivoe…Početno A ciljno L…nivoi 0, 1, 2…dok se ne pronade riješenje…
Nivo 0 početni A priširen i izbrisan iz reda, kako je nivo dubine 0 slijedi iteracija broja 1. A je
proširen i izbrisan iz reda, dodaju se njegova djeca, pa ide B, proširen i uklonjen iz reda, ide
slijeceći čvor na nivou 1 C proširen i izbrisan iz reda, tako sve dok ne budu posjećeni svi na
nivou 1. slijedi iteracija rednog broja 2…Počinje sa A izbrisan, djeca njegova, nivo 1..B
posjećen idu njegova djeca G i H, ide G pa H, pa se ide na C..I i J …D …K i konačni cilj L.
3. USMJERENE METODE PRETRAŽIVANJA
Usmjerene metode koriste dodatne informacije o problemu koje bitno mogu ubrzati riješenja,
sto je više podataka dostupno metodi, to je pretraživnaje učinkovitije. Odn vise informacija
kraći put do riješenja. Informacije o naravi stanja, o cijeni prijelaza iz jednog stanja u drugo,
osobinama cilja itd. to su heurističke informacije, temelje se na iskustvenim pravilima
prosuđivanja, ali nužno ne osiguravaju pronalaženje riješenja.
Koristi se heuristička funkcija f(n) dobivena zbrajanjem vrijednoti h(n) (procjena udaljenosti
čvora n do cilja) i g(n) (udaljenost čvora n od početnog čvora). G(n) se koristi smao u A*
pretraživanju. Ovi algoritmi ne pretražuju čvorove po redu nego za svaki obiđeni čvor
izračunavaju vrij heurist fnkcije te pretraživanje usmere prema čvoru s najmanjom
vrijednošću funkcije. Nedostatak je ovisnost o odabiru heurističke funkcije, ukoliko je dobro
odabrana brzo ćemo doći do riješenja, ukoliko nije pretraživanje će biti vrlo neučinkovito.
3.1 Pretraživanje najboljim prvim
Usmjereno pretraživanje koje optimizira pretraživanje po širini, funk heuristike procjenjuju se
čvorovi u grafu i odabire se najbolje procjenjeni čvor za daljnje pretraživanje.
Objasniti sliku…Početno A ciljno P, brojevi su udaljenosti čvorova od cilja. A% se
pohranjuje u red, nije ciljni briše se i dodaju njegova djeca u red, redoslijedom B4, C4, D6,
kako B4 nije ciljni briše se u red se dodaju njegova djeca E5 i F5, stanje reda je C4, E5, F5,
D6. kako C4 nije ciljni dodaju se njegova djeca G4 i H3, stanje u redu je H3, G4, E5, F5,
D6…H nije ciljni briše se dodaju se njegova djeca, stanje u redu je O2, P3, G4, E5, F5, D6,
kako O2 nije ciljni briše se, prvi element u redu je ciljni čvor P3 nađeno je riješenje.
3.2 Pretraživanje penjanjem
Metoda uspona na vrh slična metodi pretraživanja po dubini, širi se onaj čvor koji je
najpogodniji prema heurističkoj funkciji, dok se informacije o ostalim čvorovima brišu.
Najpogodniji čvor je onaj s minimalnom vrijednošću.
Objasni sliku…Od A do E…prvi slijedeći koji se proširuje je B ima najmanju vrijednost,
zatim se pretražuje D potom čvor C i pretraživanje je završeno dolaskom do E, riješenje je
pronađeno ali nije optimalno. Optimalno je A-C-E…nedostatak je u tome što se ne održava
stanje o svim čvorovima, za pretraživanje je važno samo trenutno stanje.
3.3 A* pretraživanje
Poseban slučaj pretraživanja najboljim prvim. Uključuje postupak računanja udaljenosti n od
početnog čvora. Što je procjenjena udaljenost do cilja manja to smo bliže cilju, ali kako A*
pretraživanje računa udaljenost od početnog stanja to još vise skraćiva pretraživanje, jer
ukoliko su dva čvora jednako udaljena od ciljnog čvora, algoritam će odabrati onaj koji je
bliže početnom čvoru, tako da se u što manje pokušaja dođe do rješenja.
3.4 Ograničeno pretraživanje po širini
Pretraživanje snopom zraka, posebna vrsta A* pretraživanja,provodi se pretraživanje na samo
n odabranih najboljih čvorova, pretraživanje se onda priširuje na susjedne čvorove, ukoliko
niti jedan od susjednih nije ciljni, algoritam od svih odabire n najboljih za daljnje
pretraživanje i postupak se ponavlja, na svakoj razini se odabiru najbolji čvrovi ( u smislu
heurističke funkcije).
3.5 IDA* pretraživanje
Iterativno A* pretraživanje po dubini, posebna vrsta A* pretraživanja. Ova metoda postavlja
graničnu vrijednost tj dubinu do koje se pretražuje, ako nije pronađeno na postavljanoj dubini,
dubinase povećava i odabire najmanja vrijednost heurističke funkcije, pretraživanje se
ponavlja dok se ne dođe do ciljnog stanja. Granična vrijednost se određuje prema heurističkoj
funkciji.
4. PRIMJER PRETRAŽIVANJA WEB-a
Programi koji koriste metode pretraživanja odn njihove algoritme su inteligentni agenti,
posjeduju određen stupanj inteligencije. Imaju različite nivoe samostalnosti u izvršavanju
zadataka, tako neki od njih mogu prikupljati informacije, drugi razvrstavati poruk, surađivati s
drugim agentima, te obavljati vrlo složene zadatke. Izgradnja jednostavnog agenta za pretra
Weba treba definirati sl parametre: cilj (ključna riječ ili izraz), početna lokacija (URL adresa),
broj ponavljanja, vremensko ograničenje, metoda pretraživnja.
Za svako pretraživanje weba agentom, mora se inicijalizirati odn definirati cilj i ustanoviti
metu. Pretraživanje počinje po ključnoj riječi, pa je sigurno da će korisnik htjeti više stranica
sa ključnom riječi, te će očekivati povratnu informaciju. Ukoliko je agent fleksibilan pa
dopušta odabir metode pretraživanja, treba ustanoviti koju metodu odabrati. Karakteristike
pojedinih metoda predstavljaju ponašanje agenta odn koliko brzo će korisnik dobiti povratne
informacije. Nakon inicijalizacije i definiranja metode počinje samo pretraživanje.
Nakon sto agent na HTTP portu za neku web stranicu uspostavi vezu, naredba get poziva
server da ispostavi tražnu stranicu, dobivena stranica se analizira radi pronalaženja linkova
koji se poredaju u čvorove kako bi se ustanovilo je li pronađena meta.
Kada agent preuzme web straicu i iz nje izvadi važne informacije, te ukoliko je cilj postignut,
pronađen borj web stranica pretraživanje je uspješno završeno, ukoliko nije postignut broj
traženih stranica slijedi donošenje odluke o sl koraku odn izbor algoritma pretraživanja. U red
se stavljaju čvorovi (linkovi) iz tekućeg dokumenta. Metoda pretraživanja određuje kojim
redoslijedom i na koji način će se posjećivati čvorovi.
Nakon što metoda doda ili izbriše čvorove može ih sortirati po cijeni ili heuristici, izbor
algoritma sortiranja nije toliko važan ali će skratiti vrijme pretraživanja. Ukoliko je prostor
pretraživanja iscrpljen i ema čvorova u redu, agent može dobiti novu vrijednost i ponovo
početi pretraživanje ili poslati povratnu inform i završiti s radom. Ako je završio s radom daje
povratnu informaciju, ukoliko nije premješta se u fazu inicijalizacije, definiranja cilja i
ponavlja se pretraživanje dok se ne postigne cilj, ili ustanovi da se nemože pronaći tražena
informacija.