multimedia -uvod -

24
Multimedia -uvod- Prof. dr Milorad Banjanin April, 2011

Upload: seanna

Post on 05-Jan-2016

67 views

Category:

Documents


2 download

DESCRIPTION

Multimedia -uvod -. Prof. dr Milorad Banjanin April, 2011. Koristimo izraz multimedija za označavanje podataka koji sadrže kombinaciju teksta, grafike, audia i videa . Od teksta do multimedije - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Multimedia -uvod -

Multimedia-uvod-

Prof. dr Milorad Banjanin

April, 2011

Page 2: Multimedia -uvod -

Koristimo izraz multimedija za označavanje podataka koji sadrže

kombinaciju teksta, grafike, audia i videa.

Od teksta do multimedije Vrsta podataka koji se šalju preko Interneta se

promenila sa teksta na grafiku, video klipove, i pune filmove.

Sličan prelaz se desio kod zvuka, omogućavajući Internetu da prenosi multimedijalne dokumente

Page 3: Multimedia -uvod -

Od teksta do multimedije

Page 4: Multimedia -uvod -

Multimedijalni dokumenti

Veći deo sadržaja dostupnog na Internetu danas sadrži multimedijalne dokumente.

Pored toga, kvalitet je poboljšan jer veći opseg omogućava

prenos videa visoke rezolucije i prenos audia visokog kvaliteta.

Page 5: Multimedia -uvod -

Dokument Pojam dokument obuhvata

tradicionalne papirne dokumente računarski obrađene informacije kojima se rukuje kao

osnovnom jedinicom obrade

Primeri: tekstualni dokumenti, npr. tekstualni opisi ili poruke grafički dokumenti, npr. slike, crteži, dijagrami, grafikoni hipertekst dokumenti, npr. HTML i XML+XLink dokumenti mediji sa vremenskom dimenzijom: zvuk, video kompozitni multimedijalni dokumenti: sastavljeni od teksta,

slike, zvuka, ili videa

Page 6: Multimedia -uvod -

TEKST ili dokument je "informacija namenjena ljudskom sporazumevanju koja može biti prikazana u dvodimenzionalnom obliku...

Tekst se sastoji od grafičkih elemenata kao što su karakteri, geometrijski ili fotografski elementi ili njihove kombinacije, koji čine sadržaj dokumenta." (ISO-definicija)U svakom tekstu se razlikuju dve osnovne formalne strukture:

logička struktura ili logički izgled (engl. logical layout) opisuje organizaciju sadržaja teksta. Tipični elementi logičke strukture su jedinice kao što su naslovi ili, pak, pasusi.

grafička struktura ili grafička izgled (engl. graphical layout) opisuje organizaciju teksta u "štampanom" obliku. Tipični elementi grafičke strukture su jedinice kao što su strana ili red.

Logička struktura ne zavisi od grafičke strukture dokumenta.

Page 7: Multimedia -uvod -

Hipertekst ... ili web-dokument je, pojednostavljeno, tekst koji sadrže veze ili uputnice (engl. link) ka drugim dokumentima ili na

samog sebe.

Preciznije, hipertekst je skup stranica (engl. page), u obliku datoteka, međusobno povezanih vezama koje su insertovane u stranice. Ove uputnice se obično vide kao veze (hiperveze) na koje se može kliknuti (od engl. to click).

Za razliku od običnog teksta, koji se čita linearno (sleva na desno, odozgo naniže), hipertekst se čita prateći hiper-veze u tekstu, dakle, ne nužno na linearan način.

Page 8: Multimedia -uvod -

NAVIGATOR

Navigator ... ili razgledač (engl. browser) je interpretator

jezika za prikazivanje hipertekstualnih dokumenata: on omogućava njihov vizuelni prikaz na ekranu.

Page 9: Multimedia -uvod -

Jezici za opisivanje dokumenta

... su jezici koji omogućavaju da se precizno opiše izgled i sadržaj jednog teksta.

Od posebnog su značaja: SGML (skr. od Standard General Markup

Language), TeX i LaTeX (za matematičke tekstove), PostScript (jezik laserskih štampača), RTF (skr. od Rich Text Format), ...

Page 10: Multimedia -uvod -

Jezici za opisivanje hiperteksta... su jezici koji omogućavaju da se precizno opiše hipertekstuelna struktura jednog teksta (uputnice na druge tekstove, itd).

Ovi jezici dopuštaju da se eksplicitno opiše logička struktura teksta i različiti tipovi veza u tekstu.

Veze mogu biti unutrašnje (kada veza upućuje na drugi deo istog teksta), spoljašnje (kada veza upućuje na neki drugi teksta) i izvršne (kada se unutar teksta aktivira veza na neku izvršnu proceduru). Najznačajniji jezici ove vrste su:

SGML, HTML (HyperText Markup Language), pojednostavljena verzija SGML-a, XHTML (Expandable HTML) i XML (Extensible Markup Language, "kompromis" između preterane složenosti

SGML-a i jednostavnosti HTML-a; njegova standardizacija je u toku).

Page 11: Multimedia -uvod -

Pretraživanje teksta –IR-Information Retrivial

Reč _ Ograničen niz znakova koji se pojavljuje u tekstu Term _ _Normalizovana_ reč (padež, morfologija, itd); klasa

ekvivalencije reči Token _ Instanca reči ili terma koja se pojavljuje u dokumentu Tip _ U većini slučajeva isto što i term: klasa ekvivalencije rečiMere za kvalitet pretraživača Svi prethodni kriterijumi su merljivi: možemo kvantifikovati

brzinu / prostor / novac Međutim, ključna mera za pretraživač je zadovoljstvo

korisnika

Page 12: Multimedia -uvod -

Kako da kvantifikujemo zadovoljstvo korisnika?

Koje KORISNIK?

Web pretražvači: tragač. Tragač pronalazi ono što traži. Mera: stepen vraćanja na ovaj pretraživač

Web pretraživači: zakupac reklama. Da li tragači klikć¢u na moje reklame? Mera: clickthrough rate

E-poslovanje: kupac. Kupac kupuje ono zbog čega je došao na sajt. Mere: vreme do kupovine, procenat konvertovanih tragača u kupce

E-poslovanje: prodavac. Prodavac može da prodaje svoju robu (jer je pretraživač uputio kupce na prave sadržaje). Mera: profit po prodatom artiklu

Firma: direktor. Zaposleni su produktivniji jer brzo pronalaze ono što im treba. Mera: profit firme

Page 13: Multimedia -uvod -

Relevantnost

Zadovoljstvo korisnika se izjednačava sa relevantnošću rezultata pretrage

Kako meriti relevantnost? Standardna metodologija u IR ima tri elementa test-kolekciju dokumenata skup test-upita binarnu (ili, ređe, ne-binarnu) ocenu relevatnosti svakog

para upit-dokumentOvakvo vrednovanje (veštački scenariji) se često kritikuje. Ali

je vrlo uspešno u IR

Page 14: Multimedia -uvod -

Šta je zadovoljstvo korisnika?

Faktori zadovoljstva uključuju:

Brzinu dobijanja odgovora Veličinu indeksa Nezatrpan korisnički interfejs Najvažnije: relevantnost (Možda najvažnije: besplatan pristup)

Nijedan faktor pojedinačno nije dovoljan: fantastično brzi ali beskorisni odgovori neće korisnika učiniti zadovoljnim

Page 15: Multimedia -uvod -

Informaciona potreba i, Upit q

Relevantnost u odnosu na šta?

Proba 1: relevantnost u odnosu na upit _Relevantnost u odnosu na upit je vrlo problematična Informaciona potreba i : Tražimo informacije o tome da li je crno vino bolje

za smanjenje rizika od infarkta nego belo vino. Ovo je informaciona potreba, a ne upit Upit q: wine and red and white and heart and attack Razmotrimo dokument d0: He then launched into the heart of his speech

and attacked the wine industry lobby for downplaying the role of red and white wine in drunk driving.

d0 je relevantan za upit q . . . d0 nije relevantan za informacionu potrebu i . Najčešća definicija Zadovoljstvo korisnika se može meriti samo prema relevantnosti u

odnosu na informacione potrebe, a ne upite-

Page 16: Multimedia -uvod -

Preciznost-povrat Pecision/Recall _ preciznost/povrat

PRECIZNOST P je deo pronađenih dokumenata koji su relevantni Preciznost = #(pronađeni relevantni)/ #(svi pronađeni)= P(relevantanIpronađen) Povrat R je deo relevantnih dokumenata koji su pronađeni Povrat =#(pronađeni relevatni)/#(svi relevantni) = P(pronađenIrelevantan) Precision/recall Relevantan Nerelevantan Pronađen true positives (TP) false positives (FP) nije pronađen false negatives (FN) true negatives (TN)

P = TP/(TP + FP) R = TP/(TP + FN)

Page 17: Multimedia -uvod -

TAČNOST

Zašto koristimo složene mere kao preciznost i povrat? Zašto ne nešto jednostavno, npr. tačnost? Tačnost je deo odluka (relevantan/irelevantan) koje su ispravne. U smislu prethodne tabele, Tačnost = (TP + TN)/(TP + FP + FN + TN). Zašto tačnost nije korisna mera za web IR? Ako u Google ukucamo reč tačno, pretraga daje 0 pogodaka Jednostavan štos za maksimizaciju tačnosti u IR: uvek kaži ne i vrati prazan skup Imaćete 99.99% tačnost za većinu upita Tragači na webu (i u IR uopšte) žele da pronađu nešto i imaju određeni stepen tolerancije na žubre Tačnost nije dobra mera zadovoljstva korisnika, pa ćemo

koristiti preciznost i povrat

Page 18: Multimedia -uvod -

Moramo računati prosek za veliki broj upita Ne postoji “tipični” ili “reprezentativni” upit Treba nam ocena relevantnosti za parove informaciona

potreba-dokument ali je njih teško/skupo napraviti

Može se povećati povrat vraćanjem više dokumenata Povrat je neopadajuća funkcija broja pronađenih

dokumenata Sistem koji vraća sve dokumente ima 100% povrat! Suprotno je takođe tačno (često): lako je imati veliku

preciznost za mali povrat

Page 19: Multimedia -uvod -

Neka je najbolje rangirani dokument relevantan. Kako moćemo maksimizovati preciznost?

F omogućava da merimo kompromis između preciznosti i povrata

F = 1/ α1/β + (1 -α)1/R =(β² + 1)PR/ β²P + R, gde β² =(1 –α)/ α

α € [0; 1] pa prema tome β² € [0;1] Najčešće koriščen: balansirani F sa β = 1 ili α = 0:5 Ovo je harmonijska sredina P i R: 1/F = 1/2 ( 1/P + 1/R )

Page 20: Multimedia -uvod -

Koji opseg vrednosti za β da izaberemo da povrat vrednujemo više nego preciznost?P

PreciznostP/povrat/F su mere nerangiranih skupova. Lako ih možemo pretvoriti u mere rangiranih lista. Izračunaćemo mere za svaki “prefiks”: najbolji 1,

najboljih 2,najboljih 3, najboljih 4 itd. pogodaka Izračunavanje na ovaj način za preciznost i povrat

daje precision/recall krivu.

Page 21: Multimedia -uvod -

Benchmark-ing

Šta je potrebno za benchmark Kolekcija dokumenata dokumenti moraju reprezentovati dokumente koje očekujemo da imamo i u

stvarnom slučaju Kolekcija informacionih potreba . . . koje ćmo često neispravno nazivati upitima Informacione potrebe moraju reprezentovati one koje

očkujemo i u stvarnom slučaju Čovekove ocene relevantnosti moramo angažovati ocenjivače za ovaj posao, skupo, troši puno vremena ocenjivaći moraju reprezentovati one koje očekujemo i u

stvarnom slučaju

Page 22: Multimedia -uvod -

Konzistentnost Ocene relevantnosti su korisne samo ako su konzistentne.

Kako možemo meriti konzistentnost među ocenjivačima? Kapa mera P Kapa je mera koliko se međusobno ocenjivači slažu Dizajnirana za kategorične ocene P(A) = koji deo od ukupnog broja slučajeva se ocenjivači slažu P(E) = koji deo slaganja bismo dobili slučajno ҝ= P(A) - P(E) / (1 - P(E)) ҝ =? za (i) slučajno slaganje (ii) totalno slaganje IR (Information Retrivial)-Pretraživanje/Pronalaženje

Page 23: Multimedia -uvod -

Akronimi

IR (Information Retrivial)-Pretraživanje/Pronalaženje informacija NIC - (Network Interface Card) – Mrežna interfejs karta AUI - (Attachment Unit Interface) - Interfejs priključne jedinice 3E (Effective, Efficient, i Enjoyable) -Efektivnost, Efikasnost, Zadovoljstvo RL- (Reinforcement Learning) -Pojačano učenje MARL-(Multi-Agent Reinforcement Learning)- Multi-agentno pojačano učenje BR (Best- Response)- Najbolja reakcija IT (Information Technology-) Informacione tehnologije se odnose na upotrebu

kompjutera i različitih vrsta softvera za konvertovanje, skladištenje, zaštitu i procesiranje informacija

CT (Communications Technology-) Komunikacione tehnologije se bave prenosom informacija s kraja na kraj u procesu komunikacije ( tehnike kodiranja i modulacije- koderi, dekoderi, modulatori, demodulatori, ruteri itd.).

CNL (Collaborative Networked Learning)- Kolaborativno mrežno učenje

Page 24: Multimedia -uvod -

Dve paradigme koje Internet aplikacije koriste

Dve osnovne Internet komunikacione paradigme su :

Paradigma toka ((stream) Paradigma poruke (message)

Orijentisano na konekciju Bez konekcije 1-na-1 komunikacija M:N komunikacija Sekvenca pojedinač.bajtova Sekvenca pojedinačnih poruka Proizvoljna dužina prenosa Poruke ograničena na 64 KB Upotrebljava većina aplikacija Koristi se za MM aplikacije Izgrađeno na TCP protokolu Izgrađeno na UDP protokolu .