pretrazivanje interneta 2011

Download Pretrazivanje Interneta 2011

Post on 17-Jun-2015

39.534 views

Category:

Education

1 download

Embed Size (px)

DESCRIPTION

Prezentacija vezano uz radionicu Pretraživanja informacija na Internetu

TRANSCRIPT

  • 1. Pretraivanje i upravljanje digitalnim informacijama Dijana Machala, prof., dipl. knji. Nacionalna i sveuilina knjinica u Zagrebu [email_address]

2. Internet

  • Internet
    • sustav globalnih nezavisnih meusobno povezanih raunalnih umreenja koja komuniciraju pomou TCP/IP protokola
    • osmiljen 1969. u okviru istraivakog programa amerikog Ministarstva obrane (ARPANet)
    • informacijsko sredite (hub) gdje ljudi provode veinu svog vremena uei, igrajui se i komunicirajui globalno jedni s drugima
    • platforma drutvenog medija,Ray Oldenburgthird places
    • medij jedan-na-jedan, jedan-na-vie, vie-na-vie, u realnom vremenu i sinkroniziran
    • platforma za poslovanje, druenje, objavljivanje, politiko djelovanje, uenje i sl.
    • ISOC Internet Society svjetska organizacija koja se brine o smjernicama razvoja Interneta
    • 3WC konzorcij koji se brine za standardizaciju internetskog medija

3. Barras, Colin.Unknown internet 3: How big is the net?New Scientist, 1 May 2009. URL:http://www.newscientist.com/article/mg20227062.200-unknown-internet-3-how-big-is-the-net.html 4. Internet

  • Internetski servisi
    • World Wide Web- koristi HTTP za prijenos web stranica napisanih u HTML-u - to je noviji servis, ali i najbre rastui
    • razgovor ili avrljanje(chat)- koji moe biti komunikacija glasom ili pismena komunikacija - primjeri su IRC, ICQ i u zadnje vrijeme sve popularniji Skype
    • elektronika pota - koristi POP, SMTP i druge protokole, jedna od prvih usluga na Internetu ( 1971. Ray Tomlinson osmislio je program koji alje mail poruke preko mree ; 1 976. kraljica Elizabeta II poslala je prvi mail ;73% zaposlenika pr o vede vie od sat vremena na mail komunikaciju )
    • prijenos datoteka - uz standardni FTP danas se sve vie koristipeer to peerprotokoli
    • Usenet - mrea namijenjena razmjeni poruka u interesnim grupama

5. Povrinski web

  • Internetski sadraj:
    • Povrinski web surface web
    • Dubinski web deep web ,invisible web ,hidden web ,darkweb ,underweb
  • Povrinski web ini dio ukupnog sadraja globalne mree kojeg su dohvatili roboti u svom indeksiranju web prostora.
    • Sadraj dohvatljiv trailicama, odnosno paukovima, robotima,crawlerima ,botima
  • Nevidljivi web 500 puta je vei od povrinskog weba

6. Nevidljivi web

  • Veinu sadraja nevidljivog weba ini:
    • sadraj baza podataka
    • dinamike stranice koje se kreiraju na upit
    • stranice koje su oznaene da ne budu indeksirane
    • sadraj koji ne sadri link niti na jednu drugu stranicu
    • privatni web sadraj koji zahtijeva autentifikaciju (intranet, extranet i druge raunalne mree)
    • sadraj u formatima razliitim od HTML-a ili teksta (multimedija, JavaScript, video i sl.)
    • dokumente izvan http protokola (gopher, telnet, ftp)
    • dinamiki sadraj (novosti, avio letovi i sl.)
    • postovi, komentari, FB komunikacija, drutvno oznaivanje
  • Pretrauje se pomou vertikalnog pretraivanja, internetskih imenika, dvorazinskog pretraivanja

7. Internetske adrese

  • URI, URL, URN
    • definiran standardom RFC 3986/2009
    • slui za odreivanje lokacije i metode pristupa objektima na Internetu. Sastoji se od naziva protokola koji odreuje kako e se pristupiti objektu te mrenog mjesta zajedno s moguim upitima i identifikacijskim dijelovima adrese
    • namjena mu je da upuuje trailice na odreeno mreno mjesto ili digitalni objekt
    • Oznaka adrese statikih, predefiniranih stranica .html, .pdf, .doc, .rtf, .ps
    • Primjer:http://www.w3.org/
  • Dinamiki URL
    • obino sadri sljedee znakove -?, &, %, +, =, $, cgi-bin, .cgi
    • DinamikiURLse generira nakon upita na bazu podataka
    • Odnosi se na dinamiki i aktivni sadraj web-a (.asp, .jsp, .php, .cfm)
    • Primjer:http://www.nsk.hr/home.aspx?id=24
  • PURL persistent uniform resource locator
    • URL koji se koristi za preusmjerenje adrese traene mrene stranice
    • koristi izvorni kod HTTP-a (eror 404, 303)
    • razvio OCLC 1995. godine
    • nedostatak - prevelika ovisnost o DNS serveru

8. Internetske adrese

  • DOI
    • DOI digital object identifier alfanumeriki naziv za jedinstvenu identifikaciju digitalnog sadraja, kao to je knjiga, lanak i sl.
    • DOI se uparuje s URL adresom unutar sredinjeg imenika, te se objavljuje umjesto URL-a
    • DOI je trajan, dok se adresa dokumenta moe mijenjati
    • DOI se dodjeljuje izdavaima i moe se koristiti u razliitim sustavima i bazama podataka
    • Primjer:Green, T (2009), We Need Publishing Standards for Datasets and Data Tables,OECD Publishing White Paper, OECD Publishing. doi: 10.1787/603233448430 http://dx.doi.org/10.1787/603233448430
  • Permalink
    • Permalink URL ili adresa koja upuuje na odreeni post na blogu ili forumu nakon to je arhivirana
    • Upotrebljava se u wiki alatu za razliite verzije dokumenta
    • TrackBack protokol link kojim emo se referirati na sadraj blogova
    • Primjer:http://en.wikipedia.org/w/index.php?title=Library_of_Alexandria&oldid=435746862

9. Internetske adrese

  • Wallace Koehler,An Analysis of Web Page and Web Site Constancy and Permanence, 50 J. AM. SOC. INFO. SCIENCE & TECH. 161, 172 (1999).
    • Poluivot mrenog mjesta iznosi 2.9 godina
    • Poluivot mrene stranice iznosi 1.9 godina (statiki web)
  • Adresa mrenog sadraja:
    • oznaka vjerodostojnosti i autoriteta na razini sadraja
    • oznaka trajnosti, pristupanosti i stabilnosti na razini nosioca sadraja
  • Struktura internetske adrese:
  • [oznaka protokola]://[adrese posluitelja].[oznaka domene]:[port]
    • http, https
      • https://www.amazon.com/gp/cart/view.html/ref=lh_co?ie=UTF8&proceedToCheckout.x=129
      • jutarnji.hr
    • ftp
    • gopher
    • telnet
    • Primjer: telnet pristup zbirki Bodleiane - http://www.lib.ox.ac.uk/olis
    • telnet://library.ox.ac.uk:23

10. Internetske adrese

  • Kastomizirana URL adresa:
    • http://retweet.cc/
    • http://tiny.cc/
    • https://bitly.com/
      • https://bitly.com/kZ5D6t+
  • Mrtvi link
    • Alexa.com wayback machine
  • Internetske domene
    • Internet Corporation for Assigned Names and Numbers(ICANN)
    • generike domene:.com, .gov, .org, .edu, .net
    • geografske:.hr, .si, .ca, .rs, .me, .is, .to, .ly
    • Od 2012 proirenje domena sukladno IPv6
    • Funkcija whois URL
    • http://www.alexa.com/siteinfo

11. Semantiki web

    • Meta elementi(meta tag) - s emantiki podaci o web stranici
    • quot;-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    • < html xmlns="http://www.w3.org/1999/xhtml">
    • Knjinice grada Zagreba - Naslovna
    • < !--meta name="email" content="kgz@kgz.hr" /
    • Mirkopodaci
    • dogovoreni set mirkopodataka za opisivanje mrenog sadraja
    • podraavaju Google, Bing
    • schema.org

12. http://technolog.msnbc.msn.com/_news/2011/06/16/6874191-what-happens-on-the-internet-every-60-seconds#blog_archives 13. Netizens

  • Prosjean korisnik Interneta:
  • ima od 18 d