velika ( socialna ) omre žja: od facebooka do messengerja
DESCRIPTION
Jure Leskovec Computer Science Department Cornell University / Stanford University. Velika ( socialna ) omre žja: od Facebooka do Messengerja. Danes: Splet – milijoni uporabnikov. Splet je kot laboratorij, kjer lahko preučujemo milijone ljudi. - PowerPoint PPT PresentationTRANSCRIPT
Velika (socialna) omrežja: od Facebooka do MessengerjaJure LeskovecComputer Science DepartmentCornell University / Stanford University
2
Danes: Splet – milijoni uporabnikov
Veliki on-line računalniški
sistemi s stotinami milijonov
uporabnikov
Uporabniki za seboj puščajo sledi svojih socialnih aktivnosti
Splet je kot laboratorij, kjer
lahko preučujemo milijone ljudi
3
VELIKA omrežja
Ko ustvarimo povezave iz kaosa nastane red...
Primeri omrežij
b) Internet (AS)c) Socialna omrežjaa) World wide web
d) Komunikacijska
omrežja
e) Bibliografska
omrežjaf) Biološka omrežja
5
Dve vrsti vprašanj
Zakaj so omrežja taka kot so? Kako se omrežja razvijajo? Kakšne lastnosti imajo?
Kako se stvari razširjajo po takih omrežjih? Kako se po omrežjih razširjajo bolezni,
informacije, vpliv, ...
6
6 stopenj ločenosti Small-world experiment [Milgram ‘67]:
210 kmetov v Nebraski skuša preko poznanstev priti do borznega posrednika v Bostonu
Pravila igre: pismo lahko posreduješ enemu izmed svojih bližnjih prijateljev
Bodo pisma sploh našla cilj? Koliko korakov je potrebnih, da najdejo cilj? Kakšna je najboljša strategija posredovanja
pisem? Problem iskanja v omrežju
6SL: Iskanje v omrežju
Kmet
Posrednik
8
6 stopenj ločenosti Koliko pisem je našlo naslovnika? 29% Koliko korakov (povezav) je pismo prepotovalo?
Povprečna dolžina poti je 6.2
Torej, 6 stopenj ločenosti
(6 degrees of separation)
9
MSN Instant Messenger
Seznam kontaktov Pogovorno okno
10
Omrežje pogovorov na MSN
MSN Instant Messenger: 1 milijarda pogovorov/danOmrežje: 240 milijonov ljudi, 1.3 milijarde povezav (Jun ‘06)
11
MSN Instant Messenger(240M ljudi, 1.3 milijarde povezav)
Število korakov (povezav) med pari
uporabnikov
Dolžina najkrajše poti med paroma točkPovprečna dolžina najkrajše poti je 6.6
90% poti je krajših od 8 korakov
Hops Nodes0 1
1 10
2 78
3 3,96
4 8,648
5 3,299,252
6 28,395,849
7 79,059,497
8 52,995,778
9 10,321,008
10 1,955,007
11 518,410
12 149,945
13 44,616
14 13,740
15 4,476
16 1,542
17 536
18 167
19 71
20 29
21 16
22 10
23 3
24 2
25 3
Š
tevi
lo p
oti
12
Število sosedov v omrežju
Uporabnik si je izmenjal sporočila z
2 milijonoma uporabnikov
Število sosedov v omrežju
Del
ež
13
Robustnost najkrajših poti
Omrežje z naključnimi povezavami
Vse povezave
Obojestranska komunikacijaKratke poti obstajajo.
So robustne.Jih lahko
najdemo?
Največje število sosedov v omrežju
Povp
rečn
a do
lžin
a na
jkra
jše
poti
Iskanje v omrežju
Kmet
Posrednik
Vsako vozlišče (človek) pozna le svoje povezave.
15
Kako težko je najti soseda, ki je bližje?
k p
Število korakov do cilja
Verje
tnos
t, da
je n
aklju
čni
sose
d bl
ižje
cilju
Kaj pa, če uporabimo geografijo?Ideja:
Pismo poredujemo prijatelju, ki je goegrafsko najbližje cilju
Ali so najkrajše poti tudi geografsko
najbližje?
Najkrajše poti niso najbližje
Geografska dolžina najkrajše poti
Kratke poti so 15,000 km predolge.
Najbližja najkrajša pot
Ali geografija sploh pomaga?
Geografija pomaga,
vendar le, da pridemo bluzu
pk
Kakšna je torej struktura omrežja? V omrežju z 240 milijoni uporabnikov (5%
svetovnega prebivalstva) Kratke poti obstajajo In so presenetljivo kratke: v povrečju le 6.6 korakov
A kako jih ljudje (z le denim poznavanjem omrežja) najdemo? Geografija je zelo uspešna, da pridemo blizu Potem je potrebna drugačna strategija: starost, spol,
poklic, itd.
Kako se stvari razširjajo po omrežjih?
Kaj, če bi lahko hkrati brali 1 milijon časopisov?
21
Kako se informacije razširjajo
Kaj, če bi spremljali praktično vse svetovne medije in sledili novicam, ko se razširjajo?
Neka obskurna
novicaJonas
na svojem blogu
SloTech
Siol.Net24ur.co
m RTV Slovenij
aDelo
Dnevnik
22
Razširjanje novic na spletu Mediji (blogi, novičarske strani, časopisi,
televizije, spletni portali) objavljajo članke
Lahko sledimo novicam, ko se razširjajo in se spreminjajo preko milijonov spletnih
portalov
Podatki: splet Stalno sledimo 3.6 milijonom spletnim medijem:
20,000 časopisom in televizijam (Google News) 3.5 milijonov različnim blogom
Vsak dan približno 1 milijon člankov
Čas [24h]
Štev
ilo č
lank
ov
In izločimo vse fraze (dolga zaporedja besed, ki se velikokrat
ponovijo)
O čem se govori na spletu?
Avgust Oktober
Kako se novica spreminja,ko se razširja?
Our opponent is someone who sees America, it seems, as being so imperfect, imperfect enough that he‘s palling around with terrorists who
would target their own country.
26
Mutacije med novicamiŠt
evilo
poj
avite
v
Odnos med mediji in blogi (1)
Čas [h]
Del
ež p
ojav
itev
Blogi sledijo medijem z 2.5 urnim zamikom
Simbioza med blogi in mediji
Zgodnji
blogi
Čas [h]
Del
ež p
ojav
itev
v
blog
ihBlog
i
Mediji
Mediji
Preostali blogi
29
Vprašanje
= Imam 10 minut časa. Kateri časopis naj berem, da bom najbolje obveščen?
= Kateri so najvplivnejši časopisi?
?
30
Ideja: pokritje novic= Izberimo množico časopisov, ki najbolje
pokrijejo prostor novic.
Splet
“novice”
Najhitrejši mediji
32
Isti problem: Vodovodna omrežja Imamo:
Mestno vodovodno omrežje
Podatke o tem, kako se onesnaženje razširja po takem omrežju
Kam naj postavimo nadzorne postaje, da bomo čim prej zaznali onesnaženje?
SS
c1
c2
Kam postaviti senzorje?
Odvisno od tega, kaj želimo
Hočemo, da čim manj ljudi zboli
Hočemo, da čim prej zaznamo
onesnaženje
Novice: Zaključek
Lahko sledimo milijonom člankom in ljudem, ki izražajo svoja mnenja na spletu
Mnenja lahko sledimo in jih preučujemo Kaj se tretutno dogaja na spletu? O čem ljudje
razpravljajo? Kako se informacije spreminjajo in kako jih ljudje
sestavljamo? Kakšno je razpoloženje/mnenje ljudstva?
35
Zaključek Zakaj so omrežja taka kot so? Šele nedavno lahko opazujemo ljudi v tako
velikem obsegu Potrdimo nekatere sociološke teorije, postavimo
druge pod vprašaj
Prednosti analize velikih količin podatkov Opazimo strukture in lastnosti, ki pri majhnih
vzorcih neopazne
Hvala!Vprašanja?