la struttura delle reti - mondo...

16
MONDO DIGITALE •n.4 - dicembre 2006 1. INTRODUZIONE U na caratteristica peculiare e generale dell’odierna organizzazione del vivere umano è data dalla interconnessione. Le strutture sociali, tecnologiche, economiche tendono sempre più ad aggregarsi, a connet- tersi. Componendo un numero sul nostro ap- parecchio telefonico possiamo parlare con qualunque altro utente del servizio telefoni- co in qualunque parte del mondo. L’energia elettrica viene capillarmente distribuita at- traverso una rete, così come il gas e l’acqua. I trasporti sono basati su reti: reti stradali, ferroviarie, aree. Esistono reti sociali di lega- mi personali e di gruppo, reti di relazioni eco- nomiche. I sistemi biologici sono costituiti da cellule interagenti attraverso complesse reti di reazioni biochimiche. Ma forse l’evento che ha avuto di più influenza sulla nostra vita è stata l’apparizione di Internet e del World Wide Web (www). Da pochi anni i computer di tutto il mondo possono collegarsi fra di lo- ro attraverso la rete fisica di Internet, mentre il www è una rete virtuale i cui nodi sono pa- gine o documenti che possono contenere qualunque informazione: testi, immagini, fil- mati e suoni. La rete Internet sta diventando sempre più veloce e potente e il www sta cre- scendo a ritmi vertiginosi: centinaia o mi- gliaia di nuove pagine vengono prodotte ogni giorno e sta diventando forse la creazio- ne dell’uomo più complessa e multiforme. Come studiare questi sistemi complessi? È possibile trovare leggi che ne regolano la struttura, le forme di aggregazione, le pro- prietà? Nei secoli scorsi lo scopo primo del- l’indagine scientifica era stato quello di de- cifrare i componenti base della natura per- ché si pensava che la comprensione del mondo passasse attraverso la conoscenza dei suoi costituenti primi: le particelle ele- mentari, gli atomi, le molecole, le proteine, le cellule. Questo approccio ha portato a ri- sultati di enorme valore, ma si è forse perso di vista l’insieme: come i mattoni elementa- ri si combinano in complesse strutture coe- se. Si è perso di vista il fatto che il compor- tamento e le proprietà di sistemi costituiti da aggregati di parti elementari dipendono dai legami e dalle relazioni fra le parti. I neu- Tutti sono d’accordo nell’ammettere che ciò che caratterizza il mondo moderno è l’interdipendenza. Le strutture sociali, tecnologiche, economi- che tendono sempre più ad aggregarsi e a connettersi. È possibile indivi- duare leggi generali che regolano queste interconnessioni e ne determi- nano il comportamento? Questa domanda ha aperto una nuova scienza la “teoria delle reti complesse” che ha avuto uno sviluppo prepotente e im- pensabile negli ultimi anni. Andrea Bobbio LA STRUTTURA DELLE RETI IN UN MONDO INTERCONNESSO 3 3.4

Upload: phungtruc

Post on 25-Feb-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1. INTRODUZIONE

U na caratteristica peculiare e generaledell’odierna organizzazione del vivere

umano è data dalla interconnessione. Lestrutture sociali, tecnologiche, economichetendono sempre più ad aggregarsi, a connet-tersi. Componendo un numero sul nostro ap-parecchio telefonico possiamo parlare conqualunque altro utente del servizio telefoni-co in qualunque parte del mondo. L’energiaelettrica viene capillarmente distribuita at-traverso una rete, così come il gas e l’acqua.I trasporti sono basati su reti: reti stradali,ferroviarie, aree. Esistono reti sociali di lega-mi personali e di gruppo, reti di relazioni eco-nomiche. I sistemi biologici sono costituiti dacellule interagenti attraverso complesse retidi reazioni biochimiche. Ma forse l’eventoche ha avuto di più influenza sulla nostra vitaè stata l’apparizione di Internet e del WorldWide Web (www). Da pochi anni i computerdi tutto il mondo possono collegarsi fra di lo-ro attraverso la rete fisica di Internet, mentreil www è una rete virtuale i cui nodi sono pa-gine o documenti che possono contenere

qualunque informazione: testi, immagini, fil-mati e suoni. La rete Internet sta diventandosempre più veloce e potente e il www sta cre-scendo a ritmi vertiginosi: centinaia o mi-gliaia di nuove pagine vengono prodotteogni giorno e sta diventando forse la creazio-ne dell’uomo più complessa e multiforme.Come studiare questi sistemi complessi? Èpossibile trovare leggi che ne regolano lastruttura, le forme di aggregazione, le pro-prietà? Nei secoli scorsi lo scopo primo del-l’indagine scientifica era stato quello di de-cifrare i componenti base della natura per-ché si pensava che la comprensione delmondo passasse attraverso la conoscenzadei suoi costituenti primi: le particelle ele-mentari, gli atomi, le molecole, le proteine,le cellule. Questo approccio ha portato a ri-sultati di enorme valore, ma si è forse persodi vista l’insieme: come i mattoni elementa-ri si combinano in complesse strutture coe-se. Si è perso di vista il fatto che il compor-tamento e le proprietà di sistemi costituitida aggregati di parti elementari dipendonodai legami e dalle relazioni fra le parti. I neu-

Tutti sono d’accordo nell’ammettere che ciò che caratterizza il mondo

moderno è l’interdipendenza. Le strutture sociali, tecnologiche, economi-

che tendono sempre più ad aggregarsi e a connettersi. È possibile indivi-

duare leggi generali che regolano queste interconnessioni e ne determi-

nano il comportamento? Questa domanda ha aperto una nuova scienza

la “teoria delle reti complesse” che ha avuto uno sviluppo prepotente e im-

pensabile negli ultimi anni.

Andrea Bobbio

LA STRUTTURA DELLE RETIIN UN MONDO INTERCONNESSO

3

3.4

0

roscienziati ci spiegano che la dicotomia fracervello e mente, cioè fra l’ammasso di cel-lule che costituisce il cervello e il pensierodipende dai legami fra le cellule. Scrive RitaLevi Montalcini [1] “Nessuna cellula nervo-sa, includendo tra queste anche quelle dellacorteccia cerebrale, è in grado di percepire,né essere capace di reazioni emotive, dipensare, ma tali proprietà sarebbero unafunzione emergente dell’intero sistema cor-ticale e dei sistemi neuronali del sistemastesso. Per questo motivo soltanto l’analisidi complessi cellulari e dei circuiti che li in-terconnettono, può portare un contributoallo studio dei processi mentali”.La consapevolezza dell’importanza dei lega-mi fra le parti, l’impatto determinato dallapresenza, ubiquità e irrinunciabilità delle retidi calcolatori e la spinta derivante dal cre-scente interesse per i sistemi biologici e perle neuroscienze hanno portato all’insorgeredi una nuova disciplina che viene normal-mente identificata come “teoria delle reticomplesse”.Gli studi per la comprensione delle strutturea rete complessa prendono le mosse da duelavori quasi contemporanei di Watts e Stro-gatz [2] sulle reti a “piccolo mondo” e di Bara-basi e Albert [3] sulle reti a legge di potenza evedono uno sviluppo incredibilmente fertile erapido che coinvolge in uno sforzo congiuntofisici, matematici, informatici, biologi. Il pre-sente lavoro intende fornire una prima letturasugli indirizzi che hanno assunto questi re-centi studi e sui principali risultati raggiunti.Per un avvicinamento più profondo alle pro-

blematiche legate alla teoria delle reti, si con-siglia la lettura del libro di uno degli iniziatoridi questo filone di ricerca A.L Barabasi [4]. Il li-bro è disponibile in una edizione italiana, è difacile comprensione per un lettore di normalecultura scientifica ed è letterariamente moltogradevole e attraente. Per chi fosse interes-sato ad approfondimenti più tecnici e detta-gliati, riguardanti anche le metodologie dianalisi e le tecniche matematiche di indagine,si rinvia a estesi lavori scientifici di rassegnasull’argomento [5, 6, 7, 8] e alle loro volumi-nose bibliografie. L’ultimo e più recente lavo-ro citato [8] rimanda a quasi mille riferimentibibliografici!

2. LE GRANDEZZE CHECARATTERIZZANO UNA RETE

Una rete è rappresentabile mediante un grafoG = (V, E) dove V è l’insieme dei nodi (o verti-ci) e E è l’insieme degli archi che connettono inodi (Figura 1 A). Gli archi possono esserenon orientati e quindi possono essere percor-si nelle due direzioni (come ad esempio uncollegamento fra due calcolatori sulla rete in-ternet, o un collegamento telefonico fra dueapparecchi, o i legami di amicizia fra due sog-getti), oppure possono essere orientati.Gli archi orientati possono essere percorsi inuna sola direzione indicata normalmente dauna freccia (Figura 1 B). Sono esempi di grafiorientati il reticolo fluviale di una regione(l’acqua scorre in una sola direzione), le retidi citazioni bibliografiche e il www. Se unapagina a del www contiene un puntatore

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

4

Nodo

A B

a

a

h h

bb

ff

d

d

g

g3

3

1

1

22

77

66

55

44

8 8

jj

k k

ee

c

c

ii

ArcoNodo Arco

FIGURA 1A Esempio di grafo

non orientato;B Esempio di grafo

orientato

(link) ad una pagina b vuol dire che da a sipuò raggiungere b con un click del mouse manon viceversa (a meno che nella pagina bnon ci sia un link esplicito alla pagina a).In una rete non orientata basta un solo arcoper nodo per rendere il grafo completamenteconnesso, cioè per poter raggiungere qual-siasi nodo partendo da qualsiasi altro nodo.Al di sotto della soglia limite di un arco pernodo una rete si decompone in aggregati dinodi non raggiungibili reciprocamente. Le re-ti in natura superano normalmente il valoredi soglia limite, in quanto hanno normalmen-te più di un arco emergente da ogni nodo:questa molteplicità di archi rende le reti mol-to più strettamente connesse e ridondanti.Per le reti orientate la connessione è piùcomplessa, in quanto si possono identificaretre tipologie distinte di nodi. Nodi che forma-no insiemi connessi cioè in cui tutti i nodi so-no raggiungibili fra loro seguendo la direzio-ne degli archi (per esempio i nodi rossi nellaFigura 1 B). I nodi sorgente che hanno solo ar-chi in uscita e non sono raggiungibili da nes-sun altro nodo (per esempio il nodo verde inFigura 1 B). I nodi assorbenti che hanno archiin ingresso ma non in uscita: possono essereraggiunti ma una volta raggiunti non posso-no essere abbandonati (per esempio i nodiblu nella Figura 1 B).Un grafo, quale quello di figura 1 A o figura 1B, può avere anche una rappresentazionematematica mediante la cosiddetta matricedi incidenza. Se il grafo ha N nodi numeratida 1 a N, la matrice di incidenza è una matri-ce quadrata N × N il cui elemento ij è ugualea 1 se i e j sono direttamente connessi da unarco, altrimenti è uguale a 0. La i-esima rigadella matrice di incidenza individua gli archiin uscita dal nodo i, mentre la i-esima colon-na individua gli archi in ingresso al nodo i.Se il grafo è non orientato la matrice di inci-denza è simmetrica (cioè l’elemento con in-dice di riga i e indice di colonna j è ugualeall’elemento con indice di riga j e indice dicolonna i). Se il grafo è orientato la matricenon è simmetrica: i nodi sorgente hanno lacorrispondente colonna della matrice di in-cidenza tutta di zeri; i nodi assorbenti han-no la corrispondente riga della matrice di in-cidenza tutta di zeri.Le reti molto complesse con migliaia, milio-

ni o miliardi di nodi, quali sono quelle concui abbiamo a che fare quotidianamente,sono difficili da descrivere e impossibili dadisegnare. Per definire e caratterizzare leproprietà di queste reti complesse sono sta-te introdotte varie misure. Le misure mag-giormente adottate [9], e che verranno ri-prese in questo lavoro (vedi riquadro a p. 6per un esempio numerico) sono il grado diconnettività, la lunghezza del cammino ca-ratteristico e il coefficiente di aggregazione(clustering).

2.1. Grado di connettivitàIl grado di connettività di un nodo (o sem-plicemente il grado di un nodo) è il parame-tro più studiato perché facilmente discrimi-na le caratteristiche di una rete complessa.In una rete non orientata il grado di un nodoè dato dal numero di archi emergenti dal no-do (equivalente al numero di nodi diretta-mente raggiungibili dal nodo in esame, det-ti anche nodi primi vicini). In una rete orien-tata si distingue fra il grado in ingresso (in-degree) che conta il numero di archi in in-gresso in un nodo e il grado in uscita (out-degree) che conta il numero di archi emer-genti da un nodo. Limitandoci ora a reti nonorientate si indichi con ki il grado del nodo i,e con P(k) la distribuzione del grado di con-nettività cioè la probabilità che un nodo ab-bia grado k (o più semplicemente la percen-tuale di nodi di grado k sul numero totale dinodi N). Il valore medio del grado ⟨k ⟩ è otte-nuto mediando il grado su tutti i nodi dellarete. Sebbene il grado sia una proprietà lo-cale di un nodo, la distribuzione del gradoP(k) è una delle principali caratteristicheche determina, come vedremo, comporta-menti complessivi della rete.

2.2. Lunghezza del camminocaratteristico LLa Lunghezza del cammino caratteristico (osemplicemente il cammino caratteristico) Lmisura la tipica separazione fra due genericinodi del grafo ed è anche, a volte, indicatacome il diametro del grafo. Dati due nodi i e jdefiniamo dij la loro distanza minima, cioè ilnumero minimo di archi che si devono attra-versare per raggiungere il nodo j partendodal nodo i (supponiamo in questo caso che il

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

5

0

0

0

1

0grafo sia non orientato e connesso cioè chepartendo da ogni nodo sia possibile raggiun-gere qualunque altro nodo). Quindi, se i e jsono direttamente connessi da un arco avre-

mo dij =1, altrimenti dij > 1. Si definisce la lun-ghezza del cammino caratteristico L come lamedia delle distanze minime fra ogni coppiadi nodi. Una rete in cui tutti i nodi sono con-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

6

Un esempio di misure di rete

Prendendo a riferimento l’esempio di rete non orientata riportata nel grafo di figura 1 A, vengono esplicitamente cal-colate le misure caratterizzanti le reti complesse definite nel paragrafo 2 del presente lavoro.

Grado di connettivitàIl grado di connettività di un nodo è dato dal numero di archi emergen-ti dal nodo. Nella tabella A viene riportato, con riferimento al grafo di fi-gura 1 A, il numero di archi emergenti da ogni nodo e il suo grado: poi-ché ogni arco connette due nodi, il grado è dato dal No. Archi divisodue. Il calcolo della media dei valori della terza colonna della tabella Apermette di di ottenere il valore medio del grado ⟨k⟩ = 1.375.I valori della terza colonna della tabella A forniscono anche la distribu-zione del grado di connettività P(k).

Lunghezza del cammino caratteristico LDato che la lunghezza del cammino caratteristico L è definita comela media delle distanze minime fra ogni coppia di nodi, occorre valu-tare dal grafo la distanza minima, espressa come numero minimo diarchi che bisogna attraversare per connettere i due nodi.Per esempio, prendendo come sorgente il nodo 3 del grafo di figura 1 A,le distanze minime nei confronti di tutti gli altri nodi sono riportate nel-la tabella B.

Calcolando le distanze minime per tutti i nodi e facen-do la media si ottiene la Lunghezza del cammino ca-ratteristico L = 1.68.

Coefficiente di aggregazione (clustering coefficient) CNel grafo di figura 1 A, si consideri il nodo 4 e si disegni ilsottografo G4 ottenuto dal grafo completo G prendendo iprimi vicini del nodo 4 e eliminando il nodo e gli archi daesso emergenti (vedi Figura).Poiché i primi vicini del nodo 4 sono i nodi 1, 2, 5, 6 e8, il sottografo G4 ha 5 nodi e al massimo (se tutti i no-di fossero connessi) 5 · 4/2 = 10 archi. Di questi 10 ar-chi potenziali il sottografo G4 ne contiene 4 da cui ilcoefficiente di aggregazione relativo al nodo 4 diven-ta C4 = 4/10= 0.4.La tabella C riporta i coefficienti di aggregazione rela-tivi ad ogni nodo da cui si calcola il coefficiente di ag-gregazione medio C = 0.492.

TABELLA A

Nodo No. Archi Grado

1 2 1

2 5 2.5

3 1 0.5

4 5 2.5

5 2 1

6 3 1.5

7 2 1

8 2 1

TABELLA B

Nodo sorgente Nodo destinazione Distanza minima

3 1 2

3 2 1

3 4 2

3 5 3

3 6 3

3 7 2

3 8 2

TABELLA C

Nodo Primi vicini Coefficiente aggregazione

1 2 1

2 5 0.2

3 1 0

4 5 0.4

5 2 1

6 3 0.333

7 2 0

8 2 1

Il sottografo G4

2

1

6

5

4

8h

a

d

j k

fi

e

nessi a tutti gli altri nodi ha una matrice di in-cidenza con tutti gli elementi ij fuori dalla dia-gonale principale (i ≠ j) uguali a uno: in que-sto caso il cammino caratteristico è L = 1, ilnumero totale di archi è N (N – 1)/2 e il gradoè costante pari a k = (N – 1)/2. Se ⟨k⟩ è il valormedio del grado, da ogni nodo si possonomediamente raggiungere in un solo passo⟨k⟩ nodi, in due passi ⟨k⟩2 nodi ecc… e in Lpassi si ricopriranno tutti gli N nodi. Per cuiavremo N ~ ⟨k⟩ L da cui L ~ ln N/ ln ⟨k⟩. Il va-lore di L è normalmente un numero piccoloche cresce lentamente con il numero totale dinodi N. Questa proprietà, per cui la distanzamedia fra nodi è un numero sovente moltobasso, viene normalmente riferita come pro-prietà di “piccolo mondo”.

2.3. Coefficiente di aggregazione(clustering coefficient) CDato un nodo i, si definisceil sottografo Gi ot-tenuto dal grafo G prendendo i primi vicini dii e eliminando il nodo i e gli archi da essoemergenti. Se il nodo i ha grado ki, allora Giha ki nodi e, al massimo, ki (ki – 1)/2 archi. Ilcoefficiente di aggregazione Ci relativo al no-do i, misura il numero di archi realmente pre-senti nel sottografo Gi rispetto al numero diarchi teoricamente possibili; misura, cioè,quanto i primi vicini del nodo i sono connessifra loro rimuovendo i. Se un nodo a è connes-so ai nodi b e c, il coefficiente di aggregazio-ne va a considerare se b e c sono anche con-nessi fra di loro (in termini di reti sociali si usaesprimere questa proprietà dicendo che ilcoefficiente di aggregazione misura se i mieiamici sono anche amici fra di loro). Il coeffi-ciente di aggregazione C è il valor medio di Cicalcolato su tutti i nodi del grafo.

3. LE RETI CASUALI

Le prime reti complesse ad essere state si-stematicamente studiate furono le reti ca-suali introdotte da due matematici ungheresiErdõs e Rényi [4] attorno agli anni ‘60. In unarete casuale di N nodi, ogni coppia di nodi hala stessa probabilità p di essere connessa.Quindi quando p è prossimo a zero i nodi so-no prevalentemente isolati, quando p tendea 1 i nodi tendono a essere connessi a tutti glialtri nodi. Si può dimostrare che quando N è

grande, il grado medio di connettività dei no-di è ⟨k⟩ = Np e la distribuzione del grado P(k)è approssimata da una legge di Poisson.

P(k) = (⟨k⟩k / k!) e–⟨k⟩ (1)

La legge di Poisson ha una forma a campa-na con un massimo centrato sul valor medio⟨k⟩. Un esempio di rete con distribuzione delgrado di tipo Poissoniano (1) è la rete auto-stradale negli USA, rappresentata nella par-te sinistra di figura 4. Gli archi sono le stra-de e i nodi i loro incroci (prevalentementenelle città). In una rete Poissoniana, i nodihanno come grado più probabile il valore⟨k⟩, e la probabilità del valore del grado di-minuisce rapidamente (esponenzialmente)al discostarsi di k dal valore medio ⟨k⟩ nelledue direzioni. In una rete casuale il cammi-no caratteristico L tende a essere piccolo e adiminuire con l’aumentare di p; anche ilcoefficiente di aggregazione tende ad esse-re piccolo perchè il fatto che un nodo a siaconnesso a due nodi b e c non aumenta laprobabilità che b sia connesso a c. In una re-te casuale il coefficiente di aggregazionepuò essere espresso come C = ⟨k⟩/N. Tutta-via, le reti reali sono tutt’altro che casuali! Inuna rete casuale di Erdõs e Rényi la probabi-lità che il mio calcolatore sia connesso alrouter del mio ufficio sarebbe uguale aquella di essere connesso a qualunque altrocalcolatore del mondo oppure la probabilitàdi un individuo di conoscere, e quindi stabi-lire un legame con il vicino di casa sarebbela stessa della probabilità di conoscere unosciamano della Papuasia. Nessuno pensache ciò sia vero. Poiché lo scopo fondamen-tale dell’indagine scientifica è quello diidentificare modelli per descrivere la realtà,è necessario introdurre nuove ipotesi e nuo-vi ragionamenti per l’interpretazione e lostudio delle reti reali.

4. LE RETI A PICCOLO MONDO

Nel 1967 il sociologo americano Stanley Mil-gram mise in piedi un esperimento per stu-diare la “distanza” fra due cittadini qualun-que degli Stati Uniti [10]. La domanda a cuisi voleva dare risposta era: scelte due per-sone a caso, quanti contatti sono necessari

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

7

0

0

0

1

0

per connetterle? L’esperimento consistevanel selezionare casualmente un gruppo diindividui e nel consegnare a ciascuno di lorouna lettera con indicato un destinatario fi-nale. Ogni soggetto, se non conosceva di-rettamente il destinatario finale, dovevainoltrare il documento ad una sola persona,a lui personalmente nota, e che ritenevaavesse maggiore opportunità di raggiunge-re il destinatario finale. Si ipotizzava chequesta catena di contatti richiedesse alme-no un centinaio di passaggi. Alla fine dell’e-sperimento Milgram registrò che su cento-sessanta individui iniziatori, quarantaquat-tro catene erano arrivate alla conclusione eche il numero medio di passaggi era sor-prendentemente basso: 5.5 passaggi. È ciòche i sociologi chiamano i sei gradi di sepa-razione. Qualunque persona nel mondo puòessere raggiunta mediamente attraversosei passaggi. Il mondo è un “piccolo mon-do”. Si noti che nell’esperimento di Milgrami cammini ottenuti non erano necessaria-mente minimi: un individuo in una catenapoteva non sapere che il suo vicino di casaera il cugino del destinatario finale. Tuttavial’esperimento mostrava un altro aspettoestremamente interessante: gli individuiriescono a trovare percorsi brevi (anche senon minimi) orientandosi puramente sullabase delle conoscenze locali della rete esenza nessuna visione globale.Le reti reali hanno normalmente un coeffi-ciente di aggregazione più elevato di quan-to previsto dalla teoria delle reti casuali, inquanto è ragionevole ipotizzare che due no-di che hanno un qualche legame con un ter-zo nodo possano avere anche un legame fradi loro. È facile, inoltre, immaginare che ilcammino caratteristico diminuisca e il gra-do di aggregazione cresca quando la rete sirivolge a gruppi di persone con interessiomogenei.Nato da un quiz televisivo americano, è statosviluppato un curioso sito internet che misurail “numero di Kevin Bacon”, cioè la distanza(minima) degli attori cinematografici di tutto ilmondo da Kevin Bacon. Si riteneva (supposi-zione poi dimostratasi non del tutto fondata[4]) che Kevin Bacon fosse uno degli attori diHollywood che avesse recitato in più film con ilmaggior numero di colleghi attori, e si intende-

va misurare quanto gli altri attori fossero “di-stanti” da Kevin Bacon. Indicando il numero diKevin Bacon con il simbolo NKB, un attore cheabbia recitato in un film con Kevin Bacon haNKB = 1; un attore che abbia recitato in un filmin cui era presente un attore che avesse recita-to in un film con Kevin Bacon ha NKB = 2 e cosìvia. Il sito internet che permette di misurareNKB per tutti gli attori cinematografici e chefornisce anche la catena minima di passaggicon l’indicazione degli attori e dei film interme-di è stato sviluppato, e viene costantementeaggiornato, da due studenti dell’Universitàdella Virginia a partire dal 1996 e ha indirizzohttp://www.cs.virginia.edu/oracle/.Per due attori italiani sulla cresta dell’onda almomento, Giovanna Mezzogiorno e RobertoBenigni, il sito di Kevin Bacon ha prodotto iseguenti risultati:

Attivando il sito con qualunque attore si os-servano valori di NKB sempre di poche unità.La comunità degli attori è veramente un pic-colo mondo, per cui è stata stimata una di-stanza media di tutti gli attori da Kevin Bacondi L= 2,8 e di tutti gli attori fra loro di L= 3,6.Le reti reali hanno la proprietà di piccolo mon-do riscontrate anche nelle reti casuali di Erdõse Rényi, ma rispetto alle reti casuali hannocoefficiente di aggregazione molto più eleva-to. Il primo tentativo di spiegare la concomi-tante presenza di piccolo mondo e grande ag-gregazione fu proposto da Watts e Strogatz inun lavoro [2] che ebbe un grandissimo impattosulla comunità scientifica. Per illustrare l’insor-gere di una rete a piccolo mondo Watts e Stro-gatz hanno proposto un modello (che chiame-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

8

Giovanna Mezzogiorno has a Bacon number of 3.

1. Giovanna Mezzogiorno was in Ilaria Alpi - Il piucrudele dei giorni (2002) with Tony Lo Bianco2. Tony Lo Bianco was in City Heat (1984) withBeau Starr3. Beau Starr was in Where the Truth Lies (2005)with Kevin Bacon

Roberto Benigni has a Bacon number of 2.

1. Roberto Benigni was in Pinocchio (2002) withQueen Latifah 2. Queen Latifah was in Beauty Shop (2005)with Kevin Bacon

remo modello WS) in cui la variazione di unsingolo parametro (p) permette di passare concontinuità da una struttura a reticolo regolaread una struttura a grafo casuale. Nella figura 2è rappresentato un grafo su un reticolo regola-re di N nodi disposti su una circonferenza eogni nodo ha lo stesso grado k. Nella figura 2si è rappresentato il caso N = 16 e k = 2 (ogninodo è connesso con i suoi due primi vicini siaa destra che a sinistra, ma gli archi sono bidire-zionali e vanno contati una volta sola).Con questa struttura il coefficiente di aggre-gazione C risulta indipendente dalla dimen-sione del grafo mentre la lunghezza del cam-mino caratteristico L risulta proporzionale alnumero di nodi N e al grado k, e cresce al cre-scere di N, perdendo la caratteristica di picco-lo mondo. La struttura regolare abbina quindielevato cammino caratteristico L e elevatogrado di aggregazione C.Il modello WS prevede ora di assegnare un va-lore di probabilità p > 0, chiamata probabilitàdi riassegnamento; con probabilità p si decidese ritracciare ogni arco, sconnettendolo dallavecchia locazione e ridisegnandolo in una nuo-va locazione scelta a caso. Nascono così, inmodo casuale, archi di “corto circuito” che at-traversano il grafo (Figura 2 B). Con questaprocedura di riassegnamento degli archi,quando p cresce la rete tende a diventare sem-pre più disordinata e per p che tende a 1 il mo-dello WS produce una rete casuale (Figura 2C). Con questo procedimento, Watts e Strogatzhanno dimostrato che con piccoli valori di p,cioè con un numero anche molto limitato di ar-chi casuali, la rete cambia regime e il suo cam-mino caratteristico L decade rapidamente purmantenendo quasi inalterato il valore del coef-ficiente di aggregazione C. Bastano pochi archicasuali in un reticolo regolare, anche di gran-dissime dimensioni, per far precipitare il valoredel cammino caratteristico L e far apparire l’ef-fetto di piccolo mondo, pur mantenendo unelevato coefficiente di aggregazione caratteri-stico delle strutture regolariIl fatto che pochi archi casuali possano modi-ficare in modo sostanziale la connettività del-le reti e ridurre drasticamente il cammino ca-ratteristico può anche essere visto intuitiva-mente in modo semplice. Siano A, B e C trereti a piccolo mondo separate fra loro. Tutti inodi all’interno di A possono essere raggiun-

ti in pochi passi, tutti i nodi all’interno di Bpossono essere raggiunti in pochi passi e tut-ti i nodi all’interno di C possono essere rag-giunti in pochi passi (A, B e C possono esserereti locali in una rete di calcolatori, o comu-nità separate nel caso di reti sociali). È suffi-ciente che un solo nodo di A sia connessocon un solo nodo di B e B con un solo nodo diC per far diventare un piccolo mondo l’unio-ne delle reti A, B e C e permettere ad ogni no-do di un colore di raggiungere in pochi passiun nodo di qualunque altro colore.La rete Internet (vedi riquadro a p. 14) pre-senta una struttura parzialmente ispirata aquella di figura 3, in cui sotto-reti locali sonoconnesse fra loro mediante collegamenti adalta capacità.

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

9

0

0

0

1

Regolare Piccolo mondo Casuale

p = 0 p = 1

A B C

FIGURA 2Il modello di Watts e Strogatz (WS) al crescere della probabilità diriassegnamento p. A) p = 0, reticolo regolare; B) p piccolo, nascita di archicasuali con l’effetto piccolo mondo; C) p = 1, grafo casuale

A

B

C

FIGURA 3Tre reti a piccolo mondo A, B e C connesse da pochi link

0

5. LE RETI IN EVOLUZIONEE LE LEGGI DI POTENZA

Il crescente interesse per le reti complesse haindotto vari ricercatori ad indagare sulla strut-tura di varie reti reali in ambiti molto diversi: infor-matico, tecnologico, sociale, biologico, econo-mico. Questi studi hanno mostrato che molte re-ti reali presentano una distribuzione del gradodi connettività P(k) ben lontana dalla forma acampana prevista dalle legge di Poisson gene-rata dalle reti casuali. I lavori di rassegna sul-l’argomento [5, 6, 7, 8], già citati, riportano ta-belle riepilogative di proprietà di reti da cui emer-ge che un significativo numero di reti reali (www,internet, citazioni scientifiche nel database ISI,reti metaboliche, reti di proteine) ha una distri-buzione del grado P(k) che segue una legge dipotenza (almeno per alti valori di k) rappresen-tabile dalla seguente espressione:

P(k) ~ c k–γ (2)

Nella formula (2) c è una costante di propor-zionalità il cui valore è solitamente di scarsointeresse pratico (vedi riquadro a p. 11 per mag-giori dettagli) e γ è il coefficiente della legge dipotenza. Dagli studi citati emerge che il valoredi γ è normalmente compreso fra 2 e 3. Le leg-gi di potenza erano già note da molti anni nella

statistica e nella letteratura tecnica dove erano,a volte, chiamate leggi di Pareto o di Zipf. Già l’e-conomista e sociologo Vilfredo Pareto (1848-1923) aveva scoperto, infatti, che la distribuzio-ne del reddito degli individui segue una legge dipotenza. Come illustrato nel quadro esplicativoB, una legge di potenza disegnata su un graficocon scala logaritmica su entrambi gli assi, vienerappresentata da una retta la cui pendenza è le-gata all’esponente γ.In estrema sintesi le leggi di potenza sono ca-ratterizzate da una “lunga coda”, cioè la fun-zione P(k) tende a zero lentamente (secondo lapotenza –γ) al crescere di k. II lento decadimentodi P(k) in funzione di k fa sì che ci sia una pro-babilità non trascurabile di trovare valori di kgrandi e molto grandi. Quindi una rete con di-stribuzione del grado del tipo rappresentatonella formula (2) contiene un gran numero dinodi con grado piccolo insieme a pochi nodi congrado molto alto, cioè con un numero molto ele-vato di archi. Questi nodi, detti connettori (ohub), sono gli elementi che maggiormente in-fluenzano la topologia e le proprietà della rete.Il percorso minimo fra due nodi qualunque pas-sa normalmente attraverso i connettori. Unarappresentazione molto intuitiva, esplicita e si-gnificativa delle reti a legge di potenza è datadalle reti delle linee aree. Nella figura 4 B è sche-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

10

Distribuzione di Poisson Distribuzione a legge di potenza

Rete casuale Rete a invarianza di scala

1

0.1

0.01

0.001

0.0001

1 10 100 1000kk

<k>

P(k) P(k)

A B

FIGURA 4A) mappa delle principali autostrade negli USA: un esempio di rete con distribuzione del grado di tipo Poisson.B) mappa delle principali linee aree nazionali negli USA: un esempio di rete con distribuzione del grado a legge dipotenza

maticamente riportata la rete dei principali col-legamenti aerei nazionali negli USA. Alcuni ae-roporti fungono da connettori (e sono effetti-vamente chiamati hub in inglese); per viaggia-re da un aeroporto ad un altro, in mancanza diun collegamento diretto, si deve effettuare unacoincidenza in un hub.Il grafico a destra in alto nella figura 4 riportala distribuzione del grado P(k) per la rete del-le linee aree in scala bilogaritmica. È eviden-te, anche ad una prima e superficiale ispezio-ne visiva, la differente struttura della rete au-tostradale (Figura 4 A) e della rete delle lineearee (Figura 4 B).Le reti a legge di potenza sono frequenti innatura e nella realtà. Perché si formano reti

con questa struttura e quale è il meccani-smo responsabile della loro generazione?Quali sono le proprietà principali indotte dauna topologia a legge di potenza e perchéquesta struttura organizzativa è spesso pri-vilegiata rispetto ad altre? La risposta aqueste domande venne affrontata per la pri-ma volta in maniera semplice e brillante daBarabasi e Albert in [3]. La loro spiegazioneparte da una semplice constatazione: le reticomplesse sono sistemi aperti che evolvo-no nel tempo crescendo di dimensione inquanto nuovi nodi si aggiungono man manoa quelli preesistenti. Sia i modelli casuali diErdõs e Rényi che quelli a piccolo mondo diWatts a Strogatz sono modelli statici, pen-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

11

0

0

0

1

Distribuzioni a legge di potenzaLe distribuzioni a legge di potenza costituiscono una famiglia di distribuzioni caratterizzate dall’avere una “lunga coda” cioè la funzione diprobabilità tende a zero lentamente all’aumentare del valore della variabile. Questa caratteristica fa sì che le leggi di potenza forniscanoprobabilità non trascurabili di riscontrare valori della variabile anche estremamente elevati. Le leggi di potenza pur essendo note e utilizza-te nella letteratura tecnica e nella statistica da parecchi decenni, hanno avuto una ripresa di interesse sia per effetto delle ricerche legate al-le reti complesse, sia, più in generale, perché si è riscontrato che permettono di interpretare innumerevoli fenomeni fisici e serie di dati spe-rimentali di natura e origine molto diversa. Per un approfondimento, si rimanda a due recenti lavori di rassegna sull’argomento [1, 2] moltochiari ed esaurienti, e che tracciano anche una illuminante prospettiva storica sull’origine e sull’uso di queste leggi. Per dimostrare la versatilità delle leggi di potenza, Il lavoro [2] cita 12 esempi semplici e reali di grandezze di origine molto diversa fra loro cheseguono una legge di potenza, almeno verso la coda della distribuzione. Gli esempi sono: ricorrenza di parole, citazioni in lavori scientifici, ac-cessi a pagine web, copie di libri venduti, chiamate telefoniche, grandezza di terremoti, diametro dei crateri lunari, intensità delle esplosioni so-lari, intensità delle guerre, reddito netto dei cittadini americani, popolazione delle città negli USA.Il primo studioso che individuò che l’ammontare dei patrimoni seguiva una legge di potenza fu l’economista e sociologo Vilfredo Pareto (1848-1923)per cui queste leggi sono a volte note come leggi di Pareto, mentre il linguista G.K. Zipf (1902,1950) introdusse metodi statistici nello studio del lin-guaggio, e trovò leggi di potenza per la ricorrenza delle parole. Una bibliografia aggiornata sulla legge di Zipf (e sulle leggi di potenza) è mantenutanel sito http://www.nslij-genetics.org/wli/zipf/index.html: il primo lavoro citato è del 1881 e la bibliografia contiene ad oggi 555 riferimenti.Una legge di potenza è caratterizzata dall’avere una densità di probabilità P(x) (dove P(x) rappresenta la probabilità di trovare la variabile com-presa fra x e x + dx) data da:

P(x) = c x–γ (1)

Dove γ > 0 è l’esponente che caratterizza la legge di potenza e c è una costante di normalizzazione che non ha rilevanza nel determinare il com-portamento della funzione e viene calcolata in modo che l’area sottesa dalla funzione di densità P(x) sia uguale a 1 (essendo P(x) una densitàdi probabilità la sua area totale deve essere uguale a 1). La legge (1) deve essere definita per un valore di x maggiore di un valore minimo xmin(per x = 0 la funzione P(x) tende all’infinito). Si suole quindi affermare che una variabile segue una legge di potenza a partire da un certo valoreminimo, cioè quando è la coda della distribuzione a soddisfare la legge (1).Il valor medio della variabile ⟨x⟩ è finito solo per γ > 2 (per γ ≤ 2 è infinito); la varianza diverge per γ ≤ 3. La distribuzione mantiene le proporzionial variare della scala. Se in un disco di un computer i file da 2 KB sono il 25% dei file da 1 KB, la legge predice che i file da 2 MB saranno il 25%dei file da 1 MB. La mancanza di un picco attorno al valore medio e il mantenimento delle proporzioni al variare della scala hanno indotto a de-finire questa legge come legge a invarianza di scala (scale free).Prendendo il logaritmo naturale di entrambi i membri nella formula (1) si ottiene ln P(x) = – γ ln x + ln c; quindi in un diagramma log-log la leggeè rappresentata con una retta a pendenza negativa e il coefficiente angolare della retta è il valore dell’esponente γ (Figura 4 B).Quali sono alcune possibili conseguenze pratiche di una legge di potenza.Esempio 1 - Il reddito netto dei cittadini americani segue una legge di potenza con γ = 2.1 [2]. Questo comporta che il 50% della popolazione piùricca detenga il 94% del reddito nazionale, e che 80% del reddito nazionale sia nelle mani del 20% degli individui più ricchi. Questa è la regola“80/20” attribuita a Pareto.Esempio 2 - L’altezza degli esseri umani segue tipicamente una legge a campana con valor medio attorno a ⟨x⟩ = 1.75 m, quindi una legge mol-to lontana da una legge di potenza. Se l’altezza degli umani seguisse una legge di potenza con esponente γ =2.5 un individuo ogni 100.000 sa-rebbe alto 15 m, e uno ogni milione sarebbe alto 30 m.

RIFERIMENTI BIBLIOGRAFICI

[1] Mitzenmacher M: A brief history of generative models for power law and lognormal distributions. Internet Mathematics, Vol. 1, 2004, p. 226-251.[2] Newman M.E.: Power laws, Pareto distributions and Zipf’s laws. Contemporary Physics, Vol. 46, 2005, p. 323-351.

0

sati per un numero fisso di nodi per i quali sicercano opportune regole per il tracciamen-to degli archi. Nelle reti in evoluzione nuovinodi si generano continuamente e i nuovinodi devono connettersi ai nodi preesisten-ti sulla base di opportune regole. Gli autorifanno l’ipotesi che il meccanismo di connes-sione dei nuovi nodi al resto della rete siaispirato al principio del “aggancio preferen-ziale (preferential attachment)”, cioè i nuovinodi tendono preferenzialmente a connet-tersi ai nodi con grado più alto. Gli esempiche possono ispirare un meccanismo di ag-gancio preferenziale sono molteplici. Se siapre un nuovo aeroporto è ragionevole pen-sare che i primi collegamenti aerei che ver-ranno resi operativi saranno verso gli aero-porti principali della regione (gli hub). In unarticolo scientifico è facile che venga citatoun lavoro che ha avuto notevole impattosulla comunità scientifica e che ha già avutomolte citazioni. I link che verranno indicatisu una pagina www di nuova generazione,saranno con grande probabilità rivolti versoi siti di maggiore frequentazione.Partendo da questi due semplici presupposti(reti in evoluzione e aggancio preferenziale),Barabasi e Albert simularono la crescita diuna rete virtuale, e, con ragionevole e legitti-ma soddisfazione, trovarono conforto alle lo-ro supposizioni, in quanto al crescere del nu-mero di nodi immessi nella rete la distribuzio-ne del grado P(k) assumeva la forma di unalegge di potenza con esponente γ = 3.Le reti generate dal modello di Barabasi e Al-bert (modello BA) vennero chiamate dagli au-tori reti a invarianza di scala (scale free). Nellereti casuali, in cui la distribuzione del grado se-gue una curva a campana, è definito un gradomedio ⟨k⟩ che determina la scala della rete,cioè determina il numero di link normalmentepresenti nei nodi essendo rare le forti deviazio-ni da questo valore. Nelle reti a legge di poten-za, la curva di distribuzione non presenta unpicco, la maggioranza dei nodi ha pochi archiemergenti, e questi innumerevoli piccoli nodiconvivono con i grandi hub. Nelle distribuzionia legge di potenza il valore medio (e la varian-za) possono anche risultare infiniti per piccolivalori dell’esponente (vedi riquadro esplicati-vo di p. 11). Sia le reti di Erdõs e Rényi sia quel-le a piccolo mondo di Watts a Strogatz presup-

ponevano una struttura democratica della retenel senso che il legame era ripartito in modosostanzialmente uniforme sui nodi; le reti a in-varianza di scala presuppongono un compor-tamento dei nodi fortemente disomogeneo, ipochi nodi connettori tendono ad aumentare iloro link durante l’evoluzione della rete mentreper gli altri nodi il numero di link rimane bassoe sostanzialmente costante. Il sito www creatoda Barabasi alla Notre Dame University riportanumerosi e suggestivi esempi di reti comples-se http://www.nd.edu/~networks/ con strut-tura a invarianza di scala.Una rete BA a invarianza di scala può esserefacilmente costruita attraverso il seguentealgoritmo di generazione:1. aggiunta di un nodo - partendo da un nu-mero predefinito (piccolo) di nodi m0, ad ogniintervallo di tempo si aggiunge un nuovo no-do con m ≤ m0 archi che devono essere con-nessi ai nodi preesistenti della rete;2. aggancio preferenziale - la probabilità cheun arco del nuovo nodo sia connesso ad unpreesistente nodo i dipende dal grado ki se-condo la legge qi = ki/ ∑j kj (vengono favoritigli agganci ai nodi con grado ki elevato).Dopo t passi l’algoritmo ha generato una retedi N = m0 + t nodi e mt archi. È stato dimo-strato che la presenza di entrambi gli ingre-dienti (crescita e aggancio preferenziale ) ènecessaria e sufficiente: la mancanza di unodei due fa perdere la proprietà della legge dipotenza. Le reti a invarianza di scala secondoil modello BA hanno piccola lunghezza carat-teristica (il passaggio attraverso gli hub con-nette rapidamente tutti i nodi) ma hanno an-che piccolo coefficiente di aggregazione nor-malmente minore di quello riscontrato nellereti reali: i nodi periferici sono connessi aglihub ma non sono connessi fra di loro.Sebbene il modello BA sia piuttosto sempli-cistico e rozzo (i nodi possono solo nascere enon morire, e i nodi più vecchi sono favoritinel diventare gli hub della rete), tuttavia haavuto una grandissima risonanza, in quantomostrava che era possibile ipotizzare delleleggi di auto-organizzazione nei sistemi fisicicomplessi e queste leggi di auto-organizza-zione portavano naturalmente a generareleggi di potenza. Sulla base di questi primi si-gnificativi risultati, vari ricercatori e vari grup-pi di ricerca si misero a studiare leggi auto-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

12

organizzative più rispondenti al mondo fisi-co, secondo le seguenti direttrici:❑ i nodi e gli archi possono essere ridiretti epossono anche scomparire (si modifica o sielimina un link, si chiude una pagina web);❑ i nodi possono invecchiare modificando laloro capacità di attrazione (sono state propo-ste varie leggi di aggancio preferenziale piùcomplesse di quella BA originaria);❑ i nodi competono fra di loro per attrarre ilink dei nodi di nuova generazione. I nodihanno un coefficiente di competitività o dibuona salute (fitness) che ne esalta il poteredi attrazione. Il modello a fitness introduceun meccanismo per cui non sempre i nodi piùvecchi sono i più favoriti nella formazione de-gli hub, e si è reso necessario per spiegare fe-nomeni tipo Microsoft o Google, cioè di atto-ri che entrati sulla scena per ultimi riescono a

imporsi molto rapidamente a scapito di nodipiù vecchi;❑ la rete cresce con un meccanismo di aggan-cio preferenziale, ma i nodi possono essere at-tivi o non-attivi e passano da una condizioneall’altra attraverso opportune leggi di probabi-lità; utilizzando questo accorgimento Klemm eEguíluz [11] hanno ottenuto reti a invarianza discala con alto un coefficiente di aggregazione;❑ il modello BA genera reti non orientate,mentre varie reti del mondo reale sono orien-tate (ad esempio il www per cui il modello BAera stato inizialmente pensato).Un esempio tipico di rete con crescita auto-evolutiva, e che anzi è stata quella che più dialtre ha spinto gli studiosi ad affrontare lostudio delle reti complesse è il www. La strut-tura del www come rete complessa è richia-mato nel riquadro. La rete Internet è pure una

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

13

0

0

0

1

La struttura della rete World Wide WebLa rapida diffusione del World Wide Web ha già fortemente inciso sull’organizzazione della società moderna e il suo impatto è certamentedestinato a crescere. L’immagazzinamento, l’acquisizione e la trasmissione dell’informazione tende sempre più ad essere delegata al wwwsoppiantando tutte le forme precedenti, in particolare quelle cartacee. I motori di ricerca hanno accesso ad un numero di documenti enor-me e impensabile fino a pochi anni fa; i criteri di selezione dei documenti sono ancora rozzi (la corrispondenza di sequenze di lettere o pa-role) ma sono comunque incomparabilmente più potenti di qualunque strumento precedente.Il www ha un’altra particolarità: è una rete totalmente auto-organizzata e con un tasso di crescita straordinariamente veloce: non c’è nessun su-pervisore centrale che ne controlli lo sviluppo e ne gestisca l’evoluzione. Il www può essere considerata una struttura paradigmatica per reti au-to-evolutive e la comprensione della sua struttura ha originato e fortemente influenzato lo studio delle reti complesse. Quale è quindi la strut-tura della rete che chiamiamo www ?Innanzitutto il www è una rete orientata, in quanto i link inclusi in una pagina sono dei puntatori direzionali: permettono con un click del mou-se di passare dalla pagina corrente a quella puntata dal link. Non è quindi definibile un unico grado di connettività ma si dovrà distinguere fragrado di ingresso (in-degree) e grado di uscita (out-degree) caratterizzati da due distinte distribuzioni Pin (k) e Pout (k). Pin (k) fornisce la pro-babilità che k link puntino ad una certa pagina, mentre Pout (k) fornisce la probabilità che una pagina abbia k link in uscita. È stato verificatosperimentalmente che entrambe le distribuzioni appartengono alla classe delle distribuzioni a legge di potenza con un esponente γin legger-mente inferiore a γout [6]. La discrepanza fra i due valori può essere ragionevolmente spiegata dal diverso processo evolutivo dei gradi di in-gresso e uscita. Il grado in ingresso non ha nessun estremo superiore, dipende da quante altre pagine decidono di indirizzare la pagina data.Pagine molto popolari (per esempio i più noti motori di ricerca) sono indirizzati da un numero enorme e crescente di pagine. Il grado in uscitaè invece determinato dal numero di link esplicitamente posizionati su una pagina, che sono definiti dal proprietario della pagina stessa; inquesto caso c’è anche un limite fisico al numero di link scrivibili in uno spazio limitato.Non si conosce il numero esatto di pagine del www, ed è praticamente impossibile contarle tutte in modo rigoroso. Attualmente dovrebbe su-perare abbondantemente parecchi miliardi (una stima del 2000 parlava di 800 milioni di pagine). Ciò nonostante, il www è un piccolo (abba-stanza piccolo) mondo: misure di cammino caratteristico fatte sperimentalmente su porzioni ristrette del www e estrapolate all’intera rete por-tano a stime di 19 passi di separazione. l numero medio di link per pagina (cioè il grado medio) di uscita è circa 7. Con questi valori, in dicianno-ve passi si potrebbero raggiungere circa 719 ≅ 1016 pagine, un numero sicuramente molto superiore al numero di pagine realmente esistenti.Riprendendo la classificazione dei nodi per grafi orientati di figura 1 B, si intuisce che anche il www può essere suddiviso in tre aree princi-pali. Un’area centrale che contiene pagine tutte connesse fra loro. In questa zona si possono raggiungere tutte le pagine saltando da una pa-gina all’altra attraverso un click del mouse. È la zona centrale del web e quella più facilmente raggiungibile dai motori di ricerca e quindi ac-cessibile a tutti i navigatori.Esiste poi una zona che chiameremo Zona-in in cui le pagine sono, in parte connesse fra di loro, e connesse alla zona centrale ma non vicever-sa. Sono pagine normalmente inaccessibili ai motori di ricerca. Quando un individuo costruisce una nuova pagina web, può indicare tutti i linkche vuole sulla sua pagina, ma se nessun link di nessun’altra pagina punta a lui, rimane nella Zona-in, invisibile al resto della rete: non bastacreare una pagina per entrare nel gran gioco del www. Alcuni motori di ricerca forniscono anche la possibilità di conoscere quanti link puntanoad una data pagina con un dato indirizzo. Per conoscere il numero di pagine che puntano ad un ipotetico indirizzo www.xxx.yyy, bisogna lancia-re il seguente comando link: http://www.xxx.yyy.La Zona-out è una zona costituita da siti raggiungibili dalla zona centrale, (e quindi anche dalla Zona-in) ma una volta entrati non permettono diessere abbandonati. Molti siti commerciali hanno queste caratteristiche: invogliano i navigatori ad entrare ma non li lasciano più scappare (siripete nel cyberspazio il mito di Ulisse e della Maga Circe).I motori di ricerca perlustrano continuamente il www alla ricerca di nuove pagine per catalogare e indicizzare nuove informazioni. Si stima, tut-tavia, che anche i motori più affermati abbiano una visibilità del www non superiore al 50%.

0rete in evoluzione, ma vincoli ingegneristicisulla capacità trasmissiva dei collegamentine condizionano e guidano la crescita deter-

minando una struttura, pure a legge di po-tenza, ma che si discosta dal semplice mo-dello BA (vedi riquadro).

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

14

La struttura della rete InternetLa rete Internet è costituita da una collezione di migliaia di reti più piccole, ciascuna sotto il controllo di amministratori locali, e non è possibileavere un quadro esaustivo e completo della sua topologia. Tuttavia, nell’euforia e nell’entusiasmo per la scoperta di fenomeni di diversissimanatura che manifestavano un andamento a legge di potenza, nel 1999 venne presentato un articolo nell’importante conferenza SIGCOMM (Spe-cial Interest Group on Data Communication) dell’ACM (Association for Computing Machinery) in cui si affermava di aver sperimentalmente veri-ficato che la rete Internet presentava un andamento ad invarianza di scala con un esponente γ = 2.5 [1]. Tale risultato fece subito pensare che latopologia di Internet potesse essere spiegata con un modello a crescita del tipo BA, e che di questo modello ereditasse le proprietà.Successive indagini più accurate [2] hanno messo in luce che la presenza di una legge di potenza nella distribuzione del grado non implica ne-cessariamente la presenza di connettori o hub come nelle reti BA, ma sono anche possibili topologie diverse, in cui i nodi a grado più elevato so-no localizzati alla periferia della rete. Nel caso della rete Internet i collegamenti fisici fra nodi possono avere ampiezza di banda (capacità di tra-smissione) molto disuniforme e quindi non è corretto assegnare a tutti gli archi lo stesso peso (vedi paragrafo 5). È necessario considerare gra-fi pesati, in cui ad ogni arco viene assegnato un valore proporzionale alla sua capacità trasmissiva. Nei grafi pesati la domanda che è giusto por-si non è quale sia la probabilità che due nodi della rete siano connessi (affidabilità) ma quale sia la probabilità che fra due nodi della rete sia pre-sente una assegnata ampiezza di banda (qualità del servizio).Nella rete internet, inoltre, il grado di connettività di ogni nodo è limitato da considerazioni ingegneristiche e da vincoli tecnologici, dovuti allacapacità massima del nodo stesso di trasmettere flussi di bit. In sostanza un nodo può avere pochi collegamenti a larga banda o un maggior nu-mero di collegamenti a banda stretta, in modo da rispettare il vincolo sul traffico massimo consentito dalla tecnologia del nodo [2]. Queste con-siderazioni hanno favorito la crescita e lo sviluppo della rete internet con una topologia gerarchica (schematizzata nella Figura A), in cui i nodiin un primo livello (backbone) sono connessi fra loro con linee ad alta capacità; da questi nodi centrali si dipartono reti locali che a loro volta ge-stiscono i computer terminali. Quindi il grado di connettività dei nodi tende a crescere andando verso la periferia della rete.Esistono nodi con un numero molto elevato di link, che determinano l’osservata legge di potenza, ma che non hanno la posizione e la funzione

di connettori; questi nodi di alto grado gestiscono reti locali periferi-che e il loro non funzionamento ha ripercussioni solo locali. La partecentrale della rete (backbone), quella che sostiene la maggior partedel traffico e che garantisce la qualità del servizio anche fra reti localidislocate geograficamente in zone molto distanti, ha una struttura piùvicina ad una rete poissoniana, e come tale possiede una elevata ri-dondanza dovuta a possibili percorsi alternativi.Per esempio, la rete italiana GARR (Gestione Ampliamento Rete Ricerca) a cui aderiscono tutti gli enti che rappresentano la comunità accademica edella ricerca scientifica in Italia ha la topologia rappresentata nella figura B. Nella figura B sono riportati i nodi da cui si dipartono le reti locali gestitedagli enti aderenti al sistema nella zona geografica di pertinenza, e sono anche evidenziate le larghezze di banda dei canali fisici di connessione, chevanno da 10 Gbit/s (Giga bit per secondo) a 34 Mbit/s (Mega bit per secondo).

RIFERIMENTI BIBLIOGRAFICI

[1] Faloutsos M., Faloutsos P., Faloutsos C.: On the Power-law Relationships of the Internet Topology. (ACM-SIGCOMM99) Computer Communi-cation Review, Vol. 29, 1999, p. 251-262.[2] Lun Li, Alderson D., Willinger W., Doyle J.: A First-Principle Approach to Understanding Internet's Router-level Topology. ACM-SIGCOMM2004.

Backbone

Rete locale

Terminale

A Struttura gerarchica di una rete di calcolatori

B La topologia della rete italiana GARR (http://www.garr.it/)

10 Gbit/s2.5 Gbit/s1 Gbit/s622 Mbit/s155 Mbit/s34 Mbit/sOpt. Fiber

Le regole di evoluzione dei modelli auto-or-ganizzativi dipendono da comportamenti lo-cali (regole di aggancio di un nodo di nuovagenerazione) ma determinano comporta-menti globali del sistema. Avendo scopertoche l’emergere in natura di reti complessecon distribuzione del grado a legge di poten-za può derivare dal meccanismo di crescitadella rete accompagnato da semplici principiauto-organizzativi, viene naturale la doman-da, perché la natura ha scelto in molti casiquesti processi di evoluzione o comunqueprocessi di evoluzione che portano alle leggidi potenza? La risposta a questa domandanon è univoca e inequivocabile, ma alcuni ri-cercatori la fanno risalire al modo con cui lereti si comportano in presenza di fenomeni didegradazione, invecchiamento o attacco.

6. TOLLERANZA AI GUASTIE AGLI ATTACCHI

I sistemi fisici possono manifestare nel tempovari meccanismi di degradazione, usura, mal-funzionamento o guasto. Fenomeni cioè chetendono in vario modo a ridurre l’efficienza ela connettività del sistema. Si è già osservatoche, in una rete non orientata, un arco per no-do è sufficiente per connettere tutti i nodi fradi loro cioè a permettere di raggiungere qua-lunque nodo partendo da qualunque altro no-do. Le reti reali sono normalmente molto piùconnesse di questa soglia minima. Le stime ri-portate da vari autori non sono molto unifor-mi: seguendo i quadri riepilogativi riportati in[6] si trovano i seguenti valori per il grado me-dio ⟨k⟩: per la rete internet un grado medio dicirca 4, per il www un grado medio attorno a7, per la rete degli attori cinematografici ungrado medio di 61. Questo valore di grado me-dio maggiore di uno, comporta una intrinsecaridondanza nella rete, cioè il fatto che si pos-sano raggiungere due nodi qualunque attra-verso una molteplicità di cammini distinti. Nelgrafo non-orientato di figura 1 A, partendo dalnodo 1 si può raggiungere il nodo 6 attraversonumerosi cammini: i più brevi sono, per esem-pio, il cammino de, il cammino abc, il cammi-no afe, djk ecc1.. Se per qualche motivo il cam-

mino abc fosse interrotto, non si pregiudica lapossibilità di un collegamento fra 1 e 6 inquanto sono percorribili strade alternative.Ovviamente in questo ragionamento si sup-pone che qualunque cammino connesso ab-bia lo stesso valore. Nella pratica i camminihanno associato un peso (lunghezza, capa-cità, costo ecc.) che rende preferibili alcunipercorsi (in generale i più brevi o i più veloci)rispetto ad altri. Dovendo andare in treno daTorino a Reggio Calabria, se tutte le altre lineefossero interrotte, si potrebbe trovare un col-legamento passante da Bolzano: il collega-mento sarebbe garantito ma gli utenti avreb-bero comunque qualcosa da ridire ! Nelle retiinformatiche la larghezza di banda (o capacitàtrasmissiva) del collegamento determina lavelocità della comunicazione e rende quindipreferibili alcuni cammini (non necessaria-mente i più corti) rispetto ad altri.La forza e la robustezza delle reti risiede nel-la loro intrinseca ridondanza. Per indagarequesta problematica più da vicino alcuni stu-diosi hanno cominciato a porsi il problema dicome valutare la ridondanza di una rete com-plessa, e di come le proprietà di robustezzafossero influenzate dalla struttura topologicadella rete. Un malfunzionamento in un arco oin un nodo perturba il funzionamento del si-stema localmente, ma può avere scarse ri-percussioni sulle proprietà globali del siste-ma; solo all’aumentare dei nodi o degli archiinterrotti cominciano a manifestarsi ripercus-sioni globali che incidono sui valori dei para-metri caratteristici della rete. Per reti di pic-cole dimensioni è possibile calcolare in mo-do accurato l’affidabilità della rete, cioè laprobabilità che due nodi siano connessi datele probabilità di fallimento di archi e nodi, at-traverso algoritmi esaustivi che cercano tuttii possibili cammini fra due nodi [12]. Per retidi grandi o grandissime dimensioni è neces-sario ricorrere ad argomenti statistici.Il guasto di un elemento della rete, sia essonodo o arco, comporta la perdita di operati-vità dell’elemento stesso, e può essere emu-lato rimuovendo l’elemento guasto dalla re-te. La rimozione di un arco ha influenza solosul legame fra i due nodi connessi e su tutti i

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

15

0

0

0

1

1 Si noti, incidentalmente, che la direzionalità degli archi modifica sostanzialmente la connettività della rete.Nel grafo orientato di figura 1 B, l’unico cammino che connette 1 con 6 è il cammino afe.

0

cammini che avrebbero attraversato quell’ar-co. La rimozione di un nodo implica, invece,la disconnessione di tutti gli archi in ingressoe in uscita dal nodo.Gli studi in questa direzione hanno cercato divalutare la reazione di una rete alla rimozioneprogressiva di suoi elementi, cioè la tolleran-za della rete ai guasti in funzione della topo-logia della rete stessa. Prendendo esempiodalle reti informatiche, sono state individuatee studiate due principali categorie di guasti:❑ guasti casuali: ogni elemento della rete hala stessa probabilità di guastarsi indipenden-temente dalla sua posizione e dalle sue pro-prietà (un nodo della rete internet può anda-re fuori servizio per innumerevoli motivi, unfulmine può cadere su una linea ferroviaria inqualunque punto della rete nazionale, unblack-out può causare la sconnessione dellarete elettrica). Per emulare questo tipo diguasti, i nodi della rete vengono via via ri-mossi con probabilità uniforme;❑ guasti maliziosi o attacchi preferenziali:sono guasti provocati intenzionalmente alloscopo di indurre il maggior danno sulla con-nettività della rete. Per i sistemi informaticisono queste le minacce più gravi alla sicurez-za del sistema. Emulare gli attacchi di questotipo, comporta iniziare a rimuovere i nodipartendo da quelli di grado più alto.Le prime ricerche furono indirizzate a esplo-

rare le proprietà di connettività della rete infunzione della frazione di nodi rimossi, e infunzione della topologia della rete. Indican-do con f la frazione di nodi rimossi, in [13] si èindagato sull’esistenza di una frazione criticafc per cui la rete perde la sua coesione.

6.1. Reti casualiNel caso in cui i guasti indotti siano di tipo ca-suale, all’aumentare della frazione f di nodirimossi, il cammino caratteristico L crescelentamente (Figura 5, tratta da [9]). All’au-mentare di f si può identificare una frazionecritica fc per cui, quando f > fc , la rete si di-saggrega in piccole sottoreti fra loro non con-nesse. Tale effetto si verifica per valori di fcdell’ordine del 3% [13]. La rete manifesta uncomportamento molto simile anche in pre-senza di attacchi mirati in cui i nodi sono ri-mossi a partire da quelli con grado più alto.La figura 5 mostra che nel caso di reti casuali(EXP) la crescita di L dovuta a guasti casuali(failure) o attacchi (attack) è molto simile.

6.2. Reti a invarianza di scalaIn questo caso l’effetto di guasti casuali o at-tacchi mirati è molto diverso. Nel caso di gua-sti casuali, il cammino caratteristico L crescemolto lentamente (Figura 5): nodi con gradopiccolo sono in numero enormemente alto euna loro rimozione ha scarso effetto sulla con-

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

16

8

7

6

5

40 0.005 0.01 0.015 0.02

f

L EXP Failure

EXP Attack

SFBA Failure

SFBA Attack

FIGURA 5Variazione del cammino caratteristico L in funzione della frazione di nodi rimossi f per reti casuali (Exp) e a invarianzadi scala con il modello BA (SF) – Figura tratta da [9]

nettività globale della rete. Si è dimostratoche, nel limite di reti che crescono all’infinito,non è possibile identificare una frazione criti-ca fc, in quanto la rete rimane comunque con-nessa attraverso gli hub. Ben diverso è il com-portamento in presenza di attacchi mirati. Ini-ziando a colpire gli hub di grado più elevato, latopologia della rete viene drasticamente alte-rata: il cammino caratteristico L cresce rapida-mente (Figura 5) e la rete perde ben presto lesue caratteristiche di connettività.La conclusione può essere sommariamenteformulata con queste parole: le reti casualihanno un comportamento sostanzialmentesimile sia rispetto ai guasti casuali che agli at-tacchi mirati e si disaggregano al superamen-to di una soglia critica. Le reti a invarianza discala sono praticamente immuni rispetto aiguasti casuali ma sono fragilissime rispettoad attacchi mirati. La fortissima tolleranza ri-spetto ai guasti casuali delle reti a invarianzadi scala viene considerata uno dei fattori prin-cipali per giustificare la presenza di questa to-pologia in reti che evolvono naturalmente.

7. PROPAGAZIONEDELLE EPIDEMIE

La propagazione di malattie o virus (ancheinformatici) può essere affrontata mediante lateoria delle reti. La rete consiste di nodi (sog-getti) sani e nodi (soggetti) infetti. Per model-lare la propagazione dell’infezione si può sup-porre che un soggetto infetto abbia una pro-babilità ν di propagare la malattia ad un sog-getto sano a lui direttamente connesso, e cheun soggetto sano abbia una probabilità δ diguarire. Indicando con λ = ν/δ il tasso di diffu-sione dell’infezione si sono ottenuti i seguentirisultati principali [5]. In reti casuali l’infezionesi propaga a tutti i nodi soltanto se il tasso didiffusione supera una soglia epidemica criti-ca, altrimenti, l’epidemia rimane confinata inzone più o meno ristrette della rete e non rie-sce ad auto alimentarsi. In reti ad invarianza discala, quando le dimensioni tendono all’infi-nito, non esiste soglia epidemica, ma l’epide-mia assume le forme di una pandemia e sipropaga a tutta la rete, per qualunque valoredel tasso di propagazione. Nelle reti finite (an-che a invarianza di scala), tuttavia, la sogliaepidemica deve esiste altrimenti tutte le reti

biologiche a invarianza di scala sarebberosparite da tempo, eliminate dalla inarrestabi-le propagazione di una infezione distruttiva. Èvero, comunque, che le reti a invarianza discala sono più vulnerabili rispetto alla propa-gazione di virus e malattie rispetto alle reti ca-suali. Ma esse sono anche più curabili (alme-no in teoria). Curando i nodi a partire daglihub, si può arrestare l’epidemia e ripristinarele condizioni di salute più rapidamente che inuna rete casuale. Se invece, in una rete ad in-varianza di scala, si applica una strategia dicura che agisce su nodi scelti a caso, la proba-bilità di arrestare la propagazione dell’infezio-ne diventa molto piccola. Questi studi hanno,come ovvio, un enorme potenziale interesseper arginare e controbattere la distruttività diattacchi maliziosi a sistemi informatici e lapropagazione di virus informatici di varia na-tura, oltre che per debellare epidemie in siste-mi biologici (per esempio per sviluppare stra-tegie di confinamento della diffusione del-l’AIDS [4]). Per una più approfondita discus-sione su questi temi si rimanda al lavoro [14].

8. CONCLUSIONI

La teoria delle reti complesse ha avuto negliultimi anni uno sviluppo travolgente. Ma no-nostante centinaia di lavori scientifici sianostati pubblicati sulle riviste di tutto il mondo,essa può ancora considerasi una scienza nel-la fase della prima infanzia da cui è lecitoaspettarsi altri e più significativi avanzamen-ti. La speranza è quella di gettare luce su co-me i sistemi complessi evolvono e si auto-or-ganizzano e su come la topologia della rete(indipendentemente dalle sue caratteristichesociali, fisiche o tecnologiche) ne determinale proprietà e il comportamento. La compren-sione di questi meccanismi guiderà verso lacostruzione di reti sempre più efficienti, affi-dabili e sicure. La sfida alla complessità saràsicuramente l’obiettivo più impegnativo maanche il più stimolante per gli scienziati delleprossime generazioni.

RingraziamentiNella compilazione del presente lavoro mi sonoavvalso della preziosa collaborazione di RobertaTerruggia.

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

17

0

0

0

1

0

Bibliografia[1] Rita Levi Montalcini: L’asso nella manica a bran-

delli. Baldini & Castoldi 1998, p. 45.

[2] Watts D.J., Strogatz S.H.: Collective dynamicsof small world networks. Nature, Vol. 393,1998, p. 493-592.

[3] Barabasi A.L., Albert R.: Emergence of scalingin random networks. Science, Vol. 286, 1999,p. 509-512.

[4] Barabasi A.L.: Linked: the new science ofnetworks. Perseus, 2002 (traduzione italiana:A. Barabasi, “Link: la scienza delle reti”, Einau-di, 2004).

[5] Dorogovtsev S.N., Mendes J.F.F.: Evolution ofnetworks. Advances in Physics, Vol. 51, 2002,p. 1079-1187.

[6] Albert R., Barabasi A.L.: Statistical mechanicsof complex networks. Review Modern Physics,Vol. 74, 2002, p. 47-97.

[7] Newman M.E.: The structure and function ofcomplex networks. SIAM Review, Vol. 45, 2003,p. 167-256.

[8] Boccaletti S., Latora V., Chavez M., Hwang D.:Complex networks: structure and dynamics.Physics Reports, Vol. 424, 2006, p 175-308.

[9] Crucitti P., Latora V., Marchiori M., Rapisarda A.:Efficiency of scale free networks: error and attacktolerance. Physica A, Vol. 320, 2003, p. 622-642.

[10] Milgram S.: The small-world problem. Physio-logy Today, Vol. 2, 1967, p. 60-67.

[11] Klemm K., Eguíluz V.M.: Highly clustered scalefree network. Physical Review, Vol. 65, 2002,art. 036123.

[12] Bobbio A., Ferraris C., Terruggia R.: New chal-lenges in network reliability analysis. In: Pro-ceedings of International Workshop on Com-plex Network and Infrastructure Protection -CNIP06, 2006, p. 554-564.

[13] Albert R., Jeong H., Barabasi A.L.: Error and at-tack tolerance of complex networks. Nature,Vol. 406, 2002, p. 378-82.

[14] LLoyd A., May R.M.: How viruses spread amongcomputers and people. Science, Vol. 292,2001, p. 1316.

M O N D O D I G I T A L E • n . 4 - d i c e m b r e 2 0 0 6

1

0

0

1

18

ANDREA BOBBIO è professore di informatica presso l’Università del Piemonte Orientale A. Avogadro con sede adAlessandria. Egli si è prevalentemente occupato di metodologie di analisi per sistemi stocastici e di teoria emetodi dell’affidabilità di sistemi. In quest’area di ricerca ha pubblicato numerosi lavori su riviste e conferen-ze internazionali, ed è stato responsabile di vari progetti di ricerca con enti pubblici e privati. È stato ospite ri-cercatore in importanti università in Europa, USA e India.E-mail: [email protected]: http://www.mfn.unipmn.it/~bobbio/