reti 4 2-mode networks collaboration networks

62
RETI 4 2-mode networks Collaboration networks

Upload: happy

Post on 09-Jan-2016

36 views

Category:

Documents


1 download

DESCRIPTION

RETI 4 2-mode networks Collaboration networks. Definizione Esempi Proiezione Statistica Coesione Utilizzo di Pajek alcuni studi sulle reti bipartite Boards /Directors recommendation system. Definizione. Esempi reali. - Scientific collaboration (authoring network) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: RETI 4 2-mode networks Collaboration networks

RETI 42-mode networks

Collaboration networks

Page 2: RETI 4 2-mode networks Collaboration networks

• Definizione• Esempi• Proiezione• Statistica• Coesione • Utilizzo di Pajek• alcuni studi sulle reti bipartite

Boards/Directors recommendation system

Page 3: RETI 4 2-mode networks Collaboration networks

Definizione

Page 4: RETI 4 2-mode networks Collaboration networks

-Scientific collaboration (authoring network)Collaboration acts=papers; Actors= authors

-Corporate board and director networkCollaboration acts=board (consigli d’amministrazione)Actors= directors

-Occurrence networksCollaboration acts=sentences of the book the words appear; Actors= words occurring in a book

-Peer-to-peer exchange networksCollaboration acts=data the peers use

Actors= peers

Esempi reali

Page 5: RETI 4 2-mode networks Collaboration networks

Proiezione 2-mode 1-mode network

Page 6: RETI 4 2-mode networks Collaboration networks

http://toreopsahl.com/2009/05/01/projecting-two-mode-networks-onto-weighted-one-mode-networks/

“This diagram illustrates a binary two-mode network where the colorsrepresent the node set to which a node belongs”.

Le reti 2-mode vengono proiettate per poter usare le misure delle reti 1-mode

Page 7: RETI 4 2-mode networks Collaboration networks

“weighted one-mode network by defining the weights as the number of co-occurrences. “

A-B connection weight 1/(2-1)+1/(3-1)=1+1/2=3/2=1.5

“Newman (2001) extended this procedure while working with scientific collaboration networks. He argued that the social bonds among scientist collaborating with few others on a paper were stronger than the bonds among scientists collaborating with many on a paper. He proposed to discount for the size of the collaboration by defining the weights among the nodes using the following formula:              where Np    is the number of authors on paper p “   (e.g., the number of blue nodes connected to the red node ).

Page 8: RETI 4 2-mode networks Collaboration networks

Esempi: donne (W)/eventi (E)(directors/boad, readers/magazines)

w1

E1 E2 E3

w3w2

E1 E2 E3w1 1 1 0w2 1 0 0w3 1 1 1

B

Page 9: RETI 4 2-mode networks Collaboration networks

Proiezione su W (righe)

w1 w2 w3w1 2 1 2w2 1 1 1w3 2 1 3

A=B BT

Potrebbe essere una «multiple line»

Valore delle linee= n° eventi in comuneElementi diagonali= n° totale di eventi per ogni donna

w1w2

w3

11

22

1

3

w1

E1 E2 E3

w3w2

Page 10: RETI 4 2-mode networks Collaboration networks

Proiezione su E

AT=BTB

Valori delle linee= n° di donne che partecipano ad entrambi gli eventiElementi diagonali: (loops)= n° di donne per ogni evento

Problemi con la proiezioneCon la proiezione si possono perdere o aggiungere proprietà alla rete

Page 11: RETI 4 2-mode networks Collaboration networks

Normalizzazione della proiezione con Pajek:

Esempio: donne /eventi (giornali/lettori)

2

3

1w1

w2

w3

1

1

2

jjii

ijij

aa

aGeo

2

3

1w1

w2

w3

1

1

1

1

2

2

altrimenti 0

a ii jjii

ij

ij

aa

a

MINDIR

2

3

1w1

w2

w3

7.012

1

6.013

1

8.032

2

correlazione

DipendenzaEssere influenzati da..

Page 12: RETI 4 2-mode networks Collaboration networks

Osservazioni

1. GEO è una misura della connettività cioè della correlazione trai nodi

1. MINDIR trasforma la rete in rete diretta (orientata). Gli archivanno dal nodo con peso minore a nodi con peso maggiore.

3. MINDIR: Gli archi vanno dal giornale con meno lettori a quello con più lettori

4. MINDIR: Il valore degli archi corrisponde alla percentuale di lettori del primo giornale che hanno letto anche il secondo

Page 13: RETI 4 2-mode networks Collaboration networks

Statistica di base 1-mode,

minime distanze dellemassima

minime distanze dellemedia

nodi due tra lato unesista cheà probabilitla E'

_

_*2

;

lati di numero ;

)()( : di grado

),(,)( di vicini

link dei insieme Enodi, dei insiemeV E),(V,G

0

Diametro

grafodelmediadistanza

densità

mediogrado

Gdidimensione

d(G)

possiblilatin

esistentilatin

1)n(n

2mδ(G)

n

2mk

EmVn

vNvdv

EvuVuvNv

VVE

Page 14: RETI 4 2-mode networks Collaboration networks

La statistica di base si applica sia alle rete intera che alle sue proiezioni

Page 15: RETI 4 2-mode networks Collaboration networks

Statistica avanzata delle reti 1-modeSia applica in genere solo alle proiezioni

1. Degree distribution= per tutti gli interi i è la frazione di nodi di grado i, ovvero la probabilità che un vertice scelto a caso abbia grado i. per ogni intero i.

2. Misure di centrality:• Clustering coefficient= probabilità che due nodi siano collegati

tra loro avendo alcuni vicini in comune= probabilità che 2 intorni di un nodo qualsiasi siano legati tra di loro.

• Degree centrality• Betweenness…3. Assortatività= correlazione tra i gradi (grado medio dei nodi di

grado i)

4. Coesione

Page 16: RETI 4 2-mode networks Collaboration networks
Page 17: RETI 4 2-mode networks Collaboration networks

cliquesTutti con tuttiSi possono sovrapporre

k coreOgni nodo nel gruppo è connesso con k nel gruppo

p-cliquesFrequenza dei link di ogni nodo del gruppo=p

Riprendiamo alcune misure di coesione già viste….Coesione:

Page 18: RETI 4 2-mode networks Collaboration networks

m-slices

• Si trasforma la rete in una unimodale

• I pesi degli archi corrispondono ad esempio al numero di eventi (donne, etc.) in comune

• m-slice: è il sottografo massimo che contiene le linee con una molteplicità ≥m

A =

1 1 1 1 0

1 1 1 1 0

1 1 2 2 0

1 1 2 4 1

0 0 0 1 1

1 1

1 2

1

2 slice

1-slice

A differenza delle clique e dei core le m-slice considerano la forza delle connessioni (peso delle linee)Net/Partitions/valued core

Page 19: RETI 4 2-mode networks Collaboration networks

Isole

In una rete dove sono note alcune proprietà dei vertici o delle linee si possono trovare isole (isole di vertici o isole di archi). Le isole sono clusters di vertici connessi con linee aventi valori più alti delle linee che collegano i vertici con gli altri ovvero il valore delle linee all’interno dell’isola è maggiore del valore delle linee tra isole. Si crea una partizione, una comunità.

In Pajek le isole si calcolano:

Net/Partitions/Islands/Line Weigths

Page 20: RETI 4 2-mode networks Collaboration networks

Differenza tra m-slice e islandsPe

so a

rchi 1 m-slice

2 isole

E’ una differenza di rappresentazione

Page 21: RETI 4 2-mode networks Collaboration networks

Studio delle reti bipartite con Pajek

Page 22: RETI 4 2-mode networks Collaboration networks

ESEMPIODAVIS SOUTHERN CLUB WOMEN

DESCRIPTION 18 women×14 events

BACKGROUND These data were collected by Davis et al in the 1930s. They represent observed attendance at 14 social events by 18 Southern women.The result is a person-by-event matrix: cell (i,j) is 1 if person i attended social event j, and 0 otherwise.

REFERENCES Breiger R. (1974). The duality of persons and groups. Social Forces, 53, 181-190. Davis, A et al. (1941). Deep South. Chicago: University of Chicago Press.

Page 23: RETI 4 2-mode networks Collaboration networks

Rappresentazione graficaStatistica di base su tutta la reteStatistica di base ed avanzata sulle proiezioniCoesione: m-slide, isole

Page 24: RETI 4 2-mode networks Collaboration networks

Davis1.net

…..

Page 25: RETI 4 2-mode networks Collaboration networks

Visualizziamo la reteDraw/drawVisualizziamo la rete con la bi partizioneNet/Partition/2-modeDraw/Draw partition

Page 26: RETI 4 2-mode networks Collaboration networks

Statistica di base sulla rete completa

Info/Network/General

Page 27: RETI 4 2-mode networks Collaboration networks

Statistica di base sulla proiezione

Proiezione sulle righe (women)

Proiettiamo la reteNet/Transform/2-mode to 1-mode/Rows (include loops)Info/Network/general(n=18, m=157 (erano 93 prima della proiezione), loops=18)

Page 28: RETI 4 2-mode networks Collaboration networks

Statistica avanzata sulla proiezione

Proietto su Rows senza loops e linee multipleNet/Transform/Remove LoopsRimuovo le linee <3 (nelle proiezioni tendono ad esserci troppe linee.Net/transform/remove/line with values/lower than (3)Elimino i nodi isolatiNet/transform/reduction/degree (all)Controllo se c’è solo una componente connessaNet/Component/weakNet/Path between 2 vertices/Diameter 3

Page 29: RETI 4 2-mode networks Collaboration networks

Net/Path between 2 vertices/Shortest Path Length matrice

La matrice si può salvare in un file di testo (prova2.m).

Distanza media=1.8125Diametro=3

Page 30: RETI 4 2-mode networks Collaboration networks

Degree Distribution

Proiettando Davis.net sull’insieme delle donneNo loops, no multiple lines

Page 31: RETI 4 2-mode networks Collaboration networks

donne

eventi

Page 32: RETI 4 2-mode networks Collaboration networks

Proietto su Rows no loops e no linee multipleNet/Transform/2-mode 1 mode/Rows

Misuriamo la coesione (m-slice e isole)

Page 33: RETI 4 2-mode networks Collaboration networks

Se ci sono nodi isolati li rimuoviamo:Net transform/reduction/Degree/AllDigitare 2 e rispondere «si» alle domande seguenti

Se troppo densa rimuoviamo delle lineeInfo /network/line ValuesNet/transform/Remove/line with value/lower than (3)

Page 34: RETI 4 2-mode networks Collaboration networks

m-slices in Pajek

Net/Partitions/Valued Core/ Use max instead of sumNet/Partitions/Valued Core/ First threshold and Step/InputFirst theshold=0, Step=1Ora Pajek ha creato una partizione con i numeri delle classi che corrispondono alla più alta m-slice a cui ogni vertice appartiene.

Per rappresentare le m-slice:Draw/Draw Partition

Per interagireExport/2D/SVG/line value/Nested ClassesAprendo la figura con un browser si possono deselezionare dei box e tutte le linee con valori fino a quello segnato saranno cancellate e così pure i vertici isolati.

NB: le slice individuano sottoinsiemi di donne che hanno almeno Con un’altra donna un certo numero k di eventi in comune

Page 35: RETI 4 2-mode networks Collaboration networks

esempio

Nodi del value core-1 e non del value core-2

Nodi del value core-2 e non del value core-3

Nodi del value core-3 e non del value core-4

Nodi del value core-5 e non del value core-6

Nodi del value core-4 e non del value core-5

3

4

52

1

1

Page 36: RETI 4 2-mode networks Collaboration networks
Page 37: RETI 4 2-mode networks Collaboration networks

Isole

Nella rete bimodale (rows) vista prima calcoliamo isole di archi:

In Pajek le isole si calcolano:

Net/Partitions/Islands/Line Weigths

Esercizio:Davis1.net. Calcolare le isole di linee di dimensione da 2 a 6 per entrambe le reti ottenute dalla 2-mode network.

Le isole sono clusters di vertici connessi con linee aventi valori più alti delle linee che collegano i vertici con gli altri ovvero il valore delle linee all’interno dell’isola è maggiore del valore delle linee tra isole. Si crea una partizione, una comunità.

Page 38: RETI 4 2-mode networks Collaboration networks

esempio

Nodi del value core-1 e non del value core-2

Nodi del value core-2 e non del value core-3

Nodi del value core-3 e non del value core-4

Nodi del value core-5 e non del value core-6

Nodi del value core-4 e non del value core-5

3

4

52

1

1

ISOLA

2 isole ma 1 value-core (1-slice)

Page 39: RETI 4 2-mode networks Collaboration networks

Draw partition-vector

Draw partition

Page 40: RETI 4 2-mode networks Collaboration networks

Correlazione/Influenza tra i nodi:Normalizzazione in Pajek

Per normalizzare:Net/Tranform/2-mode 1-mode/ rows (include loops no multiple lines)Net/Transform/2-Mode to 1-Mode/Normalize 1-Mode (GEO o MINDIR)Info/Network/line ValueNet/ Transform/Remove/line with value/Lower than (0.7)

La normalizzazione con GEO crea degli archi pesati (non diretti) che ci dicono quanti interessi in comune hanno 2 donne.

La normalizzazione con MINDIR crea una rete diretta che ci dice quanto una donna è influenzata dall’altra

Page 41: RETI 4 2-mode networks Collaboration networks

GEO

MinDir

Page 42: RETI 4 2-mode networks Collaboration networks

Osservazioni:Le misure di centralità come il clustering e la betweenness, non hanno molto senso per Davis.net

Può servire invece la misura di centralità basata sull’out-degree dopo aver normalizzato la rete per vedere quali donne sono più influenti su un maggior numero di altre

Misure di centralità

Page 43: RETI 4 2-mode networks Collaboration networks

la misura di centralità basata sull’out-degree dopo aver normalizzato la rete per vedere quale donna influenza il maggio numero di altre donne

Draw-Vector

Page 44: RETI 4 2-mode networks Collaboration networks

Esercizi (cap5): Considerare le seguenti reti 2-mode e misurare: la statistica di base, avanzata e la coesione (m-slice e isole) delle proiezioni

1. Scotland.net Corporate interlocks in Scotland (1904-5).Scotland.net: Pajek two-mode network with 244 vertices (136 multiple directors and 108 companies), 356 edges (directorate), no arcs, no loops.Industrial_categories.clu: classification of the 108 companies according to industry type (1 - oil & mining, 2 - railway, 3 - engineering & steel, 4 - electricity & chemicals, 5 - domestic products, 6 - banks, 7 - insurance, 8 - investment. Capital.vec: the total capital or deposits of the (108) companies (in 1,000 pound sterling).Scotland.paj: Pajek project file with the data described above.

Page 45: RETI 4 2-mode networks Collaboration networks

2. Movies.netMovies.net: two-mode network with 102 vertices (40 composers and 62 producers), 192 valued edges (cooperation of producer and composer; line values represent the number of films cooperated on).Movies_top_composers.clu: identification of the five top composers (1 - top 5 composer, 0 - not a top 5 composer).

This network contains the collaboration of 40 composers of film scores and the 62 producers who produced a minimum of five movies in Hollywood, 1964-1976. This is a 2-mode network: a line between a composer and a producer indicates that the former created the soundtrack for the movie produced by the latter. The line values indicate the number of movies by one producer for which the composer created the music in the period 1964- 1976. The five top composers, each of whom earned 1.5% or more of the total income of Hollywood movie score composers in the 1960s and 1970s, are identified.

Page 46: RETI 4 2-mode networks Collaboration networks

Alcuni studi sulle reti bipartite

Page 47: RETI 4 2-mode networks Collaboration networks

Communities in italian corporate networksC. Piccardi, L.Calatroni, F. BertoniPhysica A 389 (2010) 5247-5258

Page 48: RETI 4 2-mode networks Collaboration networks

Gli autori applicano la community analysis per individuare possibili partizioni tra direttori o consigli di amministrazione. Nodi dello stesso gruppo avranno proprietà in comune o ruoli simili

Boards

Directors

Page 49: RETI 4 2-mode networks Collaboration networks

Una definizione quantiva di community è stata data da Newman and Girvan (2004) introducendo il concetto di modularity Q

Un sottoinsieme Chn (n° di nodi) è chiamato community se la densità dei link interni a Ch è maggiore della densità dei link che connettono i nodi Ch con il resto della rete

La modularità Q misura il numero di link all’interno della comunità rispetto a quelli attesi se la rete fosse random (link medi per nodo per il numero di nodi). Q è un valore normalizzato. Q è dato per una fissata rete e una fissata partizione. L=numero di links ki=grado nodo i, aij=elemento matrice adiacenza, c=community

Page 50: RETI 4 2-mode networks Collaboration networks

Community analysis: trovare la partizione che massimizza QQ è un valore normalizzato e 1. Q è calcolato fissata una rete e una partizione

Somma al variare delle comunità nella partizione

Somma al variare dei link nella comunità

random fosse c comunità la selink di numero 22

1

c comunità alla internilink numero2

1

ij

ji

ij ij

L

kk

a

Page 51: RETI 4 2-mode networks Collaboration networks

Italian corporate board network for those companies listed in italian Stock Market at the end of 2008 (http://consob.it)

Page 52: RETI 4 2-mode networks Collaboration networks

Pirelli

12 communities nella giant componentCommunity structure: Qmax=0.66, z=51.7Se trascuriamo i pesi:Community structure: Qmax=0.54, z=12Conclusione la community sctucture dei consigli si amministrazione rimaneimportante

Proiezione sui boards

Page 53: RETI 4 2-mode networks Collaboration networks

Proiezione sulle firms/directors

Nodi:firms

Links: esiste un link tra A e B se le decisioni di B possono essere influenzate da A ad esempio quando i direttori di A sono anche azionisti di B. La matrice delle connessioni si può supporre simmetrica

15 communities (giant component)Community structure: Qmax=0.82, z=29.2

Se trascuriamo i pesi:Community structure: Qmax=0.59, z=3.82

Conclusione la community structure delle firms è molto meno importante

Page 54: RETI 4 2-mode networks Collaboration networks
Page 55: RETI 4 2-mode networks Collaboration networks

Quantificazione della similitudine tra le due proiezioni (partizioni)

Esistono diversi indicatori per misurare quanto le due proiezioni diano le stesse informazioni

L’aspetto più interessante della community analysis è la capacità di mettere in evidenza forme più sottili di coalizione

Per l’interpretazione dei risultati si rimanda all’articolo

Page 57: RETI 4 2-mode networks Collaboration networks

1. Presentare il data set2. Illustrare le analisi già fatte in letteratura sul data

set (references)3. a. Rappresentare graficamente e

matematicamente la rete, b. applicare la statistica di basec. applicare la statistica avanzata (centralità dei nodi, degree distribution)d. studiare la coesione (componenti connesse)

Page 58: RETI 4 2-mode networks Collaboration networks

Soft specifico

Cfr tra modi di raccogliere dati sociali

no

Page 59: RETI 4 2-mode networks Collaboration networks

Similarity in Slovenian parties

Manca descrizione

Hub-authorities

nonono

no

Paper/authors

nono

no

nono

no

Page 60: RETI 4 2-mode networks Collaboration networks

no

no

no

no

Page 61: RETI 4 2-mode networks Collaboration networks

no

nono

no

Page 62: RETI 4 2-mode networks Collaboration networks