lanalisi delle corrispondenze semplici e multiple stefano nobile
TRANSCRIPT
L’analisi delle L’analisi delle corrispondenze corrispondenze
semplici e semplici e multiplemultiple
Stefano NobileStefano Nobile
L’analisi delle corrispondenze multiple
StoriaStoria• L'A.C.M. venne introdotta dal
francese Benzecrì agli inizi degli anni Sessanta
L’analisi delle corrispondenze multiple
Aspetti generaliAspetti generali• Obiettivi
– Serve a fornire una «mappa» delle relazioni esistenti tra variabili e tra modalità di diverse variabili, mettendole in relazione con variabili illustrative esterne all'analisi stessa. “Essa è particolarmente adatta per l’esposizione e la sintesi delle relazioni fra le variabili tipiche delle ricerche sociologiche in quanto la maggior parte delle ricerche condotte con questionario comporta la presenza di molte variabili categoriali (Di Franco, 2001: 209).
• Disegno della ricerca– Prevalentemente esplorativo
• Tipo di variabili– Lavora su tutti i tipi di variabili, ma è stata concepita per
quelle a categorie non ordinate
L’analisi delle corrispondenze multiple
Dalla matrice dei dati a Dalla matrice dei dati a quella di Burtquella di Burt
Matrice casi x variabili (per la registrazione iniziale dei dati) Individuo Sesso Titolo di studio Professione Attilio 1 1 1 Biagio 1 2 2 Clotilde 2 3 3 Daria 2 3 2 Eligio 1 4 4 Titolo di studio: 1 = Licenza elementare 2 = Licenza media 3 = Diploma scuola media superiore 4 = Laurea Professione: 1 = operaio 2 = impiegato 3 = dirigente 4 = libero professionista
L’analisi delle corrispondenze multiple
La matrice disgiuntiva La matrice disgiuntiva completacompleta
Individuo Maschio
Femmina
Elementar
e
Media
Diploma
Laurea
Operaio
Impiegato
Dirigente
Libero
professioni
sta Attilio 1 0 1 0 0 0 1 0 0 0 Biagio 1 0 0 1 0 0 0 1 0 0 Clotilde 0 1 0 0 1 0 0 0 1 0 Daria 0 1 0 0 1 0 0 1 0 0 Eligio 1 0 0 0 0 1 0 0 0 1
L’analisi delle corrispondenze multiple
La matrice di BurtLa matrice di Burt• La matrice di Burt riproduce tutte le sotto-matrici
ottenibili confrontando tra loro tutte le coppie di variabili che ne fanno parte.
• Attraverso la metrica del chi quadrato, che tiene conto dei rapporti di ciascun vettore di riga e di colonna con ciascun valore corrispettivo marginale, viene analizzata la dispersione di ciascun vettore di cifre rispetto ai totali di riga o di colonna e, da questo, vengono estratti i fattori.
• La matrice di Burt, inoltre, “contiene tutte le tabelle di contingenza fra le coppie che si possono formare con le variabili immesse nell’analisi” (Di Franco, 2001: 210).
L’analisi delle corrispondenze multiple
La matrice di BurtLa matrice di BurtMatrice di Burt o matrice delle corrispondenze multiple
Maschio
Femmina
Elementare
Media
Diploma
Laurea
Operaio
Impiegato
Dirigente
Libero
professionis
ta
Maschio 3 0 1 1 0 1 1 1 0 1 Femmina 0 2 0 0 2 0 0 1 1 0
Elementare 1 0 1 0 0 0 1 0 0 0 Media 1 0 0 1 0 0 1 0 0 0 Diploma 0 2 0 0 2 0 0 1 1 0 Laurea 1 0 0 0 0 1 0 0 0 1
Operaio 1 0 1 0 0 0 1 0 0 0 Impiegato 1 1 0 1 1 0 0 2 0 0 Dirigente 0 1 0 0 1 0 0 0 1 0 Libero professionista
1 0 0 0 0 1 0 0 0 1
L’analisi delle corrispondenze multiple
L’analisi delle L’analisi delle corrispondenze semplicicorrispondenze semplici
• Tanto per l’analisi delle corrispondenze multiple che per quella delle corrispondenze semplici esistono due scuole, le quali, pur ottenendo attraverso le applicazioni risultati pressoché identici, fanno riferimento ad algoritmi distinti.
• Queste due scuole sono:– Quella francese dell’analyse des donnés e– Quella olandese del gruppo Data Theory Scaling System
(DTSS) dell’università di Leida.
• Il programma Spad fa riferimento alla prima, mentre il programma SPSS fa riferimento alla seconda.
L’analisi delle corrispondenze multiple
Le variabili attive e Le variabili attive e illustrativeillustrative
• Nella scelta delle variabili, queste possono essere distinte in attive ed illustrative. Le prime sono quelle che concretamente contribuiscono alla creazione dei fattori, mentre le seconde serviranno semplicemente a definire meglio i piani fattoriali rappresentati.
L’analisi delle corrispondenze multiple
Valori caratteristiciValori caratteristiciUna volta estratti i fattori, l'ACM fornisce diversi valori caratteristici:• La massa (o peso relativo) che equivale al rapporto tra la frequenza della modalità
di una certa variabile ed il totale delle modalità attive• L'indice di distorsione (o distanza dall'origine) che indica quanto una
determinata modalità sia eccentrica rispetto all'insieme delle modalità appartenenti alla stessa variabile. Questo implica che l'indice di distorsione è inversamente proporzionale alla massa: quante meno frequenze presenta una certa modalità, tanto minore sarà la sua massa e tanto maggiore sarà l'indice di distorsione e, di conseguenza, la lontananza della modalità stessa dall'origine degli assi.
• Il contributo assoluto di ciascuna modalità delle variabili che rappresenta la parte di varianza totale del fattore riprodotta da una determinata variabile modalità. In altre parole, esso spiega in che misura una certa modalità ha contribuito alla formazione di un fattore.
• Il coseno quadrato (o contributo relativo) che consente di valutare in quale misura un certo fattore spiega la varianza della modalità. Quanto più è basso il coseno quadrato, tanto peggio la modalità è rappresentata dal fattore.
• Le coordinate fattoriali non fanno altro che stabilire le posizioni delle modalità sul piano cartesiano. Quanto più le modalità sono distanti dall'origine degli assi (sia in ascissa che in ordinata), tanto più contribuiscono alla formazione di un fattore.
• I valori test servono a controllare la significatività dell'associazione tra una modalità ed un fattore.
L’analisi delle corrispondenze multiple
L’uso della ACS in SPSSL’uso della ACS in SPSS
L’analisi delle corrispondenze multiple
Le misure di discriminazioneLe misure di discriminazione
Nell’output grafico, un’ampia misura di discriminazione corrisponde a una larga espansione delle categorie e, conseguentemente, indica un alto grado di discriminazione tra le categorie di una variabile all’interno di quella dimensione.
L’analisi delle corrispondenze multiple
L’uso della ACS in SPSSL’uso della ACS in SPSS
L’analisi delle corrispondenze multiple
L’output in SpadL’output in Spad
L’analisi delle corrispondenze multiple
L’output in SpadL’output in Spad
L’analisi delle corrispondenze multiple
Il grafico prodottoIl grafico prodotto
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili attiveitaliana. La scelta delle variabili attive
• TEMA = TEMA CANZONE – AMOR - AMORE – SAFF - SFERA AFFETTIVA– SPER - SFERA PERSONALE – SSOC - SFERA SOCIALE – SALT - ALTRI TEMI – NOTM - NESSUN TEMA
• VERB = VERBI CONIUGATI – IPSG - PRIMA PERSONA SINGOLARE – IPSP - PRIMA PERSONA PLURALE – IIPS - SECONDA PERSONA SINGOLARE – IIPP - SECONDA PERSONA PLURALE – IIIS - TERZA PERSONA SINGOLARE– IIIP - TERZA PERSONA PLURALE – IMPE - FORMA IMPERSONALE
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili attiveitaliana. La scelta delle variabili attive
• TRAT = ARGOMENTO TRATTATO A LIVELLO – INDV - INDIVIDUALE AUTORE – COLL - COLLETTIVO
• SOLU = LIVELLO DESCRIZIONE-ANALISI-SOLUZIONE– DESC - DESCRIZIONE– ANAL - ANALISI– SOLZ - SOLUZIONE
• DEST = DESTINATARIO TESTO – PART - PARTNER – DNSP - PRESENTE NON SPECIFICABILE – AMIC - AMICO – FAMI - FAMILIARE (ELIMINATA)– GESU - DIO O GESÙ (ELIMINATA)– NODS - NESSUN DESTINATARIO
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili attiveitaliana. La scelta delle variabili attive
• TEST = MODALITÀ DI PRESENTAZIONE DEL TESTO– STOR - STORIA– IMMA - IMMAGINE– RIFL - RIFLESSIONI RICORDI– DISC - DISCORSO DIRETTO
• DENO = CONTESTO DENOTATIVO– FANT - FANTASTICO– LAVO - LAVORO– POLI - POLITICO (ELIMINATA)– SCUO - SCUOLA (ELIMINATA)– SVAG - SVAGO TEMPO LIBERO– NODE - CONTESTO DENOTATIVO ASSENTE
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili attiveitaliana. La scelta delle variabili attive
• CONN = CONTESTO CONNOTATIVO – FAMC - FAMIGLIA – PARI - GRUPPO DEI PARI – PARC - PARTNERSHIP – NOCO - CONTESTO CONNOTATIVO ASSENTE
• VALI = VALORI PRESENTI – ACHI - ACCRESCIMENTO PERSONALE – EDON - EDONISMO – MACH - MACHIAVELLISMO– ORTO - ETICA ORTODOSSA– VAMO - AMORE – VETO - ETEROFILIA – VSOC - VALORI SOCIALI – NOVA - VALORI ASSENTI
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili illustrativeitaliana. La scelta delle variabili illustrative
• SEX = SESSO INTERPRETE – MASC - MASCHIO – FEMM - FEMMINA – GRUP - GRUPPO
• TIPO = TIPOLOGIA GENERE – MELO - MELODICO – AUTO - AUTORE – ROCK - ROCK
• TIP2 = TIPOLOGIA GENERE ESTENSIVA – GRAN - GRANDI INTERPRETI – METE - METEORE – AU70 - AUTORI ANNI 70 – AU80 - AUTORI ANNI 80 – RK70 - ROCK ANNI 70 – RK80 - ROCK ANNI 80
L’analisi delle corrispondenze multiple
Un esempio: uno studio sulla canzone Un esempio: uno studio sulla canzone italiana. La scelta delle variabili illustrativeitaliana. La scelta delle variabili illustrative
• RITO = PRESENZA RITORNELLO – SIRT - SI – NORT - NO
• ANNO = PERIODO STORICO – 7074 - 1970-1974– 7579 - 1975-1979 – 8084 - 1980-1984 – 8589 - 1985-1989 – 9092 - 1990-1992
• VOMU = RAPPORTO VOCE MUSICA – VOCP - PIÙ VOCE – MUVO - VOCE UGUALE MUSICA – MUSP - PIÙ MUSICA
L’analisi delle corrispondenze multiple
Istogramma dei fattori estratti dall'analisi Istogramma dei fattori estratti dall'analisi delle corrispondenze multipledelle corrispondenze multiple
FATTORE AUTOVALORE
PERCENTUALE DI VARIANZA
SPIEGATA DAL FATTORE
PERCENTUALE DI VARIANZA CUMULATA
1 .0849 68.03 68.03 ********************** 2 .0205 16.43 84.46 ************** 3 .0086 6.89 91.35 ********** 4 .0040 3.20 94.55 ******** 5 .0033 2.64 97.19 ******* 6 .0020 1.60 98.79 ****** 7 .0010 0.80 99.59 ****** 8 .0003 0.24 99.83 ***** 9 .0001 0.09 99.92 *****
L’analisi delle corrispondenze multiple
Rapporto tra le variabili Rapporto tra le variabili attive e i primi tre fattoriattive e i primi tre fattori
I FATTORE
VARIABILE CONTRIBUTO CUMULATO
% CUMULATA
TEMA CANZONE 21.5 21.5 CONTESTO CONNOTATIVO 21.5 43.0 DESTINATARIO TESTO 18.7 61.7 VALORI CANZONE 18.3 80.0 ARTICOLAZIONE TESTO 7.1 87.1 CONIUGAZIONE VERBI 6.7 93.8 CONTESTO DENOTATIVO 3.0 96.8 LIVELLO INDIVIDUALE-COLLETT. 2.2 99.0 LIVELLO DESCRIZIONE-SOLUZ. 1.0 100.0
L’analisi delle corrispondenze multiple
Rapporto tra le variabili Rapporto tra le variabili attive e i primi tre fattoriattive e i primi tre fattori
II FATTORE
VARIABILE CONTRIBUTO CUMULATO
% CUMULATA
TEMA CANZONE 23.9 23.9 CONTESTO CONNOTATIVO 22.2 46.1 DESTINATARIO TESTO 19.6 65.7 VALORI CANZONE 16.8 82.5 CONIUGAZIONE VERBI 7.0 89.5 ARTICOLAZIONE TESTO 5.4 94.9 LIVELLO DESCRIZIONE-SOLUZ. 2.5 97.4 CONTESTO DENOTATIVO 1.3 98.7 LIVELLO INDIVIDUALE-COLLETT. 1.3 100.0
L’analisi delle corrispondenze multiple
Rapporto tra le variabili Rapporto tra le variabili attive e i primi tre fattoriattive e i primi tre fattori
III FATTORE
VARIABILE CONTRIBUTO CUMULATO
% CUMULATA
TEMA CANZONE 31.6 31.6 VALORI CANZONE 24.6 56.2 LIVELLO DESCRIZIONE-SOLUZ. 13.2 69.4 CONTESTO DENOTATIVO 9.7 79.1 ARTICOLAZIONE TESTO 8.1 87.2 DESTINATARIO TESTO 5.4 92.6 CONIUGAZIONE VERBI 4.2 96.8 LIVELLO INDIVIDUALE-COLLETT. 1.7 98.5 CONTESTO CONNOTATIVO 1.5 100.0
L’analisi delle corrispondenze multiple
I° Fattore. Contrapposizione tra la canzone I° Fattore. Contrapposizione tra la canzone "tradizionale- classica d'amore" e la canzone "tradizionale- classica d'amore" e la canzone
"innovativa" costruita su altri temi"innovativa" costruita su altri temi
VARIABILI ATTIVE SEMIASSE POSITIVO
CONTRIBUTO ASSOLUTO
CONTRIBUTO RELATIVO
COORDINATA FATTORIALE
TEMA - AMOR 10.6 .76 .88 CONN - PARC 12.0 .78 .99 DEST - PART 12.6 .68 1.19 VALI - VAMO 9.9 .61 .94 TEST - DISC 5.1 .25 .84 VERB - IIPS 2.3 .12 .53
SEMIASSE NEGATIVO
CONTRIBUTO ASSOLUTO
CONTRIBUTO RELATIVO
COORDINATA FATTORIALE
TEMA - SPER 2.9 .13 -.74 TEMA - SSOC 3.8 .16 -1.07 TEMA - SALT 2.7 .11 -1.00 CONN - NOCO 7.9 .53 -.79 DEST - NODS 5.1 .42 -.58 VALI - VSOC 3.4 .14 -1.03 TEST - RIFL 1.2 .09 -.29 VERB - IIIS 1.8 .08 -.63 VERB - IMPE 1.2 .05 -.85 TRAT - COLL 2.0 .08 -1.08
L’analisi delle corrispondenze multiple
I° Fattore. Contrapposizione tra la canzone I° Fattore. Contrapposizione tra la canzone "tradizionale- classica d'amore" e la canzone "tradizionale- classica d'amore" e la canzone
"innovativa" costruita su altri temi"innovativa" costruita su altri temi
VARIABILI ILLUSTRATIVE SEMIASSE POSITIVO COORDINATA FATTORIALE
SEX - FEMM .34 TIPO - MELO .33 TIP2 - GRAN .36 TIP2 - METE .26 ANNO - 7074 .22 RITO - SIRT .08 VOMU - VOCP .05
SEMIASSE NEGATIVO COORDINATA FATTORIALE SEX - MASC -.11 TIPO - AUTO -.30 TIPO - ROCK -.27 TIP2 - AU70 -.35 TIP2 - AU80 -.21 TIP2 - RK70 -.66 ANNO - 9092 -.21 RITO - NORT -.41 VOMU - MUVO -.22 VOMU - MUSP -.70
L’analisi delle corrispondenze multiple
II° Fattore contrapposizione nella canzone tra II° Fattore contrapposizione nella canzone tra la sfera affettiva e le canzoni "vuote" dove la sfera affettiva e le canzoni "vuote" dove
non si parla di nientenon si parla di niente
VARIABILI ATTIVE
semiasse positivo contributo
assoluto contributo
relativo coordinata fattoriale
TEMA - SAFF 19.9 .48 2.84 CONN - PARI 13.3 .33 2.03 CONN - FAMC 6.4 .15 2.39 DEST - AMIC 12.9 .30 3.16 DEST - DNSP 3.8 .10 .97 VALI - VETO 12.5 .32 1.56 TEST - DISC 3.6 .11 .56 VERB - IIPS 3.2 .10 .50
semiasse negativo contributo
assoluto contributo
relativo coordinata fattoriale
TEMA - NOTM 2.7 .06 -1.33 CONN - NOCO 2.2 .09 -.33 DEST - NODS 2.9 .15 -.35 VALI - NOVA 3.2 .08 -1.28 VERB - IIIS 1.4 .04 -.45 VERB - IMPE 1.0 .03 -.62
L’analisi delle corrispondenze multiple
II° Fattore contrapposizione nella canzone tra II° Fattore contrapposizione nella canzone tra la sfera affettiva e le canzoni "vuote" dove la sfera affettiva e le canzoni "vuote" dove
non si parla di nientenon si parla di niente
VARIABILI ILLUSTRATIVE semiasse positivo coordinata fattoriale
TIPO - AUTO .07 TIP2 - AU70 .08 TIP2 - AU80 .09 RITO - SIRT .04 VOMU - VOCP .03
semiasse negativo coordinata fattoriale TIPO - MELO -.07 TIP2 - GRAN -.09 TIP2 - METE -.07 RITO - NORT -.23 VOMU - MUVO -.20
L’analisi delle corrispondenze multiple
III° Fattore la canzone "impegnata" / la III° Fattore la canzone "impegnata" / la canzone "fantastico-immaginativa"canzone "fantastico-immaginativa"
VARIABILI ATTIVE
semiasse positivo contributo
assoluto contributo
relativo coordinata fattoriale
TEMA - SSOC 10.4 .22 1.26 VALI - VSOC 8.0 .17 1.12 SOLU - ANAL 4.3 .11 .55 SOLU - SOLZ 3.9 .08 .76 TRAT - COLL 1.6 .03 .68 TEST - RIFL 1.3 .05 .21 VERB - IPSP 1.0 .02 .57
semiasse negativo contributo
assoluto contributo
relativo coordinata fattoriale
TEMA - SAFF 6.6 .13 -1.46 TEMA - NOTM 11.9 .23 -2.55 VALI - VETO 4.3 .09 -.82 VALI - NOVA 10.5 .20 -2.06 TEST - IMMA 4.6 .09 -.94 TEST - STOR 1.8 .04 -.56 VERB - IIIS 2.0 .04 -.47 SOLU - DESC 5.0 .24 -.38 DENO - FANT 6.7 .13 -.82
L’analisi delle corrispondenze multiple
III° Fattore la canzone "impegnata" / la III° Fattore la canzone "impegnata" / la canzone "fantastico-immaginativa"canzone "fantastico-immaginativa"
VARIABILI ILLUSTRATIVE semiasse positivo coordinata fattoriale
SEX - MASC .06 TIPO - ROCK .30 TIP2 - AU70 .06 TIP2 - RK70 .49 TIP2 - RK80 .18
semiasse negativo coordinata fattoriale SEX - FEMM -.15 TIPO - MELO -.09 TIP2 - METE -.17
L’analisi delle corrispondenze multiple
Proiezione delle modalità attive e Proiezione delle modalità attive e illustrative sul I (in ascissa) e sul II (in illustrative sul I (in ascissa) e sul II (in
ordinata) fattoreordinata) fattore +------PARI---SAFFFAMCAMICFAMI+---------------------------+ | | | | | | 1.8 + | | | | | | | | | VETO | | | | | | | | | | | | | | | | | 1.2 + | | | | | | | | | | | | DNSP | | | SCUO | | | | | | | | | COLL | | .6 + LAVO IIPP GESU | | | | DISC | | SOLZ | IIPS | | IPSP | | | AUTO | | | ROCK9092 | SIRT | | SSOC ORTO ANAL MASC | | | VOCP | POLI SVAG | | .0 +-----VSOC-------------------INDV---NODE----7074---------PART | STOR | MACHMELO FEMM | | SPERACHI | DESC PARC| | MUSP EDON RIFL | IPSG AMORVAMO | | SALT | | | IIIP NOCO | | | NODS | | | IIIS IMMA | | | FANT | | -.6 + IMPE | | | | | | | | | MUVO | | | | | | NORT | | | | | | | | | | | -1.2+ | | | NOVA | | +-NOTM+-----+-----+-----+-----+-----+-----+-----+-----+---+ -1.25 -1.00 -.75 -.50 -.25 .00 .25 .50 .75 1.00
L’analisi delle corrispondenze multiple
Proiezione delle modalità attive sul II Proiezione delle modalità attive sul II (in ascissa) e sul III (in ordinata) (in ascissa) e sul III (in ordinata)
fattorefattore +---------------+POLI---------------------------------------+ | | SSOC | | | | | VSOC | | | | 1.0 + | | | | ORTO | | | | | | | | | | | | SOLZ GESU | | | COLL DNSP | | | | | | ANAL IPSP | .5 + | LAVO | | | IIPP | | | | | IIIP SPERMACH| | | | | | RIFLACHI| SCUO | | IPSG NODE | | NOCO PART DISC | | VAMOPARC | | .0 +-------AMOR----+-------------------------------------------| | EDONINDV| | | NODS | IIPS | IMPE | | | | | | | PARI | | | | DESC| | | IIIS | | -.5+ SALT | SVAG | | STOR | | | | | | | | | | FAMC | | FAMI | | VETO AMIC | | | | IMMA | | -1.NOVA | | | | SAFF | | | NOTM | | | | | | | | | | | | | | | | | -1.5+-FANT--+-------+-------+-------+-------+-------+-------+---+ -.4 .0 .4 .8 1.2 1.6 2.0
L’analisi delle corrispondenze multiple
Bibliografia minimaBibliografia minima• Amaturo E., 1989, Analyse des donnés & analisi dei dati nelle
scienze sociali, Centro Scientifico, Torino• Benzecri J.P., 1973, L’analyse des donnés. Tome I: la taxinomie;
Tome II: L’analyse des corrispondances, Dunod, Parigi• Bolasco S., 1999, Analisi multidimensionale dei dati. Metodi,
strategie e criteri di interpretazione, Carocci, Roma• Di Franco G., 1997, Tecniche e modelli di analisi multivariata dei
dati, Seam, Roma• Di Franco G., 2006, Corrispondenze multiple e altre tecniche
multivariate per variabili categoriali, Franco Angeli, Milano• Escofier B. e Pagès J., 1990, Analyses factorielles simples et
multiples. Objectifs, méthodes et interprétation, Dunod, Parigi• Lanzetti C., 1995, Elaborazioni di dati qualitativi. Introduzione
all’uso dell’analisi delle corrispondenze e dei modelli LISREL, Franco Angeli, Milano
• Ricolfi L., 2002, Manuale di analisi dei dati. Fondamenti, Laterza, Bari-Roma