combinare regressionee anova: predittori quantitativi ecategoriali … · 2016. 1. 22. · nicola...
Post on 03-Feb-2021
2 Views
Preview:
TRANSCRIPT
-
Combinare Regressione e ANOVA: predittori
quantitativi e categoriali
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 1 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Controllare per una Covariata
La regressione multipla consente di studiare la relazione tra variabiliquantitative
L’ANOVA consente di verificare come le medie di una variabile quantitativa simodifichino al variare di più predittori categoriali (qualitativi)
Domanda: è possibile costruire modelli che studino le variazione tra le mediein relazione a predittori di qualsiasi tipo?
Ciò è possibile combinando le due metodologie
Esempio: si stanno confrontando i redditi di M e F anche in relazione aidifferenti livelli di esperienza (anzianità di servizio)
Si vuole studiare come variano i redditi medi tra i due gruppi (M e F)controllando per i valori di un altro predittore quantitativo (esperienza)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 2 / 58
-
Introduzione
Analisi della Covarianza
In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata
Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza
Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata
Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso
Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58
-
Introduzione
Analisi della Covarianza
In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata
Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza
Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata
Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso
Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58
-
Introduzione
Analisi della Covarianza
In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata
Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza
Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata
Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso
Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58
-
Introduzione
Analisi della Covarianza
In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata
Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza
Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata
Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso
Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58
-
Introduzione
Analisi della Covarianza
In questo caso la variabile rispetto alla quale si effettua il controllo prende ilnome di covariata
Il modello di regressione, in presenza di covariate, prende il nome di Analisidella Covarianza
Sostanzialmente, gli effetti di un predittore (qualitativo) possono modificarsial variare dei livelli di un altro predittore (quantitativo) definito covariata
Es.: i redditi di M e F sono generalmente differenti (+M -F). Ma sappiamoche il reddito è positivamente correlato con l’esperienza. Se i M tendono adavere più esperienza lavorativa delle F, allora la differenza nei loro redditi èdovuta alla variabile esperienza e non al sesso
Per ragioni di semplicità espositiva ci limiteremo al caso di un predittorecategoriale e di un predittore quantitativo
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 3 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie e le rette di regressione
Notazione:
a X variabile esplicativa quantitativa
b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy
Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z
Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie e le rette di regressione
Notazione:
a X variabile esplicativa quantitativa
b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy
Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z
Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie e le rette di regressione
Notazione:
a X variabile esplicativa quantitativa
b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy
Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z
Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie e le rette di regressione
Notazione:
a X variabile esplicativa quantitativa
b Z variabile esplicativa categoriale. Se dicotomica è una dummy, se politomicasegue un set di dummy
Se controllo per Z, sto studiando la relazione di X su Y in ogni categoria di Z
Se controllo per X, sto studiando se vi sono differenze nelle medie di Y alvariare di Z, per ogni valore di X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 4 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı
La variabile risposta è il Prezzo
I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)
L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı
La variabile risposta è il Prezzo
I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)
L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı
La variabile risposta è il Prezzo
I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)
L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı
La variabile risposta è il Prezzo
I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)
L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Riprendiamo l’esempio sui prezzi di vendita delle caseCasa Prezzo Dimensione Tasse Stanze Letto Bagni Nuova1 279900 2048 3104 4 2 no2 146500 912 1173 2 1 no3 237700 1654 3076 4 2 no4 200000 2068 1608 3 2 no5 159900 1477 1454 3 3 no6 499900 3153 2997 3 2 s̀ı7 265500 1355 4054 3 2 no8 289900 2075 3002 3 2 s̀ı
La variabile risposta è il Prezzo
I predittori sono: Dimensione (in yarde quadrate) e Casa Nuova (1 = S e0 = N)
L’analisi consisterà nel costruire due rette di regressione (una per le casenuove e una per le vecchie) e confrontare i risultati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 5 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Con l’analisi della covarianza è possibile confrontare lerette di regressione perciascun livello del predittore qualitativo
Ad es., si osservi la figura
x
y
x
y
x
yz 5 1
z 5 0
z 5 1
z 5 0
z 5 0 or 1
(a) No interaction (b) No interaction, with identical y-intercepts
(c) Interaction
Il caso (a) ci dice che i prezzi delle case N e V dipendono allo stesso mododal predittore X (Dimensione)
Il caso (b) ci dice che il prezzo delle case N o V è lo stesso per ogni valore diX
Il caso (c) ci dice che il predittore X influenza il prezzo delle case in mododiverso a seconda del fatto che sia N o V (è l’interazione)
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 6 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z
La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z
x
yOverallrelationship
Partialrelationships
Category 1Category 2Category 3
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z
La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z
x
yOverallrelationship
Partialrelationships
Category 1Category 2Category 3
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le rette di regressione
Può accadere che il modo in cui X influenza Y sia diverso al variare dei livellidi Z
La figura mostra come la relazione di X su Y sia nel complesso positiva, masi annulla per ogni livello di Z
x
yOverallrelationship
Partialrelationships
Category 1Category 2Category 3
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 7 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le medie di Y controllando per X
L’altro caso riguarda lo studio di come la covariata Z influenza Y ,controllando per i diversi valori di X
L’esempio è quello del reddito Y , il sesso Z e l’esperienza X
La relazione nota è che il reddito dei M sia superiore a quello delle F, quindiZ influenza Y
Tuttavia controllando per l’esperienza può accadere che tale relazionescompaia, cioè M e F hanno redditi uguali a parità di esperienza
Si tratterebbe di una relazione concatenata dove i M hanno un redditomaggiore delle F solo perchè hanno complessivamente più esperienza (tracoloro con elevata esperienza prevalgono i M sulle F)
Se cos̀ı non fosse, allora davvero il sesso Z influenzerebbe il reddito Y
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 8 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le le medie di Y controllando per X
La figura mostra molto bene i diversi casi
x
y
x
y
x
y
(a) No interaction (b) No interaction, with identical regression lines
Men
Women
(c) Interaction
Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F
Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )
Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le le medie di Y controllando per X
La figura mostra molto bene i diversi casi
x
y
x
y
x
y
(a) No interaction (b) No interaction, with identical regression lines
Men
Women
(c) Interaction
Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F
Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )
Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le le medie di Y controllando per X
La figura mostra molto bene i diversi casi
x
y
x
y
x
y
(a) No interaction (b) No interaction, with identical regression lines
Men
Women
(c) Interaction
Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F
Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )
Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58
-
Confrontare le medie e le rette di regressione
Confrontare le le medie di Y controllando per X
La figura mostra molto bene i diversi casi
x
y
x
y
x
y
(a) No interaction (b) No interaction, with identical regression lines
Men
Women
(c) Interaction
Il caso (a) mostra come non ci sia interazione tra sesso e esperienza. Larelazione tra X e Y è la stessa per M e F
Il caso (b) mostra come M e F abbiano lo stesso reddito a parità diesperienza (la relazione Z su Y è la stessa controllando per X )
Il caso (c) mostra, invece, come il reddito dei M sia superiore a quello delle F(influenza di Z ), e cresca più velocemente a parità di esperienza X
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 9 / 58
-
Regressione con predittori quantitativi e categoriali
Variabili esplicative quantitative e dummy
Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy
E (y) = α+ βx + β1z1 + β2z2.
Il coefficiente β indica l’effetto di X sulla media di Y
I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )
Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58
-
Regressione con predittori quantitativi e categoriali
Variabili esplicative quantitative e dummy
Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy
E (y) = α+ βx + β1z1 + β2z2.
Il coefficiente β indica l’effetto di X sulla media di Y
I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )
Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58
-
Regressione con predittori quantitativi e categoriali
Variabili esplicative quantitative e dummy
Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy
E (y) = α+ βx + β1z1 + β2z2.
Il coefficiente β indica l’effetto di X sulla media di Y
I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )
Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58
-
Regressione con predittori quantitativi e categoriali
Variabili esplicative quantitative e dummy
Si consideri il modello con un regressore quantitativo X e uno categoriale a 3livelli, da cui conseguono 2 dummy
E (y) = α+ βx + β1z1 + β2z2.
Il coefficiente β indica l’effetto di X sulla media di Y
I coefficienti β1 e β2 indicano, rispettivamente, gli effetti per le categoriedell’altro predittore (Z )
Ovviamente si tratta di effetti che si aggiungono (algebricamente) a quellorappresentato da β
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 10 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Esempio 13.1 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale
Si è considerato un campione di americani ultra 25-enni su cui si sono rilevatele seguenti variabili:
1 y = reddito annuale
2 x = anni di istruzione (12 = high school graduate, 16 = college)
3 z = gruppo etnico-razziale (Neri, Ispanici, Bianchi)
Il campione di n = 80 intervistati è cos̀ı suddiviso: n1 = 16 neri, n2 = 14ispanici e n3 = 50 bianchi
Si hanno, in pratica, 3 gruppi di soggetti diversi per gruppo etnico-razziale, esi vuole studiare se il reddito annuale dipende dall’istruzione e/o dal gruppoetnico di appartnenza
Si introduce il controllo per gruppo etnico
Lo schema delle dummy è il seguente:
a z1 = se il soggetto è nero, z1 = 0 altrimenti;
b z2 = se il soggetto è ispanico, z2 = 0 altrimenti;
c z1 = z2 = 0 se il soggetto è bianco.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 11 / 58
-
Regressione con predittori quantitativi e categoriali
Tabella: y = Reddito Annuale (in Migliaia di Dollari) e x = Numero di Anni di Istruzioneper 3 Gruppi Etnici
Black Hispanic White White White
y x y x y x y x y x
16 10 32 16 30 14 62 16 50 1618 7 16 11 48 14 24 10 50 1426 9 20 10 40 7 50 13 22 1116 11 58 16 84 18 32 10 26 1234 14 30 12 50 10 34 16 46 1622 12 26 10 38 12 52 18 22 942 16 20 8 30 12 24 12 24 942 16 40 12 76 16 22 14 64 1416 9 32 10 48 16 20 13 28 1220 10 22 11 36 11 30 14 32 1266 16 20 10 40 11 24 13 38 1426 12 56 14 44 12 120 18 44 1220 10 32 12 30 10 22 10 22 1230 15 30 11 60 15 82 16 18 1020 10 24 9 18 12 24 1230 19 88 17 26 12 56 20
46 16 104 14
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 12 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
I dati della Tabella mostrano chiaramente che i redditi si differenziano tra igruppi etnici
Tuttavia ciò potrebbe essere dovuto alle differenze nelle distribuzioni dellavariabile Istruzione
Se ciò fosse vero, controllando per l’Istruzione, ci aspetteremmo redditi medisimili
In sintesi abbiamo:
Tabella: Redditi Medi e Istruzione, per Gruppo Etnico
Neri Ispanici Bianchi TotaleMedia Reddito y1 = 27.8 y 2 = 31.0 y3 = 42.4 y = 37.6Media Istruzione x̄1 = 12.2 x̄2 = 11.6 x̄3 = 13.1 x̄ = 12.7Dim. campionaria n1 = 16 n2 = 14 n3 = 50 n = 80
Appare chiaro che i Bianchi hanno il Reddito maggiore ma anche il valore piùelevato per Istruzione
Domanda: qual è l’effetto più rilevante?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 13 / 58
-
Regressione con predittori quantitativi e categoriali
La Tabella riporta i risultati di un modello di regressione con le dummy per ilGruppo Etnico
Tabella: Modello senza interazioni per la Variabile risposta y = Reddito e VariabiliEsplicative Istruzione e Gruppo Etnico (con variabili dummy per le categorie Neri eIspanici)
IC 95%Parametri B Std. Error t Sig Inferiore Superiore
Intercetta -15.663 8.412 -1.862 .066 -32.4 1.09istruzione 4.432 .619 7.158 .000 3.2 5.70razza = N -10.874 4.473 -2.431 .017 -19.8 -2.00razza = I -4.934 4.763 -1.036 .304 -14.4 4.60razza = B 0
R-Quadro = .462
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 14 / 58
-
Regressione con predittori quantitativi e categoriali
Si ottiene il seguente modello
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.
Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è
ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .
Per gli altri gruppi etnici avremo
ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)
I coefficienti angolari sono tutti uguali. Cosa significa?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58
-
Regressione con predittori quantitativi e categoriali
Si ottiene il seguente modello
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.
Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è
ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .
Per gli altri gruppi etnici avremo
ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)
I coefficienti angolari sono tutti uguali. Cosa significa?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58
-
Regressione con predittori quantitativi e categoriali
Si ottiene il seguente modello
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.
Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è
ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .
Per gli altri gruppi etnici avremo
ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)
I coefficienti angolari sono tutti uguali. Cosa significa?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58
-
Regressione con predittori quantitativi e categoriali
Si ottiene il seguente modello
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2.
Considerando i Neri, z1 = 1 e z2 = 0, l’equazione è
ŷ = −15.7 + 4.4x − 10.9(1)− 4.9(0) = −26.6 + 4.4x .
Per gli altri gruppi etnici avremo
ŷ = −20.6 + 4.4x (Ispanici)ŷ = −15.7 + 4.4x (Bianchi)
I coefficienti angolari sono tutti uguali. Cosa significa?
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 15 / 58
-
Regressione con predittori quantitativi e categoriali
L’effetto dell’Istruzione sul Reddito è lo stesso in tutti i Gruppi Etnici
White
White (y 5 215.7 1 4.4x)
Black
Black (y 5 226.6 1 4.4x)
Income
Hispanic
Hispanic (y 5 220.6 1 4.4x)
Education105
0
20
40
60
80
100
120
15 20
ˆ
ˆ
ˆ
Si può concludere, quindi che il modo in cui l’Istruzione influenza il Reddito èlo stesso in ogni Gruppo Etnico, quindi i Bianchi guadagnano di più non permotivi discriminatori, ma perchè mediamente più istruiti.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 16 / 58
-
Regressione con predittori quantitativi e categoriali
L’effetto dell’Istruzione sul Reddito è lo stesso in tutti i Gruppi Etnici
White
White (y 5 215.7 1 4.4x)
Black
Black (y 5 226.6 1 4.4x)
Income
Hispanic
Hispanic (y 5 220.6 1 4.4x)
Education105
0
20
40
60
80
100
120
15 20
ˆ
ˆ
ˆ
Si può concludere, quindi che il modo in cui l’Istruzione influenza il Reddito èlo stesso in ogni Gruppo Etnico, quindi i Bianchi guadagnano di più non permotivi discriminatori, ma perchè mediamente più istruiti.
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 16 / 58
-
Regressione con predittori quantitativi e categoriali
Interpretazione dei parametri: il Modello senza Interazioni
Riprendiamo il modello teorico
E (y) = α+ βx + β1z1 + β2z2.
Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha
E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .
In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento
Stesso discorso per la categoria 2 di Z , per cui il modello sarà
E (y) = (α+ β2) + βx
Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58
-
Regressione con predittori quantitativi e categoriali
Interpretazione dei parametri: il Modello senza Interazioni
Riprendiamo il modello teorico
E (y) = α+ βx + β1z1 + β2z2.
Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha
E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .
In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento
Stesso discorso per la categoria 2 di Z , per cui il modello sarà
E (y) = (α+ β2) + βx
Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58
-
Regressione con predittori quantitativi e categoriali
Interpretazione dei parametri: il Modello senza Interazioni
Riprendiamo il modello teorico
E (y) = α+ βx + β1z1 + β2z2.
Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha
E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .
In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento
Stesso discorso per la categoria 2 di Z , per cui il modello sarà
E (y) = (α+ β2) + βx
Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58
-
Regressione con predittori quantitativi e categoriali
Interpretazione dei parametri: il Modello senza Interazioni
Riprendiamo il modello teorico
E (y) = α+ βx + β1z1 + β2z2.
Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha
E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .
In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento
Stesso discorso per la categoria 2 di Z , per cui il modello sarà
E (y) = (α+ β2) + βx
Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58
-
Regressione con predittori quantitativi e categoriali
Interpretazione dei parametri: il Modello senza Interazioni
Riprendiamo il modello teorico
E (y) = α+ βx + β1z1 + β2z2.
Per la categoria 1 di Z , con z1 = 1 e z2 = 0, si ha
E (y) = α+ βx + β1(1) + β2(0) = (α+ β1) + βx .
In pratica il coefficiente β1 modifica il valore dell’intercetta per la categoria diZ di riferimento
Stesso discorso per la categoria 2 di Z , per cui il modello sarà
E (y) = (α+ β2) + βx
Ovviamente per la categoria 3 di Z si ha E (y) = α+ βx
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 17 / 58
-
Regressione con predittori quantitativi e categoriali
Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento
In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X
In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.
Tabella: Equazioni di Regressione e interpretazione dei Parametri
Differenze fra lemedie della Cat. 3,
Categoria y-Int. Pendenza E(y) per un fissato x controllando per X
1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58
-
Regressione con predittori quantitativi e categoriali
Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento
In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X
In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.
Tabella: Equazioni di Regressione e interpretazione dei Parametri
Differenze fra lemedie della Cat. 3,
Categoria y-Int. Pendenza E(y) per un fissato x controllando per X
1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58
-
Regressione con predittori quantitativi e categoriali
Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento
In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X
In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.
Tabella: Equazioni di Regressione e interpretazione dei Parametri
Differenze fra lemedie della Cat. 3,
Categoria y-Int. Pendenza E(y) per un fissato x controllando per X
1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58
-
Regressione con predittori quantitativi e categoriali
Più in dettaglio, ciascun coefficiente di regressione indica la differenza tral’intercetta della propria categoria e quella della categoria di riferimento
In questo caso le rette sono tra loro parallele, quindi ciascun βi rappresenta ladistanza verticale tra le rette di regressione, per ogni valore di xi di X
In buona sostanza, controllando per X , ciascun βi è la differenza tra la mediadella categoria i-ma e l’ultima.
Tabella: Equazioni di Regressione e interpretazione dei Parametri
Differenze fra lemedie della Cat. 3,
Categoria y-Int. Pendenza E(y) per un fissato x controllando per X
1 α+ β1 β (α+ β1) + βx β12 α+ β2 β (α+ β2) + βx β23 α β α+ βx 0
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 18 / 58
-
Regressione con predittori quantitativi e categoriali
Graficamente si ha:
x
y
a
a 1 b2
a 1 b1
E(y) 5 a 1 bx (category 3)
E(y) 5 (a 1 b1) 1 bx (category 1)
E(y) 5 (a 1 b2) 1 bx (category 2)
b1
b2
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 19 / 58
-
Regressione con predittori quantitativi e categoriali
In riferimento all’esercizio precedente, abbiamo questa equazione diregressione
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2
Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione
Più esattamente per ciascun valore della variabile X Istruzione
Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58
-
Regressione con predittori quantitativi e categoriali
In riferimento all’esercizio precedente, abbiamo questa equazione diregressione
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2
Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione
Più esattamente per ciascun valore della variabile X Istruzione
Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58
-
Regressione con predittori quantitativi e categoriali
In riferimento all’esercizio precedente, abbiamo questa equazione diregressione
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2
Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione
Più esattamente per ciascun valore della variabile X Istruzione
Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58
-
Regressione con predittori quantitativi e categoriali
In riferimento all’esercizio precedente, abbiamo questa equazione diregressione
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2
Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione
Più esattamente per ciascun valore della variabile X Istruzione
Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58
-
Regressione con predittori quantitativi e categoriali
In riferimento all’esercizio precedente, abbiamo questa equazione diregressione
ŷ = −15.7 + 4.4x − 10.9z1 − 4.9z2
Poiché la categoria di riferimento è Bianchi, il coefficiente β1 = −10.9, indicache i Neri guadagnano in media $10.900 in meno rispetto ai Bianchi, perciascun livello di istruzione
Più esattamente per ciascun valore della variabile X Istruzione
Nel caso di β2 = −4.9, diremo che gli Ispanici hanno in media un RedditoAnnuale inferiore di $4.900 rispetto ai Bianchi ∀xOvviamente la differenza β1 − β2 = −10.9− (−4.9) = −6.0 ci dice che i Nerihanno un Reddito Annuale inferiore di $6.000 rispetto agli Ispanici ∀x
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 20 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Modello con Interazioni tra Predittori Quantitativi e
Qualitativi
Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni
In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori
In questo caso le rette di regressione avranno pendenze differenti
Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Modello con Interazioni tra Predittori Quantitativi e
Qualitativi
Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni
In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori
In questo caso le rette di regressione avranno pendenze differenti
Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Modello con Interazioni tra Predittori Quantitativi e
Qualitativi
Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni
In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori
In questo caso le rette di regressione avranno pendenze differenti
Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Modello con Interazioni tra Predittori Quantitativi e
Qualitativi
Nelle Scienze Sociali, come al solito, il caso più frequente prevede l’esistenzadi Interazioni
In questo caso si tratta di stimarle considerando che abbiamo predittori diogni tipo (quantitativi e qualitativi). Ci limitiamo al caso di 2 predittori
In questo caso le rette di regressione avranno pendenze differenti
Per calcolare le interazioni si considerano i prodotti vettoriali tra le variabiliesplicative, definiti anche prodotti incrociati
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 21 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Esempio 13.2 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale con Interazioni
Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X
Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)
Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Esempio 13.2 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale con Interazioni
Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X
Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)
Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Esempio 13.2 — Regressione Reddito Istruzione e Gruppo
Etnico-Razziale con Interazioni
Rispetto al caso precedente (assenza di interazioni) abbiamo anche i terminidi interazione x × z1 e x × z2Rappresentano i prodotti incrociati delle prime 2 categorie con la variabile X
Tabella: Modello con interazioni per la Var. risposta y = Reddito e Var. EsplicativeIstruzione e Gruppo Etnico (con variabili dummy per le categorie Neri e Ispanici)
Parametri B Std. Error t SigIntercetta -25.869 10.498 -2.464 .016Istruzione 5.210 .783 6.655 .000razza = N 19.333 18.293 1.057 .294razza = I 9.264 24.282 .382 .704razza = B 0 . . .razza = N ∗ Istruzione -2.411 1.418 -1.700 .093razza = I ∗ Istruzione -1.121 2.006 -.559 .578razza = B ∗ Istruzione 0 . . .R-Quadro = 0.482
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 22 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In forma analitica l’equazione di regressione (o equazione di previsione) sarà
ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).
Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà
ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .
Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo
ŷ = −6.6 + 2.8x .
ŷ = −16.6 + 4.1x .
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In forma analitica l’equazione di regressione (o equazione di previsione) sarà
ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).
Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà
ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .
Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo
ŷ = −6.6 + 2.8x .
ŷ = −16.6 + 4.1x .
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In forma analitica l’equazione di regressione (o equazione di previsione) sarà
ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 − 2.4(x × z1)− 1.1(x × z2).
Se vogliamo considerare solo il gruppo dei Bianchi (z1 = z2 = 0) l’equazionesarà
ŷ = −25.9 + 5.2x + 19.3(0) + 9.3(0)− 2.4x(0)− 1.1x(0) = −25.9 + 5.2x .
Rispettivamente per i Neri (z1 = 1 e z2 = 0,) e gli Ispanici (z1 = 0, z2 = 1)avremo
ŷ = −6.6 + 2.8x .
ŷ = −16.6 + 4.1x .
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 23 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Significato e dei Coefficienti del Modello
Il coeff. di z1 β1 = 19.3 fornisce la differenza tra le intercette del modello perla categoria 1 e quello per la categoria 3
Questa è la differenza, però, solo se x = 0, in quanto le due equazioni hannopendenze differenti
In questo caso contano le interazioni: infatti, il parametro dell’interazionex × z1 = −2.4, misura la differenza tra le pendenze dei due modelli
2.4 = 5.2− 2.8
Sostanzialmente ci dice di quanto diminuisce l’effetto dell’Istruzione sulReddito Annuale per i Neri rispetto ai Bianchi, in quanto esiste un’interazioneIstruzione-Gruppo Etnico
Ovviamente le due rette saranno parallele quando il coefficientedell’interazione è nullo
Stesso discorso per la categoria 2 (Ispanici), il cui coefficiente di interazione èpari a x × z2 = −1.1
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 24 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In sintesi abbiamo il seguente prospetto:
Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni
Diff. dallaCat. 3
Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.
1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0
In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)
I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In sintesi abbiamo il seguente prospetto:
Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni
Diff. dallaCat. 3
Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.
1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0
In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)
I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
In sintesi abbiamo il seguente prospetto:
Tabella: Equazione di Previsione ŷ = −25.9 + 5.2x + 19.3z1 + 9.3z2 −2.4(x × z1)− 1.1(x × z2) con Interazioni
Diff. dallaCat. 3
Cat. y-Int. Pend. Equazione di Previsione y-Int. Pend.
1 −25.9 + 19.3 5.2− 2.4 (−25.9 + 19.3) + (5.2− 2.4)x 19.3 −2.42 −25.9 + 9.3 5.2− 1.1 (−25.9 + 9.3) + (5.2− 1.1)x 9.3 −1.13 −25.9 5.2 −25.9 + 5.2x 0 0
In pratica i valori delle differenze nelle Pendenze, indicano qual è la diminuzione nelReddito Annuale al crescere di un anno nell’Istruzione, per ogni categoria rispetto aquella di riferimento (Bianchi)
I Neri tendono, a parità di Istruzione, a guadagnare meno dei Bianchi, mentre pergli Ispanici tale tendenza è meno forte
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 25 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Graficamente abbiamo:
White
White (y 5 225.9 1 5.2x)
Black
Black (y 5 26.6 1 2.8x)
Hispanic
Hispanic (y 5 216.6 1 4.1x)
ˆ
ˆ
ˆ
Income
Education10
0
20
40
60
80
100
120
15 205
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 26 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X
Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:
(−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .
Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione
In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X
Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:
(−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .
Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione
In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X
Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:
(−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .
Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione
In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
Si può concludere che in un modello con interazioni, le medie della variabilerisposta Y variano in funzione della covariata X
Ad. es., possiamo calcolare la differenza nel Reddito Medio Annuale traBianchi e Ispanici al variare di x in modo semplice:
(−25.9 + 5.2x)− (−16.6 + 4.1x) = −9.3 + 1.1x .
Ciò significa che il differenziale nel Reddito Medio Annuale per le duecategorie è diverso per ogni livello dell’Istruzione
In pratica all’aumentare dell’Istruzione aumenta la differenza nel RedditoMedio Annuale
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 27 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
R o R2 per Confrontare Modelli Diversi
Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R
Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482
Conseguentemente , i Coefficienti di Correlazione Multipla saranno√0.462 = 0.680 e
√0.482 = 0.695
Si osserva chiaramente come l’incremento sia modesto
Quindi introdurre i termini di interazione non aggiunge nulla di importanteper spiegare le relazioni tra i predittori e la variabile risposta
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 28 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
R o R2 per Confrontare Modelli Diversi
Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R
Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482
Conseguentemente , i Coefficienti di Correlazione Multipla saranno√0.462 = 0.680 e
√0.482 = 0.695
Si osserva chiaramente come l’incremento sia modesto
Quindi introdurre i termini di interazione non aggiunge nulla di importanteper spiegare le relazioni tra i predittori e la variabile risposta
Nicola Tedesco (Statistica Sociale) Combinare Regressione e ANOVA: predittori quantitativi e categoriali 28 / 58
-
Modello con Interazioni tra Predittori Quantitativi e Qualitativi
R o R2 per Confrontare Modelli Diversi
Un metodo che consente di capire se l’aggiunta dei termini di interazione e/odegli effetti singoli sia utile, si basa sull’incremento del valore di R2 o quellodel Coefficiente di Correlazione Multipla R
Nel nostro esempio, il modello privo di interazioni mostra un R2 = 0.462,mentre il modello con interazioni mostra un R2 = 0.482
Conseguentemente , i Coefficienti di Correlazione Multipla s
top related