RELAZIONI TRA 2 RELAZIONI TRA 2 FENOMENI QUANTITATIVIFENOMENI QUANTITATIVI
Es: 6 famiglie, ammontare della spesa annua (in Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo euro) per l’acquisto di due generi di largo
consumo: latte fresco e biscotti.consumo: latte fresco e biscotti.
• (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione?
Famiglia
Spesa annua per l’acquisto di latte fresco (€)
Spesa annua per l’acquisto di biscotti (€)
A 105 65
B 190 130
C 80 160
D 120 90
E 240 220
F 60 50
M(x)= 132.5
M(y)=119.2
SoluzioneSoluzione
Famiglia
(xi – Mx) (yi – My) (xi-Mx)×
(yi-My)
(xi-Mx)2 (yi-My)
2
A (105-132.5) (65-119.2) (105-132.5)
(65-119.2)(105-132.5)2 (65-119.2)2
B (190-132.5) (130-119.2) (190-132.5)
(130-119.2)(190-132.5)2 (130-119.2)2
C
D
E
F
Tot.
0 0 16187.5 23787.5 20520.8
2/1
1 1
22
1
)()(
))((
n
i
n
iyixi
n
iyixi
xy
MyMx
MyMxr
73.0
20520.8 23787.5
16187.52/1
xyr
Diagramma di dispersioneDiagramma di dispersione
Diagramma di dispersione in Diagramma di dispersione in termini di scostamenti dalla mediatermini di scostamenti dalla media
Analisi del diagramma di Analisi del diagramma di dispersionedispersione
• Il punto C è un valore anomalo bivariato
• Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti
• rxy senza il punto C è uguale a 0.963
CORRELAZIONE FRA DUE S.S.CORRELAZIONE FRA DUE S.S.
• Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount
• Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile
Anni X Y
1993 72.644 600
1994 85.993 1.300
1995 96.287 1.930
1996 136.942 2.328
1997 140.100 2.523
CORRELAZIONE FRA DUE S.S.CORRELAZIONE FRA DUE S.S.• Esempio: X = numero di extracomunitari iscritti al collocamento, Y =
numero di discount• Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni
percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile
Anni X Y
1993 72.644 600
1994 85.993 1.300
1995 96.287 1.930
1996 136.942 2.328
1997 140.100 2.523
933,0)42,70588,300.27(
36,023.977.17),(
yxxy
YXCOVr
Correlazione spuria relazione tra i livelli
Esempio di correlazione spuriaEsempio di correlazione spuriaN
um
ero
di
dis
cou
nt
(Y)
•Numero di extracomunitari iscritti al collocamento (X)
0
500
1000
1500
2000
2500
3000
60.000 110.000 160.000
Esempio di correlazione spuriaEsempio di correlazione spuriaN
um
ero
di
dis
cou
nt
(Y)
• Correlazione tra le variazioni annue?
•Numero di extracomunitari iscritti al collocamento (X)
Esempio di correlazione spuriaEsempio di correlazione spuria• Numero di
extracomunitari iscritti al collocamento (X)
• Numero di discount (Y)
• Correlazione tra le variazioni annue?
NI base mobile X (numero di NI base mobile X (numero di extracomunitari) e Y (numero di discountextracomunitari) e Y (numero di discount
Anni n. i. base mobile
n. i. base mobile
Var % X
Var % Y Scost media
X
Scost media Y
1993 - -
1994 118,38 216,67 18,38 116,67 -0,34 68,14
1995 111,97 148,46 11,97 48,46 -6,75 -0,07
1996 142,22 120,62 42,22 20,62 23,50 -27,91
1997 102,31 108,38 2,31 8,38 -16,41 -40,16
Media 118,72 148,53 18,72 48,53 0,00 0,00
Var 0,0217 0,1758 0,0217 0,1758 Cov(Nix,NIy)=-0,000496
rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008
Scatter sugli scostamenti NI base mobile o var. Scatter sugli scostamenti NI base mobile o var. percentualipercentuali
-0.34% 68.14%
-6.75% -0.07%
23.50% -27.91%
-16.41% -40.16%
-60.00%
-40.00%
-20.00%
0.00%
20.00%
40.00%
60.00%
80.00%
-20.00% -15.00% -10.00% -5.00% 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00%
III
III IV
Osservazioni finaliOsservazioni finali
• Non esiste relazione lineare tra le variazioni annue di X e Y
• Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti)
Cenni alle analisi multivariateCenni alle analisi multivariate
• p fenomeni quantitativi
• Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni
MATRICE DI COVARIANZA MATRICE DI COVARIANZA (p.169)(p.169)
• p variabili: X1, X2, X3,…, Xs, …, Xp
)(),(),(
),()(),(
),(),()(
21
2212
1211
PPP
P
P
pp
XVARXXCOVXXCOV
XXCOVXVARXXCOV
XXCOVXXCOVXVAR
S
MATRICE DI CORRELAZIONEMATRICE DI CORRELAZIONE
)()(),(YVARXVAR
YXCOVrxy
1
1
1
21
221
112
pp
p
p
pp
rr
rr
rr
R
ESEMPIO MATRICE DI ESEMPIO MATRICE DI COVARIANZACOVARIANZA
• X = età
• Y = anzianità di servizio
• Z = stipendio mensile (in euro)
000.276
736.162
218.473118
Z
Y
X
ZYX
S
MATRICE DI CORRELAZIONEMATRICE DI CORRELAZIONE
8535,062118
73
xyr
1
4197,01
7391,08535,01
Z
Y
X
ZYX
R
000.276
736.162
218.473118
Z
Y
X
ZYX
S
La diapositiva che segue La diapositiva che segue contiene un esercizio da contiene un esercizio da
risolvere risolvere
Es. X= Es. X= tasso di indebitamento delle famiglie, inpercentuale, (X) e del fabbisogno di energia elettrica, in migliaia di
megawatt, (Y) in Italia nel periodo 1998– 2002
anni X Y
1998 27,8 279
1999 31,1 286
2000 32,6 299
2001 32,6 305
2002 35,1 311
LA REGRESSIONE LA REGRESSIONE LINEARELINEARE
LA REGRESSIONE LINEARELA REGRESSIONE LINEARE
• Esiste una relazione (lineare) tra X e Y?
• In caso affermativo:
• Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)?
• Per convenzione:
Y = variabile dipendente
X = variabile esplicativa
EsempiEsempi
• Relazione tra comportamenti di acquisto e caratteristiche dei consumatori
• Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità
• Relazione tra prezzo di vendita e quantità venduta di un bene
Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare
• Semplicità facilità di interpretazione dei parametri
• yi = a + bxi + ei i = 1, …, ndove:• a + bxi rappresenta una retta:• a = ordinata all’origine intercetta• b = coeff. angolare coeff. di
regressione• ei è un termine di errore (accidentale)
Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare
• Effettiva linearità molte relazioni sono molto vicine alla linearità
• Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa
• Es. y = a bx
• log y = log a + (log b) x• y’ = a’ + b’ x
Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare
• Limitatezza dell’intervallo
Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare
• Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole
Diagramma di dispersioneDiagramma di dispersione
• Come variano le vendite in funzione del numero di dipendenti?
0
1
2
3
4
5
6
7
8
0 10 20 30 40
X = N. dipendenti
Y =
ve
nd
ite
MODELLO DI REGRESSIONEMODELLO DI REGRESSIONE
• yi = a + bxi + ei i = 1, …, n
dove:
• a + bxi rappresenta una retta:
• a = ordinata all’origine intercetta
• b = coeff. angolare coeff. di regressione
• ei è un termine di errore (accidentale)
RETTA DI REGRESSIONERETTA DI REGRESSIONE
• i = 1, …, n
ii bxay ˆ
iy = valore teorico (valore stimato) di yi funzione lineare di
i = 1, …, n
Residui
iii yye ˆ
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0 5 10 15 20 25 30 35
N. dipendenti (X)
Fat
tura
to in m
ilio
ni di €
(Y
)Come si calcolano i parametri Come si calcolano i parametri aa e e bb??
Come si calcolano i parametri Come si calcolano i parametri aa e e bb??
• METODO DEI MINIMI QUADRATI
n
i
n
iiii yye
1 1
22 min )ˆ(
Le incognite sono i parametri della retta
ii bxay ˆ
Visualizzazione grafica dei residui Visualizzazione grafica dei residui ((eeii))
Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI
n
i
n
iiii yye
1 1
22 min )ˆ(
n
i
n
iiii bxaye
1 1
22 min )(
01
2
a
en
ii
01
2
b
en
ii
Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI
a
bxay
a
en
iii
n
ii
1
2
1
2 )(
0)1)((21
n
iii bxay
01
n
iie
Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI
b
bxay
b
en
iii
n
ii
1
2
1
2 )(
0))((21
n
iiii xbxay
01
i
n
ii xe
Sistema di equazioni normaliSistema di equazioni normali
n
iie
1
0
n
iiiex
1
0
0)(1
n
iii bxay
0)(1
i
n
iii xbxay
2 equazioni e 2 incognite (2 equazioni e 2 incognite (aa e e bb))
Dalla prima equazione Dalla prima equazione
0)(1
n
iii bxay
n
iii bxyna
1
)(
xbya
Sostituendo il valore trovato di Sostituendo il valore trovato di aa nella seconda equazionenella seconda equazione
0)(1
i
n
iii xbxay
0])([1
i
n
iii xbxxbyy
n
ii
n
iii
xx
yyxxb
1
2
1
)(
))((
xbya
Espressioni alternative per Espressioni alternative per aa e e bb
22
2
)( ii
iiiii
xxn
yxxxya
22 )( ii
iiii
xxn
yxyxnb
ESEMPIO (7 supermercati) ESEMPIO (7 supermercati) rrxyxy=0,96=0,96
N. dipendenti(X)
Fatturatoin milioni di € (Y)
A 10 1,9
B 18 3,1
C 20 3,2
D 8 1,5
E 30 6,2
F 12 2,8
G 14 2,3
Medie
16 3
Calcolo di a e bCalcolo di a e bxi yi xi
2 yi2 xiyi
A 10 1,9 100 3,61 19
B 18 3,1 324 9,61 55,8
C 20 3,2 400 10,24 64
D 8 1,5
E 30 6,2
F 12 2,8
G 14 2,3
Tot. 112 21 2128 77,28 402,6
17,0352.2
2,403
112128.27
6,402112128.2212
a
22
2
)( ii
iiiii
xxn
yxxxya
Calcolo di a e bCalcolo di a e bxi yi xi
2 yi2 xiyi
A 10 1,9 100 3,61 19
B 18 3,1 324 9,61 55,8
C 20 3,2 400 10,24 64
D 8 1,5
E 30 6,2
F 12 2,8
G 14 2,3
Tot. 112 21 2128 77,28 402,6
198,0352.2
2,466
112128.27
211126,40272
b
22 )( ii
iiii
xxn
yxyxnb
Scatter con retta di regressioneScatter con retta di regressione
y = 0,198x - 0,17
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0 5 10 15 20 25 30 35
N. dipendenti (X)
Fa
ttu
rato
in m
ilio
ni d
i € (
Y)
Interpretazione dei parametriInterpretazione dei parametriESEMPIO (7 supermercati)ESEMPIO (7 supermercati)
• a = –0,17 fatturato teorico quando N. di dipendenti = 0
• b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità
Interpretazione di bInterpretazione di b
• b= indica l’entità della variazione
teorica della variabile
dipendente in corrispondenza di
un incremento unitario della
variabile esplicativa
Interpretazione di bInterpretazione di b
• a+bx
• a+b(x+1)
• Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)?
• a+b(x+1)-(a+bx)=b
Sistema di equazioni normaliSistema di equazioni normali
n
iie
1
0
n
iiiex
1
0
0)(1
n
iii bxay
0)(1
i
n
iii xbxay
Analizziamo le implicazioni dei Analizziamo le implicazioni dei due precedenti vincolidue precedenti vincoli
Proprietà delle stime dei minimi Proprietà delle stime dei minimi quadratiquadrati
• Proprietà 1:
• Proprietà 2
n
i
n
iii
n
i
n
iii
n
iiii yyyybxaye
1 11 11
ˆ0)ˆ()(
)(ˆ xbayy • La retta di regressione passa sempre
per il punto di coordinate
yx
Proprietà delle stime dei minimi Proprietà delle stime dei minimi quadratiquadrati
• Proprietà 3:
0)ˆ(11
n
iii
n
iiii exyyx
Calcolo dei valori teorici e dei residuiCalcolo dei valori teorici e dei residui
xi yi Valori teorici Residui
xi ×residuoi
A 10 1,9 -0,17+0,198*10=1,81 0,09 0,89
B 18 3,1 -0,17+0,198*18=3,40 -0,30 -5,34
C 20 3,2 -0,17+0,198*20= 3,79 -0,59 -11,86
D 8 1,5 1,41 0,09 0,69
E 30 6,2 5,78 0,43 12,75
F 12 2,8 2,21 0,59 7,11
G 14 2,3 2,60 -0,30 -4,25
Tot.
112 21 21 0 0
yi=-0,17+0,198xi
n
i
n
iii yy
1 1
ˆ
n
iie
1
0
n
iiiex
1
0
Regressione in termini di Regressione in termini di scostamentiscostamenti
Dato che la sommatoria degli scostamenti dalla media è zero
• Si ottiene che a=0
22
2
)( ii
iiiii
xxn
yxxxya xbya
Modi alternativi di esprimere bModi alternativi di esprimere b
• Dato che
• Si ricava
x
yxyr
XVARYXCOV
b
)(
),(
22 )( ii
iiii
xxn
yxyxnb
ESEMPIO (7 supermercati):ESEMPIO (7 supermercati):
961,0xyr 928,6x 428,1y
198,0928,6428,1
961,0 b
17,016198,03 a
x
yxyr
XVARYXCOV
b
)(
),(
xy bMMa 16 3 xy MM
Es. n. 5.Es. n. 5. 7 famiglie 7 famiglie
Spesa per manifestazioni culturali (Z)
Reddito mensile del capofamiglia (x 1000 Euro)
(Y)
A 200 1,9
B 420 4,0
C 250 2,5
D 70 1,6
E 180 2,2
F 300 2,8
G 100 1,5
• Costruire il diagramma di dispersione
• Calcolare e commentare rYZ
• Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l’esplicativa?
Diagramma di dispersioneDiagramma di dispersione
0
50
100
150
200
250
300
350
400
450
1 1,5 2 2,5 3 3,5 4 4,5
Reditto mensile del capofamiglia (x 1000 Euro) (Y)
Spesa p
er
manifesta
zioni cultura
li (Z)
• rxy=0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali
Diagramma di dispersione con retta Diagramma di dispersione con retta di regressionedi regressione
Z = 134,65Y - 100,24
0
50
100
150
200
250
300
350
400
450
500
1 1,5 2 2,5 3 3,5 4 4,5
Reditto mensile del capofamiglia (x 1000 Euro) (Y)
Spesa p
er m
anifesta
zioni cultura
li
(Z)
0
1
2
3
4
5
6
7
8
0 10 20 30 40
Scomposizione di yScomposizione di y ii
iy
ix
y
x
ie
yyi
xxi
iy)( xxb i
BONTA’ DI ADATTAMENTOBONTA’ DI ADATTAMENTO
• Occorre analizzare i residui )ˆ( iii yye
DEVIANZA RESIDUA
n
i
n
iiii eyyEDEV
1 1
22)ˆ()(
• L’adattamento è buono quando DEV(E) è “piccola”
• Problemi:• DEV(E) cresce all’aumentare del numero di
osservazioni (n)• DEV(E) dipende dall’unità di misura e
dall’ordine di grandezza di Y
In qualsiasi modello di regressione con o senza In qualsiasi modello di regressione con o senza
intercetta è valida la relazione che segueintercetta è valida la relazione che segue
n
ii
n
ii
n
ii eyy
1
2
1
2
1
2 ˆ
•Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0)
0)ˆ(1
n
iiii yyx
DimostrazioneDimostrazione
L’ultimo termine è zero dato che
iii eyy ˆ
22 )ˆ( ii eyyi
iii ebxay
n
iii
n
i
eyyi
1
2
1
2 )ˆ(
n
i
n
iii
n
i
n
i
eyeyyiii
1 11
22
1
2 ˆ2ˆ
01
n
iiiex
n
iie
1
0
Esempio supermercati (continua)Esempio supermercati (continua)
xi yi Valori teorici
Residui
Xi
×residuoi
yi2 (Valori
teorici)2
residui2
A 10 1,9 1,81 0,09 0,89 3.61 3.279 0.008
B 18 3,1 3,40 -0,30 -5,34 9.61 11.536 0.088
C 20 3,2 3,79 -0,59 -11,86 10.24 14.386 0.351
D 8 1,5 1,41 0,09 0,69 2.25 2.000 0.007
E 30 6,2 5,78 0,43 12,75 38.44 33.351 0.181
F 12 2,8 2,21 0,59 7,11 7.84 4.871 0.351
G 14 2,3 2,60 -0,30 -4,25 5.29 6.779 0.092Tot. 112 21 21 0 0 77.28 76.201 1.079
yi=-0,17+0,198xi
n
ii
n
ii
n
ii eyy
1
2
1
2
1
2 ˆ 77.28=76.201+1.079
Indice di bontà di adattamento nei modelli di Indice di bontà di adattamento nei modelli di regressione senza intercetta regressione senza intercetta
n
ii
n
ii
n
ii
n
ii
y
e
y
y
1
2
1
2
1
2
1
2
1
ˆ
n
ii
n
ii
n
ii eyy
1
2
1
2
1
2 ˆ
Varia nell’intervallo [0 1]Varia nell’intervallo [0 1]
BONTA’ DI ADATTAMENTOBONTA’ DI ADATTAMENTO
• Retta di regressione: ii bxay ˆ
DEVIANZA TOTALE
n
iyi MyYDEV
1
2)()( DEVIANZA DI REGRESSIONE
n
iyi MyYDEV
1
2)ˆ()ˆ(DEVIANZA RESIDUA
n
i
n
iiii eyyEDEV
1 1
22)ˆ()(
Scomposizione della devianza di Scomposizione della devianza di Y Y (modelli di regressione con (modelli di regressione con
intercetta)intercetta)
)()ˆ()( EDEVYDEVYDEV
• Proprietà 1
n
ii
n
i
n
iii eyy
11 1
0ˆ
• Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati
0)ˆ(1
n
iiii yyx
• Proprietà 3
DimostrazioneDimostrazione
n
ii yyYDEV
1
2)()(
n
iiii yyyy
1
2)ˆˆ(
n
iiii
n
iii
n
ii yyyyyyyy
11
2
1
2 )ˆ)(ˆ(2)ˆ()ˆ(
n
iii eyyEDEVYDEV
1
)ˆ(2)()ˆ(
n
ii
n
iii eyeyEDEVYDEV
11
2ˆ2)()ˆ(
Indice di determinazione lineareIndice di determinazione lineare (R(R22) )
)()(
1)()ˆ(
YDEVEDEV
YDEVYDEV
0)ˆ( 2ii yy
=1 se
=0 se 0)ˆ( 2yi My
Calcolo di RCalcolo di R2 2 ((δδ))
• DEV(Y) = 7(1,428)2 =14,28
My = 3
xi
yi
A 10 1,9 1,81 0.008 1,416B 18 3,1 3,394 0.088 0,155C 20 3,2 3,79 0.351 0,624D 8 1,5 1,414 0.007 E 30 6,2 5,77 0.181 F 12 2,8 2,206 0.351 G 14 2,3 2,602 0.092 Tot. 112 21 21 1,079 13,201
iy2)ˆ( yi My 2
ie
10*0,198 0,17- ˆ1 y
DevTOT=DevREGR+DevRES
14,28 = 13,201 + 1,079924,0
28,14
079,11
28,14
201,13
Esempio 7 supermercati (continua)Esempio 7 supermercati (continua)
Relazione tra indice di Relazione tra indice di determinazione determinazione δδ e coefficiente di e coefficiente di
correlazione lineare rcorrelazione lineare rxyxy
• δ = rxy2
• Nell’esempio precedente
= (0,9615)2 = 0,924924,028,14
079,11
28,14
201,13
Relazione tra Relazione tra δδ e r e rxyxy
)(
)ˆ(
YDEV
YDEV
n
ii
n
ii
yy
yy
1
2
1
2
)(
)ˆ(
n
ii
n
ii
yy
xbabxa
1
2
1
2
)(
))((
)var(
)var(
)(
)(2
1
2
1
22
Y
Xb
yy
xxb
n
ii
n
ii
)var(
)var(
)var(
),cov(2
2
Y
X
X
YX
)var()var(
),cov( 2
YX
YX 2
xyr
xi
Residui
A 10 0,09
B 18 -0,30
C 20 -0,59
D 8 0,09
E 30 0,43
F 12 0,59
G 14 -0,30
Tot. 112 0
Esempio 7 supermercati (continua). Esempio 7 supermercati (continua). Diagnostiche sui residuiDiagnostiche sui residui
-1
-0.5
0
0.5
1
0 10 20 30 40
N. dipendenti
Res
idui
• Modello soddisfacente: distribuzione casuale dei residui → componente erratica
ESTRAPOLAZIONEESTRAPOLAZIONE
• Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa.
• CONDIZIONI– Validità della retta di regressione ( prossimo ad
1)– valore noto della variabile esplicativa non
lontano dai valori utilizzati nel calcolo della retta
ESEMPIO (Es. 4.14 Eserciziario)ESEMPIO (Es. 4.14 Eserciziario)•Y = contenuto nell’aria di un inquinante (microgrammi per m3)•X = numero di imprese manifatturiere con più di 20 addetti
Città Y X
A 13 91
B 12 453
C 17 254
D 56 412
E 29 334
F 35 428
G 49 341
H 27 125
Retta di regressione di Y in funzione di XBontà di adattamento Diagramma di dispersione
Dalle formule (o calcolatrice o Dalle formule (o calcolatrice o Excel)Excel)
• a = 15,31• b = 0,0474• Interpretazione
5,1853)( YDEV 2,295)ˆ( YDEV
159,05,1853
2,295
339,0xyr
• oppure
159,0)339,0( 2 Adattamento scadente
Scatter (x,y) con retta di regressioneScatter (x,y) con retta di regressione
0
10
20
30
40
50
60
0 100 200 300 400 500 600
N. imprese manifatturiere (X)
Co
nte
nu
to i
nq
uin
an
te (
Y)
Esercizio: giocatori titolari d’una squadra di pallavolo: Esercizio: giocatori titolari d’una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in la seguente tabella riporta il numero di punti segnati in
attacco ed il numero di punti segnati a muro in una attacco ed il numero di punti segnati a muro in una partita.partita.
Giocatore Punti segnati in attacco Punti segnati a muro
A 14 4
B 10 3
C 4 1
D 15 1
E 18 2
F 9 5
•Calcolare rxy e commentarlo•Diagramma di dispersione.•Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di rxy. C’è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate?
L’INTERPOLAZIONE DI UNA L’INTERPOLAZIONE DI UNA
SERIE STORICASERIE STORICA
ESEMPIOESEMPIOAnni t
% di persone il cui pasto principale è il pranzo
1993 1 69,3
1994 2 69,4
1995 3 66,9
1996 4 65,6
1997 5 64,1
1998 6 63,3
1999 7 61,6
2000 8 59,2
Esempio: Percentuale di persone il cui Esempio: Percentuale di persone il cui pasto principale è il pranzopasto principale è il pranzo
55
60
65
70
75
0 2 4 6 8 10
t
%
Obiettivo: stima del trend con una funzione (retta)
Regressione in cui:Regressione in cui:
• Variabile dipendente: fenomeno di cui si stima il trend (Y)
• Variabile esplicativa: tempo successione convenzionale:
t = 1; t = 2; … t = T
Tempi Valori di Y
1 y1
… …
t yt
… …
T yT
Funzione interpolante lineare:Funzione interpolante lineare:
• Stima parametri: metodo dei minimi quadrati
• Interpretazione parametri
btayt ˆ
btayt ˆ
Stima parametri: metodo dei Stima parametri: metodo dei minimi quadratiminimi quadrati
22
2
)( ttT
tyttya tt
22
2
)( ii
iiiii
xxn
yxxxya
btayt ˆ
ii bxay ˆ
Stima parametri: metodo dei Stima parametri: metodo dei minimi quadratiminimi quadrati
22 )( ttT
ytytTb ttbtayt ˆ
ii bxay ˆ
22 )( ii
iiii
xxn
yxyxnb
Interpretazione parametriInterpretazione parametri
• a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato) l’intercetta ha sempre un significato operativo
• b = variazione teorica media da un tempo al successivo
ESEMPIOESEMPIO
• a = 71,46 b = –1,45Funzione interpolante:
Anni t% di persone il cui pasto principale è il
pranzo
1993 1 69,3
1994 2 69,4
1995 3 66,9
1996 4 65,6
1997 5 64,1
1998 6 63,3
1999 7 61,6
2000 8 59,2
tyt 45,146,71ˆ Interpretazione
Bontà di adattamento:Bontà di adattamento:
• Previsione di valori futuri
988,0xy
r 977,0)988,0( 2
,21per ˆ , T Tt btayt• Esempio: % stimata di persone il cui
pasto principale è il pranzo nel 2001 (t=9):
%41,58945,146,71ˆ ty
Condizioni per la validità della Condizioni per la validità della proiezioneproiezione
elevato
• Mantenimento nel futuro delle condizioni che hanno determinato l’andamento passato funz. interpolante lineare: variazioni di ammontare costante b
Significato della proiezioneSignificato della proiezione
• I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno.
Esempio (Es. 4.24 eserciziario)Esempio (Es. 4.24 eserciziario)
• Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995:
anni Y
1981 325
1983 327
1985 329
1987 332
1989 335
1991 338
1993 340
1995 343
• Grafico della serie storica.• Calcolo dei parametri della
funzione interpolante lineare
• Bontà di adattamento• Valore previsto della
concentrazione di anidride carbonica nel 2005
Grafico della serie storica.Grafico della serie storica.
324
326
328
330
332
334
336
338
340
342
344
1980 1985 1990 1995 2000
anni
con
cen
traz
ion
e C
02
(Y)
Scelta della scala
anni biennale annuale Y
1981 1 1 325
1983 2 3 327
1985 3 5 329
1987 4 7 332
1989 5 9 335
1991 6 11 338
1993 7 13 340
1995 8 15 343
Calcolo dei parametri della funzione Calcolo dei parametri della funzione interpolante lineareinterpolante lineare
• Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15
ty t 631,2786,321ˆ
ty t 3155,1101,323ˆ Interpretazione
• Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8
Relazione tra le due intercetteRelazione tra le due intercette
• Scala annuale 323,101 = valore teorico al tempo t = 1980
ty t 631,2786,321ˆ
ty t 3155,1101,323ˆ
• Scala biennale 321,786 = valore teorico al 1979
anni
1981
1983
1985
1987
1989
1991
1993
1995
Relazione tra le due intercetteRelazione tra le due intercette
• 321,786= valore teorico1979= valore teorico1980- variazione teorica da un anno al successivo
• variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale
• 321,786=323,101-1,3155
Bontà di adattamentoBontà di adattamento
• In entrambi i casi: = 0,996
Adattamento quasi perfetto
Previsione al 2005Previsione al 2005
• Scala biennale (t = 13)
• Scala annuale (t = 25)
35613631,2786,321ˆ ty
356253155,1101,323ˆ ty
Significato e limiti della previsione
anni biennale annuale
1981 1 1
1983 2 3
1985 3 5
1987 4 7
1989 5 9
1991 6 11
1993 7 13
1995 8 15
… … …
2005 13 25
Esercizio: idrocarburi estratti Esercizio: idrocarburi estratti (in milioni di tonnellate)(in milioni di tonnellate)
n. 13 (integrativi)n. 13 (integrativi)
Serie storica delle quantità estratte Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998di idrocarburi dal 1986 al 1998
• Adottando un’opportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo
• Significato e bontà di adattamento
• Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile
Anno Idrocarburi estratti
1986 15,4
1988 18,3
1990 18,3
1992 18,6
1994 19,8
1996 19,7
1998 19,1