relazioni tra 2 fenomeni quantitativi. es: 6 famiglie, ammontare della spesa annua (in euro) per...

Post on 01-May-2015

217 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

RELAZIONI TRA 2 RELAZIONI TRA 2 FENOMENI QUANTITATIVIFENOMENI QUANTITATIVI

Es: 6 famiglie, ammontare della spesa annua (in Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo euro) per l’acquisto di due generi di largo

consumo: latte fresco e biscotti.consumo: latte fresco e biscotti.

• (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione?

Famiglia

Spesa annua per l’acquisto di latte fresco (€)

Spesa annua per l’acquisto di biscotti (€)

A 105 65

B 190 130

C 80 160

D 120 90

E 240 220

F 60 50

M(x)= 132.5

M(y)=119.2

SoluzioneSoluzione

Famiglia

(xi – Mx) (yi – My) (xi-Mx)×

(yi-My)

(xi-Mx)2 (yi-My)

2

A (105-132.5) (65-119.2) (105-132.5)

(65-119.2)(105-132.5)2 (65-119.2)2

B (190-132.5) (130-119.2) (190-132.5)

(130-119.2)(190-132.5)2 (130-119.2)2

C

D

E

F

Tot.

0 0 16187.5 23787.5 20520.8

2/1

1 1

22

1

)()(

))((

n

i

n

iyixi

n

iyixi

xy

MyMx

MyMxr

73.0

20520.8 23787.5

16187.52/1

xyr

Diagramma di dispersioneDiagramma di dispersione

Diagramma di dispersione in Diagramma di dispersione in termini di scostamenti dalla mediatermini di scostamenti dalla media

Analisi del diagramma di Analisi del diagramma di dispersionedispersione

• Il punto C è un valore anomalo bivariato

• Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti

• rxy senza il punto C è uguale a 0.963

CORRELAZIONE FRA DUE S.S.CORRELAZIONE FRA DUE S.S.

• Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount

• Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile

Anni X Y

1993 72.644 600

1994 85.993 1.300

1995 96.287 1.930

1996 136.942 2.328

1997 140.100 2.523

CORRELAZIONE FRA DUE S.S.CORRELAZIONE FRA DUE S.S.• Esempio: X = numero di extracomunitari iscritti al collocamento, Y =

numero di discount• Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni

percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile

Anni X Y

1993 72.644 600

1994 85.993 1.300

1995 96.287 1.930

1996 136.942 2.328

1997 140.100 2.523

933,0)42,70588,300.27(

36,023.977.17),(

yxxy

YXCOVr

Correlazione spuria relazione tra i livelli

Esempio di correlazione spuriaEsempio di correlazione spuriaN

um

ero

di

dis

cou

nt

(Y)

•Numero di extracomunitari iscritti al collocamento (X)

0

500

1000

1500

2000

2500

3000

60.000 110.000 160.000

Esempio di correlazione spuriaEsempio di correlazione spuriaN

um

ero

di

dis

cou

nt

(Y)

• Correlazione tra le variazioni annue?

•Numero di extracomunitari iscritti al collocamento (X)

Esempio di correlazione spuriaEsempio di correlazione spuria• Numero di

extracomunitari iscritti al collocamento (X)

• Numero di discount (Y)

• Correlazione tra le variazioni annue?

NI base mobile X (numero di NI base mobile X (numero di extracomunitari) e Y (numero di discountextracomunitari) e Y (numero di discount

Anni n. i. base mobile

n. i. base mobile

Var % X

Var % Y Scost media

X

Scost media Y

1993 - -

1994 118,38 216,67 18,38 116,67 -0,34 68,14

1995 111,97 148,46 11,97 48,46 -6,75 -0,07

1996 142,22 120,62 42,22 20,62 23,50 -27,91

1997 102,31 108,38 2,31 8,38 -16,41 -40,16

Media 118,72 148,53 18,72 48,53 0,00 0,00

Var 0,0217 0,1758 0,0217 0,1758 Cov(Nix,NIy)=-0,000496

rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008

Scatter sugli scostamenti NI base mobile o var. Scatter sugli scostamenti NI base mobile o var. percentualipercentuali

-0.34% 68.14%

-6.75% -0.07%

23.50% -27.91%

-16.41% -40.16%

-60.00%

-40.00%

-20.00%

0.00%

20.00%

40.00%

60.00%

80.00%

-20.00% -15.00% -10.00% -5.00% 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00%

III

III IV

Osservazioni finaliOsservazioni finali

• Non esiste relazione lineare tra le variazioni annue di X e Y

• Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti)

Cenni alle analisi multivariateCenni alle analisi multivariate

• p fenomeni quantitativi

• Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni

MATRICE DI COVARIANZA MATRICE DI COVARIANZA (p.169)(p.169)

• p variabili: X1, X2, X3,…, Xs, …, Xp

)(),(),(

),()(),(

),(),()(

21

2212

1211

PPP

P

P

pp

XVARXXCOVXXCOV

XXCOVXVARXXCOV

XXCOVXXCOVXVAR

S

MATRICE DI CORRELAZIONEMATRICE DI CORRELAZIONE

)()(),(YVARXVAR

YXCOVrxy

1

1

1

21

221

112

pp

p

p

pp

rr

rr

rr

R

ESEMPIO MATRICE DI ESEMPIO MATRICE DI COVARIANZACOVARIANZA

• X = età

• Y = anzianità di servizio

• Z = stipendio mensile (in euro)

000.276

736.162

218.473118

Z

Y

X

ZYX

S

MATRICE DI CORRELAZIONEMATRICE DI CORRELAZIONE

8535,062118

73

xyr

1

4197,01

7391,08535,01

Z

Y

X

ZYX

R

000.276

736.162

218.473118

Z

Y

X

ZYX

S

La diapositiva che segue La diapositiva che segue contiene un esercizio da contiene un esercizio da

risolvere risolvere

Es. X= Es. X= tasso di indebitamento delle famiglie, inpercentuale, (X) e del fabbisogno di energia elettrica, in migliaia di

megawatt, (Y) in Italia nel periodo 1998– 2002

anni X Y

1998 27,8 279

1999 31,1 286

2000 32,6 299

2001 32,6 305

2002 35,1 311

LA REGRESSIONE LA REGRESSIONE LINEARELINEARE

LA REGRESSIONE LINEARELA REGRESSIONE LINEARE

• Esiste una relazione (lineare) tra X e Y?

• In caso affermativo:

• Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)?

• Per convenzione:

Y = variabile dipendente

X = variabile esplicativa

EsempiEsempi

• Relazione tra comportamenti di acquisto e caratteristiche dei consumatori

• Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità

• Relazione tra prezzo di vendita e quantità venduta di un bene

Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare

• Semplicità facilità di interpretazione dei parametri

• yi = a + bxi + ei i = 1, …, ndove:• a + bxi rappresenta una retta:• a = ordinata all’origine intercetta• b = coeff. angolare coeff. di

regressione• ei è un termine di errore (accidentale)

Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare

• Effettiva linearità molte relazioni sono molto vicine alla linearità

• Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa

• Es. y = a bx

• log y = log a + (log b) x• y’ = a’ + b’ x

Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare

• Limitatezza dell’intervallo

Motivi che spingono ad adottare Motivi che spingono ad adottare modelli di regressione linearemodelli di regressione lineare

• Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole

Diagramma di dispersioneDiagramma di dispersione

• Come variano le vendite in funzione del numero di dipendenti?

0

1

2

3

4

5

6

7

8

0 10 20 30 40

X = N. dipendenti

Y =

ve

nd

ite

MODELLO DI REGRESSIONEMODELLO DI REGRESSIONE

• yi = a + bxi + ei i = 1, …, n

dove:

• a + bxi rappresenta una retta:

• a = ordinata all’origine intercetta

• b = coeff. angolare coeff. di regressione

• ei è un termine di errore (accidentale)

RETTA DI REGRESSIONERETTA DI REGRESSIONE

• i = 1, …, n

ii bxay ˆ

iy = valore teorico (valore stimato) di yi funzione lineare di

i = 1, …, n

Residui

iii yye ˆ

0,0

1,0

2,0

3,0

4,0

5,0

6,0

7,0

0 5 10 15 20 25 30 35

N. dipendenti (X)

Fat

tura

to in m

ilio

ni di €

(Y

)Come si calcolano i parametri Come si calcolano i parametri aa e e bb??

Come si calcolano i parametri Come si calcolano i parametri aa e e bb??

• METODO DEI MINIMI QUADRATI

n

i

n

iiii yye

1 1

22 min )ˆ(

Le incognite sono i parametri della retta

ii bxay ˆ

Visualizzazione grafica dei residui Visualizzazione grafica dei residui ((eeii))

Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI

n

i

n

iiii yye

1 1

22 min )ˆ(

n

i

n

iiii bxaye

1 1

22 min )(

01

2

a

en

ii

01

2

b

en

ii

Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI

a

bxay

a

en

iii

n

ii

1

2

1

2 )(

0)1)((21

n

iii bxay

01

n

iie

Come si calcolano i parametri Come si calcolano i parametri aa e e bb??• METODO DEI MINIMI QUADRATI

b

bxay

b

en

iii

n

ii

1

2

1

2 )(

0))((21

n

iiii xbxay

01

i

n

ii xe

Sistema di equazioni normaliSistema di equazioni normali

n

iie

1

0

n

iiiex

1

0

0)(1

n

iii bxay

0)(1

i

n

iii xbxay

2 equazioni e 2 incognite (2 equazioni e 2 incognite (aa e e bb))

Dalla prima equazione Dalla prima equazione

0)(1

n

iii bxay

n

iii bxyna

1

)(

xbya

Sostituendo il valore trovato di Sostituendo il valore trovato di aa nella seconda equazionenella seconda equazione

0)(1

i

n

iii xbxay

0])([1

i

n

iii xbxxbyy

n

ii

n

iii

xx

yyxxb

1

2

1

)(

))((

xbya

Espressioni alternative per Espressioni alternative per aa e e bb

22

2

)( ii

iiiii

xxn

yxxxya

22 )( ii

iiii

xxn

yxyxnb

ESEMPIO (7 supermercati) ESEMPIO (7 supermercati) rrxyxy=0,96=0,96

N. dipendenti(X)

Fatturatoin milioni di € (Y)

A 10 1,9

B 18 3,1

C 20 3,2

D 8 1,5

E 30 6,2

F 12 2,8

G 14 2,3

Medie

16 3

Calcolo di a e bCalcolo di a e bxi yi xi

2 yi2 xiyi

A 10 1,9 100 3,61 19

B 18 3,1 324 9,61 55,8

C 20 3,2 400 10,24 64

D 8 1,5

E 30 6,2

F 12 2,8

G 14 2,3

Tot. 112 21 2128 77,28 402,6

17,0352.2

2,403

112128.27

6,402112128.2212

a

22

2

)( ii

iiiii

xxn

yxxxya

Calcolo di a e bCalcolo di a e bxi yi xi

2 yi2 xiyi

A 10 1,9 100 3,61 19

B 18 3,1 324 9,61 55,8

C 20 3,2 400 10,24 64

D 8 1,5

E 30 6,2

F 12 2,8

G 14 2,3

Tot. 112 21 2128 77,28 402,6

198,0352.2

2,466

112128.27

211126,40272

b

22 )( ii

iiii

xxn

yxyxnb

Scatter con retta di regressioneScatter con retta di regressione

y = 0,198x - 0,17

0,0

1,0

2,0

3,0

4,0

5,0

6,0

7,0

0 5 10 15 20 25 30 35

N. dipendenti (X)

Fa

ttu

rato

in m

ilio

ni d

i € (

Y)

Interpretazione dei parametriInterpretazione dei parametriESEMPIO (7 supermercati)ESEMPIO (7 supermercati)

• a = –0,17 fatturato teorico quando N. di dipendenti = 0

• b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità

Interpretazione di bInterpretazione di b

• b= indica l’entità della variazione

teorica della variabile

dipendente in corrispondenza di

un incremento unitario della

variabile esplicativa

Interpretazione di bInterpretazione di b

• a+bx

• a+b(x+1)

• Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)?

• a+b(x+1)-(a+bx)=b

Sistema di equazioni normaliSistema di equazioni normali

n

iie

1

0

n

iiiex

1

0

0)(1

n

iii bxay

0)(1

i

n

iii xbxay

Analizziamo le implicazioni dei Analizziamo le implicazioni dei due precedenti vincolidue precedenti vincoli

Proprietà delle stime dei minimi Proprietà delle stime dei minimi quadratiquadrati

• Proprietà 1:

• Proprietà 2

n

i

n

iii

n

i

n

iii

n

iiii yyyybxaye

1 11 11

ˆ0)ˆ()(

)(ˆ xbayy • La retta di regressione passa sempre

per il punto di coordinate

yx

Proprietà delle stime dei minimi Proprietà delle stime dei minimi quadratiquadrati

• Proprietà 3:

0)ˆ(11

n

iii

n

iiii exyyx

Calcolo dei valori teorici e dei residuiCalcolo dei valori teorici e dei residui

xi yi Valori teorici Residui

xi ×residuoi

A 10 1,9 -0,17+0,198*10=1,81 0,09 0,89

B 18 3,1 -0,17+0,198*18=3,40 -0,30 -5,34

C 20 3,2 -0,17+0,198*20= 3,79 -0,59 -11,86

D 8 1,5 1,41 0,09 0,69

E 30 6,2 5,78 0,43 12,75

F 12 2,8 2,21 0,59 7,11

G 14 2,3 2,60 -0,30 -4,25

Tot.

112 21 21 0 0

yi=-0,17+0,198xi

n

i

n

iii yy

1 1

ˆ

n

iie

1

0

n

iiiex

1

0

Regressione in termini di Regressione in termini di scostamentiscostamenti

Dato che la sommatoria degli scostamenti dalla media è zero

• Si ottiene che a=0

22

2

)( ii

iiiii

xxn

yxxxya xbya

Modi alternativi di esprimere bModi alternativi di esprimere b

• Dato che

• Si ricava

x

yxyr

XVARYXCOV

b

)(

),(

22 )( ii

iiii

xxn

yxyxnb

ESEMPIO (7 supermercati):ESEMPIO (7 supermercati):

961,0xyr 928,6x 428,1y

198,0928,6428,1

961,0 b

17,016198,03 a

x

yxyr

XVARYXCOV

b

)(

),(

xy bMMa 16 3 xy MM

Es. n. 5.Es. n. 5. 7 famiglie 7 famiglie

Spesa per manifestazioni culturali (Z)

Reddito mensile del capofamiglia (x 1000 Euro)

(Y)

A 200 1,9

B 420 4,0

C 250 2,5

D 70 1,6

E 180 2,2

F 300 2,8

G 100 1,5

• Costruire il diagramma di dispersione

• Calcolare e commentare rYZ

• Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l’esplicativa?

Diagramma di dispersioneDiagramma di dispersione

0

50

100

150

200

250

300

350

400

450

1 1,5 2 2,5 3 3,5 4 4,5

Reditto mensile del capofamiglia (x 1000 Euro) (Y)

Spesa p

er

manifesta

zioni cultura

li (Z)

• rxy=0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali

Diagramma di dispersione con retta Diagramma di dispersione con retta di regressionedi regressione

Z = 134,65Y - 100,24

0

50

100

150

200

250

300

350

400

450

500

1 1,5 2 2,5 3 3,5 4 4,5

Reditto mensile del capofamiglia (x 1000 Euro) (Y)

Spesa p

er m

anifesta

zioni cultura

li

(Z)

0

1

2

3

4

5

6

7

8

0 10 20 30 40

Scomposizione di yScomposizione di y ii

iy

ix

y

x

ie

yyi

xxi

iy)( xxb i

BONTA’ DI ADATTAMENTOBONTA’ DI ADATTAMENTO

• Occorre analizzare i residui )ˆ( iii yye

DEVIANZA RESIDUA

n

i

n

iiii eyyEDEV

1 1

22)ˆ()(

• L’adattamento è buono quando DEV(E) è “piccola”

• Problemi:• DEV(E) cresce all’aumentare del numero di

osservazioni (n)• DEV(E) dipende dall’unità di misura e

dall’ordine di grandezza di Y

In qualsiasi modello di regressione con o senza In qualsiasi modello di regressione con o senza

intercetta è valida la relazione che segueintercetta è valida la relazione che segue

n

ii

n

ii

n

ii eyy

1

2

1

2

1

2 ˆ

•Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0)

0)ˆ(1

n

iiii yyx

DimostrazioneDimostrazione

L’ultimo termine è zero dato che

iii eyy ˆ

22 )ˆ( ii eyyi

iii ebxay

n

iii

n

i

eyyi

1

2

1

2 )ˆ(

n

i

n

iii

n

i

n

i

eyeyyiii

1 11

22

1

2 ˆ2ˆ

01

n

iiiex

n

iie

1

0

Esempio supermercati (continua)Esempio supermercati (continua)

xi yi Valori teorici

Residui

Xi

×residuoi

yi2 (Valori

teorici)2

residui2

A 10 1,9 1,81 0,09 0,89 3.61 3.279 0.008

B 18 3,1 3,40 -0,30 -5,34 9.61 11.536 0.088

C 20 3,2 3,79 -0,59 -11,86 10.24 14.386 0.351

D 8 1,5 1,41 0,09 0,69 2.25 2.000 0.007

E 30 6,2 5,78 0,43 12,75 38.44 33.351 0.181

F 12 2,8 2,21 0,59 7,11 7.84 4.871 0.351

G 14 2,3 2,60 -0,30 -4,25 5.29 6.779 0.092Tot. 112 21 21 0 0 77.28 76.201 1.079

yi=-0,17+0,198xi

n

ii

n

ii

n

ii eyy

1

2

1

2

1

2 ˆ 77.28=76.201+1.079

Indice di bontà di adattamento nei modelli di Indice di bontà di adattamento nei modelli di regressione senza intercetta regressione senza intercetta

n

ii

n

ii

n

ii

n

ii

y

e

y

y

1

2

1

2

1

2

1

2

1

ˆ

n

ii

n

ii

n

ii eyy

1

2

1

2

1

2 ˆ

Varia nell’intervallo [0 1]Varia nell’intervallo [0 1]

BONTA’ DI ADATTAMENTOBONTA’ DI ADATTAMENTO

• Retta di regressione: ii bxay ˆ

DEVIANZA TOTALE

n

iyi MyYDEV

1

2)()( DEVIANZA DI REGRESSIONE

n

iyi MyYDEV

1

2)ˆ()ˆ(DEVIANZA RESIDUA

n

i

n

iiii eyyEDEV

1 1

22)ˆ()(

Scomposizione della devianza di Scomposizione della devianza di Y Y (modelli di regressione con (modelli di regressione con

intercetta)intercetta)

)()ˆ()( EDEVYDEVYDEV

• Proprietà 1

n

ii

n

i

n

iii eyy

11 1

• Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati

0)ˆ(1

n

iiii yyx

• Proprietà 3

DimostrazioneDimostrazione

n

ii yyYDEV

1

2)()(

n

iiii yyyy

1

2)ˆˆ(

n

iiii

n

iii

n

ii yyyyyyyy

11

2

1

2 )ˆ)(ˆ(2)ˆ()ˆ(

n

iii eyyEDEVYDEV

1

)ˆ(2)()ˆ(

n

ii

n

iii eyeyEDEVYDEV

11

2ˆ2)()ˆ(

Indice di determinazione lineareIndice di determinazione lineare (R(R22) )

)()(

1)()ˆ(

YDEVEDEV

YDEVYDEV

0)ˆ( 2ii yy

=1 se

=0 se 0)ˆ( 2yi My

Calcolo di RCalcolo di R2 2 ((δδ))

• DEV(Y) = 7(1,428)2 =14,28

My = 3

  xi

yi

A 10 1,9 1,81 0.008 1,416B 18 3,1 3,394 0.088 0,155C 20 3,2 3,79 0.351 0,624D 8 1,5 1,414 0.007 E 30 6,2 5,77 0.181 F 12 2,8 2,206 0.351 G 14 2,3 2,602 0.092 Tot. 112 21 21 1,079 13,201

iy2)ˆ( yi My 2

ie

10*0,198 0,17- ˆ1 y

DevTOT=DevREGR+DevRES

14,28 = 13,201 + 1,079924,0

28,14

079,11

28,14

201,13

Esempio 7 supermercati (continua)Esempio 7 supermercati (continua)

Relazione tra indice di Relazione tra indice di determinazione determinazione δδ e coefficiente di e coefficiente di

correlazione lineare rcorrelazione lineare rxyxy

• δ = rxy2

• Nell’esempio precedente

= (0,9615)2 = 0,924924,028,14

079,11

28,14

201,13

Relazione tra Relazione tra δδ e r e rxyxy

)(

)ˆ(

YDEV

YDEV

n

ii

n

ii

yy

yy

1

2

1

2

)(

)ˆ(

n

ii

n

ii

yy

xbabxa

1

2

1

2

)(

))((

)var(

)var(

)(

)(2

1

2

1

22

Y

Xb

yy

xxb

n

ii

n

ii

)var(

)var(

)var(

),cov(2

2

Y

X

X

YX

)var()var(

),cov( 2

YX

YX 2

xyr

  xi

Residui

A 10 0,09

B 18 -0,30

C 20 -0,59

D 8 0,09

E 30 0,43

F 12 0,59

G 14 -0,30

Tot. 112 0

Esempio 7 supermercati (continua). Esempio 7 supermercati (continua). Diagnostiche sui residuiDiagnostiche sui residui

-1

-0.5

0

0.5

1

0 10 20 30 40

N. dipendenti

Res

idui

• Modello soddisfacente: distribuzione casuale dei residui → componente erratica

ESTRAPOLAZIONEESTRAPOLAZIONE

• Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa.

• CONDIZIONI– Validità della retta di regressione ( prossimo ad

1)– valore noto della variabile esplicativa non

lontano dai valori utilizzati nel calcolo della retta

ESEMPIO (Es. 4.14 Eserciziario)ESEMPIO (Es. 4.14 Eserciziario)•Y = contenuto nell’aria di un inquinante (microgrammi per m3)•X = numero di imprese manifatturiere con più di 20 addetti

Città Y X

A 13 91

B 12 453

C 17 254

D 56 412

E 29 334

F 35 428

G 49 341

H 27 125

Retta di regressione di Y in funzione di XBontà di adattamento Diagramma di dispersione

Dalle formule (o calcolatrice o Dalle formule (o calcolatrice o Excel)Excel)

• a = 15,31• b = 0,0474• Interpretazione

5,1853)( YDEV 2,295)ˆ( YDEV

159,05,1853

2,295

339,0xyr

• oppure

159,0)339,0( 2 Adattamento scadente

Scatter (x,y) con retta di regressioneScatter (x,y) con retta di regressione

0

10

20

30

40

50

60

0 100 200 300 400 500 600

N. imprese manifatturiere (X)

Co

nte

nu

to i

nq

uin

an

te (

Y)

Esercizio: giocatori titolari d’una squadra di pallavolo: Esercizio: giocatori titolari d’una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in la seguente tabella riporta il numero di punti segnati in

attacco ed il numero di punti segnati a muro in una attacco ed il numero di punti segnati a muro in una partita.partita.

Giocatore Punti segnati in attacco Punti segnati a muro

A 14 4

B 10 3

C 4 1

D 15 1

E 18 2

F 9 5

•Calcolare rxy e commentarlo•Diagramma di dispersione.•Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di rxy. C’è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate?

L’INTERPOLAZIONE DI UNA L’INTERPOLAZIONE DI UNA

SERIE STORICASERIE STORICA

ESEMPIOESEMPIOAnni t

% di persone il cui pasto principale è il pranzo

1993 1 69,3

1994 2 69,4

1995 3 66,9

1996 4 65,6

1997 5 64,1

1998 6 63,3

1999 7 61,6

2000 8 59,2

Esempio: Percentuale di persone il cui Esempio: Percentuale di persone il cui pasto principale è il pranzopasto principale è il pranzo

55

60

65

70

75

0 2 4 6 8 10

t

%

Obiettivo: stima del trend con una funzione (retta)

Regressione in cui:Regressione in cui:

• Variabile dipendente: fenomeno di cui si stima il trend (Y)

• Variabile esplicativa: tempo successione convenzionale:

t = 1; t = 2; … t = T

Tempi Valori di Y

1 y1

… …

t yt

… …

T yT

Funzione interpolante lineare:Funzione interpolante lineare:

• Stima parametri: metodo dei minimi quadrati

• Interpretazione parametri

btayt ˆ

btayt ˆ

Stima parametri: metodo dei Stima parametri: metodo dei minimi quadratiminimi quadrati

22

2

)( ttT

tyttya tt

22

2

)( ii

iiiii

xxn

yxxxya

btayt ˆ

ii bxay ˆ

Stima parametri: metodo dei Stima parametri: metodo dei minimi quadratiminimi quadrati

22 )( ttT

ytytTb ttbtayt ˆ

ii bxay ˆ

22 )( ii

iiii

xxn

yxyxnb

Interpretazione parametriInterpretazione parametri

• a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato) l’intercetta ha sempre un significato operativo

• b = variazione teorica media da un tempo al successivo

ESEMPIOESEMPIO

• a = 71,46 b = –1,45Funzione interpolante:

Anni t% di persone il cui pasto principale è il

pranzo

1993 1 69,3

1994 2 69,4

1995 3 66,9

1996 4 65,6

1997 5 64,1

1998 6 63,3

1999 7 61,6

2000 8 59,2

tyt 45,146,71ˆ Interpretazione

Bontà di adattamento:Bontà di adattamento:

• Previsione di valori futuri

988,0xy

r 977,0)988,0( 2

,21per ˆ , T Tt btayt• Esempio: % stimata di persone il cui

pasto principale è il pranzo nel 2001 (t=9):

%41,58945,146,71ˆ ty

Condizioni per la validità della Condizioni per la validità della proiezioneproiezione

elevato

• Mantenimento nel futuro delle condizioni che hanno determinato l’andamento passato funz. interpolante lineare: variazioni di ammontare costante b

Significato della proiezioneSignificato della proiezione

• I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno.

Esempio (Es. 4.24 eserciziario)Esempio (Es. 4.24 eserciziario)

• Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995:

anni Y

1981 325

1983 327

1985 329

1987 332

1989 335

1991 338

1993 340

1995 343

• Grafico della serie storica.• Calcolo dei parametri della

funzione interpolante lineare

• Bontà di adattamento• Valore previsto della

concentrazione di anidride carbonica nel 2005

Grafico della serie storica.Grafico della serie storica.

324

326

328

330

332

334

336

338

340

342

344

1980 1985 1990 1995 2000

anni

con

cen

traz

ion

e C

02

(Y)

Scelta della scala

anni biennale annuale Y

1981 1 1 325

1983 2 3 327

1985 3 5 329

1987 4 7 332

1989 5 9 335

1991 6 11 338

1993 7 13 340

1995 8 15 343

Calcolo dei parametri della funzione Calcolo dei parametri della funzione interpolante lineareinterpolante lineare

• Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15

ty t 631,2786,321ˆ

ty t 3155,1101,323ˆ Interpretazione

• Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8

Relazione tra le due intercetteRelazione tra le due intercette

• Scala annuale 323,101 = valore teorico al tempo t = 1980

ty t 631,2786,321ˆ

ty t 3155,1101,323ˆ

• Scala biennale 321,786 = valore teorico al 1979

anni

1981

1983

1985

1987

1989

1991

1993

1995

Relazione tra le due intercetteRelazione tra le due intercette

• 321,786= valore teorico1979= valore teorico1980- variazione teorica da un anno al successivo

• variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale

• 321,786=323,101-1,3155

Bontà di adattamentoBontà di adattamento

• In entrambi i casi: = 0,996

Adattamento quasi perfetto

Previsione al 2005Previsione al 2005

• Scala biennale (t = 13)

• Scala annuale (t = 25)

35613631,2786,321ˆ ty

356253155,1101,323ˆ ty

Significato e limiti della previsione

anni biennale annuale

1981 1 1

1983 2 3

1985 3 5

1987 4 7

1989 5 9

1991 6 11

1993 7 13

1995 8 15

… … …

2005 13 25

Esercizio: idrocarburi estratti Esercizio: idrocarburi estratti (in milioni di tonnellate)(in milioni di tonnellate)

n. 13 (integrativi)n. 13 (integrativi)

Serie storica delle quantità estratte Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998di idrocarburi dal 1986 al 1998

• Adottando un’opportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo

• Significato e bontà di adattamento

• Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile

Anno Idrocarburi estratti

1986 15,4

1988 18,3

1990 18,3

1992 18,6

1994 19,8

1996 19,7

1998 19,1

top related