Download - corelatie regresie
-
8/13/2019 corelatie regresie
1/30
Corelaiai regresia liniarSorana D. BOLBOAC
-
8/13/2019 corelatie regresie
2/30
Coninut Corelaia
Definiie Formule de calcul Testarea ipotezelor
Regresia liniar- Simpl- Multipl
2
-
8/13/2019 corelatie regresie
3/30
1. Direcia
Pozitiv(+) Negativ (-)
2. Gradul de asociere
ntre 1 i 1 Valoarea absolutsemnificputerea asocierii
3. Forma
Linear Nelinear
Corelaia: 3 caracteristici
3
-
8/13/2019 corelatie regresie
4/30
0.0
6.7
13.3
20.0
0.0 4.0 8.0 12.0
C1 vs C2
C1
C2
0.0
40.0
80.0
120.0
0.0 83.3 166.7 250.0
C1 vs C2
C1
C2
Pozitiv
Valori mari ale lui X se asociazcuvalori mari ale lui Y
Valori mici ale lui X se asociazcuvalori mici ale lui Y
Valori mari ale lui X se asociazcu valori mici ale lui YValori mici ale lui X se asociazcu valori mari ale lui Y
Ex. Viteza i acurateea
Negativ
Corelaia: 1. direcia
4
-
8/13/2019 corelatie regresie
5/30
0.0
6.7
13.3
20.0
0.0 4.0 8.0 12.0
C1 vs C2
C1
C2
0.0
40.0
80.0
120.0
0.0 4.0 8.0 12.0
C1 vs C2
C1
C2
Puternic
Slab
(nor de puncte difuz)
Corelaia: 2. Gradul asocierii
5
-
8/13/2019 corelatie regresie
6/30
Linear Nelinear
Corelaia: 3. Forma
6
-
8/13/2019 corelatie regresie
7/30
Tehnicstatisticcare msoar i descrie gradul
de asociere lineardintre douvariabilecantitative continue normal distribuite
Corelaia Pearson: Definiie
Obs X Y A 1 1B 1 3
C 3 2D 4 5E 6 4F 7 5
Date
X
Y
Grafic de tip nor de puncte
7
-
8/13/2019 corelatie regresie
8/30
Media
lui X
>Medialui Y >Medialui Y
Medialui X
-
8/13/2019 corelatie regresie
9/30
Media
X
>Medialui Y >MediaY
Medialui X
-
8/13/2019 corelatie regresie
10/30
Media
lui X
>Medialui Y >Medialui Y
Medialui X
-
8/13/2019 corelatie regresie
11/30
11
Coeficientul de corelaie PearsonSimbol: r, R
Ia valori ntre -1 i +1 indicnd puterea (interpretmvaloarea coeficientului) i direcia (interpretm semnulcoeficientului) asocierii lineare.
Valoarea absolutindicputerea asocierii + (direct proporional)/- indic(invers proporional)direcia asocierii
( ) ( )
=
22YYXX
YYXXr
-
8/13/2019 corelatie regresie
12/30
Coeficientul de corelaie Pearson
Asumpii:
1.Erorile din date sunt independente2.Existo relaie de linearitate ntre cele douvariabile de interes
3.Variabilele urmeazo distribuie normalbivariat
12
-
8/13/2019 corelatie regresie
13/30
Femur Humerus
A 38 41B 56 63
C 59 70
D 64 72E 74 84
Mean 58.2 66.00
SSX SSY SP
)( XX )( YY 2)( XX 2)( YY ))(( YYXX
YXSSSS
SP=r
Coeficientul de corelaie Pearson
13
-
8/13/2019 corelatie regresie
14/30
Femur Humerus
A 38 41 20.2 25 408.04 625 505B 56 63 2.2 3 4.84 9 6.6
C 59 70 0.8 4 .64 16 3.2
D 64 72 5.8 6 33.64 36 34.8E 74 84 15.8 18 249.64 324 284.4
mean 58.2 66.00 696.8 1010 834
SSX SSY SP
)( XX )( YY 2)( XX 2)( YY ))(( YYXX
r = 0.99
Coeficientul de corelaie Pearson
14
-
8/13/2019 corelatie regresie
15/30
Coeficientul de corelaie Pearson: Interpretare
O msura puterii asocierii: ct de puternic
punctele din grafic se aglomereazn jurul uneilinii? O msura direciei asocierii: pozitivsau negativ?
Reguli empirice de interpretare a coeficientului decorelaie: Colton [Colton T. Statistics in Medicine.Little Brown and Company, New York, NY 1974] :
R [-0.25 to +0.25] Nu existnici o relaie R (0.25 to +0.50] (-0.25 to -0.50] relaie slab R (0.50 to +0.75] (-0.50 to -0.75] relaie
moderat R (0.75 to +1) (-0.75 to -1) relaie puternic 15
-
8/13/2019 corelatie regresie
16/30
-
8/13/2019 corelatie regresie
17/30
Coeficientul de corelaie al rangurilor Spearman
Se poate aplica pe orice tip de variabile
Nu necesitasumpia distribuiei normale bivariate acelor 2 variabile de interes
Simbol:
17
-
8/13/2019 corelatie regresie
18/30
Coeficientul de corelaie al rangurilor Spearman
Semnul coeficientului de corelaieSpearman indicdirecia asocierii
(invers proporionale pentrusemnul -i direct proporionalpentru semnul +) dintrevariabilele investigate
=1 relaia dintre cele douvariabile investigate estemonoton. N.B. Nu va da un
coeficient de corelaie Pearsonegal cu 1.
18
-
8/13/2019 corelatie regresie
19/30
Coeficientul de determinare (r2/R2)
Valoarea covariaiei raportat la volumul total al
variaiei Procentul din variaia totalcare este explicat
de variabilele independente
Exemplu
Dacr = 0.80 variabilele independente explic64% din variabilitatea variabilei dependente
19
-
8/13/2019 corelatie regresie
20/30
Proprietile coeficientului de corelaie
O statisticstandardizat nu se modificdac
schimbm unitile de msurale variabilelor.Valoarea este identicdaccorelm pe X cu Y
sau pe Y cu X.
Valoarea este destul de instabilpentru n micVulnerabil la valori extreme
Are o distribuie asimetric
20
-
8/13/2019 corelatie regresie
21/30
Coeficientul de corelaie: exemplu
Enciu A, Zamfir CZ, Nicolescu A, Ida A. THE ANALYSIS OFCORRELATIONS BETWEEN THE MAIN TRAITS OF WOOL
PRODUCTION ON MILK BREED PALAS. Lucrritiinifice -Seria Zootehnie ????;57:50-54.
21
-
8/13/2019 corelatie regresie
22/30
Matricea de corelaie
-
8/13/2019 corelatie regresie
23/30
Regresia linearsimpl
Regresia linearmultipl
-
8/13/2019 corelatie regresie
24/30
Regresia liniar: asumpii
Erorile msurtorilor sunt independente
Regresia depinde de identificarea corectamodelului relaional
Nu existerori n msurarea valorilor variabileidependente
Variaia valorilor lui Y este aceeai pentru toate
valorile lui XValorile Y urmeazo distribuie normal
24
-
8/13/2019 corelatie regresie
25/30
Regresia liniar
Dacexisto relaie de liniaritate ntre
variabilele de interes putem identifica o ecuaiesimplpentru a prezice o variabilcunoscndcealaltvariabil
Variabila rezultate este variabila Y, iar variabilapredictor este variabila X Exemplu: transformarea n grade Fahrenheit
cunoscnd valoarea n grade Celsius:F = 32 + 1.8CAceastformuldo line perfect
25
-
8/13/2019 corelatie regresie
26/30
Ecuania dreptei
Formula general: Y = a + bX Ecuaia de predicie: = a+ bX
a = intercept, b = coeficientul dreptei, X = predictor
a i b sunt constante ntr-o ecuaie; X i Y se modific
26
-
8/13/2019 corelatie regresie
27/30
27
Panta i interceptul
= a + bX Panta b: Cantitatea cu care valoarea Y se modificn
momentul n care modificm valoarea lui X cu o unitate
Interceptul a: valoarea lui Y cnd X este zero
Panta este influenatde r, dar nu are aceeai semnificaieca i r
Xx
y
SS
SP
s
srb ==
XbYa =
28
-
8/13/2019 corelatie regresie
28/30
http://onlinelibrary.wiley.com/doi/10.1111/j.1939-1676.2011.00812.x/pdf
29
-
8/13/2019 corelatie regresie
29/30
-
8/13/2019 corelatie regresie
30/30
De reinut!
Evaluarea puterii asocierii dintre douvariabilecantitative continue (normal distribuite) corelaie
Prezicerea unei variabile (Y) n funcie de o altvariabil(X) regresie