korelacja i regresja liniowa - cs.put.poznan.pl · korelacja i regresja liniowa agnieszka mensfelt...

13
Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018

Upload: vananh

Post on 01-Mar-2019

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Korelacja i regresja liniowa

Agnieszka Mensfelt

14 maja 2018

Page 2: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Analiza zależności zmiennych ilościowych

50

100

150

200

120 150 180 210 240wzrost [cm]

wag

a [k

g]

Page 3: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Kowariancja

Kowariancja zmiennych losowych

var(X ) = E [(X − µ)2]

cov(X ,Y ) = E [(X − µx)(Y − µy )]

cov(X ,X ) =?

Estymator kowariancji

sXY =1

n − 1

n∑i=1

(Xi − X )(Yi − Y )

Kowariancja a niezależność zmiennych

E [(X − µx)(Y − µy )] = E [XY − XµY − YµX − µXµY ]

= E [XY ]− E [XµY ]− E [YµX ] + µXµY = E [XY ]− µXµY

Page 4: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Współczynnik korelacji liniowej Pearsona

Korelacja zmiennych losowych

ρ =cov(X ,Y )

σXσY

Estymator współczynnika korelacji

r =

∑ni=1(Xi − X )(Yi − Y )√

(∑n

i=1(Xi − X )2)(∑n

i=1(Yi − Y )2)

Page 5: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Przykład

Page 6: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Przykład

-1 0.8

-0.7 0

Page 7: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Test na istotność współczynnika korelacji

Układ hipotez:H0 : ρ = 0H1 : ρ > / 6= / < 0

Statystyka:

t =r√1− r2

√n − 2 ∼ t(n − 2)

Page 8: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

0

2

4

6

0 2 4 6x

y

Page 9: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

Y = Y + εY = β0 + β1X + ε

0

2

4

6

0 2 4 6x

y

β0}

{

{ β1

1

Page 10: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

Założenia:

Zależność liniowa między X i Y

Wartości zmiennej niezależnej X są ustalone

ε ∼ N(0, σ2)

Page 11: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Metoda najmniejszych kwadratów

Y = b0 + b1X + eY = b0 + b1Xei = yi − yi

0

2

4

6

0 2 4 6x

y{

e2

y2

y2

Page 12: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Metoda najmniejszych kwadratów

Suma kwadratów rezyduów

n∑i=1

e2i =n∑

i=1

(yi − yi )2

=n∑

i=1

(yi − (b1xi + b0))2

Współczynnik kierunkowy i wyraz wolny

b1 =cov(X ,Y )

s2(X )= r

sYsX

b0 = y − b1x

prosta regresji przechodzi przez (x , y)znak(b1) = znak(r)

Page 13: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Kwartet Anscombe’a

Źródło:https://en.wikipedia.org/wiki/Anscombe%27s_quartet