ch iv regression

53
Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics TƯƠNG QUAN VÀ HI QUY CORRELATION & REGRESSION TS. LÊ VĂN HUY Email: [email protected]

Upload: rain-wolfs

Post on 23-Jun-2015

280 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN VÀ HỒI QUYCORRELATION & REGRESSION

TS. LÊ VĂN HUYEmail: [email protected]

Page 2: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

NỘI DUNG

Tương quan tuyến tínhHồi quy tuyến tínhKiểm tra các điều kiện áp dụng mô hìnhSố liệu sai lệchHồi quy với biến giả (dummy)

Phương pháp stepwise

Page 3: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN (CORRELATION)

Xem xét mối quan hệ giữa hai hay nhiều biến

Tương quan có:Tương quan 2 biến – Bivariate Correlations

Tương quan riêng phần – Partial Correlations

Điều kiện:2 hoặc nhiều biến định lượng

Page 4: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN (CORRELATION)

Mục tiêu nghiên cứu: Giả định nhà nghiên cứu muốn tìm hiểu có mối quan hệ như thế nào giữa độ tuổi và thu nhập.

Câu hỏi nghiên cứu: Độ tuổi và thu nhập có mối quan hệ với nhau hay không ?

Hai biến được chọn: Độ tuổi và thu nhập (2 biến định lượng).

Giả thuyết H0: Trình độ học vấn và thu nhập không có liên hệ với nhau.

Page 5: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN (CORRELATION)

Vì Pearson = 0,075 và Sig = 0,291 nên chưa có cơ sở đểbác bỏ H0 nghĩa là….

Page 6: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN RIÊNG TỪNG PHÂN (PARTIAL CORRELATION)

Nghiên cứu mối quan hệ tuyến tính của hai biến có loại trừ ảnh hưởng của các yếu tố khác.

Page 7: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TƯƠNG QUAN RIÊNG TỪNG PHÂN (PARTIAL CORRELATION)

Page 8: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY ĐƠN

Mục đích: Tìm mối quan hệ giữa hai biến (mối quan hệ nhân quả)

Điều kiệnHai biến định lượng

Hai biến phải tuân theo quy luật phân phối chuẩn

Mô hình lý thuyết:

Yi = B0 + B1*Xi + εXi: trị quan sát thứ i của biến độc lập

Yi : giá trị dự đoán thứ i của biến phụ thuộc

B0 và B1: hệ số hồi quy

Page 9: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

DIỄN GIẢI DỮ LIỆU

Các hệ số góc (bj)Sự biến đổi của giá trị trung bình của các Y khi Xj tăngthêm 1 đơn vị, mọi yếu tố khác không đổi.Kiểm định: tương tự như hồi qui đơn với (n-p-1) bậc tựdo

Hệ số chặn - hằng số (b0)Giá trị trung bình của Y khi Xj = 0

Page 10: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY ĐƠN

Mục tiêu nghiên cứu: Nên tác động thế nào đến phong cách lãnh đạo để tạo ra sự trung thành của nhân viên.

Câu hỏi nghiên cứu: Lòng trung thành của nhân viên có phụ thuộc và phong cách lãnh đạo?

Hai biến được chọn: Lãnh đạo là biến độc lập vàLòng trung thành là biến phụ thuộc.

Page 11: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY ĐƠN

Vì F= 75,549 vàSig = 0,000 <0,05 bác bỏ H0 nghĩa là

2 biến có mối quan hệ

MQH thể hiện:LTTi = 0,957

+0,667*lãnh đạo +ε

R2=0,276 MQH giữa 2 biến là…

R2= 0,276 nên biến

lãnh đạo giải thích 27,6%

LTT

Page 12: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỆ SỐ XÁC ĐỊNH R2

Tỉ lệ biến đổi của biến phụ thuộc được giải thíchbằng tất cả các biến độc lập

R2 = Biến đổi được giải thích = SCRTổng biến đổi SCT

Không bao giờ giảm khi các đại lượng được thêmvào

Vấn đề khi ta so sánh các mô hình

Page 13: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNH R2a

R2 điều chỉnh (R2a)R2

Page 14: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

KIỂM ĐỊNH MỨC Ý NGHĨA (DÙNG F)

ANOVA

dl SC MC F

Regression p SCR MCR =SCR/p MCR/MCE

Residue n-p-1 SCE MCE =SCE/(n-p-1)

Total n-1 SCT

Page 15: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

MÔ HÌNH HỒI QUY (BỘI)

Mối liên hệ giữa một biến phụ thuộc với ít nhất haibiến độc lập là một hàm tuyến tính

Mô hình:

Y X X Xi i i p pi i= + + + + +β β β β ε0 1 1 2 2 …

Biến phụ thuộc Các biến độc lập

Các hệ sốhồi qui của

tổng thểHệ số chặn(hằng số)

Sai sốngẫunhiên

Page 16: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN TỔNG THẾ

Yi=β0+ β1X1i+ β2X2i + εi

Kết quảβ0

Y

X1

X2

εi

E(Y)=β0+ β1X1+ β2X2

Page 17: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

MÔ HÌNH HỒI QUY BỘI (2 BIẾN) – TRÊN MẪU

Y

Đáp số

X1

X2

b0 ei

Yi=b0+ b1X1i+ b2X2i + ei

Page 18: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH

Các điều kiện về dạng mô hình :MQH tuyến tính giữa các biến độc lập với biến phụthuộc

Các điều kiện về sai số mô hình (error):Các sai số mô hình là độc lập (không tự tương quan)Các sai số phân phối theo phân phối chuẩn

Các điều kiện về các số dự đoán:Các biến độc lập không ngẫu nhiênCác giá trị của các biến độc lập được đo lường khôngcó sai sốCác số dự đoán là độc lập theo đường thẳng, (khôngcó bội tương quan giữa các biến độc lập -multicollinearity)

Page 19: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

MÔ HÌNH NGHIÊN CỨU VÀ CÁC KHÁI NIỆM

Items 1.1

Items 1.2

Items 1.3…

Items 1.n

Items 2.1

Items 2.2

Items 2.3…

Items 2.n

LÃNH ĐẠO

CƠ HỘI ĐTẠO VÀTTIẾN

LƯƠNG, THƯỞNG

ĐỒNG NGHIỆP

PHÚC LỢI

BẢN CHẤT CVIỆC

MÔI TRƯỜNG LV

LÒNG TRUNG THÀNH

Page 20: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

VÍ DỤ VỀ HỒI QUY BỘI (PP. ENTER)

Phát triển mô hình để giảithích mối quan hệ F1,…,F7 với lòng trung thành (LTT)

Page 21: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HÃY GIẢI THÍCH KẾT QUẢ

Phương trìnhhồi quy bội

LTT = -0,745+ 0,245 F1+ 0,220 F2+ 0,476 F3- 0,105 F4

Page 22: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN

Đa cộng tuyến là trạng thái các biến độc lập trong mô hình có tương quan chặt chẽ với nhau.

Để kiểm tra hiện tượng đa cộng tuyến, có thể sửdụng bảng ma trận tương quan hoặc kiểm tra bằng lựa chọn Collinearity Diagnostic.

Kiểm tra tự tương quan, kích vào Durbin-Watson

Page 23: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN

Page 24: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

VẤN ĐỀ ĐA CỘNG TUYẾN VÀ TỰ TƯƠNG QUAN

ĐK không tự tương

quan:VIF < 10

Đối với biến Xi, tolerance bằng 1-Ri2 với Ri là

hệ số xác định của biến Xi được hồi qui bởi tất cả các biến độc lập khác

Nếu Di>4/(n-p-1), quan sát được xem như có

ảnh hưởng

Page 25: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE

Phương pháp này là kết hợp đưa vào dần và loại trừ dần.Biến nào có tương quan riêng cao nhất sẽ được xem xét đưa vào mô hình trước với xác suất là0,05Để ngăn chặn hiện tượng 1 biến được chọn vào rồi chọn ra lặp lại thì SPSS mặc định xác suất F vào nhỏ hơn F ra.Thủ tục chọn biến sẽ kết thúc khi không còn biến nào thỏa tiêu chuẩn chọn vào, chọn ra nữa.

Page 26: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE

Page 27: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE

Mô hình chọn luôn là

mô hình cuối cùng

Mô hình chọn luôn là

mô hình cuối cùng

Page 28: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HỒI QUY BỘI VỚI PHƯƠNG PHÁP STEPWISE

Câu hỏi:Kết quả này có khác gì với kết quả của

phương pháp ENTER

Mô hình:LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo

và thăng tiến + 0,260 Lãnh đạo

Page 29: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH

Các điều kiện về dạng mô hình :MQH tuyến tính giữa các biến độc lập với biến phụthuộc

Các điều kiện về sai số mô hình (error):Các sai số mô hình là độc lập (không tự tương quan)Các sai số phân phối theo phân phối chuẩn

Các điều kiện về các số dự đoán:Các biến độc lập không ngẫu nhiênCác giá trị của các biến độc lập được đo lường khôngcó sai sốCác số dự đoán là độc lập theo đường thẳng, (khôngcó bội tương quan giữa các biến độc lập -multicollinearity)

Page 30: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

CÂU HỎI

Nếu có một biến (độc lập) không thỏa các điều kiện để thực hiện một phân tích tương quan thìthế nào?

Có khả năng chuyển về biến đính tính không?Nếu muốn phân tích tương quan, trong cac biến độc lập có một biến định tính (biến 2 hoặc nhiều lựa chọn) thì có thể thực hiện được không?

Page 31: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN GIẢ (DUMMY)

Các ví dụ: Biến giới tính: nam-nữ,

có mặt – vắng mặtmiền Bắc, Trung, Nam

Được mã hóa 0 hoặc 1Về mặt lý thuyết,

các hằng số (hệ số chặn) phải khác nhauSố các biến giả cần thiết bằng số lựa chọn (của biến định tính) - 1

Page 32: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN GIẢ (DUMMY)

0 1 1 2 0 1 1ˆ (0)i i iY b b X b b b X= + + = +

0 1 1 2 0 2 1 1ˆ (1) ( )i i iY b bX b b b bX= + + = + +

Y = tiền lương

X1,7 = Lãnh đạo, Cơ hội đào tạo và thăng tiến…

X8 = Giới tính =

Nam (X8 = 1)

Nữ (X8 = 0)

0 nữ

1 nam

0 1 1 2 2i i iY b b X b X= + +

Cùnghệ sốhồi qui

Page 33: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN GIẢ (dummy)

Y (Lòng trung thành)

Nữ

Nam

X8 (giới tính)

b0 + b2

b0

Cùng hệ sốgốc

Hệ số chặn(hằng số) khácnhau

1b

Page 34: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

MÃ HÓA BIẾN DUMMY

Biến cũGiới tính 1: Nam, 2: Nữ

Chúng ta phải chuyển thànhGiới tính 1: Nam, 0: Nữ

trước khi thực hiện phân tích!!!

Page 35: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TRÌNH TỰ THỰC HIỆN

Page 36: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TRÌNH TỰ THỰC HIỆN

Page 37: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

KẾT QUẢ

Page 38: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

KẾT QUẢ

Mô hình:LTT = -0,247 + 0,459 Lương và thưởng + 0,282 CH Đào tạo và thăng tiến + 0,260 Lãnh đạo + 0,396 Danh hiệu thi đua

Page 39: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

CÂU HỎI: MÃ HÓA BIẾN VÀ PHÂN TÍCH (DUMMY)

Biến cũ: ĐIAĐIEMMiền Bắc 1

Miền Trung 2

Miền Nam 3

Chúng ta phải chuyển thànhĐIAĐIEM1 Miền Bắc 1 Khác 0

ĐIAĐIEM2 Miền Trung 1 Khác 0

Diễn giải dữ liệu cho phù hợp!!!

Page 40: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TÁC ĐỘNG CỦA MÃ HÓA BIẾN

Sự mã hóa riêng biệt các biến giả cốt là thay thếcác dòng lấy giá trị 0 đối với tất cả các biến giả liên quan đến một biến cụ thể bằng một giá trị -1.

Page 41: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TÁC ĐỘNG CỦA MÃ HÓA BIẾN

Page 42: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

TÁC ĐỘNG CỦA MÃ HÓA BIẾN

Page 43: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH

Các điều kiện về dạng mô hình :MQH tuyến tính giữa các biến độc lập với biến phụthuộc

Các điều kiện về sai số mô hình (error):Các sai số mô hình là độc lập (không tự tương quan)Các sai số phân phối theo phân phối chuẩn

Các điều kiện về các số dự đoán:Các biến độc lập không ngẫu nhiênCác giá trị của các biến độc lập được đo lường khôngcó sai sốCác số dự đoán là độc lập theo đường thẳng, (khôngcó bội tương quan giữa các biến độc lập -multicollinearity)

Page 44: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

4000003000002000001000000

Reg

ress

ion

Stu

dent

ized

Res

idua

l

4

2

0

-2

-4

KIỂM TRA 1

Page 45: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

KIỂM TRA 2

Regression Standardized Residual

3,25

2,75

2,25

1,75

1,25

,75,25-,25

-,75

-1,25

-1,75

-2,25

-2,75

-3,25

-3,75

Freq

uenc

y

60

50

40

30

20

10

0

Page 46: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

HAI KIỂM ĐỊNH PHÂN PHỐI CHUẨN

Nhờ vào hệ số mất cấn đối (Skewness)

Nhờ vào Kurtose

Page 47: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

ĐIỀU KIỆN VẬN DỤNG MÔ HÌNH

Câu hỏi: Nếu các điều kiện không đạt thì thếnào?Các điều kiện vận dụng mô hình thường xuyên không đạt được:

Tuyến tínhPhương sai không đổi của các sai số (errors) của mô hình

Một mô hình là tuyến tính nếu các tham số hiện diện trong mô hình là tuyến tính, ngay cả khi các biến độc lập không tuyến tính

Page 48: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN ĐỔI BIẾN

Các ví dụ của các mô hình tuyến tính:

Ví dụ mô hình không tuyến tính:

ε+β+β= XY 10

ε+β+β+β=2

210 XXYε+β+β= XlogY 10

ε+β+β= XY 10

ε++β=β X

01eY

Page 49: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN ĐỔI MÔ HÌNH

Hàm

Phép biến đổi

Dạng tuyến tính

βα= XY

Xlog'X,Ylog'Y =='Xlog'Y β+α=

Page 50: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN ĐỔI MÔ HÌNH

Hàm

Phép biến đổi

Dạng tuyến tính

XeYβ

α=Yln'Y =

Xln'Y β+α=

Page 51: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BiẾN ĐỔI MÔ HÌNH

Hàm

Phép biến đổi

Dạng tuyến tính

XlogY β+α=Xlog'X =

'XY β+α=

Page 52: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN ĐỔI MÔ HÌNH

β−α=

XXY

X1'X,

Y1'Y ==

Hàm

Phép biến đổi

Dạng tuyến tính 'X'Y β−α=

Page 53: Ch iv   regression

Copyright @ 2009, LÊ VĂN HUY, PhD., Danang University of Economics

BIẾN ĐỔI MÔ HÌNH

X

X

e1

eY β+α

β+α

+=

Y1Yln'Y−

=

Hàm

Phép biến đổi

Dạng tuyến tính X'Y β+α=