phÂn tÍch dỮ liỆu

29
PHÂN TÍCH DỮ LIỆU 1. Mô tả dữ liệu 2. So sánh dữ liệu 3. Liên hệ dữ liệu B4. Phân tích dữ liệu (1) Điểm số tốt đến mức độ nào? (2) Điểm số phân bố rộng hay hẹp? (1) Độ tập trung (2) Độ phân tán Xem xét sự khác biệt kết quả thuộc các “miền” khác nhau có ý nghĩa hay không ? Đánh giá mức độ ảnh hưởng (ES) của tác động được thực hiện trong nghiên cứu ? Xem xét sự khác biệt giá trị trung bình của cùng một nhóm có ý nghĩa hay không ? Xem xét sự khác biệt giá trị trung bình của hai nhóm khác nhau có ý nghĩa hay không ? Kết quả kiểm tra sau tác động có phụ thuộc vào kết quả kiểm tra trước tác động không? Mức độ tương quan giữa hai tập hợp điểm số như thế nào?

Upload: gage

Post on 13-Jan-2016

70 views

Category:

Documents


0 download

DESCRIPTION

B4. Phân tích dữ liệu. (1) Điểm số tốt đến mức độ nào? (2) Điểm số phân bố rộng hay hẹp?. (1) Độ tập trung (2) Độ phân tán. 1. Mô tả dữ liệu. Xem xét sự khác biệt giá trị trung bình của hai nhóm khác nhau có ý nghĩa hay không ?. PHÂN TÍCH DỮ LIỆU. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: PHÂN TÍCH  DỮ LIỆU

PHÂN TÍCH

DỮ LIỆU

1. Mô tả dữ liệu

2. So sánh dữ liệu

3. Liên hệ dữ liệu

B4. Phân tích dữ liệu (1) Điểm số tốt đến mức độ nào?(2) Điểm số phân bố rộng hay hẹp?

(1) Độ tập trung(2) Độ phân tán

Xem xét sự khác biệt kết quả thuộc các “miền” khác nhau có ý nghĩa hay không ?

Đánh giá mức độ ảnh hưởng (ES) của tác động được thực hiện trong nghiên cứu ?

Xem xét sự khác biệt giá trị trung bình của cùng một nhóm có ý nghĩa hay không ?

Xem xét sự khác biệt giá trị trung bình của hai nhóm khác nhau có ý nghĩa hay không ?

Kết quả kiểm tra sau tác động có phụ thuộc vào kết quả kiểm tra trước tác động không?

Mức độ tương quan giữa hai tập hợp điểm số như thế nào?

Page 2: PHÂN TÍCH  DỮ LIỆU

1. Độ tập trung

2. Độ phân tán

* Mốt (Mode): là giá trị có tần suất xuất hiện nhiều nhất trong một tập hợp điểm số.

* Trung vị (Median): là điểm nằm ở vị trí giữa trong tập hợp điểm số xếp theo thứ tự.

* Giá trị trung bình (Mean): là giá trị trung bình cộng của các điểm số.

* Độ lệch chuẩn (SD): là tham số thống kê cho biết mức độ phân tán của các điểm số xung quanh giá trị trung bình.

B4. Phân tích dữ liệu1. Mô tả dữ liệu

=Stdev(number1, number 2, …)

=Average(number1, number 2, …)

=Median(number1, number2, …)

=Mode(number1, number 2, …)

Page 3: PHÂN TÍCH  DỮ LIỆU

Điểm xuất hiện nhiều nhất

Điểm vị trí giữa

Điểm trung bình cộng

Độ lệch chuẩn

=Mode(H4:H18)

=Mode(Q4:Q18)

=Median(H4:H18)

=Median(Q4:Q18)

=Average(H4:H18)

=Average(Q4:Q18)

=Stdev(H4:H18)

=Stdev(Q4:Q18)

Page 4: PHÂN TÍCH  DỮ LIỆU

B14=Mode(B3:B12) B15=Median(B3:B12)B16=Average(B3:B12) B17=Stdev(B3:B12)

C14=Mode(C3:C12)C15=Median(C3:C12)C16=Average(C3:C12)C17=Stdev(C3:C12)

F14=Mode(F3:F12) F15=Median(F3:F12)F16=Average(F3:F12) F17=Stdev(F3:F12)

G14=Mode(G3:G12)G15=Median(G3:G12)G16=Average(G3:G12)G17=Stdev(G3:G12)

Page 5: PHÂN TÍCH  DỮ LIỆU

2. So sánh dữ liệu

Xem xét sự khác biệt kết quả thuộc các “miền” khác nhau có ý nghĩa hay không ?

Đánh giá mức độ ảnh hưởng (ES) của tác động được thực hiện trong nghiên cứu ?

Xem xét sự khác biệt giá trị trung bình của cùng một nhóm có ý nghĩa hay không ?

Xem xét sự khác biệt giá trị trung bình của hai nhóm khác nhau có ý nghĩa hay không ?

B4. Phân tích dữ liệu

Phép kiểm chứng Khi bình phương

Độ chênh lệch giá trị trung bình chuẩn (SMD)

Phép kiểm chứng t-test phụ thuộc

(theo cặp)

Phép kiểm chứng t-test độc lập

Page 6: PHÂN TÍCH  DỮ LIỆU

2. So sánh dữ liệu

+ Phép kiểm chứng t-test độc lập giúp chúng ta xác định xem chênh lệch giữa giá trị trung bình của hai nhóm khác nhau có khả năng xảy ra ngẫu nhiên hay không.

+ Trong phép kiểm chứng t-test độc lập, chúng ta tính giá trị p, trong đó: p là xác suất xảy ra ngẫu nhiên.

a. Phép kiểm chứng t-test độc lập

Giá trị p Giá trị trung bình của 2 nhóm

≤ 0,05 Chênh lệch CÓ ý nghĩa

> 0,05 Chênh lệch KHÔNG có ý nghĩa

p =ttest (array 1, array 2, tail, type)

Page 7: PHÂN TÍCH  DỮ LIỆU

Khi sử dụng công thức tính giá trị p của phép kiểm chứng t-test độc lập:

=ttest (array 1, array 2, tail, type)

= 1: Giả thuyết có định hướng= 2: Giả thuyết không có định hướng

90% khi làm, giá trị là 3= 2: Biến đều (độ lệch chuẩn bằng nhau)= 3: Biến không đều

Array 1 là dãy điểm số 1

Array 2 là dãy điểm số 2

Page 8: PHÂN TÍCH  DỮ LIỆU

Ví dụ: 2 tập hợp điểm kiểm tra của 2 nhóm

a. Phép kiểm chứng t-test độc lậpPhép kiểm chứng t-test độc lập cho biết ý nghĩa sự chênh lệch của giá trị trung bình các kết quả kiểm tra giữa nhóm thực nghiệm với nhóm đối chứng có xảy ra ngẫu nhiên hay không ?

=TTEST(H4:H18,Q4:Q18,2,3)

P=0,012 <0,05 => Có ý nghĩa=> Nghĩa là các kết quả kiểm tra giữa nhóm thực nghiệm với nhóm đối chứng không xảy ra ngẫu nhiên

Page 9: PHÂN TÍCH  DỮ LIỆU

=TTEST(B3:B12,F3:F12,1,3)

=TTEST(C3:C12,G3:G12,1,3)

Phép kiểm chứng t-test độc lập cho biết ý nghĩa sự chênh lệch của giá trị trung bình các kết quả kiểm tra giữa nhóm thực nghiệm với nhóm đối chứng có xảy ra ngẫu nhiên hay không ?

P=0,4568594 > 0,05 => Không ý nghĩa=> Nghĩa là các kết quả kiểm tra giữa nhóm thực nghiệm với nhóm đối chứng có xảy ra ngẫu nhiên

P=0,0138827 < 0,05 => có ý nghĩa=> Nghĩa là các kết quả kiểm tra giữa nhóm thực nghiệm với nhóm đối chứng không xảy ra ngẫu nhiên

Page 10: PHÂN TÍCH  DỮ LIỆU

10

2. So sánh dữ liệu

b. Phép kiểm chứng t-test phụ thuộc (theo cặp)Phép kiểm chứng t-test phụ thuộc so sánh giá trị trung bình giữa hai bài kiểm tra khác nhau của cùng một nhóm có ý nghĩa hay không.

Giá trị p Giá trị trung bình của 2 nhóm

≤ 0,05 Chênh lệch CÓ ý nghĩa

> 0,05 Chênh lệch KHÔNG có ý nghĩa

p=ttest (array 1, array 2, tail, type)

Page 11: PHÂN TÍCH  DỮ LIỆU

11

Lưu ý khi sử dụng công thức tính giá trị p của phép kiểm chứng t-test phụ thuộc:

=ttest (array 1, array 2, tail, type)

= 1: Giả thuyết có định hướng= 2: Giả thuyết không có định hướng

=1 : T-test phụ thuộc

Array 1 là dãy điểm số 1,

Array 2 là dãy điểm số 2

Page 12: PHÂN TÍCH  DỮ LIỆU

=TTEST(B3:B12,C3:C12,1,1)

=TTEST(F3:F12,G3:G12,1,1)

Phép kiểm chứng t-test phụ thuộc cho biết ý nghĩa sự chênh lệch của giá trị trung bình các kết quả kiểm tra của nhóm thực nghiệm, nhóm đối chứng có xảy ra ngẫu nhiên hay không ?

P=0,0002003 < 0,05 => có ý nghĩa=> Nghĩa là sự chênh lệch của giá trị trung bình cộng các bài kiểm tra của nhóm thực nghiệm không xảy ra ngẫu nhiên.

P=0,0519441 > 0,05 => Không ý nghĩa=> Nghĩa là sự chênh lệch của giá trị trung bình cộng các bài kiểm tra của nhóm đối chứng có xảy ra ngẫu nhiên

Page 13: PHÂN TÍCH  DỮ LIỆU

Lưu ý khi sử dụng công thức tính giá trị p của phép kiểm chứng t-test:

=ttest (array 1, array 2, tail, type)

= 1: Giả thuyết có định hướng

= 2: Giả thuyết không có định hướng

90% khi làm, giá trị là 3

= 1: T-test theo cặp/phụ thuộc

= 2: Biến đều (độ lệch chuẩn bằng nhau)

= 3: Biến không đều T-test độc lập

Array 1 là dãy điểm số 1

Array 2 là dãy điểm số 2

Page 14: PHÂN TÍCH  DỮ LIỆU

Trong NCKHSPƯD, độ lớn của chênh lệch giá trị TB (SMD) cho biết chênh lệch điểm trung bình do tác động mang lại có tính thực tiễn hoặc có ý nghĩa hay không (ảnh hưởng của tác động lớn hay nhỏ)

2. So sánh dữ liệu

SMD =Giá trị TB Nhóm thực nghiệm – Giá trị TB nhóm đối chứng

Độ lệch chuẩn Nhóm đối chứng

c. Mức độ ảnh hưởng (ES)

Page 15: PHÂN TÍCH  DỮ LIỆU

c. Mức độ ảnh hưởng (ES)

Giá trị SMD Mức độ ảnh hưởng

> 1,00 Rất lớn

0,80 – 1,00 Lớn

0,50 – 0,79 Trung bình

0,20 – 0,49 Nhỏ

< 0,20 Rất nhỏ

SMD =Giá trị TB Nhóm thực nghiệm – Giá trị TB nhóm đối chứng

Độ lệch chuẩn Nhóm đối chứng

Page 16: PHÂN TÍCH  DỮ LIỆU

SMD KT sau tác động =23.87 – 18.33

6.90= 0.801

Kết luận: Mức độ ảnh hưởng lớn

Page 17: PHÂN TÍCH  DỮ LIỆU

c. Mức độ ảnh hưởng (ES)

SMD KT sau tác động =6.30 – 4.70

1.49= 1.0706394

Kết luận: Mức độ ảnh hưởng rất lớn

Page 18: PHÂN TÍCH  DỮ LIỆU

18

2. So sánh dữ liệu

Đối với các dữ liệu rời rạc Chúng ta sử dụng phép kiểm chứng Khi bình phương để đánh giá liệu chênh lệch này có khả năng xảy ra ngẫu nhiên hay không.

Ví dụ :

d. Phép kiểm chứng Khi bình phương (Chi-square test)

Đỗ Trượt

Nhóm thực nghiệm 108 42

Nhóm đối chứng 17 38

Page 19: PHÂN TÍCH  DỮ LIỆU

19

2. So sánh dữ liệu

Phép kiểm chứng Khi bình phương xem xét sự khác biệt kết quả thuộc các “miền” khác nhau có ý nghĩa hay không ?

d. Phép kiểm chứng Khi bình phương (Chi-square test)

Đỗ Trượt

Nhóm thực nghiệm 108 42

Nhóm đối chứng 17 38

Sự khác biệt về KQ đỗ/trượt của hai nhóm có ý nghĩa hay không?

MiềnNhóm

Page 20: PHÂN TÍCH  DỮ LIỆU

20

2. So sánh dữ liệud. Phép kiểm chứng Khi bình phương (Chi-square test)

Chúng ta có thể tính giá trị Khi bình phương và giá trị p (xác suất xảy ra ngẫu nhiên) bằng công cụ tính Khi bình phương theo địa chỉ:http://people.ku.edu/~preacher/chisq/chisq.htm

Giá trị Khi bình phương

Mức độ tự do

Giá trị p

Page 21: PHÂN TÍCH  DỮ LIỆU

21

2. So sánh dữ liệu

d. Phép kiểm chứng Khi bình phương (Chi-square test)

1. Nhập các dữ liệu và ấn nút “Calculate” (Tính)

Giá trị Khi bình phương

Mức độ tự do

Giá trị p

2. Các kết quả sẽ xuất hiện!

Page 22: PHÂN TÍCH  DỮ LIỆU

22

2. So sánh dữ liệu d. Phép kiểm chứng Khi bình phương (Chi-square test)

Giải thíchĐỗ Trượt Tổng

Nhóm thực nghiệm

108 42 150

Nhóm đối chứng

17 38 55

Tổng 125 38 205

Khi bình phương

Mức độ tự do

Giá trị p

p = 9 x 10-8 = 0,00000009 < 0,001=> Chênh lệch về KQ đỗ/trượt là có ý nghĩa => Các dữ liệu không xảy ra ngẫu nhiên. KQ thu được là do tác động

Page 23: PHÂN TÍCH  DỮ LIỆU

3. Liên hệ dữ liệu

Khi cùng một nhóm được đo với 2 bài kiểm tra hoặc làm một bài kiểm tra 2 lần, cần xác định:

+ Mức độ tương quan kết quả của 2 bài kiểm tra như thế nào?

Hoặc

+ Kết quả kiểm tra sau tác động có phụ thuộc vào kết quả trước tác động hay không ?

Để xem xét mối liên hệ giữa 2 dữ liệu của cùng một nhóm chúng ta sử dụng hệ số tương quan Pearson (r).

Page 24: PHÂN TÍCH  DỮ LIỆU

24

Giá trị r Mức độ tương quan

< 0,1 Rất nhỏ

0,1 – 0,3 Nhỏ

0,3 – 0,5 Trung bình

0,5 – 0,7 Lớn

0,7 – 0,9 Rất lớn

0,9 - 1 Gần như hoàn toàn

r = correl(array1,array2)

Hệ số tương quan

Page 25: PHÂN TÍCH  DỮ LIỆU

25

=Correl(B3:B12,C3:C12) =Correl(F3:F12,G3:G12)

Trong nhóm đối chứng, kết quả KT trước tác động và kết quả KT sau tác động có r=0.9409 => KL tương quan của 2 bài KT này gần như hoàn toàn. Trong nhóm thực nghiệm, kết quả KT trước tác động và kết quả KT sau tác động có r = 0.883769 => KL tương quan của 2 bài KT này rất lớn. => KL cả 2 nhóm như sau : HS có kết quả cao trong bài KT trước tác động cũng sẽ đạt kết quả cao trong bài KT sau tác động.

Page 26: PHÂN TÍCH  DỮ LIỆU

26

2. So sánh dữ liệu: Bảng tổng hợpCông cụ thống kê Mục đích

a Phép kiểm chứng t-test độc lập

Xem xét sự khác biệt giá trị trung bình của hai nhóm khác nhau có ý nghĩa hay không

b Phép kiểm chứng t-test phụ thuộc

(theo cặp)

Xem xét sự khác biệt giá trị trung bình của cùng một nhóm có ý nghĩa hay không

c Độ chênh lệch giá trị trung bình chuẩn (SMD)

Đánh giá mức độ ảnh hưởng (ES) của tác động được thực hiện trong nghiên cứu

d Phép kiểm chứng Khi bình phương

Xem xét sự khác biệt kết quả thuộc các “miền” khác nhau có ý nghĩa hay không

Page 27: PHÂN TÍCH  DỮ LIỆU

27

Thống kê và thiết kế nghiên cứu

Thiết kế nghiên cứu và thống kê có liên quan mật thiết với nhau. Thiết kế nghiên cứu hàm chứa các kỹ thuật thống kê sẽ sử dụng trong nghiên cứu.

Page 28: PHÂN TÍCH  DỮ LIỆU

Thống kê và Thiết kế nghiên cứuKT trước tác

độngTác

độngKT sau tác

động

Nhóm thực

nghiệm: G1

O1 X O3

Phép kiểm chứng t-test phụ thuộc, Mức độ ảnh hưởng, Hệ số tương quan

Nhóm đối chứng:

G2 O2 --- O4

Phép kiểm chứng t-test phụ thuộc, Hệ số tương quan

Phép kiểm chứng t-test độc lập, Mức độ ảnh

hưởng

Phép kiểm chứng t-test độc lập, Mức độ ảnh hưởng

Không thể sử dụng hệ số tương quan (r) ở đây, vì sao?

Page 29: PHÂN TÍCH  DỮ LIỆU

29

Làm bài thực hành tính toán – Tổng hợp.

Bài tập