bao_cao_nhom_7

22
BÀI T P L N XÁC SU T THNG KÊ BÀI 1  A. Ví d3.4/161 SG K Hiu sut phn trăm (%) ca mt phn ng hóa hc được nghiên cu theo ba yếu t: pH (A), nhit độ (B) và cht xúc tác (C) được trình bày trong bng sau: Yếu tA Yế u tB B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá vnh hưởng ca các yếu ttrên đến hiu sut phn ng? Phương pháp:  PHÂN TÍCH PHƯƠN G SAI BA YU TSphân tích này được dùng để đánh giá vsnh hưởng ca ba yếu ttrên các giá trquan sát G (i = 1, 2... r: yếu tA; j = 1, 2...r: yếu tBo: k = 1, 2...r: yếu tC).  Mô hình: Khi nghiên cu nh hưởng ca hai yếu t, mi yếu tn mc, thì người ta dùng mô hình vuông la tinh n×n . Ví dnhư mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D Mô hình vuông la tinh ba yếu tđược trình bày như sau: Yếu tA Yếu tB B1 B2 B3 B4 A1 C1 Y 111 C2 Y 122 C3 Y 133 C4 Y 144 T 1.. A2 C2 Y 212 C3 Y 223 C4 Y 234 C1 Y 241 T 2.. A3 C3 Y 313 C4 Y 324 C1 Y 331 C2 Y 342 T 3.. A4 C4 Y 414 C1 Y 421 C2 Y 432 C3 Y 443 T 4.. T .i. T .1. T .2. T .3. T .4.  BÙI MINH CHUNG G0804070 Page 1

Upload: tung-dang-son

Post on 05-Apr-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 1/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

BÀI 1

 A. Ví dụ 3.4/161 SGK 

Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A),

nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Yếu tố AYếu tố B

B1 B2 B3 B4

A1 C1 9 C2 14 C3 16 C4 12

A2 C2 12 C3 15 C4 12 C1 10

A3 C3 13 C4 14 C1 11 C2 14

A4 C4 10 C1 11 C2 13 C3 13

Hãy đánh giá về ảnh hưởng của các yếu tố trên đến hiệu suất phản ứng?

Phương pháp:

 PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ

Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sátG (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố Bảo: k = 1, 2...r: yếu tố C).

 Mô hình:

Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hìnhvuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:

B C D A

C D A B

D A B C

A B C D

Mô hình vuông la tinh ba yếu tố được trình bày như sau:

Yếu tốA

Yếu tố B

B1 B2 B3 B4

A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1..

A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2..

A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3..

A4 C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4..

T.i. T.1. T.2. T.3. T.4.  

BÙI MINH CHUNG_G0804070 Page 1

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 2/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

 Bảng ANOVA:

Nguồn sai số Bậc tự do

Tổng số bình

phương

Bình phương

trung bình

Giá trị thống

Yếu tố A

(Hàng)(r-1) SSR=∑

=

−r 

i

i

12

2...

2.. MSR=

)1( −r 

SSRFR =

 MSE 

 MSR

Yếu tố B

(Cột)(r-1) SSC=∑

=

−r 

 j

 j

12

2...

2..

MSC=)1( −r 

SSC FC=

 MSE 

 MSC 

Yếu tố C (r-1) SSF= ∑=

−r 

12

2...

2.. MSF=

)1( −r 

SSF F=

 MSE 

 MSF 

Sai số (r-1)(r-2) SSE=SST – (SSF+SSR+SSC)

MSE=)2)(1( −− r r 

SSE 

Tổng cộng (r  2-1) SST=2

2...2

T Y ijk  −ΣΣΣ

Trắc nghiệm

• Giả thiết:

H0: μ1 = μ2 = ...= μk  ↔ Các giá trị trung bình bằng nhauH1: μi  ≠ μ j ↔ Có ít nhất hai giá trị trung bình khác nhau

• Giá trị thống kê: FR , FC, F

• Biện luận

 Nếu FR < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố A

 Nếu FC < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố B

 Nếu F < Fα(r-1)(r-2) → Chấp nhận H0 đối với yếu tố C

Bài làm:

 Nhập dữ liệu vào bảng tính

BÙI MINH CHUNG_G0804070 Page 2

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 3/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Thiết lập các biểu thức và tính các giá trị thống kê

1. Tính các giá trị Ti.., T.j., T..k và T...

• Các giá trị Ti..

Chọn ô B7 và chọn biểu thức =SUM(B2:E2)

Chọn ô C7 và nhập biểu thức =SUM(B3:E3)

Chọn ô D7 và nhập biểu thức =SUM(B4:E4)

Chọn ô E7 và nhập biểu thức =SUM(B4:E4)

• Các giá trị T.j.

Chọn ô B8 và nhập biểu thức =SUM(B2:B5)Dùng con trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8

• Các giá trị T..k 

Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)

Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)

Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)

Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)

• Giá trị T…Chọn ô B10 và nhập biểu thức=SUM(B2:B5)

2. Tính các giá trị G

Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)

Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9

Chọn ô G10 và nhập biểu thức =POWER(B10,2)

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)

3. Tính các giá trị SSR, SSC, SSF, SST và SSE

• Các giá trị SSR, SSC, SSF

Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)

Dùng con trỏ kéo ký hiệu tự điền từ ô I7 đến ô I9

• Giá trị SST

Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)

• Giá trị SSE

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)

4. Tính các giá trị MSR, MSC, MSF và MSE

BÙI MINH CHUNG_G0804070 Page 3

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 4/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

• Giá trị MSR, MSC, MSF

Chọn ô K7 và nhập biểu thức =I7/(4-1)

Dung con trỏ kéo ký hiệu tự điền từ ô K7 đến ô K9

• Giá trị MSE

Chọn ô K10 và nhập biểu thức =I/((4-1)*(4-2))

5. Tính các giá trị F:

Chọn ô M7 và nhập biểu thức =K7/$K$10

Dùng con trỏ kéo ký hiệu tự điền từ ô M7 đến M9.

Kết quả và biện luận

FR =3.10 < F0.05(3,6)=4.76 => chấp nhận H0 (pH)

FC=11.95 > F0.05(3,6)=4.76 => bác bỏ H0 (nhiệt độ)F=30.05 > F0.05(3,6)=4.76 => bác bỏ H0 (chất xúc tác)

Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất phản ứng.

 B. V í dụ 4.2/170 SGK 

 Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình

 bày trong bảng sau:Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%)

X1 X2 Y

15 105 1.87

30 105 2.02

60 105 3.28

15 120 3.05

30 120 4.07

60 120 5.54

BÙI MINH CHUNG_G0804070 Page 4

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 5/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

15 135 5.03

30 135 6.45

Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệusuất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệusuất phản ứng sẽ là bao nhiêu?

Phương pháp:

 HỒI QUY TUYẾN TÍNH ĐA THAM SỐ

Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến

số độc lập Xi (i=1,2,...,k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản. Phương trình tổng quát 

Ŷx0,x1,...,xk = B0 + B1X1 + ... + Bk Xk 

 Bảng ANOVA

Nguồn sai số Bậc tự doTổng số bình

phươngBình phương

trung bìnhGiá trị thống

Hồi quy K SSR MSR=k 

SSRF=

 MSE 

 MSR

Sai số  N-k-1 SSE MSE =)1( −− k  N 

SSE 

Tổng cộng  N-1 SST = SSR + SSE

Giá trị thống kê

Giá trị R-bình phương:

kF k  N 

kF 

SST 

SSR R

+−−

==

)1(

2( 81.02 ≥ R là khá tốt)

Độ lệch chuẩn:

)1( −−=

k  N 

SSE S  ( 30.0≤S  là khá tốt)

Trắc nghiệm

• Giá trị thống kê: F

• Trắc nghiệm t:

H0: βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa.

BÙI MINH CHUNG_G0804070 Page 5

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 6/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

H1: βi  ≠ 0 ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa.

F <2

α t  (r-1)(r-2) → Chấp nhận H0

• Trắc nghiệm FH0: βi = 0 ↔ Phương trình hồi quy không thích hợp.

H1: βi  ≠ 0 ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi.

F < Fα(1,N-k-1) → Chấp nhận H0

Bài làm:

 Nhập dữ liệu vào bảng tính

 Dữ liệu nhất thiết phải được nhập theo cột.

Áp dụng Regression

 Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis

Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK 

BÙI MINH CHUNG_G0804070 Page 6

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 7/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Trong hộp thoại Regression, lần lượt ấn định các chi tiết:

− Phạm vi của biến số Y (input Y range)

− Phạm vi của biến số X (input X range)

−  Nhãn dữ liệu (Labels)

− Mức tin cậy (Confidence level)

− Tọa độ đầu ra (Output range)

− Đường hồi quy (Line Fit Plots),…

Các giá trị đầu ra cho bảng sau:

 Phương trình hồi quy:  Ŷx1=f(X1)

BÙI MINH CHUNG_G0804070 Page 7

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 8/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Ŷx1=2.73 + 0.04X1 (R 2=0.21, S=1.81)

t0=2.19 < t0.05 = 2.365 (hay Pv2=0.071>α=0.05) => Chấp nhận giả thiết H0

t1=1.38 < t0.05 = 2.365 (hay Pv=0.209>α=0.05) => Chấp nhận giả thiết H0

F=1.95 < F0.05 = 5.590 (hay Fs=0.209>α=0.05)=> Chấp nhận giả thiết H0

Vậy cả hai hệ số 2.73 (B0) và 0.04 (B1) của phương trình hồi quy Ŷx1 = 2.73 + 0.04X1 đềukhông có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp.

 Phương trình hồi quy: Ŷx2 = f(X2)

Ŷx2 = -11.141 + 0.129X2 (R 2=0.76,S=0.99)

BÙI MINH CHUNG_G0804070 Page 8

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 9/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

t0 = 3.418 > t0.05 = 2.365 (hay Pv2=0.011 > α=0.05) =>Bác bỏ giả thiết H0

t1= 4.757 > t0.05 = 2.365(hay Pv=0.00206 < α=0.05) =>Bác bỏ giả thiết H0

F= 22.631 > F=5.590(hay Fs=0.00206 < α=0.05) =>Bác bỏ giả thiết H0

Vậy cả hai hệ số -11.141 (B0) và 0.129 (B1) của phương trình hồi quy Ŷx2= -11.141 + 0.129X2

đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy  này thích hợp.

Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

 Phương trình hồi quy: Ŷx1,x2=f(X1,X2)

Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2 (R 2=0.97; S=0.33)

BÙI MINH CHUNG_G0804070 Page 9

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 10/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

t0=11.528 > t0.05=2.365 (hay Pv2=2.260.10-5<α=0.05)=>Bác bỏ giả thiết H0

t1=7.583 > t0.05=2.365 (hay Pv=0.00027<α=0.05) =>Bác bỏ giả thiết H0

F=131.392 > 5.14 (hay Fs=1.112*10-5<α=0.05) =>Bác bỏ giả thiết H0

Vậy cả hai hệ số -12.70 (B0), 0.04 (B1) và 0.13 (B1) của phương trình hồi quy Ŷx1,x2 =-12.7 +0.04X1 + 0.13X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.

Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.

Sự tuyến tính của phương trình Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2. Có thể được trình bày trong biểu đồ phân tán (scatter plots):

Biểu đồ phân tán

0

1

2

3

4

5

6

7

8

0 2 4 6 8

 Y

 Y dựđoán

 Nếu muốn dự đoán hiệu suất bằng phương trình hồi quy

Y= -12.70 + 0.04X1 + 0.13X2

chỉ cần chọn một ô, ví dụ như:

E20, sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:

BÙI MINH CHUNG_G0804070 Page 10

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 11/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2, 50 là giá trị của X1(thời gian)và 115 là giá trị của X2 (nhiệt độ)

Vậy hiệu suất phản ứng theo dự đoán ở 115°C trong vòng 50 phút là 4.3109%.

BÙI MINH CHUNG_G0804070 Page 11

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 12/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

BÀI 2: 

Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua

và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau:Loại phân

A B C

24

18

27

28

21

26

32

25

16

22

19

17

Với mức ý nghĩa α = 15%, hay so sánh số quả cà chua mọc trung bình khi bón ba loại phân A,B, C nói trên.

Phương pháp

 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bìnhcủa hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng cáctrắc nghiệm t hay z (so sánh hai giá trị trung bình).

Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố

(nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi(i=0,1,2,…,k). Mô hình:

Yếu tố thí nghiệm

1 2 ….. K  

Y11 Y21 ….. Yk1

Y12 Y22 ….. Yk2

….. ….. ….. …..

Y1N Y2N ….. YkN

Tổng cộngtrung bình

T1

1

 ___ 

T2

2

 ___ 

…..

…..

Tk 

k Y 

 ___ 

T

 ___ 

 Bảng ANOVA:

Nguồn sai số Bậc sai số Tổng số bình phương Bình phương trung bình Giá trị thống kê

Yếu tố

Sai số

k-1

 N-k 

SSF=

 N 

 N 

T k 

i

i2

1

2

−∑=

MSF=1−k 

SSF F=

 MSE 

 MSF 

BÙI MINH CHUNG_G0804070 Page 12

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 13/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

SSE=SST-SSFMSE=

k  N 

SSE 

Tổng cộng  N-1 SST= N T Y 

i

n

 j

n

2

1 1

2 −∑∑= =

Trắc nghiệm:

• Giả thiết:

H0: ⇔=== k  µ  µ  µ  .....21 “Các giá trị trung bình bằng nhau”

H1: ⇔≠  ji µ  µ  “Ít nhất có hai giá trị trung bình khác nhau”

• Giá trị thống kê: F= MSE  MSF 

• Biện luận: Nếu F < Fα(k-1;N-k) => chấp nhận giả thiết H0

Bài làm

Đây là bài toán phân tích phương sai một yếu tố , số quả cà chua mọc trung bình chịu ảnhhưởng bởi loại phân bón.

Giả thiết H0: µ1 = µ2 = µ3; tức số quả cà chua mọc trung bình là bằng nhau

 Nhập dữ liệu vào bảng:

Áp dụng Anova: Single Factor 

 Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.

Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK 

Trong hộp thoại Anova: Single Factor lần lượt ấn định

− Phạm vi đầu vào (Input range)

− Cách xắp xếp theo hàng hay cột (Group by)

−  Nhấn dử liệu (Labels in fisrt row/column)

− Phạm vi đầu ra (Output range)

BÙI MINH CHUNG_G0804070 Page 13

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 14/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

 Bảng Anova:

Kết luận:

Từ giá trị trong bảng Anova:

F= 3.8557 > Fα= 2.3597 => Bác bỏ H0

=> Lượng quả cà chua mọc trung bình khi sử dụng các loại phân khác nhau là khác nhau.

=> Số lượng quả cà chua mọc trung bình khi sử dụng 3 loại phân:

Loại A là : 24,2 Loại B là : 26 Loại C là : 21

=> Loại B > Loại A > Loại C

BÙI MINH CHUNG_G0804070 Page 14

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 15/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

BÀI 3: 

Một cửa hàng lớn có bán ba loại giày A,B,C. Theo dõi số khách hàng mua các loại giày nàytrong 5 ngày, người quả lý thu được bảng số liệu sau:

Loại giày

A A A

28 28 28

21 21 21

20 20 20

18 18 18

23 23 23

Với mức ý nghĩa α=1% hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên.

Bài làm

Đây là bài toán phân tích phương sai một yếu tố , mức tiêu thụ ảnh hưởng bởi loại giày

Giả thiết H0: µ1 = µ2 = µ3; tức lượng tiêu thụ trung bình là bằng nhau

 Nhập dữ liệu vào bảng tính

Áp dụng Anova: Single Factor 

 Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.

BÙI MINH CHUNG_G0804070 Page 15

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 16/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK 

Trong hộp thoại Anova: single factor lần lượt ấn định

− Phạm vi đầu vào(input range)

− Cách xắp xếp theo hang hay cột(group by)

−  Nhấn dữ liệu(labels in fisrt row/column)

− Phạm vi đầu ra(output range)

Sau khi nhấn OK xuất hiện bảng Anova:

Kết luận:

BÙI MINH CHUNG_G0804070 Page 16

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 17/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Từ giá trị trong bảng Anova:

F = 7.5864 > Fα = 6.9266 => Bác bỏ H0

=> Lượng tiêu thụ của 3 loại giày trên là khác nhau

Lượng tiêu thụ trung bình của loại giày A là 22

Lượng tiêu thụ trung bình của loại giày B là 32.2

Lượng tiêu thụ trung bình của loại giày C là 34.6

=> Lượng tiêu thụ trung bình: Loại C > Loại B > loại A

BÀI 4:

Bảng sau đây cho ta số liệu về màu tóc của 422 người:

Màu tóc Nam Nữ

Đen

Hung

 Nâu

Vàng

56

37

84

19

32

66

90

38

Với mức ý nghĩa 1%, nhận định xem liệu có mối quan hệ giữa màu tóc và giới tính hay không.

Phương pháp:

 KIỂM ĐỊNH TÍNH ĐỘC LẬP 

 Khái niệm thống kê và giả thuyết bài toán:

- Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu hiệu

định tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu đều là dấuhiệu định tính.

- Lấy mẫu kích thước n ta có bảng số liệu như sau:

BÙI MINH CHUNG_G0804070 Page 17

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 18/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

Trong đó:

- ni (i =1,k) – số lần X nhận xi

- m j (j =1,h) – số lần Y nhận y j

nij (i = 1,...,k ; j = 1,...,h) – số lần đồng thời X nhận xi và Y nhận y j

1

i ij

  j

n n=

=∑1

i ij

i

m n=

=∑1 1

k k 

i ij

i j

n n= =

=∑∑

Kiểm định giả thiết: H0: X và Y độc lập, với mức ý nghĩa α.

Tìm 2 2 [( 1)( 1)]k hα α  

 χ χ  = − − từ bảng phân vị χ 2 “khi bình phương”

Cách 1: Tính thống kê dựa vào các công thức sau:

2

ij20

1 1

( )k k 

ij

i j ij

n γ    χ  γ   = =

−=∑∑i j

ijnm

nγ    =

Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(n ij,γij), với lưu ý số lượng các giá trịcủa nij và γij phải bằng nhau.

Kết luận

 Nếu 220 α 

 χ  χ  < → Chấp nhận giả thiết H0.

Hoặc kết quả hàm CHITEST > α = 0.01 → Chấp nhận giả thiết H0.

Bài làm

Giả thiết: H0: Màu tóc độc lập với giới tính

 – Từ bảng phân vị χ 2 “khi bình phương”, ta có 34.111)-1)(4-(220.01 = χ 

−  Nhập bảng số liệu như hình sau

− Sử dụng hàm =SUM(B2:B5) và nút tự điền

BÙI MINH CHUNG_G0804070 Page 18

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 19/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

 – Tính thống kê dựa vào các công thức sau:2

ij2

0

1 1

( )k k ij

i j ij

n γ    χ  

γ   = =

−=∑∑ i j

ij

nm

nγ    =

Sau khi sử dụng với Excel ta có bảng số liệu γ ij như sau:

2 2 22

0

(56 40.872) (32 47.128) (38 30,5261)...

40.872 47.128 30,5261 χ  

− − −= + + +

− Hoặc sử dụng hàm CHITEST trong Excel:

BÙI MINH CHUNG_G0804070 Page 19

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 20/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

 – Kết luận:

Vì 220 α 

 χ  χ  > → Bác bỏ giả thiết H0.

Hoặc γij = 0.0002468 < α = 0.01 → Bác bỏ giả thiết H0.

Vậy: Màu tóc và giới tính có mối liên hệ với nhau.

BÀI 5:

Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của nhà máy sản xuất pin – ắc quyngười ta đo được mật độ nhiễm chì của họ như sau:

Số thứ tựquan sát

Mức nhân tố

F1 F2 F3 F4 F5

1

2

3

0,25

0,28

0,32

0,22

0,25

0,24

0,25

0,26

0,28

0,31

0,33

0,30

0,22

0,28

0,28

BÙI MINH CHUNG_G0804070 Page 20

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 21/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

4

5

6

7

0,22

0,22

0,28

0,31

0,21

0,22

0,25

0,22

0,28

0,31

0,29

0,25

0,25

0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy nói trên.

Bài làm

Đây là bài toán phân tích phương sai một yếu tố .

Giả thiết: H0: µ1 = µ2 = µ3 = µ4 = µ5; tức mức độ nhiễm chì của các công nhân ở 5 phânxưởng là bằng nhau.

 Nhập dữ liệu vào bảng:

Áp dụng Anova: Single Factor 

 Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.

Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK 

Trong hộp thoại Anova: Single Factor lần lượt ấn định

− Phạm vi đầu vào (Input range)

− Cách xắp xếp theo hàng hay cột (Group by)

−  Nhấn dử liệu (Labels in fisrt row/column)

− Phạm vi đầu ra (Output range)

− Chọn α = 0.05

BÙI MINH CHUNG_G0804070 Page 21

7/31/2019 Bao_cao_Nhom_7

http://slidepdf.com/reader/full/baocaonhom7 22/22

BÀI T P L N XÁC SU T TH NG KÊẬ Ớ Ấ Ố

 Bảng Anova:

Kết luận:

Từ giá trị trong bảng Anova: F=1.5828 < Fα=2.7763 => Chấp nhận H0.Vậy mức độ nhiễm chì của các công nhân ở 5 phân xưởng là bằng nhau.

BÙI MINH CHUNG_G0804070 Page 22