kiỂm ĐỊnh giẢ thiẾt thỐng kÊ filenộidung wednesday, november 29, 2017 2 1 •giới...
TRANSCRIPT
Bài 9
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Wednesday, November 29, 2017
1
Nội dung
Wednesday, November 29, 2017
2
• Giới thiệu về bài toán kiểm định1
• Kiểm định trung bình µ và tỷ lệ p2
• Kiểm định hiệu 2 trung bình 𝝁𝟏 − 𝝁𝟐và hiệu 2 tỷ lệ 𝒑𝟏 − 𝒑𝟐
3
29-Nov-17 3
Thực tế: Cần khảo sát tuổi trung bình của tổng thể rất nhiều người (người ta đưa ra giả thiết là 40 tuổi)
Với kết quả khảo sát được thì ta có thể kết luận tổng thể có trung bình 𝝁 =40 hay không ?
• Nên chấp nhận hay bác bỏ 𝑯𝒐?
• Độ tin cậy của quyết định trên ?
Population
(Null Hypothesis:H0: = 40 )
Kết quả khảo sát:
ഥ𝒙 = 𝟑𝟓 Sample
Lấy ra 1 mẫu ngẫu nhiên để khảo sát
Giới thiệu về bài toán kiểm định
Phân biệt ước lượng và kiểm định
• Kiểm định: Ta giả sử giả thiết ban đầu Ho: 𝝁 = 𝝁𝒐 = 𝟒𝟎 đang được cho là đúng và đi tìm cơ sở để
chấp nhận hay bác bỏ 𝐻𝑜
• Tiến hành lấy mẫu và tính toán ҧ𝑥 . • Nếu ҧ𝑥 gần 𝝁𝒐 : chấp nhận 𝐻𝑜
• Nếu ҧ𝑥 x𝐚 𝝁𝒐 : bác bỏ 𝐻𝑜
29-Nov-17 5
𝝁 = 𝝁𝒐 = 𝟒𝟎
Chấp nhận 𝑯𝟎
Bác bỏ 𝑯𝟎
ഥ𝒙 = 𝟑5
Cần có 1 tiêu chuẩn để biết được khi nào thì chấp nhận hay bác bỏ
Phân phối của ഥ𝑿
Giá trị tới hạn – Critical Value
95%
Đặt giả thiết thống kê
• Giả thiết thống kê: Là một phát biểu về tham số tổng thể Ví dụ : – “Chiều cao trung bình của sv là 165cm”
– “Chiều cao trung bình của sv là lớn hơn hoặc bằng 165cm”
– “Chiều cao trung bình của sv bé hơn 165cm”
• Phân loại: giả thiết 𝑯𝟎 và giả thiết đối 𝑯𝟏• Giả thiết 𝐻0: còn gọi là giả thiết không.
Tức là giả thiết có dấu bằng
(gồm 3 trường hợp: 𝜽 = 𝜽𝟎, 𝜽 ≥ 𝜽𝟎, 𝜽 ≤ 𝜽𝟎)
• Giả thiết đối 𝐻1: giả thiết ngược lại với 𝑯𝟎
29-Nov-17 6
Đặt giả thiết thống kê
Chúng ta có 3 cách đặt giả thiết thống kê để kiểm định: Kiểm định 2 phía
• 𝑯𝟎: 𝜽 = 𝜽𝟎
• 𝑯𝟏: 𝜽 ≠ 𝜽𝟎
Kiểm định bên trái• 𝑯𝟎: 𝜽 ≥ 𝜽𝟎 hoặc ghi 𝑯𝟎: 𝜽 = 𝜽𝟎
• 𝑯𝟏: 𝜽 < 𝜽𝟎
Kiểm định bên phải• 𝑯𝟎: 𝜽 ≤ 𝜽𝟎 hoặc ghi 𝑯𝟎: 𝜽 = 𝜽𝟎
• 𝑯𝟏: 𝜽 > 𝜽𝟎
Lưu ý: dấu “ = “ luôn nằm ở giả thiết 𝐻0
29-Nov-17 7
Đặt giả thiết thống kê
Ví dụ: giả thiết về chiều cao trung bình của sv
𝐻0: 𝜇 = 𝜇0 = 165cm (chiều cao là 165 cm)
𝐻1: 𝜇 ≠ 165 (hay 𝜇 < 165 hay 𝜇 > 165)
Ví dụ: giả thiết về tỷ lệ sản phẩm tốt
𝐻0: 𝑝 = 𝑝0 = 85%
𝐻1: 𝑝 ≠ 85% (hay 𝑝 < 85% hay 𝑝 > 85%)
Giả thiết 𝐻1 được chọn tùy theo yêu cầu thực tế hoặc mục đích của người nghiên cứu. Ví dụ:
– KĐ: “Chiều cao trung bình của sv thấp hơn 165cm?” → bên trái.
– KĐ: “Chiều cao trung bình của sv khác 165cm?” → hai phía.
29-Nov-17 8
Ví dụ về đặt giả thiết
Ví dụ:
• Nhà trường tuyên bố chiều cao t.bình của sv là 𝝁 = 𝝁𝟎 = 𝟏𝟔𝟓cm.
• Chúng ta cần đi kiểm định khẳng định trên của nhà trường có đúng hay không?
• Chọn một mẫu ngẫu nhiên gồm 100 sinh viên, thấy chiều cao trung bình của mẫu là: ഥ𝒙 = 𝟏𝟔𝟐𝒄𝒎.
• Ta có thể chọn 1 trong 2 cách đặt giả thiết 𝐻1 tùy mục đích của người đi kiểm định:
𝐻1: 𝜇 < 𝜇0 (kiểm định bên trái) : “Chiều cao trung bình của sv thấp hơn 165cm?”
𝐻1: 𝜇 ≠ 𝜇0 (kiểm định hai phía): “Chiều cao trung bình của sv khác 165cm
Quiz: Hãy viết giả thiết 𝐻0 tương ứng của 2 trường hợp trên.
29-Nov-17 9
Sai lầm và mức ý nghĩa α
• Mục tiêu: kiểm định một giả thiết sao cho xác suất phạm phải sai lầm khi đưa ra một quyết định là nhỏ nhất.
• Ta có hai loại sai lầm:
– Sai lầm loại I: bác bỏ 𝑯𝟎|𝑯𝟎 đúng
– Sai lầm loại II: chấp nhận 𝑯𝟎|𝑯𝟎 sai
• Mức ý nghĩa 𝛼 = xác suất mắc phải sai lầm loại I(the significance level of the test)
29-Nov-17 Nguyễn Phi Hùng 10
𝜶 = P (reject 𝑯𝟎 𝑯𝟎 true
Sai lầm và mức ý nghĩa α
Ví dụ: “kiểm định chiều cao trung bình của sv khác 165cm với mức ý nghĩa 𝜶 = 𝟓%”
• Tức là chúng ta phải lựa chọn giữa 2 giả thiết𝑯𝟎: 𝝁 = 𝟏𝟔𝟓 cm 𝑯𝟏: 𝝁 ≠ 𝟏𝟔𝟓 cm
• Nghĩa là nếu H0 thực sự đúng thì ta có khả năng phạm sai lầm (tuyên bố bác bỏ H0) là 𝛼 = 5%
• Người ta hay xét các mức ý nghĩa: 10%, 5% và 1%.
29-Nov-17 Nguyễn Phi Hùng 11
Mức ý nghĩa 𝛼 càng nhỏ thì khả năng phạm sai lầm khi bác bỏ H0 càng thấp
29-Nov-17 12
Kiểm định giá trị trung bình
• Với bài toán kiểm định giá trị trung bình 𝜇, người ta chuẩn tắc hóa ĐLNN ത𝑋 bằng tiêu chuẩn kiểm định Z:
ത𝑋 ∼ 𝑁 𝜇𝑜,𝜎2
𝑛↔ 𝑍 =
ത𝑋 − 𝜇0
𝜎/ 𝑛∼ 𝑁(0,1)
• Khi đó với mẫu cụ thể ta tính được giá trị kiểm định
𝑧 =ҧ𝑥−𝜇0
𝜎/ 𝑛hoặc 𝑧 =
ҧ𝑥−𝜇0
Ƹ𝑠/ 𝑛khi không biết
• Từ đó để quyết định xem ҧ𝑥 gần hay xa so với 𝜇0 thì tương đương với việc giá trị z gần hay xa giá trị 0
– Nếu ҧ𝑥 gần 𝜇0 ↔ z sẽ gần giá trị 0
– Nếu ҧ𝑥 xa 𝜇0 ↔ z sẽ xa giá trị 0
29-Nov-17 13
Hai phương pháp kiểm định
Có 2 phương pháp để đưa ra quyết định chấp nhận hay bác bỏ giả thiết H0
1. Phương pháp giá trị tới hạn
• So sánh giá trị kiểm định (z hoặc t) với giá trị tới hạn(zc hoặc tc)
2. Phương pháp giá trị P
• So sánh giá trị P_value với mức ý nghĩa α
29-Nov-17 Nguyễn Phi Hùng 14
Phương pháp dùng giá trị tới hạn
29-Nov-17 15
Phương pháp dùng giá trị tới hạn
1. Tính toán giá trị tới hạn: 𝒛𝒄 ( hoặc tc nếu là mẫu nhỏ n < 30 )
2. Tính toán giá trị kiểm định: 𝒛 =ഥ𝒙−𝝁𝟎
ො𝒔/ 𝒏( hoặc t nếu mẫu nhỏ )
3. So sánh giá trị kiểm định z với giá trị tới hạn zc để kết luận.
– Với kiểm định bên trái : ta so sánh z với – 𝒛𝒄
– Với kiểm định bên phải : ta so sánh z với 𝒛𝒄
– Với kiểm định 2 phía : so sánh z với 𝒛𝒄 hoặc −𝒛𝒄
(hoặc có thể so sánh với giá trị tuyệt đối của zc - tham khảo sách)
29-Nov-17 16
a a/2 a/2a
-zc -zczc zc
Bác bỏ H0 nếu z < -zc Bác bỏ H0 nếu z > zc Bác bỏ H0 nếu z < -zc hay z > zc
𝑯𝒐 𝑯𝒐 𝑯𝒐
Cách tính giá trị tới hạn zc , tc
𝑯𝟎: 𝝁 ≥ 𝟏𝟔𝟓𝑯𝟏: 𝝁 < 𝟏𝟔𝟓
𝑯𝟎: 𝝁 ≤ 𝟏𝟔𝟓𝑯𝟏: 𝝁 > 𝟏𝟔𝟓
𝑯𝟎: 𝝁 =165𝑯𝟏: 𝝁 ≠ 𝟏𝟔𝟓
Kiểm định bên trái
Kiểm định bên phải
Kiểm định 2 phía
a
0 𝒛𝒄
0
a/2a/2
𝒛𝒄−𝒛𝒄
Giá trị tới hạn 𝒛𝒄 hoặc 𝒕𝒄 được tính từ mức ý nghĩa α và tùy thuộc kiểm định 2 phía hay 1 phía.
𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝟏 − 𝜶/𝟐)
𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝟏 − 𝜶)
𝒕𝒄 = 𝑻. 𝑰𝑵𝑽(𝟏 − 𝜶, 𝒏 − 𝟏)
𝒕𝒄 = 𝑻. 𝑰𝑵𝑽(𝟏 − 𝜶/𝟐, 𝒏 − 𝟏)
Chú ý: 𝒛𝒄, 𝒕𝒄 là các giá trị không âm
Ví dụ:
Mức ý nghĩa α 1% 2% 5% 10%
Độ tin cậy 1- α 99% 98% 95% 90%
KĐ 2 phía zc 2.58 2.33 1.96 1.64
KĐ 1 phía zc 2.33 2.05 1.64 1.28
29-Nov-17 18
Sử dụng Excel để tính toán giá trị zc cho kiểm định 2 phía và 1 phía với các mức ý nghĩa α= 1% , 2%, 5% và 10%
Với KĐ 2 phía : 𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝟏 − 𝜶/𝟐)Với KĐ 1 phía : 𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝟏 − 𝜶)
0
a/2a/2
𝒛𝒄−𝒛𝒄
a
0 𝒛𝒄
Ví dụ 1: Kiểm định 2 phía
Ví dụ 1:
• Nhà trường tuyên bố chiều cao trung bình của sinh viên là 𝝁 =𝝁𝟎 = 𝟏𝟔𝟓cm.
• Chọn một mẫu ngẫu nhiên gồm 100 sinh viên, thấy chiều cao trung bình của mẫu ഥ𝒙 = 𝟏𝟔𝟐𝒄𝒎 , với độ lệch chuẩn có hiệu chỉnh là Ƹ𝑠 = 5 𝑐𝑚
• Kiểm định giả thiết “Chiều cao trung bình của sv khác 165cm?”với mức ý nghĩa 5%.
29-Nov-17 19
Ví dụ 1: Kiểm định 2 phía
Step 1 : Xác định giá trị cần quan tâm
Ở đây là chiều cao trung bình của toàn thể sinh viên 𝝁
Step 2. Xác định các giả thiết thống kê
𝑯𝟎: 𝝁 = 𝟏𝟔𝟓 : chiều cao là 165cm
𝑯𝟏: 𝝁 ≠ 𝟏𝟔𝟓 : chiều cao khác 165cm
(Dựa vào H1 ta thấy đây là bài toán kiểm định 2 phía)
Step 3. Xác định mức ý nghĩa của kiểm định
Bài toán yêu cầu mức ý nghĩa 5% để kiểm định
Các mức ý nghĩa hay sử dụng là 1%,2%,5%,10%
Chú ý: Nếu ko có yêu cầu cụ thể thì ta tự chọn α = 5%
29-Nov-17 20
Ở đây ta đã lấy mẫu 100 sinh viên, và tính toán ra được:𝒏 = 𝟏𝟎𝟎, ഥ𝒙 = 𝟏𝟔𝟐 , ෝ𝒔 = 𝟓
• Step 4: Lấy mẫu và tính toán giá trị tới hạn và giá trị kiểm định cho phù hợp với bài toán:
Ví dụ 1: Kiểm định 2 phía
Vì biết mẫu lớn 𝒏 ≥ 𝟑𝟎 nên ta sẽ sử dụng PP chuẩnTính giá trị tới hạn 𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽 𝟏 − 𝜶/𝟐 = 𝟏. 𝟗𝟔Tính giá trị kiểm định z
𝒛 =ഥ𝒙 − 𝝁𝒐
ො𝒔𝒏
=𝟏𝟔𝟐 − 𝟏𝟔𝟓
𝟓
𝟏𝟎𝟎
= −𝟔
• Step 5. Dựa vào hình vẽ đưa ra quyết định
Do 𝒛 = −𝟔 < −𝟏. 𝟗𝟔, ta có cơ sở bác bỏ giả thiết 𝑯𝒐
Kết luận: với mức ý nghĩa 5%, ta bác bỏ giả thiết 𝐻𝑜 (hoặc chấp
nhận giả thiết 𝐻1), tức là chấp nhận giả thiết chiều cao trung bình
của sinh viên khác 165cm
Ví dụ 1: Kiểm định 2 phía
a/2 = .025
−𝒛𝒄= −1.96
0
𝒛 = −6
z
Bác bỏ H0 Không bác bỏ H0
𝑯𝒐
Bác bỏ H0
a/2 = .025
𝒛𝒄 =1.96
Ví dụ 2: Kiểm định bên trái
Ví dụ 2:
• Nhà trường tuyên bố “chiều cao trung bình của sinh viên bé hơn 165cm”. Hãy kiểm định tuyên bố trên của trường học với mức ý nghĩa α=5%.
• Chọn một mẫu ngẫu nhiên gồm 100 sv, thấy chiều cao trung bình của mẫu ഥ𝒙 = 𝟏𝟔𝟐𝒄𝒎 , với độ lệch chuẩn có hiệu chỉnh là Ƹ𝑠 = 5 𝑐𝑚
29-Nov-17 23
Gọi 𝜇 là chiều cao trung bình của toàn thể sinh viên. Ta cần kiểm định giữa 2 giả thiết
𝑯𝟎: 𝝁 ≥ 𝝁𝟎 = 𝟏𝟔𝟓𝒄𝒎𝑯𝟏: 𝝁 < 𝝁𝟎 : tuyên bố
Dựa vào 𝑯𝟏 ta thấy đây là bài toán kiểm định bên trái Mẫu lớn 𝑛 = 100 nên ta sử dụng PP chuẩn.
Ví dụ 2: Kiểm định bên trái
Tính giá trị tới hạn:𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽(𝟏 − 𝜶) = 𝟏. 𝟔𝟒
Tính giá trị kiểm định:
𝒛 =ഥ𝒙 − 𝝁𝒐
ො𝒔𝒏
=𝟏𝟔𝟐 − 𝟏𝟔𝟓
𝟓
𝟏𝟎𝟎
= −𝟔
Kiểm định bên trái nên ta so sánh z với – zc
Do 𝒛 = −𝟔 < −𝟏. 𝟔𝟒, ta có cơ sở bác bỏ giả thiết 𝑯𝒐
Kết luận: với mức ý nghĩa 5%, ta bác bỏ giả thiết 𝐻𝑜,chấp nhận giả thiết 𝐻1, tức là chấp nhận chiều cao trung bình của sinh viên sẽ nhỏ hơn 165cm
29-Nov-17 24
Bác bỏ H0 Không bác bỏ H0
a = .05
−𝒛𝒄 = −𝟏.64
0
𝑯𝒐
Ví dụ 3: Kiểm định bên phải (mẫu nhỏ)
Một trang web du lịch cho biết chi phí trung bình thuê 1 phòng kháchsạn ở New York là khoảng 168$ cho 1 đêm.
Để kiểm định giả thuyết trên, người ta lấy mẫu gồm 25 khách sạn vàtính toán được chi phí trung bình ഥ𝒙 = $𝟏𝟕𝟐. 𝟓𝟎 và ො𝒔 = $𝟏𝟓. 𝟒𝟎.
Hãy kiểm định giả thuyết chi phí thuê trung bình không quá 168$ vớimức ý nghĩa a = 0.05
(Giả sử chi phí thuê tuân theo phân phối chuẩn)
𝑯𝟎: 𝝁 ≤ 𝟏𝟔𝟖
𝑯𝟏: 𝝁 > 𝟏𝟔𝟖
Giá trị kiểm định:
t =തx − μ𝒐
ො𝒔n
= 172.50 − 168
15.40
25
= 1.46
Với n = 25
Mẫu nhỏ (𝒏 < 𝟑𝟎) nên ta dùng PP student
Giá trị tới hạn (Tra bảng) 𝒕𝒄 = 𝑻. 𝑰𝑵𝑽 𝟏 − 𝟓%, 𝟐𝟒= 𝟏. 𝟕𝟏
Ví dụ 3: Kiểm định bên phải (mẫu nhỏ)
Do 𝒕 = 𝟏. 𝟒𝟔 < 𝟏. 𝟕𝟏 nên chấp nhận giả thiết H0
Kết luận: Với mức ý nghĩa 5%, ta chấp nhận giả thiết chi phí trung bình thuê 1 phòng khách sạn ở New York là không quá 168$ cho 1 đêm
𝑯𝟎: 𝝁 ≤ 𝟏𝟔𝟖
𝑯𝟏: 𝝁 > 𝟏𝟔𝟖
t = 1.46
Bác bỏ H0
Không bác bỏ H0 𝒕𝒄 = 𝟏. 𝟕𝟏0
Known
Large Samples
Unknown
Hypothesis Tests for μ
Small Samples
Sử dụng PP chuẩn
Kiểm định trung bình: giá trị kiểm định
0x μz
σ
n
• σ biết• Mẫu lớn 𝒏 ≥ 𝟑𝟎 hoặc
mẫu bé 𝒏 < 𝟑𝟎
Known
Large Samples
Unknown
Hypothesis Tests for
Small Samples
Kiểm định trung bình: giá trị kiểm định
• σ không biết => thay bằng ො𝒔
• Mẫu lớn 𝒏 ≥ 𝟑𝟎
Sử dụng PP chuẩn
z =ഥ𝑥 − 𝜇𝑜
Ƹ𝑠𝑛
Known
Large Samples
Unknown
Hypothesis Tests for
Small Samples
Sử dụng PP Student với (n-1) bậc tự do
Kiểm định trung bình: giá trị kiểm định
(Tổng thể phải có PP chuẩn
hoặc xấp xỉ PP chuẩn)
• σ không biết => thay bằng ො𝒔
• Mẫu bé 𝒏 < 𝟑𝟎
𝑡 =ഥ𝑥 − 𝜇𝑜
Ƹ𝑠𝑛
Kiểm định tỷ lệ: giá trị kiểm định
0
0 0(1 )
f pz
p p
n
𝒏 ≥ 𝟑𝟎
Hypothesis Tests for p
Không được sử
dụng do độ lệch
nhiều
𝒏 < 𝟑𝟎Sử dụng PP chuẩn
Kiểm định tỷ lệ (1 phía)
Bài 7.5: Một nhà sản xuất cho rằng có ít nhất 95% thiết bị do mình cung cấp cho một nhà máy được xác nhận đạt thông số kỹ thuật. Kiểm tra một mẫu gồm 200 thiết bị thì thấy có 18 thiết bị không đạt. Hãy kiểm định lời tuyên bố của nhà sản xuất này với mức ý nghĩa:
a) 0,01.
b) 0,05.
29-Nov-17 31
• Ta phải quyết định giữa hai giả thiết:
• Bài toán kiểm định 1 phía (phía trái) với 𝒑𝟎 = 𝟗𝟓%
• Với mức ý nghĩa a = 𝟎, 𝟎𝟏
• Tính toán giá trị tới hạn cho kiểm định 1 phía:𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽 𝟏 − 𝒂 = 𝟐. 𝟑𝟑
• Tính toán giá trị kiểm định:
𝑧 =𝑓 − 𝑝0
)𝑝0(1 − 𝑝0
𝑛 = −2.59
H0: 𝒑 ≥ 𝟗𝟓% và H1: 𝒑 < 𝟗𝟓%
Kiểm định tỷ lệ (1 phía)
29-Nov-17 32
29-Nov-17 33
Do not reject H0
Reject H0
0
z = -2.59
-2.33
a = .01
.0064
• Kiểm định bên trái nên ta so sánh với −𝑧𝑐
• Do 𝒛 = −𝟐. 𝟓𝟗 < −𝟐.33 nên ta bác bỏ giả thiết 𝑯𝟎
• Kết luận: Với mức ý nghĩa 1%, ta bác bỏ lời tuyên bố của nhà sản suất, tức là tỷ lệ thiết bị đạt thông số sẽ nhỏ hơn 95%
Kiểm định tỷ lệ (1 phía)
𝑯𝒐
Bài tập 1
29-Nov-17 34
• Trước đây, sức chịu lực trung bình của các sợi cáp do một
công ty sản xuất là 1.800 kg. Một kỹ thuật mới được áp dụng
vào quy trình sản xuất khẳng định rằng sức chịu lực trung
bình của các sợi cáp tăng lên.
• Để kiểm định lời khẳng định này, người ta kiểm tra một mẫu
gồm 50 sợi cáp và thấy sức chịu lực trung bình là 1.850 kg và độ lệch chuẩn có điều chỉnh là 100 kg.
• Chúng ta có thể ủng hộ lời khẳng định này ở mức ý nghĩa
0,01 không?
Bài tập 2
29-Nov-17
Một hãng xe ô tô tuyên bố là một loại xe mới do hãng sản xuất chỉ
tiêu tốn trung bình 3.0 lít xăng cho 100km trên đường cao tốc. Một tổ
chức độc lập kiểm tra khẳng định này, bằng cách cho 5 người chạy
thử 5 xe khác nhau của loại xe mới đó, và kết quả là 2.90, 2.95,
3.10, 3.35, 3.45 (lít/100km).
a) Dựa theo số liệu này, hãy xác định xem tuyên bố của hãng xe ô
tô có chấp nhận được hay không?
b) Giả sử cho 5 người khác chạy thử thêm 5 xe, và được thêm 5
kết quả là: 2.95, 3.00, 3.15, 3.30, 3.40 (lít/100km). Kiểm định lại
xem tuyên bố của hãng xe có chấp nhận được hay không dựa
trên tổng cộng 10 kết quả.
35
Chú ý : Với bài toán này. Ta có thể kiểm định 2 phía hoặc kiểm định bên trái đều chấp nhận được.
Bài tập 3
A researcher wishes to test the claim that the average cost of tuition and fees at a fouryear public college is greater than $5700.
She selects a random sample of 36 four-year public colleges and finds the mean to be $5950. The standard deviation is $659.
Is there evidence to support the claim at α = 0.05?
29-Nov-17 36
Bài tập 4
Salaries of Ph.D. Students Full-time Ph.D. students receive an average salary of $12,837 according to the U.S. Department of Education. The dean of graduate studies at a large state university feels that Ph.D. students in his state earn more than this. He surveys 44 randomly selected students and finds their average salary is $14,445, and the standard deviation is $1500.
With α=0.05, is the dean correct?
29-Nov-17 37
Phương pháp dùng giá trị P để kiểm định
Nếu 𝒑 − 𝒗𝒂𝒍𝒖𝒆 ≤ 𝜶 , bác bỏ H0
Nếu 𝒑 − 𝒗𝒂𝒍𝒖𝒆 > 𝜶 , không bác bỏ H0
Phương pháp dùng giá trị p để kiểm định
• Thay vì sử dụng giá trị kiểm định z và so sánh với giá trị tới hạn 𝑧𝑐
• Ta tính toán ra 𝑝𝑣𝑎𝑙𝑢𝑒 (xs tương ứng với giá trị z) và so sánh với mức ý nghĩa 𝛼 (xs tương ứng với giá trị zc)
• Chú ý: Người ta nói 𝒑𝒗𝒂𝒍𝒖𝒆 chính là giá trị nhỏ nhất của 𝜶 mà ta có thể bác bỏ giả thiết 𝐻𝑜
p_value cho trường hợp kiểm định bên trái
Ví dụ 1: Thay vì so sánh 𝑧 = −2 và 𝑧𝑐 = −1.645 và đưa ra kết luận
Ta có thể kiểm tra 𝒑𝒗𝒂𝒍𝒖𝒆 và α như sau:
p-value =.0228
a = .05
-1.645 0
𝒛 = −𝟐
Do là kiểm định bên trái nên chỉ tính diện tích bên trái điểm 𝑧 = −2:
𝐩𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝒁 < −𝟐 = 𝟎. 𝟎𝟐𝟐𝟖 = 𝟐. 𝟑𝟖% bé hơn α = 5%
Với mức ý nghĩa 5%, ta bác bỏ giả thiết 𝐻𝑜 và chấp nhận H1
𝑯𝟏: < 𝟎𝑯𝒐
p -value cho trường hợp kiểm định bên phải
Giả sử tính toán ra 𝒛 = 𝟎. 𝟖𝟖. Ta không cần tính giá trị zc
𝐩𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝒁 > 𝟎. 𝟖𝟖 = 𝟏𝟖. 𝟗𝟒% > 𝟓%
Với mức ý nghĩa 5%, ta không có cơ sở bác bỏ 𝐻𝑜
z = 0.88
Reject H0
a = .05
Do not reject H0 𝒛𝒄 = 𝟏.64
0
p-value = 0.1894
𝑯𝟏: > 𝟎𝑯𝒐
Ví dụ 2: Tương tự trên cho kiểm định bên phải
p_value cho trường hợp kiểm định 2 phía
Giả sử tính toán ra 𝒛 = 𝟐. 𝟒𝟕. Kiểm định 2 phía nên 𝑝𝑣𝑎𝑙𝑢𝑒 sẽ được tính gồm 2 phần (bên trái và bên phải): 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝒁 > 𝟐. 𝟒𝟕 + 𝑷 𝒁 < −𝟐. 𝟒𝟕𝒑𝒗𝒂𝒍𝒖𝒆 = 𝟐 × 𝑷(𝒁 < −𝟐. 𝟒𝟕) = 𝟐 ∗ 𝟎. 𝟎𝟎𝟔𝟖 = 𝟎. 𝟎𝟏𝟑𝟔
𝐩𝐯𝐚𝐥𝐮𝐞 = 1.36% < 5% ⇒ Bác bỏ 𝐻𝑜
Reject H0Reject H0
a/2 = .025
1.960
-2.47 2.47
-1.96
a/2 = .025
.0068.0068 𝑯𝟏: ≠ 𝟎𝑯𝒐
Bảng tóm tắt: kiểm định trung bình
43
Kiểm định bên trái
Kiểm định bên phải
Kiểm định 2 phía
Giả thiết thống kê
𝐻𝑜: 𝜇 ≥ 𝜇𝑜
𝐻1: 𝜇 < 𝜇0
𝐻𝑜: 𝜇 ≤ 𝜇𝑜
𝐻1: 𝜇 > 𝜇0
𝐻𝑜: 𝜇 = 𝜇𝑜
𝐻1: 𝜇 ≠ 𝜇0
Giá trị kiểm định𝑧 =
ҧ𝑥 − 𝜇0
𝜎/ 𝑛𝑧 =
ҧ𝑥 − 𝜇0
𝜎/ 𝑛𝑧 =
ҧ𝑥 − 𝜇0
𝜎/ 𝑛
PP kết luận 1: Sử dụng p_value
Bác bỏ 𝐻𝑜 nếup_value ≤ 𝛼
Bác bỏ 𝐻𝑜 nếup_value ≤ 𝛼
Bác bỏ 𝐻𝑜 nếup_value ≤ 𝛼
PP kết luận 2 : So sánh với giá trị tới hạn
Bác bỏ 𝐻𝑜 nếu𝑧 ≤ −𝑧𝑐
Bác bỏ 𝐻𝑜 nếu𝑧 ≥ 𝑧𝑐
Bác bỏ 𝐻𝑜 nếu𝑧 ≥ 𝑧𝑐 hoặc𝑧 ≤ −𝑧𝑐
Kiểm định trung bình với mẫu lớn (2 phía)
Ví dụ 7.3 SGK:
Tuổi thọ trung bình của một mẫu gồm 100 bóng đèn huỳnh
quang do một công ty sản xuất là 1.570 giờ, độ lệch chuẩn 120
giờ. Gọi là tuổi thọ trung bình của tất cả các bóng đèn do công ty này sản xuất.
a) Hãy kiểm định giả thiết = 1.600 giờ, với giả thiết đối
1.600 giờ, với mức ý nghĩa α=5%
b) Tìm giá trị P của kiểm định này. Dùng phương pháp giá trị
P để kiểm định.
29-Nov-17 44
• Đây là bài toán kiểm định 2 phía
• Ta phải quyết định giữa hai giả thiết:
• Với mức ý nghĩa a = 𝟎, 𝟎𝟓
• Tính toán giá trị tới hạn
𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽 𝟏 −𝜶
𝟐= 𝟏, 𝟗𝟔
• Tính toán giá trị kiểm định (kiểm định trung bình)
𝒛 =ഥ𝒙 − 𝝁
ො𝒔/ 𝒏=
ഥ𝒙 − 𝝁
𝒔/ 𝒏 − 𝟏=
𝟏𝟓𝟕𝟎 − 𝟏𝟔𝟎𝟎
𝟏𝟐𝟎𝟏𝟎𝟎 − 𝟏 = −𝟐. 𝟒𝟗
H0: = 1.600 giờ và H1: 1.600 giờ
Kiểm định trung bình với mẫu lớn (2 phía)
29-Nov-17 45
Kiểm định trung bình với mẫu lớn (2 phía)
29-Nov-17 46
Do not reject H0
Reject H0Reject H0
a/2 = .025
1.960
z = -2.49
-1.96
a/2 = .025
.0064.0064
• Đây là bài toán kiểm định 2 phía. Ta có 2 cách để kiểm định
• Hoặc dựa vào : 𝒛 = −𝟐. 𝟒𝟗 < −𝟏. 𝟗𝟔
• Hoặc dựa vào: 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝟐 × 𝑷 𝒁 < −𝟐. 𝟒𝟗 = 𝟏. 𝟐𝟖% < 𝟓%
• Suy ra ta có cơ sở bác bỏ giả thiết 𝑯𝟎
• Kết luận: Với mức ý nghĩa 5%, ta chấp nhận giả thiết tuổi thọ trung bình của bóng đèn do công ty này sx khác 1600 giờ
𝑯𝒐
Tương tự : K.định trung bình mẫu nhỏ (2 phía)
Một trang web du lịch cho biết chi phí trung bình thuê 1phòng khách sạn ở New York là khoảng 168$ cho 1 đêm.
Để kiểm định giả thuyết trên, người ta lấy mẫu gồm 25khách sạn và tính toán được chi phí trung bình ഥ𝒙 =$𝟏𝟕𝟐. 𝟓𝟎 và ො𝒔 = $𝟏𝟓. 𝟒𝟎.
Hãy kiểm định giả thuyết μ = 168 với mức ý nghĩa a = 0.05.
H0: μ = 168
H1: μ 168
t =തx − μ
ො𝒔n
= 172.50 − 168
15.40
25
= 1.46
a = 0.05
n = 25
Vì mẫu nhỏ ta dùng PP student
Kiểm định trung bình với mẫu nhỏ (2 phía)
• 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝑻 < −𝟏. 𝟒𝟔 + 𝑷 𝑻 > 𝟏. 𝟒𝟔 = 𝟐 × 𝑷 𝑻 < −𝟏. 𝟒𝟔
= 𝟐 × 𝑻. 𝑫𝑰𝑺𝑻 −𝟏. 𝟒𝟔, 𝟐𝟒, 𝟏 = 𝟕. 𝟖𝟔% (ở đây P-value tính cho 2 phía)
• Vì 𝒑𝒗𝒂𝒍𝒖𝒆 > 𝟓% nên chấp nhận giả thiết H0
Kết luận: Với mức ý nghĩa 5%, ta chấp nhận giả thiết chi phí trung bình thuê 1 phòng khách sạn ở New York là 168$ cho 1 đêm
H0: μ = 168
H1: μ 168
Reject H0Reject H0
a/2=.025
-tc 0 tc
a/2=.025
-2.0639 2.06391.46
Tóm tắt PP giá trị p
29-Nov-17 49
Luật kiểm định:
• Giá trị p-value càng nhỏ, thì ta càng có nhiều cơ sở để bác bỏ 𝑯𝟎và chấp nhận 𝑯𝟏
• Có giá trị P, ta dễ dàng đưa ra được kết luận cho cả 2 bài toán: kiểm định 1 phía và 2 phía mà không cần tính zc hay tc
• Nếu biết mức ý nghĩa 𝜶 P_value ≤ 𝛼: bác bỏ giả thiết 𝐻0
P_value > 𝛼: chấp nhận 𝐻0
• Nếu chưa biết mức ý nghĩa 𝜶 P_value < 1% : có cơ sở RẤT MẠNH để bác bỏ 𝐻0
1% < P_value < 5% : có ĐỦ CƠ SỞ để bác bỏ 𝐻0
P_value > 5% : ta chấp nhận 𝐻0
• p_value ≤ 𝛼 : bác bỏ 𝐻0.
• p_value > 𝛼 : chấp nhận 𝐻0.
Bài tập: Kiểm định trung bình (1 phía)
Bài 7.4: Sức chịu lực của các sợi cáp do một công ty sản xuất có sức chịu lực trung bình là 1.800 kg và độ lệch chuẩn 100 kg. Một kỹ thuật mới được áp dụng vào quy trình sản xuất khẳng định rằng sức chịu lực trung bình của các sợi cáp tăng lên. Để kiểm định lời khẳng định này, người ta kiểm tra một mẫu gồm 50 sợi cáp và thấy sức chịu lực trung bình là 1.850 kg.
a) Chúng ta có thể ủng hộ lời khẳng định này ở mức ý nghĩa 0,01 không?
b) Giá trị P của kiểm định này là bao nhiêu?
29-Nov-17 50
Bài tập:
Khi làm việc bình thường, một máy sản xuất chip máy tính sẽ không sản xuất nhiều hơn 4% sản phẩm hỏng. Tuy nhiên nếu máy sản xuất nhiều hơn 4% sản phẩm hỏng thì cần phải ngưng sản xuất và mang đi bảo hành. Để đảm bảo đúng qui trình như vậy, bộ phận kiểm soát sẽ thường xuyên lấy mẫu. Giả sử trong một mẫu n=200 được lấy người ta thấy có m=12 sản phẩm bị lỗi.
Dùng phương pháp giá trị p, hãy quyết định xem có cần phải mang máy đó đi bảo hành hay không?
29-Nov-17 51
Bài tập:
The management of Priority Health Club claims that its members lose an average of 10 pounds or more within the first month after joining the club.
A consumer agency that wanted to check this claim took a random sample of 36 members of this health club and found that they lost an average of 9.2 pounds within the first month of membership. The standard deviation is known to be 2.4 pounds.
Find the p-value for this test. What will your decision be if α=.01? What if α=.05?
29-Nov-17 52
29-Nov-17 53
Kiểm định hiệu 2 trung bình
Kiểm định bên trái
H0: μ1 μ2
H1: μ1 < μ2
Hoặc viết là
H0: μ1 – μ2 0H1: μ1 – μ2 < 0
Kiểm định bên phải
H0: μ1 ≤ μ2
H1: μ1 > μ2
Hoặc viết là
H0: μ1 – μ2 ≤ 0H1: μ1 – μ2 > 0
Kiểm định 2 phía
H0: μ1 = μ2
H1: μ1 ≠ μ2
Hoặc viết là
H0: μ1 – μ2 = 0H1: μ1 – μ2 ≠ 0
• Xét 2 mẫu độc lập lấy từ 2 tổng thể khác nhau • Trung bình của 2 tổng thể là 𝜇1, 𝜇2 (không biết) • Trung bình của 2 mẫu là 𝑥1, 𝑥2
2 independent samples
σ1 and σ2 known
σ1 and σ2 unknown, n1 and n2 30
σ1 and σ2 unknown, n1 or n2 < 30
1 2
2 2
1 2
1 2
x xz
σ σ
n n
σ1 và σ2 đã biết
*
• Biết σ1 và σ2
• Kích thước mẫu bất kỳ (𝒏𝟏, 𝒏𝟐 bất kỳ)
• Ta sử dụng PP chuẩn
σ1 and σ2 known
σ1 and σ2 unknown, n1 and n2 30
σ1 and σ2 unknown, n1 or n2 < 30
σ1 và σ2 ko biết và mẫu lớn
*
• Không biết σ1 và σ2
• Mẫu lớn 𝒏𝟏, 𝒏𝟐 ≥ 𝟑𝟎
• Ta sử dụng PP chuẩn
2 independent samples
𝒁 =𝒙𝟏 − 𝒙𝟐
ෞ𝒔𝟏𝟐
𝒏𝟏+
ෞ𝒔𝟐𝟐
𝒏𝟐
σ1 and σ2 known
σ1 and σ2 unknown, n1 and n2 30
σ1 and σ2 unknown, n1 or n2 < 30
σ1 và σ2 ko biết và mẫu nhỏ
1 2
p
1 2
x xt
1 1s
n n
*
• Không biết σ1 và σ2
• Mẫu bé 𝒏𝟏, 𝒏𝟐 < 𝟑𝟎
• Ta sử dụng PP Student với (𝒏𝟏 + 𝒏𝟐 − 𝟐) bậc tự do
Với sp =n1−1 s1
2 + n2−1 s22
n1+n2−2
2 independent samples
Kiểm định hiệu 2 trung bình (mẫu lớn)
Bài 7.7 : 50 sinh viên nam tỏ ra ham thích tham gia môn điền kinh thì có chiều cao trung bình là 175 cm và độ lệch chuẩn hiệu chỉnh là 6 cm. Trong khi đó 50 sinh viên nam khác tỏ ra không quan tâm đến môn điền kinh thì có chiều cao trung bình là 170 cm và độ lệch chuẩn hiệu chỉnh là 7 cm.
a) Hãy kiểm định giả thiết các sinh viên nam có ý thích tham gia vào môn điền kinh thì cao hơn các sinh viên nam khác.
b) Giá trị P của kiểm định này là bao nhiêu?
29-Nov-17 58
Kiểm định hiệu 2 trung bình (mẫu lớn)
• Ta phải quyết định giữa 2 giả thiết :
• Đây là bài toán kiểm định 1 phía (bên phải)• Với mức ý nghĩa là 5% (ta tự cho)• Bài toán mẫu lớn dùng PP chuẩn, giá trị tới hạn là:
𝒛𝒄 = 𝑵𝑶𝑹𝑴. 𝑺. 𝑰𝑵𝑽 𝟏 − 𝒂 = 𝟏. 𝟔𝟓
MẪU 1 MẪU 2Kích thước mẫu n1 = 50 n2 = 50Trung bình mẫu 𝑥1 = 175 𝑥2 = 170
Độ lệch chuẩn mẫu ෝ𝑠1 = 6 ෝ𝑠2 = 7
𝑯𝟎: 𝝁𝟏 − 𝝁𝟐 = 𝟎 𝒐𝒓 𝝁𝟏 = 𝝁𝟐
𝑯𝟏: 𝝁𝟏 − 𝝁𝟐 > 𝟎 𝒐𝒓 𝝁𝟏 > 𝝁𝟐
Kiểm định hiệu 2 trung bình (mẫu lớn)
Tính toán giá trị kiểm định
KL: Với mức ý nghĩa 5%, ta bác bỏ giả thiết 𝑯𝒐,tức là chấp nhận giả thiết các sinh viên nam có ý thích tham gia vào môn điền kinh thì cao hơn các sinh viên nam khác.
0 1.65
𝜶 = 𝟎. 𝟎𝟓
Reject H0
3.83
𝐳 =ഥ𝒙𝟏−ഥ𝒙𝟐
𝝈=
𝟏𝟕𝟓−𝟏𝟕𝟎
𝟏.𝟑𝟎𝟑𝟖= 𝟑.83
𝝈𝑿𝟏−𝑿𝟐=
ෞ𝒔𝟏𝟐
𝒏𝟏+
ො𝒔𝟐𝟐
𝒏𝟐
=𝟔𝟐
𝟓𝟎+
𝟕𝟐
𝟓𝟎= 𝟏. 𝟑038
Bác bỏ H0 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝑷 𝒁 > 𝟑. 𝟖𝟑 = 𝟎. 𝟎𝟎𝟔𝟒%
𝑯𝒐
Bài 7.11 : Một mẫu gồm 100 bóng đèn điện do xí nghiệp A sản xuất cho thấy tuổi thọ trung bình là 1.190 giờ và độ lệch chuẩn là 90 giờ. Một mẫu gồm 75 bóng đèn điện do xí nghiệp B sản xuất cho thấy tuổi thọ trung bình là 1.230 giờ và độ lệch chuẩn là 120 giờ. Có sự khác biệt nào giữa tuổi thọ trung bình của hai nhãn hiệu bóng đèn với mức ý nghĩa:
a) 0,05.
b) 0,01.
c) Tính giá trị P của phép kiểm định này.
29-Nov-17 61
Kiểm định hiệu 2 trung bình (mẫu lớn)
Độ lệch chuẩn chuyển về độ lệch chuẩn hiệu chỉnh Ƹ𝑠 =𝑛
𝑛−1× 𝑠
𝐳 =ഥ𝒙𝟏−ഥ𝒙𝟐
ො𝑠12
𝒏𝟏+
ො𝒔𝟐𝟐
𝒏𝟐
= −𝟐. 𝟒𝟏 và 𝑃𝑣𝑎𝑙𝑢𝑒 = 1.61%
Kiểm định hiệu 2 trung bình (mẫu nhỏ)
• Để kiểm định tính hiệu quả của một loại phân bón mới trên việc sản xuất
lúa mì, một vùng đất được chia thành 56 thửa hình vuông có diện tích
bằng nhau, tất cả các phần chia có chất lượng đất, ánh nắng, nước tưới
như nhau.
• Loại phân bón mới được bón cho 28 thửa và 28 thửa còn lại được bón
bằng phân bón cũ.
• Năng suất thu hoạch trung bình của các thửa dùng phân bón mới là 18,2
giạ/ thửa và độ lệch chuẩn hiệu chỉnh 0,63 giạ/thửa.
• Năng suất thu hoạch trung bình và độ lệch chuẩn hiệu chỉnh của các
thửa dùng phân bón cũ lần lượt là 17,8 giạ/ thửa và 0,54 giạ/thửa.
• Giả sử rằng năng suất của 2 loại phân bón tuân theo quy luật phân phối
chuẩn và có cùng phương sai.
• Hãy kiểm định giả thiết loại phân bón mới tốt hơn loại phân bón cũ.
ĐS: 𝐬𝒑 = 𝟎. 𝟓𝟖𝟔𝟕 , 𝒕 = 𝟐. 𝟓𝟓𝟎𝟖, 𝒑𝒗𝒂𝒍𝒖𝒆 = 𝟎. 𝟔𝟖%
29-Nov-17 62
Kiểm định hiệu 2 trung bình (mẫu nhỏ)
• Một viện dưỡng lão làm thí nghiệm như sau: chọn ngẫu nhiên 30 người già
trong viện, chia làm 2 nhóm, mỗi nhóm 15 người. Cho mỗi người một cây
cảnh. Yêu cầu những người trong nhóm đầu tiên hằng ngày chăm sóc cây,
còn không yêu cầu những người trong nhóm còn lại chăm sóc cây.
• Người ta ghi nhận lại số lần than phiền về sức khỏe của những người
trong 2 nhóm trong vòng 1 tháng sau khi cho cây, kết quả có được như
sau:
• Nhóm 1 (được yêu cầu chăm sóc cây): 23, 12, 6, 15, 18, 5, 21, 18, 34, 10,
23, 14, 19, 23, 8.
• Nhóm 2 (không yêu cầu chăm sóc cây): 35, 21, 24, 26, 17, 23, 37, 22, 16,
38, 23, 41, 27, 24, 32.
• Giả sử số lần than phiền về sức khỏe của 2 nhóm có phân phối chuẩn và
có cùng phương sai.
• Theo bạn, việc chăm sóc cây có giúp làm giảm số lần than phiền về sức
khỏe của các người già hay không?
ĐS: 𝒔𝒑 = 𝟕. 𝟕𝟔𝟓𝟓; 𝒕 = −𝟑. 𝟔𝟗; 𝑷𝒗𝒂𝒍𝒖𝒆 = 𝟎. 𝟎𝟒𝟖%
29-Nov-17 63
Kiểm định hiệu 2 tỷ lệ
Kiểm định bên trái
H0: p1 p2
H1: p1 < p2
Hoặc
H0: p1 – p2 0H1: p1 – p2 < 0
Kiểm định bên phải
H0: p1 ≤ p2
H1: p1 > p2
Hoặc
H0: p1 – p2 ≤ 0H1: p1 – p2 > 0
Kiểm định hai phía
H0: p1 = p2
H1: p1 ≠ p2
Hoặc
H0: p1 – p2 = 0H1: p1 – p2 ≠ 0
• Xét 2 mẫu độc lập lấy từ 2 tổng thể khác nhau • Tỷ lệ của 2 tổng thể là 𝑝1, 𝑝2 (không biết) • Tỷ lệ của 2 mẫu là 𝑓1, 𝑓2
• 2 mẫu độc lập• 𝑛1 𝑣à 𝑛2 ≥ 30• Tỷ lệ mãu 𝑓1 𝑣à 𝑓2 tính được
𝒛 =𝒇𝟏 − 𝒇𝟐
𝒇 (𝟏 − 𝒇)𝟏
𝒏𝟏+
𝟏𝒏𝟐
Với: 𝒇 =𝒏𝟏𝒇𝟏+𝒏𝟐𝒇𝟐
𝒏𝟏+𝒏𝟐
Kiểm định hiệu 2 tỷ lệ
Ta sử dụng PP chuẩn
Ví dụ : Chọn một mãu ngẫu nhiên gồm 160 sản phẩm do máy A sản xuât thì thấy có 16 sản phẩm bị hỏng và chọn một mãu ngẫu nhiên gồm 90 sản phẩm do máy b sản xuât thì thấy có 5 sản phẩm bị hỏng.
Hãy kiểm định giả thiết : chất lượng sản phẩm của máy B không khác chất lượng sản phẩm của máy A
Tính giá trị P của phép kiểm định
29-Nov-17 66
Kiểm định hiệu 2 tỷ lệ
𝑧 =𝑓1 − 𝑓2
𝑓 1 − 𝑓1
𝑛1+
1𝑛2
= 1.216
Với 𝑧𝑐 = 1.96Giá trị P của kiểm định 2 phía = 22.4%
Với 𝑓 =𝑓1𝑛1+𝑓2𝑛2
𝑛1+𝑛2= 0.084
Kiểm định hiệu 2 tỷ lệ
Bài 7.14: Chọn một mẫu ngẫu nhiên gồm 200 sản phẩm do máy A sản xuất thì thấy có 19 sản phẩm bị hỏng và chọn một mẫu ngẫu nhiên gồm 100 sản phẩm do máy B sản xuất thì thấy có 5 sản phẩm bị hỏng. Sử dụng mức ý nghĩa là 0,05. Hãy kiểm định giả thiết:
a) Chất lượng sản phẩm do hai máy này sản xuất khác nhau. Tính giá trị P của phép kiểm định này.
b) Chất lượng sản phẩm của máy B tốt hơn máy A. Tính giá trị P của phép kiểm định này.
29-Nov-17 67
Bài tập tổng hợp 7.37
Khảo sát doanh số bán của một siêu thị trong một số ngàyđược chọn ngẫu nhiên, ta thu được số liệu sau:
a) Hãy ước lượng doanh số bán trung bình của siêu thịtrong một ngày với độ tin cậy 95%.
b) Những ngày có doanh số bán trên 130 triệu đồng đượcgọi là ngày đắt hàng. Hãy ước lượng tỷ lệ những ngàyđắt hàng của siêu thị với độ tin cậy 99%.
c) Trước đây doanh số bán trung bình một ngày là 100 triệu đồng, hiện nay siêu thị đã áp dụng phương thứcmới thay đổi cách tiếp thị và thái độ phục vụ kháchhàng. Với mức ý nghĩa 1%, xét xem phương thức mớicó thật sự làm tăng doanh số bán của siêu thị không?
d) Ban giám đốc siêu thị cho biết với phương thức mớidoanh số bán trung bình một ngày là 120 triệu đồng. Với mức ý nghĩa 5%, xét xem nguồn tin từ Ban giámđốc có hợp lý không? Tính giá trị P của phép kiểm định.
29-Nov-17 68
Doanh số
(triệu
đồng)
Số
ngày
50 - 70 10
70 - 90 30
90 - 110 40
110 - 130 25
130 - 150 20
150 - 200 15
Bài tập tổng hợp 7.40
Một công ty xuất khẩu muốn mua một bè cá basa nên đi khảosát và lấy một mẫu ngẫu nhiên tại bè cá, số liệu thống kê trọnglượng thu được trên mẫu như sau:
a) Với độ tin cậy 95%, hãy ước lượng tổng trọng lượng củacá trong bè. Biết rằng bè chứa 10 ngàn con.
b) Biết rằng cá đạt tiêu chuẩn xuất khẩu là cá có trọng lượnglớn hơn hay bằng 1,1 kg. Chủ bè cá cho rằng tỷ lệ cá đạttiêu chuẩn xuất khẩu là 90%. Với mức ý nghĩa 5%, hãykiểm tra xem báo cáo của chủ bè cá có đáng tin cậykhông. Tính giá trị P của phép kiểm định này.
c) Cũng bè cá này vào mùa trước, sau khi mua và cân đo thựctế thì công ty có ghi nhận trọng lượng trung bình của cá là1.18 kg. Mùa này, bè cá thay đổi phương pháp nuôi dưỡngmới cho cá, với mức ý nghĩa 5%, hãy kiểm tra xem phươngpháp nuôi dưỡng mới có thực sự hiệu quả để tăng trọnglượng cá trong bè hay không?
29-Nov-17 69
Trọng lượng
(đơn vị kg)
Số
con
0,8 0,9 10
0,9 1,0 16
1,0 1,1 20
1,1 1,2 40
1,2 1,3 40
1,3 1,4 80
1,4 1,6 50