bài 3: lý thuyết mẫu pp của trung bình mẫu và tỷ lệ mẫu

41
Bài 3: Lý thuyết mẫu PP của trung bình mẫu và tỷ lệ mẫu Vinh Lương University of Economics and Finance [email protected] September 2018 Lý thuyết mẫu Vinh Lương September 2018 1 / 41

Upload: khangminh22

Post on 30-Nov-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

Bài 3: Lý thuyết mẫuPP của trung bình mẫu và tỷ lệ mẫu

Vinh Lương

University of Economics and Finance

[email protected]

September 2018

Lý thuyết mẫu Vinh Lương September 2018 1 / 41

Contents

Giới thiệu về lấy mẫu và các dạng mẫu thường gặp

Định lý giới hạn trung tâm

Phân phối của trung bình mẫu 𝑋

Phân phối của tỷ lệ mẫu F

Lý thuyết mẫu Vinh Lương September 2018 2 / 41

Contents

Giới thiệu về lấy mẫu và các dạng mẫu thường gặp

Định lý giới hạn trung tâm

Phân phối của trung bình mẫu 𝑋

Phân phối của tỷ lệ mẫu F

Lý thuyết mẫu Vinh Lương September 2018 3 / 41

Population vs Sample

Tổng thể: tập hợp tất cả những phần tử mà ta quan tâm.Kích thước tổng thể: N (thường rất lớn).Ví dụ:

I Tập hợp chiều cao của toàn bộ người dân Việt nam.I Tập hợp tất cả những bóng đèn do nhà máy sản xuất.

Mẫu : 1 tập con bất kỳ của tổng thể.Kích thước mẫu: 𝑛(𝑛 ≪ 𝑁).Ví dụ:

I Chọn ngẫu nhiên 10,000 người bất kỳ để đo chiều cao.I Chọn ngẫu nhiên 100 bóng đèn để kiểm tra chất lượng.I Chọn ngẫu nhiên 50 bệnh nhân để kiểm tra hiệu quả của 1 loại

thuốc mới.

Lý thuyết mẫu Vinh Lương September 2018 4 / 41

Sampling vs Inference

1. Lấy mẫu là quá trình chọn ra một số phần tử trong tổng thể đểtiến hành nghiên cứu.

2. Ngược lại với lấy mẫu là quá trình suy luận thống kê. Tức là từthông tin của mẫu ta suy ra thông tin về tổng thể. (thông tin đó cóthể là: Trung bình, Tỷ lệ, Phương sai, ...)

Lý thuyết mẫu Vinh Lương September 2018 5 / 41

Example 1

I Muốn tìm chiều cao trung bình 𝜇 của 12000 thanh niên của mộtkhu vực nhưng vì một số lý do ta không thể khảo sát chiều cao củatất cả 12000 thanh niên trong khu vực.

I Chọn ngẫu nhiên 1 mẫu gồm 100 thanh niên trong khu vựcđể khảo sát

I Tính chiều cao trung bình 𝑥 của 100 thanh niên này.I Từ 𝑥 tính được dựa vào mẫu trên, ta sẽ suy ra thông tin về trung

bình 𝜇 của tổng thể

Lý thuyết mẫu Vinh Lương September 2018 6 / 41

Tại sao phải lấy mẫu?

1. Không thể khảo sát tất cảtừng phần tử của tổng thể. (Vídụ: kiểm tra các hộp sữa củamột lô hàng, kiểm tra tuổi thọbóng đèn...)

2. Bị giới hạn về thời gian vàchi phí. (Ví dụ: khảo sát trướcmỗi kỳ bầu cử tổng thống Mỹ,khảo sát chiều cao dân số... )

3. Kết quả suy luận thống kêlà chấp nhận được nếu ta lấymẫu hợp lý. Ví dụ: Chiều caotrung bình của sinh viên namlà từ 164cm đến 166cm.

Lý thuyết mẫu Vinh Lương September 2018 7 / 41

Lấy mẫu như thế nào là hợp lý?

1. Lấy mẫu ngẫu nhiên: mỗi phần tử trong tổng thể có cơ hội đượcchọn như nhau.

2. Kích thước mẫu đủ lớn: n càng lớn, thông tin suy luận về tổngthể càng đáng tin cậy và có ý nghĩa.

Lý thuyết mẫu Vinh Lương September 2018 8 / 41

Trung bình - Phương sai của 1 mẫu cụ thể

I Trung bình 1 mẫu cụ thể

𝑥 =

𝑛∑𝑖=1

𝑥𝑖

𝑛=

𝑥1 + 𝑥2 + · · · + 𝑥𝑛𝑛

I Phương sai mẫu và Phương sai mẫu có điều chỉnh

s2 =

n∑i=1

(xi − x)2

n; s2 =

n∑i=1

(xi − x)2

n − 1; 𝑠2 =

𝑛

𝑛− 1× 𝑠2

I Trung bình và Phương sai của tổng thể thì ký hiệu:

𝜇 =

𝑁∑𝑖=1

𝑥𝑖

𝑁=

𝑥1 + 𝑥2 + · · · + 𝑥𝑁𝑁

𝜎2 =

N∑i=1

(xi − 𝜇)2

NLý thuyết mẫu Vinh Lương September 2018 9 / 41

Trung bình - Phương sai của 1 mẫu ngẫu nhiên

I Khi chúng ta nói về một mẫu ngẫu nhiên, tức là các giá trị 𝑋𝑖

cũng ngẫu nhiên. Khi đó ta không dùng ký hiệu 𝑥; 𝑠 giống như trênmà thay bằng ký hiệu in hoa để thể hiện đó không phải là 1mẫu cụ thể.

I Trung bình của mẫu ngẫu nhiên:

𝑋 =

𝑛∑𝑖=1

𝑋𝑖

𝑛=

𝑋1 + 𝑋2 + · · · + 𝑋𝑛

𝑛

I Phương sai của mẫu ngẫu nhiên và phương sai mẫu ngẫunhiên có điều chỉnh:

S2 =

n∑i=1

(Xi − X)2

n; S2 =

n∑i=1

(Xi − X)2

n − 1

Lý thuyết mẫu Vinh Lương September 2018 10 / 41

Example 2

Tính trung bình và độ lệch chuẩn mẫu có điều chỉnh của mẫu dữliệu được thu thập như sau:10 12 14 15 17 18 18 24Trung bình của mẫu:

𝑥 =10 + 12 + 14 + 15 + 17 + 18 + 18 + 24

8= 16

Độ lệch chuẫn mẫu có điều chỉnh:

𝑠 =

√(10 − x)2 + (12 − x)2 + (14 − x)2 + · · · + (24 − x)2

n − 1

=

√(10 − 16)2 + (12 − 16)2 + (14 − 16)2 + · · · + (24 − 16)2

8 − 1

=

√130

7= 4.309

Lý thuyết mẫu Vinh Lương September 2018 11 / 41

Các dạng mẫu thường gặp

Có 3 dạng mẫu dữ liệu thông dụng hay được sử dụng:1. Mẫu dạng điểm: còn gọi là bảng dữ liệu thô2. Mẫu dạng tần số: dữ liệu thô được tổ chức lại theo dạng tần số

xuất hiện hay tỷ lệ bách phân3. Mẫu dạng khoảng: dữ liệu thô được chia thành các khoảng lớp và

tính tần số

Nhờ sự phát triển của máy tính, mẫu dạng điểm đang được sử dụngrộng rãi trong tính toán.

Lý thuyết mẫu Vinh Lương September 2018 12 / 41

Mẫu dạng điểm

Mẫu có dạng điểm: 𝑛 = 𝐶𝑂𝑈𝑁𝑇 (𝐷𝑎𝑡𝑎)

𝑥 = 𝐴𝑉 𝐸𝑅𝐴𝐺𝐸(𝐷𝑎𝑡𝑎) = 1𝑛

𝑘∑𝑖=1

𝑥𝑖

𝑠2 = 𝑉 𝐴𝑅.𝑃 () = 1𝑛

𝑘∑𝑖=1

(𝑥𝑖 − ��)2 𝑠2 = 𝑉 𝐴𝑅.𝑆() = 1𝑛−1

𝑘∑𝑖=1

(𝑥𝑖 − ��)2

𝑠 = 𝑆𝑇𝐷𝐸𝑉.𝑃 () 𝑠 = 𝑆𝑇𝐷𝐸𝑉.𝑆()

Thời gian hoàn thành công việc (giây)Lý thuyết mẫu Vinh Lương September 2018 13 / 41

Mẫu dạng tần số

Khi có các giá trị 𝑥𝑖 trùng nhau, ta gom dữ liệu thô (dạng điểm) về dữliệu dạng tần số.Sau đó tính toán trung bình, độ lệch chuẩn theo công thức:

I 𝑛 =𝑘∑

𝑖=1𝑓𝑖

I �� = 1𝑛

𝑘∑𝑖=1

𝑓𝑖𝑥𝑖

I 𝑠2 = 1𝑛−1

𝑘∑𝑖=1

𝑓𝑖(𝑥𝑖 − ��)2

Điểm thi tần suất𝑋 𝑓𝑖4 65 56 107 158 109 4

Tổng 𝑛 = 50

Excel:𝑥 = 𝑆𝑈𝑀𝑃𝑅𝑂𝐷𝑈𝐶𝑇 (𝐺𝑇𝑀,𝐺𝑇𝑋)/𝑆𝑈𝑀(𝐺𝑇𝑀)𝑠2 = 𝑆𝑈𝑀𝑃𝑅𝑂𝐷𝑈𝐶𝑇 (𝐺𝑇𝑀, (𝐺𝑇𝑋 − 𝑥)2)/(𝑛− 1)

Lý thuyết mẫu Vinh Lương September 2018 14 / 41

Mẫu dạng khoảng kiểu 1

I Khoảng lớp: xmin ≤ x ≤ xmax

I Với mẫu dạng khoảng thì ta dùng tâm lớp để tính toán.

I Tâm lớp: 𝑥𝑖 =𝑥𝑚𝑖𝑛 + 𝑥𝑚𝑎𝑥

2I Dùng tâm lớp là không chính xác nên dẫn đến sai số khi tính toán.I Do đó, dữ liệu dạng khoảng chủ yếu được dùng để mô tả dữ liệu.

Lý thuyết mẫu Vinh Lương September 2018 15 / 41

Mẫu dạng khoảng kiểu 2

I Ngoài ra người ta cũng có thể chia mẫu dạng khoảng như sau:I Sử dụng khoảng lớp: xmin ≤ x < xmax

I Ta vẫn dùng tâm lớp để tính toán

Lý thuyết mẫu Vinh Lương September 2018 16 / 41

Example 3

Điểm thi môn XSTK của lớp học được tổng hợp lại thành bảng sau:1. Hãy tính điểm trung bình của cả lớp 𝑥

2. Tính độ lệch chuẩn mẫu có hiệu chỉnh 𝑠

Điểm thi (thang điểm 100)

DS: 54.84 và 10.84

Lý thuyết mẫu Vinh Lương September 2018 17 / 41

Exercise 1Ra đời vào tháng 8/2009, hiện nay Zing Me là một trong 2 mạng xã hộiphổ biến nhất ở Việt Nam. Một sinh viên UEF khảo sát ngẫu nhiên 100người dùng (user) trên Zing Me và có được số liệu trong bảng sau về độtuổi của họ:

Độ tuổi Số người13 – 15 2415 – 17 1417 – 24 3924 – 34 1234 – 70 11

Dựa vào mẫu trên hãy tính:1. Tuổi trung bình của người dùng Zing Me.2. Độ lệch chuẫn mẫu có hiệu chỉnh 𝑠

DS: 22.795 và 11.26

Lý thuyết mẫu Vinh Lương September 2018 18 / 41

Contents

Giới thiệu về lấy mẫu và các dạng mẫu thường gặp

Định lý giới hạn trung tâm

Phân phối của trung bình mẫu 𝑋

Phân phối của tỷ lệ mẫu F

Lý thuyết mẫu Vinh Lương September 2018 19 / 41

Định lý giới hạn trung tâm

Theorem (Định lý giới hạn trung tâm )

Gọi 𝑋1, 𝑋2, . . . , 𝑋𝑛 là một dãy các ĐLNN độc lập và có cùng phânphối với kỳ vọng bằng 𝜇 và độ lệch chuẩn 𝜎 hữu hạn. Đặt:

𝑆𝑛 = 𝑋1 + 𝑋2 + · · · + 𝑋𝑛

Khi 𝑛 lớn, 𝑆𝑛 sẽ xấp xỉ phân phổi chuẩn 𝑆𝑛 ∼ 𝑁(𝑛𝜇, 𝑛𝜎2

).

Lưu ý:I 𝜇𝑆 bằng tổng các 𝜇 và 𝑉 𝑎𝑟(𝑆) bằng tổng các 𝑉 𝑎𝑟(𝑋)

I Nếu chuẩn tắc hóa 𝑆𝑛 bằng ĐLNN 𝑍 =𝑆𝑛 − 𝑛𝜇

𝜎√𝑛

, thì 𝑍 ∼ 𝑁(0, 1)

I Thông thường người ta hay chọn mốc 𝑛 ≥ 30 để có thể xấp xỉ 𝑆𝑛

bằng phân phối chuẩn.I 𝑛 càng lớn, sự xấp xỉ càng tốt.

Lý thuyết mẫu Vinh Lương September 2018 20 / 41

Định lý giới hạn trung tâm

I Định lý giới hạn trung tâm1 không yêu cầu phân phối của các𝑋𝑖 ra sao. Chỉ yêu cầu chúng độc lập và có cùng phân phối.

I 𝑋𝑖 có thể là ĐLNN rời rạc hoặc liên tụcI Trong trường hợp các 𝑋𝑖 có cùng phân phối chuẩn, điều kiện 𝑛 đủ

lớn (𝑛 ≥ 30) không còn cần thiết. Nghĩa là 𝑆𝑛 ∼ 𝑁(𝑛𝜇, (𝜎

√𝑛)

2)

với mọi 𝑛.

Một hệ quả trực tiếp của định lý giới hạn trung tâm là luật phân phốicủa trung bình mẫu mà chúng ta sẽ học ngay sau phần này.

�� =𝑋1 + · · · + 𝑋𝑛

𝑛=

𝑆𝑛

𝑛

sẽ có phân phối chuẩn 𝑁(𝜇, (𝜎/

√𝑛)

2)

khi 𝑛 ≥ 30

1The Central Limit Theorem – CLTLý thuyết mẫu Vinh Lương September 2018 21 / 41

Example 4

Trọng lượng của các nhân viên trong trụ sở một công ty tuân theo quyluật phân phối chuẩn với 𝜇 = 71.5 kg và độ lệch chuẩn 𝜎 = 7.3 kg.Thang máy trong trụ sở có mức tải trọng an toàn 444 kg. Giả sử có 6người bất kỳ cùng vào thang máy. Tính xác suất tổng trọng lượng của 6người vượt quá mức an toàn cho phép.Giải:

I Gọi 𝑋𝑖 trọng lượng của người i (1 ≤ 𝑖 ≤ 6)

I Các 𝑋𝑖 là độc lập và có cùng phân phối chuẩnI Đặt 𝑆 = 𝑋1 + 𝑋2 + ... + 𝑋6 là tổng trọng lượng của 6 người bất kỳ

I Theo định lý giới hạn trung tâm 𝑆𝑛 ∼ 𝑁(𝑛𝜇, (𝜎

√𝑛)

2)

I Suy ra: 𝑆 có phân phối chuẩn với𝜇𝑆 = 6𝜇 = 429 và 𝜎𝑆 = 𝜎

√6 = 17.8813

I 𝑃 (𝑆 > 444) = 1 −𝑁𝑂𝑅𝑀.𝐷𝐼𝑆𝑇 (444, 𝜇𝑆 , 𝜎𝑆 , 1) = 0.20077

Lý thuyết mẫu Vinh Lương September 2018 22 / 41

Example 5

Hãng xe Toyota muốn kiểm tra 1 mẫu xe mới trước khi tung ra thịtrường. Giả sử số lượng lỗi nghiêm trọng của mẫu xe mới là 1 ĐLNN cótrung bình 3.2 và độ lệch chuẫn 2.4 . Trong số 100 xe được kiểm tra đợtnày, tính xác suất số lỗi trung bình của mỗi xe là trên 4?Giải:

I Gọi 𝑋𝑖 là số lỗi của xe thứ i (1 ≤ 𝑖 ≤ 100)

I Tổng số lỗi của 100 xe sau khi kiểm tra là:

𝑆 = 𝑋1 + 𝑋2 + . . . + 𝑋100

I 𝑋𝑖 không cần thiết có PP chuẩn nhưng theo ĐL giới hạn trung tâm:với 𝑛 ≥ 30 thì S sẽ xấp xỉ PP chuẩn 𝑆 ∼ 𝑁

(𝑛𝜇, (𝜎

√𝑛)

2)

với:

Trung bình 𝜇𝑆 = 100𝜇 = 320Độ lệch chuẩn: 𝜎𝑆 = 10𝜎 = 24

I XS cần tính: 𝑃 (𝑋 > 4) = 𝑃 (𝑆 > 400) = 0.00043

Lý thuyết mẫu Vinh Lương September 2018 23 / 41

Exercise 2Một nhà máy sản xuất dây xích bằng thép, mỗi dây gồm nhiều mắt xích.Độ dài của các mắt xích được định nghĩa sao cho độ dài của dây xíchbằng tổng độ dài các mắt xích. Phòng nghiên cứu của nhà máy đo thấyđộ dài của các mắt xích là một ĐLNN 𝑋 có kỳ vọng là 5cm và độ lệchchuẩn là 0.1cm. Nhà máy bán loại dây xích dài 50m được nối bằng 1002mắt xích. Nhà máy cam đoan rằng không có dây xích nào dài dưới 50m,nếu khách hàng nào mua phải dây dài dưới 50m thì được đền tiền vàtặng một dây khác miễn phí.

1. Hãy tính xác suất để một dây xích với 1002 mắt xích có độ dài dưới50m.

2. Sau một thời gian, bộ phân bán hàng của nhà máy thấy có nhiềudây xích dài dưới 50m bị trả lại, và hỏi phòng nghiên cứu xem vấnđề nằm ở đâu. Sau khi điều tra, phòng nghiên cứu phát hiện là đokhông thật chính xác. : kỳ vọng của chiều dài mắt xích không phảilà 5cm mà là 4.993cm. Với kỳ vọng này, xác suất để một dây xíchvới 1002 mắt xích có độ dài dưới 50m là bao nhiêu?

Lý thuyết mẫu Vinh Lương September 2018 24 / 41

Contents

Giới thiệu về lấy mẫu và các dạng mẫu thường gặp

Định lý giới hạn trung tâm

Phân phối của trung bình mẫu 𝑋

Phân phối của tỷ lệ mẫu F

Lý thuyết mẫu Vinh Lương September 2018 25 / 41

Phân phối của trung bình mẫu 𝑋

I Từ tổng thể có kích thước N chọn ra một mẫu ngẫu nhiên bất kỳkích thước n, ký hiệu {𝑋1, . . . , 𝑋𝑛}

I Trung bình của mẫu ngẫu nhiên là: 𝑋 =𝑋1 + . . . + 𝑋𝑛

𝑛I Theo định lý giới hạn trung tâm thì 𝑋 sẽ có phân phối xấp xỉ phân

phối chuẩn. Ta gọi đó là phân phối của trung bình mẫu

Lý thuyết mẫu Vinh Lương September 2018 26 / 41

Phân phối của trung bình mẫu 𝑋

Gọi {𝑋1, . . . , 𝑋𝑛} là một mẫu ngẫu nhiên có kích thước n lấy từtổng thể có trung bình 𝜇 và độ lệch chuẩn 𝜎 .Khi đó trung bìnhmẫu ngẫu nhiên 𝑋 là một ĐLNN:

�� =𝑋1 + 𝑋2 + · · · + 𝑋𝑛

𝑛

1. Nếu 𝑋 ∼ 𝑁(𝜇, 𝜎2) thì trung bình mẫu 𝑋 cũng có pp chuẩn:

𝑋 ∼ 𝑁(𝜇, (𝜎√𝑛

)2)

2. Nếu tổng thể không có phân phối chuẩn nhưng kích thước mẫulớn 𝑛 ≥ 30 thì trung bình mẫu xấp xỉ phân phối chuẩn:

𝑋 ∼ 𝑁(𝜇,𝜎2

𝑛)

Tức là theo (1) và (2) ta có: 𝜇�� = 𝜇 ; 𝜎�� =𝜎√𝑛

Lý thuyết mẫu Vinh Lương September 2018 27 / 41

Phân phối của trung bình mẫu 𝑋

Lý thuyết mẫu Vinh Lương September 2018 28 / 41

Example 6

Giả sử chiều cao của sinh viên nam ở tp.HCM có phân phối chuẩn vớitrung bình là 172 cm và độ lệch chuẩn là 10 cm. Chọn một mẫu ngẫunhiên gồm 25 sinh viên.

1. Tìm quy luật phân phối của trung bình mẫu (trung bình chiều caocủa 25 sinh viên bất kỳ).

2. Tính xác suất để một mẫu ngẫu nhiên có chiều cao trung bình lớnhơn 174cm.

Lý thuyết mẫu Vinh Lương September 2018 29 / 41

I Gọi X là chiều cao của 1 sinh viên bất kỳ (lấy từ tổng thể).I Gọi 𝑋 là chiều cao trung bình của một mẫu ngẫu nhiên gồm 25

sinh viên bất kỳ. Ta có:

�� =𝑋1 + 𝑋2 + · · · + 𝑋25

25

I Do 𝑋 ∼ 𝑁(𝜇, 𝜎2) nên ta có trung bình mẫu �� cũng có phân phốichuẩn với:

𝜇�� = 𝜇 = 172𝑐𝑚; 𝜎�� =𝜎√𝑛

=10√25

= 2𝑐𝑚

I Tức là:𝑋 ∼ 𝑁(172, 22)

I Xác suất để một mẫu ngẫu nhiên có chiều cao trung bình lớn hơn174cm.

𝑃 (𝑋 > 174) = 1 − 𝑃 (𝑋 < 174) = 1 −𝑁𝑂𝑅𝑀.𝐷𝐼𝑆𝑇 (...) ≈ 15.87%

Lý thuyết mẫu Vinh Lương September 2018 30 / 41

Example 7

Cho 𝑋 ∼ 𝑁(𝜇, 𝜎2) có trung bình là 100 và độ lệch chuẩn là 15. Lấy mẫungẫu nhiên gồm 9 phần tử bất kỳ {𝑋1, 𝑋2, ..., 𝑋9} và gọi 𝑋 là trungbình của mẫu ngẫu nhiên.

1. Hãy cho biết phân phối của 𝑋

2. Tính 𝑃 (90 < 𝑋 < 110) và 𝑃 (90 < 𝑋 < 110). Nhận xét.

DS: 49.72% vs 95.44%

Lý thuyết mẫu Vinh Lương September 2018 31 / 41

Exercise 3Bài 5.4 :500 vòng bi có trọng lượng trung bình là 150g và độ lệch chuẩn là 0,9g.Chọn một mẫu ngẫu nhiên gồm 100 vòng bi, tìm xác suất để mẫu này cótổng trọng lượng:

1. Trong khoảng 14,98kg và 14,99kg.2. Lớn hơn 15,03.

Lý thuyết mẫu Vinh Lương September 2018 32 / 41

Exercise 4A. C. Neilsen khảo sát và thấy rằng trẻ em trong độ tuổi từ 2 đến 5 tuổimỗi tuần xem tivi trung bình 25 giờ và độ lệch chuẩn là 3 giờ. Giả sửthời gian xem tivi của 1 trẻ bất kỳ có phân phối chuẩn. Nếu chọn ra 1mẫu ngẫu nhiên gồm 20 em bé bất kỳ, tính xác suất để thời gian xem tivitrung bình của mẫu đó sẽ lớn hơn 26.3 giờ.(Source: Michael D. Shook and Robert L. Shook, The Book of Odds.)

ĐS: 2.62%

Lý thuyết mẫu Vinh Lương September 2018 33 / 41

Exercise 5The average age of a vehicle registered in the United States is 8 years, or96 months. Assume the standard deviation is 16 months. If a randomsample of 36 vehicles is selected, find the probability that the mean oftheir age is between 90 and 100 months.

ĐS: 92.1%

Lý thuyết mẫu Vinh Lương September 2018 34 / 41

Contents

Giới thiệu về lấy mẫu và các dạng mẫu thường gặp

Định lý giới hạn trung tâm

Phân phối của trung bình mẫu 𝑋

Phân phối của tỷ lệ mẫu F

Lý thuyết mẫu Vinh Lương September 2018 35 / 41

Phân phối của tỷ lệ mẫu F

I Gọi 𝑝 là tỷ lệ của tổng thể (tỷ lệ các phần tử có tính chất ℘ trongtổng thể)

I Gọi F là tỷ lệ của mẫu ngẫu nhiên kích thước n (tỷ lệ cácphần tử có tính chất ℘ trong mẫu ngẫu nhiên)

I Khi n đủ lớn (𝑛 ≥ 30) thì tỷ lệ mẫu F sẽ có phân phối xấp xỉ phân

phối chuẩn 𝐹 ∼ 𝑁

(𝑝,

𝑝(1 − 𝑝)

𝑛

)I Tức là:

𝜇𝐹 = 𝑝 ; 𝜎𝐹 =

√𝑝(1 − 𝑝)

𝑛

Lý thuyết mẫu Vinh Lương September 2018 36 / 41

Example 8

Người ta phát hiện một máy sản xuất có 2% sản phẩm do máy này sảnxuất ra bị hỏng. Tính xác suất trong 400 sản phẩm do máy này sản xuấtra có:

1. Không dưới 3% sản phẩm bị hỏng?2. Không quá 2% sản phẩm bị hỏng?

I Tỷ lệ của tổng thể 𝑝 = 2% (tỷ lệ sản phẩm hỏng)I Gọi F là tỷ lệ sp hỏng của mẫu ngẫu nhiên kích thước 𝑛 = 400

I Do 𝑛 > 30 nên tỷ lệ mẫu F sẽ xấp xỉ phân phối chuẩn

𝐹 ∼ 𝑁(𝜇𝐹 , 𝜎

2𝐹

)với 𝜇𝐹 = 𝑝 ; 𝜎𝐹 =

√𝑝(1 − 𝑝)

𝑛𝐹 ∼ 𝑁(0.02, 0.0072)

I 𝑃 (𝐹 ≥ 3%) = 1 − 𝑃 (𝐹 < 3%)= 1 −𝑁𝑂𝑅𝑀.𝐷𝐼𝑆𝑇 (3%; 2%; 0, 007; 1)= 7.66%

Lý thuyết mẫu Vinh Lương September 2018 37 / 41

Exercise 6Bài 5.6 :Một công bố về kết quả bầu cử cho thấy một ứng cử viên đạt được 46%số phiếu bầu.

1. Tìm xác suất trong 200 số phiếu bầu được chọn ngẫu nhiên từ tổngsố phiếu bầu có đa số phiếu bầu dành cho ứng viên này. (tức là cósố phiếu lớn hơn 50%)

2. Tìm xác suất trong 1000 số phiếu bầu được chọn ngẫu nhiên từ tổngsố phiếu bầu có đa số phiếu bầu dành cho ứng viên này.

ĐS:I 𝑃 (𝐹 ≥ 50%) = 12.82%

I 𝑃 (𝐹 ≥ 50%) = 0.5575%

Lý thuyết mẫu Vinh Lương September 2018 38 / 41

Exercise 7Tỷ lệ sinh viên thi đậu môn XSTK ở 1 trường đại học là 60%. Chọn mộtmẫu bất kỳ gồm 100 sinh viên.

1. Tính xác suất để tỷ lệ đậu của mẫu sẽ nằm trong khoảng từ 55%đến 65%.

2. Nếu lấy ra 50 mẫu bất kỳ như trên thì bạn tin chắc nhất có baonhiêu mẫu sẽ có tỷ lệ đậu từ 55% đến 65%.

ĐS: 0.6922

Exercise 8Kindergarten children have heights that are approximately normallydistributed about a mean of 39 inches and a standard deviation of 2inches. A random sample of size 25 is taken, and the mean is calculated.What is the probability that this mean value will be between 38.5 and40.0 inches?ĐS: 0.8881

Lý thuyết mẫu Vinh Lương September 2018 39 / 41

Exercise 9The average number of pounds of meat that a person consumes per yearis 218.4 pounds. Assume that the standard deviation is 25 pounds andthe distribution is approximately normal.(Source: Michael D. Shook and Robert L. Shook, The Book of Odds.)

1. Find the probability that a person selected at random consumes lessthan 224 pounds per year.

2. If a sample of 40 individuals is selected, find the probability that themean of the sample will be less than 224 pounds per year.

ĐS: 0.5871 và 0.9222

Lý thuyết mẫu Vinh Lương September 2018 40 / 41

Exercise 10It has been estimated that 43% of business graduates believe that acourse in business ethics is very important for imparting ethical values tostudents (David, Anderson, and Lawrimore 1990). Find the probabilitythat more than one-half of a random sample of 80 business graduateshave this belief.ĐS: 0.1020

Exercise 11Forty percent of students at small colleges have brought their ownpersonal computers to campus. A random sample of 120 enteringfreshmen was taken.

1. What is the standard error of the sample proportion bringing theirown personal computers to campus?

2. What is the probability that the sample proportion is between 0.38and 0.46?

Lý thuyết mẫu Vinh Lương September 2018 41 / 41