8.phuong phap chon mau, co mau
TRANSCRIPT
MẪU VÀ PHƯƠNG PHÁPCHỌN MẪU
2
Mục tiêu học tập1. Xác định được quần thể đích, quần thể
nghiên cứu, đơn vị mẫu2. Lựa chọn được phương pháp chọn
mẫu thích hợp3. Dự kiến được các loại sai số trong quá
trình chọn mẫu và các biện pháp khắc phục.
4. Tính được cỡ mẫu cho một nghiên cứu
3
Khái niệm
Quần thểNC
MẫuChọn? ?
Quần thểđích
4
Đơn vị lấy mẫu, khung mẫuĐơn vị lấy mẫu: là đơn vị của quần thể
được chọn vào mẫuKhung mẫu: Danh sách các đơn vị mẫu
hoặc bản đồ phân bố mẫu. Đơn vị nghiên cứu: là một chủ thể mà
sự quan sát hoặc đo lường sẽ được thực hiện trên chủ thể (người hoặc vật thí nghiệm)
5
Nghiên cứu về sử dụng hố xí tại xã X
200 hộ Chủ hộĐại diện
hgđ
PVDanh sách Các hộ gia đình trong xã
Chọn
Đơn vị lấy mẫu
Khung mẫu
Đơn vị NC
6
Không đủ kinh phí Sai số trong điều tra toàn thểMẫu đủ lớn sẽ ngoại suy ra toàn quần
thể
Lý do chọn mẫu
7
CÁC PHƯƠNG PHÁP CHỌN MẪU
8
Các phương pháp chọn mẫu Chọn mẫu có xác suất
Ngẫu nhiên đơnNgẫu nhiên hệ thốngPhân tầngMẫu cụmNhiều giai đoạn
Chọn mẫu không xác suấtThuận tiệnChỉ tiêuMục đích
9
Chọn mẫu ngẫu nhiên đơn
10
Là mẫu mà tất cả các thể trong quần thể có cùng cơ hội để chọn vào mẫu.
Cách chọn:Lập danh sách toàn bộ những đơn vị mẫu trong quần thểSử dụng phương pháp “bốc thăm” hoặc sử dụng bảng số ngẫu nhiên để chọn đơn vị mẫu
Chọn mẫu ngẫu nhiên đơn
11
Chọn mẫu ngẫu nhiên đơnƯu điểm:
Cách làm đơn giản, tính đại diện caoCó thể lòng vào các kỷ thuật chọn mẫu khác
Hạn chế: Cần phải có khung mẫuCác cá thể được chọn vào mẫu có thể phân bố tản mạn.
12
Chọn mẫu ngẫu nghiên hệ thống
Sampling interval’s width is determined
and individuals selected.
13
Chọn mẫu ngẫu nghiên hệ thống Những cá thể được chọn theo một
khoảng cách đều đặn Cách chọn
Ghi một danh sách đơn vị mẫuXác định khoảng cách mẫu k=N/nChọn một số ngẫu nhiên (i) giữa 1 và k.Các cá thể có số thứ tự i + 1k, i + 2k, i + 3k... sẽ được chọn vào mẫu
14
Chọn mẫu phân tầng
15
Chọn mẫu phân tầngLà việc phân chia các cá thể của quần thể
nghiên cứu thành các nhóm riêng lẽLý do phân tầng: Có sự khác biệt về đặc tính
nghiên cứu của các cá thể ở các tầngTầng có thể phân chia theo: Khu vực địa lý, giới,
tuổi, nghề nghiệp…Ví dụ: Để khảo sát các yếu tố nguy cơ gây bệnh
Đái tháo đường tại thành phố CT, nhà nghiên cứu có thể phân chia tầng theo thành thị và nông thôn
16
Cách chọn mẫu tầng
Thành phố CT
Nông thôn Thành thị
PhườngXã
17
Cluster sample
Chọn mẫu chùm (cụm)
18
Chọn mẫu chùm (cụm) Do không có khung mẫu hoặc nghiên cứu
trên địa bàn rộngCó được các nhóm của các đơn vị nghiên
cứu có sẵn (các làng, các trường học) Việc chọn những nhóm các đơn vị nghiên
cứu (các cụm) thay cho việc chọn cá nhân những đơn vị nghiên cứu.
19
Chọn mẫu chùm (cụm)Các cụm thường là những đơn vị địa lý
(xã, ấp/khu vực) hoặc những đơn vị tổ chức (các phòng khám, trường học…).
Số lượng cụm, tuỳ vào số cụm. Nên chọn 30
Ví dụ: Chọn mẫu cụm trong xác định tỷ lệ bao phủ tiêm chủng trẻ dưới 5 tuổi của tỉnh X
20
Dân số chọn mẫu
Mẫu cụm bậc
1
Mẫu cụm bậc
2
Chọn mẫu chùm (cụm)
21
Chọn mẫu PPS – Xác suất tỷ lệ với kích cỡ của quần thể Sử dụng khi nghiên cứu trên cộng đồng lớn,
kích thước các cộng đồng không đều nhau Các bước thực hiện
1. Liệt kê các cụm và dân số 2. Xếp các cụm theo một trình tự và cộng dồn3. Chọn khoảng cách mẫu k = Dscd/số cụm4. Chọn ngẫu nhiên con số i nào đó, chọn cụm
đầu tiên có dân số cộng dồn lớn hơn hoặc bằng i
5. Các cụm kế tiếp tính bằng cách lấy i + k
22
Ví dụMột nghiên cứu về tình trạng sâu răng
của học sinh tiểu học tại quận Ninh kiều TPCT.
Cỡ mẫu: 300 học sinh Số lượng trường tiểu học là 10Số lượng trường tiểu học cần chọn là 4Các bước chọn theo PPS?
23
Tên trường và số lượng học sinhTên Trường Số lượng
1 4002 7003 8004 12005 18006 3007 8008 9009 1100
10 1000Tổng 9000
24
Cộng dồnTên Trường Số lượng Cộng dồn
1 400 4002 700 11003 800 19004 1200 31005 1800 49006 300 52007 800 60008 900 69009 1100 8000
10 1000 9000Tổng 9000
25
Tính khoảng cách kTên Trường Số lượng Cộng dồn
Khoảng cách k
1 400 400 22502 700 11003 800 19004 1200 31005 1800 49006 300 52007 800 60008 900 69009 1100 8000
10 1000 9000Tổng 9000
26
Chọn số ngẫu nhiên i <= kTên Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
1 400 400 22502 700 1100 6793 800 19004 1200 31005 1800 49006 300 52007 800 60008 900 69009 1100 8000
10 1000 9000Tổng 9000
27
Chọn các cụm còn lạiTên Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
1 400 400 22502 700 1100 6793 800 19004 1200 3100 29295 1800 49006 300 5200 51797 800 60008 900 69009 1100 8000 7429
10 1000 9000Tổng 9000
28
Tính tổng học sinh của các trường được chọnTên Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
1 400 400 22502 700 1100 6793 800 19004 1200 3100 29295 1800 49006 300 5200 51797 800 60008 900 69009 1100 8000 7429
10 1000 9000Tổng 9000 3300 0
29
Tính cỡ mẫu cho các trường ni= (n x Ni)/N Tên Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
1 400 400 22502 700 1100 679 643 800 19004 1200 3100 2929 1095 1800 49006 300 5200 5179 277 800 60008 900 69009 1100 8000 7429 100
10 1000 9000Tổng 9000 3300 300
30
Chọn mẫu nhiều giai đoạn Trong những quần thể rất lớn và rải
khắp mẫu có thể được tiến hành theo hai hoặc nhiều giai đoạn
Thường là những nghiên cứu dựa trên cộng đồng, trong đó người được phỏng vấn thuộc những làng khác nhau, và những làng này đã được chọn từ những khu vực khác nhau
31
Ví dụVí dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều
huyện, mỗi huyện có nhiều xã...Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh; Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các
tỉnh đã được chọn ở giai đoạn 1Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các
huyện đã được chọn ở giai đoạn 2,...Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xãGiai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ
mỗi ấp
32
Chọn mẫu không xác xuấtChọn mẫu thuận tiệnĐạt được trên cơ sở các cá thể có sẵn
khi thu thập số liệu. Ví dụ: Tất cả các bệnh nhân đến khám
tại phòng khám hằng ngày. Đây là cách chọn mẫu hay gặp trong
nghiên cứu lâm sàng.
33
Chọn mẫu không xác xuấtChọn mẫu chỉ tiêuLà phương pháp đảm bảo rằng một số
nhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính đặc trưng sẽ có mặt trong mẫu.
34
Chọn mẫu không xác xuấtChọn mẫu mục đíchNhà nghiên cứu đã xác định trước các
nhóm quan trọng để tiến hành thu thập số liệu.
Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau.
Đây là cách hay dùng trong các điều tra thăm dò, phỏng vấn sâu.
35
Các sai số thường gặp trong chọn mẫu
Sự không đáp ứng Nghiên cứu với người tình nguyện Sai số do mùa Sai số do đường xá
36
Sự không đáp ứng Là hiện tượng các cá thể từ chối tham gia nghiên
cứu. Thường hay gặp trong thử nghiệm lâm sàng Cách khắc phục:
Chuẩn hoá phương pháp thu thập số liệuGiải thích các đối tượng trước khi thu thập số liệuNếu vằng mặt thì người điều tra phải quay lại gặp cho bằng được.Nếu đối tượng không muốn hợp tác thì phải xem xét lại đối tượng này để tìm ra các đặc điểm khác với những đối tượng tham gia.Có thể chọn thêm đối tượng vào mẫu để thay thế những người không tham gia.
37
CỠ MẪU
38
Các yếu tố ảnh hưởng đến cỡ mẫu
Loại thiết kế nghiên cứuPhương pháp chọn mẫuĐộ lớn của tham số được nghiên cứuMức độ sai lệch tham số mẫu và tham
số quần thể Khả năng thực thi
39
Cỡ mẫu cho việc ước tính tỷ lệ trong quần thể
22
2/1)1(
dppZn
Cỡ mẫu Tỷ lệ ước đoán
Khoảng sai lệch
Mức ý nghĩa thống kê
Hệ số tin cậy
0,1 0,05
0,05 0,01
40
Giá trị ZGiá trị Z thu được từ bằng cách tra
bảng ZVới α = 0,1 ; Z = 1,645Với α = 0,05; Z = 1,96Với α = 0,01; Z= 2,58
41
Ví dụ Trưởng phòng y tế huyện muốn xác định
tỷ lệ SDD của trẻ dưới 5 tuổi trong huyện hiện tại là bao nhiêu. Giả sử rằng bạn sử dụng kỷ thuật chọn mẫu ngẫu nhiên, hãy tính cỡ mẫu cần thiết cho cuộc điều tra này. Biết rằng tỷ lệ SDD chung của quốc gia là 30%, độ tin cậy là 95%, khoảng sai lệch 5%.
42
Cách tính cỡ mẫu nghiên cứu đối với ước tính một tỷ lệ trong QT
22
2/1)1(
dppZn
Cỡ mẫu Tỷ lệ ước đoán
Khoảng sai lệch
Mức ý nghĩa thống kê
Hệ số tin cậy
0,050,05
1,96
0,3
323
VD: Muốn ước lượng tỷ lệ hộ gia đình có người mắc bệnh A, dựa vào tài liệu của một số nghiên cứu trước chúng ta biết tỷ lệ này là 35%. Nếu chúng ta sử dụng độ chính xác là 99% , sai số tuyệt đối là 5% thì cỡ mẫu cần thiết là bao nhiêu?
44
Quần thể hữu hạn
P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã hiệu chỉnh Với ví dụ trên, dân số trẻ dưới 5 tuổi trong
huyện là 1000 thì số trẻ cần cho nghiên cứu?
PNPNNhc
45
Cỡ mẫu trong nghiên cứu đối với giá trị trung bình
2
22
2/1 dZn
n: là cỡ mẫu nghiên cứu cần cóσ: Độ lệch chuẩn quần thể
VD: Nhà nghiên cứu muốn ước lượng cân
nặng trung bình của trẻ em mới sinh ra trong cộng đồng. Có một báo cáo từ một nghiên cứu khác ở địa bàn tương tự cộng đồng này đã cho biết độ lệch chuẩn là 600gr. Người nghiên cứu cần có một mẫu trong đó độ rộng khoảng tin cậy dao động không quá 60gr với độ tin cậy là 99%. Vậy cỡ mẫu nghiên cứu là bao nhiêu?
47
Hiệu lực thiết kế (Design Effect): D
Sử dụng trong nhiều trường hợp chọn mẫu: mẫu cụm, chọn mẫu nhiều giai đoạn.
Đễ đảm bảo tính chính xác của mẫu, nhà nghiên cứu thường nhân cỡ mẫu với một hệ số gọi là hiệu lực thiết kế (ký hiệu D).
Giá trị của D: 1,5 - 2…Thông thường chọn D = 2.
Một nghiên cứu nhằm khảo sát tỷ lệ hút thuốc lá của sinh viên nam tại trường Đại học Tây Đô. Theo một số nghiên cứu khác cho thấy tỷ lệ Hút thuốc lá trong Nam sinh viên của các trường Đại học là 30%.
a) Tính cỡ mẫu cho nghiên cứub) Giả sử số liệu các lớp sinh viên trong
trường theo bảng, hãy sử dụng phương pháp chọn mẫu thích hợp chọn ra học sinh (Phương pháp chọn, cách chọn, lớp được chọn, học sinh trong lớp được chọn....)
Lớp D1 D2 D3 D4 D5 D6 D7
Số sv 270 232 278 300 250 130 120
Lớp D8
ĐD1
ĐD2
ĐD3
ĐD4
CTD2
CTD3
Số sv 67 150 105 76 54 86 67