ĐỀ tÀi khoa hỌc sỐ: 03-2004 -...

22
72 ĐỀ TÀI KHOA HỌC SỐ: 03-2004 NGHIÊN CỨU CÁC NGUYÊN TẮC XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU ỨNG DỤNG VÀO THỰC TIỄN ĐIỀU TRA THỐNG KÊ Ở NƢỚC TA 1. Cấp đề tài : Tổng cục 2. Thời gian nghiên cứu : 2003-2004 3. Đơn vị chủ trì : Viện Khoa học Thống kê 4. Đơn vị quản lý : Viện Khoa học Thống kê 5. Chủ nhiệm đề tài : CN. Lê Văn Duỵ 6. Những ngƣời phối hợp nghiên cứu: PGS.TS. Tăng Văn Khiên CN. Vũ Văn Tuấn Ths. Nguyễn Văn Đoàn CN. Phan Đắc Lộc TS. Phùng Chí Hiền CN. Cao Nhƣ Nguyệt CN. Nguyễn Văn Minh CN. Phan Ngọc Trâm CN. Đỗ Văn Huân CN. Trần Thị Thanh Hƣơng 7. Kết quả bảo vệ: Loại giỏi

Upload: others

Post on 10-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

72

ĐỀ TÀI KHOA HỌC

SỐ: 03-2004

NGHIÊN CỨU CÁC NGUYÊN TẮC XÁC ĐỊNH

CỠ MẪU VÀ PHÂN BỔ MẪU ỨNG DỤNG VÀO THỰC TIỄN

ĐIỀU TRA THỐNG KÊ Ở NƢỚC TA

1. Cấp đề tài : Tổng cục

2. Thời gian nghiên cứu : 2003-2004

3. Đơn vị chủ trì : Viện Khoa học Thống kê

4. Đơn vị quản lý : Viện Khoa học Thống kê

5. Chủ nhiệm đề tài : CN. Lê Văn Duỵ

6. Những ngƣời phối hợp nghiên cứu:

PGS.TS. Tăng Văn Khiên

CN. Vũ Văn Tuấn

Ths. Nguyễn Văn Đoàn

CN. Phan Đắc Lộc

TS. Phùng Chí Hiền

CN. Cao Nhƣ Nguyệt

CN. Nguyễn Văn Minh

CN. Phan Ngọc Trâm

CN. Đỗ Văn Huân

CN. Trần Thị Thanh Hƣơng

7. Kết quả bảo vệ: Loại giỏi

Page 2: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

73

PHẦN MỘT

CƠ SỞ LÝ LUẬN VỀ XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU

I. XÁC ĐỊNH CỠ MẪU

1.1. Các nguyên tắc xác định cỡ mẫu cơ bản

Việc xác định cỡ mẫu của một cuộc điều đƣợc xác định dựa vào hai

nguyên tắc cơ bản sau:

a. Phải dựa vào mức độ biến động (đƣợc biểu hiện thông qua phƣơng

sai) của chỉ tiêu cần đƣợc nghiên cứu của cuộc điều tra. Mức độ biến động

này càng lớn cỡ mẫu càng lớn, ngƣợc lại mức độ biến động của chỉ tiêu

đƣợc nghiên cứu càng nhỏ, cỡ mẫu cần thiết cho điều tra cũng nhỏ theo.

b. Phải dựa vào mức độ sai số cho phép. Khi sử dụng thông tin,

ngƣời dùng tin hiểu biết thống kê thƣờng đòi hỏi chỉ tiêu cần đƣợc nghiên

cứu chỉ mắc một sai số nhất định. Điều này cũng có tính chất quyết định

đến cỡ mẫu cần cho cuộc điều tra. Mức độ sai số cho phép càng lớn cỡ

mẫu càng nhỏ. Ngƣợc lại, mức độ sai số cho phép nhỏ cỡ mẫu phải lớn.

c. Số lƣợng các chỉ tiêu thống kê cần thu thập. Số lƣợng các chỉ tiêu

thống kê cần thu thập qua cuộc điều tra ít, cỡ mẫu có thể lớn, ngƣợc lại số

lƣợng các chỉ tiêu thống kê cần thu thập qua cuộc điều tra nhiều cỡ mẫu

cần phải nhỏ. Làm ngƣợc lại sẽ ảnh hƣởng tới chất lƣợng của cuộc điều tra.

d. Cấp độ và mức độ chi tiết của thông tin cần đƣa ra, tức là thông

tin sẽ đại diện cho tới cấp độ nào (ví dụ tới cấp tỉnh/ thành phố hay tới cấp

huyện,...) hoặc mức độ chi tiết đến đâu? Cấp độ và mức độ thông tin càng

chi tiết, cỡ mẫu càng phải lớn có nhƣ vậy mới đáp ứng đƣợc yêu cầu đặt ra.

1.2. Phƣơng pháp xác định cỡ mẫu cơ bản

Trên phƣơng diện lý thuyết, xác định cỡ mẫu dựa vào mức độ biến

động của chỉ tiêu cần nghiên cứu tạo ra một bài toán cơ bản đƣợc trình bày

dƣới đây.

+ Đối với chọn mẫu ngẫu nhiên đơn giản có hoàn lại (chọn lặp):

Page 3: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

74

Trong trƣờng hợp chọn mẫu có hoàn lại, bình phƣơng sai số của tiêu

thức đƣợc nghiên cứu có dạng có dạng: n

SxD

22 )(

. Thay giá trị này vào

công thức (1.5) rồi giải phƣơng trình ta có công thức tính cỡ mẫu nhƣ sau:

2

22

d

Sun

; (1.6)

+ Đối với chọn mẫu ngẫu nhiên đơn giản không hoàn lại (chọn

không lặp):

Bình phƣơng sai số của chọn mẫu ngẫu nhiên đơn giản trong trƣờng

hợp chọn không hoàn lại có dạng: )11

()( 22

NnSxD

. Thay giá trị của

)x(D-

2 vào phƣơng trình xác định cỡ mẫu ta có: 0)11

( 222 dNn

Su . Giải

phƣơng trình này với ẩn số là n thu đƣợc kết quả sau:

222

22

NdSu

SNun

; (1.7)

+ Đối với chọn mẫu ngẫu nhiên phân tổ:

a. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại và

cơ chế phân bổ mẫu là phân bổ tỷ lệ với quy mô thì phƣơng sai chung của

mẫu có dạng:

k

i

iim SWNn

xD 22 11, với k là số tổ

Thay D2 ở công thức này vào phƣơng trình (1.5) rồi giải với ẩn số là

n ta sẽ có công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với cơ

chế chọn ngẫu nhiên không hoàn lại và phân bổ mẫu tỷ lệ thuận với quy

mô tổ". Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:

k

i

ii

k

i

ii

SWNu

d

SW

n

1

2

2

2

1

2

1

, ; (1.8)

Page 4: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

75

b. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại và

cơ chế phân bổ mẫu là phân bổ Neyman thì phƣơng sai chung của mẫu có

dạng:

k

i

ii

k

i

iim SWN

SWn

xD1

2

2

1

2 11)(

Thay D2 ở công thức này vào phƣơng trình (1.5) rồi giải với ẩn số là

n sẽ có công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với cơ

chế chọn ngẫu nhiên không hoàn lại và phân bổ mẫu theo kiểu Neyman".

Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:

k

i

ii

k

i

ii

SWNu

d

SW

n

1

2

2

2

2

1

1

; (1.9)

II. PHÂN BỔ MẪU

Trong điều tra chọn mẫu có hai trƣờng hợp cần tiến hành phân bổ

mẫu, đó là khi áp dụng điều tra chọn mẫu phân tổ hoặc khi áp dụng điều tra

chọn mẫu phân tầng. Sau đây là các nguyên tắc cần chú ý khi tiến hành

phân bổ mẫu và một số phƣơng pháp phân bổ mẫu cơ bản.

2.1. Các nguyên tắc phân bổ mẫu cho các tổ

Về phƣơng diện lý thuyết, việc phân bổ mẫu cho các tổ phụ thuộc

vào mức độ biến động của chỉ tiêu cần nghiên cứu ở từng tổ. Mặt khác nó

còn phụ thuộc vào dung lƣợng thông tin từng tổ hoặc từng đơn vị điều tra.

Với lý do đó việc phân bổ mẫu cũng có những nguyên tắc nhất định. Sau

đây là những nguyên tắc cơ bản thƣờng đƣợc sử dụng khi phân bổ số lƣợng

đơn vị mẫu cho các tổ.

a. Dựa vào mức độ biến động của chỉ tiêu cần thu thập trong từng

tổ. Với nguyên tắc này, tổ nào có sự biến động lớn, tổ đó cần đƣợc phân bổ

số lƣợng đơn vị mẫu nhiều hơn.

b. Dựa vào tầm quan trọng của từng cá thể, từng nhóm cá thể đối

với thông tin cần cho ra để phân bổ mẫu.

Page 5: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

76

Với một chủ đề thông tin cần thu thập, các đơn vị điều tra thƣờng có

dung lƣợng thông tin khác nhau. Có đơn vị mang nhiều dung lƣợng thông

tin hơn, ngƣợc lại có đơn vị có rất ít lƣợng thông tin . Trong điều kiện nhƣ

vậy, thƣờng ngƣời ta dựa vào dung lƣợng thông tin để phân tổ tổng thể ra

thành các tổ có dung lƣợng thông tin khác nhau. Trên cơ sở đó, phân bổ cỡ

mẫu cho các tổ theo nguyên tắc các tổ có dung lƣợng thông tin phong phú

tỷ lệ chọn mẫu phải cao, thậm chí có khi phải chọn hết.

c. Dựa vào nhu cầu thông tin của các cấp lãnh đạo.

d. Dựa vào số lượng các đơn vị cá thể và tính đồng đều của các đơn

vị cá thể trong mỗi tổ: Số lƣợng càng lớn thì số đơn vị mẫu có thể giảm

tƣơng đối; Tính đồng đều của các đơn vị cá thể càng cao thì phân bổ cỡ

mẫu có thể giảm đi.

2.2. Các phƣơng pháp phân bổ mẫu cho các tổ

Về mặt lý luận, ngƣời ta thƣờng nhắc đến các kiểu phân bổ mẫu cơ

bản là phân bổ mẫu tỷ lệ thuận với quy mô, phân bổ mẫu tỷ lệ nghịch với

quy mô, phân bổ mẫu Neyman, phân bổ mẫu tối ƣu.

2.2.1. Phân bổ mẫu tỷ lệ thuận với quy mô

Công thức phân bổ mẫu tỷ lệ thuận với quy mô có dạng:

nWnN

Nn i

ii ** với i=1,2,...,M ; (1.10)

Trong đó M là số tổ; n là cơ mẫu chung của tổng thể ni là cỡ mẫu

của tổ i , N là quy mô tổng thể; Ni là quy mô của tổ i; Wi là tỷ trọng của tổ i

trong tổng thể.

Phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô thƣờng đƣợc áp

dụng khi quy mô của các tổ tƣơng đối đồng đều, phƣơng sai và chi phí cho

các tổ không quá khác biệt nhau và khi không biết trƣớc phƣơng sai cũng

nhƣ chi phí cho một đơn vị mẫu.

Phân bổ mẫu tỷ lệ thuận với quy mô có một số ƣu là quy trình phân

bổ mẫu đơn giản. Mặt khác rất phù hợp với suy nghĩ thông thƣờng của mọi

ngƣời nên dễ đƣợc chấp nhận. Quy trình ƣớc lƣợng đơn giản. Đối với các

chỉ tiêu tƣơng đối, không cần phải quyền số hoá khi ƣớc lƣợng chúng.

Page 6: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

77

Mẫu phân bổ tỷ lệ thuận với quy mô tổ thuộc loại "tự cân đối quyền số".

Tuy nhiên, phƣơng pháp phân bổ mẫu này có một số nhƣợc điểm là trong

trƣờng hợp quy mô của các tổ chênh lệch nhau quá lớn, các tổ có quy mô

nhỏ thƣờng không đủ số lƣợng đơn vị mẫu để đại diện cho tổ mình, trong

trƣờng hợp quy mô của các tổ chênh lệch nhau quá lớn, việc tổ chức điều

tra cũng nhƣ kinh phí cần thiết cho điều tra ở các tổ có quy mô lớn sẽ rất

nặng nề, gây lãng phí không cần thiết.

2.2.2. Phân bổ mẫu tỷ lệ nghịch với quy mô

Để khắc phục nhƣợc điểm của phƣơng pháp phân bổ mẫu tỷ lệ thuận

với quy mô, ngƣời ta thƣờng phân bổ theo cách tổ có qui mô càng bé thì tỷ

lệ chọn mẫu của nó càng lớn, còn tổ có qui mô lớn thì có tỷ lệ chọn mẫu

nhỏ. Bằng cách này thông tin không những đại diện đƣợc cho toàn bộ tổng

thể mà còn có thể đại diện đƣợc cho từng tổ một.

Phƣơng pháp phân bổ mẫu tỷ lệ nghịch với quy mô có những ƣu

điểm là cho phép các tổ có quy mô nhỏ cũng có đủ số lƣợng đơn vị mẫu để

có thể có cơ may tiếp cận tốt hơn và gánh nặng điều tra và kinh phí không

dồn vào một tổ. Tuy nhiên, phƣơng pháp phân bổ mẫu này cũng có những

hạn chế là việc ƣớc lƣợng các thông số cho tổng thể phức tạp.

Nhóm các phƣơng pháp phân bổ mẫu tỷ lệ nghịch với qui mô có

một số đại diện là phƣơng pháp phân bổ mẫu Maitra (tên một học giả),

phƣơng pháp phân bổ mẫu đều và phƣơng pháp phân bổ mẫu tỷ lệ nghịch

với qui mô dựa vào phân bổ mẫu tỷ lệ thuận với qui mô.

a. Phương pháp phân bổ mẫu Maitra

Trên cơ sở giả thiết là các kết quả ƣớc lƣợng thu đƣợc ở các tổ có sai

số chọn mẫu nhƣ nhau, Maitra đã tính toán và đƣa ra công thức xác định cỡ

mẫu riêng cho từng tổ một nhƣ sau:

Tỷ lệ chọn mẫu của tổ thứ nhất (tổ nào là tổ thứ nhất là tuỳ thuộc

vào sự sắp xếp của cán bộ thiết kế mẫu và cũng không ảnh hƣởng gì tới kết

quả chung) đƣợc xác định bằng công thức:

M

af

f

M

i

i

2

1

1

)1(

; )11.1(

Page 7: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

78

Trong đó : f là tỷ lệ chọn mẫu chung, i

iN

Na 1 (i =2,3,...,M)

+ Tỷ lệ chọn mẫu của các tổ còn lại đƣợc xác định bằng công thức:

1

1

)1(1 fa

faf

i

ii

(i =2,3,...,M) ; )12.1(

Có tỷ lệ chọn mẫu của từng tổ, muốn có số lƣợng mẫu của chúng chỉ

cần nhân tỷ lệ này với quy mô của tổ:

iii Nfn , với i= 1,...,M ; (1.13)

Phƣơng pháp phân bổ mẫu nghịch đảo này có ƣu điểm là cho phép

so sánh kết quả ƣớc lƣợng của các tổ với nhau; Cách phân bổ này loại trừ

đƣợc ảnh hƣởng của quy mô tổ chỉ còn lại ảnh hƣởng của phƣơng sai nội

bộ tổ và các đơn vị có qui mô lớn không phải điều tra một khối lƣợng lớn

đơn vị mà vẫn đảm bảo mức độ đại diện theo yêu cầu.

b. Phương pháp phân bổ mẫu đều

Ở phƣơng pháp này, số các đơn vị mẫu đƣợc chia đều cho các tổ.

Công thức phân bổ có dạng:

M

nnh , với h=1,..,M ; (1.14)

Phƣơng pháp phân bổ mẫu đều thƣờng đƣợc áp dụng khi quy mô

của các tổ tƣơng đối đồng đều, phƣơng sai và chi phí cho các tổ không quá

khác biệt nhau và khi không biết trƣớc phƣơng sai cũng nhƣ chi phí cho

một đơn vị mẫu.

Phƣơng pháp phân bổ mẫu đều có những ƣu và nhƣợc điểm tƣơng tự

nhƣ phƣơng pháp phân bổ mẫu Maitra.

c. Phân bổ mẫu tỷ lệ nghịch với qui mô dựa vào phân bổ mẫu tỷ lệ

thuận với qui mô

Nhiều trƣờng hợp sau khi phân bổ mẫu cho các tổ theo phƣơng pháp

phân bổ tỷ lệ thuận với qui mô xảy ra hiện tƣợng nhiều tổ cỡ mẫu "quá

thừa số lƣợng đơn vị mẫu đại diện" trong khi đó nhiều tổ lại "chƣa đủ số

lƣợng mẫu đại diện". Trong trƣờng hợp nhƣ vậy, cần hiệu chỉnh cỡ mẫu

sao cho tiếp cận tổ không xảy ra hiện tƣợng "tốt lỏi" và không bị "lãng

Page 8: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

79

phí". Việc hiệu chỉnh cỡ mẫu này đã chuyển phƣơng pháp phân bổ mẫu tỷ

lệ thuận với qui mô sang phƣơng pháp phân bổ mẫu tỷ lệ nghịch với qui

mô.

Lý thuyết cho thấy nếu cỡ mẫu của tổ i chuyển từ ni sang n'i thì

phƣơng sai của tổ này sẽ phải nhân với i

i

n

n

'. Trong thực tế, chỉ tiêu đƣợc

quan tâm không phải là phƣơng sai mẫu mà là sai số mẫu, vì vậy sai số

mẫu cũ phải đƣợc nhân với i

i

n

n

'.

Nếu quy mô mẫu chung không đổi mà việc phân bổ mẫu cho các tổ

đƣợc thực hiện theo phƣơng pháp "cỡ mẫu tỷ lệ nghịch với quy mô" thì tỷ

lệ chọn mẫu không đồng đều sẽ làm tăng sai số chọn mẫu cho mẫu chung.

Trong trƣờng hợp nhƣ vậy phƣơng sai mẫu của mẫu chung cần phải đƣợc

nhân với hệ số sau2:

M

i

ii

M

i

M

i

iii

Wn

nWn

L

1

2

1 1

2

)(

))((

2.2.3. Phân bổ Neyman

Để nâng cao hiệu quả của thiết kế mẫu, Neyman đã đƣa ra và giải

bài toán: với cỡ mẫu chung cho trƣớc bằng n, cần phân bổ nó cho k tổ sao

cho phƣơng sai chung của mẫu nhỏ nhất. Kết quả nghiên cứu của Neyman

đã đƣa ra công thức phân bổ mẫu sau:

n

SN

SNn

M

i

ii

iii

1

(i=1,2,3,...,M) ; )15.1(

Công thức (1.15) có tên gọi là "Phân bổ Neyman". Công thức trên

cho thấy cỡ mẫu của các tổ vừa tỷ lệ thuận với phƣơng sai của các tổ vừa

tỷ lệ thuận với quy mô của các tổ. Tổ nào có qui mô hoặc phƣơng sai lớn

tổ đó sẽ có cỡ mẫu lớn. Nhƣ vậy phân bổ Neyman vừa tính đến sự khác

2 DHS 1987: Sampling Manual; trang 14 2 Leslie Kish 1995: Survey Sampling; trang 94

Page 9: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

80

biệt về quy mô tổ vừa tính đến sự khác biệt về phƣơng sai giữa các tổ.

Phƣơng pháp phân bổ mẫu Neyman thƣờng đƣợc áp dụng khi phƣơng sai

của các tổ cũng nhƣ quy mô của các tổ tƣơng đối khác biệt nhau.

Lý thuyết đã chứng minh đƣợc là hiệu quả thiết kế mẫu theo phân bổ

Neyman cao hơn so với phân bổ tỷ lệ thuận với quy mô và càng cao hơn so

với mẫu ngẫu nhiên đơn giản có cùng quy mô (SE phân bổ Neyman < SE

phân bổ tỷ lệ thuận với quy mô < SE phân bổ ngẫu nhiên cho tổng thể).

Ngoài các ƣu điểm đã nêu trên, phân bổ Neyman còn một ƣu điểm khác

nữa là với cùng một yêu cầu về sai số và độ tin cậy, nó có cỡ mẫu nhỏ hơn

các loại phân bổ khác và vì vậy tiết kiệm đƣợc kinh phí hơn.

2.2.4. Phân bổ mẫu tối ưu

Khi tiến hành thiết kế mẫu, ngƣời thiết kế luôn hƣớng vào mục tiêu

làm sao cho kết quả thu đƣợc từ mẫu đảm bảo mức độ chính xác mong

muốn trong điều kiện sức ngƣời, sức của cho phép. Với lý do đó, khi thiết

kế mẫu ngƣời ta cố gắng tìm cách phân bổ mẫu để đạt đƣợc cùng một lúc

hai mục tiêu: sai số chọn mẫu nhỏ nhất trong điều kiện kinh phí cho phép.

Phân bổ mẫu đạt đƣợc điều kiện nhƣ vậy đƣợc gọi là phân bổ mẫu tối ƣu

(I.M. Chakravati và cộng sự: Handbook of Methods of Applied Statistics;

Volume II trang 40). Công thức phân bổ mẫu tối ƣu nhƣ sau:

n

c

SN

c

SN

nM

i i

ii

i

ii

i

1

, với i=1,2,…,M ; (1.16)

Công thức trên cho thấy khi các tổ chi phí bình quân cho một đơn vị

điều tra như nhau (ci=c, với i=1,2,…,M), phân bổ mẫu tối ưu trở thành

phân bổ mẫu Neyman. Trong trường hợp consantc

S

i

i (với i=1,2,…,M),

phân bổ mẫu tối ưu trở về dạng phân bổ mẫu tỷ lệ thuận với quy mô.

Phƣơng pháp phân bổ mẫu tối ƣu thƣờng đƣợc áp dụng khi phƣơng

sai của các tổ và chi phí cho một đơn vị điều tra ở các tổ có sự khác biệt

nhau đáng kể. Phân bổ mẫu tối ƣu có một ƣu điểm lớn là vừa đảm bảo yêu

cầu của phân bổ Neyman, tức là có tính đến mức độ biến động khác nhau ở

Page 10: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

81

các tổ, vừa đảm bảo yêu cầu có sự khác nhau về mặt kinh phí của các tổ.

Tuy nhiên, cũng giống nhƣ phƣơng pháp phân bổ mẫu Neyman, phƣơng

pháp phân bổ mẫu tối ƣu cũng chỉ là tối ƣu đối với mẫu chung, chứ chƣa

chắc đã tối ƣu đối với từng tổ.

2.3. Nguyên tắc phân bổ mẫu trong điều tra chọn mẫu phân tầng

Trong điều tra chọn mẫu phân tầng, việc phân bổ mẫu là việc phân

chia số lƣợng đơn vị mẫu giữa các tầng. Công thức xác định cỡ mẫu trong

mẫu phân tầng (ở đây để dễ hiểu chỉ nghiên cứu mẫu hai tầng) có dạng:

n= m*n0,

Trong đó n là cỡ mẫu chung, m là số lƣợng đơn vị mẫu cấp I, còn n0

là số lƣợng đơn vị mẫu cấp II bình quân.

Tuy có thể có nhiều loại mẫu phân tầng (mẫu hai tầng, mẫu ba

tầng,…), song chúng đều có nguyên tắc phân bổ chung, đó là dựa vào mật

độ của đối tƣợng điều tra trong đơn vị mẫu cấp trên. Mật độ của đối tƣợng

điều tra ở mẫu cấp trên thấp, số lƣợng đơn vị mẫu của nó phải nhiều và số

lƣợng đơn vị mẫu cấp dƣới sẽ giảm đi (vì cỡ mẫu chung n không đổi).

PHẦN HAI

THỰC TẾ XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU TRONG CÁC

CUỘC ĐIỀU TRA CHỌN MẪU CỦA TỔNG CỤC THỐNG KÊ

I. THỰC TẾ XÁC ĐỊNH CỠ MẪU

Các vụ thống kê nghiệp vụ của Tổng cục Thống kê từ nhiều năm nay

đã tiến hành điều tra chọn mẫu. Nhiều cuộc điều tra do chính các vụ tự

thiết kế và thực hiện. Mặt khác, có nhiều cuộc điều tra việc thiết kế mẫu có

sự trợ giúp của các chuyên gia trong và ngoài nƣớc. Phần này đƣợc viết

dựa trên các báo cáo do các vụ thống kê nghiệp vụ của Tổng cục Thống kê

viết và các phƣơng án điều tra đã đƣợc công bố.

1.1. Trong điều tra chọn mẫu của Vụ Thống kê Dân số và Lao động

Vụ Thống kê Dân số và Lao động tiến hành các cuộc điều tra chọn

mẫu nhƣ điều tra chọn mẫu lồng ghép trong tổng điều tra dân số 1989,

1999, điều tra chọn mẫu nhân khẩu học giữa kỳ, điều tra biến động dân số

hàng năm, điều tra nhiều vòng.

Page 11: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

82

Đối với cuộc điều tra chọn mẫu lồng trong tổng điều tra dân số 1999,

cỡ mẫu đƣợc ấn định là 3% số dân số của toàn quốc. Tỷ lệ chọn mẫu của

năm 1999 giảm đi là do sau khi nghiên cứu kết quả điều tra chọn mẫu lồng

trong tổng điều tra dân số 1989, các chuyên gia thấy chỉ cần điều tra với tỷ

lệ mẫu nhƣ vậy là đủ. Tƣơng tự nhƣ điều tra chọn mẫu lồng trong tổng điều

tra của năm 1989, tỷ lệ chọn mẫu của các tỉnh đƣợc xác định dựa vào số

dân do hệ thống báo cáo dân số thƣờng xuyên và tỷ lệ chọn mẫu chung của

toàn quốc.

1.2. Trong điều tra chọn mẫu của Vụ Thống kê Xã hội và Môi trƣờng

Vụ Thống kê Xã hội và Môi trƣờng từ lâu đã tiến hành điều tra chọn

mẫu về hộ gia đình. Bắt đầu từ năm 1994 cuộc điều tra này đƣợc tiến hành

thƣờng xuyên hơn. Trong giai đoạn 1994-2000, nội dung điều tra gồm

nhiều lĩnh vực khác nhau nên các cuộc điều tra về hộ gia đình trên có tên

gọi là điều tra đa mục tiêu. Phƣơng pháp điều tra là phƣơng pháp chọn

mẫu. Cỡ mẫu đƣợc ấn định cho cả nƣớc là 45.000 hộ. Từ năm 2002, cơ

quan có chủ trƣơng cứ hai năm tiến hành điều tra một lần và nội dung chủ

yếu tập trung vào mức sống của dân cƣ nên cuộc điều tra này đƣợc gọi là

"Khảo sát mức sống hộ gia đình". Việc xác định cỡ mẫu của Vụ Thống kê

Xã hội và Môi trƣờng trƣớc đây hoặc dựa vào kinh nghiệm của các chuyên

gia nƣớc ngoài, hoặc dựa vào kinh nghiệm của mình.

1.3. Trong điều tra chọn mẫu của Vụ Thống kê Nông, Lâm nghiệp và

Thủy sản

Vụ Thống kê Nông, Lâm nghiệp và Thủy sản điều tra thu thập thông

tin về năng suất, sản lƣợng cây trồng, số lƣợng đầu gia súc và năng suất,

sản lƣợng thủy hải sản. Phƣơng pháp điều tra chọn mẫu cũng đƣợc áp dụng

trong lĩnh vực này. Trong cuộc điều tra thực thu của các hộ gia đình

phƣơng pháp điều tra chọn mẫu phân tổ kết hợp với phân tầng đã đƣợc áp

dụng. Số các đơn vị điều tra đƣợc ấn định là mỗi huyện chọn khoảng 1/3 số

xã; mỗi xã đƣợc chọn chọn lấy 3 thôn và mỗi thôn đƣợc chọn lại chọn lấy

một số hộ. Tổng số hộ đƣợc chọn để điều tra cho một huyện dao động từ

100-300 hộ. Trong cuộc điều tra năng suất, sản lượng lúa giai đoạn 1996-

1997 việc xác định số đơn vị để điều tra cũng dựa vào việc xác định tỷ lệ

Page 12: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

83

các xã, thôn và hộ cần chọn. Tuy nhiên, tỷ lệ chọn các đơn vị điều tra ở các

cấp đƣợc xác định cho từng loại tổ theo quy mô của chúng. Trong cuộc

điều tra chăn nuôi áp dụng hai hình thức điều tra: điều tra toàn bộ và điều

tra chọn mẫu tuỳ thuộc vào vật nuôi và sản phẩm chăn nuôi. Điều tra toàn

diện thƣờng ứng dụng đối với các trang trại, còn điều tra chọn mẫu áp dụng

đối với khu vực hộ gia đình. Phƣơng pháp chọn mẫu cũng là phân tổ kết

hợp với phân tầng (cấp). Mỗi huyện là một tổ. Xã là đơn vị chọn mẫu cấp I

(coi mỗi tổ là một tổng thể), thôn là đơn vị chọn mẫu cấp II và hộ là đơn vị

chọn mẫu cấp III. Điều tra lâm nghiệp ngoài quốc doanh, các xã trong

huyện đƣợc chia ra thành 3 hoặc 4 vùng. Mỗi vùng chọn 1 hoặc 2 thôn

bản, mỗi thôn bản đƣợc chọn lại chọn từ 10-15% số hộ để điều tra. Điều

tra thủy sản ngoài quốc doanh, các xã trong huyện đƣợc chia ra thành các

vùng tùy thuộc vào điều kiện đánh bắt hoặc nuôi trồng thủy sản. Mỗi vùng

chọn từ 2 đến ba 3 xã đại diện, mỗi xã chọn từ 15 đến 20 cơ sở để điều tra.

1.4. Trong điều tra chọn mẫu của Vụ Thống kê Thƣơng mại, Dịch vụ

và Giá cả

Các cuộc điều tra do Vụ Thống kê Thƣơng mại, Dịch vụ và Giá cả

tiến hành hầu hết thuộc dạng "điều tra phân tổ kết hợp với điều tra nhiều

cấp". Mỗi huyện/ quận đƣợc coi là một tổ. Đơn vị chọn mẫu cấp I là xã/

phƣờng. Việc xác định cỡ mẫu đƣợc quy định là các quận, huyện dƣới

2000 cơ sở SXKD cá thể điều tra 40% số xã/ phƣờng, các quận, huyện có

từ 2000 đến dƣới 5000 cơ sở SXKD cá thể điều tra 35% số xã/ phƣờng, các

quận, huyện có từ 5000 cơ sở SXKD cá thể trở lên điều tra 30% số xã/

phƣờng.

1.5. Trong điều tra chọn mẫu của Vụ Thống kê Công nghiệp và Xây dựng

Tƣơng tự nhƣ ở các vụ thống kê nghiệp vụ khác, việc xác định cỡ

mẫu cho điều tra các doanh nghiệp của Vụ Thống kê Công nghiệp và Xây

dựng cũng ở dạng đƣa ra các tỷ lệ chọn mẫu cho các tổ có quy mô khác

nhau. Ví dụ, trong điều tra mẫu hàng tháng cỡ mẫu được xác định là đối

với điều tra mẫu trong các doanh nghiệp ngoài quốc doanh, tỷ lệ chọn mẫu

quy định là 15%; Đối với điều tra mẫu trong các cơ sở cá thể, tỷ lệ mẫu của

từng tỉnh, thành phố đƣợc quy định theo số lƣợng các cơ sở hiện có: Dƣới

Page 13: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

84

10.000 cơ sở tỷ lệ chọn mẫu là 2%; Từ 10.000 đến dƣới 30.000 cơ sở tỷ lệ

chọn mẫu là 1,5%; Từ 30.000 cơ sở trở lên tỷ lệ chọn mẫu là 1%.

1.6. Một số nhận xét về cách xác định cỡ mẫu ở các vụ

Trong các cuộc điều tra do các vụ thống kê nghiệp vụ tự thiết kế

mẫu, việc xác định cỡ mẫu thƣờng theo một trong hai xu hƣớng sau:

a. Quy định tỷ lệ chọn mẫu chung hoặc tỷ lệ chọn mẫu cho từng cấp

(các vụ thƣờng tổ chức điều tra chọn mẫu nhiều cấp).

b. Quy định sẵn số đơn vị chọn mẫu cho cuộc điều tra.

Ở xu hƣớng thứ nhất việc xác định cỡ mẫu (n) hoàn toàn dựa vào

suy nghĩ chủ quan của ngƣời thiết kế mẫu bởi lẽ cỡ mẫu theo lý thuyết

không phụ thuộc vào quy mô của tổng thể (N) mà chỉ phụ thuộc vào mức

độ biến động của chỉ tiêu cần đƣợc điều tra. Cách quy định nhƣ vậy đồng

nghĩa với việc coi cỡ mẫu phụ thuộc vào quy mô của tổng thể: quy mô của

tổng thể lớn số lƣợng đơn vị đƣợc chọn vào mẫu lớn, ngƣợc lại quy mô của

tổng thể nhỏ số lƣợng đơn vị đƣợc chọn vào mẫu ít (vì cỡ mẫu fNn ).

Thật vậy, lý thuyết điều tra chọn mẫu cho thấy công thức xác định cỡ mẫu

nhƣ sau (đối với cách chọn mẫu có hoàn lại): 2

22

d

Stn đối với chỉ tiêu giá

trị trung bình hoặc 2

2)1(

d

PPtn

đối với chỉ tiêu tỷ lệ.

Trong công thức trên, t là mức độ tin cậy (ở đây giả thiết hiện tƣợng

có dạng phân bố chuẩn), d là mức độ sai số cho phép và s2 là phƣơng sai

của chỉ tiêu cần điều tra.

Các công thức trên cho thấy rõ ràng là cỡ mẫu chỉ phụ thuộc vào

mức độ biến động của chỉ tiêu (thể hiện thông qua phƣơng sai S2), mức độ

tin cậy (thể hiện bằng t trong công thức) và sai số cho phép (thể hiện bằng

d trong công thức) chứ hoàn toàn không phụ thuộc vào quy mô của tổng

thể vì trong các công thức trên hoàn toàn không thấy xuất hiện N (quy mô

của tổng thể). Ở xu hƣớng thứ hai việc xác định cỡ mẫu cũng dựa vào cảm

nhận và kinh nghiệm của những ngƣời thiết kế điều tra.

II. THỰC TẾ PHÂN BỔ MẪU

Page 14: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

85

Trong những năm qua nhiều vụ thống kê nghiệp vụ cũng tiến hành

điều tra chuyên đề theo phƣơng pháp điều tra chọn mẫu. Phƣơng pháp điều

tra chủ yếu là điều tra phân tổ theo đơn vị hành chính (tỉnh, huyện,…).

Nhìn một cách tổng thể, việc phân bổ mẫu không đặt ra với các cuộc điều

tra này. Điều này đƣợc thể hiện ở chỗ hầu hết các vụ đều định sẵn một tỷ lệ

chọn mẫu chung cho tất cả các tỉnh/ thành phố.

2.1. Trong điều tra của Vụ Thống kê Dân số và Lao động.

Vụ Thống kê Lao động và Dân số đã tiến hành tổ chức nhiều cuộc

điều tra chọn mẫu hộ gia đình. Đối với cuộc điều tra chọn mẫu lồng trong

tổng điều tra dân số 1989, 1999 cỡ mẫu đƣợc ấn định tƣơng ứng là 5% và

3% số dân số của toàn quốc. Phƣơng pháp phân bổ mẫu là phƣơng pháp

phân bổ mẫu Maitra. Đối với các cuộc điều tra biến động dân số đƣợc tiến

hành trƣớc năm 1989 việc phân bổ cỡ mẫu hoàn toàn dựa vào ý muốn chủ

quan của ngƣời thiết kế.

2.2. Trong điều tra của Vụ Thống kê Xã hội và Môi trƣờng

Vụ Thống kê Xã hội và Môi trƣờng từ lâu đã tiến hành điều tra về

hộ gia đình. Bắt đầu từ năm 1994 cuộc điều tra này đƣợc tiến hành thƣờng

xuyên hơn. Phƣơng pháp điều tra là phƣơng pháp chọn mẫu. Trƣớc năm

2001, các cuộc điều tra chọn mẫu hộ gia đình do vụ chỉ đạo việc phân bổ

mẫu đƣợc tiến hành theo phƣơng pháp "phân bổ mẫu tỷ lệ với quy mô dân

số của các tỉnh/ thành phố". Tuy nhiên, trong những trƣờng hợp nhất định

có sử dụng đến ý kiến chuyên gia để hiệu chỉnh cỡ mẫu cho một số tỉnh/

thành phố cho thích hợp. Năm 2001-2002 vụ tiến hành điều tra mức sống

hộ gia đình. Phƣơng pháp phân bổ mẫu đƣợc áp dụng là "phân bổ mẫu tỷ lệ

với tỷ trọng của căn bậc hai của dân số":

M

i

i

i

i

N

Nnn

1

, với i=1,…,M; M là số tổ; N quy mô dân số; n quy mô mẫu

Phƣơng pháp phân bổ mẫu này có ƣu điểm là vừa tận dụng đƣợc ƣu

thế của phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô vừa làm cho cỡ

mẫu của các tổ không bị chênh nhau nhiều quá. Tức là khắc phục đƣợc

Page 15: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

86

nhƣợc điểm của phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô trong

điều kiện quy mô của các tổ quá chênh lệch nhau.

2.3. Trong điều tra của Vụ Thống kê Nông, Lâm nghiệp và Thủy sản

Vụ Thống kê Nông, Lâm nghiệp và Thủy sản điều tra thu thập thông

tin về năng suất, sản lƣợng cây trồng, số lƣợng đầu gia súc và năng suất,

sản lƣợng thủy hải sản. Phƣơng pháp điều tra không toàn bộ cũng đƣợc áp

dụng trong lĩnh vực này. Trong cuộc điều tra thực thu của các hộ gia đình,

số các đơn vị điều tra ở các tổ đƣợc ấn định là mỗi huyện chọn khoảng 1/3

số xã; mỗi xã đƣợc chọn chọn lấy 3 thôn để điều tra và mỗi thôn đƣợc chọn

lại chọn lấy một số hộ. Tổng số hộ đƣợc chọn để điều tra cho một huyện

dao động từ 100-300 hộ. Nhƣ vậy, việc phân bổ các đơn vị mẫu hoàn toàn

dựa vào kinh nghiệm hoặc thói quen của vụ đã tiến hành từ trƣớc đến nay,

còn tỷ lệ phân bổ là bao nhiêu thì không có nguyên tắc để đƣa ra.

2.4. Trong điều tra của Vụ Thống kê Thƣơng mại, Dịch vụ và Giá cả

Mẫu của vụ lấy xã phƣờng làm đơn vị chọn mẫu cấp I. Số lƣợng

mẫu đƣợc ấn định và phân bổ theo mức độ nhiều hay ít xã phƣờng của tỉnh.

Các tỉnh có từ 100-200 xã phƣờng cỡ mẫu sẽ đƣợc phân bổ là 25 đơn vị

cấp I. Các tỉnh/ thành phố có số xã phƣờng trên 200 thì đƣợc phân bổ 30

đơn vị cấp I. Việc phân bổ mẫu cấp II đƣợc tiến hành bằng cách chia các

tỉnh ra thành các loại: I, II và III. Ở nhóm tỉnh loại I chọn điều tra 30 ngành

hàng và mỗi ngành chọn 30 hộ để điều tra. Ở nhóm tỉnh loại II chọn điều

tra 20 ngành hàng và mỗi ngành chọn 25 hộ để điều tra. ở nhóm tỉnh loại

III chọn điều tra 14 ngành hàng và mỗi ngành chọn 20 hộ để điều tra.

Trong thực tế điều tra chi phí SXKD ngành công nghiệp (phiếu

02/ĐT-CP) tháng 10 năm 2003, việc phân bổ mẫu cho các ngành (26

ngành) đƣợc thực hiện theo phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy

mô sản xuất (giá trị sản xuất) và tính đồng đều của các cơ sở sản xuất trong

từng ngành kinh tế. Việc phân bổ mẫu nhƣ vậy không phù hợp với thực tế

vì quy mô giữa các ngành rất khác nhau (có ngành có trên 179 nghìn đơn

vị, có ngành chỉ có dƣới 10 đơn vị). Cách phân bổ này đã dẫn đến tình

trạng có ngành quá thừa mức độ đại diện và có ngành lại không đủ mức độ

đại diện.

Page 16: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

87

2.5. Trong điều tra của Vụ Thống kê Công nghiệp và Xây dựng

Việc phân bổ mẫu của Vụ Thống kê Công nghiệp và Xây dựng đƣợc

thực hiện theo ba bƣớc. Bƣớc thứ nhất, dựa vào tỷ lệ chọn mẫu của từng

tỉnh tính cỡ mẫu cho từng tỉnh. Bƣớc thứ hai, trên cơ sở cỡ mẫu tính đƣợc

của các tỉnh phân bổ mẫu về cho các quận, huyện theo tỷ trọng giá trị sản

xuất của mỗi quận huyện ở năm trƣớc. Bƣớc thứ ba, trên cơ sở cỡ mẫu tính

đƣợc của các quận, huyện phân bổ mẫu về cho các ngành công nghiệp cấp

II theo tỷ trọng giá trị sản xuất của từng ngành trong quận, huyện ở năm

trƣớc.

2.6. Nhận xét về cách phân bổ mẫu ở các vụ thống kê nghiệp vụ

Từ xem xét các cuộc điều tra chọn mẫu do các vụ thống kê nghiệp

vụ tiến hành thấy có một số cuộc điều tra việc phân bổ mẫu do các cán bộ

của các vụ tự tiến hành. Một số khác do các chuyên gia nƣớc ngoài đề xuất

phƣơng pháp phân bổ mẫu.

Các cán bộ thuộc các vụ thống kê nghiệp vụ thƣờng phân bổ mẫu

theo phƣơng pháp phân bổ mẫu tỷ lệ thuận với quy mô hoặc dựa vào kinh

nghiệm mà chƣa dựa vào mức độ biến động của chỉ tiêu cần thu thập thông

tin ở các tổ. Mặt khác cũng không xem xét đến sự khác biệt quá lớn về quy

mô của các tổ để lựa chọn phƣơng pháp phân bổ mẫu cho thích hợp. Tuy

nhiên, Vụ Thống kê công nghiệp và Xây dựng khi tiến hành phân bổ mẫu

đã chú ý tới tầm quan trọng của các cá thể. Các chuyên gia nƣớc ngoài khi

tiến hành phân bổ mẫu cho các tổ đã vận dụng tƣơng đối tốt các nguyên tắc

phân bổ mẫu khác nhau, nên kết quả điều tra thu đƣợc có hiệu quả thiết kế

mẫu cao và sai số chọn mẫu tƣơng đối thấp.

PHẦN BA

NHỮNG NGUYÊN TẮC XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU

RÚT RA ĐƢỢC TỪ KẾT QUẢ NGHIÊN CỨU ĐỀ TÀI

Trong thực tế điều tra chọn mẫu thƣờng chỉ có ba phƣơng pháp chọn

mẫu đƣợc ứng dụng. Đó là phƣơng pháp điều tra chọn mẫu phân tổ,

phƣơng pháp điều tra chọn mẫu phân tầng và phƣơng pháp điều tra chọn

mẫu chùm. Phƣơng pháp điều tra chọn mẫu ngẫu nhiên đơn giản tuy không

Page 17: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

88

hay đƣợc ứng dụng trực tiếp trong thực tế, song dƣờng nhƣ trong bất kỳ

cuộc điều tra nào nó cũng đƣợc ứng dụng. Cụ thể là nó đƣợc ứng dụng ở

từng tổ trong điều tra chọn mẫu phân tổ hoặc đƣợc ứng dụng ở cấp thấp

nhất trong điều tra chọn mẫu phân tầng.

Kết quả cần đạt đƣợc của đề tài này là phải đề ra đƣợc các nguyên

tắc xác định cỡ mẫu và phân bổ mẫu khả dĩ có thể ứng dụng đƣợc vào thực

tiễn công tác thống kê ở nƣớc ta, vì vậy thay cho phần kết luận và khuyến

nghị nhƣ ở các đề tài khác, đề tài này sẽ tổng kết các nguyên tắc và phƣơng

pháp xác định cỡ mẫu và phân bổ mẫu mà đề tài cho rằng thích hợp trong

điều kiện ở nƣớc ta.

I. CÁC NGUYÊN TẮC VÀ PHƢƠNG PHÁP XÁC ĐỊNH CỠ MẪU

1.1. Các nguyên tắc xác định cỡ mẫu

Giữa lý luận và thực tế có sự khác biệt nhất định, vì vậy không thể

dựa hoàn toàn vào lý luận để xác định cỡ mẫu cho cuộc điều tra. Nếu cứ

máy móc làm theo lý thuyết, chắc chắn nhiều khi không thể xác định đƣợc

cỡ mẫu cho cuộc điều tra. Điều đó có nghĩa là thực tiễn có tiêu chuẩn riêng

của mình. Với lý do đó, khi tiến hành xác định cỡ mẫu cho một cuộc điều

tra cần kết hợp giữa tiêu chuẩn riêng của thực tiễn và đòi hỏi của lý thuyết.

Trong thực tế, khi xác định cỡ mẫu các nhà thiết kế mẫu thƣờng dựa

vào các nguyên tắc sau đây:

a. Khả năng kinh phí của cuộc điều tra: Nếu khả năng kinh phí của

cuộc điều tra cao, có thể mở rộng cỡ mẫu theo mong muốn của ngƣời thiết

kế. Ngƣợc lại nếu khả năng kinh phí có hạn thì cỡ mẫu chỉ đƣợc xác định

phù hợp với mức kinh phí cho phép. Trong trƣờng hợp nhƣ vậy mức độ đại

diện của các kết quả thu đƣợc từ mẫu bị hạn chế.

b. Thời hạn cần có thông tin: Thời hạn cần cho ra thông tin có ảnh

hƣởng rất lớn tới cỡ mẫu cần điều tra. Thời hạn ngắn, thì cỡ mẫu không thể

lớn. Vì cỡ mẫu lớn khối lƣợng công việc sẽ nhiều, thời gian cần thiết để

thực hiện khối lƣợng công việc đó cũng phải dài, nhƣ vậy khó có thể có

thông tin nhanh đƣợc.

Page 18: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

89

c. Nhu cầu thông tin của các cấp quản lý: ở Việt nam có bốn cấp

quản lý nhà nƣớc, bao gồm cấp quốc gia, cấp tỉnh, cấp huyện và cấp xã.

Khi xác định cỡ mẫu cần phải xét xem thông tin cần cho tới cấp nào. Về

mặt nguyên tắc, cấp quản lý cần thông tin càng thấp, thì cỡ mẫu càng lớn.

Ngƣợc lại, cấp quản lý cần thông tin càng cao thì cỡ mẫu càng nhỏ. Trong

thực tế xác định cỡ mẫu, rất nhiều trƣờng hợp các chuyên gia dựa vào

nguyên tắc này để xác định cỡ mẫu cho cuộc điều tra.

d. Nhu cầu phân tích chi tiết của các chỉ tiêu thống kê cần thu

thập: Về mặt nguyên tắc, nhu cầu phân tích càng sâu, cỡ mẫu càng lớn. Ví

dụ, nếu chỉ cần nghiên cứu tỷ lệ sinh đặc trƣng theo nhóm tuổi 5 năm một

(có 7 nhóm tuổi) của dân số toàn quốc thì cỡ mẫu chỉ cần khoảng 5000 hộ.

Tuy nhiên, nếu cần nghiên cứu tỷ lệ sinh đặc trƣng theo từng độ tuổi một

(gồm có 35 độ tuổi) thì cỡ mẫu phải tăng lên tới trên 100 nghìn hộ. Nhƣ

vậy, nếu thiết kế mẫu dùng để phân tích vĩ mô, chỉ cần cỡ mẫu nhỏ, còn

nếu dùng để phân tích vi mô cỡ mẫu cần phải lớn.

e. Dựa vào mức độ biến động của chỉ tiêu và sai số cho phép

Mức độ biến động của chỉ tiêu cần thu thập thông tin đƣợc thể hiện

thông qua phƣơng sai. Chỉ tiêu có mức độ biến động lớn, cỡ mẫu cần thiết

phải lớn. Ngƣợc lại mức độ biến động của chỉ tiêu nhỏ không cần thiết phải

điều tra một số lƣợng mẫu lớn.

f. Dựa vào số lượng các chỉ tiêu thống kê cần thu thập

Trong một cuộc điều tra, tiến hành thu thập thông tin về nhiều chỉ

tiêu thống kê khác nhau cũng đồng nghĩa với việc phải tiến hành thu thập

thông tin của nhiều tiêu thức điều tra khác nhau (thông thƣờng để thu đƣợc

thông tin của một chỉ tiêu thống kê cần thu thập thông tin của vài ba tiêu

thức thống kê khác nhau). Điều này đòi hỏi phải mất nhiều thời gian. Vì

vậy để đảm bảo về mặt thời gian, nếu số lƣợng tiêu thức điều tra nhiều, cỡ

mẫu cần phải nhỏ. Trong trƣờng hợp số lƣợng các tiêu thức điều tra ít, có

thể tăng cỡ mẫu lên một mức thích hợp. Khi xác định cỡ mẫu không lƣu ý

tới nguyên tắc này có thể sẽ làm ảnh hƣởng tới thời gian cho ra thông tin

(thời hạn của một cuộc điều tra thƣờng không dài) cũng nhƣ chất lƣợng của

chúng.

Page 19: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

90

g. Dựa vào khả năng tổ chức thực hiện cuộc điều tra

Trình độ tổ chức cũng là một yếu tố cần phải đƣợc cân nhắc khi xác

định cỡ mẫu cho một cuộc điều tra. Nếu trình độ tổ chức và thực hiện điều

tra thấp thì không đƣợc phép lấy cỡ mẫu lớn. Bởi làm nhƣ vậy sẽ dễ dẫn

đến thất bại.

h. Dựa vào việc cân đối giữa sai số phi chọn mẫu và sai số mẫu

Trong điều kiện hiện nay của các nƣớc đang phát triển, sai số phi

chọn mẫu thƣờng tỷ lệ thuận với quy mô mẫu. Cỡ mẫu càng lớn khả năng

mắc sai số phi chọn mẫu càng lớn. Với lý do này khi xác định cỡ mẫu

ngƣời ta thƣờng cân nhắc sao cho hài hoà giữa sai số mẫu và sai số phi

chọn mẫu.

i. Xác định cỡ mẫu dựa vào kinh nghiệm

Trong thực tế công tác điều tra ngƣời ta thƣờng dựa vào kinh

nghiệm để xác định sẵn cỡ mẫu cần thiết. Thực chất đây là dựa vào kinh

nghiệm đúc rút ra từ nhiều lần điều tra để quyết định cỡ mẫu chuẩn dùng

cho các lần điều tra tiếp theo.

1.2. Các phƣơng pháp xác định cỡ mẫu

Qua nghiên cứu lý luận và thực tiễn rút ra đƣợc các phƣơng pháp cơ

bản để xác định cỡ mẫu nhƣ sau:

a. Dựa vào các công thức xác định cỡ mẫu đã được trình bày ở

chương II phần một. Để xác định cỡ mẫu bằng các công thức đã đƣợc

trình bày cần có thông tin về phƣơng sai, quy mô của tổng thể và mức độ

sai số cho phép.

b. Dựa vào khả năng kinh phí của cuộc điều tra. Có mức kinh phí

và các định mức về chi phí cho một đơn vị điều tra, mức chi phí cố định

(chi phí dành để chuẩn bị cho cuộc điều tra, tổng hợp số liệu, quản lý

phí,…), mức chi phí đi lại giữa các địa bàn điều tra,… ta có thể tính đƣợc

số lƣợng đơn vị mẫu.

c. Dựa vào kinh nghiệm của các cuộc điều tra cùng loại đã được

tiến hành. Nếu trong nƣớc hoặc trên thế giới đã có các cuộc điều tra cùng

Page 20: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

91

loại đƣợc tiến hành thì ta có thể mƣợn cỡ mẫu của các cuộc điều tra này

làm cỡ mẫu cho cuộc điều tra của ta.

II. CÁC NGUYÊN TẮC VÀ PHƢƠNG PHÁP PHÂN BỔ MẪU

2.1. Các nguyên tắc phân bổ mẫu

Qua nghiên cứu thấy việc phân bổ mẫu cho các tổ phụ thuộc vào

mức độ biến động của chỉ tiêu cần nghiên cứu ở từng tổ. Mặt khác nó cũng

phụ thuộc vào dung lƣợng thông tin từng tổ hoặc từng đơn vị điều tra. Khái

quát lại các nguyên tắc cơ bản sau đây thƣờng đƣợc sử dụng khi phân bổ số

lƣợng đơn vị mẫu cho các tổ.

a. Dựa vào mức độ biến động của chỉ tiêu cần thu thập trong từng

tổ. Với nguyên tắc này, tổ nào có sự biến động lớn, tổ đó cần đƣợc phân bổ

số lƣợng đơn vị mẫu nhiều hơn.

b. Dựa vào tầm quan trọng của từng cá thể, từng nhóm cá thể đối

với thông tin cần cho ra để phân bổ mẫu.

Trong điều kiện các đơn vị điều tra có dung lƣợng thông tin khác

nhau, việc phân bổ cỡ mẫu cho các tổ tuân theo nguyên tắc các tổ có dung

lƣợng thông tin phong phú tỷ lệ chọn mẫu phải cao, thậm chí có khi phải

chọn hết.

c. Dựa vào nhu cầu thông tin của các cấp lãnh đạo.

d. Dựa vào số lượng các đơn vị cá thể và tính đồng đều của các

đơn vị cá thể trong mỗi tổ: Số lƣợng càng lớn thì số đơn vị mẫu có thể

giảm tƣơng đối; Tính đồng đều của các đơn vị cá thể càng cao thì phân bổ

cỡ mẫu có thể giảm đi.

e. Dựa vào mật độ của đối tượng điều tra trong đơn vị mẫu cấp

trên. Mật độ của đối tƣợng điều tra ở mẫu cấp trên thấp, số lƣợng đơn vị

mẫu của nó phải nhiều và số lƣợng đơn vị mẫu cấp dƣới sẽ giảm đi (vì cỡ

mẫu chung n không đổi).

2.2. Các phƣơng pháp phân bổ mẫu

Khi áp dụng phƣơng pháp điều tra chọn mẫu phân tổ thì ta cần tiến

hành phân bổ mẫu cho các tổ. Trong thực tế, việc phân bổ số lƣợng các đơn

Page 21: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

92

vị mẫu cho các tổ của tổng thể cần đƣợc tiến hành dựa vào tình hình thực tế

đang diễn ra. Các nguyên tắc cơ bản có thể sử dụng để phân bổ mẫu trong

thực tế nhƣ sau:

a. Phân bổ mẫu tỷ lệ thuận với quy mô: Phƣơng pháp phân bổ

mẫu này thƣờng đƣợc áp dụng khi quy mô hoặc phƣơng sai của các tổ

tƣơng đối đồng đều. Trong trƣờng hợp này công thức (10) đƣợc áp dụng.

b. Phân bổ mẫu Maitra: Phƣơng pháp phân bổ mẫu này thƣờng

đƣợc áp dụng khi quy mô hoặc phƣơng sai của các tổ tƣơng đối khác biệt,

mặt khác ngƣời dùng tin muốn so sánh kết quả ƣớc lƣợng của các tổ với

nhau. Trong trƣờng hợp này công thức (11) và (12) đƣợc áp dụng.

c. Phân bổ mẫu đều: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc

áp dụng khi quy mô hoặc phƣơng sai của các tổ tƣơng đối đồng đều và khả

năng kinh phí và tổ chức thực hiện dành cho các tổ tƣơng tự nhƣ nhau.

Trong trƣờng hợp này công thức (14) đƣợc áp dụng.

d. Phân bổ mẫu Neyman: Phƣơng pháp phân bổ mẫu này thƣờng

đƣợc áp dụng khi quy mô và phƣơng sai của các tổ tƣơng đối khác nhau.

Trong trƣờng hợp này công thức (15) đƣợc áp dụng.

e. Phân bổ mẫu tối ưu: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc

áp dụng khi quy mô, phƣơng sai và khả năng kinh phí của các tổ tƣơng đối

khác nhau. Trong trƣờng hợp này công thức (16) đƣợc áp dụng.

f. Phân bổ mẫu có sự ưu tiên cho các tổ được đánh giá là quan

trọng: Phƣơng pháp phân bổ mẫu này thƣờng đƣợc áp dụng khi có sự khác

nhau đáng kể giữa các tổ về hàm lƣợng thông tin mà chung có. Theo

nguyên tắc này, các tổ chứa hàm lƣợng thông tin cao sẽ đƣợc phân bổ cỡ

mẫu lớn, còn các tổ chứa hàm lƣợng thông tin thấp đƣợc phân bổ cỡ mẫu

nhỏ.

KHUYẾN NGHỊ

Để xác định cỡ mẫu phù hợp với thực tế và có cơ sở khoa học cần:

+ Lƣu trữ thông tin của tất cả các cuộc điều tra. Đây là cơ sở giúp

các nhà thiết kế mẫu có đƣợc dàn chọn mẫu và tính toán sai số mẫu của các

cuộc điều tra đó rồi xác định cỡ mẫu cần thiết cho các cuộc điều tra sau;

Page 22: ĐỀ TÀI KHOA HỌC SỐ: 03-2004 - vienthongke.vnvienthongke.vn/attachments/article/2925/03.2004.pdf72 ĐỀ tÀi khoa hỌc sỐ: 03-2004 nghiÊn cỨu cÁc nguyÊn tẮc xÁc

93

+ Việc xác định cỡ mẫu và phân bổ mẫu là vấn đề phức tạp. Trong

điều kiện hiện nay công việc này nên đƣợc tiến hành tại cơ quan Tổng cục.

Các cục thống kê có đủ khả năng tiến hành công việc này cũng nên lấy ý

kiến của các đơn vị chức năng của Tổng cục;

+ Việc xác định cỡ mẫu và phân bổ mẫu cần có sự phối hợp giữa các

đơn vị nghiệp vụ và Viện Khoa học Thống kê. Sự phối hợp này vừa đảm

bảo cơ sở khoa học lẫn cơ sở thực tiễn của một thiết kế mẫu;

+ Trong bối cảnh hiện thời, các thông tin thu thập chỉ dừng lại ở mức

đại diện cho cấp tỉnh và toàn quốc;

+ Việc phân bổ mẫu không nên tiến hành một cách máy móc mà cần

có sự xem xét cụ thể đặc điểm của từng tổ để có sự điều chỉnh hợp lý;

+ Các phƣơng án phân bổ mẫu nên có sự đóng góp ý kiến của các

cục thống kê địa phƣơng.

TÀI LIỆU THAM KHẢO

1. Sharon I. Lohr: Sampling Desgin and analysis, NXB Duxbury

Press;

2. Paul S. Levy: Sampling of population, NXB John Wiley & Son

3. M. Mosleh Uddin: Sampling theory and application

4. IRD: Sampling manual

5. I.M. Chakravarti; R.G. Kaha; J. Roy: Hand book of method of

applied statistics

6. Tổng cục Thống kê, Hà nội 1977: Từ điển thống kê

7. Maurice G.Kendall and other, London 1957: A dictionary of

statistical terms

8. Trung tâm nghiên cứu thông tin và tƣ liệu dân số (Lê Văn Dụy

Chủ biên): Điều tra chọn mẫu - lý luận và ứng dụng trọng công tác dân số

và kế hoạch hóa gia đình, NXB Thống kê 1998.

9. Trƣờng đại học kinh tế quốc dân, bộ môn điều khiển học kinh tế:

Lý thuyết xác suất và thống kê toán; NXB Khoa học kỹ thuật, 1996