nguyen ly thong ke

218
Bài 1: Gii thiu vthng kê hc v1.0 1 Ni dung Mc tiêu Thng kê hc là gì và đối tượng nghiên cu ca thng kê hc. Mt skhái nim thường dùng trong thng kê. Các loi thang đo thng kê. Giúp hc viên hiu được thng kê hc là gì và vai trò ca thng kê trong đời sng xã hi. Làm rõ đối t ượng nghiên cu ca thng kê hc. Hiu mt skhái nim và các loi thang đo được dùng nhiu trong thng kê. Thi lượng hc Hướng dn hc 4 tiết Đọc tài liu và tho lun vi ging viên và các hc viên khác vcác vn đề chưa nm rõ. Ly ví dnhm làm rõ các khái nim. Trli các câu hi ôn tp cui bài. BÀI 1: GII THIU VTHNG KÊ HC

Upload: sunhuynh

Post on 08-Jun-2015

4.142 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 1

0

Nội dung Mục tiêu

Thống kê học là gì và đối tượng nghiên cứu của thống kê học.

Một số khái niệm thường dùng trong thống kê.

Các loại thang đo thống kê.

Giúp học viên hiểu được thống kê học là gì và vai trò của thống kê trong đời sống xã hội.

Làm rõ đối tượng nghiên cứu của thống kê học.

Hiểu một số khái niệm và các loại thang đo được dùng nhiều trong thống kê.

Thời lượng học Hướng dẫn học

4 tiết Đọc tài liệu và thảo luận với giảng viên và các học viên khác về các vấn đề chưa nắm rõ.

Lấy ví dụ nhằm làm rõ các khái niệm.

Trả lời các câu hỏi ôn tập ở cuối bài.

BÀI 1: GIỚI THIỆU VỀ THỐNG KÊ HỌC

Page 2: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

2 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Sử dụng thông tin thu thập để ra quyết định đầu tư

Bạn được thừa hưởng một khoản thừa kế là 500 triệu đồng. Bạn quyết định sẽ làm cho khoản tiền đó sinh lời bằng cách đầu tư vào thị trường chứng khoán. Nhưng đầu tư vào cổ phiếu nào đây? Để đảm bảo cho việc đầu tư của mình là đúng đắn và mang lại thành công, bạn sẽ làm gì?

Phải chăng đó là việc thu thập và phân tích các thông tin liên quan đến cổ phiếu đó. Giá cả của nó là bao nhiêu, nó đã tăng bao nhiêu lần so với mệnh giá. Quan trọng hơn, tình hình tài chính của công ty niêm yết hiện nay ra sao?

Câu hỏi

Để đi đến quyết định của mình, bạn đã tìm kiếm các báo cáo tài chính, bản cáo bạch, báo cáo phân tích của công ty,... để nghiên cứu. Bao nhiêu phần trăm trong số thông tin mà bạn thu

thập được thể hiện dưới dạng các con số thống kê và các con số đó phản ánh điều gì?

Bài học này sẽ giúp bạn hiểu các con số thống kê thường phản ánh điều gì và vai trò của thông

tin thống kê trong xã hội hiện nay.

Page 3: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 3

1.1. Một số vấn đề chung về thống kê học

1.1.1. Thống kê học và vai trò của thông tin thống kê trong đời sống xã hội

Thống kê đã ra đời từ rất lâu và phát triển theo yêu cầu của xã hội.

Ngày nay, thống kê len lỏi trong mọi hoạt động, mọi lĩnh vực của đời sống và thông tin thống kê trở thành một trong những nguồn lực vô giá để đánh giá bản chất và xu hướng phát triển của hiện tượng.

Thông tin thống kê cũng gợi mở cho người sử dụng các biện pháp nhằm thúc đẩy quá trình sản xuất tốt hơn hay dự kiến khả năng đạt được trong thời gian tới. Chính vì vậy, Lê-nin đã cho rằng: Thống kê là một công cụ mạnh mẽ nhất để nhận thức xã hội.

Tuỳ theo mục đích khác nhau mà thống kê học phục vụ theo những khía cạnh khác nhau.

Các con số thống kê có thể được sử dụng nhiều lần với nhiều mục tiêu khác nhau. Chính vì tính chất khách quan, dễ gây ảnh hưởng và lan rộng của nó mà thống kê là một trong những công cụ quan trọng, có vai trò cung cấp các thông tin phục vụ quản lý ở cả tầm vi mô và vĩ mô.

Ngày nay, cùng với sự phát triển của xã hội loài người, sự tiến bộ của khoa học – kỹ thuật, khoa học thống kê càng hoàn thiện hơn về lý luận và phương pháp, thông tin. Thống kê đa dạng, phong phú được sử dụng rộng rãi và ngày càng đáp ứng được yêu cầu của người sử dụng.

“Thống kê kinh tế – xã hội là một trong những công cụ mạnh mẽ nhất để nhận thức xã hội” – V.I. Lê-nin, toàn tập, tập 19, trang 432, bản tiếng Việt, NXB Tiến bộ, Motskva, 1980.

1.1.1.1. Định nghĩa thống kê học

Không thể phủ nhận được vai trò quan trọng của thông tin thống kê, vậy thống kê học là gì? Các nhà thống kê học nổi tiếng trên thế giới đều thống nhất đưa ra định nghĩa sau về thống kê học:

Thống kê học là môn khoa học xã hội nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong những điều kiện địa điểm và thời gian cụ thể.

Trước hết, ta phải khẳng định: Thống kê học là một môn khoa học xã hội: Thực tế, thống kê học là sự giao thoa giữa khoa học tự nhiên và khoa học xã hội vì nó vận dụng phương pháp toán và sử dụng phương pháp lý luận xã hội để phân tích các hiện tượng hay các quá trình kinh tế – xã hội. Nhưng vì không chỉ dừng lại ở các con số mà ta phải đọc được ý nghĩa của nó và đưa ra kết luận về các hiện tượng nên người ta xếp thống kê học vào khoa học xã hội.

Thống kê học là một môn khoa học xã hội nghiên cứu không chỉ một phương pháp mà là một hệ thống các phương pháp: thu thập – xử lý – phân tích, trong phân tích thì có phân tích và dự đoán. Trên cơ sở phân tích con số thống kê, người ta rút ra được bản chất và tính quy luật của hiện tượng. Chính vì vậy, thống kê còn là một môn khoa học định lượng.

Page 4: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

4 v1.0

Ví dụ: Chúng ta đều biết đến mối liên hệ giữa doanh thu (DT) với giá bán (p) và lượng hàng hoá tiêu thụ (q): DT = p q

Thống kê học nghiên cứu mức độ ảnh hưởng của p và q tới DT.

Chẳng hạn 09

08

DT120%

DT , tức là năm 2009, doanh thu đã tăng 20% so với năm 2008.

Trong 20% tăng doanh thu này, người ta muốn biết phần biến động của giá làm doanh thu tăng bao nhiêu và phần biến động của lượng làm doanh thu tăng bao nhiêu? Mặt khác, việc tăng doanh thu này có thực sự là tốt hay không? Thống kê sẽ trả lời được những câu hỏi đó trên cơ sở phân tích số liệu thực tế.

1.1.1.2. Phạm vi nghiên cứu của thống kê học

Các hiện tượng và quá trình kinh tế – xã hội mà thống kê thường nghiên cứu, đó là:

Các hiện tượng về quá trình tái sản xuất mở rộng như: cung cấp nguyên liệu, quy trình công nghệ, chế biến sản phẩm...

Các hiện tượng về phân phối, trao đổi, tiêu dùng sản phẩm như: giá cả, lượng hàng tiêu thụ, xuất nhập khẩu hàng hoá, nguyên liệu...

Các hiện tượng về dân số, lao động như: tỷ lệ sinh, tỷ lệ tử, sự phân bố dân cư, lao động...

Các hiện tượng về văn hoá, y tế, giáo dục như số trường lớp, số bệnh viện, giường bệnh, số người mắc bệnh, số thư viện...

Các hiện tượng về đời sống chính trị, xã hội, bầu cử, luật pháp...

Ngoài ra, thống kê còn nghiên cứu ảnh hưởng của các hiện tượng tự nhiên đến sự phát triển của các hiện tượng kinh tế xã hội, như ảnh hưởng của khí hậu, thời tiết, ảnh hưởng của các biện pháp khoa học kỹ thuật tới quá trình sản xuất, kết quả sản xuất và đời sống nhân dân...

1.1.2. Đối tượng nghiên cứu của thống kê học

Đối tượng nghiên cứu của thống kê học là mặt lượng trong mối liên hệ mật thiết với mặt chất của các hiện tượng số lớn trong điều kiện thời gian và địa điểm cụ thể.

Từ khái niệm trên, có một số vấn đề cần làm rõ như sau:

Thứ nhất, thế nào là mặt lượng trong mối liên hệ với mặt chất?

Trước hết, ta phải hiểu mặt lượng là gì, mặt chất là gì? Xuất phát từ lý luận cơ bản của chủ nghĩa duy vật biện chứng, bất kỳ sự vật, hiện tượng nào cũng đều có hai mặt chất và lượng. Theo đó, mặt chất của hiện tượng là bản chất trừu tượng giúp ta phân biệt hiện tượng, sự vật đó với những hiện tượng, sự vật khác.

Ví dụ: Sau khi phân tích các thông tin về công ty A, bạn đánh giá là công ty A có tình hình tài chính tốt.

Ở đây, tốt là một biểu hiện về mặt chất, nó rất trừu tượng và chỉ được biểu hiện cụ thể qua các thông số như: doanh số, lợi nhuận, năng suất lao động, hiệu quả sử dụng vốn... chính là mặt lượng. Như vậy, mặt lượng là những biểu hiện bằng con số, nó cho biết bản chất cụ thể của sự vật, hiện tượng thông qua quy mô, khối lượng, trình độ phát triển và mối liên hệ giữa các bộ phận.

Giữa hai mặt của hiện tượng bao giờ cũng tồn tại mối liên hệ mật thiết với nhau. Bất kỳ chất nào cũng được biểu hiện bằng một lượng cụ thể, lượng nào cũng là lượng của một chất xác định. Chất của hiện tượng có tính ổn định tương đối còn

Page 5: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 5

lượng lại thường xuyên biến động. Khi lượng thay đổi đến một mức nào đó thì chất sẽ thay đổi. Chính vì vậy, thống kê chúng ta nghiên cứu mặt lượng nhưng không tách rời mặt chất mà trong mối liên hệ mật thiết với mặt chất.

Mặt lượng, mặt chất ở đây không phải của một vài hiện tượng đơn lẻ mà phải là của hiện tượng số lớn.

Thứ hai, thế nào là các hiện tượng số lớn?

Theo quy luật số lớn, khi nghiên cứu một số đủ lớn các hiện tượng cá biệt thì các nhân tố ngẫu nhiên sẽ bị triệt tiêu làm bộc lộ nhân tố cơ bản, bản chất của hiện tượng.

Đối tượng nghiên cứu chủ yếu của thống kê học là các hiện tượng kinh tế – xã hội số lớn, trong đó bao gồm nhiều đơn vị hoặc hiện tượng cá biệt tạo thành. Thông qua nghiên cứu một số đủ lớn các đơn vị cá biệt này, chúng ta sẽ rút ra được kết luận về bản chất, tính quy luật của sự vật, hiện tượng. Kết luận này có thể sẽ không đúng với từng hiện tượng cá biệt, nhưng nó phản ánh đúng với hiện tượng số lớn.

Ví dụ: Theo kết quả của Tổng điều tra dân số và nhà ở lúc 0 giờ ngày 1/4/2009, trong tổng thể dân số nước ta hiện nay, tỷ lệ nam/nữ là 98,1/100. Tỷ lệ này có thể không đúng đối với từng gia đình nhưng đúng với số đông các gia đình ở Việt Nam hiện nay.

Nhưng con số nào là đủ lớn thì còn tuỳ vào đặc điểm của hiện tượng.

Ví dụ: Tập hợp 100 trên 120 nhân viên của công ty X có tham gia mua bán trên thị trường chứng khoán là một số đủ lớn, nhưng tập hợp 100 người trong tổng dân số Việt Nam thì không được coi là đủ lớn.

Thống kê chỉ nghiên cứu các hiện tượng số lớn? Câu trả lời là không. Thống kê chủ yếu nghiên cứu hiện tượng số lớn và có kết hợp nghiên cứu cả đơn vị, hiện tượng cá biệt, thường là những hiện tượng có tính chất điển hình tiên tiến hoặc điển hình lạc hậu.

Ví dụ: Trong một nhà máy A, tổ sản xuất B liên tục có năng suất lao động cao nhất nhà máy trong nhiều năm liền; khi đó, nghiên cứu riêng tổ sản xuất B để rút ra kết luận, tại sao tổ này có năng suất lao động cao, do tuổi nghề, do bậc thợ, do trình độ khéo léo, tăng ca... từ đó rút ra bài học kinh nghiệm trong quản lý nhằm nâng cao NSLĐ toàn nhà máy.

Thứ ba, tại sao phải nghiên cứu trong điều kiện thời gian và địa điểm cụ thể?

Chúng ta đều biết, mặt lượng của các hiện tượng kinh tế – xã hội thường xuyên biến động qua thời gian và qua không gian. Khi điều kiện thời gian và không gian thay đổi, bản chất của sự vật, hiện tượng có thể cũng thay đổi theo. Vì vậy, khi nghiên cứu phải xác định rõ hiện tượng đó xảy ra tại thời điểm nào và ở đâu.

Ví dụ: Giá vàng tại các thời gian, không gian khác nhau là khác nhau. Thậm chí tại cùng thời gian nhưng ở các địa phương khác nhau, các cửa hàng khác nhau, giá vàng cũng khác nhau.

Mục đích của việc nghiên cứu thống kê là nhằm tìm ra bản chất, tính quy luật của hiện tượng. Từ đó, chúng ta có nhận thức đúng đắn về hiện tượng được nghiên cứu để làm căn cứ cho các quyết định trong quản lý, đồng thời đề xuất được những giải pháp phù hợp nhằm thúc đẩy hiện tượng phát triển theo đúng quy luật.

Page 6: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

6 v1.0

Ví dụ: Với khoản tiền thừa kế 500 triệu đồng, sau khi nghiên cứu thông tin về các loại cổ phiếu và tình hình tài chính của các công ty niêm yết, bạn đã xác định được có một số loại cổ phiếu tốt và quyết định đầu tư vào đó nhằm mục đích thu được lợi nhuận cao và bền vững.

Sau khi đã làm rõ đối tượng nghiên cứu của thống kê học, chúng ta sẽ tìm hiểu một số thuật ngữ riêng thường dùng trong thống kê trước khi đi vào chi tiết các quá trình nghiên cứu thống kê.

1.2. Các khái niệm thường dùng trong thống kê

1.2.1. Tổng thể thống kê và đơn vị tổng thể

1.2.1.1. Khái niệm

Tổng thể thống kê là hiện tượng kinh tế – xã hội số lớn mà trong đó bao gồm nhiều đơn vị hoặc hiện tượng cá biệt cần được quan sát, phân tích mặt lượng của chúng.

Từng đơn vị, hiện tượng cá biệt như vậy được gọi là đơn vị tổng thể.

Ví dụ 1: Tổng thể các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. Hồ Chí Minh.

Đơn vị tổng thể: từng công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. Hồ Chí Minh.

Ví dụ 2: Tổng thể các cổ đông của công ty A.

Đơn vị tổng thể: Mỗi cổ đông của công ty A.

Ví dụ 3: Tổng thể những doanh nghiệp có hoạt động làm ăn phi pháp.

Đơn vị tổng thể: Từng doanh nghiệp có hoạt động làm ăn phi pháp.

Ví dụ 4: Tổng thể những người thích xem phim truyền hình.

Đơn vị tổng thể: mỗi người thích xem phim truyền hình.

1.2.1.2. Phân loại tổng thể thống kê

Có nhiều cách để phân loại tổng thể thống kê, cụ thể:

Căn cứ vào sự nhận biết các đơn vị trong tổng thể

o Tổng thể bộc lộ: Tổng thể có ranh giới rõ ràng, có thể nhận biết được tất cả các đơn vị bằng trực quan.

Ví dụ 1, ví dụ 2 ở trên là những tổng thể bộc lộ.

o Tổng thể tiềm ẩn: Tổng thể có ranh giới không rõ ràng, không nhận biết hết được tất cả các đơn vị trong tổng thể.

Ví dụ 3, ví dụ 4 ở trên là những tổng thể tiềm ẩn.

Trong thực tế, tổng thể tiềm ẩn rất đa dạng, vì vậy cần xác định tổng thể nghiên cứu là tổng thể bộc lộ hay tiềm ẩn để tìm cách xác định đối tượng cho phù hợp.

Căn cứ vào mục đích nghiên cứu

o Tổng thể đồng chất: Bao gồm những đơn vị giống nhau về một số đặc điểm chủ yếu có liên quan tới mục đích nghiên cứu.

o Tổng thể không đồng chất: Bao gồm những đơn vị có những đặc điểm chủ yếu khác nhau có liên quan tới mục đích nghiên cứu.

Page 7: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 7

Cách phân loại này khác với cách phân loại ở trên. Cách phân loại tổng thể căn cứ vào sự nhận biết các đơn vị trong tổng thể mang tính chất tương đối cố định. Trong khi đó, cách phân loại căn cứ vào mục đích nghiên cứu lại tuỳ thuộc vào mục đích nghiên cứu cụ thể. Mục đích nghiên cứu khác nhau thì việc xác định đặc điểm nào là chủ yếu cũng khác nhau. Khi mục đích nghiên cứu thay đổi, tổng thể đồng chất có thể trở thành tổng thể không đồng chất và ngược lại.

Ví dụ: Với mục đích nghiên cứu là hoạt động của các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. HCM, người ta đưa ra một số tổng thể sau:

Tổng thể các công ty có phát hành cổ phiếu trên địa bàn cả nước (1).

Tổng thể các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán đóng trên địa bàn TP. HCM (2).

Tổng thể các công ty có cổ phiếu niêm yết trên các sàn giao dịch chứng khoán ở Việt Nam (3).

Tổng thể các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. HCM (4).

Tổng thể các công ty hoạt động trong lĩnh vực xây dựng có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. HCM (5).

Với 5 tổng thể đưa ra ở trên, nếu căn cứ vào mục đích nghiên cứu, chỉ có tổng thể (4) và (5) là tổng thể đồng chất dù tổng thể (5) có quy mô hẹp hơn so với yêu cầu. Còn tổng thể (1), (2) và (3) là những tổng thể không đồng chất.

Căn cứ vào phạm vi nghiên cứu

o Tổng thể chung: Bao gồm tất cả các đơn vị thuộc đối tượng nghiên cứu.

o Tổng thể bộ phận: Bao gồm một phần của tổng thể chung.

Ví dụ: Với mục đích nghiên cứu là hoạt động của các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán ở Việt Nam thì tổng thể (3) ở trên là tổng thể chung, còn tổng thể (2), (4) và (5) là các tổng thể bộ phận.

Trên thực tế, phải xác định được những đơn vị nào thuộc tổng thể nghiên cứu. Tuỳ thuộc vào mục đích nghiên cứu cụ thể mà đưa ra những khái niệm, định nghĩa, tiêu chuẩn, đặc điểm để xác định đơn vị đó có thuộc tổng thể của chúng ta không.

1.2.2. Tiêu thức thống kê

1.2.2.1. Khái niệm

Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau.

Như vậy, tiêu thức thống kê không phải là tất cả những đặc điểm của đơn vị tổng thể mà chỉ là những đặc điểm được chọn ra để nghiên cứu.

Ví dụ: Trong tổng thể các cổ đông của công ty A, mỗi cổ đông là một đơn vị tổng thể. Các cổ đông này, được xác định theo các đặc điểm khác nhau như: họ tên, tuổi, giới tính, nghề nghiệp, số cổ phiếu nắm giữ, tỷ lệ nắm giữ... Mỗi đặc điểm này khi được chọn ra để nghiên cứu là một tiêu thức thống kê.

Page 8: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

8 v1.0

1.2.2.2. Phân loại tiêu thức thống kê

Tiêu thức thống kê được phân làm 3 loại.

Tiêu thức thực thể: Nêu lên bản chất của đơn vị tổng thể, bao gồm: o Tiêu thức thuộc tính: Là tiêu thức không có các biểu hiện trực tiếp bằng con

số mà bằng các đặc điểm và tính chất khác nhau. Ví dụ 1: Tiêu thức giới tính, nghề nghiệp, thành phần kinh tế, loại hình sản xuất kinh doanh... là những tiêu thức có biểu hiện trực tiếp. Ví dụ 2: Tiêu thức mức sống được biểu hiện gián tiếp qua thu nhập, chi tiêu... là tiêu thức có biểu hiện gián tiếp.

Những biểu hiện gián tiếp của tiêu thức thuộc tính được gọi là các chỉ báo thống kê. o Tiêu thức số lượng: Là tiêu thức có các biểu hiện trực tiếp bằng con số và

những con số đó được gọi là lượng biến của tiêu thức. Có hai loại lượng biến: Lượng biến rời rạc là lượng biến biểu hiện bằng số nguyên.

Ví dụ: Tiêu thức tuổi, số cổ phiếu nắm giữ... Lượng biến liên tục là lượng biến có biểu hiện bằng số thập phân.

Ví dụ: Tiêu thức thu nhập, tiêu thức tỷ lệ cổ phiếu nắm giữ... o Tiêu thức thay phiên: Là tiêu thức chỉ có 2 biểu hiện không trùng nhau trên 1

đơn vị tổng thể. Ví dụ: Tiêu thức giới tính (nam – nữ), tiêu thức NSLĐ (tiên tiến/không tiên tiến), tiêu thức kết quả học tập (đạt/không đạt)…

Tiêu thức thời gian: Nêu lên hiện tượng nghiên cứu theo sự xuất hiện của nó ở thời gian nào.

Tiêu thức không gian: Nêu lên phạm vi lãnh thổ bao trùm và sự xuất hiện theo địa điểm của hiện tượng nghiên cứu.

1.2.3. Chỉ tiêu thống kê

1.2.3.1. Khái niệm

Chỉ tiêu thống kê là những con số phản ánh mặt lượng trong mối liên hệ mật thiết với mặt chất của các hiện tượng và quá trình kinh tế – xã hội số lớn trong điều kiện thời gian và địa điểm cụ thể. Ví dụ: Doanh thu của doanh nghiệp A năm 2008 đạt 500 tỷ đồng. Với định nghĩa trên ta thấy, mỗi một chỉ tiêu thống kê bao giờ cũng có tính hai mặt:

Khái niệm của chỉ tiêu: Phản ánh nội dung kinh tế xã hội của chỉ tiêu đó, gồm các định nghĩa và giới hạn về thực thể, thời gian, không gian. Khái niệm của chỉ tiêu thường mang tính chất tổng hợp.

Trị số của chỉ tiêu: Phản ánh mặt lượng của hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.

Lưu ý

Đơn vị tính, chia ra thành 3 loại: Hiện vật: Hiện vật đơn: chiếc, cái, con, mét…; hiện vật kép: m/s, kwh... Giá trị: VNĐ, USD, EUR... Thời gian: Ca, ca máy, giờ, một ngày đêm… Trong quan hệ so sánh, phải thống nhất về nội dung, phương pháp và phạm vi tính toán.

Page 9: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 9

1.2.3.2. Phân loại chỉ tiêu thống kê

Có nhiều cách thức phân loại chỉ tiêu thống kê khác nhau.

Theo hình thức biểu hiện, chỉ tiêu thống kê được chia thành:

o Chỉ tiêu hiện vật: Biểu hiện bằng đơn vị tự nhiên hoặc đơn vị đo lường quy ước.

Ví dụ: Dân số (đơn vị người), diện tích (đơn vị km2)...

o Chỉ tiêu giá trị: Biểu hiện bằng đơn vị tiền tệ.

Ví dụ: GDP (đơn vị đồng Việt Nam), kim ngạch xuất khẩu (đơn vị đô la Mỹ)...

Theo tính chất biểu hiện

o Chỉ tiêu tuyệt đối: Biểu hiện quy mô, số lượng của hiện tượng.

Ví dụ: Tổng kim ngạch xuất khẩu của Việt Nam năm 2008 là 62.685,1 triệu USD.

o Chỉ tiêu tương đối: Biểu hiện quan hệ so sánh giữa các mức độ của hiện tượng.

Ví dụ: Chỉ số giá tiêu dùng CPI của nước ta bình quân năm 2008 so với 2007 là 122,97%.

Theo đặc điểm về thời gian

o Chỉ tiêu thời kỳ: Phản ánh trạng thái của hiện tượng nghiên cứu trong một thời kỳ nhất định, phụ thuộc vào độ dài thời kỳ nghiên cứu.

Thông thường chỉ tiêu này phản ánh kết quả, hiệu quả, có thể cộng với nhau để tính chỉ tiêu trong thời kỳ dài hơn.

Ví dụ: Lợi nhuận trước thuế hợp nhất của Vietcombank trong 6 tháng đầu năm 2009 đạt 2.930 tỷ đồng.

o Chỉ tiêu thời điểm: Phản ánh trạng thái của hiện tượng nghiên cứu tại một thời điểm nhất định, không phụ thuộc vào độ dài thời kỳ nghiên cứu.

Thông thường chỉ tiêu này phản ánh nguồn lực như lao động, vốn..., không thể cộng với nhau để tính chỉ tiêu trong thời kỳ dài hơn.

Ví dụ: Tổng dân số của Việt Nam vào thời điểm 0 giờ ngày 1/4/2009 là 85.789.573 người.

Theo nội dung phản ánh

o Chỉ tiêu khối lượng: phản ánh quy mô khối lượng của hiện tượng nghiên cứu theo thời gian và địa điểm cụ thể.

Ví dụ: Tổng dân số của Việt Nam vào thời điểm 0 giờ ngày 1/4/2009 là 85.789.573 người.

o Chỉ tiêu chất lượng: biểu hiện trình độ phổ biến và mối quan hệ so sánh trong tổng thể. Chỉ tiêu này được tính từ ít nhất 2 chỉ tiêu số lượng. Chỉ tiêu chất lượng có thể là số tương đối, số bình quân chứ không biểu hiện bằng số tuyệt đối.

Ví dụ: Hiệu quả sử dụng vốn của doanh nghiệp A năm 2008 là 120%.

Ví dụ tổng kết:

Nữ

Nam Giới tính

Dân số

Tỷ lệ dân số nam ở nước ta tại thời điểm 0h ngày 1/4/2009 là:

Tỷ lệ dân số nữ ở nước ta tại thời điểm 0h ngày 1/4/2009 là:

Tổng thể Tiêu thức Biểu hiện Chỉ tiêu

Page 10: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

10 v1.0

1.2.3.3. Hệ thống chỉ tiêu thống kê

Khái niệm: Hệ thống chỉ tiêu thống kê là một tập hợp nhiều chỉ tiêu nhằm phản ánh những đặc điểm, tính chất quan trọng nhất, những mối liên hệ chủ yếu nhất của hiện tượng được nghiên cứu.

Những mối liên hệ chủ yếu ở đây gồm có mối liên hệ giữa các mặt của hiện tượng và mối liên hệ giữa hiện tượng nghiên cứu và hiện tượng có liên quan.

Hệ thống chỉ tiêu thống kê có vai trò rất quan trọng: là căn cứ, là cơ sở để tiến hành nghiên cứu thống kê.

Ý nghĩa: Hệ thống chỉ tiêu thống kê cho phép lượng hoá các mặt quan trọng nhất, lượng hoá cơ cấu và các mối liên hệ cơ bản của hiện tượng nghiên cứu để từ đó có thể nhận thức được bản chất cụ thể và tính quy luật của hiện tượng.

Nhưng để hệ thống chỉ tiêu có chất lượng, hiệu quả phản ánh được bản chất của hiện tượng và có tính khả thi thì nó phải tuân theo một số yêu cầu nhất định.

Một số yêu cầu cơ bản để xây dựng hệ thống chỉ tiêu thống kê

o Phải xuất phát từ mục đích nghiên cứu cụ thể và đặc điểm của hiện tượng nghiên cứu.

o Phải phản ánh những đặc điểm, những tính chất chủ yếu nhất, những mối liên hệ cơ bản nhất của hiện tượng nghiên cứu.

o Phải có tính khả thi, tức là có thể thu thập được tài liệu để tính toán.

Trong thống kê, mặt lượng bao giờ cũng đi liền với mặt chất của hiện tượng được nghiên cứu. Tuy nhiên, không phải sự vật, hiện tượng nào cũng có thể lượng hoá được. Do vậy, để lượng hoá, nhất là khi xử lý các tiêu thức thuộc tính, người ta phải dùng tới các thang đo. Nhưng có những thang đo nào và chúng dùng để lượng hoá như thế nào?

1.3. Thang đo thống kê

Tuỳ theo tính chất của dữ liệu thống kê mà ta có thể sử dụng các loại thang đo khác nhau. Có 4 loại thang đo chủ yếu sau:

1.3.1. Thang đo định danh

Định nghĩa: Thang đo định danh là thang đo đánh số các biểu hiện cùng loại của cùng một tiêu thức.

Ví dụ: Với tiêu thức giới tính, người ta gán cho nam giá trị bằng 1, nữ giá trị bằng 0.

Điều kiện vận dụng: Với những tiêu thức mà biểu hiện của nó có vai trò như nhau và cùng loại, thường được sử dụng cho các tiêu thức thuộc tính.

Ví dụ: Tiêu thức giới tính, nghề nghiệp, thành phần kinh tế...

Đặc điểm: Các con số trên thang đo không biểu thị quan hệ hơn kém, cao thấp nhưng khi chuyển từ số này sang số khác thì dấu hiệu đo đã có sự thay đổi về chất. Không áp dụng các phép tính khi sử dụng loại thang đo này mà chỉ đếm được tần số xuất hiện của từng biểu hiện.

Hạn chế của việc áp dụng loại thang đo này là giữa các phạm trù không thể so sánh được với nhau, do đó người ta đã sử dụng một loại thang đo khác nhằm khắc phục nhược điểm này.

Page 11: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 11

1.3.2. Thang đo thứ bậc

Định nghĩa: Thang đo thứ bậc là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém, cao thấp.

Ví dụ: Bậc thợ (7 bậc), chất lượng sản phẩm, xếp hạng huân huy chương...

Điều kiện vận dụng: Với những tiêu thức mà các biểu hiện của nó có quan hệ hơn kém, có thể sử dụng cho các tiêu thức thuộc tính và tiêu thức số lượng.

Loại thang đo này được dùng nhiều trong nghiên cứu xã hội, đo các tiêu thức mà các biểu hiện có quan hệ thứ tự như thái độ, quan điểm của con người đối với các hiện tượng xã hội.

Đặc điểm: Sự chênh lệch giữa các biểu hiện không nhất thiết phải bằng nhau. Với thang đo này, có thể tính toán đặc trưng chung cho một tổng thể một cách tương đối qua tính số bình quân, còn đối với một đơn vị tổng thể thì không thực hiện được.

Ví dụ: Để đánh giá độ tự tin của bạn khi được giao một công việc mới, người ta đưa ra một thang đo thứ bậc với 3 nấc: 1. Rất tự tin, 2. Tương đối tự tin, 3. Không tự tin. Con số 1, 2, 3 ở đây không có nghĩa là bạn tự tin gấp 2, gấp 3 lần mà chỉ biểu thị quan hệ hơn kém. Tuy nhiên, ta không thể xác định được mức độ cao thấp giữa các nhóm, khoảng cách giữa các biểu hiện cũng không bằng nhau.

Chính vì những hạn chế trên, thang đo khoảng được sử dụng thay thế cho thang đo thứ bậc.

1.3.3. Thang đo khoảng

Định nghĩa: Thang đo khoảng là thang đo thứ bậc nhưng có khoảng cách đều nhau và không có điểm gốc không (0) tuyệt đối.

Điều kiện vận dụng: Với những tiêu thức mà số 0 là một biểu hiện của tiêu thức đó chứ không có nghĩa là không có, thang đo này thường được sử dụng cho các tiêu thức số lượng.

Ví dụ: Tiêu thức nhiệt độ không khí, 0oC là một biểu hiện; tiêu thức điểm thi, điểm 0 là một biểu hiện chứ không có nghĩa là không có điểm.

Đặc điểm: Có thể sử dụng các phép tính cộng, trừ và có thể tính được các đặc trưng của dãy số như số bình quân, phương sai... nhưng không tính được tỷ lệ giữa các trị số đo.

Ví dụ: Nhiệt độ trung bình của thành phố A là 30oC, thành phố B là 10oC, nhưng điều đó không có nghĩa là thành phố A nóng gấp 3 lần thành phố B.

Trong thực tế nghiên cứu xã hội, nhiều thang đo thứ bậc được dùng như thang đo khoảng, tức đã có những cải tiến thang đo thứ bậc theo hướng thang đo khoảng nhằm định lượng sự hơn, kém theo một dấu hiệu nào đó.

Ví dụ: Với câu hỏi “bạn có tự tin khi nhận công việc mới này hay không, hãy cho điểm đánh giá theo thang đo sau?” thay vì trả lời theo 3 nấc rất tự tin, tương đối tự tin và không tự tin như ở trên, bạn có thể cho điểm theo thang đo khoảng, nếu rất tự tin thì cho điểm 10 còn hoàn toàn không tự tin thì cho điểm 0.

Page 12: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

12 v1.0

Mặc dù ở đây đã lượng hoá được phần nào mức độ tự tin của người được hỏi nhưng chưa có tiêu chuẩn cụ thể cho mỗi bậc của thang đo. Việc cho mấy điểm hoàn toàn do cảm tính của người được hỏi mà chưa có chuẩn chính thức.

Hạn chế cơ bản của thang đo khoảng là chưa có giá trị “không tuyệt đối” mà chỉ có giá trị 0 quy ước. Chính vì vậy, để khắc phục được nhược điểm trên, người ta thường hay sử dụng loại thang đo dưới đây trong thống kê.

1.3.4. Thang đo tỷ lệ

Định nghĩa: Thang đo tỷ lệ là thang đo khoảng có điểm gốc không (0) tuyệt đối.

Điều kiện vận dụng: Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiện tượng kinh tế – xã hội như: thu nhập, chi tiêu, tuổi,... Các đơn vị đo lường vật lý thông thường (kg, m, lít,...) cũng là các đơn vị của thang đo loại này.

Đặc điểm: Có thể thực hiện tất cả các phép tính với trị số đo và có thể so sánh các tỷ lệ giữa các trị số đo.

Tóm lại, thông thường thang đo sau có chất lượng đo lường cao hơn thang đo trước, đồng thời việc xây dựng thang đo cũng phức tạp hơn. Tuy nhiên, không phải cứ sử dụng thang đo tỷ lệ là tốt nhất mà phải tuỳ thuộc vào đặc điểm của hiện tượng và tiêu thức nghiên cứu mà chọn thang đo thích hợp.

Hai loại thang đo định danh và thứ bậc chưa có tiêu chuẩn đo (đơn vị đo), thuộc loại thang đo định tính. Đó là loại thang đo mà khi thay đổi từ giá trị này sang giá trị khác thì đối tượng đo có sự thay đổi về chất, chúng phù hợp với việc đo lường các tiêu thức thuộc tính.

Hai loại thang đo khoảng và tỷ lệ đã có tiêu chuẩn đo, khi chuyển từ một điểm này sang điểm khác trên thang thì có sự thay đổi về lượng nhưng chưa chắc đã có sự thay đổi về chất. Đây là loại thang đo định lượng, phù hợp để đo lường các tiêu thức số lượng.

Theo tuần tự của 4 loại thang đo thì việc đo mức độ tập trung, phân tán và mối liên hệ của hiện tượng nghiên cứu cũng tăng dần. Với thang đo định danh ta chỉ có thể tính được tỷ lệ (%) phân bố của tổng thể cho từng biểu hiện và tính mốt (M0). Sử dụng thang đo thứ bậc, ta có thể tính thêm được trung vị (Me), hệ số tương quan cặp và riêng phần. Muốn thực hiện được các phép tính cộng, trừ, tính bình quân, phương sai, tỷ lệ, các hệ số và tỷ số tương quan thì phải sử dụng thang đo khoảng. Với thang đo tỷ lệ, ta có thể sử dụng mọi độ đo thống kê.

Page 13: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

v1.0 13

TÓM LƯỢC CUỐI BÀI

Thống kê ra đời và phát triển theo yêu cầu của xã hội. Ngày nay thống kê trở thành một phần không thể thiếu của đời sống kinh tế – xã hội, thống kê là công cụ giúp cho việc ra các quyết định trong quản lý.

Thống kê học là một môn học nghiên cứu về hệ thống các phương pháp thu thập – xử lý – phân tích số liệu của các hiện tượng và quá trình kinh tế – xã hội.

Đối tượng nghiên cứu của thống kê học là mặt lượng trong mối liên hệ mật thiết với mặt chất của các hiện tượng và quá trình kinh tế xã hội số lớn trong điều kiện thời gian và không gian cụ thể.

Có nhiều thuật ngữ được sử dụng trong thống kê, trong đó có 3 thuật ngữ được sử dụng rộng rãi nhất, đó là: (1) tổng thể thống kê, (2) tiêu thức thống kê và (3) chỉ tiêu thống kê.

Để lượng hoá các tiêu thức, nhất là với tiêu thức thuộc tính, người ta thường sử dụng 4 loại thang đo sau: thang đo định danh, thang đo thứ bậc, thang đo khoảng và thang đo tỷ lệ. Tuỳ theo đặc điểm của hiện tượng nghiên cứu và tiêu thức nghiên cứu mà sử dụng loại thang đo cho phù hợp.

Page 14: Nguyen ly thong ke

Bài 1: Giới thiệu về thống kê học

14 v1.0

CÂU HỎI ÔN TẬP

1. Hãy làm rõ đối tượng nghiên cứu của thống kê học.

2. Trình bày các khái niệm thường dùng trong thống kê.

So sánh các loại tổng thể thống kê, cho ví dụ minh hoạ.

Phân biệt các loại tiêu thức thống kê, cho ví dụ minh hoạ.

Phân biệt các loại chỉ tiêu thống kê, cho ví dụ minh hoạ.

Phân biệt tiêu thức thống kê và chỉ tiêu thống kê.

3. Phân biệt các loại thang đo thống kê. Cho ví dụ minh hoạ.

Page 15: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 15

0

Nội dung Mục tiêu

Điều tra thống kê.

Tổng hợp thống kê.

Phân tích và dự đoán thống kê.

Giúp học viên nắm được những vấn đề chung nhất về điều tra thống kê.

Giới thiệu một số vấn đề chung về giai đoạn tổng hợp thống kê và tập trung đi sâu vào phương pháp tổng hợp số liệu thống kê đã có.

Giới thiệu một số vấn đề chung về giai đoạn phân tích và dự đoán thống kê.

Thời lượng học Hướng dẫn học

10 tiết Đọc tài liệu và trao đổi lại với giáo viên và các học viên khác về những nội dung còn chưa nắm rõ.

Tìm đọc phương án điều tra của một số cuộc điều tra lớn để hiểu rõ hơn bài học.

Có thể tự xây dựng một phương án điều tra thống kê nhằm thu thập thông tin về một vấn đề mà mình quan tâm.

Làm bài tập phần phân tổ thống kê.

BÀI 2: QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ

Page 16: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

16 v1.0

TÌNH HUỐNG DẪN NHẬP

Tình huống: Hàm lượng canxi trong sữa

Thời gian qua, trên thị trường sữa Việt Nam xôn xao thông tin dư luận về sự kiện hàm lượng canxi của hãng sữa Mead Johnson cao hơn mức công bố. Điều này ít nhiều đã ảnh hưởng đến hình ảnh và doanh số bán hàng của hãng. Bạn, với vai trò là một nhân viên làm công tác thống kê của hãng được yêu cầu phải đánh giá tình hình thị trường sữa ở Việt Nam trước và sau sự việc này.

Câu hỏi

1. Bạn quyết định thực hiện một nghiên cứu thống kê để trên cơ sở đó viết báo cáo đánh giá. Vậy bạn sẽ thực hiện nghiên cứu đó như thế nào?

2. Bài học này sẽ giúp bạn tìm hiểu một quá trình nghiên cứu thống kê bao gồm những giai

đoạn nào và nội dung cụ thể của từng giai đoạn đó.

Page 17: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 17

Bài học sẽ tập trung đi sâu vào nội dung cơ bản của 3 giai đoạn chủ yếu trong quá trình nghiên cứu thống kê: điều tra thống kê, tổng hợp thống kê và phân tích thống kê.

2.1. Điều tra thống kê

2.1.1. Khái niệm chung về điều tra thống kê

2.1.1.1. Khái niệm

Điều tra thống kê là việc tổ chức thu thập tài liệu về các hiện tượng và quá trình kinh tế – xã hội một cách khoa học, theo một kế hoạch thống nhất nhằm phục vụ cho quá trình nghiên cứu thống kê.

Ví dụ: Để nghiên cứu về tình hình thị trường sữa ở Việt Nam trước và sau sự kiện hàm lượng canxi của hãng Mead Johnson, bước đầu, bạn sẽ phải tổ chức điều tra thống kê nhằm thu thập thông tin về các chủng loại sữa đang được bán trên thị trường, giá cả, doanh số, thị phần...

Từ khái niệm về điều tra thống kê ở trên ta thấy, điều tra không phải tuỳ tiện mà phải được thực hiện một cách khoa học và có tổ chức, nghĩa là phải xác định cụ thể trình tự các công việc cần tiến hành theo mốc thời gian qui định và phải bố trí công việc hợp lý. Ngoài ra, việc thực hiện theo một kế hoạch thống nhất tức là phải thực hiện theo yêu cầu chung quy định trước cuộc điều tra như thống nhất về đối tượng, phạm vi, thời gian, nội dung thu thập...

Một cuộc điều tra thống kê được tổ chức khoa học, thống nhất chắc chắn sẽ thu thập được nhiều số liệu thống kê có chất lượng cao và có mối liên hệ tốt làm cơ sở cho quá trình phân tích thống kê.

2.1.1.2. Ý nghĩa của điều tra thống kê

Đây là giai đoạn đầu tiên của quá trình nghiên cứu thống kê. Tài liệu về hiện tượng nghiên cứu thu thập trong giai đoạn này nhằm phục vụ cho giai đoạn phân tích và tổng hợp thống kê. Không có tài liệu thì không thể có nghiên cứu thống kê. Chất lượng của tài liệu có ảnh hưởng trực tiếp tới độ tin cậy của kết quả nghiên cứu sau này.

Để đảm bảo chất lượng phục vụ cho quá trình nghiên cứu, điều tra thống kê phải đáp ứng một số yêu cầu nhất định.

2.1.1.3. Một số yêu cầu cơ bản của điều tra thống kê

Tài liệu của điều tra thống kê phải đáp ứng 3 yêu cầu cơ bản sau:

Chính xác: Tài liệu phải được thu thập chính xác, khách quan, phản ánh đúng tình hình thực tế của hiện tượng.

Đây là yêu cầu hết sức quan trọng, là cơ sở để phân tích, tính toán nhằm rút ra kết luận đúng đắn về hiện tượng nghiên cứu. Tuy nhiên, độ chính xác trong thống kê không mang ý nghĩa tuyệt đối như trong kế toán. Do thống kê nghiên cứu hiện tượng số lớn nên chắc chắn sẽ có sai lệch. Độ sai lệch cho phép trong thống kê là ± 5%.

Page 18: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

18 v1.0

Kịp thời: Tài liệu phải được thu thập kịp thời, tức là theo đúng thời hạn qui định. Bên cạnh đó, tính kịp thời còn thể hiện ở chỗ tài liệu phải được cung cấp đúng lúc khi người sử dụng cần.

Tại sao phải kịp thời? Như bài 1 đã trình bày, mặt lượng của hiện tượng thường xuyên thay đổi, nếu không thu thập kịp thời, nó sẽ thay đổi; khi đó không phản ánh đúng hiện tượng được nữa. Ngoài ra còn có một ý nghĩa thực tiễn khác là kịp thời để còn có chính sách phù hợp.

Ví dụ: Khi có thiên tai, lũ lụt,... phải kịp thời thống kê được thiệt hại cả về người và của để có chính sách cứu trợ hợp lý.

Đầy đủ: Tài liệu phải được thu thập đầy đủ trên 2 phương diện:

o Về nội dung: phải theo đúng nội dung như trong kế hoạch và phương án điều tra.

o Về số đơn vị điều tra: đảm bảo số lượng đơn vị theo yêu cầu.

Ví dụ: Trong điều tra toàn bộ thì toàn bộ các đơn vị phải được điều tra. Còn trong điều tra chọn mẫu thì phải chọn mẫu đủ lớn và đảm bảo tính đại diện.

Hàng năm, người ta tiến hành hàng trăm các cuộc điều tra khác nhau. Có cuộc điều tra do ngành thống kê tổ chức nhưng cũng có cuộc điều tra do các ngành khác tổ chức. Vậy có những loại điều tra nào trong thực tế?

2.1.2. Các loại điều tra thống kê

2.1.2.1. Điều tra thường xuyên và không thường xuyên

Nếu căn cứ vào tính liên tục của việc ghi chép tài liệu ban đầu, điều tra thống kê được chia thành hai loại:

Điều tra thường xuyên: là việc thu thập tài liệu được tiến hành thường xuyên, liên tục, gắn liền với quá trình biến động của hiện tượng qua thời gian.

Ví dụ: doanh số ngày bán hàng, ghi chép tình hình xuất nhập kho, khai sinh khai tử...

Điều tra không thường xuyên: là việc tiến hành thu thập và ghi chép tài liệu ban đầu của hiện tượng không gắn với quá trình biến động của hiện tượng mà khi thấy cần thiết mới tiến hành thu thập tại một thời điểm hay một thời kỳ nào đó.

Thế nào là cần thiết? Điều này xuất phát từ yêu cầu quản lý kinh tế và xây dựng các kế hoạch phát triển kinh tế – xã hội của Nhà nước và khi có những hiện tượng xảy ra bất thường như thiên tai, địch họa... thì phải tổ chức điều tra.

Ví dụ: Khi thấy sự việc hàm lượng canxi ở sữa không như công bố có thể ảnh hưởng đến hình ảnh và doanh số bán hàng của hãng Mead Johnson, thì hãng quyết định tổ chức điều tra về thị trường sữa nhằm có những quyết định phù hợp trong quản lý sản xuất kinh doanh.

2.1.2.2. Điều tra toàn bộ và không toàn bộ

Nếu căn cứ vào phạm vi của đối tượng được điều tra thực tế, người ta chia điều tra thống kê thành:

Page 19: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 19

Điều tra toàn bộ: tiến hành thu thập tài liệu trên tất cả các đơn vị của hiện tượng nghiên cứu.

Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009.

o Ưu điểm: Cung cấp tài liệu đầy đủ nhất về từng đơn vị tổng thể, cho biết được quy mô tổng thể.

o Hạn chế: Chi phí lớn, thời gian dài, chất lượng tài liệu thu được không cao do phạm vi rộng, chỉ điều tra được những nội dung cơ bản, không đi sâu vào chi tiết, đặc biệt có nhiều trường hợp không thể tiến hành điều tra toàn bộ (vì là tổng thể tiềm ẩn hay tổng thể bộc lộ nhưng việc điều tra gắn liền với việc phá huỷ đơn vị điều tra) hoặc không cần thiết để điều tra toàn bộ (vì tổng thể là lớn và các đơn vị trong tổng thể không khác nhau nhiều).

Ví dụ: Điều tra chất lượng sản phẩm đồ hộp, điều tra tuổi thọ bóng đèn, điều tra trọng lượng hành khách đi đường hàng không...

Chính vì những nhược điểm trên mà hình thức điều tra này không phổ biến. Trên thực tế người ta thường sử dụng điều tra không toàn bộ.

Điều tra không toàn bộ: tiến hành thu thập tài liệu trên một bộ phận các đơn vị của hiện tượng nghiên cứu.

o Ưu điểm: Tiết kiệm chi phí, thời gian, chất lượng tài liệu thu được cao với nhiều nội dung chi tiết, ứng dụng rộng rãi hơn trên các tổng thể, các lĩnh vực.

o Nhược điểm: Không cung cấp tài liệu chi tiết, đầy đủ về từng đơn vị tổng thể; không biết được quy mô tổng thể; không tránh khỏi những sai số khi nhìn nhận tổng thể chung trên cơ sở kết quả điều tra không toàn bộ.

Tuỳ theo mục đích nghiên cứu mà cách chọn đơn vị điều tra khác nhau, dẫn đến có các loại điều tra không toàn bộ khác nhau. Thông thường, có 3 loại điều tra không toàn bộ, gồm:

Điều tra chọn mẫu: chỉ tiến hành thu thập tài liệu ở một số đơn vị nhất định được chọn ra từ tổng thể chung. Các đơn vị này được chọn theo những qui tắc nhất định để đảm bảo tính đại biểu và kết quả của điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung.

Ví dụ: Điều tra mức sống hộ gia đình, điều tra năng suất, diện tích, sản lượng cây trồng trong nông nghiệp, điều tra thị trường sữa trẻ em...

Đây là hình thức điều tra phổ biến nhất trong thực tế và rất phù hợp với các tổng thể tiềm ẩn.

Điều tra trọng điểm: người ta tiến hành điều tra trên một bộ phận quan trọng nhất, chủ yếu nhất của hiện tượng nghiên cứu.

Khác với điều tra chọn mẫu, kết quả của điều tra trọng điểm không dùng để suy rộng cho tổng thể chung mà chỉ giúp chúng ta biết được tình hình cơ bản của hiện tượng.

Ví dụ: Nghiên cứu tình hình vận tải hàng không ở Việt Nam, chỉ điều tra trên 2 sân bay lớn nhất cả nước là Nội Bài và Tân Sơn Nhất.

Page 20: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

20 v1.0

Điều tra chuyên đề: chỉ tiến hành thu thập tài liệu trên một vài đơn vị, thậm chí một đơn vị nhưng đi sâu nghiên cứu chi tiết nhiều khía cạnh.

Ví dụ: Điều tra các hộ nông dân chuyển đổi có hiệu quả...

Mục đích của loại điều tra này là nhằm tìm những nhân tố mới hay rút ra bài học kinh nghiệm, từ đó có những kết luận cần thiết để chỉ đạo thực tế. Đây là trường hợp đặc biệt của thống kê khi không nghiên cứu hiện tượng số lớn.

2.1.3. Các hình thức tổ chức điều tra

2.1.3.1. Báo cáo thống kê định kỳ

Báo cáo thống kê định kỳ là hình thức tổ chức điều tra thống kê thường xuyên, định kỳ theo chế độ do Nhà nước quy định.

Đây là hình thức tổ chức điều tra theo con đường hành chính bắt buộc, thường vận dụng chủ yếu ở các cơ quan nhà nước. Nội dung của các báo cáo thường liên quan đến lĩnh vực quản lý vĩ mô toàn bộ nền kinh tế quốc dân nhằm quản lý tập trung nền kinh tế. Chủ yếu áp dụng điều tra toàn bộ, thường xuyên và thu thập tài liệu một cách gián tiếp.

2.1.3.2. Điều tra chuyên môn

Điều tra chuyên môn là hình thức tổ chức điều tra không thường xuyên, tiến hành theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều tra.

Điều tra này chỉ được thực hiện khi cần thiết. Hình thức điều tra này không mang tính pháp lệnh mà vận động đối tượng cung cấp tài liệu điều tra.

Tài liệu thu được từ điều tra này rất phong phú, có ý nghĩa nhiều mặt hơn do:

Thu thập tài liệu của hầu hết những hiện tượng báo cáo thống kê định kỳ chưa hoặc không cung cấp được.

Thu thập tài liệu đối với khu vực ngoài quốc doanh.

Kết quả của điều tra chuyên môn được dùng để kiểm tra chất lượng tài liệu của báo cáo thống kê định kỳ.

Về cơ bản, điều tra chuyên môn được áp dụng linh hoạt các loại điều tra và các phương pháp thu thập tài liệu khác nhau.

2.1.4. Phương pháp thu thập thông tin trong điều tra thống kê

Các loại điều tra thống kê khác nhau sẽ sử dụng những phương pháp thu thập tài liệu khác nhau. Căn cứ vào tính chất trực tiếp hay gián tiếp của việc thu thập tài liệu sẽ có 2 phương pháp sau:

2.1.4.1. Phương pháp thu thập trực tiếp

Khái niệm

Phương pháp thu thập trực tiếp là phương pháp mà người điều tra tự mình quan sát hoặc trực tiếp hỏi đơn vị điều tra và tự ghi chép vào tài liệu.

Page 21: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 21

Đánh giá phương pháp

o Ưu điểm: Chất lượng tài liệu thu được cao; hạn chế được sai sót do đối tượng điều tra hiểu sai câu hỏi, hoặc cung cấp sai thông tin, ...

o Nhược điểm: Tốn kém về thời gian và chi phí, người điều tra có ảnh hưởng chủ quan tới đối tượng điều tra…

2.1.4.2. Phương pháp thu thập gián tiếp

Khái niệm

Phương pháp thu thập gián tiếp là phương pháp thu thập tài liệu qua bản viết của đơn vị điều tra như chứng từ sổ sách và các tài liệu có liên quan.

Đánh giá phương pháp

o Ưu điểm: Tiết kiệm thời gian và chi phí, không chịu ảnh hưởng của ý kiến người đi điều tra.

o Nhược điểm: Chất lượng tài liệu thu được không cao do đối tượng điều tra tự điền vào mẫu phiếu điều tra nên nhiều câu hỏi không hiểu mà không có người giải thích nên sẽ cung cấp thông tin sai, hoặc người trả lời cố ý cung cấp thông tin sai..., mức độ phù hợp với nghiên cứu không cao.

Để tổ chức tốt một cuộc điều tra chuyên môn đòi hỏi phải xây dựng được phương án điều tra thật chi tiết, tỉ mỉ, cụ thể và toàn diện.

2.1.5. Phương án điều tra thống kê

2.1.5.1. Khái niệm

Phương án điều tra thống kê là một văn bản được xây dựng trong bước chuẩn bị điều tra; trong đó qui định rõ những vấn đề cần phải được giải quyết hoặc cần hiểu thống nhất trước, trong và sau khi tiến hành điều tra thống kê.

Đây là loại văn bản mà bất cứ cuộc điều tra nào cũng phải xây dựng. Tính khoa học và thống nhất của điều tra thống kê được thể hiện rõ nét thông qua văn bản này.

2.1.5.2. Nội dung chủ yếu của phương án điều tra thống kê

Tuỳ theo đặc điểm, tính chất của hiện tượng được nghiên cứu mà nội dung của phương án điều tra sẽ khác nhau. Nhưng về cơ bản, một phương án điều tra thống kê bao gồm những nội dung chủ yếu sau:

Xác định mục đích điều tra

Với nội dung này, chúng ta phải trả lời được câu hỏi, cuộc điều tra đó nhằm mục tiêu gì và phục vụ cho yêu cầu cụ thể nào.

Mục đích điều tra là nội dung quan trọng đầu tiên của kế hoạch điều tra. Nó có tác dụng định hướng cho toàn bộ quá trình điều tra và giúp chúng ta xác định chính xác đối tượng, đơn vị và nội dung điều tra.

Xác định đối tượng điều tra và đơn vị điều tra

Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là xác định

Page 22: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

22 v1.0

phạm vi đối tượng cần nghiên cứu, cần điều tra nhằm thu thập tài liệu chính xác, không nhầm lẫn với các hiện tượng khác.

Đơn vị điều tra là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế. Trong điều tra toàn bộ, số đơn vị điều tra cũng chính là số đơn vị thuộc đối tượng điều tra. Trong điều tra không toàn bộ, số đơn vị điều tra là những đơn vị được chọn ra từ tổng thể các đơn vị thuộc đối tượng điều tra.

Xác định đơn vị điều tra tức là xác định tài liệu sẽ được thu thập ở đâu. Tuỳ theo mục đích và đối tượng điều tra mà đơn vị điều tra được xác định khác nhau.

Ví dụ: Trong Tổng điều tra dân số và nhà ở 1/4/2009.

Mục đích điều tra: Phục vụ công tác nghiên cứu, phân tích và dự báo quá trình phát triển dân số và nhà ở trên phạm vi cả nước và từng địa phương...

Đối tượng điều tra: Tất cả công dân Việt Nam.

Đơn vị điều tra: Hộ gia đình.

Ví dụ: Trong điều tra sản xuất và kinh doanh rau sạch, đơn vị điều tra có thể là doanh nghiệp, hợp tác xã, hộ nông dân hoặc từng người dân có sản xuất và kinh doanh rau sạch.

Ví dụ: Trong điều tra về thị trường sữa trẻ em ở Việt Nam, đơn vị điều tra là các siêu thị, đại lý, cửa hàng... có kinh doanh sữa trẻ em.

Xác định nội dung điều tra

Mỗi đơn vị điều tra có rất nhiều tiêu thức khác nhau. Nhưng trong một cuộc điều tra, không nhất thiết phải thu thập tất cả các tiêu thức, mà chỉ thu thập theo một số tiêu thức chủ yếu, những tiêu thức quan trọng nhất đáp ứng cho mục đích điều tra và mục đích nghiên cứu. Như vậy, nội dung điều tra là toàn bộ các đặc điểm cơ bản của từng đối tượng, từng đơn vị điều tra mà ta cần thu được thông tin hay nói cách khác, đó là danh mục các tiêu thức hay đặc trưng của các đơn vị điều tra cần thu thập.

Để xác định nội dung điều tra, cần phải căn cứ vào các yếu tố sau:

o Mục đích điều tra.

o Đặc điểm của hiện tượng nghiên cứu.

o Năng lực, trình độ thực tế của đơn vị, người tổ chức điều tra.

Trong kế hoạch điều tra phải xác định và thống nhất danh mục các tiêu thức cần thu thập. Các tiêu thức này phải được diễn đạt thành câu hỏi ngắn gọn, dễ hiểu, cụ thể, rõ ràng để cả người điều tra và đơn vị điều tra đều hiểu một cách thống nhất. Danh mục các tiêu thức này được thể hiện dưới dạng phiếu hỏi, phiếu điều tra, bảng hỏi hay biểu mẫu điều tra.

Đi kèm theo phiếu hỏi phải có bảng giải thích cách ghi phiếu nhằm giải thích cụ thể nội dung từng tiêu thức, cách thu thập và ghi chép số liệu. Mục đích giúp người đi điều tra, đơn vị điều tra hiểu và thực hiện chính xác, thu thập số liệu cho đúng.

Xác định thời điểm điều tra, thời kỳ điều tra và thời hạn điều tra

Trong đó:

o Thời điểm điều tra là mốc thời gian (ngày, giờ cụ thể) được xác định để tiến hành thu thập tài liệu một cách thống nhất trên tất cả các đơn vị của hiện tượng nghiên cứu.

Page 23: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 23

Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời điểm điều tra là 0 giờ ngày 1/4/2009.

Tuỳ theo tính chất, đặc điểm của hiện tượng nghiên cứu mà xác định thời điểm điều tra. Tuy nhiên, thời điểm điều tra thường được xác định vào lúc hiện tượng ít biến động nhất và gắn kết với những kế hoạch của địa phương.

Ví dụ: Điều tra về du lịch biển ở Sầm Sơn thì không nên chọn vào mùa đông.

o Thời kỳ điều tra là độ dài (khoảng) thời gian có sự tích luỹ về mặt lượng của hiện tượng nghiên cứu.

Ví dụ: Điều tra tình hình xuất khẩu gạo của địa phương A trong quý 1 năm 2008.

Thời kỳ điều tra dài hay ngắn phụ thuộc vào mục đích nghiên cứu.

o Thời hạn điều tra là khoảng thời gian kể từ lúc bắt đầu tiến hành điều tra cho đến khi hoàn thành việc thu thập tài liệu trên tất cả các đơn vị điều tra.

Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời hạn điều tra trong vòng 20 ngày từ sáng 1/4 đến tối 20/4...

Như vậy, thời hạn điều tra dài hay ngắn phụ thuộc vào qui mô, tính chất phức tạp của hiện tượng, nội dung nghiên cứu và lực lượng tham gia nhưng nhìn chung, thời hạn điều tra không nên quá lâu vì sẽ dẫn đến việc thu thập tài liệu thiếu chính xác.

Ngoài 4 vấn đề chính ở trên, trong phương án điều tra thống kê còn đề cập tới một số vấn đề về nguồn nhân lực, kinh phí, thời gian thực hiện, điều tra thử, thành lập các cơ quan điều tra và tuyên truyền trong nhân dân...

Trong tiến hành điều tra thống kê, dù khoa học đến mấy nhưng vẫn có sai số. Vậy sai số là gì? Liệu có thể khắc phục được sai số hay không?

2.1.6. Sai số trong điều tra thống kê

2.1.6.1. Khái niệm

Sai số trong điều tra thống kê là chênh lệch giữa các trị số của tiêu thức điều tra thu thập được so với trị số thực tế của hiện tượng nghiên cứu.

Ví dụ: Trong điều tra dân số, sai số hay mắc phải là về tiêu thức tuổi do một số nguyên nhân: Người già không nhớ chính xác tuổi, tâm lý trẻ muốn già hơn và ngược lại…; trong điều tra về mức sống, đối tượng điều tra nhiều khi không nhớ chính xác về các khoản đã chi trong thời gian nghiên cứu...

Sai số trong điều tra thống kê là sai số vốn có. Phạm vi sai số cho phép trong điều tra thống kê là ± 5%. Tuy nhiên, sai số càng lớn thì chất lượng của kết quả điều tra càng giảm và gây ảnh hưởng đến chất lượng của cả quá trình nghiên cứu thống kê. Vấn đề đặt ra là phải xác định được sai số do nguyên nhân nào để từ đó chủ động tìm biện pháp khắc phục.

Page 24: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

24 v1.0

2.1.6.2. Các loại sai số

Căn cứ vào nguyên nhân dẫn đến sai số mà người ta chia sai số trong điều tra thống kê thành các loại sau:

Sai số do ghi chép tài liệu (do đăng ký lần đầu): đây là loại sai số mà tất cả các cuộc điều tra đều mắc phải, xảy ra do các nguyên nhân:

o Người điều tra vô tình cân, đo, đong, đếm và ghi chép sai.

o Đơn vị điều tra không hiểu câu hỏi dẫn đến trả lời sai.

o Cả đơn vị điều tra và người điều tra cố tình ghi chép sai.

Sai số do tính chất đại biểu của số đơn vị được chọn: chỉ xảy ra trong điều tra chọn mẫu, do các nguyên nhân:

o Cỡ mẫu không đủ lớn.

o Do cố tình vi phạm nguyên tắc chọn mẫu.

o Do bản thân nguyên tắc chọn mẫu.

2.1.6.3. Các biện pháp khắc phục sai số

Sai số trong thống kê là một vấn đề không thể tránh khỏi. Để khắc phục sai số, cần phải thực hiện tốt các biện pháp sau:

Làm tốt công tác chuẩn bị điều tra

o Lập phương án điều tra khoa học, chi tiết.

o Chuẩn bị cán bộ điều tra đảm bảo chất lượng.

o Coi trọng công tác tuyên truyền sâu rộng về mục đích cuộc điều tra.

Làm tốt công tác kiểm tra điều tra

o Kiểm tra tài liệu thu thập được có đầy đủ về nội dung và số đơn vị điều tra không, có chính xác về con số và logic không.

o Kiểm tra tính đại biểu của số đơn vị được chọn trong điều tra chọn mẫu.

Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu. Nhưng những tài liệu này mới chỉ ở dạng thô, mang tính chất rời rạc, chưa cho thấy đặc trưng chung của hiện tượng nghiên cứu. Công việc tiếp theo là phải tổng hợp những tài liệu đó lại để tìm ra các đặc trưng của hiện tượng làm cơ sở cho quá trình phân tích và dự đoán thống kê.

2.2. Tổng hợp thống kê

2.2.1. Khái niệm chung về tổng hợp thống kê

2.2.1.1. Khái niệm

Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học toàn bộ tài liệu thu thập được trong điều tra thống kê.

Ví dụ: Sau khi điều tra về thị trường sữa trẻ em ở Việt Nam hiện nay, chúng ta thu được một tập số liệu nhưng chưa biết được hiện có bao nhiêu chủng loại sữa, giá bán mỗi loại, thị phần... Tổng hợp thống kê sẽ giúp giải quyết những câu hỏi đó.

Chỉnh lý, hệ thống hoá là việc kiểm tra lại và sắp xếp tài liệu theo một trật tự nào đó chứ không sửa trực tiếp vào phiếu điều tra.

Page 25: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 25

2.2.1.2. Ý nghĩa và nhiệm vụ của tổng hợp thống kê

Tổng hợp thống kê là giai đoạn trung gian, xử lý sơ bộ tài liệu, làm căn cứ cho phân tích và dự đoán thống kê. Nếu tài liệu điều tra tỉ mỉ chi tiết nhưng tổng hợp không đúng thì tính toán phân tích sẽ sai. Mặt khác, bản thân việc tổng hợp thống kê này đã là một phương pháp trong phân tích thống kê.

Ví dụ: Phương pháp trình bày dữ liệu, phương pháp phân tích kết cấu của tổng thể trong trạng thái tĩnh, phương pháp phân tích chuyển dịch cơ cấu của tổng thể trong trạng thái động...

Qua tổng hợp, có thể làm cho các đặc trưng riêng của từng đơn vị tổng thể bước đầu chuyển thành các đặc trưng chung của cả tổng thể (từ các tiêu thức xây dựng nên các chỉ tiêu). Hệ thống hóa là nhiệm vụ chủ yếu của tổng hợp thống kê.

Sau đây là một số phương pháp tổng hợp thống kê cơ bản.

2.2.2. Phân tổ thống kê

2.2.2.1. Một số vấn đề chung về phân tổ thống kê

Khái niệm: Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ và các tiểu tổ có tính chất khác nhau.

Ví dụ: Trong nghiên cứu dân số, căn cứ vào tiêu thức giới tính, người ta chia dân số thành 2 tổ: nam và nữ; căn cứ vào tiêu thức tuổi, chia dân số thành các tổ: 0; 1 – 4; 5 – 9, 10 – 14, 15 – 19...

Ví dụ: Trong điều tra về thị trường sữa ở nước ta hiện nay, căn cứ theo tiêu thức loại sữa để phân chia tổng thể điều tra thành các loại sữa với nhãn hiệu khác nhau; hoặc căn cứ vào tiêu thức giá bán để phân chia thành các loại sữa với mức giá bán khác nhau...

Ý nghĩa: Phân tổ thống kê là một trong những phương pháp thường được sử dụng trong nghiên cứu thống kê.

o Giai đoạn điều tra thống kê: Trong điều tra toàn bộ và điều tra không toàn bộ, người ta phải phân tổ trước các hiện tượng cần nghiên cứu nhằm giúp cho việc điều tra được dễ dàng, thuận tiện; trong điều tra chọn mẫu, phương pháp phân tổ được sử dụng để đảm bảo tính đại diện của mẫu.

o Giai đoạn tổng hợp thống kê: Phân tổ là phương pháp cơ bản nhất dùng để chỉnh lý và hệ thống hóa toàn bộ tài liệu thu thập được trong điều tra thống kê.

o Giai đoạn phân tích thống kê: Phân tổ là một trong những phương pháp quan trọng, là cơ sở để vận dụng các phương pháp thống kê khác một cách có hiệu quả. Bản thân phân tổ thống kê cũng đã là một phương pháp phân tích thống kê quan trọng, đó là phân tích kết cấu của hiện tượng ở trạng thái tĩnh và chuyển dịch cơ cấu ở trạng thái động.

Nhiệm vụ: Nó cho phép giải quyết ba nhiệm vụ cơ bản sau:

Page 26: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

26 v1.0

o Thứ nhất, phân chia các loại hình kinh tế – xã hội theo đúng với sự tồn tại khách quan của nó. Trên cơ sở đó, nghiên cứu mối quan hệ giữa các loại hình kinh tế – xã hội nhằm nhận thức được quá trình vận động và phát triển của hiện tượng.

Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp ở nước ta theo thành phần kinh tế: Nhà nước, ngoài Nhà nước và có vốn đầu tư nước ngoài.

o Thứ hai, biểu hiện kết cấu của hiện tượng nghiên cứu, qua đó nêu lên đặc điểm cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Mặt khác, khi nghiên cứu sự biến động kết cấu của hiện tượng qua thời gian ta sẽ thấy được xu hướng phát triển cơ bản của hiện tượng nghiên cứu.

Ví dụ: Khi nghiên cứu kết cấu của các cơ sở sản xuất công nghiệp ở nước ta trong một khoảng thời gian, có thể thấy sự chuyển dịch theo hướng: tỷ trọng các cơ sở sản xuất công nghiệp trong khu vực Nhà nước giảm dần, tỷ trọng các cơ sở sản xuất công nghiệp trong khu vực ngoài Nhà nước và có vốn đầu tư nước ngoài tăng dần.

o Thứ ba, biểu hiện mối liên hệ giữa các tiêu thức. Ta chia tiêu thức thành tiêu thức nguyên nhân (tiêu thức gây ảnh hưởng) và tiêu thức kết quả (tiêu thức bị ảnh hưởng), sau đó sẽ tiến hành phân tổ theo tiêu thức nguyên nhân.

Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động, giữa năng suất lao động và tiền lương, giữa lượng phân bón và năng suất cây trồng, giữa thu nhập và loại sữa dùng cho trẻ…

Các loại phân tổ thống kê

o Căn cứ vào số lượng tiêu thức phân tổ: Phân tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ: phân tổ dân số theo riêng tiêu thức độ tuổi, giới tính...) và phân tổ theo nhiều tiêu thức. Phân tổ theo nhiều tiêu thức được chia thành hai loại:

Phân tổ kết hợp: là phân tổ lần lượt theo từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ, nhiều khía cạnh khác nhau.

Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được phân chia tiếp theo tiêu thức nhóm tuổi.

Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.

Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau nhưng có vai trò ngang nhau trong phản ánh hiện tượng.

Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao động, tài sản cố định, giá trị xây lắp, doanh thu... Các tiêu thức này có vai trò ngang nhau khi phản ánh qui mô của doanh nghiệp.

Page 27: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 27

o Căn cứ vào mục đích phân tổ, người ta chia thành:

Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường phân tổ theo tiêu thức thuộc tính.

Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu thức thuộc tính, có thể theo tiêu thức số lượng.

Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong những điều kiện thời gian, không gian khác nhau.

2.2.2.2. Tiêu thức phân tổ và chỉ tiêu giải thích

Khái niệm: Tiêu thức phân tổ là tiêu thức thống kê được chọn làm căn cứ để phân tổ thống kê.

Ví dụ: Phân tổ dân số theo giới tính thì giới tính là tiêu thức phân tổ.

Mỗi đơn vị tổng thể đều bao gồm nhiều tiêu thức, tiêu thức nào cũng có thể dùng để phân tổ được. Tuy nhiên, mỗi tiêu thức lại có ý nghĩa khác nhau nhưng tiêu thức phân tổ sẽ phản ánh đúng bản chất của hiện tượng nhất theo mục đích nghiên cứu.

Với cùng một tài liệu, nếu chọn tiêu thức phân tổ khác nhau có thể đưa đến kết luận khác nhau. Và nếu chọn tiêu thức phân tổ không đúng theo mục đích nghiên cứu sẽ dẫn đến nhận xét đánh giá khác nhau về thực tế của một hiện tượng. Vậy làm thế nào để chọn tiêu thức phân tổ cho chính xác?

Những căn cứ để lựa chọn tiêu thức phân tổ: Có ba căn cứ sau:

o Phải tiến hành phân tích lý luận kinh tế – xã hội để hiểu được đặc điểm, bản chất của hiện tượng, từ đó mới chọn ra tiêu thức nói rõ bản chất nhất, phù hợp với mục đích nghiên cứu để làm tiêu thức phân tổ.

Ví dụ: Để nghiên cứu về mức sống dân cư, ở thành thị chúng ta có thể sử dụng tiêu thức thu nhập, chi tiêu hay diện tích nhà ở bình quân nhưng nếu nghiên cứu ở nông thôn, tiêu thức diện tích nhà ở bình quân lại không có ý nghĩa.

o Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng (thời gian và địa điểm cụ thể) để lựa chọn tiêu thức thích hợp.

Ví dụ: Ngày nay, việc phân tổ các cơ sở sản xuất kinh doanh theo tiêu thức thành phần kinh tế mới có ý nghĩa; trong thời kỳ trước đổi mới, tiêu thức này là không phù hợp vì đa phần các cơ sở sản xuất kinh doanh đều thuộc sở hữu của Nhà nước.

o Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên cứu, có thể lựa chọn phân tổ theo một hay nhiều tiêu thức khác nhau.

Sau khi đã lựa chọn được tiêu thức phân tổ, người ta còn phải xác định các chỉ tiêu giải thích để nói rõ đặc trưng của các tổ cũng như của toàn bộ tổng thể.

Mỗi chỉ tiêu giải thích có ý nghĩa quan trọng riêng giúp ta thấy rõ các đặc trưng số lượng của từng tổ cũng như cả tổng thể, làm căn cứ để so sánh các tổ với nhau và tính ra các chỉ tiêu khác. Tuy nhiên, cũng không nên đề ra quá nhiều

Page 28: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

28 v1.0

chỉ tiêu, mà phải lựa chọn một số chỉ tiêu thích hợp nhất đối với mục đích nghiên cứu.

Ví dụ: Mục tiêu phân tích thực trạng của các doanh nghiệp hiện nay, chúng ta có thể lựa chọn những chỉ tiêu phản ánh rõ nét thực trạng đó nhất như: qui mô lao động, qui mô vốn, doanh thu, lợi nhuận...

Sau khi đã chọn được tiêu thức phân tổ, chúng ta tiến hành phân tổ. Nhưng phân ra thành bao nhiêu tổ là phù hợp?

2.2.2.3. Xác định số tổ

Có các trường hợp sau:

Nếu tiêu thức phân tổ là tiêu thức thuộc tính: Các tổ được hình thành theo các loại hình khác nhau, tuy nhiên không nhất thiết mỗi loại hình phải hình thành một tổ.

o Trường hợp đơn giản (tiêu thức có ít biểu hiện): Mỗi biểu hiện của tiêu thức có thể hình thành 1 tổ.

Ví dụ: 2 giới tính, 5 thành phần kinh tế...

o Trường hợp phức tạp (tiêu thức có nhiều biểu hiện): Ghép một số tổ nhỏ thành tổ lớn tùy theo đặc điểm hiện tượng và yêu cầu về mức độ chi tiết khi phân tổ. Cần bảo đảm yêu cầu các tổ nhỏ được ghép phải giống nhau hoặc gần giống nhau về đặc điểm và tính chất.

Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và đảm bảo giữa các tổ có sự khác nhau về đặc điểm, tính chất.

Ví dụ: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên cứu, ta chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngoài Nhà nước.

Ví dụ: Trong công nghiệp, có thể phân thành 3 nhóm ngành lớn: công nghiệp khai thác, công nghiệp chế biến và công nghiệp điện, ga, nước.

Ví dụ: Phân chỗ ngồi ở chợ theo các nhóm ngành hàng: hàng khô, hàng rau quả, hàng thịt,...

Nếu tiêu thức phân tổ là tiêu thức số lượng: Tùy theo số lượng biến của tiêu thức nhiều hay ít mà có cách giải quyết khác nhau.

o Số lượng các lượng biến ít: Với trường hợp này, lượng biến thay đổi ít, mỗi lượng biến có thể hình thành nên 1 tổ. Khi đó gọi là phân tổ không có khoảng cách tổ.

Ví dụ: Phân tổ công nhân doanh nghiệp A theo bậc thợ.

Bậc thợ Số công nhân (người)

1 10

2 20

3 45

4 60

5 35

6 25

7 5

Tổng 200

Page 29: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 29

Trong nhiều trường hợp, với mục đích nghiên cứu khác nhau, tuy số lượng các

lượng biến ít, người ta vẫn ghép một số lượng biến thành 1 tổ.

Ví dụ: Trong nghiên cứu dân số, khi nghiên cứu về qui mô hộ gia đình. Một hộ gia

đình có thể có 1, 2, 3, 4... người. Cùng với sự phát triển của xã hội, qui mô hộ thu

hẹp lại; khi đó làm nảy sinh khái niệm “gia đình hạt nhân” chỉ có bố mẹ và con cái

và “gia đình truyền thống” gồm 3, 4 thế hệ. Ngày nay, số lượng các gia đình hạt

nhân tăng lên, số lượng gia đình truyền thống giảm xuống.

o Số lượng các lượng biến nhiều: phải căn cứ vào quan hệ lượng – chất xem

lượng biến tích lũy đến một mức độ nào đó thì chất thay đổi và làm nảy sinh

một tổ mới. Mỗi tổ sẽ bao gồm 1 phạm vi lượng biến với 2 giới hạn: giới hạn

dưới: lượng biến nhỏ nhất để hình thành tổ; giới hạn trên: lượng biến lớn nhất,

nếu vượt qua giới hạn này thì chất đổi, dẫn đến hình thành 1 tổ mới. Phân tổ

như trên gọi là phân tổ có khoảng cách tổ. Chênh lệch giữa giới hạn trên và

giới hạn dưới gọi là khoảng cách tổ.

h = Giới hạn trên – Giới hạn dưới

Có các trường hợp:

Trường hợp phân tổ có khoảng cách tổ bằng nhau:

Xác định trị số khoảng cách tổ:

max minX X

hn

Trong đó:

Xmax, Xmin: Lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu.

n: Số tổ định chia.

Ví dụ: Khi nghiên cứu thu nhập bình quân một tháng (triệu đồng) tại một

phòng giao dịch của Ngân hàng ACB có 20 nhân viên, người ta thu được

kết quả sau:

3,0 4,6 5,8 15,0 6,5

9,0 7,7 9,5 3,4 8,5

5,2 7,0 5,5 11,0 10,0

12,5 8,8 7,5 5,8 8,2

Theo tiêu thức thu nhập bình quân một tháng, người ta muốn chia số nhân

viên nói trên thành 6 tổ có khoảng cách tổ bằng nhau.

Sau khi sắp xếp số liệu theo thứ tự tăng dần, nhận thấy, mức thu nhập thấp

nhất là 3 triệu đồng, mức thu nhập cao nhất là 15 triệu đồng. Khi đó,

khoảng cách tổ sẽ được tính như sau:

15 3h 2

6

(triệu đồng)

Các tổ được thiết lập như sau:

Page 30: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

30 v1.0

Thu nhập bình quân một tháng (triệu đồng)

Số nhân viên (người)

3 – 5 3 5 – 7 5

7 – 9 6 9 – 11 3 11 – 13 2 13 – 15 1 Tổng 20

Chú ý:

Giới hạn trên của tổ đứng trước được lấy làm giới hạn dưới của tổ đứng sau với mục đích làm cho dãy số kín hay liên tục.

Khi 1 đơn vị có lượng biến đúng bằng giới hạn trên và giới hạn dưới của 2 tổ liền nhau thì thường được xếp vào tổ đứng sau.

o Trường hợp phân tổ có khoảng cách tổ không bằng nhau: Dựa vào ý nghĩa kinh tế – xã hội của hiện tượng mà xác định nội dung và phạm vi của tổ.

Ví dụ: Phân tổ số học sinh của địa phương A theo lớp học như sau:

Lớp Số học sinh

1 – 5 320

6 – 9 270

10 – 12 180

Tổng 770

o Trường hợp phân tổ mở: là trường hợp tổ đầu tiên không có giới hạn dưới hay tổ cuối cùng không có giới hạn trên.

Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp của địa phương A theo số lao động:

Số lao động (người) Số cơ sở công nghiệp

20 10

21 – 50 30

51 – 100 20

100 10

Tổng 70

Chú ý:

Quy ước: Khoảng cách tổ của tổ gần nhất được sử dụng làm khoảng cách tổ cho tổ mở khi xác định trị số giữa.

Sau khi phân tổ hiện tượng nghiên cứu theo một tiêu thức nào đó thì các đơn vị của hiện tượng được sắp xếp vào các tổ tương ứng với các biểu hiện của tiêu thức mà đơn vị đó có, khi đó sẽ hình thành nên một dãy số phân phối.

2.2.2.4. Dãy số phân phối

Khái niệm: Dãy số phân phối là một dãy số được lập nên do phân phối các đơn vị tổng thể vào các tổ theo một tiêu thức phân tổ nào đó và được sắp xếp theo trình tự biến động của lượng biến tiêu thức phân tổ.

Page 31: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 31

Ví dụ : Các ví dụ nêu trên đều là dãy số phân phối.

Tác dụng của dãy số phân phối

o Cho biết tỉ mỉ, chi tiết tình hình phân phối các đơn vị của hiện tượng nghiên cứu theo 1 tiêu thức cụ thể.

o Là cơ sở để tiến hành tính toán và phân tích thống kê.

Phân loại dãy số phân phối: Có 2 loại dãy số phân phối tương ứng với loại tiêu thức phân tổ.

o Dãy số thuộc tính: là kết quả của phân tổ theo tiêu thức thuộc tính.

o Dãy số lượng biến: là kết quả của phân tổ theo tiêu thức số lượng.

Trong thống kê, người ta thường sử dụng các dãy số lượng biến. Đặc điểm của dãy số này là các lượng biến bao giờ cũng được sắp xếp theo thứ tự từ nhỏ đến lớn hoặc ngược lại.

Dạng tổng quát của một dãy số lượng biến:

Lượng biến

xi

Tần số

fi

Tần suất

di

Tần số tích lũy

Si

Tần suất tích lũy

Si’

x1 f1 d1 S1 = f1 S1’= d1

x2 f2 d2 S2 = S1 + f2 S2’= S1’ + d2

… … … … …

xn fn dn Sn = Sn-1 + fn Sn’= Sn-1’ + dn

∑fi ∑di

Trong đó lượng biến xi (i = 1,n ) là các trị số biểu hiện mức độ cụ thể của tiêu

thức số lượng.

Căn cứ vào tính chất liên tục hay không liên tục của lượng biến có thể chia ra:

Lượng biến liên tục: các trị số của nó có thể được biểu hiện bằng số nguyên hay số thập phân (ví dụ: tiền lương…). Khi đó, dãy số lượng biến phải có khoảng cách tổ.

Lượng biến không liên tục (rời rạc): các trị số của dãy số chỉ có thể biểu hiện bằng các số nguyên (ví dụ: tuổi…). Dãy số lượng biến có thể có hoặc không có khoảng cách tổ.

Đối với phân tổ có khoảng cách tổ, lượng biến xi là trị số giữa của từng tổ và được tính:

xi =Giới hạn dưới + Giới hạn trên

2

Tần số fi (i = 1,n ): Là số lượng biến của từng tổ được sắp xếp vào trong

từng tổ hay là số lần lặp lại của các lượng biến.

∑fi: Tổng số đơn vị trong tổng thể.

Tần suất di (i = 1,n ): Là tỷ trọng từng bộ phận trong tổng thể, là tần số

được biểu hiện bằng số tương đối. Vai trò của fi và di là tương đương nhau,

có thể thay thế cho nhau. Công thức: ii

i

fd =

f (lần, %).

Page 32: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

32 v1.0

Tần số tích lũy tiến Si (i = 1,n ): Là cộng dồn tần số, có 2 tác dụng: cho biết

số lượng các đơn vị có lượng biến nhỏ hơn hay lớn hơn 1 lượng biến cụ thể nào đó và cho phép xác định 1 đơn vị đứng ở vị trí nào đó trong dãy số có lượng biến là bao nhiêu.

Ví dụ: Có tài liệu về NSLĐ của 40 công nhân như sau:

NSLĐ (kg) (xi)

Số lao động (người) (fi) di (%) Si

50 3 7,5 3

55 5 12,5 8

60 10 25,0 18

65 12 30,0 30

70 7 17,5 37

72 3 7,5 40

∑ 40 100,0

Si = 18 khi xi = 60: Nó cho biết có 18 người có NSLĐ từ 60 sản phẩm trở xuống và có 40 – 18 = 22 người có NSLĐ từ 60 sản phẩm trở lên. Vậy người thứ 20 có NSLĐ là bao nhiêu?

Người thứ 20 nằm trong khoảng 18 – 30 nên có NSLĐ là 65 sản phẩm.

Tần suất tích lũy tiến iS (i = 1,n ): là cộng dồn tần suất.

Mật độ phân phối (mi): Trong dãy số lượng biến có các tổ với khoảng cách tổ không bằng nhau thì tần số trong các khoảng cách tổ không trực tiếp so sánh với nhau được, vì các tần số đó phụ thuộc vào trị số khoảng cách tổ. Để có thể so sánh được các tần số đó, người ta tính mật độ phân phối là tỷ số giữa tần số (hoặc tần suất) với trị số khoảng cách tổ.

ii

i

fm

h

Sau khi phân tổ thống kê, để tài liệu phát huy hết tác dụng trong phân tích thì phải trình bày kết quả phân tổ sao cho thuận tiện, dễ sử dụng, đảm bảo mỹ quan. Khi đó, người ta thường sử dụng bảng thống kê và đồ thị thống kê.

2.2.3. Bảng thống kê và đồ thị thống kê

2.2.3.1. Bảng thống kê

Khái niệm: Bảng thống kê là hình thức biểu hiện các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng nhằm nêu lên các đặc trưng về lượng của hiện tượng nghiên cứu.

Ý nghĩa: Trong bảng thống kê có những con số bộ phận và con số chung có liên quan mật thiết tới nhau do đó bảng thống kê phản ánh đặc trưng cơ bản của từng tổ và của cả tổng thể.

Page 33: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 33

Tác dụng: Giúp tiến hành so sánh, phân tích, đối chiếu và nghiên cứu số liệu thống kê theo các phương pháp khác nhau.

Cấu thành bảng thống kê

o Theo hình thức:

Hàng ngang, cột dọc phản ánh quy mô của bảng.

Tiêu đề phản ánh nội dung của bảng, gồm: Tiêu đề chung: nội dung chung của cả bảng thống kê. Tiêu đề nhỏ (tiêu mục): nội dung từng bộ phận trong bảng.

Các tài liệu và con số: Phản ánh đặc trưng về lượng của hiện tượng nghiên cứu.

o Theo nội dung:

Phần chủ đề (chủ từ): Giải thích đối tượng nghiên cứu gồm những đơn vị nào, loại hình nào, thuộc cột trái.

Phần giải thích (tân từ): Gồm các chỉ tiêu giải thích đặc điểm của từng đối tượng, thuộc cột phải.

Tên bảng thống kê (tiêu đề chung)

Đơn vị tính:…

Các chỉ tiêu giải thích

1 2 … n Tổng số

Tên chủ đề

Tổng số

Các loại bảng thống kê:

o Bảng giản đơn: phần chủ đề không phân tổ mà chỉ liệt kê các đơn vị theo tên địa phương, thời gian…

o Bảng phân tổ: đối tượng nghiên cứu ở phần chủ đề được phân chia thành các tổ theo 1 tiêu thức.

o Bảng kết hợp: đối tượng nghiên cứu ở phần chủ đề được phân chia thành các tổ theo 2, 3 hay nhiều tiêu thức.

Những yêu cầu đối với việc xây dựng bảng thống kê:

o Quy mô của bảng không nên quá lớn. Nếu bảng thống kê mà có quá nhiều hàng, nhiều cột, nên tách thành 2 hoặc 3 bảng nhỏ hơn.

o Các tiêu đề, tiêu mục cần chính xác, gọn gàng, dễ hiểu.

o Các hàng, cột cần được ký hiệu.

o Các chỉ tiêu giải thích cần được sắp xếp hợp lý, phù hợp với mục đích nghiên cứu.

o Phải có đơn vị tính cụ thể cho từng chỉ tiêu hoặc cho cả bảng.

o Cách ghi số liệu vào bảng thống kê:

“–”: Không có số liệu.

“…”: Số liệu thiếu sẽ bổ sung sau.

“x”: Không có liên quan, nếu viết số liệu sẽ vô nghĩa.

Phần giải thích Phần

chủ đề

Page 34: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

34 v1.0

Các số liệu phải ghi theo độ chính xác như nhau (bao nhiêu số thập phân

sau dấu phẩy theo nguyên tắc làm tròn số).

o Phải có phần ghi chú ở cuối bảng để giải thích nội dung một số chỉ tiêu (nếu cần) hoặc ghi nguồn số liệu (nếu có).

Bên cạnh bảng thống kê, còn một công cụ nữa cũng rất hay được sử dụng trong trình

bày số liệu thống kê, đó là đồ thị thống kê.

2.2.3.2. Đồ thị thống kê

Khái niệm: Đồ thị thống kê là các hình vẽ hay đường nét để miêu tả có tính chất

quy ước các tài liệu thống kê.

Đặc điểm: Khác với bảng thống kê, đồ thị thống kê sử dụng con số kết hợp với

hình vẽ, đường nét và màu để trình bày các đặc trưng về số lượng của hiện tượng

nghiên cứu hay trình bày khái quát các đặc điểm chủ yếu về bản chất và xu hướng

phát triển của hiện tượng.

Tác dụng: Đồ thị thống kê có hai tác dụng sau:

o Hình tượng hóa sự phát triển kết cấu, mối quan hệ so sánh hay mối liên hệ giữa

các bộ phận trong tổng thể hoặc giữa các tiêu thức với nhau, giúp người đọc

nắm được đặc điểm cơ bản của hiện tượng một cách dễ dàng, nhanh chóng.

o Là phương tiện để tuyên truyền, biểu dương kết quả của hoạt động sản xuất

kinh doanh cũng như các hoạt động xã hội.

Các loại đồ thị thống kê

o Theo hình thức biểu hiện:

Biểu đồ hình cột.

Biểu đồ diện tích.

Biểu đồ tượng hình.

Các loại đồ thị, đường gấp khúc.

Các loại bản đồ thống kê.

o Theo nội dung phản ánh:

Đồ thị so sánh.

Đồ thị kết cấu.

Đồ thị phát triển.

Đồ thị biểu thị mối liên hệ.

Những yêu cầu chung đối với việc xây dựng đồ thị

o Lựa chọn loại đồ thị phù hợp với nội dung, tính chất của số liệu cần diễn đạt.

o Quy mô đồ thị phải vừa phải tuỳ theo mục đích sử dụng.

o Các thang đo tỷ lệ và độ rộng của đồ thị phải được xác định chính xác.

o Phần giải thích tên đồ thị, các con số và ghi chú dọc theo thang đo tỷ lệ, các

con số bên cạnh từng bộ phận của đồ thị, giải thích các ký hiệu qui ước... cần

được ghi rõ, ngắn gọn và dễ hiểu.

Page 35: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 35

2.2.4. Một số vấn đề chủ yếu của tổng hợp thống kê

Xác định được mục đích của tổng hợp: Nhằm khái quát hoá những đặc trưng hoặc những cơ cấu tồn tại khách quan theo các mặt của tổng thể bằng các chỉ tiêu thống kê.

Kiểm tra tài liệu tổng hợp: Thường gọi là làm sạch dữ liệu, gồm:

o Kiểm tra phát hiện tiêu thức bị lỗi trong bảng hỏi.

o Đánh dấu lỗi phát hiện được và đánh dấu phiếu có mắc lỗi.

o Hiệu đính.

Xác định phương pháp tổng hợp: Gồm 3 phương pháp:

o Sắp xếp số liệu và phân tổ thống kê.

o Bảng thống kê.

o Đồ thị thống kê.

Chuẩn bị tài liệu dùng để tổng hợp

o Đóng các câu hỏi mở: đọc nhiều phiếu để đưa ra các nhóm ý kiến và mã hoá các ý kiến trả lời.

o Lượng hoá các biểu hiện của tiêu thức thuộc tính thông qua các thang đo (mã hoá số liệu: là việc thay thế một giá trị thông tin bằng lời của tiêu thức nào đó bằng các con số quy ước).

Sau khi đã có kết quả tổng hợp dưới dạng các bảng biểu, đồ thị..., chúng ta bước sang giai đoạn phân tích và dự đoán.

2.3. Phân tích và dự đoán thống kê

2.3.1. Khái niệm chung về phân tích và dự đoán thống kê

2.3.1.1. Khái niệm

Phân tích và dự đoán thống kê là nêu lên một cách tổng hợp bản chất cụ thể và tính quy luật của các hiện tượng và quá trình kinh tế xã hội trong điều kiện nhất định qua biểu hiện bằng số lượng và tính toán các mức độ trong tương lai, nhằm đưa ra những căn cứ cho quyết định quản lý.

Thế nào là điều kiện nhất định? Tùy thuộc vào tính chất, đặc điểm cũng như xu hướng phát triển của hiện tượng đã được phân tích trong quá khứ để có căn cứ sử dụng mô hình dự đoán thích hợp.

Thế nào là biểu hiện bằng số lượng? Tất cả các xu hướng phát triển của hiện tượng đều phải được lượng hóa bằng con số. Từ đó, nói lên bản chất và quy luật vận động của hiện tượng, đồng thời làm cơ sở lượng hóa, tìm hiểu sự biến động của hiện tượng trong tương lai.

2.3.1.2. Ý nghĩa và nhiệm vụ của phân tích và dự đoán thống kê

Đây là khâu cuối cùng của quá trình nghiên cứu thống kê. Nó biểu hiện tập trung kết quả của toàn bộ quá trình nghiên cứu thống kê. Qua đó, ta có thể nêu rõ bản chất và tính quy luật của hiện tượng. Trên cơ sở đó, dự đoán được sự phát triển của hiện tượng trong tương lai.

Page 36: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

36 v1.0

Phân tích, dự đoán thống kê không chỉ có ý nghĩa nhận thức mà còn góp phần cải tạo hiện tượng: đưa ra các quyết định quản lý tác động đối với hiện tượng nhằm thúc đẩy sự phát triển của hiện tượng theo qui luật.

Ví dụ: Dân số nước ta đông và xếp hạng 13 trên thế giới, từ đó đưa ra giải pháp là chính sách sinh đẻ có kế hoạch.

2.3.2. Các yêu cầu trong phân tích và dự đoán thống kê

Phải dựa trên cơ sở phân tích lý luận kinh tế xã hội để từ đó hiểu rõ được đặc điểm, bản chất của hiện tượng nghiên cứu. Khi đó, mới lựa chọn ra những chỉ tiêu phân tích phù hợp.

Phải dựa vào tài liệu đã điều tra và tổng hợp được (dựa vào tình hình thực tế) để tiến hành tính toán và phân tích.

Tuỳ thuộc vào mục đích phân tích cụ thể và đặc điểm của hiện tượng nghiên cứu mà sử dụng các phương pháp phân tích cho phù hợp.

2.3.3. Một số vấn đề chủ yếu của phân tích và dự đoán thống kê

Xác định nhiệm vụ cụ thể của phân tích thống kê, tức là phân tích đó nhằm giải quyết vấn đề gì.

Lựa chọn và đánh giá tài liệu dùng để phân tích.

Tính toán các chỉ tiêu cần thiết để phân tích.

So sánh đối chiếu các chỉ tiêu, từ đó phát hiện ra vấn đề tồn tại trong bản thân hiện tượng nghiên cứu.

Dự đoán về mức độ của hiện tượng trong tương lai.

Kết luận những vấn đề đã được phân tích và đưa ra giải pháp.

Page 37: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 37

TÓM LƯỢC CUỐI BÀI

Một quá trình nghiên cứu thống kê gồm có 3 giai đoạn chính: điều tra thống kê – tổng hợp thống kê – phân tích và dự đoán thống kê.

Điều tra thống kê là việc tổ chức thu thập tài liệu về các hiện tượng và quá trình kinh tế – xã hội một cách khoa học, theo một kế hoạch thống nhất. Tính khoa học và thống nhất này được thể hiện rất rõ trong phương án điều tra thống kê.

Có các loại điều tra thống kê khác nhau tuỳ theo cách phân loại: điều tra thường xuyên và điều tra không thường xuyên; điều tra toàn bộ và điều tra không toàn bộ. Trong điều tra không toàn bộ, tuỳ theo cách chọn đơn vị điều tra mà có 3 loại điều tra không toàn bộ khác nhau: điều tra chọn mẫu, điều tra trọng điểm và điều tra chuyên đề. Có hai hình thức tổ chức điều tra thống kê khác nhau: báo cáo thống kê định kỳ và điều tra chuyên môn. Các loại điều tra này thường sử dụng phương pháp thu thập thông tin trực tiếp hoặc gián tiếp. Mặc dù được thực hiện rất khoa học nhưng trong điều tra thống kê vẫn tồn tại hai loại sai số thống kê: sai số do ghi chép tài liệu và sai số do tính chất đại biểu.

Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu ở dạng thô. Công việc tiếp theo là phải tổng hợp những tài liệu đó lại để tìm ra các đặc trưng của hiện tượng làm cơ sở cho quá trình phân tích thống kê. Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học toàn bộ tài liệu thu thập được trong điều tra thống kê.

Có 3 phương pháp tổng hợp: phân tổ thống kê, bảng thống kê và đồ thị thống kê. Trong đó, phân tổ thống kê theo một tiêu thức nào đó là phương pháp chủ yếu nhất. Kết quả của phân tổ thống kê sẽ cho một dãy số phân phối – được sử dụng trong giai đoạn phân tích và dự đoán thống kê.

Phân tích và dự đoán thống kê là nêu lên một cách tổng hợp bản chất và tính quy luật của các hiện tượng và quá trình kinh tế xã hội trong điều kiện nhất định qua biểu hiện bằng số lượng và tính toán các mức độ trong tương lai, nhằm đưa ra những căn cứ cho quyết định quản lý.

Page 38: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

38 v1.0

CÂU HỎI ÔN TẬP

1. Điều tra thống kê là gì? Ý nghĩa và các yêu cầu của điều tra thống kê.

2. Trình bày các loại điều tra thống kê. Phân biệt các loại điều tra thống kê.

3. Phương án điều tra thống kê là gì? Trình bày các nội dung cơ bản của phương án điều tra thống kê.

4. Thế nào là sai số thống kê? Có những loại sai số thống kê nào?

5. Tổng hợp thống kê là gì? Ý nghĩa, nhiệm vụ của tổng hợp thống kê?

6. Phân tổ thống kê là gì? Vai trò của phân tổ trong nghiên cứu thống kê?

7. Trình bày các loại phân tổ thống kê.

8. Trình bày khái niệm, tác dụng và các loại bảng thống kê, các yêu cầu khi xây dựng bảng thống kê.

9. Trình bày khái niệm, tác dụng và các loại đồ thị thống kê, các yêu cầu khi xây dựng đồ thị thống kê.

10. Phân tích và dự đoán thống kê là gì? Ý nghĩa, nhiệm vụ và các yêu cầu của phân tích và dự đoán thống kê?

Page 39: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

v1.0 39

BÀI TẬP

1. Từ điều tra tiêu dùng năng lượng ở Mỹ, người ta thu được một tập hợp số liệu về tiêu dùng năng lượng trong 1 năm (triệu BTU) của 50 hộ gia đình ở miền Nam nước Mỹ, như sau:

130 55 54 64 145 66 60 80 102 62

58 101 75 111 141 139 81 55 66 90

97 77 51 67 125 50 136 55 83 91

54 86 100 78 93 113 111 104 96 113

96 87 129 109 60 94 99 97 83 97

Hãy xây dựng bảng tần số phân bố và tính tần suất. Sử dụng khoảng cách tổ là 10.

2. Khi điều tra về lượng sắt dung nạp tính theo mg trong 24 giờ của một mẫu gồm 45 phụ nữ, người ta thu được kết quả như sau:

15,0 18,1 14,4 14,6 10,9 18,1 18,2 18,3 15,0

16,0 12,6 16,6 20,7 19,8 11,6 12,8 15,6 11,0

15,3 9,4 19,5 18,3 14,5 16,6 11,5 16,4 12,5

14,6 11,9 12,5 18,6 13,1 12,1 10,7 17,3 12,4

17,0 6,3 16,8 12,5 16,3 14,7 12,7 16,3 11,5

a) Hãy xây dựng dãy số phân phối về hàm lượng sắt dung nạp. Sử dụng các khoảng cách tổ bằng nhau, bắt đầu từ tổ 6 – 8.

b) Theo khuyến nghị của Uỷ ban dinh dưỡng và lương thực thuộc Viện khoa học quốc gia Mỹ thì hàm lượng sắt cho phép dung nạp hàng ngày của phụ nữ dưới 51 tuổi là không vượt quá 18mg. Vậy với mẫu ở trên, có bao nhiêu phần trăm số phụ nữ đã dung nạp quá mức lượng sắt cho phép.

3. Bảng điểm của các sinh viên tham gia kỳ thi môn thống kê như sau:

88 82 89 70 85

63 100 86 67 39

90 96 76 34 81

64 75 84 89 96

a) Xây dựng bảng tần số phân bố về điểm của sinh viên với các tổ có khoảng cách tổ là 10.

b) Vẽ biểu đồ tần số và biểu đồ tần suất.

c) Vẽ đồ thị tần số và tần số tích luỹ.

4. Bảng tần số dưới đây cho biết số ngày đến hạn phải thanh toán của 40 khoản đầu tư ngắn hạn.

Số ngày đến hạn thanh toán Số khoản đầu tư ngắn hạn

30 – 40 3

40 – 50 1

50 – 60 8

60 – 70 10

70 – 80 7

80 – 90 7

90 – 100 4

Tổng 40

Page 40: Nguyen ly thong ke

Bài 2: Quá trình nghiên cứu thống kê

40 v1.0

a) Tính tần suất của bảng trên.

b) Hãy cho biết khoản đầu tư thứ 23 có số ngày đến hạn phải thanh toán là bao nhiêu?

c) Có bao nhiêu khoản đầu tư có số ngày phải thanh toán dưới 70 ngày.

d) Vẽ đồ thị biểu diễn mối liên hệ trên.

5. Người chiến thắng trong cuộc thi sắc đẹp ở một trường đại học trong thời gian từ 1993 – 2008 có nguồn gốc từ các địa phương sau:

Quê quán Số người

Thái Nguyên 2

Hải Dương 4

Hà Nội 7

Lai Châu 1

Cao Bằng 11

Nam Định 1

a) Tính tần suất của số liệu trên.

b) Vẽ biểu đồ hình cột (bar chart) cho tần suất.

c) Vẽ biểu đồ hình bánh (pie chart) cho tần suất.

Page 41: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 41

Nội dung Mục tiêu

Số tuyệt đối, số tương đối.

Số bình quân.

Các tham số đo độ biến thiên của tiêu thức.

Từ số liệu đã được tổng hợp, học viên có thể tính toán được các mức độ nhằm phản ánh hiện tượng kinh tế – xã hội, từ đó đưa ra nhận thức chung nhất về hiện tượng nghiên cứu.

Thời lượng học Hướng dẫn học

12 tiết Đọc bài giảng, thảo luận về các vấn đề còn chưa nắm rõ.

Trả lời các câu hỏi ôn tập và làm bài tập ở cuối bài.

BÀI 3: NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ – XÃ HỘI

Page 42: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

42 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Đánh giá năng suất lao động và tiền lương

Bạn với cương vị là nhân viên làm thống kê của một doanh nghiệp đang thực hiện một nghiên cứu nhằm đánh giá về năng suất lao động và tiền lương của doanh nghiệp mình. Sau khi đã tiến hành điều tra thống kê và tổng hợp số liệu theo một số nội dung quan tâm, bạn thu được các dãy số phân phối và các bảng biểu tổng hợp khác. Bây giờ, nhiệm vụ của bạn là thông qua các dãy số phân phối đó, thấy được các đặc trưng về hiện tượng mà bạn nghiên cứu.

Câu hỏi

Để tìm hiểu bản chất và tính quy luật của hiện tượng kinh tế – xã hội trong thống kê, người ta thường sử dụng các mức độ khác nhau để phản ánh. Các mức độ đó có thể là số tuyệt đối, số tương đối, số bình quân và các mức độ đo độ biến thiên. Bài học này sẽ hướng dẫn cho bạn cách tính toán các mức độ để qua đó có được những nhận thức chung nhất về hiện tượng.

Page 43: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 43

3.1. Số tuyệt đối và số tương đối trong thống kê

3.1.1. Số tuyệt đối trong thống kê

3.1.1.1. Khái niệm

Số tuyệt đối (còn gọi là mức độ tuyệt đối) là mức độ phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.

Như vậy, về thực chất số tuyệt đối trong thống kê nói lên điều gì? Nó cho biết:

Thứ nhất, số lượng đơn vị của hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.

Ví dụ 1: Tổng số lao động của doanh nghiệp A tại thời điểm 1/7/N là 200 người.

Thứ hai, tổng lượng biến tiêu thức.

Ví dụ 2: Tổng doanh thu của doanh nghiệp A năm N – 1 là 50 tỷ đồng.

3.1.1.2. Đặc điểm

Số tuyệt đối trong thống kê bao hàm nội dung kinh tế – xã hội trong những điều kiện thời gian và địa điểm cụ thể.

Phần lớn các số tuyệt đối trong thống kê là kết quả của điều tra thống kê và tổng hợp tài liệu.

Số tuyệt đối có đơn vị tính cụ thể.

3.1.1.3. Tác dụng

Số tuyệt đối cho ta nhận thức cụ thể về quy mô, khối lượng hiện tượng trong điều kiện thời gian và địa điểm cụ thể.

Là cơ sở để phân tích thống kê và tiến hành tính toán các mức độ khác trong nghiên cứu thống kê.

3.1.1.4. Các loại số tuyệt đối trong thống kê

Căn cứ vào đặc điểm tồn tại về qui mô của hiện tượng qua thời gian, người ta chia số tuyệt đối thành hai loại:

Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một khoảng thời gian nhất định.

Ví dụ 2 (Phần 3.1.1.1 – Khái niệm) ở trên là số tuyệt đối thời kỳ.

o Số tuyệt đối thời kỳ được hình thành thông qua sự tích luỹ về lượng trong suốt thời gian nghiên cứu. Khoảng thời gian mang tính chất qui ước mà trong đó diễn ra sự tích luỹ về lượng của hiện tượng nghiên cứu có thể là giờ, ngày, tháng, năm... tuỳ thuộc vào đặc điểm, tính chất diễn tiến của hiện tượng.

Page 44: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

44 v1.0

o Tích luỹ về lượng là sự cộng dồn theo thời gian, thời gian càng dài thì quy mô cộng dồn càng lớn. Điều này có nghĩa là có thể cộng các số tuyệt đối thời kỳ của cùng một chỉ tiêu ở các thời gian liền nhau để có số tuyệt đối của thời kỳ dài hơn.

Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng tại một thời điểm nhất định.

Ví dụ 1 (Phần 3.1.1.1 – Khái niệm) ở trên là một số tuyệt đối thời điểm.

o Thời điểm là một mốc thời gian cụ thể khi hiện tượng được phản ánh. Trước và sau thời điểm đó, qui mô của hiện tượng có thể thay đổi.

o Đặc điểm cơ bản của số thời điểm là không có sự tích luỹ về lượng nên không cộng lại được.

Bên cạnh số tuyệt đối, còn có một loại số khác cũng rất hay được dùng trong thống kê, đó chính là số tương đối.

3.1.2. Số tương đối trong thống kê

3.1.2.1. Khái niệm

Số tương đối (còn gọi là mức độ tương đối) là mức độ phản ánh quan hệ so sánh giữa hai mức độ của hiện tượng nghiên cứu.

Quan hệ so sánh là sự khác biệt cơ bản giữa số tuyệt đối và số tương đối trong thống kê. Hai mức độ của hiện tượng nghiên cứu có thể là:

Hai mức độ cùng loại nhưng khác nhau về thời gian hoặc về không gian, thực tế với kế hoạch, bộ phận với tổng thể.

Hai mức độ khác loại nhưng có mối liên hệ với nhau. Để có thể tính được số tương đối này thì 2 mức độ so sánh phải có cùng thời gian và không gian.

3.1.2.2. Đặc điểm

Số tương đối là kết quả so sánh 2 số đã có (thường là 2 số tuyệt đối), không trực tiếp thu thập được qua điều tra.

Tuỳ thuộc vào mức độ nghiên cứu cụ thể mà gốc so sánh khác nhau. Khi gốc so sánh khác nhau thì ý nghĩa của số tương đối cũng khác nhau.

Đơn vị tính: lần, %, đơn vị kép tùy thuộc loại số tương đối.

3.1.2.3. Tác dụng

Số tương đối được sử dụng nhiều trong phân tích thống kê, giúp cho nghiên cứu hiện tượng một cách sâu sắc trong quan hệ so sánh.

Trong nhiều trường hợp cần phải giữ bí mật số tuyệt đối, người ta dùng số tương đối để biểu hiện sự khác biệt.

Ví dụ: Giám đốc doanh nghiệp A công bố thông tin trên báo chí, tiền thưởng tết năm nay bằng 1,3 lần năm ngoái nhưng không nói rõ số tiền là bao nhiêu.

Thường dùng trong lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch.

Page 45: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 45

3.1.2.4. Các loại số tương đối trong thống kê

Số tương đối động thái (tốc độ phát triển): Phản ánh sự biến động của hiện tượng qua thời gian.

Công thức: 1

0

yt

y (lần, %)

Trong đó:

t: Số tương đối động thái.

y1, y0: Mức độ của hiện tượng kỳ nghiên cứu và kỳ gốc.

Ví dụ: Tổng doanh thu của doanh nghiệp A năm 2009 là 50 tỷ đồng, năm 2008 là 30 tỷ đồng. Vậy số tương đối động thái nói lên sự phát triển doanh thu của doanh nghiệp A là: 50/30 = 1,667 lần hay 166,7%.

Chú ý

Trên trục thời gian, thông thường kỳ gốc đứng trước còn kỳ nghiên cứu đứng sau. Nhưng trong một số trường hợp đặc biệt có thể ngược lại. Chính vì vậy, kỳ gốc và kỳ nghiên cứu chỉ có ý nghĩa tương đối. Phải đảm bảo tính chất có thể so sánh được giữa tử số và mẫu số, nghĩa là y1, y0 phải cùng phạm vi, phương pháp tính và đơn vị tính.

Số tương đối kế hoạch: Dùng để lập và kiểm tra tình hình thực hiện kế hoạch.

Có 2 loại:

o Số tương đối nhiệm vụ kế hoạch: Là tỷ lệ so sánh giữa mức độ cần đạt tới của chỉ tiêu nào đó với mức độ thực tế ở kỳ gốc, được dùng để lập kế hoạch.

Công thức: kn

0

yK

y (lần, %)

Trong đó: Kn: Số tương đối nhiệm vụ kế hoạch.

yk: Mức độ kế hoạch.

y0: Mức độ thực tế ở kỳ gốc.

Ví dụ: Năm 2008 doanh thu của doanh nghiệp A là 30 tỷ do vậy, doanh thu kế hoạch đề ra cho năm 2009 là 45 tỷ đồng, vậy:

09n

08

y 45K

y 30 = 1,5 lần (150%)

o Số tương đối thực hiện kế hoạch: Là tỷ lệ so sánh giữa mức độ đạt được trong kỳ với mức kế hoạch của 1 chỉ tiêu. Dùng để kiểm tra tình hình thực hiện kế hoạch.

Công thức: 1t

k

yK

y (lần, %)

Trong đó: Kt: Số tương đối thực hiện kế hoạch.

y1: Mức độ thực tế.

yk: Mức độ kế hoạch.

Page 46: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

46 v1.0

Ví dụ: 09t

k09

y 50K

y 45 = 1,11 lần (111%)

Mối liên hệ:

1 1 k

0 k 0

y y y

y y y t = Kn Kt

Số tương đối động thái

=Số tương đối

nhiệm vụ kế hoạch

Số tương đối hoàn thành kế hoạch

Số tương đối kết cấu: cho biết tỷ trọng của từng bộ phận chiếm trong toàn bộ hiện tượng. Dùng để phân tích đặc điểm cấu thành, bản chất của hiện tượng. Sự thay đổi của số tương đối kết cấu cho thấy xu hướng phát triển của hiện tượng qua thời gian.

bp

tt

yd

y (lần, %)

Đặc điểm: Tổng các số tương đối kết cấu của tất cả các bộ phận bằng 1 hoặc 100%.

Ví dụ: Doanh nghiệp có 200 lao động, trong đó nam: 120 lao động và nữ: 80 lao động.

Kết cấu nam trong tổng số lao động của doanh nghiệp:

namnam

y 120d 100 100

y 200 = 60%

Kết cấu nữ trong tổng số lao động của doanh nghiệp:

nn

y 80d 100 100

y 200 ÷

÷ = 40%

Kết cấu nam và nữ trong tổng số lao động của doanh nghiệp:

nam nnam n

y 120 80d 100 100

y 200

÷

÷ = 100% hay 1 lần

Số tương đối không gian: Sử dụng trong 2 trường hợp:

o So sánh giữa 2 mức độ cùng loại nhưng khác nhau về không gian.

Ví dụ: So sánh giá vàng ở Hà Nội và TP.HCM.

o So sánh giữa hai bộ phận trong 1 tổng thể: 2 không gian khác nhau cùng tồn tại trong 1 tổng thể.

Ví dụ: Tỷ lệ lao động nam/nữ của doanh nghiệp nói trên.

Số tương đối cường độ: Nói lên trình độ phổ biến của hiện tượng trong điều kiện lịch sử nhất định, là kết quả so sánh 2 mức độ khác loại nhưng có mối liên hệ với nhau.

Ví dụ: GDP bình quân đầu người (đồng/người), mật độ dân số (người/km2)…

Số tương đối cường độ có đơn vị kép: là đơn vị của 2 chỉ tiêu đem ra so sánh ghép lại với nhau.

Page 47: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 47

3.1.3. Điều kiện vận dụng số tuyệt đối và số tương đối trong nghiên cứu thống kê

Phải căn cứ vào tính chất và đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho chính xác.

Ví dụ: Cùng là tỷ lệ phế phẩm 5%, nhưng với các sản phẩm bình thường thì đây là tỷ lệ chấp nhận được. Còn với những sản phẩm thuốc tiêm độc hại, tỷ lệ này lại là quá cao vì hậu quả sẽ rất nghiêm trọng.

Phải vận dụng kết hợp các số tương đối và số tuyệt đối vì:

o Về phương diện tính toán: số tương đối được tính ra từ số tuyệt đối, số tương đối là sự kết hợp khác nhau giữa các số tuyệt đối.

o Về phương diện nhận thức hiện tượng nghiên cứu: số tuyệt đối cho ta nhận thức cụ thể về quy mô, khối lượng của hiện tượng còn số tương đối cho ta nhận thức về tính chất so sánh được, sâu về bản chất của hiện tượng.

Ví dụ: Tiền lương tăng từ 200 USD lên 800 USD tăng thêm 600 USD hay

tăng 800 200

100200

= 300%. Như vậy, 1% tăng thêm tương đương với 2 USD.

Ngược lại, tiền lương giảm từ 800 USD xuống còn 200 USD giảm 600 USD

hay giảm 800 200

100800

= 75%. Khi đó, 1% giảm đi tương đương với 8 USD.

Như vậy, gốc so sánh là quan trọng vì cùng thay đổi 600 USD nhưng tỷ lệ % tương ứng lại khác hẳn nhau.

Ví dụ: Năm 2007, tốc độ tăng trưởng GDP của Việt Nam là 8,5%, trong khi tốc độ tăng trưởng GDP của Mỹ chỉ có 2,2%. Nếu chỉ căn cứ vào hai số tương đối này, chúng ta có thể đưa ra một nhận định lạc quan rằng trong thời gian tới nền kinh tế Việt Nam sẽ đuổi kịp nền kinh tế Mỹ. Nhưng khi xem xét các số tuyệt đối, ta thấy qui mô GDP của Việt Nam năm 2007 là 71,216 tỷ USD, trong khi đó, qui mô GDP của Mỹ là 13811,2 tỷ USD. Như vậy, 1% tăng trưởng của Mỹ đã gần gấp đôi cả nền kinh tế của Việt Nam. Vì vậy, nhận định

trên là hoàn toàn sai lầm.

Để nêu lên đặc điểm chung nhất của hiện tượng số lớn, người ta thường dựa vào mức độ điển hình chung đại biểu cho hiện tượng, đó chính là số bình quân trong thống kê. Đây là các mức độ nằm ở khoảng giữa của dãy số phân phối. Vì chúng là mức độ điển hình đại biểu cho hiện tượng nên còn gọi là các tham số đo độ đại

biểu hoặc độ đại diện hay tham số đo xu hướng hội tụ.

3.2. Số bình quân trong thống kê

Số bình quân biểu hiện mức độ đại biểu cho tất cả các lượng biến theo một tiêu

thức nào đó của các đơn vị cùng loại.

Qua khái niệm trên, có hai vấn đề cần làm rõ như sau:

Page 48: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

48 v1.0

Theo một tiêu thức: Số bình quân chỉ đại biểu theo một tiêu thức chứ không theo nhiều tiêu thức của toàn bộ tổng thể.

Ví dụ: Tiền lương bình quân của công nhân trong doanh nghiệp A là 2,5 triệu đồng/người/tháng cho thấy có nhiều tiêu thức khác nhau nhưng trong trường hợp này: 2,5 triệu đồng là biểu hiện mức độ đại biểu theo tiêu thức tiền lương.

Các đơn vị cùng loại: Số bình quân được tính ra từ tổng thể bao gồm một số lớn các đơn vị và phải là tổng thể đồng chất.

Trong thống kê, tuỳ thuộc vào đặc điểm của đối tượng nghiên cứu và điều kiện tài liệu cho phép mà có thể tính số bình quân bằng các công thức khác nhau. Trong đó, số bình quân cộng được sử dụng phổ biến nhất.

3.2.1. Số bình quân cộng (Mean)

3.2.1.1. Khái niệm

Số bình quân cộng thực chất là số bình quân được tính theo phương pháp trung bình cộng trong toán học.

Số bình quân cộng được áp dụng trong trường hợp có sẵn tài liệu về lượng biến tiêu thức nghiên cứu xi và số lượng đơn vị tương ứng mỗi lượng biến, tức là tần số fi. Các lượng biến này có mối liên hệ tổng với nhau.

Công thức chung:

Tổng lượng biến của tiêu thức x =

Tổng số đơn vị của tổng thể

Chú ý

Vì số bình quân mang tính chất đại diện cho tổng thể, nên để số bình quân có tính đại biểu cao thì cần đảm bảo sao cho số đơn vị tổng thể dùng để tính số bình quân phải đủ lớn.

3.2.1.2. Đặc điểm

Số bình quân cộng san bằng mọi sự chênh lệch về lượng biến của tiêu thức để có một con số duy nhất đại diện cho tất cả lượng biến của tiêu thức nghiên cứu.

Chịu ảnh hưởng của lượng biến đột xuất trong dãy số. Đây cũng là một nhược điểm của số bình quân cộng.

3.2.1.3. Tác dụng

Tác dụng của số bình quân cộng:

Dùng để biểu hiện mức độ đại biểu, nêu lên đặc điểm chung nhất của hiện tượng.

Dùng để so sánh các hiện tượng không cùng quy mô.

Ví dụ: Để so sánh giữa các doanh nghiệp không có cùng qui mô, người ta không thể so sánh lợi nhuận, doanh thu của từng doanh nghiệp mà phải so sánh NSLĐ bình quân, mức doanh lợi bình quân…

Page 49: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 49

Thông qua sự biến động của số bình quân để thấy được xu hướng phát triển của hiện tượng.

Ví dụ: Thông qua NSLĐ bình quân của doanh nghiệp qua các năm, có thể thấy được xu hướng phát triển của NSLĐ trong toàn doanh nghiệp.

Dùng để lập kế hoạch, phân tích thống kê.

3.2.1.4. Các loại số bình quân cộng

Số bình quân cộng giản đơn: Áp dụng khi tài liệu thống kê chưa phân tổ hoặc khi số lần xuất hiện của các lượng biến trong tài liệu là như nhau. Với n lượng biến xi, ta có công thức tính số bình quân cộng giản đơn như sau:

n

ii 1

xx

n

Số bình quân cộng gia quyền: Áp dụng khi tài liệu đã được phân tổ.

o Đối với tài liệu phân tổ không có khoảng cách tổ:

Ứng với mỗi lượng biến xi chúng ta có một tần số fi hay nói cách khác, trong mỗi tổ (bộ phận) thì mỗi lượng biến xi lặp lại là fi lần. Như vậy, tổng lượng biến của tiêu thức sẽ là tổng các xifi và tổng số đơn vị của tổng thể sẽ là tổng các fi. Khi đó, công thức tính số bình quân cộng gia quyền là:

n

i i1 1 2 2 n n i 1

n1 2 n

ii 1

x fx f x f ... x f

xf f ... f

f

Trong đó, fi được gọi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số), nói lên tầm quan trọng của từng lượng biến trong tính số bình quân.

Số bình quân chịu ảnh hưởng bởi lượng biến có tần số lớn nhất hay lượng biến nào có tần số lớn nhất thì ảnh hưởng nhiều nhất đối với trị số của số bình quân. Do vậy, số bình quân ở gần lượng biến có tần số lớn nhất.

Với trường hợp bình quân cộng giản đơn, fi đều bằng nhau và bằng 1 nên không có sự khác biệt giữa các lượng biến đối với trị số của số bình quân.

Ví dụ: Có tài liệu về lương của công nhân trong doanh nghiệp A như sau:

a Lương (1.000 đồng) xi

Số công nhân (người) fi

di xifi xidi

3.000 15 0,075 45.000 225,0

3.500 30 0,150 105.000 525,0

4.000 45 0,225 180.000 900,0

4.500 55 0,275 247.500 1.237,5

5.000 40 0,200 200.000 1.000,0

5.500 15 0,075 82.500 412,5

Tổng 200 1,000 860.000 4.300,0

Page 50: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

50 v1.0

Yêu cầu: Tính lương trung bình của công nhân trong doanh nghiệp.

Như vậy, với tài liệu đã phân tổ này, cần phải tính theo công thức bình quân cộng gia quyền.

Xác định xi, fi:

xi: Lượng biến – là biểu hiện cụ thể bằng số của tiêu thức số lượng. Tiêu thức đang nghiên cứu là lương công nhân, vậy lượng biến xi là lương.

fi: Tần số – là số đơn vị của tổng thể được sắp xếp vào từng tổ. Ở mỗi mức lương khác nhau sẽ có số lượng công nhân tương ứng. Vậy, tần số fi là số công nhân.

Vậy lương trung bình của công nhân trong doanh nghiệp là:

i i

i

x f 860.000x

f 200

4.300 (nghìn đồng)

Nhận xét: Mức lương trung bình của công nhân trong doanh nghiệp A là 4.300 nghìn đồng. Ta thấy, kết quả này gần với mức lương 4.500 nghìn đồng, là mức lương có nhiều công nhân nhận được nhất.

Như chúng ta đã biết, việc tính số bình quân phụ thuộc vào điều kiện tài liệu cho phép. Trong trường hợp tài liệu chỉ cung cấp tần suất di, vậy số bình quân sẽ được tính theo công thức:

i ii i

i

x fx x d

f

Nếu tần suất tính bằng đơn vị %:

i ix dx

100

Khi đó, di đóng vai trò là quyền số.

Với ví dụ trên, giả sử không cho số công nhân mà chỉ cho tỷ trọng số công nhân nhận mức lương đó trong tổng số công nhân, tức chỉ cho tần suất di. Khi đó, mức lương trung bình của công nhân trong doanh nghiệp được tính:

i ix x d = 4.300 (nghìn đồng)

Kết quả này hoàn toàn trùng khớp với kết quả tính được ở trên. Như vậy, dù tính theo công thức nào, kết quả số bình quân tính ra đều như nhau.

o Đối với tài liệu phân tổ có khoảng cách tổ: Trong trường hợp này, số bình quân được tính theo 2 bước.

Bước 1: Tính trị số giữa làm lượng biến đại diện cho từng tổ.

Trị số giữa của từng tổ xi Giới hạn dưới + Giới hạn trên 2

Bước 2: Tính số bình quân theo công thức trung bình cộng gia quyền.

Page 51: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 51

Ví dụ: Có tài liệu về NSLĐ của doanh nghiệp A như sau:

NSLĐ

(triệu đồng) Số công nhân (người) xi xifi

10 – 15 10 12,5 125,0

15 – 20 30 17,5 525,0

20 – 25 45 22,5 1.012,5

25 – 30 80 27,5 2.200,0

30 – 35 30 32,5 975,0

35 – 40 5 37,5 187,5

Tổng 200 5.025,0

Yêu cầu: Tính năng suất lao động trung bình của công nhân doanh nghiệp A.

Tính trị số giữa xi:

1

10 15x 12,5

2

(triệu đồng)

Năng suất lao động trung bình:

i i

i

x f 5.025x

x 200

25,125 (triệu đồng)

Chú ý

Với trường hợp dãy số có khoảng cách tổ mở, việc tính trị số giữa phải căn cứ vào khoảng cách tổ liền kề có đầy đủ giới hạn trên và giới hạn dưới để tính.

Số bình quân cộng điều hòa gia quyền

Áp dụng khi biết lượng biến tiêu thức xi và tổng lượng biến tiêu thức từng bộ phận (từng tổ) Mi = xi fi

Công thức tính bình quân cộng điều hoà gia quyền:

_i i i i i

i i ii

i i

x f x f Mx

x f Mfx x

Khi đó, Mi đóng vai trò là quyền số.

Số bình quân cộng điều hoà giản đơn được áp dụng khi các Mi bằng nhau và được tính theo công thức:

i i i i

iii

i ii

x f M n M nx

M 1 1f Mx xx

Ví dụ: Có hai công nhân cùng sản xuất một loại sản phẩm. Người thứ nhất làm trong 8 giờ, sản xuất một sản phẩm hết 2 phút. Người thứ hai làm trong 9 giờ, sản xuất một sản phẩm hết 6 phút. Tính thời gian hao phí bình quân để sản xuất 1 sản phẩm của hai người nói trên.

Page 52: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

52 v1.0

Phân tích:

x : Thời gian hao phí bình quân để sản xuất 1 sản phẩm; xi: Các mức thời gian hao phí để sản xuất 1 sản phẩm; fi: Số sản phẩm được sản xuất ra của từng người; Mi: Tổng thời gian lao động của từng người.

Vì 2 người có thời gian lao động khác nhau Mi khác nhau Áp dụng công thức bình quân cộng điều hòa gia quyền, ta có:

i

i

i

M 8 60 9 60x

M 8 60 9 602 6x

= 3,09 phút

3.2.1.5. Điều kiện vận dụng số bình quân cộng trong thống kê

Từ đặc điểm cơ bản của số bình quân, có 2 điều kiện khi vận dụng số bình quân cộng như sau:

Số bình quân cộng phải được tính từ tổng thể đồng chất. Trong tổng thể đồng chất có sự khác nhau về trị số nên có thể san bằng về mặt lượng. Tổng thể không đồng chất có sự khác nhau về bản chất nên không thể san bằng được.

Số bình quân chung che lấp sự chênh lệch lượng biến của các bộ phận cấu thành tổng thể. Do đó, cần vận dụng kết hợp với số bình quân tổ và dãy số phân phối để có thể giải thích sâu sắc từng khía cạnh, từng bộ phận của hiện tượng.

Số bình quân cộng được tính khi giữa các lượng biến có quan hệ tổng. Tuy nhiên trong thực tế, có những lượng biến không thể cộng với nhau, ví dụ như tốc độ phát triển, vậy sẽ tính số bình quân như thế nào?

3.2.2. Số bình quân nhân

3.2.2.1. Điều kiện vận dụng số bình quân nhân trong thống kê

Số bình quân nhân là số bình quân được tính theo phương pháp trung bình nhân trong toán học. Điều kiện vận dụng số bình quân nhân:

Số bình quân nhân vận dụng khi các lượng biến trong dãy số có quan hệ tích, thông thường để tính tốc độ phát triển bình quân.

Số bình quân nhân cũng có đặc điểm như số bình quân cộng là san bằng chênh lệch giữa các lượng biến và chịu ảnh hưởng của lượng biến đột xuất, số bình quân nhân cũng phải được tính ra từ tổng thể đồng chất. Khi phân tích cũng nên kết hợp với các số bình quân tổ để có được kết quả tốt nhất.

3.2.2.2. Các loại số bình quân nhân

Căn cứ vào vai trò đóng góp khác nhau của các thành phần tham gia bình quân hóa, có 2 loại số bình quân nhân:

Số bình quân nhân giản đơn: vận dụng khi các tần số fi bằng nhau. n

nn1 2 n i

i 1x x x ...x x

Số bình quân nhân gia quyền: vận dụng khi các tần số fi khác nhau.

xi được lặp lại fi lần ifix

Page 53: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 53

i i1 2 n i

nf ff f f fi

i 1x x x ...x x

Ví dụ: Khi nghiên cứu về chỉ tiêu doanh thu của doanh nghiệp A trong 10 năm, người ta nhận thấy:

5 năm có tốc độ phát triển hàng năm là 110%.

2 năm có tốc độ phát triển hàng năm là 125%.

3 năm có tốc độ phát triển hàng năm là 115%.

Yêu cầu: Tính tốc độ phát triển bình quân hàng năm trong giai đoạn 10 năm nói trên của chỉ tiêu doanh thu của doanh nghiệp A.

Phân tích:

xi: Tốc độ phát triển. Các xi có quan hệ tích số nên nếu nhân lại với nhau sẽ tính được tốc độ phát triển doanh thu của doanh nghiệp năm thứ 10 so với năm đầu tiên.

fi: Thời gian.

Tốc độ phát triển bình quân hàng năm được tính theo công thức:

i i

nf f 5 2 310

ii 1

x x 1,1 1,25 1,15 1,1436

lần (114,36%)

Vậy, trong 10 năm tốc độ phát triển bình quân doanh thu của doanh nghiệp A là 114,36%.

Trong một số trường hợp như tổng thể là tiềm ẩn, hoặc phức tạp không xác định được quy mô điều tra thì sẽ không áp dụng được số bình quân cộng hay nhân mà chúng ta phải dùng các mức độ khác để tính toán thay thế. Các mức độ đó chính là trung vị và mốt.

3.2.3. Mốt (Mode)

3.2.3.1. Khái niệm

Mốt là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể hay trong 1 dãy số phân phối. Vì mốt là biểu hiện của tiêu thức được gặp nhiều nhất nên nó có tần số fi lớn nhất.

3.2.3.2. Cách tính mốt

Đối với dãy số không có khoảng cách tổ: Mốt là lượng biến xi có tần số fi lớn nhất.

Ví dụ: Xem ví dụ về tiền lương công nhân ở trên (Phần 3.2.1.4 – Các loại số bình quân cộng).

fi max = 55 ứng với lượng biến 4.500 nghìn đồng.

Vậy, M0 = 4.500 nghìn đồng là mức lương nhiều công nhân trong doanh nghiệp nhận được nhất.

Đối với dãy số có khoảng cách tổ bằng nhau: Mốt được xác định theo 2 bước:

o Bước 1: Xác định tổ có Mốt – là tổ có tần số lớn nhất.

o Bước 2: Tính trị số gần đúng của Mốt:

0 0

0 0

0 0 0 0

M M 10 M min M

M M 1 M M 1

f fM x h

(f f ) (f f )

Page 54: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

54 v1.0

Trong đó:

0M minx : Giới hạn dưới của tổ có Mốt.

0Mh : Khoảng cách tổ của tổ có Mốt.

oMf : Tần số của tổ có Mốt.

oM 1f : Tần số của tổ đứng liền trước tổ có Mốt.

oM 1f : Tần số của tổ đứng liền sau tổ có Mốt.

Ví dụ: Từ tài liệu về NSLĐ của 200 công nhân trong doanh nghiệp A. Xác định tổ có M0: Tổ (25 – 30) là tổ có M0 vì có tần số lớn nhất. Tính M0.

0

80 45M 25 5

80 45 80 30

= 27,06 (triệu đồng)

Đối với dãy số có khoảng cách tổ không bằng nhau: với trường hợp này, việc xác định Mốt phải căn cứ vào mật độ phân phối.

ii

i

fm

h

Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có mi max. Cần phải thêm cột vào bảng tính để xác định tổ chứa Mốt và tính giá trị của Mốt tương tự theo công thức trên, nhưng thay các f bằng các m.

3.2.3.3. Tác dụng

Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng

hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn.

Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì nó không chịu ảnh hưởng của lượng biến đột xuất.

Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số.

Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất nhiều, đáp ứng nhu cầu khách hàng.

3.2.3.4. Ưu, nhược điểm của Mốt

Ưu điểm:

o Mốt không thay đổi đối với những lượng biến đột xuất.

o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng.

Hạn chế:

o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến có tần số lớn nhất mà không quan tâm tới các lượng biến khác.

o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số lớn xấp xỉ nhau (trường hợp có nhiều Mốt).

Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị.

Page 55: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 55

3.2.4. Trung vị (Median)

3.2.4.1. Khái niệm

Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến, chia dãy số thành hai phần bằng nhau.

Như vậy, từ khái niệm trên có 3 vấn đề cần làm rõ:

Thứ nhất, trung vị là lượng biến chứ không phải là vị trí. Vì là lượng biến nên trung vị chỉ được tính ra từ tiêu thức số lượng.

Thứ hai, trung vị là lượng biến của đơn vị ở vị trí giữa. Vậy đơn vị nào ở giữa?

o Nếu số đơn vị tổng thể lẻ (n = 2m + 1), vị trí giữa là đơn vị thứ m + 1.

o Nếu số đơn vị tổng thể chẵn (n = 2m), vị trí giữa là 2 đơn vị m và m + 1.

Thứ ba, vị trí giữa ở đây là trong dãy số lượng biến chứ không phải trong dãy số bất kỳ. Vì vậy, trước khi tính trung vị, ta phải sắp xếp các lượng biến theo thứ tự (từ lượng biến nhỏ nhất xmin tới lượng biến lớn nhất xmax hay ngược lại).

3.2.4.2. Cách tính trung vị

Đối với dãy số không có khoảng cách tổ: Me là lượng biến của đơn vị đứng ở vị trí giữa.

o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, Me = xm + 1, là lượng biến của đơn vị thứ m + 1.

o Nếu số đơn vị tổng thể chẵn: ∑f = 2m, m m 1e

x xM

2

, là trung bình cộng 2

lượng biến của 2 đơn vị thứ m và m + 1.

Ví dụ: Xét ví dụ về lương của công nhân doanh nghiệp A ở trên.

Lương (1.000 đồng) xi

Số công nhân (người) fi

Tần số tích luỹ Si

3.000 15 15

3.500 30 45

4.000 45 90

4.500 55 145

5.000 40 185

5.500 15 200

Tổng 200

Dãy số lượng biến có ∑f = 200 = 2m. Vậy m = 100.

Vậy trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 100 và 101.

Để xác định giá trị của hai đơn vị thứ 100 và 101 ta phải dựa vào tần số tích luỹ. Nhìn vào bảng tính tần số tích luỹ ở trên, ta thấy, hai đơn vị thứ 100 và 101 nằm ở tổ thứ tư và có lượng biến là 4.500 nghìn đồng. Nghĩa là, x100 = x101 = 4.500 (nghìn đồng). Khi đó:

m m 1e

x x 4.500 4.500M 4.500

2 2

(nghìn đồng)

Page 56: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

56 v1.0

Trung vị của dãy số lượng biến trên là 4.500 nghìn đồng. Điều này có nghĩa là 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở xuống và 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở lên.

Đối với dãy số có khoảng cách tổ: Me được xác định theo 2 bước.

o Bước 1: Xác định tổ có trung vị, là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa.

o Bước 2: Tính trị số gần đúng của trung vị.

e

e e

e

iM 1

e M min MM

fS

2M x hf

Trong đó:

eM minx : Giới hạn dưới của tổ có trung vị.

eMh : Khoảng cách tổ của tổ có trung vị.

eM 1S : Tần số tích lũy của tổ đứng liền trước tổ có trung vị.

eMf : Tần số của tổ có trung vị.

Ví dụ: Xét ví dụ về NSLĐ ở trên.

NSLĐ

(triệu đồng) Số công nhân

(người) Si

10 – 15 10 10

15 – 20 30 40

20 – 25 45 85

25 – 30 80 165

30 – 35 30 195

35 – 40 5 200

Tổng 200

Tổ 25 – 30 là tổ có Me vì nó chứa lượng biến của 2 vị trí ở giữa 100 và 101 dựa theo tần số tích lũy Si, ta có:

e

20085

2M 25 580

25,94 (triệu đồng)

Kết quả tính trung vị ở trên cho biết, có 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở xuống và 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở lên.

Chú ý

Vì là tham số đặc trưng nên trung vị, mốt và số bình quân không nhất thiết phải bằng 1 lượng biến cụ thể nào.

3.2.4.3. Tác dụng

Me biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng hay bù trừ chênh lệch giữa các lượng biến (khác x ). Do đó, nó có thể bổ sung hay thay thế cho số trung bình cộng khi việc tính số trung bình gặp khó khăn. Bên cạnh

Page 57: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 57

đó, Me không chịu ảnh hưởng của lượng biến đột xuất (lượng biến quá nhỏ hay quá lớn).

Dựa vào tính chất toán học đáng chú ý của Me: Tổng các chênh lệch tuyệt đối giữa các lượng biến với Me là trị số nhỏ nhất so với M0, x để ứng dụng trong công tác kỹ thuật và phục vụ công cộng ở nơi thuận lợi, phục vụ được nhiều người nhất.

i ex M min

Cùng với x và M0, Me là một trong những tham số nêu lên đặc trưng phân phối của dãy số.

x x x

f f f

xxx > Me > M0< Me < M0= Me = M0 > Me > M0< Me < M0= Me = M0 Đối xứng

(phân phối chuẩn) Lệch trái

(phân phối âm) Lệch phải

(phân phối dương)

Xác định được M0 trước tiên vì đây là lượng biến tương ứng với tần số lớn nhất.

Me và x nằm ở đâu sẽ quyết định hình dáng của phân phối. Trong phân phối

chuẩn, Me luôn nằm giữa x và M0. Mặt khác, tổ chứa Mốt sẽ là tổ chứa Me.

Vì vậy, trong tính toán chỉ cần tìm tổ chứa M0 là có thể suy ra tổ chứa Me mà

không cần tìm Si.

o x = Me = M0: Dãy số có phân phối chuẩn đối xứng.

o x < Me < M0: Dãy số có phân phối lệch trái, số đơn vị có lượng biến lớn hơn

số trung bình chiếm đa số.

o x > Me > M0: Dãy số có phân phối lệch phải, số đơn vị có lượng biến nhỏ hơn

số trung bình chiếm đa số.

3.2.4.4. Một số phân vị thường dùng

Như trên đã trình bày, trung vị chia dãy số phân phối thành 2 phần bằng nhau: 50%

các đơn vị ở dưới và 50% các đơn vị ở trên. Tuy nhiên, trong nghiên cứu thống kê, tuỳ

theo mục đích nghiên cứu khác nhau, người ta còn có thể chia dãy số phân phối hay

tổng thể thành những phần nhỏ hơn bằng nhau. Các phần này được gọi là các phân vị.

Trong thống kê, người ta thường hay sử dụng tứ phân vị: chia tổng thể thành 4 phần

bằng nhau, ngũ phân vị: chia thành 5 phần bằng nhau, thập phân vị: 10 phần bằng

nhau hay bách phân vị: chia tổng thể thành 100 phần bằng nhau,... trong đó tứ phân vị

là phổ biến nhất.

Với tứ phân vị, người ta chia tập hợp số liệu thành 4 phần bằng nhau. Khi đó, chúng ta sẽ xác định được 3 phân vị Q1, Q2 và Q3. Với tứ phân vị đầu tiên Q1, ta sẽ có 25%

Page 58: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

58 v1.0

số đơn vị có lượng biến từ Q1 trở xuống và 75% số đơn vị có lượng biến từ Q1 trở lên. Tứ phân vị thứ hai Q2 là trung vị của dãy số, chia dãy số thành hai phần 50% bằng nhau. Còn tứ phân vị cuối cùng Q3 chia dãy số thành 75% số đơn vị có lượng biến từ Q3 trở xuống và 25% số đơn vị có lượng biến từ Q3 trở lên.

Ví dụ: Có tài liệu thu thập được về số giờ ngồi máy tính trung bình trong tuần của 20 sinh viên như sau:

25 41 27 32 43

66 35 31 15 5

34 26 32 38 16

30 38 30 20 21

Hãy xác định tứ phân vị cho bộ số liệu trên.

Để xác định tứ phân vị, trước hết chúng ta phải sắp xếp lại số liệu theo thứ tự tăng dần. Sau đó chia số liệu thành 4 phần bằng nhau và tính các phân vị Q1, Q2 và Q3.

Kết quả như sau:

5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66

Nhóm thứ nhất Nhóm thứ hai Nhóm thứ ba Nhóm thứ tư

Tứ phân vị thứ nhất: 1

21 25Q 23,0

2

(giờ)

Tứ phân vị thứ hai: 2

30 31Q 30,5

2

(giờ)

Tứ phân vị thứ ba: 3

35 38Q 36,5

2

(giờ)

Như vậy, có 25% số sinh viên nói trên có số giờ ngồi máy tính trung bình một tuần ít hơn 23,0 giờ, 25% số sinh viên có số giờ ngồi máy tính trong tuần từ 23,0 đến 30,5 giờ, 25% trong khoảng 30,5 đến 36,5 giờ và 25% còn lại có số giờ ngồi máy tính trong tuần lớn hơn 36,5 giờ.

3.3. Các tham số đo độ biến thiên của tiêu thức

Ý nghĩa của các tham số đo độ biến thiên hay độ phân tán của tiêu thức (dispersion):

Giúp đánh giá trình độ đại biểu của số bình quân: nếu độ biến thiên thấp, trình độ đại biểu của số bình quân cao và ngược lại.

Quan sát độ biến thiên của tiêu thức trong 1 dãy số lượng biến cho thấy đặc trưng về phân phối, kết cấu và tính đồng đều của tổng thể.

Độ biến thiên của tiêu thức thường được dùng trong nhiều trường hợp nghiên cứu thống kê: phân tích biến động, mối liên hệ trong điều tra, dự đoán...

Q1 Q2 Q3

Page 59: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 59

Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau:

Sản phẩm/1 công nhân

NSLĐA NSLĐB

40 58

50 59

60 60

70 61

80 62

Khi so sánh Ax và Bx ở 2 tổ, ta thấy Ax = Bx = 60 sản phẩm/1 công nhân. Như vậy,

NSLĐ bình quân của công nhân 2 tổ sản xuất là như nhau nhưng tính đại biểu của Bx

cao hơn vì độ biến thiên trong NSLĐ của 5 công nhân ở tổ sản xuất B ít hơn.

Để đưa ra kết luận đúng đắn cho các hiện tượng, người ta cần so sánh cả độ biến thiên của tiêu thức. Có 5 tham số sau:

3.3.1. Khoảng biến thiên (range)

Khái niệm: Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu.

R = xmax – xmin

Ví dụ: Với số liệu ở trên R1 > R2 nên độ biến thiên (phân tán) về NSLĐ tổ 1 lớn hơn tổ 2, vì vậy tính chất đại diện của số bình quân tổ 1 kém hơn tổ 2.

Ưu điểm: Dễ tính.

Hạn chế: Chỉ tính đến lượng biến đầu và cuối, như vậy sẽ không chính xác nếu có lượng biến đột xuất, làm sai bản chất của hiện tượng.

Để khắc phục nhược điểm trên, người ta sử dụng tham số dưới đây.

3.3.2. Độ lệch tuyệt đối bình quân (mean absolute deviation - MAD)

Khái niệm: Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch tuyệt đối giữa lượng biến và số bình quân cộng của các lượng biến đó.

Công thức:

o Giản đơn: ix x

dn

o Gia quyền: i i

i

x x fd

f

Trong công thức này, người ta phải lấy giá trị tuyệt đối vì ∑(xi – x ) = 0. Độ lệch tuyệt đối bình quân càng lớn, độ biến thiên càng lớn.

Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, do đó nó rất có ý nghĩa khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều.

Hạn chế: Chỉ tính giá trị tuyệt đối của độ lệch giữa các lượng biến với số trung bình các lượng biến đó.

Để khắc phục hạn chế về giá trị tuyệt đối của độ lệch, người ta tính tham số thứ ba.

Page 60: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

60 v1.0

3.3.3. Phương sai (Variance)

Khái niệm: Phương sai là bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.

Công thức:

o Giản đơn: 2

i2x x

n

=

22i ix x

n n

= 22x x

o Gia quyền: 2

i i2

i

x x f

f

=

22i i i i

i i

x f x f

f f

= 22x x

Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch.

Hạn chế: Vì là bình phương các độ lệch nên trị số bị khuếch đại và không có đơn vị tính phù hợp.

Tham số thứ tư được đưa ra để khắc phục nhược điểm của phương sai.

3.3.4. Độ lệch tiêu chuẩn (standard deviation)

Khái niệm: Độ lệch tiêu chuẩn là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.

Công thức: 2

Vì là căn bậc hai của phương sai nên độ lệch tiêu chuẩn đã khắc phục được nhược điểm của phương sai là có đơn vị tính và giảm khuếch đại.

Ưu điểm: Khắc phục được nhược điểm của tất cả các chỉ tiêu trên.

Hạn chế: Khó tính.

Tóm lại: Cả 4 chỉ tiêu trên đều chỉ dùng để so sánh độ biến thiên của các hiện tượng cùng loại hoặc các hiện tượng cùng loại và có số trung bình bằng nhau. Vậy trong trường hợp muốn so sánh độ biến thiên của các hiện tượng khác loại hoặc các hiện tượng cùng loại nhưng có số trung bình khác nhau, người ta sẽ sử dụng tham số nào?

3.3.5. Hệ số biến thiên (coefficient of variation)

Khái niệm: Là số tương đối (lần, %) rút ra từ sự so sánh giữa độ lệch tiêu chuẩn với số bình quân cộng.

Công thức:

Vx

100 (%)

Chính vì biểu hiện bằng số tương đối nên hệ số biến thiên có thể dùng để so sánh độ biến thiên của các hiện tượng khác loại hay các hiện tượng cùng loại nhưng số trung bình không bằng nhau.

Ví dụ: Hai hiện tượng khác loại:

So sánh độ biến thiên của năng suất lao động và tiền lương trong doanh nghiệp A:

Page 61: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 61

NSLĐ: x NSLĐ = 40 (sản phẩm)

NSLĐ = 4 (sản phẩm)

Tiền lương: x TL = 2.000 (nghìn đồng)

TL = 80 (nghìn đồng)

Tính hệ số biến thiên:

NSLDNSLD

NSLD

4V 100 100 10%

40x

TLTL

TL

80V 100 100 4%

2000x

VNSLD > VTL, vậy NSLĐ có độ biến thiên lớn hơn tiền lương, số bình quân về tiền lương có trình độ đại biểu cao hơn số bình quân về NSLĐ.

Ví dụ: Hai hiện tượng cùng loại nhưng số bình quân khác nhau.

Có số liệu về năng suất lao động của hai phân xưởng như sau:

PX1: 1x = 30 (sản phẩm), 1 = 9 (sản phẩm)

PX2: 2x = 40 (sản phẩm), 2 = 10 (sản phẩm)

11

1

9V 100 100 30%

30x

22

2

10V 100 100 25%

40x

V1 > V2 , độ biến thiên của PX1 lớn hơn và NSLĐ của PX2 đồng đều hơn.

Page 62: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

62 v1.0

TÓM LƯỢC CUỐI BÀI

Đối tượng nghiên cứu của thống kê là mặt lượng trong mối liên hệ mật thiết với mặt chất của các hiện tượng kinh tế – xã hội. Mặt lượng của các hiện tượng này lại được thể hiện cụ thể thông qua các mức độ khác nhau. Trong thống kê, người ta thường sử dụng các mức độ: số tuyệt đối, số tương đối, số bình quân, hay các mức độ đo độ biến thiên của tiêu thức. Mỗi loại mức độ trên có ý nghĩa phản ánh, công thức tính và điều kiện vận dụng khác nhau. Do đó, khi vận dụng phải kết hợp phân tích các mức độ đó thì việc phân tích mới sâu sắc, chính xác, nhằm tìm ra đúng bản chất và tính qui luật phát triển của các hiện tượng kinh tế – xã hội.

Page 63: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 63

CÂU HỎI ÔN TẬP

1. Trình bày khái niệm, đặc điểm, tác dụng và các loại số tuyệt đối trong thống kê.

2. Trình bày khái niệm, đặc điểm, tác dụng và các loại số tương đối trong thống kê.

3. Khái niệm, ý nghĩa của số bình quân cộng trong thống kê? Trình bày các loại số bình quân cộng.

4. Mốt là gì? Cách xác định mốt, tác dụng và ưu nhược điểm của mốt?

5. Trung vị là gì? Cách xác định trung vị và tác dụng của trung vị?

6. Trình bày ý nghĩa và nội dung của các mức độ đo độ biến thiên của tiêu thức.

Page 64: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

64 v1.0

BÀI TẬP

1. Một cuộc điều tra về năng suất lao động (đơn vị: sản phẩm) của công nhân tại một phân xưởng cho kết quả như sau:

39 41 38 39 38

41 40 38 37 39

39 41 43 38 40

39 39 43 39 37

38 37 40 43 40

42 40 39 36 43

a) Xây dựng bảng tần số phân bố với các tổ không có khoảng cách tổ.

b) Tính năng suất lao động bình quân của công nhân toàn phân xưởng.

c) Tính Mốt về năng suất lao động của công nhân toàn phân xưởng.

d) Tính trung vị về năng suất lao động của công nhân toàn phân xưởng.

2. Theo số liệu ghi lại được về chỉ số IQ của 112 trẻ em ở California, Mỹ, như sau:

IQ Số trẻ em (Người)

60 – 70 1

70 – 80 5

80 – 90 13

90 – 100 22

100 – 110 28

110 – 120 23

120 – 130 14

130 – 140 3

140 – 150 2

150 – 160 1

a) Tính chỉ số IQ bình quân của 112 trẻ em nói trên.

b) Tính Mốt về chỉ số IQ của 112 trẻ em nói trên.

c) Tính trung vị về chỉ số IQ của 112 trẻ em nói trên.

3. Có kết quả điều tra về tuổi của sinh viên theo học chương trình TOPICA kỳ mùa xuân năm 2009 như sau:

19 17 15 20 23 41 33 21 18 20

15 33 32 29 24 19 18 20 17 22

55 19 22 25 28 30 44 19 20 39

a) Xây dựng bảng tần số phân bố với các tổ 15 – 19, 20 – 24, 25 – 29, 30 – 34, và từ 35 trở lên.

b) Tính Mốt về tuổi của sinh viên.

c) Tính tuổi trung bình của sinh viên từ số liệu ban đầu.

d) So sánh kết quả tính được ở câu b) và c). Trong 2 tham số đó, tham số nào đo xu hướng trung tâm tốt hơn? Hãy giải thích.

Page 65: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 65

4. Có thông tin về độ tuổi của 36 triệu phú ở Mỹ như sau:

31 64 39 66 68 48 69 71 52

68 45 60 54 66 79 38 48 77

53 52 79 75 67 71 42 39 57

47 74 59 64 42 55 61 79 48

a) Xây dựng bảng tần số phân bố với các tổ có khoảng cách tổ bằng nhau.

b) Tính tuổi bình quân của các triệu phú trên theo hai cách:

Từ tài liệu ban đầu.

Từ tài liệu phân tổ.

So sánh hai kết quả trên. Kết quả nào chính xác hơn.

c) Tính trung vị về tuổi của các triệu phú trên.

d) Tính khoảng tứ phân vị về tuổi của các triệu phú trên.

5. Có tài liệu về tốc độ phát triển tiền lương bình quân của công nhân trong một doanh nghiệp như sau (năm trước = 100):

Năm 2002 2003 2004 2005 2006 2007 2008

Tốc độ phát triển (%) 102 105 110 109 110 110 97

a) Tính tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 2004 – 2008.

b) Nếu tốc độ phát triển bình quân về tiền lương bình quân của công nhân của doanh nghiệp trong giai đoạn 1995 – 2000 là 108,7% và 2000 – 2002 là 105%. Hãy tính tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 1995 – 2008.

6. Có tài liệu về lợi nhuận trước thuế của một doanh nghiệp qua các năm như sau:

Năm 2002 2003 2004 2005 2006 2007 2008

Lợi nhuận trước thuế (tỷ đồng)

12,3 13,5 13,8 15,2 16,4 16,9 15,0

a) Tính tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn trên.

b) Nếu tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 1998 – 2000 là 105,6%, 2000 – 2002 là 103,8%. Tính tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 1998 – 2008.

7. Có 3 phân xưởng cùng sản xuất một loại sản phẩm trong 5 giờ. Phân xưởng 1 gồm 8 công nhân, sản xuất 1 sản phẩm hết 5 phút. Phân xưởng 2 gồm 6 công nhân, sản xuất 1 sản phẩm hết 2 phút. Phân xưởng 3 gồm 9 công nhân, sản xuất một sản phẩm hết 3 phút. Tính thời gian hao phí bình quân để sản xuất ra 1 sản phẩm của công nhân 3 phân xưởng trên.

8. Để tính thử thời gian phục vụ 1 khách vào buổi trưa của chuỗi cửa hàng KFC, người ta chọn ra 3 cửa hàng để nghiên cứu. Qua điều tra cho thấy:

Cửa hàng thứ nhất gồm 10 nhân viên, phục vụ bữa trưa trong 3 giờ, bình quân mỗi khách phục vụ mất 5 phút.

Page 66: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

66 v1.0

Cửa hàng thứ hai gồm 12 nhân viên, phục vụ bữa trưa trong 3,5 giờ, bình quân mỗi khách phục vụ mất 6 phút.

Cửa hàng thứ ba gồm 8 nhân viên, phục vụ bữa trưa trong 3 giờ, bình quân mỗi khách phục vụ mất 4 phút.

Tính thời gian phục vụ 1 khách bình quân của 3 cửa hàng nói trên.

9. Có tài liệu về một cửa hàng trong quí I và II, năm 2008 như sau:

Quí I Quí II

Mặt hàng Doanh thu (nghìn đồng)

Giá bán đơn vị (nghìn đồng)

Lượng hàng tiêu thụ (sản phẩm)

Giá bán đơn vị (nghìn đồng)

A 3.850 35 135 40

B 7.200 50 180 45

C 6.300 70 120 68

a) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quí I.

b) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quí II.

c) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong cả hai quí.

10. Có tài liệu về tình hình thực hiện kế hoạch về giá trị sản xuất tại một doanh nghiệp trong quí I và II, năm 2008 như sau:

Quí I Quí II Phân

xưởng Giá trị sản xuất (triệu đồng)

% hoàn thành kế hoạch về GTSX

Kế hoạch về GTSX (triệu đồng)

% hoàn thành kế hoạch về GTSX

A 500 102 520 108

B 480 97 500 105

C 430 115 500 110

a) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quí I.

b) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quí II.

c) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong cả hai quí.

d) Tính tỷ trọng giá trị sản xuất của từng phân xưởng trong quí I, quí II, cả hai quí.

11. Có kết quả điều tra thu nhập của lao động trong một doanh nghiệp năm 2008 như sau:

Thu nhập (triệu đồng) Số lao động (người)

4,7 – 5,2 4

5,2 – 5,7 9

5,7 – 6,2 13

6,2 – 6,7 42

6,7 – 7,2 39

7,2 – 7,7 20

7,7 – 8,2 9

a) Tính thu nhập bình quân của lao động trong doanh nghiệp.

b) Tính khoảng biến thiên về thu nhập của lao động trong doanh nghiệp.

Page 67: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

v1.0 67

c) Tính độ lệch tuyệt đối bình quân về thu nhập của lao động trong doanh nghiệp.

d) Tính phương sai về thu nhập của lao động trong doanh nghiệp.

e) Tính độ lệch tiêu chuẩn về thu nhập của lao động trong doanh nghiệp.

f) Tính hệ số biến thiên về thu nhập của lao động trong doanh nghiệp.

12. Có tài liệu về số lượng séc chi trả mỗi ngày ở 5 chi nhánh của một ngân hàng trong tháng trước như sau:

Số lượng séc Tần số

< 200 10

200 – 400 13

400 – 600 17

600 – 800 42

800 – 1.000 18

Một nhà quản lý ngân hàng cho rằng, nếu độ lệch tiêu chuẩn về séc chi trả mà lớn hơn 200 séc mỗi ngày thì sẽ gây ra những vấn đề về nhân lực và tổ chức ở các chi nhánh do sự bất công bằng về khối lượng công việc. Vậy đây có phải là điều mà nhà quản lý ngân hàng lo ngại hay không?

13. Khi nghiên cứu về thu nhập bình quân và chi tiêu bình quân của các hộ gia đình trong một địa phương năm 2008, người ta thu được kết quả sau:

Số bình quân (nghìn đồng) Phương sai

Thu nhập 3.500 8.540

Chi tiêu 3.000 4.100

a) Hãy xác định trong hai chỉ tiêu trên, chỉ tiêu nào có độ biến thiên lớn hơn.

b) Nếu biết thêm trung vị về thu nhập là 3.200 nghìn đồng. Hãy cho biết số hộ gia đình có thu nhập lớn hơn thu nhập bình quân sẽ chiếm đa số hay thiểu số?

14. Theo điều tra ngẫu nhiên 200 người tại một bệnh viện về số ngày nằm viện, ta có kết quả sau:

Số ngày nằm viện (ngày) Số người (người)

1 – 3 24

4 – 6 83

7 – 9 52

10 – 12 22

13 – 15 11

16 – 18 5

19 – 21 2

22 – 24 1

a) Tính số ngày nằm viện trung bình.

b) Tính độ lệch tiêu chuẩn về số ngày nằm viện của 200 người trên.

c) Tính hệ số biến thiên về số ngày nằm viện.

Page 68: Nguyen ly thong ke

Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội

68 v1.0

15. Có kết quả điều tra về lượng tiêu dùng cá hàng năm (đơn vị: kg) của hai nhóm người Nga và Đức sống ở Mỹ như sau:

Người Đức Người Nga

17 17 16 21 12

1 9 11 5 23

15 6 19 19 22

10 13 16 23 12

14 11 18 7 17

a) Tính lượng tiêu dùng cá trung bình của mỗi nhóm người.

b) Tính trung vị về lượng tiêu dùng cá của mỗi nhóm người.

c) Tính mốt về lượng tiêu dùng cá của mỗi nhóm người.

d) So sánh độ phân tán về lượng tiêu dùng cá của hai nhóm người trên.

Page 69: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 69

Nội dung Mục tiêu

Nhiệm vụ của phân tích hồi quy và tương quan.

Một số mô hình hồi quy và cách xác định các tham số của mô hình.

Cung cấp phương pháp phân tích thống kê nghiên cứu mối liên hệ nhân quả giữa các hiện tượng kinh tế – xã hội.

Thời lượng học Hướng dẫn học

7 tiết Đọc bài giảng và thảo luận.

Trả lời câu hỏi ôn tập, câu hỏi trắc nghiệm và làm bài tập.

BÀI 4: PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN

Page 70: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

70 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Phân tích thị trường xe máy

Giả sử bạn đang nghiên cứu về vấn đề mua bán xe máy Honda Wave đã qua sử dụng. Bạn nhận thấy giá bán của chiếc xe do rất nhiều nhân tố quyết định. Đó có thể là số năm sử dụng xe, màu sắc, đối tượng mua, đối tượng bán, thậm chí cả nhu cầu mua, nhu cầu bán cũng có ảnh hưởng đến giá cả của nó... Bạn thực hiện một điều tra thống kê trên 11 chiếc xe để tìm hiểu mối liên hệ giữa các nhân tố ảnh hưởng và giá bán của nó. Số liệu cho thấy, dường như đúng là có mối liên hệ giữa các nhân tố nêu trên với giá của chiếc xe. Nhưng bạn lại không biết biểu diễn mối liên hệ đó như thế nào.

Câu hỏi

Bài học này sẽ giúp bạn cách thức xây dựng mối liên hệ phụ thuộc qua lại giữa các hiện tượng kinh tế – xã hội, đồng thời cũng sẽ hướng dẫn bạn cách đánh giá mức độ chặt chẽ của mối liên

hệ đó như thế nào?

Page 71: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 71

4.1. Nhiệm vụ của phân tích hồi quy và tương quan

4.1.1. Mối liên hệ giữa các hiện tượng kinh tế xã hội

Các hiện tượng kinh tế – xã hội tồn tại trong mối liên hệ phụ thuộc lẫn nhau. Các mối liên hệ này có thể diễn ra theo thời gian hay không gian nhất định. Các mối liên hệ diễn ra theo thời gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các hiện tượng khi chúng ở các giai đoạn và quá trình của sự phát triển. Các mối liên hệ diễn ra theo không gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các hiện tượng khi chúng ở cùng một thời gian. Thậm chí ngay trong cùng một hiện tượng nghiên cứu bao gồm nhiều tiêu thức khác nhau, thì những tiêu thức này cũng có mối liên hệ qua lại nhất định. Tuỳ theo mức độ chặt chẽ, mà người ta chia mối liên hệ thành các loại dưới đây.

4.1.1.1. Liên hệ hàm số

Khái niệm: Liên hệ hàm số là mối liên hệ hoàn toàn chặt chẽ. Sự thay đổi của hiện tượng này có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ lệ xác định.

Liên hệ hàm số được viết dưới dạng: y = f(x), có nghĩa là cứ mỗi giá trị của x thì theo một hàm nào đó có một giá trị của y tương ứng.

Mối liên hệ này thường có trong tự nhiên. Ví dụ trong vật lý: S = v t...

Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được biểu hiện trên từng đơn vị cá biệt.

4.1.1.2. Liên hệ tương quan

Khái niệm: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ. Sự thay đổi của hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng không có ảnh hưởng hoàn toàn quyết định.

Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội.

Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng số lớn (là tổng thể).

Ví dụ: Mối liên hệ giữa tuổi nghề và NSLĐ. Tuổi nghề có tác động đến NSLĐ nhưng NSLĐ không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh hưởng của các nhân tố khác. Mặt khác, nếu nghiên cứu riêng lẻ từng đơn vị cá biệt, có những đơn vị, tuổi nghề hoàn toàn không ảnh hưởng tới NSLĐ. Vì vậy, để có thể nêu lên được mối liên hệ tương quan cần phải nghiên cứu hiện tượng số lớn.

4.1.2. Nhiệm vụ của phân tích hồi quy và tương quan

Phương pháp phân tích hồi quy và tương quan giải quyết hai nhiệm vụ chủ yếu sau:

4.1.2.1. Xác định mô hình hồi quy phản ánh mối liên hệ

Nhiệm vụ đầu tiên của phân tích hồi quy tương quan là xây dựng mô hình (hay phương trình) hồi quy và xác định tính chất (thuận – nghịch) cũng như hình thức của mối liên hệ (loại mô hình).

Page 72: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

72 v1.0

Để giải quyết nhiệm vụ này, cần phải thực hiện 4 bước sau:

Bước 1: Giải thích sự tồn tại thực tế và bản chất của mối liên hệ bằng phân tích lý luận. Tuỳ theo mục đích nghiên cứu cụ thể mà xác định trong mối liên hệ đó, đâu là nguyên nhân, đâu là kết quả.

Ví dụ: Tuổi nghề có ảnh hưởng tới NSLĐ. Như vậy, tuổi nghề là nguyên nhân có ảnh hưởng đến NSLĐ.

Nhưng nếu xét trong mối liên hệ với khối lượng sản phẩm sản xuất và giá thành đơn vị, ta thấy: NSLĐ tăng dẫn tới khối lượng sản phẩm sản xuất tăng. Khi đó, NSLĐ lại là nguyên nhân, khối lượng sản phẩm là kết quả. Khi khối lượng sản phẩm sản xuất tăng thì giá thành giảm. Khối lượng sản phẩm sản xuất lại đóng vai trò là nguyên nhân, giá thành là kết quả.

Ví dụ: Mối liên hệ giữa chi phí quảng cáo và doanh thu. Khi nghiên cứu các nhân tố tác động đến doanh thu thì chi phí quảng cáo là một nguyên nhân. Nhưng khi nghiên cứu nhân tố tác động đến chi phí quảng cáo thì doanh thu cũng lại là một nguyên nhân. Trong trường hợp này phải chú ý đến mục đích nghiên cứu là gì để xác định đâu là tiêu thức nguyên nhân, đâu là tiêu thức kết quả.

Trong mối liên hệ này, có thể có nhiều nguyên nhân nhưng chỉ có một kết quả.

Bước 2: Thăm dò mối liên hệ bằng các phương pháp thống kê: phương pháp đồ thị, phân tổ, số bình quân, phương pháp quan sát 2 dãy số song song…

Bước 3: Lập phương trình hồi quy biểu hiện mối liên hệ.

Ví dụ: Các phương trình y = a + bx; y = a + bx + cx2…

Bước 4: Tính toán các tham số và giải thích ý nghĩa của chúng.

4.1.2.2. Đánh giá mức độ chặt chẽ của mối liên hệ tương quan

Sau khi đã xây dựng được phương trình hồi quy biểu diễn mối liên hệ giữa các hiện tượng kinh tế – xã hội, nhiệm vụ thứ hai của phân tích hồi quy tương quan là đánh giá mức độ chặt chẽ của mối liên hệ tương quan và sự phù hợp của mô hình thông qua hệ số tương quan (tuyến tính) và tỷ số tương quan (phi tuyến tính).

4.1.3. Ý nghĩa của phân tích hồi quy và tương quan

Phân tích hồi quy và tương quan là phương pháp thường được sử dụng để nghiên cứu mối liên hệ tương quan giữa các hiện tượng kinh tế – xã hội. Bên cạnh đó, nó còn được sử dụng nhiều trong nghiên cứu thống kê, như phân tích dãy số thời gian, dự đoán thống kê...

Trong phần tiếp theo, bài giảng sẽ đi vào trình bày cách thức xây dựng và phân tích một mô hình hồi quy thể hiện mối liên hệ giữa một tiêu thức nguyên nhân và một tiêu thức kết quả.

4.2. Hồi quy và tương quan giữa hai tiêu thức số lượng

Trước hết là dạng mô hình đơn giản nhất, mô hình hồi quy tuyến tính.

Page 73: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 73

4.2.1. Mô hình hồi quy tuyến tính giữa hai tiêu thức số lượng

4.2.1.1. Mô hình hồi quy

Trước khi đi vào xây dựng mô hình hồi quy, chúng ta hãy xem xét một số khái niệm có liên quan.

Một số khái niệm liên quan

o Đường hồi quy thực nghiệm: là đường được hình thành bởi các tài liệu thực tế.

o Đường hồi quy lý thuyết: là đường điều chỉnh bù trừ các chênh lệch ngẫu nhiên vạch ra xu hướng cơ bản của hiện tượng.

o Mô hình hồi quy là mô hình xác định vị trí của đường hồi quy lý thuyết sao cho mô tả gần đúng nhất mối liên hệ thực tế.

Xây dựng mô hình hồi quy tuyến tính đơn

o Mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng có dạng:

xy = b0 + b1x

Trong đó: x: Trị số của tiêu thức gây ảnh hưởng (nguyên nhân) (biến độc lập).

xy : Trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) (biến phụ

thuộc) theo quan hệ với x. b0: Hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết,

nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài x tới sự biến động của y.

b1: Hệ số hồi quy (hệ số góc, độ dốc), phản ánh ảnh hưởng trực tiếp của tiêu thức nguyên nhân x đến tiêu thức kết quả y. Mỗi khi x tăng lên 1 đơn vị thì y sẽ thay đổi trung bình b1 đơn vị. b1 nói lên chiều hướng của mối liên hệ: b1 > 0: Mối liên hệ thuận; b1 < 0: Mối liên hệ nghịch.

o Cách xác định tham số: b0, b1 phải được xác định sao cho đường hồi quy lý thuyết mô tả gần đúng nhất mối liên hệ thực tế. Trên hình vẽ, khoảng cách từ điểm thực tế đến điểm thuộc đường hồi quy lý thuyết nhỏ nhất sẽ là tốt nhất. Sử dụng phương pháp bình phương nhỏ nhất (OLS – Ordinary Least Square) với nội dung: tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biến phụ thuộc (tiêu thức kết quả) là nhỏ nhất.

Đường hồi quy thực nghiệm

Đường hồi quy lý thuyết

Page 74: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

74 v1.0

2i xˆS (y y ) min

Hay 2i 0 1S (y b b x) min

Để thỏa mãn điều kiện trên, cần tính đạo hàm riêng theo 2 tham số cần tìm. Từ đó, b0 và b1 phải thỏa mãn hệ phương trình:

0 1

20 1

y nb b x

xy b x b x

Hệ phương trình chuẩn

Từ hệ phương trình trên, sau khi biến đổi, b0 và b1 có thể được tính đơn giản hơn theo công thức:

1 2x

xy xyb

b0 = y – b1 x

Trong đó: i xx

n iy

yn

xy

xyn

222 2 2x

x xx (x)

n n

Chú ý:

Nên sử dụng công thức rút gọn ở trên để tính b0 và b1 chứ không nên giải hệ phương trình chuẩn.

Ví dụ: Có tài liệu về 11 xe máy Honda Wave đã qua sử dụng như sau:

Stt Số năm sử dụng

(năm) x Giá bán

(triệu đồng) y xy x2 y2

1 5 8,5 42,5 25,0 72,25

2 4 10,3 41,2 16,0 106,09

3 6 7,0 42,0 36,0 49,00

4 5 8,2 41,0 25,0 67,24

5 5 8,9 44,5 25,0 79,21

6 5 9,8 49,0 25,0 96,04

7 6 6,6 39,6 36,0 43,56

8 6 9,5 57,0 36,0 90,25

9 2 16,9 33,8 4,0 285,61

10 7 7,0 49,0 49,0 49,00

11 7 4,8 33,6 49,0 23,04

Tổng 58 97,5 473,2 326,0 961,29

Trung bình 5,273 8,864 43,018 29,636 87,390

Yêu cầu: Lập mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm sử dụng xe và giá bán của xe.

Hướng dẫn:

Ở đây chúng ta đang nghiên cứu các nhân tố ảnh hưởng đến giá bán xe máy nên số năm sử dụng sẽ là tiêu thức nguyên nhân x, còn giá bán sẽ là tiêu thức kết quả y.

Page 75: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 75

Mô hình hồi quy có dạng: xy = b0 + b1x

Xác định các tham số:

2 2 2 2x x (x) 29,636 5,273 1,831

1 2x

xy xyb

=

43,018 5,273 8,8642,03

1,831

< 0 mối liên hệ nghịch

b0 = y – b1 x = 8,864 – (–2,03 5,273) = 19,57

Vậy phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm sử dụng và giá bán có dạng:

xy = 19,57 – 2,03x

Trong đó:

b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số năm sử dụng tới sự thay đổi của giá bán.

b1 = – 2,03 nêu lên ảnh hưởng trực tiếp của số năm sử dụng tới sự thay đổi của giá bán. Khi số năm sử dụng tăng thêm 1 năm thì giá bán của chiếc xe sẽ giảm đi trung bình 2,03 triệu đồng.

Cách kiểm tra kết quả:

x tăng từ 2 đến 7 năm làm y giảm từ 16,9 xuống còn 4,8 triệu đồng; vậy x tăng làm y giảm, ta có mối liên hệ nghịch, tức b1 < 0.

Thay bất kỳ giá trị nào của x vào phương trình hồi quy phải ra giá trị xy ≈ yx.

Lưu ý:

Từ phương trình hồi quy trên, nếu ta có một giá trị của x, thay vào phương trình ta sẽ tính được giá trị của y tương ứng và ngược lại.

Trong trường hợp trên, khi x = 0, xy = b0 = 19,57 (triệu đồng), đây chính là

mức giá của 1 chiếc xe Honda Wave mới.

Sau khi đã xây dựng xong mô hình hồi quy phản ánh mối liên hệ giữa các hiện tượng kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy và tương quan là phải đánh giá được trình độ chặt chẽ của mối liên hệ đó cũng như sự phù hợp của mô hình đã có.

4.2.1.2. Hệ số tương quan

Khái niệm: Hệ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ tương quan tuyến tính đơn.

Tác dụng:

o Xác định cường độ của mối liên hệ từ đó chọn ra nguyên nhân chủ yếu hoặc thứ yếu đối với hiện tượng nghiên cứu.

o Xác định chiều hướng cụ thể của mối liên hệ (thuận – nghịch).

o Hệ số tương quan còn dùng trong nhiều trường hợp dự đoán thống kê và tính sai số của dự đoán.

Công thức tính:

x1

x y y

xy xyr b

Page 76: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

76 v1.0

Như vậy, dấu của hệ số tương quan r phụ thuộc vào dấu của hệ số b1 vì phương sai luôn mang dấu dương.

Các tính chất của hệ số tương quan: Miền xác định: –1 ≤ r ≤ 1.

o r > 0: Mối liên hệ tương quan tuyến tính thuận.

o r < 0: Mối liên hệ tương quan tuyến tính nghịch.

o r = ± 1: Mối liên hệ hàm số hoàn toàn chặt chẽ.

o r = 0: Không có mối liên hệ tương quan tuyến tính giữa x và y.

o r càng gần 1: Mối liên hệ càng chặt chẽ (cường độ mối liên hệ).

o r 0,9: Mối liên hệ rất chặt chẽ.

o 0,7 r 0,9: Mối liên hệ tương đối chặt chẽ.

o 0,5 r 0,7: Mối liên hệ bình thường (trong dự đoán thường không sử dụng r

này đối với tiêu thức số lượng nhưng với tiêu thức thuộc tính thì vẫn sử dụng).

o r < 0,5 : Mối liên hệ hết sức lỏng lẻo.

Vận dụng vào ví dụ trên, ta có: 22 2 2

y y y y 87,390 8,864 2,97

r = (–2,03) 97,2

353,1 = – 0,925

Kết luận: Mối liên hệ giữa số năm sử dụng và giá bán xe Honda Wave cũ là mối liên hệ tương quan tuyến tính nghịch và rất chặt chẽ.

4.2.1.3. Hệ số xác định

Khái niệm: Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ lệ % thay đổi của y được giải thích bởi mô hình.

Ở ví dụ trên, ta có: r2 = (– 0,925)2 = 0,8556.

Như vậy, 85,56% sự thay đổi của giá bán xe máy Honda Wave cũ được giải thích bởi mô hình đã nói ở trên trong mối quan hệ với số năm sử dụng. Điều đó nói lên rằng, số năm sử dụng là hoàn toàn hữu ích khi dự đoán mức giá bán của một chiếc xe cũ.

4.2.1.4. Kiểm định các tham số của phương trình hồi quy tuyến tính đơn

Trong mối liên hệ tương quan giữa x và y, cứ mỗi giá trị của x ta có thể thu được nhiều giá trị của y. Khi đó, chúng ta phải có một số giả định sau:

o Đường hồi quy tổng thể chung: với phương trình tuyến tính xy = 0 + 1x, thì

mỗi giá trị của x sẽ có nhiều giá trị tương ứng của y, khi đó số bình quân của các giá trị này sẽ nằm trên một đường thẳng. Đường thẳng đó gọi là đường hồi quy tổng thể chung và phương trình của nó là phương trình hồi quy tổng thể chung.

o Độ lệch tiêu chuẩn: độ lệch tiêu chuẩn của tổng thể chung gồm các giá trị y tương ứng với một giá trị cụ thể của x là như nhau, bất kể x là bao nhiêu.

o Phân phối chuẩn: với một giá trị của x, tổng thể chung gồm các giá trị y tương ứng có phân phối chuẩn.

Page 77: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 77

Nói cách khác, các giả định trên cho rằng, nếu có các tham số không đổi là 0, 1 và thì với mỗi giá trị của x, tổng thể chung gồm các giá trị của y tương ứng sẽ

có phân phối chuẩn với số bình quân là 0 + 1x và độ lệch tiêu chuẩn .

Kiểm định hệ số hồi quy của phương trình tuyến tính đơn: Bài toán đặt ra như sau:

Giả sử, phương trình hồi quy tuyến tính đơn xy = 0+ 1x, biểu diễn mối liên hệ

phụ thuộc giữa tiêu thức nguyên nhân x và tiêu thức kết quả y. Từ phương trình đó, chúng ta cho rằng có thể dùng x để dự đoán giá trị của y. Nhưng có thật sự là như vậy hay không?

Chúng ta đã biết, trong mô hình hồi quy, hệ số hồi quy thể hiện mối liên hệ giữa x và y, nó cho biết ảnh hưởng trực tiếp của nguyên nhân x đến kết quả y. Chính vì vậy, để trả lời câu hỏi trên, người ta thực hiện kiểm định hệ số hồi quy của phương trình tuyến tính đơn.

Trình tự thực hiện kiểm định như sau:

o Bước 1: Phát biểu giả thiết không và giả thiết đối của nó.

Giả thiết không là: H0: 1 = 0 (x không có mối liên hệ với y)

Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa x và y)

o Bước 2: Xác định mức ý nghĩa α (với 1 – α là hệ số tin cậy).

o Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát.

Trên thực tế, các giá trị 0, 1 và là không biết nhưng chúng ta có thể ước lượng được qua một mẫu cụ thể.

Giả sử rằng với một mẫu cụ thể, chúng ta xác định được phương trình hồi quy mẫu với hệ số hồi quy là b1, b1 có phân phối chuẩn với số bình quân

1b 1 và độ lệch

tiêu chuẩn 1b 2

i

S(x x)

. Khi đó, biến ngẫu nhiên chuẩn hoá z cũng có phân

phối chuẩn.

1

1 1

b

bz

S

Nhưng trong phương trình trên, chúng ta chưa biết , nên có thể dùng sai số tiêu

chuẩn 2

i xe

ˆ(y y )S

n 2

của mẫu để thay thế. Khi đó, biến ngẫu nhiên kết quả

có phân phối t-student với bậc tự do df = n – 2.

1 1

e

2i

bt

S

(x x)

Với giả thiết không H0: 1 = 0, tiêu chuẩn kiểm định là:

1

e

2i

bt

S

(x x)

Page 78: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

78 v1.0

o Bước 4: Xác định miền bác bỏ và kết luận có bác bỏ giả thiết không hay không.

Giá trị tới hạn là tα/2, với bậc tự do là n – 2. Tra bảng t để xác định giá trị tới hạn đó.

Nếu giá trị tuyệt đối của t tính được mà lớn hơn giá trị tới hạn t tra bảng thì bác bỏ giả thiết H0. Ngược lại, thì chưa có cơ sở để bác bỏ giả thiết H0.

Ví dụ:

Với số liệu ở ví dụ trên, giả sử có cơ sở cho rằng số năm sử dụng không có ảnh hưởng đến mức giá bán của chiếc xe Honda Wave cũ. Khi đó, ta sẽ thực hiện kiểm định giả thiết sau:

Giả thiết không là: H0: 1 = 0 (số năm sử dụng không có mối liên hệ với mức giá bán).

Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa số năm sử dụng và mức giá bán).

Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa = 0,05.

Giá trị tới hạn là tα/2 = t0,025, với bậc tự do là n – 2 = 11 – 2 = 9.

Tra bảng ta tính được giá trị tới hạn ± t0,025 = 2,262.

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

1

e

2i

b 2,03t 7,25

S 1,2577

20,182(x x)

Trong đó:

Stt Số năm sử dụng

(năm) x Giá bán

(triệu đồng) y ˆxy 2

i(x - x) ˆ 2i x(y -y )

1 5 8,5 9,42 0,075 0,846

2 4 10,3 11,45 1,621 1,323

3 6 7,0 7,39 0,529 0,152

4 5 8,2 9,42 0,075 1,488

5 5 8,9 9,42 0,075 0,270

6 5 9,8 9,42 0,075 0,144

7 6 6,6 7,39 0,529 0,624

8 6 9,5 7,39 0,529 4,452

9 2 16,9 15,51 10,713 1,932

10 7 7,0 5,36 2,983 2,690

11 7 4,8 5,36 2,983 0,314

Tổng 58 97,5 20,182 14,236

Trung bình 5,273 8,864

2i x

e

ˆ(y y ) 14, 236S 1, 2577

n 2 11 2

Vậy ta có t > ± t0,025, bác bỏ giả thiết H0.

Kết luận: Với mẫu đã cho, ở mức ý nghĩa 5%, có thể kết luận rằng: số năm sử dụng xe máy Honda Wave có ảnh hưởng tới giá bán của chiếc xe đó.

Page 79: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 79

Kiểm định hệ số tương quan của phương trình tuyến tính đơn

Tương tự với bài toán trên, giả sử với hai biến x và y, chúng ta nhận thấy chúng có mối liên hệ tuyến tính với nhau. Tuy nhiên, có cơ sở để giả định rằng không có mối liên hệ tương quan tuyến tính đó trong tổng thể chung.

Khi đó chúng ta thực hiện kiểm định hệ số tương quan tuyến tính của cả tổng thể

chung . Giả thiết cần kiểm định: = 0 (không có mối liên hệ tương quan tuyến

tính giữa x và y).

Để kiểm định giả thiết này, lấy mẫu n từ tổng thể chung, khi đó xác định được hệ số tương quan mẫu r.

Tiêu chuẩn kiểm định được chọn là thống kê:

2

rt

1 rn 2

có phân phối t – student với bậc tự do n – 2.

Với mức ý nghĩa α cho trước, tuỳ thuộc vào dạng của giả thiết đối mà miền bác bỏ được xây dựng như sau:

H0: = 0 nếu t > tα, bác bỏ giả thiết H0 (kiểm định phải)

H1: > 0

H0: = 0 nếu t > tα, bác bỏ giả thiết H0 (kiểm định trái)

H1: < 0

H0: = 0 nếu t > tα/2, bác bỏ giả thiết H0 (kiểm định hai phía)

H1: ≠ 0

Ví dụ: Với số liệu ở ví dụ trên, có cơ sở cho rằng giữa số năm sử dụng và giá bán xe Honda Wave cũ không có mối liên hệ tương quan tuyến tính với nhau. Với là hệ số tương quan tuyến tính của tổng thể chung, ta thực hiện kiểm định giả

thiết sau:

H0: = 0 (số năm sử dụng và giá bán không có mối liên hệ tuyến tính)

H1: < 0 (số năm sử dụng và giá bán có mối liên hệ tương quan tuyến tính nghịch)

Với mức ý nghĩa α = 0,05, giá trị tới hạn t = 1,833 khi bậc tự do n – 2 = 9.

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

2 2

r 0,925t 7,303

1 r 1 ( 0,925)n 2 11 2

Ta thấy t > tα = 1,833, bác bỏ giả thiết H0.

Với mẫu đã cho, ở mức ý nghĩa 5%, có thể kết luận rằng số năm sử dụng xe và giá bán của chiếc xe Honda Wave có mối liên hệ tương quan tuyến tính với nhau, và đây là mối liên hệ nghịch.

Tuy nhiên, trên thực tế, không phải mối liên hệ nào cũng là mối liên hệ tương quan tuyến tính. Vì vậy, chúng ta nghiên cứu trường hợp tiếp theo (mô hình hồi quy phi tuyến tính), mối liên hệ này thường gặp nhiều hơn trong thực tế.

Page 80: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

80 v1.0

4.2.2. Mô hình hồi quy phi tuyến giữa hai tiêu thức số lượng

4.2.2.1. Một số dạng mô hình hồi quy phi tuyến thường gặp

Phương trình parabol (bậc 2)

o Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu thức kết quả biến động với 1 lượng không đều nhau (nhanh hơn hoặc chậm hơn).

Ví dụ: Chi phí quảng cáo và doanh thu.

o Mô hình hồi quy: 2

x 0 1 2y b b x b x

b0, b1, b2 là các tham số của mô hình hồi quy, được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:

20 1 2

2 30 1 2

22 3 40 1 2

y b n b x b x

xy b x b x b x

x y b x b x b x

Phương trình hypebol

o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ không đều nhau.

o Mô hình hồi quy:

1x 0

by b

x

b0, b1 là tham số của mô hình hồi quy, được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:

0 1

0 1 2

1y b n b

x1 1 1

y b bx x x

Page 81: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 81

Phương trình hàm mũ

o Vận dụng khi trị số của tiêu thức kết quả thay đổi theo cấp số nhân.

o Mô hình hồi quy: x

x 0 1y b b

hay: lny = lnb0 + x lnb1

lnb0, lnb1 phải thỏa mãn hệ phương trình:

0 1

20 1

ln y n ln b ln b x

x ln y ln b x ln b x

4.2.2.2. Tỷ số tương quan

Khái niệm: Tỷ số tương quan là chỉ tiêu đánh giá trình độ chặt chẽ của mối liên hệ tương quan phi tuyến.

Công thức:

2

i x

2

i

ˆy y1

y y

Tính chất: o Tỷ số tương quan nằm trong khoảng [0,1].

o η = 0: Không có mối liên hệ tương quan phi tuyến.

o η = 1: Mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.

o η càng gần 1: Mối liên hệ càng chặt chẽ.

Nhận xét

η luôn > 0 do đó tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên hệ chứ không nói được chiều hướng của mối liên hệ.

η có thể dùng cho cả phi tuyến và tuyến tính (khi r 0).

Page 82: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

82 v1.0

TÓM LƯỢC CUỐI BÀI

Các hiện tượng kinh tế – xã hội luôn tồn tại trong một mối liên hệ ràng buộc lẫn nhau. Tuỳ theo mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và liên hệ tương quan.

Phân tích hồi quy và tương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc với hai nhiệm vụ chủ yếu: xây dựng phương trình hồi quy biểu diễn mối liên hệ và đánh giá mức độ chặt chẽ của mối liên hệ.

Với mối liên hệ đơn giản nhất giữa hai tiêu thức số lượng, tuỳ theo việc thăm dò dạng của mô hình hồi quy mà ta có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ số của mô hình hồi quy được xác định theo phương pháp bình phương nhỏ nhất. Hệ số tương quan và tỷ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mối liên hệ tương quan giữa hai tiêu thức số lượng.

Page 83: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 83

CÂU HỎI ÔN TẬP

1. Thế nào là liên hệ hàm số và liên hệ tương quan?

2. Nêu nhiệm vụ của phân tích hồi quy và tương quan.

3. Nêu ý nghĩa của hệ số tự do và hệ số hồi quy trong mô hình hồi quy tuyến tính giữa hai tiêu thức số lượng.

4. Trình bày tác dụng và tính chất của hệ số tương quan.

5. Trình bày tác dụng và tính chất của tỷ số tương quan.

Page 84: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

84 v1.0

BÀI TẬP

1. Có tài liệu về chi tiêu cho nghiên cứu và phát triển (R&D) và lợi nhuận thu được hàng năm của một doanh nghiệp như sau:

Năm Chi cho R&D (tỷ đồng) Lợi nhuận hàng năm (tỷ đồng)

2003 2 20

2004 3 25

2005 5 34

2006 4 30

2007 11 40

2008 5 31

a) Hãy xác định trong hai chỉ tiêu trên, đâu là tiêu thức nguyên nhân, đâu là tiêu thức kết quả. Giải thích.

b) Trình bày bằng đồ thị mối liên hệ giữa chi cho R&D và lợi nhuận hàng năm của doanh

nghiệp trên và cho nhận xét.

c) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa chi cho R&D

và lợi nhuận hàng năm của doanh nghiệp trên. Giải thích ý nghĩa của các tham số.

d) Đánh giá trình độ chặt chẽ của mối liên hệ.

2. Một nhà kinh tế đang quan tâm đến mối quan hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm hàng năm của các hộ gia đình ở nông thôn nước ta. Để nghiên cứu ông ta tiến hành hỏi ngẫu nhiên 8 hộ gia đình có cùng quy mô hộ (cha, mẹ và 2 con) và có mức thu nhập trung bình. Kết quả như sau:

Thu nhập khả dụng

(triệu đồng)

Chi cho lương thực thực phẩm (triệu đồng)

30 5,5

36 6,0

27 4,2

20 4,0

16 3,7

24 2,6

19 3,9

25 4,3

a) Vẽ đồ thị biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm của các hộ trên.

b) Xác định phương trình hồi quy biểu diễn mỗi liên hệ đó. Giải thích ý nghĩa của các tham số.

c) Sử dụng phương trình hồi quy để dự đoán chi cho lương thực thực phẩm hàng năm của hộ

gia đình có mức thu nhập khả dụng là 25 triệu đồng.

Page 85: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 85

3. Có kết quả điều tra một mẫu gồm 8 sinh viên về thời gian tự học trong hai tuần và điểm kiểm tra môn học đó sau hai tuần như sau:

Thời gian tự học (giờ) Điểm kiểm tra

10 9,2

15 8,1

12 8,4

20 7,4

8 8,5

16 8,0

14 8,4

22 8,0

a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa thời gian tự học và điểm kiểm tra của các sinh viên trong mẫu nói trên. Giải thích ý nghĩa của các tham số.

b) Đánh giá trình độ chặt chẽ của mối liên hệ trên.

c) Hãy cho biết phương trình vừa xây dựng được có phù hợp để giải thích mối liên hệ giữa hai biến trên không?

4. Có tài liệu về chiều cao và cân nặng của 11 phụ nữ trong độ tuổi 18 – 24 được lựa chọn ngẫu nhiêu như sau:

Cân nặng (kg) Chiều cao (cm)

65 175

67 133

71 185

71 163

66 126

75 198

67 153

70 163

71 159

69 151

69 155

a) Khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào.

b) Đánh giá trình độ chặt chẽ giữa cân nặng và chiều cao của nhóm người trên.

5. Có số liệu về giá trị sản xuất và lượng nhiên liệu tiêu thụ ở các phân xưởng của một nhà máy như sau:

Phân xưởng Giá trị sản xuất

(triệu đồng) Nhiên liệu tiêu thụ

(triệu đồng)

A 520 23

B 595 20

C 945 25

D 640 19

E 500 10

G 720 18

Page 86: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

86 v1.0

a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn ảnh hưởng của giá trị sản xuất tới lượng nhiên liệu tiêu thụ. Giải thích ý nghĩa các tham số.

b) Liệu có đầy đủ bằng chứng để kết luận rằng hệ số hồi quy trong phương trình nói trên là khác 0 và vì vậy có thể sử dụng giá trị sản xuất để dự đoán lượng nhiêu liệu tiêu thụ hay không? Hãy thực hiện kiểm định giả thiết cần thiết với mức ý nghĩa 5%.

6. Công ty Coca Cola đang nghiên cứu ảnh hưởng của chiến dịch quảng cáo gần nhất. Họ tiến hành phỏng vấn ngẫu nhiên 10 người để biết xem những người này đã đọc hay xem quảng cáo của hãng bao nhiêu lần và số lon Coca Cola mà họ đã mua trong tuần qua. Kết quả như sau:

Số lần xem hay đọc quảng cáo Số lon đã mua

4 12

9 14

3 7

0 6

1 3

6 5

2 5

5 10

a) Hãy xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa hai biến trên.

b) Đánh giá trình độ chặt chẽ của mối liên hệ.

c) Với kết quả điều tra ở trên, có thể kết luận rằng số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua hay không? Hãy thực hiện kiểm định giả thiết với mức ý nghĩa 0,05.

7. Có số liệu về độ tuổi và nhịp tim của một mẫu gồm 10 người được chọn ngẫu nhiên như sau:

Tuổi Nhịp tim (lần)

30 186

38 183

41 171

38 177

29 191

39 177

46 175

41 176

42 171

24 196

a) Giữa hai biến trên liệu có mối liên hệ với nhau không? Nếu có, hãy xác định đâu là nguyên nhân, đâu là kết quả.

b) Khi tăng thêm 1 tuổi thì nhịp tim sẽ thay đổi thế nào?

c) Có thể dùng tuổi để dự đoán nhịp tim của một người hay không? Với mức ý nghĩa 0,05, hãy giải thích tại sao?

Page 87: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

v1.0 87

8. Một nghiên cứu của cơ quan giao thông ở Atlanta về ảnh hưởng của giá vé xe buýt đến số lượng hành khách thu được kết quả như sau:

Giá vé (Cents) Số hành khách trên 100 dặm

15 440

20 430

25 430

30 370

35 360

40 340

45 350

50 350

a) Vẽ đồ thị biểu diễn mối liên hệ trên.

b) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.

c) Với mức ý nghĩa 5%, có thể kết luận rằng, giữa giá vé xe buýt và số lượng hành khách có mối liên hệ tương quan tuyến tính âm hay không?

9. Để dự đoán về những chi phí quản lý phải trả dựa trên số lượng sản phẩm sản xuất ra, một nhà quản lý đã thu thập thông tin ở các đơn vị khác nhau và thu được kết quả sau:

Chi phí quản lý phải trả (triệu đồng) Số lượng sản phẩm

191 40

170 42

272 53

155 35

280 56

173 39

234 48

116 30

153 37

178 40

a) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.

b) Dự đoán chi phí quản lý phải trả khi có 50 sản phẩm được sản xuất ra.

c) Tính sai số tiêu chuẩn của mô hình dự đoán trên.

10. Liệu có phải có điểm cao khi học thì ra trường sẽ có việc làm với mức lương cao hơn? Một sinh viên thống kê doanh nghiệp đã thực hiện điều tra ngẫu nhiên một mẫu gồm một số người

Page 88: Nguyen ly thong ke

Bài 4: Phân tích hồi quy và tương quan

88 v1.0

bạn mới tốt nghiệp của anh ta về mức lương khởi điểm và điểm trung bình khi học đại học

của họ. Kết quả như sau:

Mức lương khởi điểm (triệu đồng) Điểm trung bình học đại học

3,1 7,0

2,5 6,0

2,5 6,5

1,9 5,0

2,2 6,0

2,8 6,5

1,6 5,5

2,2 5,5

a) Vẽ đường hồi quy thực nghiệm và đường hồi quy lý thuyết biểu diễn mối liên hệ trên.

b) Đánh giá trình độ chặt chẽ của mối liên hệ trên.

c) Dự đoán mức lương khởi điểm cho sinh viên có điểm trung bình khi học đại học là 8,0.

d) Tính sai số tiêu chuẩn của mô hình dự đoán trên.

Page 89: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 89

0

Nội dung Mục tiêu

Một số vấn đề chung về dãy số thời gian.

Các chỉ tiêu phân tích dãy số thời gian.

Một số phương pháp biểu diễn xu hướng biến động của hiện tượng qua thời gian.

Dự đoán thống kê ngắn hạn.

Trang bị những kiến thức cơ bản về dãy số thời gian, bao gồm những khái niệm, các chỉ tiêu phân tích dãy số thời gian, các phương pháp biểu diễn xu hướng phát triển của hiện tượng và dự báo thống kê ngắn hạn.

Thời lượng học Hướng dẫn học

9 tiết Nghe bài giảng, thảo luận với giảng viên và học viên khác.

Trả lời câu hỏi ôn tập và làm các bài tập ở cuối bài học.

BÀI 5: PHÂN TÍCH DÃY SỐ THỜI GIAN

Page 90: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

90 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Lập kế hoạch tình hình sản xuất kinh doanh của doanh nghiệp

Bạn được sếp giao cho nhiệm vụ lập kế hoạch về tình hình sản xuất kinh doanh của doanh nghiệp trong vài năm tới. Để đảm bảo kế hoạch là khả thi, bạn tiến hành thu thập và tổng hợp tài liệu về tình hình sản xuất kinh doanh của doanh nghiệp trong những năm gần đây. Bạn định dựa trên cơ sở những số liệu thu thập đó để có thể phân tích sự biến động và tìm ra xu hướng phát triển của các hiện tượng, từ đó xác định được các mức độ kế hoạch trong tương lai.

Câu hỏi

Bạn sẽ phân tích dãy số liệu thu thập được như thế nào? Tìm ra tính quy luật của chúng ra sao? Làm thế nào để xác định được các mức độ của hiện tượng trong tương lai?

Đó chính là nội dung của bài học này, phân tích mối liên hệ của hiện tượng theo thời gian.

Page 91: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 91

Mặt lượng của hiện tượng thường xuyên biến động qua thời gian. Để nghiên cứu sự biến động này, người ta thường sử dụng các dãy số thời gian. Vậy dãy số thời gian là gì?

5.1. Một số khái niệm chung về dãy số thời gian

5.1.1. Khái niệm và ý nghĩa của dãy số thời gian

5.1.1.1. Khái niệm

Dãy số thời gian là một dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian.

Ví dụ 1: Có tài liệu về doanh thu của doanh nghiệp A qua các năm như sau:

Năm 2004 2005 2006 2007 2008

Doanh thu (tỷ đồng) 25 29 36 50 60

Ví dụ 2: Có tài liệu về lao động của doanh nghiệp A như sau:

Ngày 1/1/09 1/2/09 1/3/09 1/4/09

Số lao động (người) 350 370 370 380

Qua quan sát hai ví dụ trên ta thấy, một dãy số thời gian có kết cấu gồm 2 thành phần sau:

Thời gian: có thể là ngày, tuần, tháng, quý, năm tuỳ thuộc vào đặc điểm, tính chất của hiện tượng nghiên cứu. Độ dài giữa 2 thời gian liền nhau gọi là khoảng cách thời gian.

Chỉ tiêu về hiện tượng nghiên cứu: tên, đơn vị tính phù hợp và trị số của chỉ tiêu.

Các trị số này được gọi là các mức độ của dãy số thời gian yi ( i 1,n ). Các mức

độ của dãy số thời gian có thể là số tuyệt đối, số tương đối hoặc số bình quân.

5.1.1.2. Ý nghĩa

Dãy số thời gian cho phép thống kê nghiên cứu xu hướng biến động của hiện tượng qua thời gian. Từ đó, tìm ra tính quy luật của sự phát triển đồng thời dự đoán được các mức độ của hiện tượng trong tương lai.

5.1.2. Các loại dãy số thời gian

Một dãy số thời gian luôn bao gồm hai thành phần: thời gian và trị số của chỉ tiêu. Thời gian thì có thời kỳ và thời điểm. Trị số của chỉ tiêu có thể là số tuyệt đối, số tương đối hoặc số bình quân. Khi đó, ta có các loại dãy số thời gian tương ứng dưới đây.

Căn cứ vào các loại chỉ tiêu, dãy số thời gian được chia thành:

o Dãy số số tuyệt đối: dãy số có các trị số của chỉ tiêu là số tuyệt đối.

Ví dụ: Quy mô vốn của doanh nghiệp qua các năm.

o Dãy số số tương đối: dãy số mà các trị số là các số tương đối.

Ví dụ: Tốc độ tăng trưởng kinh tế hàng năm.

o Dãy số số bình quân: dãy số mà các trị số là các số bình quân.

Ví dụ: Năng suất lao động trung bình của doanh nghiệp qua các năm.

Trong đó, dãy số tương đối và dãy số bình quân luôn là dãy số thời kỳ.

Page 92: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

92 v1.0

Chú ý

Nội dung bài giảng sẽ chỉ tập trung đi vào phân tích dãy số số tuyệt đối. Vì thế, các khái niệm liên quan dưới đây có thể không phù hợp với hai dãy số số tương đối và dãy số số bình quân.

Căn cứ vào đặc điểm biến động về quy mô của hiện tượng qua thời gian, dãy số được chia thành: o Dãy số thời kỳ: biểu hiện quy mô, khối lượng của hiện tượng trong từng

khoảng thời gian nhất định. Các trị số của chỉ tiêu có thể cộng dồn với nhau tạo thành số có ý nghĩa trong thời gian dài hơn. Ví dụ 1 (phần 5.1.1.1) là dãy số thời kỳ, phản ánh quy mô doanh thu của doanh nghiệp qua từng năm.

o Dãy số thời điểm: biểu hiện quy mô, khối lượng của hiện tượng tại những thời điểm nhất định. Các trị số của chỉ tiêu không thể cộng dồn với nhau vì không có ý nghĩa. Ví dụ 2 (phần 5.1.1.1) là dãy số thời điểm, phản ánh số lao động của doanh nghiệp tại từng thời điểm nhất định trong tháng.

Để có thể nghiên cứu biến động của hiện tượng qua thời gian thì các mức độ trong dãy số phải đảm bảo tính chất có thể so sánh được, tức là dãy số thời gian đó phải đáp ứng một số yêu cầu nhất định.

5.1.3. Yêu cầu khi xây dựng dãy số thời gian

Phải thống nhất về nội dung và phương pháp tính chỉ tiêu qua thời gian.

Ví dụ: Chỉ tiêu GDP ở nước ta hiện nay tính theo Hệ thống tài khoản quốc gia của Liên hợp quốc (SNA 1993), trước đó là chỉ tiêu Thu nhập quốc dân tính theo Hệ thống sản xuất vật chất của Liên Xô cũ (MPS).

Phải thống nhất về phạm vi tổng thể nghiên cứu.

Ví dụ: Từ 1/8/2008, Hà Nội bao gồm Hà Tây và một số địa phương thuộc Vĩnh Phúc, Hoà Bình. Như vậy, không thể đem các số liệu của Hà Nội trước khi nhập tỉnh để so sánh với số liệu của Hà Nội hiện nay được.

Các khoảng cách thời gian trong dãy số nên bằng nhau, nhất là với các dãy số thời kỳ phải bằng nhau.

5.2. Các chỉ tiêu phân tích dãy số thời gian Chúng ta đã biết, mặt lượng của hiện tượng thường xuyên biến động. Để tìm ra tính quy luật của sự biến động đó, trong thống kê, người ta sử dụng 5 chỉ tiêu sau để phân tích dãy số thời gian:

5.2.1. Mức độ bình quân theo thời gian

Khái niệm

Mức độ bình quân theo thời gian là chỉ tiêu tổng hợp phản ánh mức độ đại biểu của hiện tượng trong toàn bộ thời gian nghiên cứu hoặc từng giai đoạn nghiên cứu.

Công thức tính

o Đối với dãy số thời kỳ: n

ii 1

yy

n

Page 93: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 93

o Đối với dãy số thời điểm: Dãy số thời điểm phản ánh quy mô, khối lượng của hiện tượng trong từng thời điểm. Để tính được mức độ bình quân một cách chính xác, người ta phải xác định trị số chỉ tiêu ở từng ngày. Nhưng trên thực tế, chúng ta chỉ có được trị số chỉ tiêu vào một ngày trong tháng nên phải giả thiết rằng khoảng giữa hai thời điểm điều tra, mật độ của hiện tượng tăng giảm đều đặn. Khi đó công thức tính mức độ bình quân qua thời gian như sau:

Trường hợp dãy số thời điểm có khoảng cách thời gian bằng nhau:

2 31 2 n 1 n 1 n2 n 1

y yy y y y y y... y ... y

2 2 2 2 2yn 1 n 1

Bản chất của cách tính này là chuyển từ dãy số thời điểm sang dãy số thời kỳ để thực hiện phép tính.

Ví dụ: Số lao động của doanh nghiệp A tại các thời điểm:

Ngày 1/1/09 1/2/09 1/3/09 1/4/09

Số lao động (người) 350 370 370 380

Yêu cầu: Tính số lao động bình quân trong qúy I/2009 của doanh nghiệp A.

Hướng dẫn:

Số lao động là số tuyệt đối vì vậy khi tính bình quân, ta phải sử dụng công thức bình quân cộng. Nhưng do đây là số tuyệt đối thời điểm, không thực hiện được phép cộng nên phải chuyển về nó về dạng cộng được, tức phải tính bình quân cho từng thời kỳ. Trước hết, ta phải tính số lao động bình quân từng tháng.

Số lao động bình quân tháng 1 là số lao động bình quân của tất cả các ngày trong tháng 1. Giả thiết biến động số lao động các ngày trong tháng là tương đối đều đặn. Vậy, ta sẽ tính số lao động bình quân tháng 1 dựa vào số lao động ngày đầu tháng và cuối tháng (ở đây, có số liệu vào ngày 1/2, được coi là số liệu của ngày 31/1).

1 21

y y 350 370y 360

2 2

(người)

Tương tự với tháng 2 và tháng 3:

2 32

y y 370 370y 370

2 2

(người)

3 43

y y 370 380y 375

2 2

(người)

Khi đó, số lao động bình quân quý I/2009 là:

3 31 2 2 4 1 42 3

1 2 3

y yy y y y y yy yy y y 2 2 2 2 2 2 2 2y

3 3 4 1

350 380370 370

2 24 1

368,33 hay 369 (người)

Vậy số lao động bình quân của doanh nghiệp trong quý I/2009 là 369 người.

Page 94: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

94 v1.0

Trường hợp dãy số thời điểm có khoảng cách thời gian không bằng nhau.

i i

i

y ty

t

Trong đó: yi: Các mức độ của dãy số thời gian.

ti: Khoảng cách thời gian có các mức độ yi tương ứng.

Ví dụ: Có tài liệu về số lao động của doanh nghiệp A trong tháng 4/2009:

Ngày 1/4 doanh nghiệp có 380 lao động. Đến ngày 10/4, doanh nghiệp tuyển dụng thêm 5 lao động. Ngày 15/4, tuyển dụng tiếp 3 lao động. Đến ngày 21/4, cho 4 lao động thôi việc.

Yêu cầu: Tính số lao động bình quân trong tháng 4/2009 của doanh nghiệp.

Hướng dẫn:

Ta có dãy số thời gian thể hiện sự biến động số lao động của doanh nghiệp trong tháng 4/2009 như sau:

Ngày Số lao động (người) yi

Khoảng cách thời gian (ngày) ti

yiti

1 380 9 3.420

10 385 5 1.925

15 388 6 2.328

21 384 10 3.840

∑ 30 11.513

n

i ii 1

n

ii 1

y t11.513

y 383,7730

t

hay 384 (người)

Vậy số lao động bình quân trong tháng 4/2009 của doanh nghiệp là 384 người.

5.2.2. Lượng tăng (giảm) tuyệt đối

Khái niệm: Là chỉ tiêu phản ánh sự biến động về trị số tuyệt đối của chỉ tiêu giữa hai thời gian nghiên cứu hay nói cách khác, nó cho biết mức độ của hiện tượng nghiên cứu qua hai thời gian đã tăng/giảm một lượng tuyệt đối là bao nhiêu.

Hai thời gian nghiên cứu ở đây có thể:

o Liền nhau: liên hoàn.

o Trong một khoảng thời gian có 1 năm gốc cố định: định gốc.

o Trong một khoảng thời gian: bình quân.

Công thức tính: Tương ứng với 3 loại thời gian nghiên cứu ở trên, có 3 chỉ tiêu tính lượng tăng (giảm) tuyệt đối như sau:

o Lượng tăng (giảm) tuyệt đối liên hoàn: phản ánh sự thay đổi trị số tuyệt đối giữa hai thời gian liền nhau.

Công thức: i = yi – yi – 1 (i = 2,n )

Page 95: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 95

o Lượng tăng (giảm) tuyệt đối định gốc: phản ánh sự thay đổi trị số tuyệt đối giữa các khoảng thời gian dài và thường lấy mức độ đầu tiên làm gốc cố định.

Thực tế thì có thể chọn bất kỳ thời gian nào để làm gốc nhưng về mặt lý thuyết thì thường chọn mốc thời gian đầu tiên để làm gốc.

Công thức: i = yi – y1 (i = 2,n )

Ví dụ: Tiếp ví dụ 1 phần 5.1.1.1:

Năm 2004 2005 2006 2007 2008

Doanh thu (tỷ đồng) 25 29 36 50 60

i (tỷ đồng) 2 = 4 3 = 7 4 = 14 5 = 10

i (tỷ đồng) 2 = 4 3 = 11 4 = 25 5 = 35

Từ hai công thức trên, ta thấy mối liên hệ giữa lượng tăng (giảm) tuyệt đối liên hoàn và lượng tăng (giảm) tuyệt đối định gốc: lượng tăng (giảm) tuyệt đối định gốc trong một thời gian bằng tổng các lượng tăng (giảm) tuyệt đối liên hoàn trong thời gian đó.

ii n

n i n 1i 2

y y

Như ở ví dụ trên, 351014745

25

ii (tỷ đồng) là lượng tăng tuyệt

đối về chỉ tiêu doanh thu của doanh nghiệp năm 2008 so với năm 2004. o Lượng tăng (giảm) tuyệt đối bình quân: Là bình quân cộng của các lượng tăng

(giảm) tuyệt đối liên hoàn, phản ánh mức độ của hiện tượng nghiên cứu đã tăng hay giảm bình quân là bao nhiêu.

Công thức:

n

ii 2 n n 1y y

n 1 n 1 n 1

Áp dụng số liệu ở ví dụ trên, ta có:

5 358,75

5 1 4

(tỷ đồng)

Như vậy, trong giai đoạn 2004 – 2008, bình quân mỗi năm doanh thu của doanh nghiệp tăng thêm 8,75 tỷ đồng.

Chú ý

chỉ phụ thuộc vào mức độ đầu tiên và mức độ cuối cùng. Do vậy, chỉ nên tính khi các mức độ của dãy số có cùng xu hướng và nên kết hợp với các lượng tăng giảm tuyệt đối liên hoàn i để phân tích thì mới chặt chẽ.

5.2.3. Tốc độ phát triển

Khái niệm: Là chỉ tiêu phản ánh xu hướng phát triển của hiện tượng qua thời gian. Về bản chất, tốc độ phát triển giống như số tương đối động thái.

Công thức tính: Tương tự như lượng tăng (giảm) tuyệt đối, tốc độ phát triển cũng được chia thành 3 loại và có cách tính như sau:

o Tốc độ phát triển liên hoàn: Phản ánh sự phát triển của hiện tượng giữa hai thời gian liền nhau.

Page 96: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

96 v1.0

ii

i 1

yt

y

(lần, %) i = 2,n

o Tốc độ phát triển định gốc: Phản ánh sự phát triển của hiện tượng trong các khoảng thời gian dài và lấy mức độ đầu tiên làm gốc cố định.

ii

1

yT

y (lần, %) i = 2,n

Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:

Năm 2004 2005 2006 2007 2008

Doanh thu (tỷ đồng) 25 29 36 50 60

ti (lần) t2 = 1,16 t3 = 1,24 t4 = 1,39 t5 = 1,20

Ti (lần) T2 = 1,16 T3 = 1,44 T4 = 2,00 T5 = 2,40

Mối liên hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc:

Tốc độ phát triển định gốc trong 1 độ dài thời gian bằng tích các tốc độ phát triển liên hoàn trong thời gian đó.

Ti = Πti Tn = n

ii 2

t

Tốc độ phát triển liên hoàn bằng thương của 2 tốc độ phát triển định gốc liền nhau.

ii

i 1

Tt

T

o Tốc độ phát triển bình quân: Là bình quân nhân của các tốc độ phát liên hoàn, phản ánh tốc độ phát triển đại diện trong cả 1 thời kỳ dài.

nnn 1n 1 n 1i n

i 2 1

yt t T

y

Với ví dụ trên, ta có: 445t T 2,40 1,245 (lần) hay 124,5%

Như vậy, trong giai đoạn 2004 – 2008, tốc độ phát triển trung bình của chỉ tiêu doanh thu của doanh nghiệp A là 1,245 (lần) hay 124,5%.

Chú ý

t bản chất là trung bình nhân của ti nhưng thực chất chỉ phụ thuộc vào hai mức độ đầu và cuối của dãy số. Do đó, chỉ nên tính khi các mức độ của dãy số có cùng xu hướng. Nếu không cùng xu hướng thì nên dùng tốc độ phát triển liên hoàn.

5.2.4. Tốc độ tăng (giảm)

Khái niệm: Tốc độ tăng (giảm) là chỉ tiêu phản ánh mức độ của hiện tượng trong hai thời gian nghiên cứu tăng lên hay giảm đi bao nhiêu lần hay bao nhiêu %.

Công thức tính:

o Tốc độ tăng (giảm) liên hoàn: phản ánh tốc độ tăng, giảm của hai thời gian liền nhau.

i i 1ii i

i 1 i 1

y ya t 1

y y

(lần) i = 2,n

Page 97: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 97

o Tốc độ tăng (giảm) định gốc: phản ánh sự biến động tương đối giữa những khoảng thời gian dài, thường lấy mức độ đầu tiên làm gốc cố định.

i i 1 ii i

1 1 1

y y yA 1 T 1

y y y

(lần) i = 2,n

Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:

a Năm 2004 2005 2006 2007 2008

Doanh thu (tỷ đồng) 25 29 36 50 60

ai (lần) a2 = 0,16 a3 = 0,24 a4 = 0,39 a5 = 0,20

Ai (lần) A2 = 0,16 A3 = 0,44 A4 = 1,00 A5 = 1,40

Lưu ý: Không có mối quan hệ giữa tốc độ tăng (giảm) liên hoàn và định gốc.

o Tốc độ tăng (giảm) bình quân: phản ánh tốc độ tăng (giảm) đại diện của hiện tượng trong một thời gian nghiên cứu.

a t 1 (lần) hay a t 100 (%)

a t 1 = 1,245 – 1 = 0,245 lần (hay 24,5%)

Vậy, trong giai đoạn 2004 – 2008, doanh thu của doanh nghiệp A tăng trung bình 0,245 (lần/năm) hay 24,5%/năm.

Chú ý

a cũng chỉ nên sử dụng khi dãy số có cùng xu hướng.

Trong thống kê luôn luôn phải sử dụng kết hợp số tuyệt đối và số tương đối, bởi nhiều hiện tượng mặc dù có cùng tốc độ tăng (giảm) nhưng giá trị tuyệt đối của nó lại hoàn toàn khác nhau. Sự khác nhau đó được quyết định bởi gốc so sánh, có nghĩa là cùng một tốc độ như nhau nhưng chỉ tiêu nào có gốc so sánh lớn hơn thì lượng tăng (giảm) tuyệt đối của nó cũng lớn hơn. Trong thống kê, người ta thường sử dụng chỉ tiêu sau để phản ánh mức độ tăng (giảm) của hiện tượng.

5.2.5. Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn

Là sự kết hợp giữa chỉ tiêu lượng tăng (giảm) tuyệt đối và chỉ tiêu tốc độ tăng (giảm).

Khái niệm: Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn phản ánh sự kết hợp giữa số tương đối và số tuyệt đối. Cụ thể, nó biểu hiện cứ 1% tăng hay giảm liên hoàn thì tương ứng với 1 trị số tuyệt đối là bao nhiêu.

Công thức tính:

i i i 1i

ii

i 1

yg

a (%) 100100y

gi: là số tuyệt đối, nên đơn vị tính tương ứng với đơn vị tính của chỉ tiêu nghiên cứu.

Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:

Page 98: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

98 v1.0

Năm 2004 2005 2006 2007 2008

Doanh thu (tỷ đồng) 25 29 36 50 60

gi (tỷ đồng) g2 = 0,25 g3 = 0,29 g4 = 0,36 g5 = 0,50

Lưu ý: Trên thực tế, người ta không dùng chỉ tiêu giá trị tuyệt đối của 1% tốc độ tăng (giảm) định gốc vì nó luôn là 1 hằng số.

i i 1i

ii

1

yG const

A (%) 100100y

Không có Gi nên không có mối liên hệ giữa Gi và gi, do đó cũng không có g .

Bên cạnh việc phân tích sự biến động của dãy số thời gian, một vấn đề rất quan trọng là phải thấy được xu hướng biến động của hiện tượng.

5.3. Một số phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng

5.3.1. Sự cần thiết phải nghiên cứu các phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng

Hiện tượng biến động qua thời gian, chịu ảnh hưởng bởi nhiều nhóm nhân tố, trong đó:

Các nhân tố chủ yếu, tác động đến hiện tượng và quyết định xu hướng phát triển cơ bản của hiện tượng.

Các nhân tố ngẫu nhiên tác động một cách ngẫu nhiên làm cho hiện tượng sai lệch so với xu hướng chung.

Vấn đề đặt ra là phải loại trừ những nhân tố ngẫu nhiên và làm bộc lộ ra những nhân tố cơ bản. Mục đích chung của các phương pháp này là loại bỏ những nhân tố ngẫu nhiên. Nhưng để thực hiện được các phương pháp này, điều kiện đầu tiên là phải đảm bảo tính chất có thể so sánh được giữa các mức độ của hiện tượng trong dãy số.

5.3.2. Các phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng

Thống kê sử dụng 4 phương pháp cơ bản dưới đây:

5.3.2.1. Phương pháp mở rộng khoảng cách thời gian

Nội dung: Mở rộng thêm khoảng cách thời gian bằng cách ghép một số thời gian liền nhau vào thành một khoảng thời gian dài hơn.

Ví dụ: Mở rộng khoảng cách thời gian từ tháng thành quý, từ quý thành năm...

Mục đích là để từ dãy số không có hoặc chưa thể hiện rõ tính quy luật thành dãy số xuất hiện tính quy luật (triệt tiêu ngẫu nhiên để biểu hiện xu hướng).

Vận dụng: Mở rộng khoảng cách thời gian được vận dụng với dãy số thời kỳ có khoảng cách thời gian tương đối ngắn, nhiều mức độ và chưa thấy rõ được xu hướng phát triển cơ bản của hiện tượng.

Thời gian dài – ngắn mang ý nghĩa tương đối, phụ thuộc vào đặc điểm của hiện tượng và từng loại chỉ tiêu khác nhau.

Page 99: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 99

Ví dụ: Sản phẩm của ngành chế biến thủy sản có thể xét theo ngày, tuần. Nhưng sản phẩm của ngành đóng tàu phải xét theo tháng, năm…

Hạn chế:

o Do ghép nhiều khoảng thời gian vào thành một nên số lượng các mức độ trong dãy số mất đi quá nhiều, đôi khi làm mất ảnh hưởng của các nhân tố cơ bản.

Ví dụ: Số liệu từ tháng chuyển thành qúy, từ 12 mức độ còn 4 mức độ, tức là mất đi 2/3 số mức độ ban đầu.

o Trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ làm mất đi tính chất thời vụ của hiện tượng.

5.3.2.2. Phương pháp bình quân trượt

Từ đặc điểm của số bình quân là san bằng các chênh lệch vì thế nó san bằng các nhân tố ngẫu nhiên làm bộc lộ nhân tố cơ bản của hiện tượng, người ta đưa ra khái niệm số bình quân trượt.

Khái niệm: Số bình quân trượt là số bình quân của một nhóm nhất định các mức độ trong dãy số được tính bằng cách lần lượt loại trừ dần mức độ đầu, đồng thời thêm vào các mức độ tiếp theo sao cho số lượng các mức độ tham gia tính số bình quân là không đổi.

Dãy số bình quân trượt là dãy số được hình thành từ các số bình quân trượt.

Ví dụ: Có dãy số thời gian n mức độ y1, y2, …, yn

Giả sử nhóm 3 mức độ để tính số bình quân trượt, ta có:

1 2 32

y y yy

3

;

2 3 43

y y yy

3

;

n 2 n 1 nn 1

y y yy

3

2 3 ny , y ,..., y được gọi là dãy số bình quân trượt lần thứ nhất (MA1).

Nếu dãy số vẫn chưa bộc lộ rõ xu hướng, nghĩa là chưa loại bỏ hết các yếu tố ngẫu nhiên thì có thể tính bình quân trượt lần thứ hai.

2 3 43

y y yy

3

;

3 4 54

y y yy

3

;

n 3 n 2 n 1n 2

y y yy

3

Page 100: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

100 v1.0

Khi đó ta có dãy số bình quân trượt lần thứ 2 (MA2).

Ngoài phương pháp trượt như trên còn có thể tính số bình quân trượt có trọng số.

Vận dụng: Với dãy số thời kỳ theo tháng, quý, năm nhưng không có yếu tố thời vụ.

Ưu điểm: So với mở rộng khoảng cách thời gian thì số lượng các mức độ trong dãy số mất đi ít hơn, khi biểu diễn trên đồ thị sẽ thấy xu hướng rõ ràng hơn.

Hạn chế: Trong trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ làm mất đi tính chất thời vụ của hiện tượng.

Để khắc phục nhược điểm của hai phương pháp trên, người ta sử dụng phương pháp dưới đây.

5.3.2.3. Phương pháp hồi quy theo thời gian

Nội dung: Phương pháp hồi quy trong dãy số thời gian được vận dụng để biểu diễn xu hướng phát triển cơ bản của những hiện tượng có nhiều dao động ngẫu nhiên. Khi đó, người ta xây dựng một hàm số (gọi là phương trình hồi quy) nhằm phản ánh biến động của hiện tượng theo thời gian.

Hàm số này có dạng tổng quát: ty = f(t) và thường được gọi là hàm xu thế.

Trong đó:

o t: là biến thời gian, là thứ tự thời gian theo quy ước, đóng vai trò là biến số độc lập trong phương trình hồi quy.

– < t < +

o ty : Mức độ của hiện tượng ở thời gian t tính từ hàm xu thế.

Các dạng hàm xu thế thường sử dụng

o Hàm xu thế tuyến tính: Sử dụng khi dãy số thời gian có các lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau.

Hàm có dạng: ty = a0 + a1t

Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất. Theo đó, a0 và a1 phải thỏa mãn phương trình:

0 1

20 1

y na a t

ty a t a t

hoặc: 1 2t

ty tya

và a0 = y – a1 t

Chú ý

Để dễ tính nên chọn t sao cho t = 0. Kết quả ở hàm hồi quy sẽ khác nhau nhưng dùng để dự báo thì đều có giá trị như nhau.

o Hàm xu thế parabol: Được sử dụng trong trường hợp các mức độ của dãy số tăng dần theo thời gian đạt cực đại, sau đó lại giảm dần theo thời gian hoặc giảm dần theo thời gian đạt cực tiểu, sau đó lại tăng dần theo thời gian.

Hàm có dạng: ty = a0 + a1t + a2t2

Các tham số được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:

Page 101: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 101

20 1 2

2 30 1 2

2 2 3 40 1 2

y a n a t a t

ty a t a t a t

t y a t a t a t

o Hàm xu thế hypebol: Được sử dụng khi các mức độ của hiện tượng giảm dần theo thời gian.

Hàm có dạng: 1t 0

ay a

t

Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:

0 1

0 1 2

1y a n a

t1 1 1

y a at t t

o Hàm xu thế mũ: Được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau.

Hàm có dạng: tt 0 1y a a

hay: lny = lna0 + t lna1

Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và lna, lnb phải thỏa mãn hệ phương trình:

0 1

20 1

ln y ln a n ln a t

t ln y ln a t ln a t

Ví dụ: Có số liệu về sản lượng sản xuất của doanh nghiệp A qua các năm như sau:

Năm 2003 2004 2005 2006 2007 2008

Sản lượng (triệu sản phẩm) 10,0 12,5 15,4 17,6 20,2 22,9

Yêu cầu: Xây dựng hàm xu thế tuyến tính biểu diễn biến động của sản lượng sản xuất của doanh nghiệp qua thời gian.

Hướng dẫn:

Hàm xu thế tuyến tính có dạng: ty = a0 + a1t

Trong đó: y: Sản lượng sản xuất của doanh nghiệp.

t: Biến thứ tự thời gian.

Nếu quy ước năm 2003, t = 1; năm 2004, t = 2, ta có các giá trị khác của t như ở bảng dưới đây:

Năm Sản lượng (y) Thứ tự thời gian (t) t y t2

2003 10,0 1 10,0 1

2004 12,5 2 25,0 4

2005 15,4 3 46,2 9

2006 17,6 4 70,4 16

2007 20,2 5 101,0 25

2008 22,9 6 137,4 36

Cộng 98,6 21 390,0 91

Trung bình 16,43 3,50 65,0 15,17

Page 102: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

102 v1.0

Khi đó, các giá trị a0, a1 ở trên được xác định bằng phương pháp bình phương nhỏ nhất và được tính theo công thức:

1 22t

ty ty 65 3,5 16,43a

15,17 3,5

= 2,567

a0 = y – a1 t = 16,43 2,567 3,5 = 7,446

Vậy hàm xu thế tuyến tính biểu diễn biến động sản lượng sản xuất của doanh nghiệp qua thời gian là:

ty = 7,446 + 2,567t

o Lựa chọn hàm xu thế nào thì tốt?

Với một dãy số liệu, người ta có thể xây dựng nhiều hàm xu thế khác nhau. Liệu hàm xu thế nào là tốt?

Khi đó, từ các hàm xu thế, người ta tính sai số chuẩn của mỗi hàm xu thế và chọn dạng hàm cho sai số chuẩn nhỏ nhất.

2t t

e

ˆ(y y )S

n p

Trong đó:

ty : Mức độ thực tế của hiện tượng ở thời gian t.

ty : Mức độ của hiện tượng ở thời gian t được tính từ hàm xu thế.

n: Số lượng các mức độ của dãy số thời gian.

p: Số lượng các tham số của hàm xu thế (hàm tuyến tính: p = 2; parabol: p = 3; hypebol: p = 2; hàm mũ: p = 2).

5.3.2.4. Phương pháp biểu hiện biến động thời vụ

Khái niệm: Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định.

Nguyên nhân của biến động thời vụ là do ảnh hưởng của điều kiện tự nhiên và tập quán sinh hoạt của dân cư. Ảnh hưởng nhiều nhất là trong các ngành nông nghiệp, du lịch và các ngành công nghiệp chế biến sản phẩm từ nông nghiệp, các ngành khai thác... Biến động thời vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi.

Biến động thời vụ thường gây ra tình trạng làm ảnh hưởng đến hoạt động sản xuất kinh doanh của ngành đó và các ngành có liên quan. Vì vậy, việc nghiên cứu biến động thời vụ cho phép chủ động trong công tác quản lý kinh tế - xã hội, lập kế hoạch sản xuất hay hoạt động nghiệp vụ thích hợp, hạn chế ảnh hưởng đến sản xuất và sinh hoạt xã hội.

Page 103: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 103

Phương pháp nghiên cứu: Nghiên cứu biến động thời vụ thường dựa vào nguồn số liệu trong nhiều năm, ít nhất là 3 năm và sử dụng phương pháp tính chỉ số thời vụ.

Công thức tính

o Đối với dãy số không có xu thế: Dãy số không có xu thế là dãy số mà các mức độ theo thời gian tương đối ổn định: cùng kỳ từ năm này qua năm khác không có biểu hiện tăng giảm rõ rệt (biến động thời vụ không có xu thế).

Công thức: ii

0

yI = × 100

y

Trong đó: Ii: Chỉ số thời vụ của thời gian thứ i (có thể là tháng, quý,...).

iy : Mức độ bình quân của thời gian i qua các năm.

0y : Mức độ bình quân chung của dãy số.

Ii > 100% cho biết: Sự biến động của hiện tượng ở thời gian i tăng, tức đây là thời kỳ bận rộn và ngược lại.

Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của doanh nghiệp A như sau:

Mức tiêu thụ hàng hóa (triệu đồng) Năm Quý 2006 2007 2008

iy Ii (%)

I 4.489 4.589 4.574 4.551 63.86

II 7.957 8.296 8.000 8.084 113.46

III 9.450 9.524 9.514 9.496 133.27

IV 6.376 6.294 6.444 6.371 89.41

∑ 28.272 28.703 28.532 400.00

Tính các mức độ bình quân của từng quý qua 3 năm iy .

1

4.489 4.589 4.574y 4.551

3

(triệu đồng)

Tương tự với các qúy khác (kết quả như trên bảng).

Tính mức độ bình quân chung:

0

28.272 28.703 28.532y 7.126

12

(triệu đồng)

Tính các chỉ số thời vụ cho từng quý Ii:

11

0

y 4.551I 100 100

7.126y 63,87%

Ii của các quý khác tính tương tự (kết quả cho ở bảng trên).

Thời gian

y

y

0

Page 104: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

104 v1.0

Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý II và quý III và tiêu thụ ít (dưới mức bình quân chung) vào các quý I, quý IV.

o Đối với dãy số có xu thế: Nếu các mức độ cùng kỳ của hiện tượng từ năm này qua năm khác có biểu hiện tăng hay giảm rõ rệt (có yếu tố thời vụ và xu thế), muốn tính chỉ số thời vụ, trước hết phải điều chỉnh dãy số bằng phương trình hồi quy để tính các mức độ lý thuyết rồi sau đó dùng các mức độ này làm căn cứ so sánh.

Công thức:

nij

j 1 iji

y

yI 100

m

(%)

Trong đó:

yij: Mức độ thực tế của thời kỳ thứ i (i = 1,n ) thuộc năm j (j = 1,m ).

ijy : Mức độ lý thuyết của thời kỳ thứ i (i = 1,n ) thuộc năm j (j = 1,m ) được

tính từ hàm xu thế.

m: Số năm nghiên cứu.

Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của 1 doanh nghiệp như sau:

Mức độ thực tế (triệu đồng)

yij

Mức độ lý thuyết (triệu đồng)

ˆijy ˆ

ij

ij

y×100(%)

y

Quý

2006 2007 2008 2006 2007 2008 2006 2007 2008

Ii (%)

I 1.639 2.336 3.030 866 1.808 2.750 189,28 129,21 110,18 142,89

II 864 1.091 2.177 1.101 2.043 2.986 78,44 53,39 72,92 68,25

III 671 1.407 2.603 1.337 2.279 3.221 50,19 61,74 80,81 64,25

IV 2.410 2.749 4.958 1.572 2.515 3.457 153,26 109,32 143,44 135,34

∑ 5.584 7.583 12.768 4.877 8.645 12.413

Bước 1: Xác định hàm xu thế tuyến tính dạng ty = a0 + a1t

Sau khi sắp xếp lại số liệu theo thứ tự thời gian, ta có bảng số liệu:

Thời gian

y ty

0

Page 105: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 105

Thời gian Mức tiêu thụ hàng hóa (y)

Thứ tự thời gian (t)

ty t2

I/2006 1.639 1 1.639 1

II/2006 864 2 1.728 4

III/2006 671 3 2.013 9

IV/2006 2.410 4 9.640 16

I/2007 2.336 5 11.680 25

II/2007 1.091 6 6.546 36

III/2007 1.407 7 9.849 49

IV/2007 2.749 8 21.992 64

I/2008 3.030 9 27.270 81

II/2008 2.177 10 21.770 100

III/2008 2.603 11 28.633 121

IV/2008 4.958 12 59.496 144

Cộng 25.935 78 202.256 650

Từ đó, các tham số của hàm xu thế được xác định như sau:

1 22t

202256 78 25935ty ty 12 12 12a

650 7812 12

= 235.514

a0 = y – a1 t = 25935 78

235.51412 12

= 630.409

Hàm xu thế tuyến tính có dạng:

ty = 630.409 + 235.514t

Bước 2: Thay t từ 1 – 12 có kết quả ijy tương ứng (bảng trên).

Bước 3: Tính ij

ij

y100 (%)

y và Ii theo công thức.

Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý I và quý IV và tiêu thụ ít (dưới mức bình quân chung) vào các quý II, quý III.

5.4. Một số phương pháp dự đoán thống kê ngắn hạn

5.4.1. Khái niệm dự đoán thống kê ngắn hạn

Dự đoán thống kê là việc xác định các mức độ của hiện tượng nghiên cứu trong tương lai. Dự đoán chia ra làm 3 loại: dài hạn (> 10 năm), trung hạn (3 – 10 năm) và ngắn hạn (< 3 năm), thời gian quá khứ ít nhất là 5 mức độ.

Xuất phát từ đối tượng và nhiệm vụ nghiên cứu, từ nguồn tài liệu thích hợp, thống kê thường thực hiện dự đoán ngắn hạn hay còn gọi là dự đoán thống kê ngắn hạn.

Page 106: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

106 v1.0

Đây là công cụ quan trọng để tổ chức quản lý thường xuyên các hoạt động sản xuất kinh doanh của các ngành, các cấp. Nó cho phép phát hiện những nhân tố mới, những sự mất cân đối để từ đó có biện pháp phù hợp trong quá trình quản lý, hay nói cách khác, đây là cơ sở cho việc ra quyết định trong quản lý.

Có nhiều phương pháp dự đoán khác nhau, phụ thuộc vào nguồn thông tin cũng như mục tiêu của dự đoán. Nhưng nội dung cơ bản của dự đoán thống kê là dựa trên các giá trị đã biết hay các mức độ của dãy số thời gian, phân tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng, thừa nhận rằng những yếu tố đã và đang tác động sẽ vẫn còn tác động đến hiện tượng trong tương lai để xây dựng mô hình dự đoán. Chính vì vậy, người ta còn gọi dự đoán thống kê là dự đoán có điều kiện.

Cụ thể, có 3 phương pháp dự đoán cơ bản sau:

Phương pháp chuyên gia: Tham khảo, hỏi ý kiến các chuyên gia về sự phát triển trong tương lai ở lĩnh vực mà chuyên gia đó am hiểu.

Phương pháp hồi quy: Mô hình hoá hiện tượng chịu tác động của nhiều nhân tố từ đó xây dựng phương trình hồi quy. Phương pháp này tính toán phức tạp nên chỉ phù hợp với dự đoán trung và dài hạn.

Phương pháp dãy số thời gian: Xây dựng mô hình và dự đoán. Phương pháp này dễ tính, cần ít tài liệu nên thích hợp đối với dự đoán thống kê ngắn hạn.

Dưới đây, bài giảng sẽ giới thiệu một số phương pháp dự đoán thống kê ngắn hạn dựa trên cơ sở phân tích dãy số thời gian.

5.4.2. Một số phương pháp dự đoán thống kê ngắn hạn

5.4.2.1. Dựa vào lượng tăng (giảm) tuyệt đối trung bình

Mô hình dự đoán: n L ny y L

Trong đó: L là tầm xa dự đoán.

Theo công thức này, giá trị dự đoán phụ thuộc phần lớn vào = n 1y y

n 1

hay chính

xác hơn là dựa vào yn và yl. Do đó, chỉ nên áp dụng phương pháp này khi dãy số thời gian có các lượng tăng hay giảm tuyệt đối liên hoàn xấp xỉ nhau.

5.4.2.2. Dựa vào tốc độ phát triển trung bình

Mô hình dự đoán: L

n L ny y t

Trong đó: L là tầm xa dự đoán.

Giá trị dự đoán phụ thuộc phần lớn vào nn 1

1

yt

y hay chính xác hơn là dựa vào yn và

y1. Do đó, chỉ nên áp dụng phương pháp này khi dãy số thời gian có các tốc độ phát triển liên hoàn xấp xỉ nhau.

5.4.2.3. Ngoại suy hàm xu thế

Mô hình dự đoán: ty f t

với f(t) là hàm xu thế tìm được, thay giá trị t tương ứng với thời kỳ cần dự đoán để tìm ra ty .

Page 107: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 107

5.4.2.4. Dự đoán kết hợp xu thế và biến động thời vụ

Mô hình dự đoán: t iy f t I

với f(t) là hàm xu thế tìm được, Ii là chỉ số thời vụ đối với từng thời kỳ cụ thể, thay giá

trị t tương ứng để tìm ty .

Ví dụ: Với ví dụ về sản lượng sản xuất của doanh nghiệp ở trên, ta có:

Dự đoán sản lượng năm 2009 theo lượng tăng/giảm tuyệt đối trung bình:

= n 1y y 22,9 10,0

n 1 6 1

2,58

Vậy 2009 2008y y 1 = 22,9 + 2,58 1 = 25,48 (triệu sản phẩm)

Dự đoán sản lượng năm 2009 theo phương pháp ngoại suy hàm xu thế:

Hàm xu thế tuyến tính biểu diễn biến động của sản lượng sản xuất qua thời gian:

ty = 7,446 + 2,567t

Năm 2009, tương ứng t = 7, vậy 2009y = 7,446 + 2,567 7 = 25,415 (triệu sản phẩm).

Page 108: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

108 v1.0

TÓM LƯỢC CUỐI BÀI

Để phân tích mối liên hệ của hiện tượng theo thời gian, trong thống kê người ta thường sử dụng các dãy số thời gian. Đó là một dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian. Dựa vào đặc điểm về biến động quy mô của hiện tượng qua thời gian, có thể phân dãy số thời gian thành dãy số thời kỳ và dãy số thời điểm.

Trong thống kê, để phân tích đặc điểm biến động của hiện tượng qua thời gian, người ta thường sử dụng 5 chỉ tiêu để phân tích, đó là: Mức độ bình quân qua thời gian; lượng tăng (giảm) tuyệt đối; tốc độ phát triển; tốc độ tăng (giảm) và giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn. Mỗi chỉ tiêu có ý nghĩa riêng đối với việc phân tích nhưng chúng có mối liên hệ mật thiết với nhau.

Để biểu hiện xu hướng hay tính quy luật sự phát triển của hiện tượng, có thể sử dụng các phương pháp khác nhau: mở rộng khoảng cách thời gian, dãy số bình quân trượt, hàm xu thế và chỉ số thời vụ.

Bên cạnh việc cho thấy sự biến động của hiện tượng theo thời gian thì thông qua dãy số thời gian, ta có thể thực hiện dự đoán thống kê. Đó là việc xác định các mức độ của hiện tượng trong tương lai bằng cách sử dụng tài liệu thống kê và áp dụng các phương pháp phù hợp. Một dãy số thời gian rất phù hợp với loại hình dự đoán thống kê ngắn hạn, gồm một số phương pháp cơ bản sau: dự đoán dựa vào lượng tăng (giảm) tuyệt đối bình quân, dự đoán dựa vào tốc độ phát triển bình quân, dự đoán dựa vào hàm xu thế và dự đoán kết hợp xu thế và biến động thời vụ.

Page 109: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 109

CÂU HỎI ÔN TẬP

1. Trình bày khái niệm và ý nghĩa của dãy số thời gian.

2. Trình bày các loại dãy số thời gian.

3. Nêu các yêu cầu khi xây dựng dãy số thời gian.

4. Phân tích các chỉ tiêu phân tích dãy số thời gian. Cho ví dụ minh họa.

5. Trình bày một số phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng.

6. Trình bày một số phương pháp dự đoán thống kê ngắn hạn.

Page 110: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

110 v1.0

BÀI TẬP

1. Có tài liệu về lợi nhuận của một doanh nghiệp qua các năm như sau:

Năm Lợi nhuận (tỷ đồng) δi (tỷ đồng) ti (%) ai (%) gi (tỷ đồng)

2002 8,2 0,5

2003 12,5

2004 1,25

2005

2006 110,2 0,108

2007 0,72

2008 108,0

a) Hãy điền các số liệu còn thiếu vào bảng trên.

b) Tính lượng tăng (giảm) tuyệt đối bình quân và tốc độ tăng (giảm) bình quân hàng năm về lợi nhuận của doanh nghiệp trên.

2. Có tài liệu về kết quả sản xuất tại một doanh nghiệp trong 4 tháng đầu năm 2009 như sau:

Chỉ tiêu Tháng 1 Tháng 2 Tháng 3 Tháng 4

Số lao động ngày đầu tháng (người)

180 188 192 188

Năng suất lao động

(triệu đồng)

11,2 11,8 11,5 12,1

Lợi nhuận (triệu đồng) 206 242 222 234

a) Tính số lao động bình quân trong quý I/2009 của doanh nghiệp.

b) Tính năng suất lao động bình quân một công nhân trong quý I/2009.

c) Tính lợi nhuận bình quân một công nhân của từng tháng.

d) Tính lợi nhuận bình quân một công nhân trong quý I/2009.

3. Có tài liệu về giá trị tồn kho của một cửa hàng trong tháng quý II/2009 như sau:

Ngày 1/4, giá trị tồn kho là 250 triệu đồng.

Ngày 30/4, giá trị tồn kho là 280 triệu đồng.

Ngày 30/5, giá trị tồn kho là 270 triệu đồng.

Ngày 5/6, nhập kho thêm 10 triệu đồng.

Ngày 18/6, xuất kho 23 triệu đồng.

Ngày 25/6, nhập kho thêm 15 triệu đồng.

a) Tính giá trị tồn kho bình quân của từng tháng trong quý II/2009.

b) Tính giá trị tồn kho bình quân của quý II/2009.

4. Theo kế hoạch, lợi nhuận trước thuế của một doanh nghiệp năm 2008 so với năm 2003 là 150%. Nhưng kế hoạch này đã vượt 23,8%.

a) Tính tốc độ phát triển bình quân về lợi nhuận trước thuế của doanh nghiệp trong giai đoạn 2003 – 2008 nói trên.

b) Tính tốc độ phát triển bình quân về lợi nhuận trước thuế của doanh nghiệp trong giai đoạn 2000 – 2008 biết rằng, trung bình mỗi năm trong giai đoạn 2000 – 2003, lợi nhuận trước thuế của doanh nghiệp tăng 10,2%.

Page 111: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

v1.0 111

5. Có tài liệu về tốc độ tăng tổng quỹ lương của một doanh nghiệp trong thời gian từ năm 2004 – 2008 như sau:

Năm 2005 2006 2007 2008

Tốc độ tăng (%)

(so với năm 2004)

5 13 20 23

a) Tính tốc độ phát triển bình quân tổng quỹ lương của doanh nghiệp trong giai đoạn 2004 – 2008.

b) Tính giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn của tổng quỹ lương biết, tổng quỹ lương năm 2006 của doanh nghiệp là 22.000 triệu đồng.

6. Có tài liệu nghiên cứu về số người thiệt mạng do uống rượu khi lái xe ở một địa phương qua 8 năm như sau:

Năm 2001 2002 2003 2004 2005 2006 2007 2008

Số người chết 98 105 116 119 135 156 177 208

a) Xây dựng hàm xu thế biểu diễn sự biến động của số người chết do uống rượu khi lái xe qua thời gian.

b) Dự đoán số người chết do uống rượu khi lái xe ở địa phương trên trong năm 2009 và 2010 dựa vào lượng tăng (giảm) tuyệt đối bình quân, tốc độ phát triển bình quân và hàm xu thế.

7. Có tài liệu về doanh số bán một loại đồng hồ điện tử của một cửa hàng như sau:

Năm 2004 2005 2006 2007 2008

Doanh số (nghìn USD) 13 24 39 65 106

a) Xây dựng hàm xu thế biểu diễn biến động của doanh số bán qua thời gian.

b) Dự đoán doanh số bán đồng hồ của cửa hàng trên trong năm 2009.

8. Có tốc độ tăng hàng năm về doanh thu của một doanh nghiệp như sau:

Năm 2004 2005 2006 2007 2008

Tốc độ tăng (%) 6,2 8,5 5,4 7,1 6,3

a) Tính tốc độ tăng bình quân hàng năm về chỉ tiêu doanh thu của doanh nghiệp trong thời gian 2003 – 2008. Biết rằng, 1% tăng lên về doanh thu năm 2008 tương ứng với 3 tỷ đồng.

b) Xây dựng hàm xu thế tuyến tính biểu diễn sự biến động của chỉ tiêu doanh thu qua thời gian.

c) Dự đoán doanh thu của doanh nghiệp trong năm 2009 và 2010.

9. Có tài liệu về số khách thuê phòng ở một khách sạn 5 sao như sau:

Số khách thuê phòng (Lượt khách) Năm

Quý I Quý II Quý III Quý IV

2004 1.861 2.203 2.415 1.908

2005 1921 2.343 2.514 1.986

2006 1.834 2.154 2.098 1.799

2007 1.837 2.025 2.304 1.965

2008 2.073 2.414 2.339 1.967

Tính chỉ số thời vụ cho từng quý và cho nhận xét.

Page 112: Nguyen ly thong ke

Bài 5: Phân tích dãy số thời gian

112 v1.0

10. Có tài liệu về số bệnh nhân nhập viện ở một bệnh viện như sau:

Số bệnh nhân nhập viện (nghìn lượt người) Năm

Quý I Quý II Quý III Quý IV

2005 2,6 4,1 4,8 3,2

2006 2,9 4,5 5,0 3,4

2007 2,8 4,9 5,5 3,3

2008 3,1 5,1 5,6 3,6

a) Tính chỉ số thời vụ cho từng quý và cho nhận xét.

b) Dự đoán số bệnh nhân nhập viện cho các quý của năm 2009.

Page 113: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 113

0

Nội dung Mục tiêu

Các vấn đề chung về chỉ số và cách tính các loại chỉ số.

Giới thiệu 3 hệ thống chỉ số dùng để phân tích đặc điểm biến động của hiện tượng do ảnh hưởng của các nhân tố.

Trang bị các kiến thức cơ bản về chỉ số trong thống kê, bao gồm các khái niệm, phương pháp tính chỉ số và phân tích hệ thống chỉ số.

Thời lượng học

Hướng dẫn học

9 tiết Đọc tài liệu, nghe bài giảng và thảo luận.

Trả lời các câu hỏi ôn tập và làm bài tập.

BÀI 6: CHỈ SỐ

Page 114: Nguyen ly thong ke

Bài 6: Chỉ số

114 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Biến động doanh thu bán hàng

Một cửa hàng bán sản phẩm của doanh nghiệp bạn đang đứng trước nguy cơ phải đóng cửa vì nhiều tháng liền, doanh số liên tục giảm. Bạn được giao nhiệm vụ thay người phụ trách cũ với mục tiêu giữ lại cửa hàng đó trong chuỗi cửa hàng bán sản phẩm của doanh nghiệp. Sau hai tháng quản lý, tình hình doanh số của cửa hàng đã có nhiều cải thiện, tháng sau tăng hơn so với tháng trước. Tuy nhiên, có ý kiến cho rằng, doanh số của cửa hàng đó tăng là không bền vững do tăng giá bán. Bạn không đồng ý với ý kiến trên và quyết định sẽ chứng minh việc tăng doanh số đó là bền vững vì dù giá có tăng nhưng khối lượng hàng tiêu thụ không hề giảm, số lượng khách đến

mua hàng ngày càng tăng.

Với hệ thống sổ sách ghi chép bán hàng, bạn tổng hợp lại và tính toán biến động của doanh thu do ảnh hưởng của các nhân tố giá bán và lượng hàng tiêu thụ.

Câu hỏi

Bạn đã làm theo cách nào, đã tính toán những chỉ tiêu nào? Đó cũng là nội dung chính của bài

học này.

Page 115: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 115

6.1. Khái niệm chung về chỉ số

6.1.1. Khái niệm và đặc điểm của phương pháp chỉ số

6.1.1.1. Khái niệm

Chỉ số trong thống kê là số tương đối (tính bằng đơn vị lần hoặc %), biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng nghiên cứu.

Ví dụ 1: Sản lượng sản xuất của doanh nghiệp A năm 2008 so năm 2007 bằng 1,103 lần hay 110,3%.

Ví dụ 2: Giá máy vi tính HP của cửa hàng A so với giá máy vi tính cùng loại đó của cửa hàng B trong tháng 3/2009 bằng 0,965 lần hay 96,5%.

Ví dụ 3: Doanh thu thực tế của doanh nghiệp A so với doanh thu kế hoạch trong năm 2008 bằng 1,58 lần hay 158%.

Vậy chỉ số là số tương đối, phải chăng số tương đối là chỉ số? Từ khái niệm trên ta thấy, chỉ số biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng nghiên cứu. Còn số tương đối không những biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng nghiên cứu mà còn biểu hiện quan hệ so sánh giữa hai hiện tượng khác nhau.

Như vậy, chỉ số là số tương đối. Nhưng số tương đối thì chưa chắc đã là chỉ số. Nó chỉ tương đương khi là số tương đối động thái, số tương đối kế hoạch và số tương đối không gian. Còn số tương đối cường độ và số tương đối kết cấu không phải là chỉ số.

6.1.1.2. Đặc điểm của phương pháp chỉ số

Trong thực tế, đối tượng nghiên cứu chủ yếu của phương pháp chỉ số là các hiện tượng kinh tế phức tạp. Đó là các hiện tượng bao gồm nhiều đơn vị hoặc hiện tượng cá biệt có đặc điểm, tính chất khác nhau. Chẳng hạn, khi nghiên cứu về lượng hàng hoá tiêu thụ trên thị trường, có rất nhiều loại hàng hoá khác nhau, mỗi loại có một giá trị sử dụng riêng biệt với đơn vị tính cụ thể.

Mặt khác, các hiện tượng đó lại chịu ảnh hưởng của nhiều nhân tố khác nhau, chẳng hạn với lượng hàng hoá tiêu thụ trên thị trường thì bị ảnh hưởng bởi giá bán, thị hiếu tiêu dùng, phong tục, tập quán...

Xuất phát từ đặc điểm của đối tượng nghiên cứu như vậy mà phương pháp chỉ số có hai đặc điểm rất cơ bản là:

Khi muốn so sánh hai mức độ của một hiện tượng bao gồm nhiều đơn vị hoặc phần tử có đặc điểm, tính chất khác nhau trước hết ta phải chuyển chúng về dạng giống nhau để có thể cộng và so sánh trực tiếp được với nhau.

Ví dụ: Lượng hàng tiêu thụ có nhiều loại khác nhau, nhưng nếu nhân với giá bán đơn vị ta sẽ thu được chỉ tiêu doanh thu, khi đó có thể cộng và so sánh trực tiếp với nhau được.

Page 116: Nguyen ly thong ke

Bài 6: Chỉ số

116 v1.0

Khi có nhiều nhân tố tham gia tính toán, để nghiên cứu biến động của một nhân tố thì phải giả định các nhân tố khác không đổi.

Ví dụ: để nghiên cứu sự thay đổi của khối lượng sản phẩm, ta phải cố định giá thành và ngược lại.

6.1.2. Tác dụng của chỉ số trong thống kê

Chỉ số là một phương pháp không những có khả năng nêu lên biến động tổng hợp của hiện tượng phức tạp mà còn có thể phân tích sự biến động này. Trong thống kê, chỉ số có các tác dụng cụ thể sau:

Nghiên cứu sự biến động của hiện tượng qua thời gian thông qua chỉ số phát triển.

Nghiên cứu sự biến động của hiện tượng qua không gian thông qua chỉ số không gian.

Nêu nhiệm vụ kế hoạch hay phân tích tình hình thực hiện kế hoạch đối với các chỉ tiêu kinh tế thông qua chỉ số nhiệm vụ kế hoạch và chỉ số hoàn thành kế hoạch.

Phân tích biến động của hiện tượng do ảnh hưởng biến động của các nhân tố thông qua phân tích các hệ thống chỉ số.

Ví dụ: Phân tích biến động của doanh thu do ảnh hưởng biến động của lượng hàng hoá tiêu thụ và ảnh hưởng biến động của giá bán đơn vị.

6.1.3. Phân loại chỉ số

Có nhiều căn cứ để phân loại chỉ số.

6.1.3.1. Căn cứ vào nội dung mà chỉ số phản ánh

Chỉ số phát triển: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai thời gian khác nhau.

Chỉ số không gian: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai điều kiện không gian khác nhau.

Chỉ số kế hoạch: biểu hiện quan hệ so sánh giữa các mức độ thực tế và kế hoạch của chỉ tiêu nghiên cứu bao gồm chỉ số nhiệm vụ kế hoạch và chỉ số thực hiện kế hoạch.

6.1.3.2. Căn cứ vào tính chất của chỉ tiêu nghiên cứu

Chỉ số chỉ tiêu chất lượng: phản ánh sự biến động của một chỉ tiêu chất lượng nào đó.

Ví dụ: Chỉ số giá thành, chỉ số giá cả, chỉ số NSLĐ...

Chỉ số chỉ tiêu khối lượng: phản ánh sự biến động của một chỉ tiêu khối lượng nào đó.

Ví dụ: Chỉ số khối lượng sản phẩm, chỉ số lượng hàng tiêu thụ...

6.1.3.3. Căn cứ vào phạm vi tính toán

Chỉ số đơn (chỉ số cá thể): phản ánh sự biến động của từng đơn vị, hiện tượng cá biệt.

Ví dụ: Chỉ số đơn về giá cả, phản ánh sự biến động về giá cả của từng mặt hàng.

Chỉ số tổng hợp (chỉ số chung): phản ánh sự biến động chung của nhiều đơn vị hoặc hiện tượng cá biệt.

Page 117: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 117

Ví dụ: Chỉ số tổng hợp giá cả, phản ánh sự biến động chung về giá cả của một số

mặt hàng.

Chú ý

Khi viết chỉ số, chỉ tiêu chất lượng viết trước, chỉ tiêu số lượng viết sau.

Trên đây là những vấn đề chung về chỉ số. Trong phần tiếp theo chúng ta sẽ đi sâu vào nghiên cứu phương pháp tính hai chỉ số hay được sử dụng nhiều nhất, đó là chỉ số

phát triển và chỉ số không gian.

6.2. Chỉ số phát triển

Ví dụ: Số liệu về tình hình tiêu thụ 3 loại hàng hóa khác nhau của 1 cửa hàng như sau:

Giá bán đơn vị (1.000 đồng) Lượng hàng tiêu thụ

Tên hàng Kỳ gốc p0

Kỳ nghiên cứu p1

Kỳ gốc

q0

Kỳ nghiên cứu

q1

A 30 45 1.000 1.100

B 50 60 2.000 2.400

C 20 22 4.000 4.200

Trong đó, đơn vị tính lượng hàng tiêu thụ của 3 mặt hàng khác nhau.

Các ký hiệu: p – q: Giá – lượng.

0 – 1: Kỳ gốc – kỳ nghiên cứu.

i – I: Chỉ số đơn – chỉ số tổng hợp.

6.2.1. Chỉ số đơn (relative index)

Trong phần này, bài giảng sẽ trình bày hai loại chỉ số đơn tiêu biểu là chỉ số đơn của

chỉ tiêu chất lượng và chỉ số đơn của chỉ tiêu khối lượng.

6.2.1.1. Chỉ số đơn của chỉ tiêu chất lượng

Để đưa ra cách tính chỉ số đơn của chỉ tiêu chất lượng, lấy giá cả hàng hoá làm ví dụ, khi đó, chỉ số đơn về giá biểu hiện quan hệ so sánh giữa mức giá của từng mặt hàng ở

kỳ nghiên cứu so với kỳ gốc.

Công thức: 1p

0

pi

p (lần, %)

Với ví dụ trên ta có:

A

1Ap

0A

p 45i 1,5

p 30 lần (hay 150%)

Vậy giá bán mặt hàng A kỳ gốc so với kỳ nghiên cứu bằng 1,5 lần hay 150%, tức là tăng 50%.

6.2.1.2. Chỉ số đơn của chỉ tiêu khối lượng

Để tính chỉ số đơn của chỉ tiêu khối lượng, lấy lượng hàng hóa tiêu thụ làm ví dụ, khi đó, chỉ số đơn về lượng biểu hiện quan hệ so sánh giữa khối lượng tiêu thụ của từng mặt hàng ở kỳ nghiên cứu so với kỳ gốc.

Page 118: Nguyen ly thong ke

Bài 6: Chỉ số

118 v1.0

Công thức: 1q

0

qi

q (lần, %)

Với ví dụ trên ta có:

A

1Aq

0A

q 1.100i 1,1

q 1.000 lần hay 110%

Vậy khối lượng tiêu thụ mặt hàng A kỳ gốc so với kỳ nghiên cứu là 1,1 lần hay 110%, tức là tăng 10%.

Từ công thức tính hai chỉ số đơn như ở trên; ta thấy, chỉ số đơn tuy đơn giản, dễ tính nhưng nó cũng có những hạn chế nhất định.

6.2.1.3. Hạn chế của chỉ số đơn

Không cho biết sự biến động chung của các nhóm hàng hoá khác nhau vì các mặt hàng khác nhau, giá trị sử dụng khác nhau, đơn vị tính khác nên không thể cộng chúng lại với nhau được.

Không loại bỏ tác động của các yếu tố khác, chẳng hạn như lượng hàng tiêu thụ.

Không phân tích được sự biến động của doanh thu.

Ví dụ: Api = 1,5 lần hay giá kỳ nghiên cứu so với kỳ gốc tăng 50% nhưng không thể

nói doanh thu tăng 50%.

Để khắc phục những hạn chế ở trên đòi hỏi phải có một loại chỉ số khác phản ánh tác động tổng hợp của cả hai nhân tố, đó chính là chỉ số tổng hợp.

6.2.2. Chỉ số tổng hợp (composite index)

Cũng tương tự như ở chỉ số đơn, trong phần này sẽ trình bày hai loại chỉ số tổng hợp tiêu biểu là chỉ số tổng hợp của chỉ tiêu chất lượng (lấy giá cả hàng hoá làm ví dụ) và chỉ số tổng hợp của chỉ tiêu khối lượng (lấy khối lượng hàng hoá làm ví dụ).

6.2.2.1. Chỉ số tổng hợp của chỉ tiêu chất lượng

Chỉ số tổng hợp về giá cả biểu hiện quan hệ so sánh giữa giá bán của một nhóm hay toàn bộ mặt hàng ở kỳ nghiên cứu so với kỳ gốc và qua đó phản ánh biến động chung giá bán của các mặt hàng.

Xuất phát từ quan hệ: Doanh thu = Giá bán đơn vị Lượng hàng tiêu thụ

DT = p q

∑DT = ∑p q

Để nghiên cứu biến động của chỉ tiêu doanh thu, ta tính chỉ số doanh thu bằng cách lấy tổng doanh thu kỳ nghiên cứu chia cho tổng doanh thu kỳ gốc.

Ipq = 1 1

0 0

p q

p q

Nhìn vào công thức trên, ta thấy, các hai nhân tố giá và lượng đều biến động. Do đó, để nghiên cứu sự biến động chung của giá cả thì phải cố định lượng hàng tiêu thụ ở

Page 119: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 119

một kỳ nhất định. Lượng hàng tiêu thụ được cố định ở thời kỳ nhất định đó được gọi là quyền số của chỉ số tổng hợp về giá cả.

Ip = 1

0

p q

p q

Tùy thuộc vào việc lựa chọn thời kỳ cho quyền số mà có 3 loại chỉ số tổng hợp về giá sau:

Chỉ số tổng hợp giá cả Laspeyres

Quyền số được chọn là q0, lượng hàng tiêu thụ kỳ gốc.

Công thức: 1 0Lp

0 0

p qI

p q

(lần, %)

Trong đó:

o p0q0: Tổng doanh thu bán hàng hoá ở kỳ gốc.

o p1q0: Tổng doanh thu bán hàng hoá kỳ gốc với giả định giá bán ở kỳ nghiên cứu.

o p1q0 – p0q0: Chênh lệch doanh thu bán hàng kỳ nghiên cứu so với kỳ gốc do ảnh hưởng của nhân tố giá trong điều kiện lượng hàng tiêu thụ được cố định ở kỳ gốc.

Ví dụ:

1 0Lp

0 0

p q 45 1.000 60 2.000 22 4.000 253.000I

p q 30 1.000 50 2.000 20 4.000 210.000

= 1,2048 lần

hay 120,48 (%)

Chỉ số này mang tính giả định, ít có ý nghĩa thực tế; tuy nhiên lại có tính kịp thời cao vì chỉ cần bước vào đầu kỳ nghiên cứu nếu có p1 thì sẽ tính ngay được chỉ số này. Chỉ số này không được sử dụng nhiều.

Trong trường hợp dữ liệu đã xác định được chỉ số đơn về giá và mức tiêu thụ của từng mặt hàng ở kỳ gốc thì chỉ số tổng hợp về giá của Laspeyres được tính theo công thức sau:

p 0 01 0Lp

0 0 0 0

i p qp qI

p q p q

Với công thức trên, quyền số là mức doanh thu bán hàng kỳ gốc của từng mặt hàng.

Nếu đặt d0 là kết cấu (hay tỷ trọng) doanh thu kỳ gốc của từng mặt hàng:

0 00

0 0

p qd

p q

(lần) 0 00

0 0

p qD 100

p q

(%)

Ta có chỉ số tổng hợp về giá của Laspeyres được xác định như sau:

p 0Lp p 0

i DI i d

100

Như vậy, quyền số trong trường hợp này là tỷ trọng doanh thu của từng mặt hàng ở kỳ gốc.

Tóm lại

Thực chất chỉ số tổng hợp về giá là chỉ số bình quân cộng gia quyền của các chỉ số đơn về giá ip với quyền số là doanh thu bán hàng hoá kỳ gốc (p0q0) hoặc tỷ trọng doanh thu bán hàng kỳ gốc (d0, D0) của từng mặt hàng.

Page 120: Nguyen ly thong ke

Bài 6: Chỉ số

120 v1.0

Chỉ số tổng hợp giá cả Paasche

Quyền số được chọn là q1 – lượng hàng tiêu thụ kỳ nghiên cứu.

Công thức: 1 1Pp

0 1

p qI

p q

(lần, %)

Trong đó:

o p1q1: Tổng doanh thu bán hàng hoá kỳ nghiên cứu.

o p0q1: Tổng doanh thu bán hàng hoá kỳ nghiên cứu với giá bán ở kỳ gốc.

o p1q1 – p0q1: Chênh lệch doanh thu bán hàng kỳ nghiên cứu so với kỳ gốc do ảnh hưởng của nhân tố giá trong điều kiện lượng hàng tiêu thụ được cố định ở kỳ nghiên cứu.

Ví dụ:

1 1Pp

0 1

p q 45 1.100 60 2.400 22 4.200 285.900I

p q 30 1.100 50 2.400 20 4.200 237.000

= 1,2063 lần (120,63%)

Chỉ số này có ý nghĩa thực tế và thường đến cuối kỳ mới tính được nhưng chỉ để phân tích mà không thể điều chỉnh.

Trong trường hợp dữ liệu đã xác định được chỉ số đơn về giá và mức tiêu thụ của từng mặt hàng ở kỳ nghiên cứu thì chỉ số tổng hợp giá Paashe được tính theo công thức như sau:

1 1 1 1Pp

1 10 1

p

p q p qI

p qp qi

Nếu đặt d1 là kết cấu doanh thu kỳ nghiên cứu của từng mặt hàng:

1 11

1 1

p qd

p q

(lần) 1 11

1 1

p qD 100

p q

(%)

Ta có chỉ số tổng hợp giá Paashe theo công thức sau:

Pp

1 1p p

1 100I

1 1d D

i i

Tóm lại

Thực chất chỉ số tổng hợp về giá là chỉ số bình quân cộng điều hoà gia quyền của các chỉ số đơn về giá ip với quyền số là mức doanh thu bán hàng hoá kỳ nghiên cứu (p1q1) hoặc tỷ trọng doanh thu kỳ nghiên cứu (d1, D1) của từng mặt hàng.

Trong thực tế, kết quả tính toán chỉ số tổng hợp về giá theo các công thức của Laspeyres và Paasche thường có sự chênh lệch. Nguyên nhân cơ bản của sự chênh lệch đó là sự khác biệt về thời kỳ quyền số. Nói cách khác, đó là kết quả của sự thay đổi cơ cấu tiêu thụ của các mặt hàng giữa hai kỳ. Để san bằng sự khác biệt đó, người ta thường tính một chỉ số khác.

Page 121: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 121

Chỉ số tổng hợp giá cả Fisher

Chỉ số này sử dụng kết hợp quyền số q0 và q1 để loại bỏ ảnh hưởng do biến động

cơ cấu tiêu thụ và vận dụng trong trường hợp có sự chênh lệch lớn giữa LpI và P

pI .

Chỉ tổng hợp giá cả Fisher được tính theo công thức bình quân nhân như sau:

Công thức: 1 0 1 1F L PP P p

0 0 0 1

p q p qI I I

p q p q

(lần, %)

Ví dụ:

F L PP P pI I I 1,2048 1,2063 = 1,2055 lần (120,55%)

Tóm lại: Khi tính chỉ số tổng hợp về giá, quyền số có thể là: q0, q1, p0q0, p1q1, d0, d1, D0, D1.

6.2.2.2. Chỉ số tổng hợp của chỉ tiêu khối lượng

Chỉ số tổng hợp lượng hàng tiêu thụ biểu hiện quan hệ so sánh giữa khối lượng tiêu thụ của một nhóm hay toàn bộ các mặt hàng thuộc phạm vi nghiên cứu giữa hai thời gian, qua đó phản ánh biến động chung về khối lượng tiêu thụ của các mặt hàng.

1q

0

pqI

pq

Như vậy, khi nghiên cứu sự biến động về lượng hàng tiêu thụ chung, ta phải cố định nhân tố giá cả, tức giá cả đóng vai trò là quyền số. Tương tự như trên, có 3 chỉ số tổng hợp về lượng hàng tiêu thụ.

Chỉ số tổng hợp lượng hàng tiêu thụ của Laspeyres Quyền số được chọn là p0 – giá cả hàng hoá kỳ gốc.

0 1Lq

0 0

p qI

p q

Trong đó:

o p0q0: Tổng doanh thu kỳ gốc.

o p0q1: Tổng doanh thu kỳ nghiên cứu với giá bán ở kỳ gốc.

o p0q1 – p0q0: Chênh lệch tổng doanh thu kỳ nghiên cứu so với kỳ gốc do ảnh

hưởng của lượng hàng tiêu thụ trong điều kiện giá bán được cố định ở kỳ gốc.

Ngược với chỉ số tổng hợp về giá, chỉ số tổng hợp về lượng của Laspeyres lại có ý nghĩa thực tế.

Trong trường hợp ta có chỉ số đơn về lượng và doanh thu của từng mặt hàng ở kỳ gốc thì chỉ số tổng hợp về lượng Laspeyres được tính theo công thức sau:

q 0 00 1Lq

0 0 0 0

i p qp qI

p q p q

Page 122: Nguyen ly thong ke

Bài 6: Chỉ số

122 v1.0

Nếu biết kết cấu doanh thu của từng mặt hàng:

0 00

0 0

p qd

p q

(lần) 0 00

0 0

p qD 100

p q

(%)

Ta có chỉ số tổng hợp về lượng Laspeyres được xác định như sau:

q 0Lq q 0

i DI i d

100

a Tóm lại

Thực chất chỉ số tổng hợp về lượng hàng hoá tiêu thụ chính là chỉ số bình quân cộng gia quyền của các chỉ số đơn về lượng hàng hoá tiêu thụ iq với quyền số là doanh thu bán hàng hoá kỳ gốc (p0q0) hoặc tỷ trọng doanh thu kỳ gốc (d0, D0) của từng mặt hàng.

Chỉ số tổng hợp lượng hàng tiêu thụ của Paasche

Quyền số được chọn là p1 – giá cả hàng hoá kỳ nghiên cứu.

1 1Pq

1 0

p qI

p q

Trong đó:

o p1q0: Tổng doanh thu kỳ gốc tính giả định với giá ở kỳ nghiên cứu.

o p1q1: Tổng doanh thu thực tế kỳ nghiên cứu.

o p1q1 – p1q0: Chênh lệch tổng doanh thu kỳ nghiên cứu so với kỳ gốc do ảnh hưởng của lượng hàng tiêu thụ trong điều kiện giá bán được cố định ở kỳ nghiên cứu.

Trong trường hợp ta có chỉ số đơn về lượng và mức tiêu thụ của từng mặt hàng ở kỳ nghiên cứu thì chỉ số tổng hợp về lượng Paasche được tính theo công thức bình quân như sau:

1 1 1 1Pq

1 01 1

q

p q p qI

1p q p qi

Nếu biết kết cấu doanh thu của từng mặt hàng:

1 11

1 1

p qd

p q

(lần) 1 11

1 1

p qD 100

p q

(%)

Ta có chỉ số tổng hợp về lượng Paasche theo công thức sau:

Pq

1 1q q

1 100I

1 1d D

i i

a Tóm lại

Thực chất chỉ số tổng hợp về lượng hàng hoá tiêu thụ chính là chỉ số bình quân cộng điều hoà gia quyền của các chỉ số đơn về lượng hàng hoá tiêu thụ iq với quyền số là doanh thu bán hàng hoá kỳ nghiên cứu (p1q1) hoặc tỷ trọng doanh thu kỳ nghiên cứu (d1, D1) của từng mặt hàng.

Page 123: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 123

Chỉ số tổng hợp lượng hàng tiêu thụ của Fisher

Chỉ số tổng hợp lượng hàng tiêu thụ của Fisher sử dụng kết hợp quyền số là giá của các mặt hàng kỳ gốc và kỳ nghiên cứu thông qua công thức sau:

0 1 1 1F L Pq q q

0 0 1 0

p q p qI I I

p q p q

Tương tự như với chỉ số tổng hợp giá cả Fisher, chỉ số này chỉ nên dùng khi có sự

khác biệt lớn giữa hai chỉ số LqI và P

qI .

Tóm lại: Khi tính chỉ số tổng hợp về lượng hàng tiêu thụ, quyền số có thể là: p0, p1, p0q0, p1q1, d0, d1, D0, D1.

6.3. Chỉ số không gian

Chỉ số không gian biểu hiện mối quan hệ so sánh giữa hai mức độ của hiện tượng ở hai điều kiện không gian khác nhau.

Tương tự như với chỉ số phát triển, trong chỉ số không gian, ta sẽ tính hai loại chỉ số đơn và chỉ số tổng hợp; với chỉ tiêu chất lượng lấy giá cả làm ví dụ, với chỉ tiêu khối lượng, lấy lượng hàng tiêu thụ làm ví dụ.

Ví dụ: Tài liệu về giá bán và sản lượng tiêu thụ một số mặt hàng tivi LCD tại hai cửa hàng như sau:

Cửa hàng A Cửa hàng B

Mặt hàng Giá đơn vị

(triệu đồng) Lượng tiêu thụ

(sản phẩm) Giá đơn vị

(triệu đồng) Lượng tiêu thụ

(sản phẩm)

X 5,0 250 4,8 262

Y 4,6 430 4,9 392

Z 6,9 187 6,8 213

6.3.1. Chỉ số đơn

6.3.1.1. Chỉ số đơn của chỉ tiêu chất lượng

Chỉ số đơn về giá phản ánh quan hệ so sánh về giá bán của từng mặt hàng ở hai không gian khác nhau.

Công thức: A

B

Ap

B

pi

p hoặc

B

A A

B

Bp

A p

p 1i

p i (lần, %)

Ví dụ trên: A

B

XX Ap X

B

p 5i

p 4,8 = 1,0417 (lần)

B

A A

B

XX Bp X X

A p

p 4,8 1i 0,96

p 5 i (lần)

Page 124: Nguyen ly thong ke

Bài 6: Chỉ số

124 v1.0

6.3.1.2. Chỉ số đơn của chỉ tiêu khối lượng

Chỉ số đơn về lượng phản ánh quan hệ so sánh về lượng tiêu thụ của từng mặt hàng ở hai không gian khác nhau.

Công thức: A

B

Aq

B

qi

q hoặc

B

A A

B

Bq

A q

q 1i

q i (lần, %)

Ví dụ trên: A

B

XX Aq X

B

q 250i 0,9542

q 262 (lần)

B

A A

B

XX Bq X X

A q

q 262 1i 1,048

q 250 i (lần)

Hạn chế của chỉ số đơn không gian cũng giống như chỉ số đơn phát triển là không thể tính được cho nhiều mặt hàng cũng như không phản ánh được tác động tổng hợp của cả giá và lượng. Do đó, để phân tích, người ta cũng thường hay sử dụng chỉ số tổng hợp không gian.

6.3.2. Chỉ số tổng hợp

6.3.2.1. Chỉ số tổng hợp của chỉ tiêu chất lượng

Chỉ số tổng hợp về giá so sánh giá bán của một nhóm hay toàn bộ các mặt hàng ở hai điều kiện không gian khác nhau.

Công thức: A

B

Ap

B

p QI

p Q

hoặc B

A A

B

Bp

A p

p Q 1I

p Q I

(lần, %)

Thông thường các chỉ tiêu chất lượng thường lấy lượng hàng tiêu thụ q làm quyền số. Vấn đề là lượng hàng tiêu thụ trên không gian nào? Trong trường hợp này việc lấy qA hay qB làm quyền số đều không thoả đáng. Vì vậy, trong điều kiện cùng thời gian và khác biệt về không gian thì chỉ số tổng hợp giá so sánh giữa hai không gian A và B sẽ phải lấy Q = qA + qB là lượng tiêu thụ của từng mặt hàng ở cả hai không gian làm quyền số để đảm bảo tính đồng nhất. Khi đó chỉ số tổng hợp về giá được tính như sau:

A

B

A A A Bp

B B A B

p Q p q qI

p Q p q q

Ví dụ:

A

B

A A A Bp

B B A B

p Q p q qI

p Q p q q

5 250 262 4,6 430 392 6,9 187 213

4,8 250 262 4,9 430 392 6,8 187 213

= 0,9887 (lần)

Vậy giá bán các mặt hàng ở cửa hàng A chỉ bằng 0,9887 lần (hay 98,87%) giá bán các mặt hàng ở cửa hàng B.

6.3.2.2. Chỉ số tổng hợp của chỉ tiêu khối lượng

Chỉ số tổng hợp về lượng so sánh lượng hàng hóa của một nhóm hay toàn bộ các mặt hàng ở hai điều kiện không gian khác nhau.

Page 125: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 125

Công thức: A

B

Ap

B

pqI

pq

hoặc B

A A

B

Bp

A p

pq 1I

pq I

(lần, %)

Chỉ số tổng hợp về lượng lấy giá cả p làm quyền số. Trong thực tế có hai loại giá khác

nhau có thể dùng để làm quyền số để tính chỉ số không gian.

Trong trường hợp, nếu giá trị của p đã được Nhà nước hoặc các Bộ, ngành quy định

chung cho các doanh nghiệp, khi đó ta có thể lấy mức giá cố định pn đó làm quyền số.

Chẳng hạn ở Việt Nam hiện nay, người ta thường dùng giá cố định năm 1994 trong

các tính toán so sánh. Khi đó:

Công thức: A

B

n Ap

n B

p qI

p q

hoặc B

A A

B

n Bp

n A p

p q 1I

p q I

(lần, %)

Còn nếu giá trị của p chưa thống nhất giữa các địa phương, thì phải dùng giá bình

quân trên cả hai không gian p làm quyền số. Khi đó:

Công thức: A

B

Ap

B

pqI

pq

hay B

A A

B

Bp

pA

pq 1I

Ipq

(lần, %)

với A A B B

A B

p q p qp

q q

Ví dụ: B B

A B

X X X XA A

X X X

p q p q 5 250 4,8 262p

q q 250 262

4,9 triệu đồng

B B

A B

Y Y Y YA A

Y Y Y

p q p q 4,6 430 4,9 392p

q q 430 392

4,7 triệu đồng

B B

A B

Z Z Z ZA A

Z Z Z

p q p q 6,9 187 6,8 213p

q q 187 213

6,8 triệu đồng

A

B

Ap

B

pq 4,9 250 4,7 430 6,8 187I 0,9875

4,9 262 4,7 392 6,8 213pq

(lần)

Vậy lượng tiêu thụ các mặt hàng ở cửa hàng A bằng 0,9875 (lần hay 98,75%) lượng

tiêu thụ các mặt hàng ở cửa hàng B.

Qua cách tính các chỉ số ở trên cho thấy, việc vận dụng tính và phân tích mỗi chỉ số

chỉ cho phép đưa ra những thông tin phản ánh sự biến động của một hiện tượng

nghiên cứu một cách riêng biệt. Trong khi đó, nhiều nội dung nghiên cứu trong các

lĩnh vực kinh tế – xã hội và trong hoạt động kinh doanh đòi hỏi phải phân tích mối

liên hệ tác động giữa các hiện tượng. Vì vậy, khi vận dụng các chỉ số thống kê để

phân tích mối quan hệ giữa các hiện tượng, có thể kết hợp các chỉ số thành hệ thống

chỉ số. Vậy hệ thống chỉ số là gì? Xây dựng hệ thống chỉ số như thế nào?

Page 126: Nguyen ly thong ke

Bài 6: Chỉ số

126 v1.0

6.4. Hệ thống chỉ số

6.4.1. Một số khái niệm chung về hệ thống chỉ số

6.4.1.1. Khái niệm và cấu thành của hệ thống chỉ số

Khái niệm: Hệ thống chỉ số là một đẳng thức phản ánh mối liên hệ giữa các chỉ số.

Chính vì hệ thống chỉ số phản ánh mối liên hệ giữa các chỉ số cho nên để xây dựng hệ thống chỉ số phải dựa vào quan hệ giữa các chỉ tiêu.

Ví dụ: Sản lượng = Năng suất Số công nhân

Hệ thống chỉ số: Chỉ số sản lượng = Chỉ số năng suất Chỉ số số công nhân

Ví dụ: Doanh thu = Giá bán đơn vị Lượng hàng tiêu thụ

Hệ thống chỉ số: Chỉ số doanh thu = Chỉ số giá bán Chỉ số lượng hàng tiêu thụ

Ví dụ: Chi phí sản xuất = Giá thành đơn vị Khối lượng sản phẩm

Hệ thống chỉ số:

Chỉ số chi phí sản xuất = Chỉ số giá thành Chỉ số khối lượng sản phẩm

(Chỉ số toàn bộ) (Chỉ số nhân tố) (Chỉ số nhân tố)

Cấu thành của hệ thống chỉ số: gồm có 2 thành phần

o Chỉ số toàn bộ: phản ánh sự biến động của hiện tượng phức tạp do ảnh hưởng của các nhân tố cấu thành.

Ví dụ: Chỉ số sản lượng, chỉ số doanh thu, chi phí sản xuất ở ví dụ trên.

o Các chỉ số nhân tố: bao gồm từ 2 chỉ số nhân tố trở lên, trong đó, mỗi chỉ số nhân tố phản ánh ảnh hưởng biến động của từng nhân tố đối với biến động của hiện tượng phức tạp cấu thành từ nhiều nhân tố.

Ví dụ: Chỉ số năng suất, chỉ số số công nhân...

6.4.1.2. Tác dụng của hệ thống chỉ số

Trong phân tích thống kê, hệ thống chỉ số được vận dụng đối với các chỉ tiêu có mối liên hệ với nhau; khi đó nó có hai tác dụng chủ yếu sau:

Xác định vai trò và mức độ ảnh hưởng biến động của các nhân tố đối với sự biến động của hiện tượng phức tạp. Trong đó, ảnh hưởng của từng nhân tố có thể biểu hiện bằng số tuyệt đối hay số tương đối.

Dựa vào hệ thống chỉ số có thể nhanh chóng xác định được các chỉ số chưa biết khi đã biết các chỉ số khác trong hệ thống.

6.4.2. Hệ thống chỉ số tổng hợp

Cơ sở xây dựng hệ thống chỉ số tổng hợp là mối liên hệ thực tế giữa các chỉ tiêu và được biểu hiện bằng các công thức hoặc các phương trình kinh tế.

Có hai phương pháp xây dựng hệ thống chỉ số. Lấy phân tích biến động doanh thu làm ví dụ.

Phương pháp ảnh hưởng biến động riêng biệt

Đặc điểm của phương pháp này là quyền số của các chỉ số nhân tố đều lấy ở kỳ gốc.

Page 127: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 127

L Lpq p qI I I K

Trong đó: K là chỉ số liên hệ phân tích tác động đồng thời của các nhân tố tới sự biến động của toàn bộ hiện tượng.

Phương pháp liên hoàn

Các nhân tố cấu thành hiện tượng đều biến động. Nghiên cứu ảnh hưởng của từng nhân tố giả định các nhân tố lần lượt biến động. Chỉ số toàn bộ bằng tích của các chỉ số nhân tố. Mẫu số của chỉ số nhân tố đứng trước tương ứng là tử số của chỉ số nhân tố đứng sau. Sự kết hợp của các chỉ số nhân tố hình thành một dãy các chỉ số liên tục và khép kín đảm bảo quan hệ cân bằng.

Chênh lệch tuyệt đối giữa tử số và mẫu số của chỉ số toàn bộ bằng tổng các chênh lệch tuyệt đối giữa tử số và mẫu số của các chỉ số nhân tố. Đây chính là biến động tuyệt đối của chỉ tiêu nghiên cứu do ảnh hưởng của các nhân tố cấu thành.

Quyền số của các chỉ số nhân tố lấy ở các kỳ khác nhau. Trong thực tế, quyền số của chỉ số chỉ tiêu chất lượng là chỉ tiêu khối lượng liên quan được lấy ở kỳ nghiên cứu, còn quyền số của chỉ số chỉ tiêu khối lượng là chỉ tiêu chất lượng liên quan được lấy ở kỳ gốc.

Hệ thống chỉ số phân tích biến động tổng doanh thu:

1 1 1 1 0 1

0 0 0 1 0 0

p q p q p q

p q p q p q

Biến động tương đối: IDT = Ipq = Ip x Iq

Biến động tuyệt đối: ∑p1q1 – ∑p0q0 = (∑p1q1 – ∑p0q1) + (∑p0q1 – ∑p0q0)

∆pq = ∆p + ∆q

∆pq: Biến động chung của tổng doanh thu kỳ nghiên cứu so với kỳ gốc.

∆p: Biến động của tổng doanh thu do ảnh hưởng biến động của giá bán đơn vị.

∆q: Biến động của tổng doanh thu do ảnh hưởng biến động của lượng hàng tiêu thụ.

Ví dụ: Số liệu về tình hình tiêu thụ 3 loại hàng hóa khác nhau của 1 cửa hàng (phần chỉ số phát triển):

1 1 1 1 0 1

0 0 0 1 0 0

p q p q p q

p q p q p q

Thay số: 285.900 285.900 237.000

210.000 237.000 210.000

Biến động tương đối: 1,3614 = 1,2063 1,1286

136,14% = 120,63% 112,86%

(+36,14%) (+20,63%) (+12,86%)

Biến động tuyệt đối:

285.900 – 210.000 = (285.900 – 237.000) + (237.000 – 210.000)

75.900 = 48.900 + 27.000 (nghìn đồng)

Page 128: Nguyen ly thong ke

Bài 6: Chỉ số

128 v1.0

Nhận xét: Tổng doanh thu 3 mặt hàng kỳ nghiên cứu bằng 136,14% kỳ gốc, tức đã tăng 36,14%, tương ứng với 75.900 nghìn đồng do các nhân tố:

o Sự biến động về giá bán chung của 3 mặt hàng kỳ nghiên cứu làm cho tổng doanh thu thay đổi 120,63% kỳ gốc, tức đã tăng 20,63% tương ứng với một lượng tuyệt đối là 48.900 nghìn đồng.

o Sự biến động về khối lượng tiêu thụ chung của 3 mặt hàng làm cho tổng doanh thu thay đổi 112,86% so với kỳ gốc, tức đã tăng 12,86% tương ứng với một lượng tuyệt đối là 27.000 nghìn đồng.

Tóm lại, tổng doanh thu của 3 mặt hàng kỳ nghiên cứu so với kỳ gốc tăng lên do cả hai nhân tố giá và lượng đều tăng lên, trong đó sự tăng lên của giá cả đóng vai trò quan trọng hơn sự tăng lên của lượng hàng tiêu thụ.

6.4.3. Hệ thống chỉ số số bình quân

Trong bài học số 3, số bình quân được tính theo công thức:

i ii i

i

x fx x d

f

Từ công thức số bình quân như vậy, ta thấy số bình quân phụ thuộc vào hai nhân tố: (1) Lượng biến của tiêu thức nghiên cứu và (2) Kết cấu của tổng thể nghiên cứu.

Ví dụ: i iNSLD CNNSLD

CN

, vậy NSLĐ bình quân chịu ảnh hưởng của NSLĐ

cá biệt và kết cấu số công nhân trong tổng thể.

Trong đó:

NSLD : năng suất lao động bình quân.

NSLDi: năng suất lao động bình quân mức i.

CNi: số công nhân có mức NSLĐ i.

CN: tổng số công nhân.

Để phân tích sự biến động của số bình quân qua thời gian, hệ thống chỉ số được xây dựng như sau:

1 1 1 1 0 1

1 1 11

0 0 0 1 0 00

0 1 0

x f x f x f

f f fxx f x f x fx

f f f

hay: 1 1 1 1 0 11

0 0 0 1 0 00

x d x d x dx

x d x d x dx

Rút gọn: 011 1

0 01 0

xx x

x x x

Biến động tương đối: fxx dI I I

(1) (2) (3)

Page 129: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 129

Biến động tuyệt đối: 1 0 1 01 01 0x x x x x x

∆ = ∆x + ∆df

Trong đó:

1 11 1 1

1

x fx x d

f

: Số bình quân chung kỳ nghiên cứu.

0 00 0 0

0

x fx x d

f

: Số bình quân chung kỳ gốc.

0 101 0 1

1

x fx x d

f

: Số bình quân chung kỳ gốc tính với kết cấu kỳ nghiên cứu.

(1): Chỉ số cấu thành khả biến: phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của tất cả các nhân tố cấu thành.

(2): Chỉ số cấu thành cố định: phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của sự thay đổi lượng biến tiêu thức trong điều kiện kết cấu tổng thể không đổi.

(3): Chỉ số ảnh hưởng kết cấu: phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của sự thay đổi kết cấu tổng thể theo tiêu thức nghiên cứu.

Ví dụ:

Tài liệu tổng hợp về tình hình sản xuất tại các phân xưởng cùng sản xuất 1 sản phẩm:

Kỳ gốc Kỳ nghiên cứu

Phân

xưởng Sản lượng

(sản phẩm) q0

Giá thành sản phẩm

(nghìn đồng) Z0

Sản lượng

(sản phẩm) q1

Giá thành sản phẩm

(nghìn đồng) Z1

A 1.000 10 8.000 9,0

B 2.500 12 3.000 11,5

C 4.500 13 1.000 12,5

Yêu cầu: Phân tích biến động giá thành bình quân chung của xí nghiệp.

Hướng dẫn:

Ta có mối liên hệ:

i i

i

Z qZ

q

Giá thành bình quân chung của xí nghiệp biến động do 2 nhân tố: Giá thành sản phẩm của từng phân xưởng và kết cấu số lượng sản phẩm của từng phân xưởng.

Ta có hệ thống chỉ số:

1 1 1 1 0 1

1 1 1

0 0 0 1 0 0

0 1 0

Z q Z q Z q

q q q

Z q Z q Z q

q q q

Page 130: Nguyen ly thong ke

Bài 6: Chỉ số

130 v1.0

Tính toán:

PX q0 Z0 q1 Z1 Zoq0 Z1q1 Z0q1

A 1.000 10 8.000 9 10.000 72.000 9.000

B 2.500 12 3.000 11,5 30.000 34.500 28.750

C 4.500 13 1.000 12,5 58.500 12.500 56.250

∑ 8.000 12.000 98.500 119.000 129.000

Thay số, ta có:

119.000 119.000 129.00012.000 12.000 12.00098.500 129.000 98.5008.000 12.000 8.000

9,92 9,92 10,75

12,31 10,75 12,31

Biến động tương đối: 0,806 = 0,9228 0,873

(80,6%) (92,28%) (87,3%)

(–19,4%) (–7,72%) (–12,7%)

Biến động tuyệt đối: 9,92 – 12,31 = (9,92 – 10,75) + (10,75 – 12,31)

–2,39 = (–0,83) + (–1,56) (nghìn đồng)

Nhận xét: Giá thành sản phẩm bình quân chung của xí nghiệp kỳ nghiên cứu bằng 80,6% kỳ gốc, tức đã giảm 19,4% tương ứng là 2.390 đồng/sản phẩm là do ảnh hưởng tác động của các nhân tố:

Giá thành sản phẩm của các phân xưởng trong xí nghiệp kỳ nghiên cứu đã giảm so với kỳ gốc làm giá thành bình quân chung giảm 7,72%, tương ứng là 830 đồng/sản phẩm.

Biến động kết cấu số lượng sản phẩm của xí nghiệp theo các phân xưởng làm giá thành bình quân chung giảm 12,7%, tương ứng là 1.560 đồng/sản phẩm.

6.4.4. Hệ thống chỉ số tổng lượng biến tiêu thức

Cũng xuất phát từ bài 3, tổng lượng biến tiêu thức của một tổng thể nghiên cứu được tính:

i ii i i i

i

x fx f f x f

f

Trong đó: i

x là lượng biến tiêu thức với i

f là tần số tương ứng.

Như vậy, có hai cách để xác định nhân tố ảnh hưởng đến tổng lượng biến tiêu thức:

Cách thứ nhất: Tổng lượng biến được cấu thành từ hai nhân tố là bản thân các

lượng biến và số đơn vị (tần số) tương ứng ( i ix f ).

Ví dụ: Tổng sản lượng của doanh nghiệp bao gồm các phân xưởng khác nhau có thể chịu ảnh hưởng của hai nhân tố là năng suất lao động và quy mô lao động của từng phân xưởng.

Cách thứ hai: Tổng lượng biến tiêu thức được cấu thành từ hai nhân tố là chỉ tiêu

bình quân và tổng số đơn vị tổng thể ( ix f ).

Ví dụ: Cũng với chỉ tiêu tổng sản lượng trong ví dụ trên, có thể phân tích thành hai nhân tố là năng suất lao động bình quân chung và tổng số lao động của doanh nghiệp.

Page 131: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 131

Trong trường hợp phân tích theo cách thứ nhất thì sự kết hợp của các nhân tố cho phép thiết lập hệ thống chỉ số tổng hợp giống như khi phân tích chỉ tiêu doanh thu theo hai nhân tố giá và khối lượng tiêu thụ của các mặt hàng. Do vậy, ở đây chỉ đề cập đến hệ thống chỉ số phân tích tổng lượng biến tiêu thức theo cách thứ hai với các nhân tố bao gồm chỉ tiêu bình quân và tổng số đơn vị của tổng thể.

Hệ thống chỉ số:

1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

x f x f x f x f

x f x f x f x f

Biến động tương đối: xXf f

I I I

(1) (2) (3)

Biến động tuyệt đối: 1 1 0 0 1 0 1 1 0 0x f x f x x f f f x

∆ = x

+ ∆∑f

Trong đó:

(1): Biến động của tổng lượng biến tiêu thức kỳ nghiên cứu so với kỳ gốc.

(2): Biến động của tổng lượng biến tiêu thức do ảnh hưởng của sự biến động chỉ tiêu bình quân.

(3): Biến động của tổng lượng biến tiêu thức do ảnh hưởng của sự thay đổi tổng số đơn vị tổng thể.

Ví dụ: Từ ví dụ đã nêu ở phần hệ thống chỉ số số bình quân, yêu cầu phân tích biến động của tổng chi phí sản xuất 3 phân xưởng do ảnh hưởng của các nhân tố cấu thành.

Có thể thấy, chi phí sản xuất chịu ảnh hưởng bởi các nhân tố sau:

Thứ nhất, giá thành đơn vị từng phân xưởng (z) và sản lượng từng phân xưởng (q): với hai nhân tố ảnh hưởng này, khi phân tích biến động của tổng chi phí sản xuất 3 phân xưởng, ta sử dụng hệ thống chỉ số tổng hợp – tương tự như đã đề cập đến ở phần 6.4.2.

Thứ hai, giá thành đơn vị bình quân chung 3 phân xưởng ( z ) và tổng sản lượng

của 3 phân xưởng ( q ): khi phân tích, sử dụng hệ thống chỉ số tổng lượng biến

tiêu thức như vừa trình bày ở trên.

Hệ thống chỉ số:

1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

Z q Z q Z q Z q

Z q Z q Z q Z q

I∑Zq = Z q

I I

Biến động tương đối:

119.000 119.000 12,31 12.000

98.500 12,31 12.000 98.500

119.000 119.000 147.720

98.500 147.720 98.500

Page 132: Nguyen ly thong ke

Bài 6: Chỉ số

132 v1.0

1,2081 = 0,8056 1,4997

120,81% = 80,56% 149,97%

(+ 20,81%) (–19,44%) (+ 49,97%)

Biến động tuyệt đối: 1 1 0 1 0 1 1 0 00Z q Z q Z Z q q q Z

∆∑Zq = Z

+ ∆∑q

119.000 – 98.500 = (119.000 – 147.720) + (147.720 – 98.500)

20.500 = – 28.720 + 49.220 (nghìn đồng)

Nhận xét: Tổng chi phí sản xuất của 3 phân xưởng kỳ nghiên cứu bằng 120,81% kỳ gốc, tức đã tăng 20,81%, tương ứng với một lượng tuyệt đối là 20.500 nghìn đồng do ảnh hưởng của hai nhân tố:

Do biến động của giá thành đơn vị bình quân chung 3 phân xưởng làm cho tổng chi phí sản xuất giảm 19,44%, tương ứng một lượng tuyệt đối là 28.720 nghìn đồng.

Do biến động của tổng số sản phẩm sản xuất ra của cả 3 phân xưởng làm cho tổng chi phí sản xuất tăng 49,97%, tương ứng một lượng tuyệt đối là 49.220 nghìn đồng.

Như phần 6.4.3 đã nêu, có thể phân tích chỉ số chỉ tiêu bình quân thành 2 thành phần: lượng biến tiêu thức và kết cấu tổng thể theo tiêu thức nghiên cứu. Do đó, từ mô hình 2 nhân tố ở trên có thể xây dựng mô hình 3 nhân tố như sau:

Hệ thống chỉ số:

1 1 1 1 01 1 0 1

0 0 01 1 0 1 0 0

x f x f x f x f

x f x f x f x f

hay: 1 1 1 1 0 1 0 1

0 0 0 1 0 00 1

x f x f x f x f

x f x f x fx f

Biến động tương đối: I∑xf = Ix Idf I∑f

(1) (2) (3) (4)

Biến động tuyệt đối:

1 1 0 0 1 01 1 01 0 1 1 0 0x f x f x x f x x f f f x

∆ = ∆x + ∆df + ∆∑f

Trong đó:

(1): Biến động của tổng lượng biến tiêu thức do ảnh hưởng của các nhân tố cấu thành.

(2): Biến động của tổng lượng biến tiêu thức do ảnh hưởng biến động của các lượng biến.

(3): Biến động của tổng lượng biến tiêu thức do ảnh hưởng biến động của kết cấu tổng thể theo tiêu thức nghiên cứu.

(4): Biến động của tổng lượng biến tiêu thức do ảnh hưởng biến động của tổng số đơn vị tổng thể.

Page 133: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 133

TÓM LƯỢC CUỐI BÀI

Chỉ số trong thống kê là một số tương đối biểu hiện mối quan hệ so sánh giữa hai mức độ của hiện tượng nghiên cứu. Đó có thể là hai mức độ ở hai thời gian khác nhau (chỉ số phát triển) mà cũng có thể là hai mức độ ở hai không gian khác nhau (chỉ số không gian). Còn nếu căn cứ vào phạm vi tính toán, thì đó có thể là chỉ số đơn hoặc chỉ số tổng hợp.

Để xác định biến động chung của hiện tượng với nhiều phần tử, đơn vị khác nhau, người ta thường tính chỉ số tổng hợp. Khi đó, các phần tử phải được chuyển về dạng giống nhau để có thể cộng và so sánh trực tiếp với nhau. Mặt khác, do có nhiều nhân tố cùng tham gia tính toán nên khi phân tích biến động của nhân tố nghiên cứu thì phải giả định các nhân tố khác là không đổi. Nhân tố được giữ cố định đó gọi là quyền số. Quyền số của chỉ số chỉ tiêu chất lượng là chỉ tiêu khối lượng liên quan và quyền số của chỉ số chỉ tiêu khối lượng là chỉ tiêu chất lượng liên quan.

Với chỉ số phát triển, tuỳ theo từng trường hợp thực tế mà có thể sử dụng quyền số ở các thời kỳ khác nhau. Chỉ số tổng hợp của Laspeyres sử dụng quyền số ở kỳ gốc. Chỉ số tổng hợp của Paasche sử dụng quyền số ở kỳ nghiên cứu. Còn chỉ số tổng hợp của Fisher thì sử dụng kết hợp cả hai quyền số ở kỳ gốc và kỳ nghiên cứu theo công thức bình quân nhân nhằm san bằng chênh lệch giữa các chỉ số Laspeyres và Paasche.

Còn với chỉ số không gian, quyền số của chỉ số không gian so sánh giá bán của các mặt hàng ở hai không gian khác nhau là tổng lượng hàng tiêu thụ trên cả hai không gian. Còn quyền số của chỉ số không gian so sánh lượng hàng tiêu thụ của các mặt hàng ở hai không gian có thể là mức giá cố định do Nhà nước đặt ra hoặc mức giá bình quân của từng mặt hàng trên cả hai thị trường.

Để phân tích ảnh hưởng biến động của hiện tượng do ảnh hưởng biến động của các nhân tố cấu thành, người ta xây dựng một hệ thống chỉ số. Một hệ thống chỉ số bao gồm chỉ số toàn bộ phản ánh biến động chung của hiện tượng và các chỉ số nhân tố phản ánh ảnh hưởng biến động của từng nhân tố đối với hiện tượng phức tạp. Có 3 hệ thống chỉ số chính: hệ thống chỉ số tổng hợp, hệ thống chỉ số số bình quân và hệ thống chỉ số tổng lượng biến tiêu thức.

Phương pháp xây dựng hệ thống chỉ số thông dụng nhất là phương pháp liên hoàn. Theo phương pháp này, hiện tượng nghiên cứu được phân tích thành những nhân tố nào thì hệ thống chỉ số sẽ bao gồm từng đó các chỉ số nhân tố. Mẫu số của chỉ số nhân tố đứng trước là tử số của chỉ số nhân tố đứng sau tạo thành vòng liên hoàn khép kín.

Page 134: Nguyen ly thong ke

Bài 6: Chỉ số

134 v1.0

CÂU HỎI ÔN TẬP

1. Trình bày khái niệm chỉ số, đặc điểm và tác dụng của phương pháp chỉ số trong thống kê.

2. Trình bày các loại chỉ số trong thống kê.

3. Nêu phương pháp tính các chỉ số tổng hợp về giá và điều kiện vận dụng của chúng.

4. Nêu phương pháp tính các chỉ số tổng hợp về lượng và điều kiện vận dụng của chúng.

5. Phương pháp tính các chỉ số không gian tổng hợp?

6. Khái niệm và cấu thành hệ thống chỉ số?

7. Trình bày phương pháp thiết lập hệ thống chỉ số theo phương pháp liên hoàn.

8. Trình bày các loại hệ thống chỉ số và điều kiện vận dụng của chúng.

Page 135: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 135

BÀI TẬP

1. Có tài liệu về giá bán 3 loại tivi LCD của hãng LG ở một cửa hàng trong hai tháng cuối năm 2008 như sau:

Tháng 11 Tháng 12 Loại tivi

Giá bán (triệu đồng) Giá bán (triệu đồng) Doanh số (triệu đồng)

19’’ 7,5 5,5 990,0

29’’ 12,0 10,3 2.317,5

32’’ 19,5 12,0 1.944,0

a) Tính chỉ số giá của từng loại tivi tháng 12 so với tháng 11. b) Tính chỉ số giá chung của cả 3 loại tivi nói trên.

2. Một nhà đầu tư đang nắm giữ 3 loại cổ phiếu với các thông số như sau:

Ngày 15/3 Ngày 1/12 Mã cổ phiếu

Giá (nghìn đồng) Khối lượng (cổ phiếu) Giá bán (nghìn đồng)

BT6 45 3.200 60

LCG 110 2.600 82

BCI 55 4.000 58

a) Tính chỉ số giá của từng loại cổ phiếu trên ngày 1/12 so với 15/3. b) Tính chỉ số giá chung của cả 3 loại cổ phiếu trên và phân tích biến động giá chung của chúng.

3. Có tài liệu thu thập được về sản lượng của 3 loại khoáng sản sau:

Sản lượng (tấn) Loại khoáng sản Quý I Quý II

Tỷ lệ % tăng (giảm) về NSLĐ bình quân cuả quý II so với quý I

Đồng 3.200 3.310 6,8

Chì 2.750 2.845 3,1

Kẽm 3.300 3.350 -0,5

a) Tính chỉ số tổng hợp về NSLĐ bình quân của Laspeyres và Paasche. b) Tính chỉ số tổng hợp về số công nhân của Laspeyres và Paasche. c) Tính biến động về sản lượng của 3 loại khoáng sản giữa hai quý do ảnh hưởng biến động

của NSLĐ bình quân khi số công nhân vẫn giữ nguyên như ở quý I.

4. Có tài liệu của một doanh nghiệp trong quý II/2008 như sau:

x Giá thành (triệu đồng)

Chi phí sản xuất (triệu đồng)

Tỷ lệ % tăng (giảm) giá thành quý II so với quý I

Tỷ lệ % tăng (giảm) CPSX quý II so với quý I

A 7,7 3.465 5 4

B 8,3 3.320 4 6

C 8,0 3.056 –3 2

a) Tính chỉ số tổng hợp về giá thành của Laspeyres và Paasche. b) Tính chỉ số tổng hợp về sản lượng sản xuất của Laspeyres và Paasche. c) Phân tích biến động của chi phí sản xuất quý II so với quý I do ảnh hưởng biến động của

giá thành và sản lượng từng phân xưởng.

5. Có tài liệu về doanh thu của 5 cửa hàng bán hàng dệt may xuất khẩu của một công ty may trong năm 2008 như sau:

Page 136: Nguyen ly thong ke

Bài 6: Chỉ số

136 v1.0

Cửa hàng Doanh thu (triệu đồng) Tỷ lệ % tăng (giảm) giá năm 2008 so với năm 2007

A 1.320 3,5 B 990 –1,5 C 1.575 3,0 D 1.280 –1,2 E 1.030 2,7

a) Tính chỉ số tổng hợp về giá của Paasche và chỉ số tổng hợp về lượng của Laspeyres. Biết tổng doanh thu của 5 cửa hàng nói trên năm 2007 là 5.200 triệu đồng.

b) Phân tích biến động của tổng doanh thu 5 cửa hàng năm 2008 so với năm 2007 do ảnh hưởng bởi giá và lượng hàng tiêu thụ.

6. Có tài liệu về tình hình sản xuất một loại sản phẩm của hai phân xưởng dệt trong một doanh nghiệp như sau:

Phân xưởng

Sản lượng năm 2006 (triệu mét)

Tốc độ tăng sản lượng năm 2008 so với năm 2007 (%)

Kế hoạch sản lượng 2008 so với sản lượng 2006 (%)

Tỷ lệ % vượt kế hoạch sản lượng

của năm 2008

A 12 5 107 5

B 10 8 110 2

a) Xác định chỉ số và tốc độ tăng sản lượng của hai phân xưởng trên năm 2007 và 2008 với năm 2006 làm gốc so sánh.

b) Xác định chỉ số quy mô lao động của hai phân xưởng nói trên năm 2008 so với năm 2006 biết năng suất lao động bình quân một công nhân của hai phân xưởng trên năm 2006 là 500 nghìn mét và năm 2008 so với năm 2006 đã tăng 30%.

c) Phân tích các nhân tố ảnh hưởng tới biến động sản lượng của hai phân xưởng dệt ở trên năm 2008 so với năm 2006.

7. Có số liệu về tình hình sản xuất của 3 phân xưởng trong một doanh nghiệp trong quý I và quý II năm 2009 như sau:

Quý I Quý II Phân

xưởng Năng suất lao động 1 công nhân (triệu đồng)

Giá trị sản xuất (triệu đồng)

Giá trị sản xuất (triệu đồng)

A 25 500 520

B 28 616 640

C 27 486 480

a) Tính năng suất lao động bình quân 1 công nhân của toàn doanh nghiệp trong quý I. b) Tính tỷ trọng về giá trị sản xuất của từng phân xưởng trong quý I. c) Phân tích biến động của giá trị sản xuất quý II so với quý I do ảnh hưởng bởi năng suất

lao động bình quân chung và tổng số công nhân 3 phân xưởng, biết quý II, tổng số công nhân toàn doanh nghiệp tăng 5% so với quý I.

8. Có tài liệu về tình hình tiêu thụ 3 mặt hàng chủ yếu của hai cửa hàng Made in Vietnam trong quý II/2009 như sau:

Cửa hàng A Cửa hàng B Mặt hàng Giá bán đơn vị

(nghìn đồng) Lượng hàng

tiêu thụ (sản phẩm)Giá bán đơn vị (nghìn đồng)

Lượng hàng tiêu thụ (sản phẩm)

Tshirt 85 320 82 350

Cotton 70 470 75 500

Jean 180 330 175 350

Page 137: Nguyen ly thong ke

Bài 6: Chỉ số

v1.0 137

a) Tính chỉ số giá của từng mặt hàng cửa hàng A so với cửa hàng B. b) Tính chỉ số lượng hàng tiêu thụ của từng mặt hàng cửa hàng A so với cửa hàng B. c) Tính chỉ số tổng hợp về giá của cửa hàng A so với cửa hàng B. d) Tính chỉ số tổng hợp về lượng của cửa hàng A so với cửa hàng B.

9. Có tài liệu về tình hình khai thác khoáng sản ở hai mỏ trong tháng 2/2009 như sau:

Mỏ A Mỏ B Khoáng sản Giá thành đơn vị

(nghìn đồng) Sản lượng (tấn)

Giá thành đơn vị (nghìn đồng)

Sản lượng (tấn)

Đồng 20 3.650 22 3.300

Chì 25 4.200 23 4.100

Kẽm 18 2.845 17 3.080

a) Tính chỉ số tổng hợp về giá thành của mỏ A so với mỏ B. b) Tính chỉ số tổng hợp về sản lượng khai thác của mỏ A so với mỏ B.

10. Có tài liệu về tình hình tiêu thụ một số loại mũ bảo hiểm của hai cửa hàng trong tháng như sau: Cửa hàng A Cửa hàng B

Loại mũ Giá bán đơn vị (nghìn đồng)

Doanh số (nghìn đồng)

Giá bán đơn vị (nghìn đồng)

Lượng hàng tiêu thụ (chiếc)

Osaka 130 17.550 125 120

Amoro 120 12.000 130 85

Honda 145 21.750 150 138

Protect 170 25.500 155 180

a) Tính chỉ số tổng hợp về giá của cửa hàng A so với cửa hàng B.

b) Tính chỉ số tổng hợp về lượng của cửa hàng A so với cửa hàng B.

11. Có tài liệu về tình hình sản xuất kinh doanh của các phân xưởng trong một doanh nghiệp như sau:

Năm 2007 Năm 2008

Phân xưởng NSLĐ bình quân một công nhân

(triệu đồng)

Số công nhân bình quân

(người)

NSLĐ bình quân một công nhân

(triệu đồng)

Số công nhân bình quân

(người)

A 105 32 110 35

B 113 37 108 35

C 100 41 102 45

a) Phân tích các nhân tố ảnh hưởng đến biến động của năng suất lao động bình quân chung 3 phân xưởng.

b) Phân tích biến động của tổng giá trị sản xuất của 3 phân xưởng do ảnh hưởng của NSLĐ bình quân một công nhân và số công nhân bình quân từng phân xưởng.

c) Phân tích biến động của tổng giá trị sản xuất của 3 phân xưởng do ảnh hưởng của NSLĐ bình quân chung một công nhân 3 phân xưởng và tổng số công nhân 3 phân xưởng.

12. Có tài liệu về một cửa hàng trong quý I và II năm 2008 như sau:

Quý I Quý II Mặt hàng Doanh thu

(nghìn đồng) Giá bán đơn vị (nghìn đồng)

Lượng hàng tiêu thụ (sản phẩm)

Giá bán đơn vị (nghìn đồng)

A 3.850 35 135 40

B 7.200 50 180 45

C 6.300 70 120 68

Page 138: Nguyen ly thong ke

Bài 6: Chỉ số

138 v1.0

a) Phân tích biến động của giá bán đơn vị bình quân chung 3 mặt hàng.

b) Phân tích biến động của tổng doanh thu 3 mặt hàng do ảnh hưởng của các nhân tố cấu thành.

13. Có tài liệu về tổng quỹ lương của 3 phân xưởng trong hai năm 2007 và 2008 như sau:

2007 2008

Phân xưởng Tổng quỹ lương

(triệu đồng) Số lao động

(người)

Tiền lương bình quân 1 lao động

(triệu đồng)

Số lao động (người)

A 1.512 35 45,6 38

B 1.944 40 50,4 45

C 1.764 42 42,0 40

a) Phân tích biến động của tiền lương bình quân 1 lao động chung 3 phân xưởng.

b) Phân tích biến động của tổng quỹ lương do ảnh hưởng của tiền lương bình quân chung 3 phân xưởng và tổng số lao động của 3 phân xưởng.

14. Có tài liệu về mức lưu chuyển hàng hoá của 3 nhóm hàng trong quý I và quý II năm 2009 như sau:

Quý I Quý II Nhóm hàng Số lần chu chuyển

hàng hoá Dự trữ hàng hoá bình

quân (triệu đồng) Số lần chu chuyển

hàng hoá Mức lưu chuyển hàng

hoá (triệu đồng)

A 2,5 250 2,6 702

B 3,3 320 3,0 900

C 1,8 270 1,9 475

a) Phân tích biến động của mức lưu chuyển hàng hoá do ảnh hưởng biến động của số lần chu chuyển hàng hoá từng mặt hàng và dự trữ hàng hoá bình quân của từng mặt hàng.

b) Phân tích biến động của mức lưu chuyển hàng hoá do ảnh hưởng biến động của số lần chu chuyển hàng hoá bình quân chung 3 mặt hàng và tổng mức dự trữ hàng hoá bình quân của 3 mặt hàng.

15. Có tài liệu về vốn lưu động của các xí nghiệp thuộc một tổng công ty trong quý I và quý II/2009 như sau:

Quý I Quý II

Xí nghiệp Vốn lưu động (triệu đồng)

Số lao động (người)

Vốn lưu động (triệu đồng)

Vốn lưu động trên 1 lao động

(triệu đồng)

A 3.600 120 4.200 28,0

B 4.800 150 4.725 31,5

C 6.300 180 6.120 36,0

a) Phân tích biến động của vốn lưu động bình quân chung 1 lao động của 3 xí nghiệp.

b) Phân tích biến động của vốn lưu động do ảnh hưởng bởi vốn lưu động từng xí nghiệp, kết cấu lao động của từng xí nghiệp và tổng số lao động của cả 3 xí nghiệp.

Page 139: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 139

0

Nội dung Mục tiêu

Những vấn đề chung về điều tra chọn mẫu.

Đi sâu nghiên cứu một số vấn đề của điều tra chọn mẫu ngẫu nhiên.

Giới thiệu một số phương pháp chọn mẫu.

Tóm lược quy trình của một cuộc điều tra chọn mẫu.

Trang bị các kiến thức cơ bản về điều tra chọn mẫu. Trên cơ sở đó, đi sâu nghiên cứu điều tra chọn mẫu ngẫu nhiên qua đó giúp học viên có thể nắm bắt được cách suy rộng kết quả điều tra mẫu, xác định số đơn vị tiến hành điều tra và trình tự tiến hành một cuộc điều tra.

Thời lượng học Hướng dẫn học

9 tiết Đọc tài liệu và thảo luận.

Trả lời các câu hỏi ôn tập ở cuối bài và làm bài tập.

BÀI 7: ĐIỀU TRA CHỌN MẪU

Page 140: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

140 v1.0

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Điều tra để thực hiện điều chỉnh tiền lương

Do ảnh hưởng của suy thoái kinh tế, trong năm vừa qua, doanh nghiệp của bạn làm ăn thua lỗ, lợi nhuận âm. Để đảm bảo việc làm cho công nhân, doanh nghiệp phải thực hiện điều chỉnh tiền lương. Với tư cách là người tư vấn cho lãnh đạo doanh nghiệp về mức điều chỉnh, bạn thực hiện một cuộc điều tra nhằm đánh giá mức năng suất lao động bình quân của công nhân trong doanh nghiệp. Đây là cơ sở để bạn đưa ra mức giảm trừ tiền lương là bao nhiêu cho phù hợp. Nhưng để điều tra trên khoảng 3.000 công nhân của doanh nghiệp thì mất khá nhiều thời gian và tốn kém, bạn quyết định thực hiện điều tra ngẫu nhiên trên một mẫu gồm 300 lao động. Với kết quả tính toán được từ mẫu điều tra này, bạn sẽ suy rộng

kết quả cho toàn bộ doanh nghiệp.

Câu hỏi

Bạn sẽ thực hiện trình tự cuộc điều tra đó thế nào? Làm thế nào để có thể suy rộng kết quả

điều tra?

Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản nhất về một cuộc điều tra chọn mẫu và cách sử dụng kết quả điều tra để đánh giá, nhìn nhận toàn bộ hiện tượng.

Page 141: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 141

7.1. Một số khái niệm chung về điều tra chọn mẫu

7.1.1. Khái niệm, ưu nhược điểm và trường hợp vận dụng điều tra chọn mẫu

7.1.1.1. Khái niệm

Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế. Các đơn vị này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung.

Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra kết quả của cả tổng thể chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy luật số lớn và lý thuyết xác suất thống kê để tính toán trong thực tế. Quy luật số lớn đã chỉ ra rằng, nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những biểu hiện ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật sẽ được thể hiện rõ. Mặt khác, lý thuyết xác suất cũng chứng minh rằng sự sai lệch giữa số bình quân của một số rất lớn các đại lượng ngẫu nhiên với kỳ vọng toán của nó là một đại lượng nhỏ tuỳ ý.

Khi chọn đơn vị để điều tra mẫu, người ta có thể chọn theo những quy tắc khác nhau, ngẫu nhiên hoặc không ngẫu nhiên.

Suy rộng (ước lượng): từ các tham số (mức độ) tính toán được trên các đơn vị điều tra suy ra các tham số tương ứng của toàn bộ hiện tượng, có hai loại:

Suy rộng bình quân theo một tiêu thức.

Suy rộng tỷ lệ theo một tiêu thức.

7.1.1.2. Ưu, nhược điểm của điều tra chọn mẫu

Ưu điểm

o Tiết kiệm hơn cả về mặt thời gian lẫn chi phí so với điều tra toàn bộ.

o Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết nhiều mặt của hiện tượng.

o Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu:

Do phạm vi điều tra nhỏ hơn nên được chuẩn bị và kiểm tra kỹ lưỡng tỷ mỉ hơn cả trước, trong và sau cuộc điều tra;

Do số đơn vị điều tra ít nên cần ít điều tra viên, do đó có điều kiện chọn được người có trình độ chuyên môn cao.

Dựa trên cơ sở khoa học của lý thuyết xác suất thống kê và quy luật số lớn nên có thể tính được sai số và độ tin cậy của tài liệu.

o Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm người cũng có thể tiến hành điều tra được.

Page 142: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

142 v1.0

Nhược điểm

o Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết quy mô tổng thể.

o Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.

o Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu.

7.1.1.3. Trường hợp vận dụng điều tra chọn mẫu

Sử dụng để thay thế điều tra toàn bộ trong trường hợp đối tượng nghiên cứu cho phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với những trường hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tra toàn bộ quá lớn, cần thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ.

Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả của điều tra toàn bộ.

Ví dụ: Tổng điều tra dân số năm 2009, chọn 15% tổng số hộ để tiến hành điều tra chọn mẫu; trong đó mở rộng nội dung nghiên cứu về các mặt như đời sống, sức khoẻ, giáo dục,... đồng thời cũng để đánh giá kết quả của điều tra toàn bộ.

Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu thông tin cho các đối tượng sử dụng.

Ví dụ: Trong tổng điều tra dân số việc tổng hợp tài liệu đòi hỏi phải có thời gian dài, vì vậy để kịp thời phục vụ cho công tác lãnh đạo và kế hoạch hoá có thể sử dụng điều tra chọn mẫu để có được tài liệu một cách nhanh chóng.

Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thiết thống kê).

Ví dụ: Sau một thời gian thử nghiệm hai phương pháp đào tạo nghề mới, có ý kiến cho rằng, phương pháp A tốt hơn phương pháp B. Để kiểm tra giả thiết đó có đúng hay không, người ta tiến hành chọn hai mẫu gồm những người công nhân được đào tạo theo hai phương pháp trên. Sau đó, sử dụng phương pháp thống kê phù hợp để kết luận xem liệu có cơ sở nào để bác bỏ giả thiết đặt ra ở trên hay không.

7.1.2. Tổng thể chung và tổng thể mẫu

Trong bất kỳ cuộc điều tra nào, khi tiến hành điều tra ngoài việc xác định được mục đích, đối tượng và nội dung điều tra còn phải xác định phạm vi tiến hành điều tra. Với điều tra chọn mẫu, phạm vi đó có thể là tổng thể chung và tổng thể mẫu. Trong đó:

Tổng thể chung là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tượng điều tra.

Page 143: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 143

Tổng thể mẫu là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng thể chung để tiến hành điều tra thực tế.

Khi đó, ta có một số ký hiệu thường dùng với tổng thể chung và tổng thể mẫu như sau:

Chỉ tiêu Tổng thể chung Tổng thể mẫu

Quy mô N n

Số bình quân μ x

Tỷ lệ theo một tiêu thức p f

Phương sai 2 2 2x 2 2 20 x x

7.1.3. Phương pháp chọn mẫu

Hiện nay, có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.

Chọn ngẫu nhiên: là phương pháp chọn hoàn toàn ngẫu nhiên không phụ thuộc vào ý muốn chủ quan của con người. Khi đó, người ta gọi là điều tra chọn mẫu ngẫu nhiên.

Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên.

Chọn mẫu phi ngẫu nhiên: là phương pháp chọn đơn vị điều tra phụ thuộc vào ý muốn chủ quan của người chọn. Khi đó, ta có điều tra chọn mẫu phi ngẫu nhiên.

Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia.

Chọn mẫu phi ngẫu nhiên được sử dụng trong trường hợp việc chọn mẫu ngẫu nhiên gặp khó khăn như những cuộc điều tra mới hoàn toàn chưa có một thông tin tiên nghiệm nào về đối tượng điều tra, hoặc có những hiện tượng kinh tế phức tạp, sự phân tán không ổn định, biến động thất thường hoặc nhiều tầng lớp,... Phương pháp này không hoàn toàn dựa trên cơ sở toán học như điều tra chọn mẫu ngẫu nhiên mà đòi hỏi phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội. Do đó, phần nhiều mang tính chất cảm tính, chủ quan của người chọn thông qua kinh nghiệm và sự hiểu biết về tổng thể nghiên cứu. Chính vì vậy, trong phạm vi và nội dung bài giảng chỉ đề cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên.

7.2. Điều tra chọn mẫu ngẫu nhiên

7.2.1. Chọn hoàn lại và chọn không hoàn lại

Có nhiều kỹ thuật chọn mẫu khác nhau dựa trên cơ sở tiêu thức phân loại. Thông thường trong thống kê căn cứ vào sự thay đổi của tổng thể chung trong quá trình chọn và xác suất lấy mẫu, người ta chia thành các loại sau đây:

Chọn hoàn lại (chọn lặp, chọn nhiều lần): Mỗi khi đơn vị được chọn ra để điều tra sau đó sẽ được trả lại tổng thể chung và có cơ hội được chọn lại.

Đặc điểm của phương pháp chọn này là quy mô của tổng thể chung không thay đổi trong quá trình chọn và số đơn vị trong tổng thể mẫu không hoàn toàn là các đơn vị khác nhau. Chính vì quy mô không thay đổi nên xác suất được chọn của mỗi đơn vị là như nhau (đều bằng 1/N). Khi đó, số mẫu có thể hình thành là: k = Nn.

Page 144: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

144 v1.0

Chọn không hoàn lại (chọn một lần): Mỗi khi các đơn vị được chọn ra để điều tra sau đó sẽ được xếp riêng ra không trả lại tổng thể chung và không có cơ hội được chọn lại.

Chính vì vậy mà đặc điểm của phương pháp chọn này là quy mô tổng thể giảm trong quá trình chọn. Số đơn vị trong tổng thể mẫu là hoàn toàn khác nhau và xác suất được chọn của các đơn vị là hoàn toàn khác nhau, xác suất này tăng dần trong quá trình chọn. Khi đó, số mẫu có thể hình thành:

nN

N!k C

n!(N n)!

Với hai cách chọn trên, dù chọn theo cách nào thì số mẫu có thể hình thành là rất lớn. Mẫu được chọn ra điều tra thực tế chỉ là một trong số rất nhiều mẫu có thể hình thành đó. Do đó, các mức độ được tính trên mẫu (như bình quân, tỷ lệ, phương sai...) là những biến ngẫu nhiên tuân theo những quy luật phân phối xác suất nhất định. Với số lượng đơn vị tổng thể mẫu từ 30 đơn vị trở lên thì bình quân mẫu và tỷ lệ mẫu được xem như phân phối theo quy luật chuẩn.

7.2.2. Sai số trong điều tra chọn mẫu

7.2.2.1. Khái niệm và các loại sai số trong điều tra chọn mẫu

Sai số thống kê là phần chênh lệch giữa kết quả thu được qua điều tra và giá trị thực tế của nó trong tổng thể chung, tức là:

= ’ M 0M

Trong đó:

: Tham số của tổng thể chung.

’: Thống kê của tổng thể mẫu.

M: Sai số chọn mẫu (sai số do tính đại biểu).

0M: Sai số phi chọn mẫu (sai số do ghi chép).

Như vậy, sai số chọn mẫu là chênh lệch giữa mức độ được tính ra từ tổng thể mẫu và mức độ tương ứng của tổng thể chung, tức là (x ) và (f – p).

Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào. Sai số ảnh hưởng rất lớn đến kết quả điều tra, thậm chí trong trường hợp sai số quá lớn có thể dẫn đến huỷ bỏ kết quả của cuộc điều tra. Vậy có những loại sai số nào? Trong một cuộc điều tra chọn mẫu, thường xuất hiện hai loại sai số chủ yếu sau:

Sai số phi chọn mẫu: Sai số này xảy ra ở tất cả các cuộc điều tra. Nguyên nhân là do điều tra viên cân đong đo đếm sai, ghi chép sai, đơn vị điều tra cung cấp sai sự thật. Sai số này không thể xoá bỏ được mà chỉ giảm bằng cách huấn luyện nhân viên điều tra cẩn thận hơn.

Sai số chọn mẫu: Sai số này chỉ xảy ra trong điều tra chọn mẫu, do chỉ điều tra một số ít đơn vị nhưng kết quả lại ước lượng cho cả tổng thể. Sai số chọn mẫu được biểu hiện dưới hai hình thức:

Page 145: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 145

o Sai số hệ thống: xảy ra do vi phạm nguyên tắc chọn, chọn một số đơn vị không đủ lớn để đảm bảo tính chất đại biểu, chọn mẫu không khách quan.

o Sai số ngẫu nhiên: chỉ xuất hiện trong trường hợp các đơn vị của tổng thể chung được chọn theo nguyên tắc ngẫu nhiên, không lường trước được lệch về hướng nào, nhiều hơn hay ít hơn so với thực tế. Sai số này được giảm dần khi điều tra một số đủ lớn các đơn vị.

Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tượng nhưng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. Do đó, để tính sai số nhằm đánh giá mức độ chính xác của ước lượng thì phải tính sai số bình quân chọn mẫu.

7.2.2.2. Sai số bình quân chọn mẫu

Khái niệm

Sai số bình quân chọn mẫu là một trị số sai số chọn mẫu đại diện cho các giá trị của sai số chọn mẫu, nói cách khác, đó là bình quân của tất cả các sai số chọn mẫu do việc lựa chọn mẫu có kết cấu thay đổi.

Trong thống kê, cùng một hiện tượng nghiên cứu nếu áp dụng các phương pháp tổ chức chọn mẫu khác nhau sẽ có sai số bình quân chọn mẫu khác nhau. Thống kê toán đã xác định công thức tính sai số bình quân chọn mẫu trong các trường hợp như sau:

Cách chọn

Suy rộng

Chọn hoàn lại (chọn nhiều lần)

Chọn không hoàn lại (chọn một lần)

Bình quân

2

x n

hoặc

20

x n 1

2

xn

(1 )n N

hoặc

20

xn

(1 )n 1 N

Tỷ lệ

p

p(1 p)n

hoặc

pf(1 f)n 1

pp(1 p) n

(1 )n N

hoặc

pf(1 f) n

(1 )n 1 N

Trong đó:

N, n: Số đơn vị tổng thể chung và tổng thể mẫu.

x , σp: Các sai số bình quân chọn mẫu khi ước lượng số bình quân và tỷ lệ.

2: Phương sai của tổng thể chung.

σ02: Phương sai của tổng thể mẫu.

p, f: Tỷ lệ theo một tiêu thức nào đó của tổng thể chung và tổng thể mẫu.

Page 146: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

146 v1.0

Từ cách tính sai số bình quân chọn mẫu ở trên, có thể thấy có rất nhiều nhân tố ảnh hưởng đến độ lớn của sai số chọn mẫu. Trong đó, ba nhân tố chủ yếu nhất, đó là:

o Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần với tổng thể chung, sai số chọn mẫu sẽ giảm.

Khi n N thì x 0 , p f 0 .

o Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đại diện của mẫu chọn ra khác nhau cũng sẽ dẫn đến những sai số chọn mẫu khác nhau.

o Độ đồng đều của tổng thể chung: Nếu tổng thể có độ đồng đều cao tức phương

sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ.

Ý nghĩa của việc tính toán sai số chọn mẫu

o Dùng để ước lượng chỉ tiêu nghiên cứu theo khoảng.

o Dùng để đánh giá tính đại diện của chỉ tiêu nghiên cứu qua tính toán tỷ lệ sai số chọn mẫu (H) như sau:

H 100x

H càng nhỏ thì chỉ tiêu có tính đại diện càng cao và ngược lại.

o Là cơ sở để xác định cỡ mẫu cho các cuộc điều tra được tiến hành về sau.

Chú ý

Sự khác biệt giữa hai phương pháp chọn hoàn lại và chọn không hoàn lại chính là (1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại.

Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1. Do vậy, có thể chọn theo cách không hoàn lại nhưng sử dụng công thức của chọn hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản.

Sai số bình quân chọn mẫu không phải là một trị số xác định. Khi ta tiến hành nhiều lần điều tra khác nhau với cùng một hiện tượng, ta sẽ nhận được các sai số khác nhau và chúng đều dao động xung quanh μ. Do đó, không thể xác định chính xác sai số chọn mẫu cho mỗi lần điều tra mà chỉ có thể dựa vào sai số bình quân chọn mẫu để ước lượng phạm vi sai số chọn mẫu.

7.2.2.3. Phạm vi sai số chọn mẫu

Khái niệm

Phạm vi sai số chọn mẫu hay độ chính xác của suy rộng là chênh lệch giữa các chỉ tiêu của tổng thể mẫu và các chỉ tiêu tương ứng của tổng thể chung với độ tin cậy nhất định.

Nói cách khác, để ước lượng được tham số của tổng thể chung từ tham số của tổng thể mẫu thì phải xác định được phạm vi sai số chọn mẫu.

Page 147: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 147

Trong thống kê phạm vi sai số chọn mẫu được ký hiệu là và được xác định bằng

công thức:

= z σ

Trong đó:

σ: Sai số bình quân chọn mẫu.

z: Hệ số tin cậy.

Theo chứng minh của toán học thì z tương ứng với hàm xác suất (z) đã được

Liapunốp tính sẵn thành bảng riêng. Ý nghĩa của hàm xác suất này được biểu hiện

như sau:

xP( x (z) 1

pP( p f (z) 1

Với là xác suất sai lầm; (1 – ) gọi là độ tin cậy ước lượng.

Sau đây là một vài trị số tiêu biểu của z:

z = 1 thì (z) = 0,6827

z = 2 thì (z) = 0,9545

z = 3 thì (z) = 0,9973

Ý nghĩa

o Với xác suất là 0,6827 các tham số của tổng thể chung và tổng thể mẫu chênh

lệch nhau không quá σ, hay = ’ σ.

o Với xác suất là 0,9545 các tham số của tổng thể chung và tổng thể mẫu chênh

lệch nhau không quá 2σ, hay = ’ 2σ.

o Với xác suất là 0,9973 các tham số của tổng thể chung và tổng thể mẫu chênh

lệch nhau không quá 3σ, hay = ’ 3σ.

Sau khi xác định được phạm vi sai số chọn mẫu, công việc tiếp theo là phải ước lượng

các tham số của tổng thể chung.

7.2.3. Suy rộng kết quả điều tra chọn mẫu

Dù chọn lặp hay không lặp thì số mẫu có thể hình thành là một con số rất lớn. Mẫu được chọn ra để tiến hành điều tra thực tế chỉ là một trong số rất nhiều mẫu có thể hình thành. Qua điều tra chọn mẫu chúng ta tính toán được các tham số x , f, σ0

2 của tổng thể mẫu. Nhưng mục đích của chúng ta là xác định các tham số của tổng thể chung μ, p,

2. Do đó, ta phải ước lượng, nghĩa là từ các tham số của

tổng thể mẫu suy ra các tham số của tổng thể chung.

Trong thống kê có hai phương pháp ước lượng là ước lượng điểm và ước lượng khoảng. Tuy nhiên, khi kích thước mẫu nhỏ ước lượng điểm cho sai số lớn và

Page 148: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

148 v1.0

thường không đánh giá được khả năng mắc sai lầm khi ước lượng. Do đó, phương pháp được sử dụng phổ biến nhất để ước lượng kết quả điều tra là phương pháp ước lượng khoảng.

Dựa vào tham số của tổng thể mẫu và phạm vi sai số chọn mẫu tính toán được, các tham số của tổng thể chung được thống kê toán ước lượng như sau:

Khi ước lượng số bình quân:

x xx x z

hay x xx z x z

Khi ước lượng tỷ lệ theo một tiêu thức nào đấy:

p = f p = f z σp

hay f – z σp p f + z σp

7.2.4. Xác định số đơn vị mẫu cần điều tra

7.2.4.1. Yêu cầu

Chúng ta đã biết, sai số chọn mẫu tỷ lệ nghịch với số đơn vị mẫu chọn để điều tra. Do đó, để giảm sai số chọn mẫu người ta phải tăng số đơn vị mẫu đến mức tối đa có thể thực hiện được.

Tuy nhiên, việc tăng số đơn vị điều tra lại liên quan đến vấn đề kinh phí. Vì vậy, cũng phải chọn số đơn vị điều tra sao cho các chi phí là thấp nhất.

Hai yêu cầu này luôn khó thực hiện cùng một lúc do đó người ta ưu tiên sai số nhỏ để xác định số đơn vị mẫu điều tra.

7.2.4.2. Phương pháp xác định số đơn vị mẫu cần điều tra

Trên thực tế, có rất nhiều phương pháp xác định cỡ mẫu khác nhau tuỳ thuộc vào từng điều kiện cụ thể. Xét về mặt lý thuyết, người ta thường căn cứ vào độ chính xác khi suy rộng kết quả điều tra chọn mẫu. Biểu hiện tập trung nhất của độ chính xác là phạm vi sai số chọn mẫu.

Từ công thức tính phạm vi sai số chọn mẫu, suy ra công thức tính số đơn vị mẫu cần điều tra như sau:

Cách chọn

Suy rộng

Chọn hoàn lại

(chọn nhiều lần)

Chọn không hoàn lại

(chọn một lần)

Bình quân

2 2

2x

zn

2 2

2 2 2x

Nzn

N z

Tỷ lệ 2

2p

z p(1 p)n

2

2 2p

Nz p(1 p)n

N z p(1 p)

Để xác định số đơn vị cần điều tra chúng ta phải biết đầy đủ các yếu tố trong công thức trên. Trong thực tế điều tra, người ta thường cho trước hệ số tin cậy và phạm vi sai số chọn mẫu nhưng phương sai thì chưa biết. Khi đó, ta có thể xác định phương sai của tổng thể chung bằng một trong những cách sau:

Lấy phương sai lớn nhất trong những lần điều tra trước (nếu có) hoặc chọn p nào gần với 0,5 nhất.

Lấy phương sai của các cuộc điều tra khác có tính chất tương tự.

Page 149: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 149

Điều tra thí điểm để xác định phương sai.

Ước lượng phương sai nhờ khoảng biến thiên. Thống kê toán đã chứng minh trong trường hợp hiện tượng phân phối chuẩn thì:

max minx xR

6 6

7.2.4.3. Các nhân tố tác động đến kích thước mẫu điều tra

Từ công thức tính cỡ mẫu ở trên, có thể xác định được các nhân tố ảnh hưởng đến cỡ mẫu, gồm có:

Hệ số tin cậy z: Nếu yêu cầu trình độ tin cậy của ước lượng là lớn, tức hệ số tin cậy z lớn thì số đơn vị mẫu điều tra nhiều và ngược lại.

Độ đồng đều của tổng thể chung (2): Nếu tổng

thể biến thiên lớn thì 2 tính ra lớn vì thế số đơn vị mẫu điều tra nhiều và ngược lại.

Phạm vi sai số chọn mẫu : Nếu phạm vi sai số chọn mẫu lớn thì số đơn vị mẫu điều tra nhỏ và ngược lại.

Ngoài ra trong trường hợp chọn không hoàn lại, quy mô của tổng thể chung có thể ảnh hưởng đến cỡ mẫu khi mà quy mô tổng thể không lớn lắm.

7.2.4.4. Các dạng bài toán cơ bản trong điều tra chọn mẫu

Bài toán 1: Suy rộng kết quả điều tra chọn mẫu

Để giải bài toán này thì phải cho trước xác suất hay độ tin cậy khi suy rộng tài liệu. Sau đó tiến hành suy rộng số bình quân hay tỷ lệ theo công thức.

Bài toán 2: Tính xác suất khi suy rộng tài liệu.

Với bài toán này, phải cho trước phạm vi sai số chọn mẫu ε.

Bài toán 3: Tính số đơn vị mẫu cần điều tra.

Để giải bài toán này, cần cho trước xác suất khi suy rộng và phạm vi sai số chọn mẫu. Sau đó tính số đơn vị mẫu cần điều tra theo các công thức tuỳ theo loại suy rộng và cách chọn.

Ví dụ: Doanh nghiệp A có 3.000 lao động. Người ta tiến hành chọn ngẫu nhiên 300 lao động theo cách chọn không lặp để điều tra về năng suất lao động bình quân của công nhân trong doanh nghiệp và thu được kết quả sau (cột một và cột hai):

a NSLĐ (1.000 đồng)

Số lao động (người)

xi xifi xi2fi

40 – 50 25 45 1.125 50.625

50 – 60 40 55 2.200 121.000

60 – 70 70 65 4.550 295.750

70 – 80 85 75 6.375 478.125

80 – 90 60 85 5.100 433.500

Từ 90 trở lên 20 95 1.900 180.500

Tổng 300 21.250 1.559.500

Page 150: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

150 v1.0

Yêu cầu:

a) Tính năng suất lao động bình quân của công nhân toàn doanh nghiệp với xác suất bằng 0,9544.

Trước hết ta phải tính được NSLĐ bình quân của công nhân trong mẫu điều tra.

i i

i

x f 21.250x 70,83

x 300

(nghìn đồng)

Phương sai của mẫu:

22i i i i 2

i i

x f x f 1.559.500x (70,83) 181, 44

f f 300

Sai số bình quân chọn mẫu theo cách chọn không lặp:

20

x

n 181,44 300(1 ) (1 ) 0,739

n 1 N 300 1 3.000

(nghìn đồng)

Công thức để suy rộng năng suất lao động bình quân của công nhân toàn doanh nghiệp với xác suất bằng 0,9544 hay hệ số tin cậy z = 2 là:

x xx z x z

Thay số: 70,83 2 0,739 70,83 2 0,739

69,352 72,308 (nghìn đồng)

Vậy năng suất lao động bình quân của công nhân toàn doanh nghiệp nằm trong khoảng 69,352 đến 72,308 (nghìn đồng) với xác suất 0,9544.

b) Tính xác suất khi suy rộng tài liệu về năng suất lao động bình quân một công nhân trong doanh nghiệp với phạm vi sai số chọn mẫu không vượt quá 2,22 nghìn đồng.

x

x

2, 22z 3

0,739

Với z = 3 thì xác suất Φ(z) = 0,9973.

c) Với xác suất bằng 0,9544 và phạm vi sai số chọn mẫu khi suy rộng về NSLĐ bình quân không vượt quá 2 nghìn đồng. Tính số công nhân cần điều tra theo cách chọn không lặp.

Áp dụng công thức tính số mẫu cần điều tra khi ước lượng số trung bình và theo cách chọn không lặp:

2 2 2

2 2 2 2 2x

Nz 3.000 2 181,44n 171,1

N z 3.000 2 2 181,44

hay 172 (người)

(trong trường hợp này lấy phương sai của tổng thể chung là phương sai của mẫu trong lần điều tra trước bằng 181,44 vừa tính được ở câu a).

Vậy số công nhân cần điều tra là 172 người.

Page 151: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 151

d) Với xác suất 0,9545, hãy xác định tỷ lệ công nhân có mức NSLĐ từ 80 nghìn đồng trở lên trong doanh nghiệp.

Tỷ lệ công nhân có mức NSLĐ từ 80 nghìn đồng trở lên ở mẫu điều tra là:

60 20f 0,267

300

(lần)

Sai số bình quân chọn mẫu khi ước lượng tỷ lệ theo cách chọn không lặp:

p

f (1 f ) n 0, 267(1 0, 267) 300(1 ) (1 ) 0,024

n 1 N 300 1 3.000

(lần)

Công thức để suy rộng tỷ lệ công nhân có mức NSLĐ từ 80 nghìn đồng trở lên trong toàn doanh nghiệp với hệ số tin cậy z = 2 là:

f – z σp p f + z σp

Thay số: 0,267 – 2 0,024 p 0,267 + 2 0,024

0,219 p 0,315 (lần)

e) Tính xác suất khi suy rộng tài liệu về tỷ lệ số công nhân có mức NSLĐ từ 80 nghìn đồng trở lên với phạm vi sai số chọn mẫu không vượt quá 7,21%.

p

p

0,721z 3

0,024

Vậy xác suất khi suy rộng là 0,9973.

f) Với xác suất bằng 0,9545 và phạm vi sai số chọn mẫu không vượt quá 5% khi suy rộng về tỷ lệ số công nhân có mức NSLĐ từ 80 nghìn đồng trở lên, hãy tính số công nhân cần điều tra theo cách chọn không lặp.

2 2

2 2 2 2p

Nz p(1 p) 3.000 2 0,267(1 0,267)n 283,54

N z p(1 p) 3.000 0,05 2 0,267(1 0,267)

hay 284 người

Lưu ý: Khi tính cỡ mẫu, phải luôn làm tròn lên.

7.3. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng trong thống kê

Việc lựa chọn các đơn vị mẫu từ tổng thể chung có thể có nhiều phương pháp khác

nhau. Trong thống kê hiện nay phổ biến có 5 phương pháp dưới đây.

7.3.1. Chọn mẫu ngẫu nhiên đơn giản

Khái niệm: Là phương pháp tổ chức chọn mẫu một cách hoàn toàn ngẫu nhiên không qua một sự sắp xếp nào và có thể dùng phương pháp chọn một lần hoặc

chọn nhiều lần.

Ví dụ: Bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ.

Page 152: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

152 v1.0

Đánh giá phương pháp

o Ưu điểm: Đơn giản, dễ làm.

o Nhược điểm: gặp khó khăn khi tổng thể chung có quy mô lớn hoặc kết cấu phức tạp. Nếu gặp tổng thể không đồng đều thì tính chất đại biểu của mẫu không cao do các đơn vị được lựa chọn có thể phân bố không đều, tập trung

vào một chỗ.

Điều kiện vận dụng: Chỉ thích hợp với những tổng thể tương đối đồng đều và

không quá lớn.

7.3.2. Chọn mẫu hệ thống (máy móc)

Khái niệm: Là phương pháp tổ chức chọn mẫu trong đó mỗi đơn vị được chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã được sắp xếp sẵn của tổng thể chung. Các đơn vị được chọn lần lượt, đơn vị sau cách đơn vị trước một khoảng xác định d = N/n.

Ví dụ: Từ tổng thể chung có 1.000 công nhân, người ta chọn ra 100 công nhân để tiến hành điều tra, khi đó d = 1.000/100 = 10. Và cứ 10 người theo danh sách thì sẽ chọn ra 1 người để điều tra. Người đầu tiên được chọn ra trong số 10 người đầu tiên của danh sách bằng cách ngẫu nhiên đơn thuần. Giả sử trong 10 người này rút thăm được người thứ 5 thì những người được chọn tiếp theo là 15, 25...

Đánh giá phương pháp

o Ưu điểm: Thủ tục đơn giản, rút ngắn được thời gian cũng như chi phí; các đơn

vị rải đều ra trong toàn bộ tổng thể nên tính chất đại biểu của mẫu cao.

o Nhược điểm: Có khả năng xảy ra sai số hệ thống (sai số luôn lệch về một phía đối với số thực tế) do mẫu lấy ra phụ thuộc vào đơn vị đầu tiên được chọn từ nhóm đầu tiên. Do đó, khi tổng thể chung không đồng đều, đây chưa phải là cách cho chúng ta mẫu tốt nhất. Mặt khác, khi tổng thể chung lớn thì việc sắp

xếp các đơn vị theo một thứ tự nào đó để chọn mẫu cũng gặp nhiều khó khăn.

Điều kiện vận dụng: Trước khi tiến hành chọn phải sắp xếp các đơn vị trong tổng thể vào danh sách theo một thứ tự nào đó của tiêu thức nghiên cứu hoặc tiêu thức

bất kỳ.

7.3.3. Chọn mẫu phân loại (phân tổ)

Khái niệm: Là việc tiến hành chọn các đơn vị mẫu khi tổng thể chung đã được phân chia thành các tổ theo tiêu thức liên quan trực tiếp đến mục đích nghiên cứu. Việc chọn các đơn vị từ các tổ được tiến hành theo phương pháp chọn ngẫu nhiên. Số đơn vị của mỗi tổ được chọn vào mẫu có thể tỷ lệ với quy mô tổ (chọn theo

tỷ lệ) hoặc không tỷ lệ với quy mô tổ (chọn không theo tỷ lệ).

Page 153: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 153

Đánh giá phương pháp

o Ưu điểm: Chọn được tổng thể mẫu có kết cấu gần giống với kết cấu của tổng thể chung (trong trường hợp chọn theo tỷ lệ) nên tính đại biểu cao, sai số chọn mẫu nhỏ.

o Nhược điểm: Phức tạp và khó thực hiện hơn, đòi hỏi phải có nhiều thông tin về tổng thể chung.

Điều kiện vận dụng: Thường sử dụng khi tổng thể phức tạp, phân bố không đồng đều.

7.3.4. Chọn mẫu cả khối (mẫu chùm)

Khái niệm: Theo phương pháp chọn mẫu này, các đơn vị của tổng thể chung được chia thành các khối (chùm) với số lượng đơn vị có thể bằng hoặc không bằng nhau. Từ các khối đó, người ta chọn ngẫu nhiên một số khối để điều tra. Các đơn vị mẫu lúc này không phải là từng đơn vị lẻ tẻ mà từng khối đơn vị.

Ví dụ: Kiểm tra chất lượng sản phẩm đã đóng thùng của nhà máy cơ khí chính xác.

Đánh giá phương pháp

o Ưu điểm: Tổ chức gọn nhẹ, giảm được chi phí.

o Nhược điểm: Do số đơn vị được chọn chỉ tập trung vào một số khối nên có thể dẫn đến sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều.

Điều kiện vận dụng: Chỉ nên áp dụng trong trường hợp giữa các đơn vị trong một khối có sự khác nhau đáng kể song giữa các khối lại giống nhau về bản chất.

7.3.5. Chọn mẫu phân tầng (chọn nhiều cấp)

Khái niệm: Là phương pháp tổ chức chọn mẫu phải thông qua ít nhất hai cấp chọn trung gian. Đầu tiên xác định các đơn vị mẫu cấp I sau đó các đơn vị mẫu cấp I lại được phân chia thành các đơn vị chọn mẫu cấp II và cứ như thế cho đến cấp cuối cùng.

Về bản chất, phương pháp này là sự biến thể của của phương pháp chọn mẫu cả khối. Vì khi điều tra chọn mẫu hai cấp thì ở cấp I tổng thể được chia thành các khối sau đó chọn ngẫu nhiên một số khối nhất định. Ở cấp II, thay vì điều tra toàn bộ các đơn vị của các chùm được chọn ra, người ta chỉ chọn và điều tra một số đơn vị của các chùm được chọn.

Điều kiện vận dụng: Sử dụng trong trường hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông tin về tổng thể.

Tóm lại: Trong các phương pháp tổ chức chọn mẫu ngẫu nhiên được trình bày ở trên thì phương pháp tổ chức chọn mẫu phân loại (phân tổ) – đặc biệt là phương pháp chọn theo tỷ lệ, thường cho sai số chọn mẫu nhỏ nhất, đồng thời là phương pháp tổ chức chọn mẫu phức tạp nhất.

7.4. Quy trình tiến hành điều tra chọn mẫu ngẫu nhiên

Thông thường một cuộc điều tra chọn mẫu được tiến hành qua các giai đoạn dưới đây:

Page 154: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

154 v1.0

7.4.1. Xác định mục đích nghiên cứu

Xác định mục đích nghiên cứu tức là phải xác định một cách rõ ràng: cuộc điều tra đó

nhằm tìm hiểu những vấn đề gì, phục vụ cho các yêu cầu cụ thể nào?

Xác định mục đích nghiên cứu là bước khởi đầu rất quan trọng, là tiền đề cho các giai

đoạn sau.

7.4.2. Xác định tổng thể nghiên cứu

Tổng thể nghiên cứu là tổng thể chung bao gồm tất cả các đơn vị của hiện tượng nghiên cứu – tức xác định N. Để xác định tổng thể nghiên cứu thì phải dựa vào mục đích nghiên cứu, mục đích nghiên cứu khác nhau thì tổng thể nghiên cứu khác nhau. Thực chất của việc xác định tổng thể nghiên cứu là đi xác định các đơn vị của nó. Muốn vậy, ngoài việc dựa vào mục đích nghiên cứu còn phải dựa vào lý luận kinh tế – xã hội, tình hình thực tế để đưa ra định nghĩa, những tiêu chuẩn làm căn cứ để xem xét một

cách cụ thể.

7.4.3. Xác định nội dung điều tra

Xác định nội dung điều tra là xác định danh mục các tiêu thức cần điều tra trên các đơn vị của tổng thể mẫu và được cụ thể hoá bằng phiếu (biểu) điều tra. Để xác định nội dung điều tra thì phải dựa vào mục đích nghiên cứu. Mục đích nghiên cứu đòi hỏi

phải giải quyết nhiều vấn đề thì nội dung điều tra phải bao gồm nhiều tiêu thức.

7.4.4. Xác định số lượng đơn vị của tổng thể mẫu và phương pháp tổ chức chọn mẫu

Xác định số lượng đơn vị của tổng thể mẫu – tức là xác định n (hay kích thước mẫu, quy mô mẫu). Để xác định số lượng đơn vị của tổng thể mẫu cần phải cho trước phạm vi sai số chọn mẫu và xác suất suy rộng tài liệu (khi nghiên cứu các hiện tượng

kinh tế – xã hội thường lấy xác suất 0,9544 hay 95,44%).

Sau khi đã xác định được số lượng đơn vị của tổng thể mẫu, dựa vào đặc điểm của hiện tượng nghiên cứu và khả năng tổ chức điều tra để áp dụng các phương pháp tổ chức

chọn mẫu thích hợp nhằm xác định các đơn vị của tổng thể mẫu (lập dàn chọn mẫu).

7.4.5. Tiến hành thu thập tài liệu ở các đơn vị của tổng thể mẫu

Dựa vào phiếu điều tra để tiến hành thu thập tài liệu ở các đơn vị của tổng thể mẫu. Có nhiều phương pháp thu thập tài liệu như: phương pháp đăng ký trực tiếp, phương pháp phỏng vấn trực tiếp,… Tuỳ thuộc vào điều kện và tính chất của cuộc điều tra để áp

dụng phương pháp thu thập tài liệu cho phù hợp.

7.4.6. Suy rộng kết quả điều tra chọn mẫu

Sau khi đã thu thập được đầy đủ tài liệu ở các đơn vị của tổng thể mẫu, căn cứ vào đó để tiến hành tính toán và suy rộng (ước lượng) ra các đặc điểm của tổng thể chung. Có

hai phương pháp suy rộng là: suy rộng trực tiếp và suy rộng khoảng.

Page 155: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 155

Suy rộng trực tiếp là coi các mức độ của tổng thể mẫu cũng là các mức độ của tổng thể chung. Chẳng hạn, coi số bình quân mẫu, tỷ lệ của tổng thể mẫu cũng là số bình quân, tỷ lệ của tổng thể chung.

Suy rộng khoảng là các mức độ của tổng thể chung được xác định nhận giá trị trong một khoảng nào đó với xác suất cho trước.

7.4.7. Đưa ra kết luận về tổng thể chung

Đây là giai đoạn cuối cùng thể hiện kết quả của quá trình nghiên cứu. Các vấn đề cần giải quyết như: “Có thể có các kết luận gì về tổng thể chung?”, “Các kết luận đó có đáp ứng được mục đích nghiên cứu đã được đặt ra hay không? Có phản ánh được đặc điểm, bản chất của hiện tượng hay không?”. Từ đó, cần đưa ra những giải pháp, kiến nghị cụ thể để thúc đẩy sự phát triển của hiện tượng.

Các kết quả nghiên cứu đạt được cần được trình bày thông qua các bảng thống kê, các đồ thị thống kê và báo cáo phân tích.

Page 156: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

156 v1.0

TÓM LƯỢC CUỐI BÀI

Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế (tổng thể mẫu). Các đơn vị này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra chọn mẫu được dùng để suy rộng cho toàn bộ hiện tượng (tổng thể chung).

Với nhiều ưu điểm và cả những nhược điểm, điều tra chọn mẫu được sử dụng rộng rãi trong nhiều trường hợp khác nhau, ở các lĩnh vực khác nhau với các tổng thể khác nhau. Hiện nay, có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.

Trong điều tra chọn mẫu ngẫu nhiên, người ta thường hay sử dụng hai phương pháp chọn là chọn hoàn lại và chọn không hoàn lại. Dù chọn theo cách nào thì số mẫu có thể hình thành là rất lớn. Mẫu được chọn ra để điều tra thực tế chỉ là một trong số đó.

Từ các tham số của tổng thể mẫu, người ta suy rộng hay ước lượng ra các tham số của tổng thể chung. Khi đó, việc suy rộng thường có sai số và được gọi là sai số chọn mẫu. Khái niệm sai số bình quân chọn mẫu nói lên mức sai số đại diện cho các sai số chọn mẫu có thể có. Khái niệm phạm vi sai số chọn mẫu nói lên khi suy rộng thì sai số chọn mẫu không được vượt quá phạm vi đó với một xác suất nhất định.

Có nhiều phương pháp tổ chức chọn mẫu khác nhau tuỳ theo đặc điểm của hiện tượng và khả năng tổ chức điều tra. Đó có thể là phương pháp chọn mẫu ngẫu nhiên giản đơn, chọn mẫu hệ thống (chọn máy móc), chọn mẫu phân tổ (phân loại), chọn mẫu chùm hay chọn mẫu phân tầng. Trong đó, chọn mẫu phân loại thường cho sai số chọn mẫu nhỏ nhất và đây cũng là phương pháp tổ chức chọn mẫu phức tạp nhất.

Để thực hiện tốt một cuộc điều tra chọn mẫu, cần phải tiến hành theo đúng trình tự nhất định như xác định mục đích nghiên cứu, xác định tổng thể nghiên cứu, xác định nội dung điều tra, xác định số lượng đơn vị tổng thể mẫu và phương pháp tổ chức chọn mẫu, thu thập số liệu ở mẫu, suy rộng kết quả mẫu và rút ra kết luận chung.

Page 157: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 157

CÂU HỎI ÔN TẬP

1. Điều tra chọn mẫu là gì và được vận dụng trong trường hợp nào?

2. Trình bày ưu, nhược điểm của điều tra chọn mẫu.

3. Thế nào là chọn hoàn lại và chọn không hoàn lại? Đặc điểm của từng cách chọn.

4. Sai số chọn mẫu là gì? Có những loại sai số nào trong điều tra chọn mẫu?

5. Phân tích các yếu tố ảnh hưởng đến sai số chọn mẫu.

6. Sai số bình quân chọn mẫu là gì? Nêu cách tính.

7. Phân tích các nhân tố ảnh hưởng đến số đơn vị mẫu được chọn để điều tra.

8. Trình bày các phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng. Nêu rõ ưu, nhược điểm và điều kiện áp dụng của từng phương pháp.

9. Nêu trình tự tiến hành một cuộc điều tra chọn mẫu.

Page 158: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

158 v1.0

BÀI TẬP

1. Để nghiên cứu tình hình kinh doanh của 40 cửa hàng có tổng số 920 nhân viên kinh doanh trong chuỗi cửa hàng của Made in Vietnam, người ta đã chọn ra 6 cửa hàng để điều tra thực tế bằng phương pháp chọn ngẫu nhiên đơn thuần không hoàn lại. Kết quả điều tra như sau:

Cửa hàng Doanh số trung bình 1 nhân viên kinh doanh (triệu đồng)

Doanh số (triệu đồng)

A 40 520

B 35 595

C 45 945

D 40 640

E 50 500

F 48 720

a) Với độ tin cậy bằng 95,45%, hãy xác định doanh số trung bình chung một nhân viên kinh doanh của toàn bộ các cửa hàng Made in Vietnam. Từ đó, hãy tính tổng doanh số của toàn bộ 40 cửa hàng trên.

b) Tính xác suất khi suy rộng doanh số trung bình chung một nhân viên kinh doanh của toàn bộ các cửa hàng khi phạm vi sai số chọn mẫu không vượt quá 1,49 triệu đồng.

2. Một trường tiểu học có 1.120 học sinh. Người ta chọn ra 112 em để tiến hành điều tra chọn mẫu ngẫu nhiên theo phương pháp chọn không lặp nhằm đánh giá mức IQ của học sinh trong trường. Kết quả như sau:

IQ Số trẻ em (người)

60 – 70 1

70 – 80 5

80 – 90 13

90 – 100 22

100 – 110 28

110 – 120 23

120 – 130 14

130 – 140 3

140 – 150 2

150 – 160 1

a) Tính chỉ số IQ bình quân của học sinh trường tiểu học nói trên với xác suất 0,9545.

b) Tính xác suất khi suy rộng chỉ số IQ bình quân của học sinh trường tiểu học nói trên biết rằng phạm vi sai số chọn mẫu không vượt quá 1,47.

c) Nếu thực hiện một cuộc điều tra khác để đánh giá chỉ số IQ bình quân của học sinh trường tiểu học nói trên. Với xác suất 0,9545 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 2,5. Hãy tính số học sinh cần điều tra theo phương pháp chọn lặp và chọn không lặp.

3. Theo kết quả điều tra chọn mẫu ngẫu nhiên không lặp 200 bệnh nhân về số ngày nằm viện của họ, người ta thu được kết quả sau:

Page 159: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

v1.0 159

Số ngày nằm viện (ngày) Số người (người)

1 – 3 24

4 – 6 83

7 – 9 52

10 – 12 22

13 – 15 11

16 – 18 5

19 – 21 2

22 – 24 1

a) Tính tỷ lệ những người nằm viện từ 10 ngày trở lên với xác suất 0,9544. Biết rằng, toàn bệnh viện có tổng số 2.000 bệnh nhân. Từ đó, hãy xác định số bệnh nhân phải nằm viện

từ 10 ngày trở lên ở cả bệnh viện.

b) Tính xác suất khi suy rộng tỷ lệ bệnh nhân nằm viện từ 10 ngày trở lên biết rằng phạm vi

sai số chọn mẫu không vượt quá 8,15%.

c) Người ta tiến hành một cuộc điều tra chọn mẫu mới để xác định tỷ lệ bệnh nhân nằm viện từ 10 ngày trở lên. Hãy tính số bệnh nhân cần điều tra theo phương pháp chọn lặp và chọn

không lặp với xác suất 0,9545 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 5%.

4. Một ngân hàng hiện đang có 300 khoản đầu tư ngắn hạn. Họ thực hiện điều tra chọn mẫu ngẫu nhiên đơn thuần không lặp trên 40 khoản đầu tư nhằm thu thập thông tin về số ngày đến hạn thanh toán của chúng. Kết quả như sau:

Số ngày đến hạn thanh toán Số khoản đầu tư ngắn hạn

30 – 40 3

40 – 50 1

50 – 60 8

60 – 70 10

70 – 80 7

80 – 90 7

90 – 100 4

Tổng 40

a) Hãy xác định số ngày đến hạn thanh toán bình quân của tất cả các khoản đầu tư trên với

xác suất 0,9544.

b) Biết phạm vi sai số chọn mẫu khi suy rộng số ngày đến hạn thanh toán bình quân của tất

cả các khoản đầu tư trên không vượt quá 7,25 ngày, hãy tính xác suất khi suy rộng.

c) Xác định tỷ lệ số khoản đầu tư có ngày đến hạn thanh toán dưới 2 tháng với xác suất

0,9545.

5. Trong một cuộc điều tra về chất lượng lao động ở khu công nghiệp có 10.000 lao động, người ta chọn ra 1.000 lao động để điều tra về tuổi theo phương pháp chọn mẫu ngẫu nhiên đơn thuần không hoàn lại. Kết quả thu được như sau:

Page 160: Nguyen ly thong ke

Bài 7: Điều tra chọn mẫu

160 v1.0

Tuổi Số lao động (người)

16 – 18 50

18 – 20 163

20 – 24 280

24 – 30 214

30 – 40 150

40 – 50 88

50 – 60 45

≥ 60 10

a) Tính tuổi trung bình của lao động toàn khu công nghiệp với xác suất 0,9546.

b) Tính tỷ lệ lao động trong khu công nghiệp có độ tuổi từ 20 – 29 với xác suất 0,9546. Từ đó, xác định số công nhân trong khu công nghiệp có độ tuổi từ 20 – 29.

c) Người ta tiến hành một cuộc điều tra chọn mẫu mới nhằm xác định tỷ lệ lao động trong khu công nghiệp có độ tuổi từ 20 – 29. Hãy xác định số công nhân cần điều tra theo phương pháp chọn không hoàn lại với xác suất khi suy rộng là 0,9545 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 5%.

Page 161: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 161

ĐÁP ÁN

Bài 2

Bài tập 1

Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn, xác định được Xmax = 145, Xmin = 50.

Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố được xây dựng như sau:

Năng lượng tiêu dùng (triệu BTU)

Tần số (hộ) Tần suất (lần)

50 – 60 8 0,16

60 – 70 7 0,14

70 – 80 3 0,06

80 – 90 6 0,12

90 – 100 10 0,20

100 – 110 5 0,10

110 – 120 4 0,08

120 – 130 2 0,04

130 – 140 3 0,06

140 – 150 2 0,04

Tổng 50 1,00

Từ đó tính được tần suất theo công thức: ii

i

fd

f

(kết quả như ở bảng trên).

Bài tập 2

Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn.

a) Tổ đầu tiên bắt đầu từ 6 – 8. Biết khoảng cách các tổ bằng nhau và bằng 2, dãy số phân phối được xây dựng như sau:

Lượng sắt dung nạp trong 24 giờ (mg) Số người

6 – 8 1

8 – 10 1

10 – 12 7

12 – 14 9

14 – 16 9

16 – 18 9

18 – 20 8

20 – 22 1

Tổng 45

b) Biết hàm lượng sắt cho phép dung nạp hàng ngày của phụ nữ dưới 51 tuổi là không vượt quá 18mg. Vậy với mẫu ở trên, tỷ lệ phần trăm số phụ nữ đã dung nạp quá mức lượng sắt cho phép (tức có x ≥ 18) là:

(8 + 1)/45 = 0,2 (tức 20%)

Page 162: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

162 v1.0

Bài tập 3

Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn ta có: Xmax = 100, Xmin = 34.

a) Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố như sau:

Điểm Tần số (số sinh viên) Tần suất (lần) Tần số tích luỹ 30 – 40 2 0,10 2 40 – 50 0 0,00 2 50 – 60 0 0,00 2 60 – 70 3 0,15 5 70 – 80 3 0,15 8 80 – 90 8 0,40 16 90 – 100 4 0,20 20

Tổng 20 1,00

b) Biểu đồ tần số:

0

1

2

3

4

5

6

7

8

9

30-40 40-50 50-60 60-70 70-80 80-90 90-100

Điểm

Số

sin

h v

iên

Biểu đồ tần suất:

0.1 0

0

0.15

0.15

0.4

0.2

30-40

40-50

50-60

60-70

70-80

80-90

90-100

(Lưu ý: có thể sử dụng biểu đồ hình cột hoặc biểu đồ hình tròn đều được).

c) Đồ thị tần số

0

1

2

3

4

5

6

7

8

9

30-40 40-50 50-60 60-70 70-80 80-90 90-100

Điểm

Số

sin

h v

iên

Page 163: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 163

Đồ thị tần số tích luỹ

0

5

10

15

20

25

0 20 40 60 80 100 120

Điểm

Tần

số

tíc

h l

uỹ

Bài tập 4

a) Tần suất được tính theo công thức: ii

i

fd

f

Số ngày đến hạn thanh toán

Số khoản đầu tư ngắn hạn (f) Tần suất (lần) Tần số tích luỹ

30 – 40 3 0,075 3 40 – 50 1 0,025 4 50 – 60 8 0,200 12 60 – 70 10 0,250 22 70 – 80 7 0,175 29 80 – 90 7 0,175 36 90 – 100 4 0,100 40

Tổng 40

b) Để biết khoản đầu tư thứ 23 có số ngày đến hạn thanh toán là bao nhiêu, ta phải tính tần số tích luỹ.

Nhìn vào bảng tần số tích lũy ở trên thì khoản đầu tư thứ 23 nằm ở tổ thứ 5 và do đó có số ngày đến hạn thanh toán là 70 – 80 ngày.

c) Cũng theo bảng tần số tích lũy ở trên thì số khoản đầu tư có ngày đến hạn thanh toán dưới 70 ngày là 22 khoản.

d) Đồ thị biểu diễn mối liên hệ:

0

2

4

6

8

10

12

30-40 40-50 50-60 60-70 70-80 80-90 90-100

Số ngày đến hạn thanh toán

Số

kh

oản

đầu

ngắn

hạn

Bài tập 5

a) Tính tần suất theo công thức: ii

i

fd

f

Page 164: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

164 v1.0

Quê quán Số người Tần suất (lần)

Thái Nguyên 2 0,077

Hải Dương 4 0,154

Hà Nội 7 0,269

Lai Châu 1 0,038

Cao Bằng 11 0,423

Nam Định 1 0,038

Tổng 26 1,000

b) Vẽ biểu đồ hình cột (bar chart) cho tần suất.

0.077

0.154

0.269

0.038

0.423

0.038

0

0.2

0.4

0.6

0.8

1

1

Nam Định

Cao Bằng

Lai Châu

Hà Nội

Hải Dương

Thái Nguyên

c) Vẽ biểu đồ hình bánh (pie chart) cho tần suất.

Thái Nguyên, 0.077Hải Dương,

0.154

Hà Nội, 0.269Lai Châu, 0.038

Cao Bằng, 0.423

Nam Định, 0.038

Thái Nguyên

Hải Dương

Hà Nội

Lai Châu

Cao Bằng

Nam Định

Bài 3

Bài tập 1

a) Bảng tần số phân bố với các tổ không có khoảng cách tổ (chỉ có cột NSLĐ và số công nhân)

Thái Nguyên (0.077)

Hải Dương (0.154) Nam Định (0.038)

Cao Bằng (0.423)

Lai Châu (0.038) Hà Nội (0.269)

Page 165: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 165

NSLĐ (sản phẩm) (xi) Số công nhân (fi) xifi Tần số tích luỹ

36 1 36 1

37 3 111 4

38 5 190 9

39 8 312 17

40 5 200 22

41 3 123 25

42 1 42 26

43 4 172 30

Tổng 30 1.186

b) Tính năng suất lao động bình quân của công nhân toàn phân xưởng.

i i

i

x f 1.186x 39,53

f 30

(sản phẩm)

c) Tính Mốt về năng suất lao động của công nhân toàn phân xưởng.

Đây là dãy số phân tổ không có khoảng cách tổ, khi đó M0 là lượng biến của tổ có tần số lớn nhất (fmax = 8), vậy M0 = 39 sản phẩm.

d) Tính trung vị về năng suất lao động của công nhân toàn phân xưởng.

Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến. Có 30 công nhân, vậy vị trí chính giữa là 15 và 16.

Tính tần số tích lũy để xác định vị trí thứ 15 và 16, đó là tổ có lượng biến bằng 39.

Me = (x15 + x16)/2 = (39 + 39)/2 = 39 (sản phẩm)

Bài tập 2

IQ Số trẻ em

(người) (fi) xi xifi

Tần số tích luỹ (di)

60 – 70 1 65 65 1

70 – 80 5 75 375 6

80 – 90 13 85 1.105 19

90 – 100 22 95 2.090 41

100 – 110 28 105 2.940 69

110 – 120 23 115 2.645 92

120 – 130 14 125 1.750 106

130 – 140 3 135 405 109

140 – 150 2 145 290 111

150 – 160 1 155 155 112

112 11.820

a) Đây là dãy số phân tổ có khoảng cách tổ, lượng biến được xác định là trị số giữa của từng tổ (xi).

Khi đó chỉ số IQ bình quân của 112 trẻ em nói trên được tính như sau:

i i

i

x f 1.1820x 105,54

f 112

Page 166: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

166 v1.0

b) Tổ có tần số lớn nhất là tổ 100 – 110, đây cũng là tổ chứa M0.

Mốt về chỉ số IQ của 112 trẻ em nói trên được tính:

0 0

0 0

0 0 1 0 0

M M 10 M min M

M M M M 1

f f 28 22M x h 100 10 105, 46

(f f ) (f f ) 28 22 28 23

c) Theo bảng tần số tích lũy, tổ chứa trung vị là tổ chứa đơn vị thứ 56 và 57, tức tổ 100 – 110. Khi đó trung vị về chỉ số IQ của 112 trẻ em nói trên được tính:

e

e e

e

iM 1

e M min MM

f 112S 41

2 2M x h 100 10 105,36f 28

Bài tập 3

a) Bảng tần số phân bố được xây dựng như sau:

Tuổi Số sinh viên

15 – 19 10

20 – 24 9

25 – 29 3

30 – 34 4

35+ 4

b) Tổ chứa M0 là tổ 15 – 19. Mốt về tuổi của sinh viên được tính:

0 0

0 0

0 0 1 0 0

M M 10 M min M

M M M M 1

f f 10 0M x h 15 4 18,64

(f f ) (f f ) 10 0 10 9

(tuổi)

c) Tuổi trung bình của sinh viên từ số liệu ban đầu: n

ii 1

x757

x 25,23n 30

(tuổi)

d) x > M0, x là tham số đo xu hướng trung tâm tốt hơn, vì nó đã tính đến tất cả các lượng biến chứ không như M0, chỉ quan tâm tới lượng biến có tần số lớn nhất.

Bài tập 4

a) Xây dựng bảng tần số phân bố với các tổ có khoảng cách tổ bằng nhau:

Tuổi Số người (fi) xi xifi

30 – 40 4 35 140

40 – 50 7 45 315

50 – 60 7 55 385

60 – 70 10 65 650

70 – 80 8 75 600

Tổng 36 2.090

b) Tính tuổi trung bình từ số liệu ban đầu: n

ii 1

x2.107

x 58,53n 36

(tuổi)

Page 167: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 167

Tính tuổi trung bình từ tài liệu phân tổ:

i i

i

x f 2.090x 58,06

f 36

(tuổi)

Tính bình quân từ tài liệu ban đầu chính xác hơn vì cách tính thứ hai mang tính giả định các lượng biến trong tổ đều bằng với trị số giữa của nó.

c) Sắp xếp dãy số ban đầu theo thứ tự tăng dần từ nhỏ đến lớn, khi đó trung vị được xác định như sau:

Me = (x18 + x19)/2 = (59 + 60)/2 = 59,5 (tuổi)

d) Tính khoảng tứ phân vị về tuổi: Dãy số được chia thành 4 phần bằng nhau, như sau:

31 38 39 39 42 42 45 47 48

48 48 52 52 53 54 55 57 59

60 61 64 64 66 66 67 68 68

69 71 71 74 75 77 79 79 79

Q1 = (48 + 48)/2 = 48

Q2 = (59 + 60)/2 = 59,5

Q3 = (68 + 59)/2 = 68,5

Bài tập 5

a) Tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 2004 – 2008 là:

5n1 2 n 04 / 03 05/ 04 06/ 05 07 / 06 08/07x x x ...x x x x x x 1,0707 (lần) hay 107,07%

b) Tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 1995 – 2008 là:

i1 2 n

f f f f 5 2 1 513x x x ...x 1,087 1,05 1,05 1,0707 1,0721 (lần) hay 107,21%.

Bài tập 6

a) Tính tốc độ phát triển lợi nhuận hàng năm của doanh nghiệp.

Năm 2002 2003 2004 2005 2006 2007 2008

Lợi nhuận trước thuế (tỷ đồng) 12,3 13,5 13,8 15,2 16,4 16,9 15,0

Tốc độ phát triển hàng năm (%) 109,76 102,22 110,14 107,89 103,05 88,76

Tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 2002 – 2008:

6n1 2 n 03/ 02. 04 / 03 05/ 04 06 / 05 07 / 06 08/ 07x x x ...x x x x x x x 1,0336 (lần) hay 103,36%.

b) Tính tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 1998 – 2008.

i1 2 n

f f f f 2 2 610x x x ...x 1,056 1,038 1,0336 1,0389 (lần) hay 103,89%.

Bài tập 7

Xuất phát từ mối liên hệ:

Tổng thời gian sản xuất Thời gian hao phí bình quân =

Tổng số sản phẩm sản xuất

Page 168: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

168 v1.0

Thời gian hao phí bình quân để sản xuất ra 1 sản phẩm của công nhân 3 phân xưởng trên được tính theo công thức:

_ii i i i

i i ii

i i

Mx f x fx

x f Mfx x

Trong đó:

x : thời gian hao phí bình quân để sản xuất 1 sản phẩm (phút).

xi: mức thời gian hao phí để sản xuất 1 sản phẩm của từng phân xưởng (phút).

fi: số sản phẩm được sản xuất ra của từng phân xưởng (sản phẩm).

Mi: tổng thời gian lao động của từng phân xưởng (phút).

Thay số vào công thức trên ta có:

8 5 60 6 5 60 9 5 60x 3,03

8 5 60 6 5 60 9 5 605 2 3

(phút)

Bài tập 8

Xuất phát từ mối liên hệ:

Tổng thời gian phục vụ khách

Thời gian phục vụ 1 khách bình quân =

Tổng số khách phục vụ

Thời gian phục vụ 1 khách bình quân của 3 cửa hàng nói trên được tính theo công thức: _

ii i i i

i i ii

i i

Mx f x fx

x f Mfx x

Trong đó:

x : thời gian bình quân để phục vụ 1 khách của 3 cửa hàng (phút).

xi: mức thời gian phục vụ 1 khách của từng cửa hàng (phút).

fi: số khách được phục vụ của từng cửa hàng (người).

Mi: tổng thời gian phục vụ khách của từng cửa hàng (phút).

Thay số vào công thức trên ta có:

10 3 60 12 3,5 60 8 3 60x 5,05

10 3 60 12 3,5 60 8 3 605 6 4

(phút)

Bài tập 9

Xuất phát từ mối liên hệ: Doanh thu = Giá bán lượng tiêu thụ

a) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quý I.

Quý I

Mặt hàng Doanh thu (nghìn đồng) Mi

Giá bán đơn vị (nghìn đồng) xi

Lượng hàng tiêu thụ (sản phẩm)

fi = Mi/xi

A 3.850 35 110

B 7.200 50 144

C 6.300 70 90

Tổng 17.350 344

Page 169: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 169

_i

i

i

M 1.7350x 50,44

M 344x

(nghìn đồng)

b) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quý II.

Quý II

Mặt hàng Lượng hàng tiêu thụ (sản phẩm) fi

Giá bán đơn vị (nghìn đồng) xi

Doanh thu

(nghìn đồng)

Mi = xifi

A 135 40 5.400

B 180 45 8.100

C 120 68 8.160

Tổng 435 21.660

_i i

i

x f 21.660x 49,79

f 435

(nghìn đồng)

c) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong cả hai quý.

I II

I II

M M 17.350 21.660x 50,08

f f 344 435

(nghìn đồng)

Bài tập 10

Xuất phát từ mối liên hệ:

Tổng GTSX thực tế

% HTKH về GTSX =

Tổng GTSX kế hoạch 100

a) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quý I.

Quý I

Phân xưởng Giá trị sản xuất (triệu đồng) Mi

% hoàn thành kế hoạch về GTSX xi

Giá trị sản xuất KH (triệu đồng)

fi = Mi/xi

Tỷ trọng giá trị sản xuất từng

phân xưởng (%)

A 500 102 490,20 35,46

B 480 97 494,85 34,04

C 430 115 373,91 30,50

Tổng 1.410 1.358,95 100,00

_i

i

i

M 1.410x 1,0376

M 1.358,95x

lần (hay 103,76%)

b) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quý II.

Quý II

Phân xưởng Kế hoạch về GTSX (triệu đồng) fi

% hoàn thành kế hoạch về GTSX xi

Giá trị sản xuất (triệu đồng)

Mi = xi.fi

Tỷ trọng giá trị sản xuất từng

phân xưởng (%)

A 520 108 561,6 34,31

B 500 105 525,0 32,08

C 500 110 550,0 33,61

Tổng 1.520 1.637 100,00

Page 170: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

170 v1.0

_i i

i

x f 1.637x 1,0767

f 1.520

lần (hay 107,67%)

c) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong cả hai quý.

I II

I II

M M 1.410 1.637x 1,0582

f f 1.358,95 1.520

lần (hay 105,82%)

d) Tính tỷ trọng giá trị sản xuất của từng phân xưởng trong quý I, quý II (như bảng trên), cả hai quý: 34,84 % – 32,99% – 32,17 %.

Lưu ý:

Khi tính nên đổi tỷ lệ % hoàn thành kế hoạch về đơn vị lần để đảm bảo ý nghĩa kinh tế của các chỉ tiêu liên quan.

Khi tính tỷ trọng, tính theo giá trị sản xuất thực tế.

Bài tập 11

Tính trị số giữa của mỗi tổ làm lượng biến của tổ đó.

Thu nhập (triệu đồng)

Số lao động (người)

fi

xi xifi i ix - x f xi2fi

4,7 – 5,2 4 4,95 19,80 6,92 98,01

5,2 – 5,7 9 5,45 49,05 11,07 267,32

5,7 – 6,2 13 5,95 77,35 9,49 460,23

6,2 – 6,7 42 6,45 270,90 9,66 1.747,31

6,7 – 7,2 39 6,95 271,05 10,53 1.883,80

7,2 – 7,7 20 7,45 149,00 15,40 1.110,05

7,7 – 8,2 9 7,95 71,55 11,43 568,82

Tổng 136 908,70 74,50 6.135,54

a) Thu nhập bình quân của lao động trong doanh nghiệp:

_i i

i

x f 908,7x 6,68

f 136

(triệu đồng)

b) Khoảng biến thiên về thu nhập của lao động trong doanh nghiệp:

R = xmax – xmin = 8,2 – 4,7 = 3,5 (triệu đồng)

c) Độ lệch tuyệt đối bình quân về thu nhập của lao động trong doanh nghiệp:

i i

i

x x f 74,5d 0,55

f 136

(triệu đồng)

d) Phương sai về thu nhập của lao động trong doanh nghiệp:

22i i i i2 2

i i

x f x f 6.135,546,68 0,49

f f 136

Page 171: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 171

e) Độ lệch tiêu chuẩn về thu nhập của lao động trong doanh nghiệp:

2 0, 49 0,7 (triệu đồng)

f) Hệ số biến thiên về thu nhập của lao động trong doanh nghiệp:

0,7V 0,1048

6,68x

lần (hay 10,48%)

Bài tập 12

Trị số giữa của mỗi tổ làm lượng biến của tổ đó.

Số lượng séc Tần số xi xifi xi2fi

< 200 10 100 1.000 100.000

200 – 400 13 300 3.900 1.170.000

400 – 600 17 500 8.500 4.250.000

600 – 800 42 700 29.400 20.580.000

800 – 1000 18 900 16.200 14.580.000

Tổng 100 59.000 40.680.000

Phương sai về số lượng séc chi trả: 22

i i i i2

i i

x f x f 40.680.000 59.00058.700

f f 100 100

Độ lệch tiêu chuẩn về số lượng séc chi trả:

2 58.700 242,28 (séc)

Đây chính là điều mà nhà quản lý ngân hàng lo ngại.

Bài tập 13

Số bình quân (nghìn đồng)

Phương sai Độ lệch tiêu chuẩn (nghìn đồng)

Hệ số biến thiên (%)

Thu nhập 3.500 8.540 92,41 2,64

Chi tiêu 3.000 4.100 64,03 2,13

a) Công thức tính hệ số biến thiên: Vx

100 (%)

b) Với chỉ tiêu thu nhập: Me = 3.200 nghìn đồng, khi đó:

x > Me > M0, dãy số có phân phối chuẩn lệch phải.

Vậy số hộ gia đình có mức thu nhập lớn hơn mức thu nhập bình quân sẽ chiếm thiểu số.

Bài tập 14

Tính trị số giữa của mỗi tổ làm lượng biến của tổ đó.

Số ngày nằm viện (ngày)

Số người (người) xi xifi xi2fi

1 – 3 24 2 48 96

4 – 6 83 5 415 2.075

7 – 9 52 8 416 3.328

Page 172: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

172 v1.0

10 – 12 22 11 242 2.662

13 – 15 11 14 154 2.156

16 – 18 5 17 85 1.445

19 – 21 2 20 40 800

22 – 24 1 23 23 529

200 1423 13.091

a) Số ngày nằm viện trung bình: _

i i

i

x f 1.423x 7,115

f 200

(ngày)

b) Độ lệch tiêu chuẩn về số ngày nằm viện của 200 người trên là: 22

i i i i2 2

i i

x f x f 13.0917,115 14,83

f f 200

2 14,83 3,85 (ngày)

c) Hệ số biến thiên về số ngày nằm viện:

3,85V 0,5413

7,115x

lần (hay 54,13%)

Bài tập 15

a) Lượng tiêu dùng cá trung bình của mỗi nhóm người là:

Người Đức:

n

ii 1

x113

x 11,3n 10

(kg)

Người Nga:

n

ii 1

x241

x 16,07n 15

(kg)

b) Tính trung vị về lượng tiêu dùng cá của mỗi nhóm người.

Sắp xếp dãy số theo thứ tự từ nhỏ đến lớn.

Người Đức: vị trí chính giữa là 5 và 6

Vậy: Me = (x5 + x6)/2 = (11 + 13)/2 = 12 (kg)

Người Nga: vị trí chính giữa là 8

Vậy: Me = x8 = 17 (kg)

c) Mốt về lượng tiêu dùng cá của mỗi nhóm người:

Người Đức: M0 = 17 (kg)

Người Nga: không tính Mốt cho trường hợp này vì có nhiều Mốt.

d) So sánh độ phân tán về lượng tiêu dùng cá của hai nhóm người trên.

Tính phương sai về lượng tiêu dùng cá.

Người Đức:

22i i2 2x x 1.507

11,3 23,01n n 10

Page 173: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 173

Người Nga:

22i i2 2x x 4.313

16,07 29,29n n 15

Hệ số biến thiên:

Người Đức: 23,01

V 0,424511,3x

lần (hay 42,45%)

Người Nga: 29,29

V 0,336716,07x

lần (hay 33,67%)

Vậy lượng tiêu dùng cá của nhóm người Đức có độ phân tán lớn hơn lượng tiêu dùng cá của nhóm người Nga.

Bài 4: Phân tích hồi quy và tương quan

Bài tập 1

a) Mối liên hệ hai chiều.

b) Vẽ đồ thị.

c) Xây dựng mô hình hồi quy phản ánh ảnh hưởng của chi cho R&D đến lợi nhuận.

Mô hình có dạng: xy = bo + b1x

Năm Chi cho R&D (tỷ đồng) x

Lợi nhuận hàng năm (tỷ đồng) y

xy x2 y2

2003 2 20 40 4 400

2004 3 25 75 9 625

2005 5 34 170 25 1.156

2006 4 30 120 16 900

2007 11 40 440 121 1.600

2008 5 31 155 25 961

Tổng 30 180 1.000 200 5.642

Trung bình 5,0 30,0 166,7 33,3 940,3

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

1 2 2x

xy xy 166,7 5 30b 2

33,3 5

b0 = y – b1 x = 30 – 2 × 5 = 20

Vậy mô hình hồi quy có dạng: xy 20 2x

Ý nghĩa các tham số:

b0 = 20 cho biết ảnh hưởng của các nguyên nhân khác ngoài chi cho R&D đến lợi nhuận của doanh nghiệp.

b1 = 2 cho biết ảnh hưởng trực tiếp của chi cho R&D đến lợi nhuận của doanh nghiệp. Cụ thể, khi chi cho R&D tăng 1 đơn vị (tức 1 tỷ đồng) thì lợi nhuận của doanh nghiệp sẽ tăng bình quân 2 tỷ đồng. Đây là mối liên hệ thuận.

Page 174: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

174 v1.0

Lưu ý :

Mô hình hồi quy biểu diễn ảnh hưởng của lợi nhuận đến chi cho R&D của doanh nghiệp được xây dựng tương tự.

d) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan:

2x

1 2x y y

33,3 5xy xyr b 2 0,907

940,3 30

Đây là mối liên hệ tương quan tuyến tính rất chặt chẽ.

Bài tập 2

a) Vẽ đồ thị biểu diễn mối liên hệ.

b) Mô hình hồi quy biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực

phẩm của các hộ gia đình nói trên có dạng: xy = b0 + b1x

Hộ gia đình

Thu nhập khả dụng (triệu đồng) x

Chi cho lương thực thực phẩm (triệu đồng) y

xy x2

1 30,0 5,5 165,0 900,0

2 36,0 6,0 216,0 1.296,0

3 27,0 4,2 113,4 729,0

4 20,0 4,0 80,0 400,0

5 16,0 3,7 59,2 256,0

6 24,0 2,6 62,4 576,0

7 19,0 3,9 74,1 361,0

8 25,0 4,3 107,5 625,0

Tổng 197,0 34,2 877,6 5.143,0

Trung bình 24,63 4,28 109,70 642,88

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

1 2 2x

xy xy 109,7 24,63 4,28b 0,12

642,88 24,63

b0 = y – b1 x = 4,28 – 0,12 24,63 = 1,324

Vậy mô hình có dạng: xy 1,324 0,12x .

c) Thay giá trị x = 25 vào mô hình ở trên, ta tính được giá trị dự đoán :

xy = 1,324 + 0,12 25 = 4,324 (triệu đồng)

Bài tập 3

a) Mô hình hồi quy biểu diễn mối liên hệ giữa thời gian tự học và điểm kiểm tra của các sinh

viên nói trên có dạng: xy = b0 + b1x

Page 175: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 175

Sinh viên Thời gian tự học

(giờ) x Điểm

kiểm tra – y xy x2 y2

1 10,0 9,2 92,0 100,0 84,6

2 15,0 8,1 121,5 225,0 65,6

3 12,0 8,4 100,8 144,0 70,6

4 20,0 7,4 148,0 400,0 54,8

5 8,0 8,5 68,0 64,0 72,3

6 16,0 8,0 128,0 256,0 64,0

7 14,0 8,4 117,6 196,0 70,6

8 22,0 8,0 176,0 484,0 64,0

Tổng 117,0 66,0 951,9 1.869,0 546,4

Trung bình 14,63 8,25 118,99 233,63 68,30

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

1 2 2x

xy xy 118,99 14,63 8,25b 0,087

233,63 14,63

b0 = y – b1 x = 8,25 – (– 0,087) 14,63 = 9,52

Vậy mô hình có dạng: xy 9,52 0,087x .

b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan:

2x

1 2x y y

233,63 14,63xy x.yr b 0,087 0,79

68,3 8,25

Đây là mối liên hệ tương quan tuyến tính nghịch và tương đối chặt chẽ.

c) Để xác định xem phương trình trên có phù hợp hay không, tính hệ số xác định:

r2 = (– 0,79)2 = 0,6241.

Có nghĩa là 62,41% sự thay đổi của điểm thi được giải thích bởi mô hình nói trên. Vì vậy, có thể sử dụng được mô hình này.

Bài tập 4

a) Để xác định xem khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào, ta tính hệ số hồi quy b1 trong mô hình hồi quy tuyến tính biểu diễn ảnh hưởng của chiều cao tới cân nặng.

Cân nặng (kg) y

Chiều cao (cm) x

xy x2 y2

65 175 11.375 30.625 4.225

67 133 8.911 17.689 4.489

71 185 13.135 34.225 5.041

71 163 11.573 26569 5.041

66 126 8.316 15876 4.356

75 198 14.850 39204 5.625

67 153 10.251 23.409 4.489

70 163 11.410 26569 4.900

Page 176: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

176 v1.0

71 159 11.289 25281 5.041

69 151 10.419 22.801 4.761

69 155 10.695 24.025 4.761

761 1.761 122.224 286.273 52.729

69,18 160,09 11.111,27 26.024,82 4.793,55

Hệ số hồi quy được tính như sau:

1 2 2x

xy xy 11.111,27 160,09 69,18b 0,092

26.024,82 160,09

Vậy khi chiều cao tăng thêm 1cm thì cân nặng tăng thêm 0,092 kg.

b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan:

2x

1 2x y y

26 024,82 160,09xy x.yr b 0,092 0,661

4 793,55 69,18

Đây là mối liên hệ tương quan bình thường và có chiều hướng thuận.

Bài tập 5

a) Mô hình hồi quy tuyến tính biểu diễn ảnh hưởng của GTSX tới lượng nhiên liệu tiêu thụ có

dạng: xy = b0 + b1x

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

Phân xưởng

Giá trị sản xuất

(triệu đồng) x

Nhiên liệu tiêu thụ

(triệu đồng) y

xy x2 ˆxy 2(x - x) ˆ 2x(y - y )

A 520 23 11.960 270.400 16,726 17.776,889 39,363

B 595 20 11.900 354.025 18,099 3.402,389 3,616

C 945 25 23.625 893.025 24,504 8.5071,389 0,247

D 640 19 12.160 409.600 18,922 177,689 0,006

E 500 10 5.000 250.000 16,360 23.510,089 40,450

G 720 18 12.960 518.400 20,386 4.444,889 5,693

Tổng 3920 115 77.605 2.695.450 114,996 134.383,333 89,374

Trung bình

653,33 19,17 12.934,17 449.241,67

1 2 2x

xy xy 12.934,17 653,33 19,17b 0,0183

449.241,67 653,33

b0 = y – b1 x = 19,17 – 0,0183 653,33 = 7,21

Vậy mô hình có dạng: xy 7, 21 0,0183x .

b) Có cơ sở cho rằng, hệ số hồi quy trong phương trình biểu diễn mối liên hệ giữa GTSX và lượng nhiên liệu tiêu thụ là bằng 0. Khi đó, ta thực hiện kiểm định cặp giả thiết sau:

H0: 1 = 0 (GTSX không có mối liên hệ với lượng nhiên liệu tiêu thụ).

H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa GTSX với lượng nhiên liệu tiêu thụ).

Page 177: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 177

Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa = 0,05.

Khi đó giá trị tới hạn là ±tα/2 = ±t0,025, với độ tự do là n – 2 = 6 – 2 = 4, tra bảng ta xác định được giá trị tới hạn ±t0,025 = ± 2,776.

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

1

e

2

b 0,0183t

S 4,73

134.383,33(x x)

1,418

Với 2

xe

ˆ(y y ) 89,374S 4,73

n 2 6 2

Vậy giá trị ttính = 1,418 < t0,025, df = 4 = 2,776, với mẫu ở trên và mức ý nghĩa = 0,05, chưa có cơ sở bác bỏ H0. Vì vậy, không nên dùng GTSX để dự đoán giá trị của lượng nhiên liệu tiêu thụ.

Bài tập 6

a) Phương trình hồi quy tuyến tính biểu diễn ảnh hưởng của số lần xem hay đọc quảng cáo đến

số lon Coca Cola mua có dạng: xy = b0 + b1x

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

Số lần xem hay đọc quảng cáo – x Số lon đã mua – y xy x2 y2

4 12 48 16 144

9 14 126 81 196

3 7 21 9 49

0 6 0 0 36

1 3 3 1 9

6 5 30 36 25

2 5 10 4 25

5 10 50 25 100

30 62 288 172 584

3,75 7,75 36,00 21,50 73,00

1 2 2x

xy xy 36 3,75 7,75b 0,933

21,5 3,75

b0 = y – b1 x = 7,75 – 3,75 0,933 = 4,25

Vậy mô hình có dạng: xy 4, 25 0,933x.

b) Đánh giá trình độ chặt chẽ của mối liên hệ:

2x

1 2x y y

21,5 3,75xy xyr b 0,933 0,71

73 7,75

Đây là mối liên hệ thuận và tương đối chặt chẽ.

Page 178: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

178 v1.0

c) Với điều nghi ngờ ở trên, thực hiện kiểm định cặp giả thiết sau:

H0: = 0 (số quảng cáo đã đọc hay xem và số lon Coca Cola đã mua không có mối liên hệ

tuyến tính).

H1: > 0 (số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số

lon Coca Cola đã mua).

Với mức ý nghĩa α = 0,05, độ tự do df = n – 2 = 8 – 2 = 6, giá trị tới hạn tra bảng t0,05,df = 6 = 1,943.

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

2 2

r 0,71t 2,47

1 r 1 0,71n 2 8 2

Ta thấy t > tα = 1,943, với mẫu đã cho và mức ý nghĩa α = 0,05, bác bỏ giả thiết H0.

Vậy có cơ sở để kết luận rằng, giữa số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua.

Bài tập 7

a) Với mẫu đã cho, nếu biểu diễn trên đồ thị có thể thấy giữa tuổi và nhịp tim có mối liên hệ với nhau (thực tế thì y học đã chứng minh). Tuổi là nguyên nhân và nhịp tim là kết quả.

b) Tính hệ số b1 trong phương trình hồi quy biểu diễn ảnh hưởng của tuổi đến nhịp tim.

Tuổi – x Nhịp tim (lần) y

xy x2 ˆ xy 2(x - x) ˆ 2x(y - y )

30 186 5.580 900 188,052 46,24 4,211

38 183 6.954 1.444 178,932 1,44 16,549

41 171 7.011 1.681 175,512 17,64 20,358

38 177 6.726 1.444 178,932 1,44 3,733

29 191 5.539 841 189,192 60,84 3,269

39 177 6.903 1.521 177,792 4,84 0,627

46 175 8.050 2.116 169,812 84,64 26,915

41 176 7.216 1.681 175,512 17,64 0,238

42 171 7.182 1.764 174,372 27,04 11,370

24 196 4.704 576 194,892 163,84 1,228

368 1803 65.865 13.968 1.803,000 425,60 88,498

36,8 180,3 6.586,5 1.396,8

1 2 2x

xy xy 6586,5 36,8 180,3b 1,14

1396,8 36,8

Vậy khi tuổi tăng thêm 1 thì nhịp tim sẽ giảm đi 1,14 lần/phút.

c) Để xác định xem có thể dùng tuổi để dự đoán nhịp tim hay không (tức là giữa tuổi và nhịp tim có tồn tại mối liên hệ tuyến tính hay không), ta kiểm định cặp giả thiết sau :

H0: 1 = 0 (tuổi không có mối liên hệ với nhịp tim).

H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa tuổi và nhịp tim).

Với mức ý nghĩa α = 0,05, độ tự do là n – 2 = 10 – 2 = 8, tra bảng ta xác định được giá trị tới hạn ±t0,025 = ±2,306.

Page 179: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 179

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

1

e

2

b 1,14t

S 3,326

425,6(x x)

–7,07

Với 2

xe

ˆ(y y ) 88, 498S 3,326

n 2 10 2

(từ mẫu trên, tính được b0 = 222,252 trong phương trình hồi quy tuyến tính giữa tuổi và nhịp

tim, thay các giá trị của x để tính được giá trị lý thuyết xy tương ứng).

Vậy ta có: t > ±t0,025, bác bỏ giả thiết H0.

Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: có thể dùng tuổi để dự đoán nhịp tim của một người nào đó.

Bài tập 8

a) Vẽ đồ thị.

b) Phương trình: xy = b0 + b1x

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

Giá vé (Cents) x

Số hành khách trên 100 dặm – y

xy x2 y2

15 440 6.600 225 193.600

20 430 8.600 400 184.900

25 430 10.750 625 184.900

30 370 11.100 900 136.900

35 360 12.600 1.225 129.600

40 340 13.600 1.600 115.600

45 350 15.750 2.025 122.500

50 350 17.500 2.500 122.500

260 3.070 96.500 9.500 1.190.500

32,5 383,75 12.062,5 1.187,5 148.812,5

1 2 2x

xy xy 12062,5 32,5 383,75b 3,12

1187,5 32,5

b0 = y – b1 x = 383,75 – (–3,12) 32,5 = 485,15

Vậy mô hình có dạng: xy 485,15 3,12x .

c) Kiểm định cặp giả thiết sau:

H0: = 0 (giá vé và số hành khách trên 100 dặm không có mối liên hệ tuyến tính).

H1: < 0 (giá vé có mối liên hệ tương quan tuyến tính nghịch với số hành khách trên 100 dặm).

Page 180: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

180 v1.0

Với mức ý nghĩa α = 0,05, độ tự do df = n – 2 = 8 – 2 = 6, giá trị tới hạn tra bảng t0,05,df = 6 = 1,943.

Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:

2 2

r 0,9048t 5,205

1 r 1 ( 0,9048)n 2 8 2

Trong đó: hệ số tương quan của mẫu đã chọn ở trên được tính như sau:

2x

1 2x y y

1187,5 32,5xy xyr b 3,12 0,9048

148812,5 383,75

Ta thấy t > tα = 1,943, bác bỏ giả thiết H0.

Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: giữa giá vé xe buýt và số lượng hành khách là có mối liên hệ tương quan tuyến tính âm.

Bài tập 9

a) Phương trình: xy = b0 + b1x

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

Chi phí quản lý phải trả (triệu đồng) y

Số lượng sản phẩm – x xy x2 ˆxy ˆ 2

x(y - y )

191 40 7.640 1.600 179,22 138,77

170 42 7.140 1.764 192,20 492,84

272 53 14.416 2.809 263,59 70,73

155 35 5.425 1.225 146,77 67,73

280 56 15.680 3.136 283,06 9,36

173 39 6.747 1.521 172,73 0,07

234 48 11.232 2.304 231,14 8,18

116 30 3.480 900 114,32 2,82

153 37 5.661 1.369 159,75 45,56

178 40 7.120 1.600 179,22 1,49

1922 420 84.541 18.228 1.922,00 837,56

192,2 42,0 8.454,1 1.822,8

1 2 2x

xy xy 8.454,1 42 192,2b 6,49

1.822,8 42

b0 = y – b1 x = 192,2 – 6,49 42 = –80,38

Vậy mô hình có dạng: xy 80,38 6,49x .

b) Khi x = 50, 50y 80,38 6,49 50 244,12 (triệu đồng)

c) Tính sai số tiêu chuẩn của mô hình dự đoán trên.

2x

e

ˆ(y y ) 837,56S 10, 23

n 2 10 2

(triệu đồng)

Page 181: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 181

Bài tập 10

a) Để vẽ được đường hồi quy lý thuyết, trước hết xác định mô hình hồi quy phản ánh mối liên hệ trên:

Phương trình: xy = b0 + b1x

Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS.

Mức lương khởi điểm (triệu đồng) y

Điểm trung bình học đại học – x

xy x2 y2 ˆxy ˆ 2x(y - y )

3,1 7,0 21,7 49,0 9,61 2,98 0,01

2,5 6,0 15,0 36,0 6,25 2,35 0,02

2,5 6,5 16,3 42,3 6,25 2,67 0,03

1,9 5,0 9,5 25,0 3,61 1,72 0,03

2,2 6,0 13,2 36,0 4,84 2,35 0,02

2,8 6,5 18,2 42,3 7,84 2,67 0,02

1,6 5,5 8,8 30,3 2,56 2,04 0,19

2,2 5,5 12,1 30,3 4,84 2,04 0,03

18,8 48,0 114,8 291,0 45,8 18,80 0,35

2,35 6,00 14,34 36,38 5,73

1 2 2x

xy xy 14,34 2,35 6b 0,63

36,38 6

b0 = y – b1 x = 2,35 – 0,63 × 6 = –1,43

Vậy mô hình có dạng: xy 1, 43 0,63x .

b) Tính hệ số tương quan:

2x

1 2x y y

36,38 6xy xyr b 0,63 0,85

5,73 2,35

Đây là mối liên hệ tương quan thuận và tương đối chặt chẽ.

c) Với điểm trung bình bằng 8, tức x = 8, mức lương khởi điểm dự đoán là:

8y 1, 43 0,63 8 3,61 (triệu đồng)

d) Tính sai số tiêu chuẩn của mô hình dự đoán trên.

2x

e

ˆ(y y ) 0,35S 0,058

n 2 8 2

(triệu đồng)

Bài 5: Phân tích dãy số thời gian

Bài tập 1

a) Áp dụng các công thức để tính :

Page 182: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

182 v1.0

Năm Lợi nhuận (tỷ đồng)

δi

(tỷ đồng)

ti

(%)

ai

(%)

gi

(tỷ đồng)

2002 8,200 0,500 106,494 6,494 0,077

2003 9,225 1,025 112,500 12,500 0,082

2004 10,475 1,250 113,550 13,550 0,092

2005 10,800 0,325 103,103 3,103 0,105

2006 11,902 1,102 110,200 10,200 0,108

2007 12,622 0,720 106,050 6,050 0,119

2008 13,631 1,010 108,000 8,000 0,126

b) Lượng tăng (giảm) tuyệt đối bình quân về chỉ tiêu doanh thu của doanh nghiệp trong giai đoạn 2002 – 2008:

n

ii 2 5, 432

0,905n 1 7 1

(tỷ đồng)

Tốc độ tăng (giảm) bình quân về chỉ tiêu doanh thu của doanh nghiệp trong giai đoạn 2002 – 2008:

n7 1n 1

ii 2

a t 1 t 1,6624 1,088

lần (hay 108,8%).

Bài tập 2

a) Tính số lao động bình quân trong quý I/2009 của doanh nghiệp.

Áp dụng công thức tính mức độ bình quân theo thời gian trong trường hợp dãy số thời điểm có các mức độ tại các thời điểm có khoảng cách thời gian bằng nhau:

1 42 3

y yy y 90 188 192 942 2y 188n 1 4 1

(người)

b) Tính năng suất lao động bình quân một công nhân trong quý I/2009.

Áp dụng công thức tính mức độ bình quân theo thời gian của dãy số thời kỳ, ta có: n

ii 1

y11, 2 11,8 11,5

y 11,5n 3

(triệu đồng)

c) Trước hết tính số lao động bình quân từng tháng trong quý I/2009.

1 21

y y 180 188y 184

2 2

(người)

2 32

y y 188 192y 190

2 2

(người)

3 43

y y 192 188y 190

2 2

(người)

Lợi nhuận bình quân một công nhân của từng tháng là:

LN1 = 206/184 = 1,12 (triệu đồng).

Page 183: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 183

LN2 = 242/190 = 1,27 (triệu đồng).

LN3 = 222/190 = 1,17 (triệu đồng).

d) Tính lợi nhuận bình quân một công nhân trong quý I/2009.

LNI = (206 + 242 + 222)/188 = 3,56 (triệu đồng)

Bài tập 3

Từ tài liệu đã cho lập được dãy số thời gian về giá trị tồn kho của doanh nghiệp như sau:

Ngày 1/4 30/4 30/5 5/6 18/6 25/6

Mức độ y1 y2 y3 y4 y5 y6

Giá trị tồn kho (triệu đồng) (yi)

250 280 270 280 257 272

Khoảng cách thời gian (ti)

4 13 7 6

yiti 1.080 3.640 1.799 1.632

a) Tính giá trị tồn kho bình quân của từng tháng trong quý II/2009.

Tháng 4, 5 được tính bằng bình quân mức độ đầu và cuối tháng.

Tháng 4: 1 24

y y 250 280y 265

2 2

(triệu đồng)

Tháng 5: 2 35

y y 280 270y 275

2 2

(triệu đồng)

Tháng 6 do biến động thường xuyên và khoảng cách thời gian giữa các mức độ không bằng nhau nên ta sử dụng công thức: (coi mức độ ngày 30/5 là mức độ ngày 1/6)

i i6

i

y t 8 151y 271,7

t 30

(triệu đồng)

b) Giá trị tồn kho bình quân của quý II/2009:

4 5 6y y y 265 275 271,7y 270,57

3 3

(triệu đồng)

Bài tập 4

Từ đề bài, ta có:

08khn

03

yK 1,5

y (lần)

08ttt

08kh

yK 1,238

y (lần)

Vậy tốc độ phát triển (hay số tương đối động thái) về lợi nhuận của năm 2008 so với năm 2003 được tính như sau:

T08/03 = Kn Kt = 1,5 1,238 = 1,857 (lần)

a) Tính tốc độ phát triển bình quân về lợi nhuận trước thuế của doanh nghiệp trong giai đoạn 2003 – 2008:

5508/ 03 08/ 03t T 1,857 1,1318 (lần) (hay 113,18%).

Page 184: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

184 v1.0

b) Tính tốc độ phát triển bình quân về lợi nhuận trước thuế của doanh nghiệp trong giai đoạn 2000 – 2008:

3 5 3 58808/ 00 03/ 00 08/ 03t t t 1,102 1,1318 1,1205 (lần) (hay 112,05%).

Bài tập 5

Năm 2004 2005 2006 2007 2008

Tốc độ tăng (%)

(so với năm 2004)

5 13 20 23

Tốc độ phát triển (%)

(so với năm 2004)

105 113 120 123

Tốc độ phát triển liên hoàn (%)

105,00 107,62 106,19 102,50

Tổng quỹ lương (triệu đồng)

19.469,03 20.442,48 22.000,00 23.362,83 23.946,90

Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn

194,69 204,42 22.000 233,63

a) Tính tốc độ phát triển bình quân tổng quỹ lương của doanh nghiệp trong giai đoạn 2004 – 2008.

n 1 4nt T 1,23 1,053 (lần)

b) Tính giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn của tổng quỹ lương, biết tổng quỹ lương năm 2006 của doanh nghiệp là 22.000 triệu đồng.

Trước hết tính tốc độ phát triển liên hoàn: ii

i 1

Tt

T

Tính tổng quỹ lương khi biết y06 = 22.000

Cuối cùng tính giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn (Kết quả tính như ở bảng trên).

Bài tập 6

Năm 2001 2002 2003 2004 2005 2006 2007 2008 Tổng Trung bình

Số người chết – y 98 105 116 119 135 156 177 208 1.114 139,25

t 1 2 3 4 5 6 7 8 36 4.50

yt 98 210 348 476 675 936 1.239 1.664 5.646 705,75

t2 1 4 9 16 25 36 49 64 204 25,50

a) Nhìn vào dãy số thời gian ở trên, ta thấy đây là dãy số có cùng xu hướng và có các lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau, do đó, dạng hàm xu thế là tuyến tính và có dạng:

ty = a0+ a1t

Các tham số a0, a1 được xác định bằng phương pháp OLS:

1 2 2t

ty ty 705,75 4,5 139,25a 15,07

25,5 4,5

Page 185: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 185

a0 = y – a1 t = 139,25 – 15,07 4,5 = 71,44

Vậy hàm xu thế có dạng: ty 71,44 15,07t

b) Dự đoán:

Dựa vào n 1y y 208 9815,71

n 1 8 1

.

Mô hình dự đoán: n L ny y L 208 15,71 L

09y 208 15,71 1 223,71 hay 224 người

10y 208 15,71 2 239,42 hay 240 người

Dựa vào n 7n 1

1

y 208t 1,114

y 98 .

Mô hình dự đoán: LL

n L ny y t 208.1,114

109y 208 1,114 232,71 hay 233 người

210y 208 1,114 258,13 hay 259 người

Dựa vào hàm xu thế: ty 71,44 15,07t

09y 71,44 15,07 9 207,07 hay 208 người

10y 71,44 15,07 19 222,14 hay 223 người

Bài tập 7

a) Hàm xu thế có dạng hàm mũ vì có các tốc độ phát triển liên hoàn xấp xỉ nhau. t

t 0 1y a a hay: lny = lna0 + tlna1

Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và lna, lnb phải thỏa mãn hệ phương trình:

0 1

20 1

lny = lna n + lna t

t lny = lna y + t ln a t

Doanh số (nghìn USD) – y 13 24 39 65 106 247

lny 2,565 3,178 3,664 4,174 4,663 18,244

t 1 2 3 4 5 15

tlny 2,565 6,356 10,991 16,698 23,317 59,926

t2 1 4 9 16 25 55

Thay số:

0 1

0 1

18,244 = 5lna + 15lna

59,926 = 15lna + 55lna

Giải hệ phương trình trên, ta có:

lna0 = 2,0906 a0 = 8,09

lna1 = 0,5194 a1 = 1,68

Vậy hàm xu thế có dạng: tty 8,09 1,68

Page 186: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

186 v1.0

b) Dự đoán năm 2009: 6

09y 8,09 1,68 181,89 (nghìn USD)

Bài tập 8

a) g08 = y07/100 = 3 (tỷ đồng). Vậy y07 = 300 (tỷ đồng)

Tính tốc độ phát triển liên hoàn sau đó tính được chỉ tiêu doanh thu trong giai đoạn 2003 – 2008 biết doanh thu năm 2007 là 300 tỷ đồng. Kết quả như ở bảng:

Năm 2003 2004 2005 2006 2007 2008

Tốc độ tăng (%) 6,2 8,5 5,4 7,1 6,3

Tốc độ phát triển liên hoàn (%) 106,2 108,5 105,4 107,1 106,3

Doanh thu (tỷ đồng) 230,64 244,94 265,76 280,11 300,00 318,90

Tính tốc độ tăng bình quân hàng năm về chỉ tiêu doanh thu của doanh nghiệp trong thời gian 2003 – 2008.

5a t 1 318,9 / 230,64 1 1,0669 1 0,669 lần (hay 6,69%).

b) Hàm xu thế tuyến tính có dạng: ty = a0+ a1t

Các tham số a0, a1 được xác định bằng phương pháp OLS:

Năm 2003 2004 2005 2006 2007 2008 Tổng Trung bình

Doanh thu (tỷ đồng) y 230,64 244,94 265,76 280,11 300,00 318,90 1640,35 273,39

t 1 2 3 4 5 6 21 3,5

yt 230,64 489,88 797,28 1.120,44 1.500,00 1.913,40 6.051,64 1.008,61

t2 1 4 9 16 25 36 91 15,17

1 2 2t

ty ty 1008,61 3,5 273,39a 17,72

15,17 3,5

a0 = y – a1 t = 273,39 – 17,72 3,5 = 211,37

Vậy hàm xu thế có dạng: ty 211,37 17,72t

c) Dự đoán doanh thu của doanh nghiệp trong năm 2009 và 2010:

09y 211,37 17,72 7 335,41 (tỷ đồng)

10y 211,37 17,72 8 353,13 (tỷ đồng)

Bài tập 9

Công thức tính chỉ số thời vụ cho từng quý (dãy số không có xu thế):

ii

0

yI 100

y

Trong đó:

iy : là số khách thuê phòng bình quân của quý i trong 5 năm (i = 1,4 ).

0y : là số khách thuê phòng bình quân chung của một quý trong 5 năm.

Page 187: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 187

Kết quả tính toán như ở bảng:

Số khách thuê phòng (lượt khách) Năm

Quý I Quý II Quý III Quý IV Tổng

2004 1.861 2.203 2.415 1.908 8.387

2005 1.921 2.343 2.514 1.986 8.764

2006 1.834 2.154 2.098 1.799 7.885

2007 1.837 2.025 2.304 1.965 8.131

2008 2.073 2.414 2.339 1.967 8.793

Tổng 9.526 11.139 1.1670 9.625 41.960

iy 1.905,2 2.227,8 2.334,0 1.925,0 0y 2.098,0

Chỉ số thời vụ Ii (%) 90,81 106,19 111,25 91,75

Bài tập 10

a) Công thức tính chỉ số thời vụ (dãy số có xu thế):

mij

j 1 iji

y

yI 100

m

(%)

Trong đó:

yij: số bệnh nhân nhập viện thực tế của quý i (i = 1,4 ) thuộc năm j (j = 1,4 ).

ijy : số bệnh nhân nhập viên theo lý thuyết của quý i (i = 1,4 ) thuộc năm j (j = 1,4 ) được tính

từ hàm xu thế.

m: số năm nghiên cứu (m = 4).

Trước hết, xác định hàm xu thế tuyến tính biểu diễn sự biến động về số bệnh nhân nhập viện

theo thời gian: ty = a0+ a1t.

Sau khi sắp xếp lại số liệu theo thứ tự thời gian, ta có bảng số liệu:

Thời gian y t yt t2

I/05 2,6 1 2,6 1

II/05 4,1 2 8,2 4

III/05 4,8 3 14,4 9

IV/05 3,2 4 12,8 16

I/06 2,9 5 14,5 25

II/06 4,5 6 27,0 36

III/06 5,0 7 35,0 49

IV/06 3,4 8 27,2 64

I/07 2,8 9 25,2 81

II/07 4,9 10 49,0 100

III/07 5,5 11 60,5 121

IV/07 3,3 12 39,6 144

Page 188: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

188 v1.0

I/08 3,1 13 40,3 169

II/08 5,1 14 71,4 196

III/08 5,6 15 84,0 225

IV/08 3,6 16 57,6 256

Tổng 64,4 136,0 569,3 1.496,0

Trung bình 4,025 8,500 35,581 93,500

1 2 2t

ty ty 35,581 4,025 8,5a 0,0644

93,5 8,5

a0 = y – a1 t = 4,025 – 0,0644 8,5 = 3,4776

Hàm xu thế có dạng:

ty 3, 4776 0,0644t

Thay các giá trị của t vào hàm xu thế ở trên để tính được số bệnh nhân nhập viện theo lý thuyết.

Kết quả tính toán như ở bảng sau:

Mức độ thực tế (triệu đồng) yij

Mức độ lý thuyết

(triệu đồng) ˆijy ˆij

ij

y×100(%)

y

Quý

2005 2006 2007 2008 2005 2006 2007 2008 2005 2006 2007 2008

Ii (%)

I 2,6 2,9 2,8 3,1 3,542 3,800 4,057 4,315 73,4 76,3 69,0 71,8 72,65

II 4,1 4,5 4,9 5,1 3,606 3,864 4,122 4,379 113,7 116,5 118,9 116,5 116,37

III 4,8 5 5,5 5,6 3,671 3,928 4,186 4,444 130,8 127,3 131,4 126,0 128,86

IV 3,2 3,4 3,3 3,6 3,735 3,993 4,250 4,508 85,7 85,2 77,6 79,9 82,08

∑ 14,7 15,8 16,5 17,4 14,55 15,58 16,62 17,65

b) Dự đoán số bệnh nhân nhập viện cho các quý của năm 2009.

Mô hình dự đoán: t iy f t I

I / 09y (3, 4776 0,0644 17) 0,7265 3,322 (nghìn lượt người)

II / 09y (3, 4776 0,0644 18) 1,1637 5,396 (nghìn lượt người)

III / 09y (3, 4776 0,0644 19) 1,2886 6,058 (nghìn lượt người)

IV / 09y (3, 4776 0,0644 20) 0,8208 3,912 (nghìn lượt người)

Bài 6: Chỉ số

Bài tập 1

a) Chỉ số đơn về giá của từng loại tivi tháng 12 so với tháng 11 được tính theo công thức:

1p

0

pi

p 100 (%)

Page 189: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 189

Kết quả tính như ở bảng sau:

Tháng 11 Tháng 12

Loại tivi Giá bán (triệu đồng)

po

Giá bán (triệu đồng)

p1

Doanh số (triệu đồng)

p1q1

Chỉ số đơn về giá tháng 12

so với tháng 11 (%) ip

p1q1/ip (triệu đồng)

19’’ 7,5 5,5 990,0 73,33 1.350

29’’ 12,0 10,3 2.317,5 85,83 2.700

32’’ 19,5 12,0 1.944,0 61,54 3.159

Tổng 5.251,5 7.209

b) Xuất phát từ mối liên hệ: Doanh thu = Giá bán × Lượng hàng tiêu thụ

Ta có thể tính được chỉ số tổng hợp về giá của 3 loại tivi trên.

Theo dữ liệu bài cho, có thể tính được chỉ số tổng hợp về giá của Paasche khi biết chỉ số đơn về giá và doanh thu bán hàng ở kỳ nghiên cứu:

1 1 1 1Pp

1 10 1

p

p q p q 5.251,5I 0,7285

p qp q 7.209i

lần (hay 72,85%).

Bài tập 2

a) Chỉ số đơn về giá của từng loại cổ phiếu được tính theo công thức:

1p

0

pi

p 100 (%)

Kết quả tính toán được cho ở bảng sau:

Ngày 15/3 Ngày 1/12

Mã cổ phiếu

Giá (nghìn đồng)

po

Khối lượng (cổ phiếu)

qo

Giá bán (nghìn đồng)

p1

Chỉ số đơn về giá ngày 1/12

so với 15/3 (%)ip

poqo p1qo

BT6 45 3.200 60 133,33 144.000 192.000

LCG 110 2.600 82 74,55 286.000 213.200

BCI 55 4.000 58 105,45 220.000 232.000

Tổng 650.000 637.200

b) Xuất phát từ mối liên hệ: giá trị cổ phiếu nắm giữ = giá cổ phiếu × khối lượng cổ phiếu nắm giữ.

Chỉ số tổng hợp về giá của 3 loại cổ phiếu trên được tính theo công thức của Laspeyres:

1 0Lp

0 0

p q 637.200I 0,9803

p q 650.000

lần (hay 98,03%)

Như vậy, sự thay đổi về giá bán chung của 3 mã cổ phiếu trên làm cho tổng giá trị cổ phiếu ngày 1/12 bằng 98,03% so với ngày 15/3, tức giảm 1,97% tương đương một lượng tuyệt đối là: ∆ = 637.200 – 650.000 = –12.800 nghìn đồng.

Page 190: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

190 v1.0

Bài tập 3

Xuất phát từ mối liên hệ: sản lượng (NT) = NSLĐ bình quân (N) × số công nhân (T).

a) Tính chỉ số tổng hợp về NSLĐ bình quân của Laspeyres và Paasche.

Chỉ số đơn về NSLĐ = 100 + tốc độ tăng (giảm) về NSLĐ (%)

Sản lượng (tấn) Loại khoáng

sản

Quý I

NoTo

Quý II

N1T1

Tỷ lệ % tăng (giảm)

về NSLĐ bình quân cuả quý II

so với quý I

Chỉ số đơn về NSLĐ

bình quân của quý II

so với quý I (%) iN

iNNoTo N1T1/iN

Đồng 3.200 3.310 6,8 106,8 3.417,60 3.099,25

Chì 2.750 2.845 3,1 103,1 2.835,25 2.759,46

Kẽm 3.300 3.350 –0,5 99,5 3.283,50 3.366,83

Tổng 9.250 9.505 9.536,35 9.225,54

1 0 N 0 0LN

0 0 0 0

N T i N T 9.536,35I 1,031

N T N T 9.250

lần (hay 103,1%).

1 1 1 1PN

1 10 1

N

N T N T 9.505I 1,0303

N TN T 9.225,54i

lần (hay 103,03%).

b) Chỉ số tổng hợp về số công nhân của Laspeyres và Paasche:

1 1

0 1L NT

0 0 0 0

N TN T i 9.225,54

I 0,9974N T N T 9.250

lần (hay 99,74%).

1 1 1 1PT

1 0 N 0 0

N T N T 9.505I 0,9967

N T i .N T 9.536,35

lần (hay 99,67%).

c) Biến động về sản lượng của 3 loại khoáng sản giữa hai quý do ảnh hưởng biến động của NSLĐ bình quân khi số công nhân vẫn giữ nguyên như ở quý I là:

N 1 0 0 0N T N T 9.536,35 9.250 286,35 (tấn)

Bài tập 4

Xuất phát từ mối liên hệ: Chi phí sản xuất (CPSX) (zp) = Giá thành (z) × sản lượng sản xuất (p)

Chỉ số đơn về giá thành = 100 + tốc độ tăng (giảm) về giá thành (%)

Chỉ số đơn về CPSX = 100 + tốc độ tăng (giảm) về CPSX (%)

CPSX quý I = CPSX quý II/Chỉ số đơn về CPSX quý II so với quý I

a) Tính chỉ số tổng hợp về giá thành của Laspeyres và Paasche.

Page 191: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 191

Phân xưởng

Giá thành (triệu đồng)

z1

Chi phí sản xuất (triệu đồng) z1q1

Tỷ lệ % tăng

(giảm) giá

thành quý II so với quý I

Tỷ lệ % tăng

(giảm) CPSX quý II so với quý I

Chỉ số giá

thành quý II so với quý I

(%) iz

Chỉ số CPSX quý II so với quý I

(%) izq

z0q0

(triệu đồng)

izz0q0 z1q1/iz

A 7,7 3.465 5 4 105 104 3.331,73 3.498,32 3.300,00

B 8,3 3.320 4 6 104 106 3.132,08 3.257,36 3.192,31

C 8,0 3.056 –3 2 97 102 2.996,08 2.906,20 3.150,52

Tổng 9.841 9.459,88 9.661,87 9.642,82

1 0 Z 0 0LZ

0 0 0 0

z q i z q 9.661,87I 1,0214

z q z q 9.459,88

lần (hay 102,14%).

1 1 1 1PZ

1 10 1

Z

z q z q 9.841I 1,0206

z qz q 9.642,82i

lần (hay 102,06%).

b) Tính chỉ số tổng hợp về sản lượng sản xuất của Laspeyres và Paasche.

0 1Lq

0 0

z q 9.642,82I 1,0193

z q 9.459,88

lần (hay 101,93%).

1 1Pq

1 0

z q 9.841I 1,0185

z q 9.661,87

lần (hay 101,85%).

c) Sử dụng hệ thống chỉ số (HTCS) tổng hợp để phân tích.

1 1 1 1 0 1

0 0 0 1 0 0

z q z q z q

z q z q z q

Thay số: 9.841 841 9.642,82

9.459,88 9.642,82 9.459,88

Biến động tương đối: 1,0403 = 1,0206 1,0193 (lần)

104,03% = 102,06% 101,93%

(+4,03%) (+2,06%) (+1,93%)

Biến động tuyệt đối: 9.841 – 9.459,88 = (9.841 – 9.642,82) + (9.642,82 – 9.459,88)

381,12 = 198,18 + 182,94 (triệu đồng)

Nhận xét:

Tổng CPSX của 3 phân xưởng quý II bằng 104,03% so với quý I, tức đã tăng 4,03%, tương ứng một lượng tuyệt đối là 381,12 triệu đồng, do ảnh hưởng của các nhân tố sau:

Do sự biến động giá thành chung 3 phân xưởng làm cho tổng CPSX tăng 2,06% tương ứng một lượng tuyệt đối là 198,18 triệu đồng.

Do sự biến động sản lượng sản xuất chung của 3 phân xưởng làm cho tổng CPSX tăng 1,93% tương ứng một lượng tuyệt đối là 182,94 triệu đồng.

Page 192: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

192 v1.0

Bài tập 5

Xuất phát từ mối liên hệ: Doanh thu = Giá Lượng bán

a) Tính chỉ số tổng hợp về giá của Paasche và chỉ số tổng hợp về lượng của Laspeyres. Biết tổng doanh thu của 5 cửa hàng nói trên năm 2007 là 5.200 triệu đồng, tức:

0 0p q 5.200 triệu đồng.

Cửa hàng Doanh thu

(triệu đồng) p1q1

Tỷ lệ % tăng (giảm) giá năm 2008

so với năm 2007

Chỉ số giá năm 2008 so với năm 2007

(%) ip p1q1/ip

A 1.320 3,5 103,5 1.275,36

B 990 –1,5 98,5 1.005,08

C 1.575 3 103 1.529,13

D 1.280 –1,2 98,8 1.295,55

E 1.030 2,7 102,7 1.002,92

Tổng 6.195 6.108,03

1 1 1 1Pp

1 10 1

p

p q p q 6.195I 1,0142

p qp q 6.108,03i

lần (hay 101,42%).

0 1Lq

0 0

p q 6.108,03I 1,1746

p q 5.200

lần (hay 117,46%).

b) HTCS: 1 1 1 1 0 1

0 0 0 1 0 0

p q p q p q

p q p q p q

Thay số: 6.195 6.195 6.108,03

5.200 6.108,03 5.200

Biến động tương đối: 119,13 = 101,42 × 117,46 (%)

Biến động tuyệt đối: 995 = 86,97 + 908,03 (triệu đồng)

Nhận xét:

Bài tập 6

Xuất phát từ mối liên hệ:

Sản lượng = NSLĐ × Số công nhân

a) Chỉ số sản lượng 08/06 = Kế hoạch sản lượng 2008/2006 (100 + tỷ lệ % vượt kế hoạch về sản lượng 08/06)/100 (%) (theo công thức t = Kn × Kt).

Chỉ số sản lượng 08/07 = 100 + Tốc độ tăng sản lượng năm 2008 so với năm 2007 (%)

Chỉ số sản lượng 07/06 = Chỉ số sản lượng 08/06 : Chỉ số sản lượng 08/07

Từ các chỉ số sản lượng 08/07 và 07/06, biết sản lượng 2006, tính được sản lượng 2007 và 2008.

Kết quả tính như ở bảng sau:

Page 193: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 193

Phân xưởng

Sản lượng 2006 (triệu mét)

Tốc độ tăng sản

lượng năm 2008 so với năm

2007 (%)

Kế hoạch sản lượng 2008 so với sản lượng

2006 (%)

Tỷ lệ % vượt kế

hoạch sản lượng của năm 2008

Chỉ số sản

lượng 08/07 (%)

Chỉ số sản

lượng 08/06 (%)

Chỉ số sản

lượng 07/06 (%)

Sản lượng 2008 (triệu mét)

Sản lượng 2007 (triệu mét)

A 12 5 107 5 105 112,35 107,00 13,48 12,84

B 10 8 110 2 108 112,20 103,89 11,22 10,39

Tổng 22 24,70 23,23

Chỉ số sản lượng của hai phân xưởng nói trên năm 2008 và 2007 so với 2006:

I08/06 = Tổng sản lượng 08/Tổng sản lượng 06 = 24,7/22 = 1,1228 lần (hay 112,28%).

I07/06 = Tổng sản lượng 07/Tổng sản lượng 06 = 23,23/22 = 1,0559 lần (hay 105,59%).

Tốc độ tăng sản lượng của hai phân xưởng năm 2008 và 2007 so với 2006 là:

t08/06 = I08/06 – 100 = 12,28%

t07/06 = I07/06 – 100 = 5,59%

b) Tổng sản lượng = NSLĐ bình quân × Tổng số công nhân

Khi đó ta có HTCS: NNT TI I I

Trong đó: Chỉ số NSLĐ bình quân hai phân xưởng = 100 + tốc độ tăng NSLĐ (%) = 130%.

Vậy chỉ số quy mô số công nhân của hai phân xưởng được tính:

NT

TN

I 1,1228I 0,8637

I 1,3 lần (hay 86,37%).

c) HTCS: 1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

N T N T N T N T

N T N T N T N T

Với 0N 0,5 (triệu mét), lần lượt tính được :

1N 0,5 1,3 0,65 (triệu mét)

0T 22 / 0,5 44 người

1T 24,7 / 0,65 38 người

Thay số và tính được:

Biến động tương đối: NNT TI I I

112,28 = 130 86,36%

Biến động tuyệt đối: 2,7 = 5,7 – 3 (triệu mét)

Bài tập 7

Xuất phát từ mối liên hệ: Giá trị sản xuất = NSLĐ × Số công nhân

a) Tính năng suất lao động bình quân 1 công nhân của toàn doanh nghiệp trong quý I.

Page 194: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

194 v1.0

Quý I Quý II

Phân xưởng

Năng suất lao động 1 công nhân

(triệu đồng) xi

Giá trị sản xuất (triệu đồng) Mi

Giá trị sản xuất

(triệu đồng)

Số công nhân quý

I – fi=Mi/xi

Tỷ trọng GTSX quý I (%)

A 25 500 520 20 31,21

B 28 616 640 22 38,45

C 27 486 480 18 30,34

Tổng 1.602 1.640 60 100,00

_i

i

i

M 1.602x 26,7

M 60x

(triệu đồng)

b) Tính tỷ trọng về giá trị sản xuất của từng phân xưởng trong quý I.

Kết quả như ở bảng trên.

c) HTCS: 1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

N T N T N T N T

N T N T N T N T

Quý II, tổng số công nhân toàn doanh nghiệp tăng 5% so với quý I:

0T 60 người

1T 60 1,05 63 người.

0N 26,7 triệu đồng.

1N 1.640 / 63 26,03 triệu đồng

Thay số vào HTCS ở trên và tính được:

Biến động tương đối: 102,4 = 97,5 105%

Biến động tuyệt đối: 38 = – 42,1 + 80,1 triệu đồng

Nhận xét:

Bài tập 8

a) Tính chỉ số giá của từng mặt hàng cửa hàng A so với cửa hàng B. A / B

Ap

B

pi

p

b) Tính chỉ số lượng hàng tiêu thụ của từng mặt hàng cửa hàng A so với cửa hàng B. A / B

Aq

B

qi

q

(Kết quả tính như ở bảng).

c) Tính chỉ số tổng hợp về giá của cửa hàng A so với cửa hàng B.

A / B

A A A Bp

B B A B

p Q p q q 247.250I

p Q p q q 246.690

1,0023 lần (hay 100,23%).

Page 195: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 195

Cửa hàng A Cửa hàng B

Mặt hàng

Giá bán đơn vị (nghìn đồng)

pA

Lượng hàng

tiêu thụ (sản

phẩm) qA

Giá bán đơn vị (nghìn đồng) –

pB

Lượng hàng

tiêu thụ (sản

phẩm) qB

Chỉ số giá A/B

(%)

Chỉ số lượng hàng

tiêu thụ A/B (%)

qA+qB pA(qA+qB) pB(qA+qB)

Tshirt 85 320 82 350 103,66 0,91 670 56.950 54.940

Cotton 70 470 75 500 93,33 0,94 970 67.900 72.750

Jean 180 330 175 350 102,86 0,94 680 122.400 119.000

Tổng 247.250 246.690

d) Tính chỉ số tổng hợp về lượng của cửa hàng A so với cửa hàng B.

Cửa hàng A Cửa hàng B

Mặt hàng

Giá bán đơn vị (nghìn đồng) – pA

Lượng hàng tiêu thụ (sản

phẩm) – qA

Giá bán đơn vị (nghìn đồng) – pB

Lượng hàng tiêu thụ (sản

phẩm) – qB

qA+qB pAqA pBqB p Apq Bpq

Tshirt 85 320 82 350 670 27.200 28.700 83,43 2.6697,6 29.200.5

Cotton 70 470 75 500 970 32.900 37.500 72,58 3.4112,6 36.290.0

Jean 180 330 175 350 680 59.400 61.250 177,43 5.8551,9 62.100.5

Tổng 11.9362,1 127.591.0

A / B

Aq

B

pq 119.362,1I 0,9355

127.591,0pq

lần (hay 93,55%).

Với A A B B

A B

p q p qp

q q

(kết quả tính như ở bảng trên)

Bài tập 9

a) Tính chỉ số tổng hợp về giá thành của mỏ A so với mỏ B.

A / B

A A A BZ

B B A B

z Q z q q 453.150I 1,0194

z Q z q q 444.525

lần (hay 101,94%).

b) Tính chỉ số tổng hợp về sản lượng khai thác của mỏ A so với mỏ B.

A / B

Aq

B

zq 227.047,9I 1,0254

221.422,1zq

lần (hay 102,54%).

Với A A B B

A B

z q z qz

q q

tính được như ở bảng dưới.

Page 196: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

196 v1.0

Mỏ A Mỏ B

Khoáng sản

Giá thành đơn vị (nghìn đồng) – zA

Sản lượng (tấn)

qA

Giá thành đơn vị (nghìn đồng) – zB

Sản lượng (tấn) – qB

qA + qB

zA(qA + qB)

zB(qA + qB)

zAqA zBqB z z qA z qB

Đồng 20 3.650 22 3.300 6.950 139.000 152.900 73.000 72.600 20,95 76.466,2 69.133,8

Chì 25 4.200 23 4.100 8.300 207.500 190.900 105.000 94.300 24,01 100.850,6 98.449,4

Kẽm 18 2.845 17 3.080 5.925 106.650 100.725 51.210 52.360 17,48 49.731,1 53.838,9

Tổng 453.150 444.525 227.047,9 221.422,1

Bài tập 10

Trước hết tính lượng hàng tiêu thụ ở cửa hàng A: qA = doanh số/giá bán

a) Tính chỉ số tổng hợp về giá của cửa hàng A so với cửa hàng B.

A / B

A A A Bp

B B A B

p Q p q q 153.210I 1,0195

p Q p q q 150.275

lần (hay 101,95%).

b) Tính chỉ số tổng hợp về lượng của cửa hàng A so với cửa hàng B.

A / B

Aq

B

pq 76.073,9I 1,0093

75.376,1pq

lần (hay 100,93%).

Với A A B B

A B

p q p qp

q q

Cửa hàng A Cửa hàng B

Loại mũ

Giá bán đơn vị (nghìn đồng)

pA

Doanh số

(nghìn đồng) – pAqA

Giá bán đơn vị (nghìn đồng)

pB

Lượng hàng

tiêu thụ (chiếc)

qB

qA qA + qB

pA(qA + qB)

pB(qA + qB)

pBqB p p qA p qB

Osaka 130 17.550 125 120 135 255 33.150 31.875 15.000 127,6 17.232,4 15.317,6

Amoro 120 12.000 130 85 100 185 22.200 24.050 11.050 124,6 12.459,5 10.590,5

Honda 145 21.750 150 138 150 288 41.760 43.200 20.700 147,4 22.109,4 20.340,6

Protect 170 25.500 155 180 150 330 56.100 51.150 27.900 161,8 24.272,7 29.127,3

Tổng 153.210 150.275 76.073,9 75.376,1

Bài tập 11

a) Phân tích các nhân tố ảnh hưởng đến biến động của năng suất lao động bình quân chung 3 phân xưởng.

HTCS số bình quân:

011 1

0 01 0

NN N

N N N

Page 197: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 197

Trong đó:

0 00

0

N T 11.641N 105,83

T 110

(triệu đồng)

1 11

1

N T 12.220N 106, 26

T 115

(triệu đồng)

0 101

1

N T 12.130N 105, 48

T 115

(triệu đồng)

Năm 2007 Năm 2008

Phân xưởng

NSLĐ bình quân một công

nhân (triệu đồng) N0

Số công nhân bình

quân (người)

To

NSLĐ bình quân một công

nhân (triệu đồng) N1

Số công nhân bình

quân (người)

T1

NoTo(triệu đồng)

N1T1 (triệu đồng)

NoT1 (triệu đồng)

A 105 32 110 35 3.360 3.850 3.675

B 113 37 108 35 4.181 3.780 3.955

C 100 41 102 45 4.100 4.590 4.500

Tổng 110 115 11.641 12.220 12.130

Thay số vào HTCS ở trên:

106,26 106,26 105,48

105,83 105,48 105,83

Biến động tương đối: 1,0041 = 1,0074 × 0,9967

hay 100,41% = 100,74% × 99,67%

(+0,41%) (+0,74%) (–0,33%)

Biến động tuyệt đối: 0,43 = 0,78 – 0,35 (triệu đồng)

Nhận xét:

NSLĐ bình quân chung của công nhân 3 phân xưởng năm 2008 bằng 100,41% so với năm 2007, tức đã tăng thêm 0,41% tương đương một lượng tuyệt đối là 0,43 triệu đồng, do các nhân tố sau:

Do ảnh hưởng biến động của NSLĐ bình quân từng phân xưởng làm cho NSLĐ bình quân chung 3 phân xưởng tăng 0,74% tương đương một lượng tuyệt đối là 0,78 triệu đồng.

Do biến động kết cấu lao động của từng phân xưởng làm cho NSLĐ bình quân chung 3 phân xưởng giảm 0,33% tương đương một lượng tuyệt đối là 0,35 triệu đồng.

Vậy NSLĐ bình quân chung của công nhân 3 phân xưởng năm 2008 tăng so với 2007 là do NSLĐ bình quân của công nhân từng phân xưởng tăng.

b) Phân tích biến động của tổng giá trị sản xuất của 3 phân xưởng do ảnh hưởng của NSLĐ bình quân một công nhân và số công nhân bình quân từng phân xưởng.

HTCS tổng hợp: 1 1 1 1 0 1

0 0 0 1 0 0

N T N T N T

N T N T N T

Page 198: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

198 v1.0

Thay số: 12.220 12.220 12.131

11.641 12.131 12.220

Biến động tương đối: 1,0497 = 1,0074 1,0420

104,97% = 100,74% 104,20%

(+4,97%) (+0,74%) (+4,2%)

Biến động tuyệt đối: 579 = 90 + 489 (triệu đồng)

Nhận xét: Tổng GTSX của 3 phân xưởng năm 2008 bằng 104,97% tức đã tăng lên 4,97% tương ứng một lượng tuyệt đối là 579 triệu đồng so với năm 2007. Nguyên nhân của sự biến động này là do:

Do NSLĐ bình quân của công nhân từng phân xưởng thay đổi làm cho tổng GTSX tăng 0,74% tương ứng với 90 triệu đồng.

Do số công nhân từng phân xưởng thay đổi làm cho tổng GTSX tăng 4,2% tương ứng với 489 triệu đồng.

Vậy tổng GTSX của 3 phân xưởng năm 2008 tăng so với 2007 là do cả hai yếu tố: NSLĐ bình quân của công nhân từng phân xưởng và số công nhân từng phân xưởng, nhưng sự thay đổi số công nhân từng phân xưởng đóng vai trò quyết định trong sự tăng lên này.

c) Phân tích biến động của tổng giá trị sản xuất của 3 phân xưởng do ảnh hưởng của NSLĐ bình quân chung một công nhân 3 phân xưởng và tổng số công nhân 3 phân xưởng.

HTCS tổng lượng biến tiêu thức:

1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

N T N T N T N T

N T N T N T N T

Thay số: 12.220 12.220 105,83 115

11.641 105,83 115 12.220

Biến động tương đối: 1,0497 = 1,0041 1,0455

104,97% = 100,41% 104,55%

(+4,97%) (+0,41%) (+4,55%)

Biến động tuyệt đối: 579 = 49,55 + 529,45 (triệu đồng)

Nhận xét: Tổng GTSX của 3 phân xưởng năm 2008 bằng 104,97% tức đã tăng lên 4,97%

tương ứng một lượng tuyệt đối là 579 triệu đồng so với năm 2007. Nguyên nhân của sự biến

động này là do:

Do sự biến động của NSLĐ bình quân chung của công nhân 3 phân xưởng làm cho tổng

GTSX tăng 0,41% tương ứng một lượng tuyệt đối là 49,55 triệu đồng.

Do sự biến động của tổng số công nhân 3 phân xưởng làm cho tổng GTSX tăng 4,55%

tương ứng một lượng tuyệt đối là 529,45 triệu đồng.

Vậy tổng GTSX của 3 phân xưởng năm 2008 tăng so với 2007 là do cả hai yếu tố: NSLĐ

bình quân chung của công nhân 3 phân xưởng và tổng số công nhân 3 phân xưởng, nhưng sự

thay đổi tổng số công nhân 3 phân xưởng đóng vai trò quyết định trong sự tăng lên này.

Page 199: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 199

Bài tập 12

Các tính toán như ở bảng dưới:

Quý I Quý II

Mặt hàng

Doanh thu

(nghìn đồng) poqo

Giá bán đơn vị (nghìn đồng)

po

Lượng hàng tiêu thụ (sản phẩm)

q1

Giá bán đơn vị (nghìn đồng) p1

qo p1q1 poq1

A 3.850 35 135 40 110 5.400 4.725

B 7.200 50 180 45 144 8.100 9.000

C 6.300 70 120 68 90 8.160 8.400

Tổng 17.350 435 344 21.660 22.125

a) Phân tích biến động của giá bán đơn vị bình quân chung 3 mặt hàng.

HTCS số bình quân:

011 1

0 01 0

pp p

p p p

Trong đó:

0 00

0

p q 17.350p 50, 44

q 344

(nghìn đồng)

1 11

1

p q 21.660p 49,79

q 435

(nghìn đồng)

0 101

1

p q 22.125p 50,86

q 435

(nghìn đồng)

Thay số: 49,79 49,79 50,86

50,44 50,86 50,44

Biến động tương đối: 98,71% = 97,9% 100,83%

Biến động tuyệt đối: –0,65 = –1,07 + 0,42 (nghìn đồng)

b) Phân tích biến động của tổng doanh thu 3 mặt hàng do ảnh hưởng của các nhân tố cấu thành.

Có thể phân tích theo 3 mô hình sau:

HTCS tổng hợp: do ảnh hưởng biến động của giá bán đơn vị và lượng hàng tiêu thụ từng mặt hàng.

1 1 1 1 0 1

0 0 0 1 0 0

p q p q p q

p q p q p q

Thay số: 21.660 21.660 22.125

17.350 22.125 17.350

Biến động tương đối: 124,84% = 97,9% 127,52%

Biến động tuyệt đối: 4.310 = – 465 + 4.775 (nghìn đồng)

Page 200: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

200 v1.0

HTCS tổng lượng biến tiêu thức (mô hình 2 nhân tố): do ảnh hưởng biến động của giá bán đơn vị bình quân chung 3 mặt hàng và tổng lượng hàng tiêu thụ của 3 mặt hàng.

1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

p q p q p q p q

p q p q p q p q

Thay số: 21660 21660 50,44.435

17350 50,44.435 17350

Biến động tương đối: 124,84% = 98,72% 126,46%

Biến động tuyệt đối: 4.310 = –281,4 + 4.591,4 (nghìn đồng)

HTCS tổng lượng biến tiêu thức (mô hình 3 nhân tố): do ảnh hưởng biến động của giá bán đơn vị từng mặt hàng, kết cấu lượng hàng tiêu thụ của từng mặt hàng và tổng lượng hàng tiêu thụ của 3 mặt hàng.

1 1 1 1 01 1 0 1

0 0 01 1 0 1 0 0

p q p q p q p q

p q p q p q p q

hay 1 1 1 1 0 1 0 1

0 0 0 1 0 00 1

p q p q p q p q

p q p q p qp q

Thay số: 21.660 21.660 22.125 50,44 435

17.350 22.125 50,44 435 17.350

Biến động tương đối: 124,84% = 97,9% 100,84% 126,46%

Biến động tuyệt đối: 4.310 = – 465 + 183,6 + 4.591,4 (nghìn đồng)

Bài tập 13

Các tính toán như ở bảng dưới.

2007 2008

Phân xưởng

Tổng quỹ lương (triệu đồng) LoTo

Số lao động

(người) To

Tiền lương bình quân 1 lao động (triệu đồng) L1

Số lao động

(người) T1

Lo L1T1 LoT1

A 1.512 35 45,6 38 43,2 1.732,8 1.641,6

B 1.944 40 50,4 45 48,6 2.268,0 2.187,0

C 1.764 42 42,0 40 42,0 1.680,0 1.680,0

Tổng 5.220 117 123 5.680,8 5.508,6

a) Phân tích biến động của tiền lương bình quân 1 lao động chung 3 phân xưởng.

HTCS số bình quân: 011 1

0 01 0

LL L

L L L

Trong đó:

0 00

0

L T 5.220L 44,62

T 117

(triệu đồng)

Page 201: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 201

1 11

1

L T 5.680,8L 46,19

T 123

(triệu đồng)

0 101

1

L T 5.508,6L 44,79

T 123

(triệu đồng)

Thay số: 46,19 46,19 44,79

44,62 44,79 44,62

Biến động tương đối: 103,52% = 103,13% × 100,38%

Biến động tuyệt đối: 1,57 = 1,4 + 0,17 (triệu đồng)

b) Phân tích biến động của tổng quỹ lương do ảnh hưởng của tiền lương bình quân chung 3

phân xưởng và tổng số lao động của 3 phân xưởng.

HTCS: 1 1 1 1 1 1 0 1

0 0 0 0 0 1 0 0

L T L T L T L T

L T L T L T L T

Thay số: 5.680,8 5.680,8 44,62 123

5.220 44,62 123 5.220

Biến động tương đối: 108,83% = 103,51% × 105,14%

Biến động tuyệt đối: 460,8 = 192,54 + 268,26 (triệu đồng)

Bài tập 14

Các tính toán như ở bảng dưới.

Quý I Quý II

Nhóm hàng

Số lần chu chuyển hàng hoá

– no

Dự trữ hàng hoá bình quân

(triệu đồng)

do

Số lần chu chuyển

hàng hoá – n1

Mức lưu chuyển hàng hoá

(triệu đồng) n1d1

n0d0 d1 n0d1

A 2,5 250 2,6 702 625 270 675

B 3,3 320 3,0 900 1.056 300 990

C 1,8 270 1,9 475 486 250 450

Tổng 840 2.077 2.167 820 2.115

a) Phân tích biến động của mức lưu chuyển hàng hoá do ảnh hưởng biến động của số lần chu chuyển hàng hoá từng mặt hàng và dự trữ hàng hoá bình quân của từng mặt hàng.

HTCS tổng hợp: 1 1 1 1 0 1

0 0 0 1 0 0

n d n d n d

n d n d n d

Thay số: 2.077 2.077 2.115

2.167 2.115 2.167

Biến động tương đối: 95,85% = 98,2% 97,6%

Biến động tuyệt đối: –90 = –38 – 52 (triệu đồng)

b) Phân tích biến động của mức lưu chuyển hàng hoá do ảnh hưởng biến động của số lần chu chuyển hàng hoá bình quân chung 3 mặt hàng và tổng mức dự trữ hàng hoá bình quân của 3 mặt hàng.

Page 202: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

202 v1.0

HTCS tổng lượng biến tiêu thức:

1 1 1 1 0 1

0 0 0 1 0 0

n d n d n d

n d n d n d

Trong đó:

0 00

0

n d 2.167n 2,58

d 840

(lần)

Thay số: 2.077 2.077 2,58 820

2.167 2,58 820 2.167

Biến động tương đối: 95,85% = 98,18% × 97,63%

Biến động tuyệt đối: – 90 = –38,6 – 51,4 (triệu đồng)

Bài tập 15

Các tính toán như ở bảng dưới:

Quý I Quý II

Xí nghiệp

Vốn lưu động

(triệu đồng) VoTo

Số lao động (người)

To

Vốn lưu động (triệu đồng)

V1T1

Vốn lưu động trên 1 lao động

(triệu đồng) V1

Vo T1 VoT1

A 3.600 120 4.200 28,0 30 150 4.500

B 4.800 150 4.725 31,5 32 150 4.800

C 6.300 180 6.120 36,0 35 170 5.950

Tổng 14.700 450 15.045 470 15.250

32,67 32,01 32,45

a) Phân tích biến động của vốn lưu động bình quân chung 1 lao động của 3 xí nghiệp.

HTCS số bình quân: 011 1

0 01 0

VV V

V V V

Trong đó:

0 00

0

V T 14.700V 32,67

T 450

(triệu đồng)

1 11

1

V T 15.045V 32,01

T 470

(triệu đồng)

0 101

1

V T 15.250V 32, 45

T 470

(triệu đồng)

Thay số: 67,32

45,32

45,32

01,32

67,32

01,32

Biến động tương đối: 97,98% = 98,64% 99,33%

Biến động tuyệt đối: – 0,66 = – 0,44 – 0,22 (triệu đồng)

b) Phân tích biến động của vốn lưu động do ảnh hưởng bởi vốn lưu động từng xí nghiệp, kết cấu lao động của từng xí nghiệp và tổng số lao động của cả 3 xí nghiệp.

Page 203: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 203

HTCS tổng lượng biến tiêu thức (mô hình 3 nhân tố):

1 1 1 1 01 1 0 1

0 0 01 1 0 1 0 0

V T V T V T V T

V T V T V T V T

hay 1 1 1 1 0 1 0 1

0 0 0 1 0 00 1

V T V T V T V T

V T V T V TV T

Thay số: 15.045 15.045 15.250 32,67 470

14.700 15.250 32,67 470 14.700

Biến động tương đối: 102,35% = 98,66% 99,32% 104,46%

Biến động tuyệt đối: 345 = – 205 – 104,9 + 654,9 (triệu đồng)

Bài 7: Điều tra chọn mẫu

Bài tập 1

Chọn ngẫu nhiên đơn thuần không hoàn lại.

a) Tính doanh số trung bình chung một nhân viên kinh doanh của các cửa hàng trong mẫu điều tra:

Cửa hàng

Doanh số trung bình 1 nhân viên

kinh doanh (triệu đồng) xi

Doanh số (triệu đồng) Mi

Số nhân viên kinh doanh

(người)

fi = Mi/xi

xi2fi

A 40 520 13 20.800

B 35 595 17 20.825

C 45 945 21 42.525

D 40 640 16 25.600

E 50 500 10 25.000

F 48 720 15 34.560

Tổng 3.920 92 169.310

i i i

ii

i

x f M 3.920x 42,61

Mx 92x

(triệu đồng)

Tính phương sai về doanh số trung bình một nhân viên kinh doanh của các cửa hàng trong mẫu điều tra:

22i i i i2 2

0i i

x f x f 169.310(42,61) 24,71

f f 92

Sai số bình quân chọn mẫu: với n = 92 (người), N = 920 (người):

20

x

n 24,71 92(1 ) (1 ) 0,494

n 1 N 92 1 920

(triệu đồng)

Với độ tin cậy 95,45% tức z = 2, doanh số trung bình chung một lao động kinh doanh của

toàn bộ các cửa hàng được xác định: x xx x z

x xx z x z

Page 204: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

204 v1.0

Thay số: 42,61 – 2 0,494 μ 42,61 + 2 0,494

41,622 μ 43,598 (triệu đồng)

Tổng doanh số của toàn bộ 40 cửa hàng trên:

41,622 920 Tổng doanh số 43,598 920 (triệu đồng)

38.292,14 Tổng doanh số 40.110,16 (triệu đồng)

b) Tính xác suất khi suy rộng doanh số trung bình chung một nhân viên kinh doanh của toàn bộ các cửa hàng khi phạm vi sai số chọn mẫu không vượt quá 1,49 triệu đồng.

Hệ số tin cậy x

x

1, 49z 3,

0, 494

vậy xác suất là 0,9973 hay 99,73%.

Bài tập 2

Chọn không lặp.

a) Tính chỉ số IQ bình quân của 112 em trong mẫu điều tra:

i i

i

x f 11.820x = 105,54

x 112

IQ Số trẻ em (người) fi

xi xifi xi2fi

60 – 70 1 65 65 4.225

70 – 80 5 75 375 28.125

80 – 90 13 85 1.105 93.925

90 – 100 22 95 2.090 198.550

100 – 110 28 105 2.940 308.700

110 – 120 23 115 2.645 304.175

120 – 130 14 125 1.750 218.750

130 – 140 3 135 405 54.675

140 – 150 2 145 290 42.050

150 – 160 1 155 155 24.025

Tổng 112 11.820 1.277.200

Phương sai về chỉ số IQ của mẫu điều tra: 22

i i i i2 20

i i

x f x f 1.277.200(105,54) 264,88

f f 112

Sai số bình quân chọn mẫu:

20

x

n 264,88 112(1 ) (1 ) 1,465

n 1 N 112 1 1.120

Với độ tin cậy 95,45% tức z = 2, chỉ số IQ bình quân của các học sinh trường tiểu học trên

được xác định: x xx x z

x xx z x z

Thay số: 105,54 – 2 1,465 μ 105,54 + 2 1,465

102,61 μ 108,47

Page 205: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 205

b) Tính xác suất khi suy rộng chỉ số IQ bình quân của học sinh trường tiểu học nói trên biết rằng phạm vi sai số chọn mẫu không vượt quá 1,47.

Hệ số tin cậy x

x

1, 47z 1

1,465

, vậy xác suất là 0,6827 (hay 68,27%).

c) Với xác suất 0,9545, tức z = 2 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 2,5, tức εx = 2,5. Lấy phương sai của tổng thể chung là phương sai của cuộc điều tra trước, tức σ2 = 264,88.

Số học sinh cần điều tra theo phương pháp chọn lặp: 2 2 2

2 2x

z 2 264,88n 169,52

2,5

(hay 170 học sinh).

Số học sinh cần điều ta theo phương pháp chọn không lặp: 2 2 2

2 2 2 2 2x

Nz 1.120 2 264,88n 147,23

N z 1.120 2,5 2 264,88

(hay 148 học sinh).

Bài tập 3

Chọn mẫu ngẫu nhiên không lặp.

a) Tính tỷ lệ những người nằm viện từ 10 ngày trở lên với xác suất 0,9544, tức z = 2. Biết rằng, toàn bệnh viện có tổng số 2.000 bệnh nhân, tức N = 2.000.

Số ngày nằm viện (ngày)

1 – 3 4 – 6 7 – 9 10 – 12 13 – 15 16 – 18 19 – 21 22 – 24 Tổng

Số người (người) 24 83 52 22 11 5 2 1 200

Tính tỷ lệ những người nằm viện từ 10 ngày trở lên trong mẫu điều tra:

22 11 5 2 1f 0,205

200

(lần)

Sai số bình quân chọn mẫu:

p

f (1 f ) n 0.205 (1 0.205) 200(1 ) (1 ) 0,027

n 1 N 200 1 2.000

Tỷ lệ những người nằm viện từ 10 ngày trở lên trong toàn bệnh viện:

p = f p = f zσp hay f – zσp p f + z σp

Thay số: 0,205 – 2 0,027 p 0,205 – 2 0,027

0,151 p 0,259 (lần)

Số bệnh nhân nằm viện từ 10 ngày trở lên trong toàn bệnh viện:

0,151 2.000 Số bệnh nhân 0,259 2.000

302 Số bệnh nhân 518 (người)

b) Tính xác suất khi suy rộng tỷ lệ bệnh nhân nằm viện từ 10 ngày trở lên biết rằng phạm vi sai số chọn mẫu không vượt quá 8,15%.

Hệ số tin cậy p

p

0,0815z 3

0,027

, xác suất là 99,73%.

Page 206: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

206 v1.0

c) Với xác suất 0,9545, z = 2 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 5%, εp = 0,05. Lấy phương sai tổng thể chung là phương sai của cuộc điều tra trước, tức lấy p = 0,205, ta có :

Số bệnh nhân cần điều tra theo phương pháp chọn lặp: 2 2

2 2p

z p(1 p) 2 0,205 (1 0,205)n 260,76

0,05

(hay 261 người).

Số bệnh nhân cần điều tra theo phương pháp chọn không lặp. 2 2

2 2 2 2p

Nz p(1 p) 2.000 2 0,205 (1 0,205)n 230,68

N z p(1 p) 2.000 0,05 2 0,205 (1 0,205)

(hay 231 người).

Bài tập 4

Chọn mẫu ngẫu nhiên đơn thuần không lặp.

a) Số ngày đến hạn thanh toán bình quân của mẫu điều tra:

i i

i

x f 2.740x 68,5

x 40

(ngày)

Số ngày đến hạn thanh toán

Số khoản đầu tư ngắn hạn – fi

xi xifi xi2fi

30 – 40 3 35 105 3.675

40 – 50 1 45 45 2.025

50 – 60 8 55 440 24.200

60 – 70 10 65 650 42.250

70 – 80 7 75 525 39.375

80 – 90 7 85 595 50.575

90 – 100 4 95 380 36.100

Tổng 40 2740 198.200

Phương sai của mẫu: 22

i i i i2 20

i i

x f x f 198.200(68,5) 262,75

f f 40

Sai số bình quân chọn mẫu:

20

x

n 262,75 40(1 ) (1 ) 2,416

n 1 N 40 1 300

Với độ tin cậy 95,44% tức z = 2, số ngày đến hạn thanh toán bình quân của 300 khoản đầu tư

ngắn hạn trên được xác định: x xx x z

x xx z x z

Thay số: 68,5 – 2 2,416 μ 68,5 + 2 2,416

63,668 μ 73,332 (ngày)

b) Biết phạm vi sai số chọn mẫu khi suy rộng số ngày đến hạn thanh toán bình quân của tất cả các khoản đầu tư trên không vượt quá 7,25 ngày, hãy tính xác suất khi suy rộng.

Page 207: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

v1.0 207

Hệ số tin cậy x

x

7, 25z 3

2, 416

, vậy xác suất là 99,73%.

c) Xác định tỷ lệ số khoản đầu tư có ngày đến hạn thanh toán dưới 2 tháng với xác suất 0,9545.

Tỷ lệ số khoản đầu tư có ngày đến hạn thanh toán dưới 2 tháng trong mẫu điều tra:

3 1 8f 0,3

40

(lần)

Sai số bình quân chọn mẫu:

p

f (1 f ) n 0,3 (1 0,3) 40(1 ) (1 ) 0,068

n 1 N 40 1 300

Tỷ lệ những khoản đầu tư có ngày đến hạn thanh toán dưới 2 tháng là:

p = f p = f zσp hay f – zσp p f + zσp

Thay số: 0,3 – 2 0,068 p 0,3 + 2 0,068

0,164 p 0,436 (lần)

Bài tập 5

Chọn mẫu ngẫu nhiên đơn thuần không hoàn lại.

a) Tính tuổi trung bình của lao động toàn khu công nghiệp với xác suất 0,9546.

Tuổi Số lao động (người) – fi

xi xifi xi2fi

16 – 18 50 17 850 14.450

18 – 20 163 19 3.097 58.843

20 – 24 280 22 6.160 135.520

24 – 30 214 27 5.778 156.006

30 – 40 150 35 5.250 183.750

40 – 50 88 45 3.960 178.200

50 – 60 45 55 2.475 136.125

≥ 60 10 65 650 42.250

Tổng 1.000 28.220 905.144

Tuổi trung bình của 1.000 lao động trong mẫu điều tra:

i i

i

x f 28.220x 28, 22

x 1.000

(tuổi)

Phương sai của mẫu: 22

i i i i2 20

i i

x f x f 905.144(28, 22) 108,776

f f 1.000

Sai số bình quân chọn mẫu:

20

x

n 108,776 1.000(1 ) (1 ) 0,313

n 1 N 1000 1 10.000

(tuổi)

Page 208: Nguyen ly thong ke

Đáp án – Nguyên lý thống kê

208 v1.0

Với độ tin cậy 95,46% tức z = 2, tuổi trung bình của lao động khu công nghiệp trên được xác

định: x xx x z

x xx z x z

Thay số: 28,22 – 2 × 0,313 μ 28,22 – 2 0,313

27,594 μ 28,846 (tuổi)

b) Tính tỷ lệ lao động trong khu công nghiệp có độ tuổi từ 20 – 29 với xác suất 0,9546.

Tỷ lệ lao động có độ tuổi từ 20 – 29 trong mẫu điều tra:

280 214f 0,494

1.000

(lần)

Sai số bình quân chọn mẫu:

p

f (1 f ) n(1 )

n 1 N

0, 494 (1 0, 494) 1.000(1 ) 0,015

1.000 1 10.000

Tỷ lệ lao động có độ tuổi từ 20 – 29 trong mẫu điều tra là:

p = f p = f zσp hay f – zσp p f + zσp

Thay số: 0,494 – 2 0,015 p 0,494 + 2 0,015

0,464 p 0,524 (lần)

Số công nhân trong khu công nghiệp có độ tuổi từ 20 – 29.

0,464 × 10.000 Số công nhân 0,524 × 10.000

4.640 Số công nhân 5.240 (người)

c) Số công nhân cần điều tra theo phương pháp chọn không hoàn lại với xác suất khi suy rộng là 0,9545, tức z = 2 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 5%, tức εp = 0,05. Lấy phương sai tổng thể chung là phương sai của cuộc điều tra trước, tức lấy p = 0,494, ta có:

2

2 2p

Nz p(1 p)n

N z p(1 p)

2

2 2

10.000 2 0,494 (1 0,494)

10.000 0,05 2 0,494 (1 0,494)

384,56 (hay 385 người).

Page 209: Nguyen ly thong ke

Phụ lục – Nguyên lý thống kê

v1.0 209

PHỤ LỤC

df = 0.1 = 0.05 = 0.025 = 0.01 = 0.005 = 0.001

1 3.078 6.314 12.706 31.821 63.657 318.309

2 1.886 2.920 4.303 6.965 9.925 22.327

3 1.638 2.353 3.182 4.541 5.041 10.215

4 1.533 2.132 2.776 3.747 4.604 7.173

5 1.476 2.015 2.571 3.365 4.032 5.893

6 1.440 1.943 2.447 3.143 3.707 5.208

7 1.415 1.895 2.365 2.998 3.499 4.785

8 1.397 1.860 2.306 2.896 3.355 4.501

9 1.383 1.833 2.262 2.821 3.250 4.297

10 1.372 1.812 2.228 2.764 3.169 4.144

11 1.363 1.796 2.201 2.718 3.106 4.025

12 1.356 1.782 2.179 2.681 3.055 3.930

13 1.350 1.771 2.160 2.650 3.012 3.852

14 1.345 1.761 2.145 2.624 2.977 3.787

15 1.341 1.753 2.131 2.602 2.947 3.733

16 1.337 1.746 2.120 2.583 2.921 3.686

17 1.333 1.740 2.110 2.567 2.898 3.646

18 1.330 1.734 2.101 2.552 2.878 3.610

19 1.328 1.729 2.093 2.539 2.861 3.579

20 1.325 1.725 2.086 2.528 2.845 3.552

21 1.323 1.721 2.080 2.518 2.831 3.527

22 1.321 1.717 2.074 2.508 2.819 3.505

23 1.319 1.714 2.069 2.500 2.807 3.485

24 1.318 1.711 2.064 2.492 2.797 3.467

25 1.316 1.708 2.060 2.485 2.787 3.450

Page 210: Nguyen ly thong ke

Phụ lục – Nguyên lý thống kê

210 v1.0

26 1.315 1.706 2.056 2.479 2.779 3.435

27 1.314 1.703 2.052 2.473 2.771 3.421

28 1.313 1.701 2.048 2.467 2.763 3.408

29 1.311 1.699 2.045 2.462 2.756 3.396

30 1.310 1.697 2.042 2.457 2.750 3.385

40 1.303 1.684 2.021 2.423 2.704 3.307

60 1.296 1.671 2.000 2.390 2.660 3.232

120 1.289 1.658 1.980 2.358 2.617 3.160

240 1.285 1.651 1.970 2.342 2.596 3.125

inf. 1.282 1.645 1.960 2.326 2.576 3.090

Page 211: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

v1.0 211

THUẬT NGỮ

B

Biến động thời vụ

Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng

thời gian nhất định.

C

Chỉ tiêu thống kê

Chỉ tiêu thống kê là những con số phản ánh mặt lượng trong mối liên hệ mật thiết với mặt chất của các hiện tượng và quá trình kinh tế – xã hội số lớn trong điều kiện thời gian và

không gian cụ thể.

Chỉ số trong thống kê

Chỉ số trong thống kê là số tương đối (tính bằng đơn vị lần hoặc %), biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng

nghiên cứu.

Chỉ số ảnh hưởng kết cấu

Chỉ số ảnh hưởng kết cấu là chỉ số phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của sự thay đổi kết cấu tổng thể theo

tiêu thức nghiên cứu.

Chỉ số cấu thành cố định

Chỉ số cấu thành cố định là chỉ số phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của sự thay đổi lượng biến tiêu thức

trong điều kiện kết cấu tổng thể không đổi.

Chỉ số cấu thành khả biến

Chỉ số cấu thành khả biến là chỉ số phản ánh biến động của chỉ tiêu bình quân do ảnh

hưởng của tất cả các nhân tố cấu thành.

Chỉ số đơn

Chỉ số đơn là chỉ số phản ánh sự biến động

của từng đơn vị, hiện tượng cá biệt.

Chỉ số kế hoạch

Chỉ số kế hoạch là chỉ số biểu hiện quan hệ so sánh giữa các mức độ thực tế và kế hoạch của chỉ tiêu nghiên cứu bao gồm chỉ số nhiệm vụ kế hoạch và chỉ số thực hiện kế hoạch.

Chỉ số không gian

Chỉ số không gian là chỉ số biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai điều kiện không gian khác nhau.

Chỉ số nhân tố

Chỉ số nhân tố là chỉ số phản ánh ảnh hưởng biến động của từng nhân tố đối với biến động của hiện tượng phức tạp cấu thành từ nhiều nhân tố.

Chỉ số phát triển

Chỉ số phát triển là chỉ số biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai thời gian khác nhau.

Chỉ số toàn bộ

Chỉ số toàn bộ là chỉ số phản ánh sự biến động của hiện tượng phức tạp do ảnh hưởng của các nhân tố cấu thành.

Chỉ số tổng hợp

Chỉ số tổng hợp là chỉ số phản ánh sự biến động chung của nhiều đơn vị hoặc hiện tượng cá biệt.

Chọn hoàn lại (chọn lặp, chọn nhiều lần)

Chọn hoàn lại là một phương pháp chọn mẫu ngẫu nhiên, mỗi khi đơn vị được chọn ra để điều tra sau đó sẽ được trả lại tổng thể chung và có cơ hội được chọn lại.

Chọn không hoàn lại (chọn một lần)

Chọn không hoàn lại là một phương pháp chọn mẫu ngẫu nhiên, mỗi khi các đơn vị được chọn ra để điều tra sau đó sẽ được xếp riêng ra không trả lại tổng thể chung và không có cơ hội được chọn lại.

Page 212: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

212 v1.0

Chọn mẫu cả khối (mẫu chùm) Chọn mẫu cả khối là phương pháp chọn mẫu mà các đơn vị của tổng thể chung được chia thành các khối (chùm) với số lượng đơn vị có thể bằng hoặc không bằng nhau. Từ các khối đó, người ta chọn ngẫu nhiên một số khối để điều tra. Các đơn vị mẫu lúc này không phải là từng đơn vị lẻ mà là từng khối đơn vị.

Chọn mẫu hệ thống (máy móc) Chọn mẫu hệ thống là phương pháp tổ chức chọn mẫu trong đó mỗi đơn vị được chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã được sắp xếp sẵn của tổng thể chung. Các đơn vị được chọn lần lượt, đơn vị sau cách đơn vị trước một khoảng xác định d = N/n.

Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu ngẫu nhiên đơn giản là phương pháp tổ chức chọn mẫu một cách hoàn toàn ngẫu nhiên không qua một sự sắp xếp nào và có thể dùng phương pháp chọn một lần hoặc chọn nhiều lần.

Chọn mẫu phân loại (phân tổ) Chọn mẫu phân loại (phân bổ) là việc tiến hành chọn các đơn vị mẫu khi tổng thể chung đã được phân chia thành các tổ theo tiêu thức liên quan trực tiếp đến mục đích nghiên cứu. Việc chọn các đơn vị từ các tổ được tiến hành theo phương pháp chọn ngẫu nhiên.

Chọn mẫu phân tầng (chọn nhiều cấp) Chọn mẫu phân tầng là phương pháp tổ chức chọn mẫu phải thông qua ít nhất hai cấp chọn trung gian. Đầu tiên xác định các đơn vị mẫu cấp I sau đó các đơn vị mẫu cấp I lại được phân chia thành các đơn vị chọn mẫu cấp II và cứ như thế cho đến cấp cuối cùng.

Chọn ngẫu nhiên Chọn ngẫu nhiên là phương pháp chọn hoàn toàn ngẫu nhiên không phụ thuộc vào ý muốn chủ quan của con người. Khi đó người ta gọi là điều tra chọn mẫu ngẫu nhiên.

Chọn phi ngẫu nhiên Chọn phi ngẫu nhiên là phương pháp chọn đơn vị điều tra phụ thuộc vào ý muốn chủ quan của người chọn. Khi đó người ta gọi là điều tra chọn mẫu phi ngẫu nhiên.

D

Dãy số lượng biến Dãy số lượng biến là dãy số phân phối mà tiêu thức phân tổ là tiêu thức số lượng.

Dãy số phân phối Dãy số phân phối là một dãy số được lập nên do phân phối các đơn vị tổng thể vào các tổ theo một tiêu thức phân tổ nào đó và được sắp xếp theo trình tự biến động của lượng biến tiêu thức phân tổ.

Dãy số thuộc tính Dãy số thuộc tính là dãy số phân phối mà tiêu thức phân tổ là tiêu thức thuộc tính.

Dãy số thời gian Dãy số thời gian là một dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian.

Dự đoán thống kê Dự đoán thống kê là việc xác định các mức độ của hiện tượng nghiên cứu trong tương lai bằng việc sử dụng tài liệu thống kê và áp dụng các phương pháp phù hợp.

Đ

Điều tra chọn mẫu Điều tra chọn mẫu là loại hình điều tra không toàn bộ, người ta chỉ tiến hành thu thập tài liệu ở một số đơn vị nhất định được chọn ra từ tổng thể chung. Các đơn vị này được chọn theo những qui tắc nhất định để đảm bảo tính đại biểu và kết quả của điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung.

Điều tra chuyên đề Điều tra chuyên đề là loại hình điều tra không toàn bộ, chỉ tiến hành thu thập tài liệu trên

Page 213: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

v1.0 213

một vài đơn vị, thậm chí một đơn vị nhưng đi sâu nghiên cứu chi tiết nhiều khía cạnh.

Điều tra không thường xuyên Điều tra không thường xuyên là việc tiến hành thu thập và ghi chép tài liệu ban đầu của hiện tượng không gắn với quá trình biến động của hiện tượng mà khi nào xét thấy cần thiết mới tiến hành thu thập tại một thời điểm hay một thời kỳ nào đó.

Điều tra không toàn bộ Điều tra không toàn bộ là việc tiến hành thu thập tài liệu trên một bộ phận các đơn vị của hiện tượng nghiên cứu.

Điều tra thống kê Điều tra thống kê là việc tổ chức thu thập tài liệu về các hiện tượng và quá trình kinh tế – xã hội một cách khoa học, theo một kế hoạch thống nhất nhằm phục vụ cho quá trình nghiên cứu thống kê.

Điều tra thường xuyên Điều tra thường xuyên là việc thu thập tài liệu được tiến hành thường xuyên, liên tục, gắn liền với quá trình biến động của hiện tượng qua thời gian.

Điều tra toàn bộ Điều tra toàn bộ là việc tiến hành thu thập tài liệu trên tất cả các đơn vị của hiện tượng nghiên cứu.

Điều tra trọng điểm Điều tra trọng điểm là loại hình điều tra không toàn bộ, người ta chỉ tiến hành điều tra trên một bộ phận quan trọng nhất, chủ yếu nhất của hiện tượng nghiên cứu.

Đối tượng điều tra Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các dữ liệu cần thiết khi tiến hành điều tra.

Đơn vị điều tra Đơn vị điều tra là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế.

Độ lệch tuyệt đối bình quân

Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch tuyệt đối giữa lượng biến và số bình quân của các lượng biến đó.

Độ lệch tiêu chuẩn

Độ lệch tiêu chuẩn là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.

Đường hồi quy lý thuyết

Đường hồi quy lý thuyết là đường điều chỉnh bù trừ các chênh lệch ngẫu nhiên vạch ra xu hướng cơ bản của hiện tượng.

Đường hồi quy thực nghiệm

Đường hồi quy thực nhiệm là đường được hình thành bởi các tài liệu thực tế.

G

Giới hạn dưới

Giới hạn dưới là lượng biến nhỏ nhất hình thành nên một tổ.

Giới hạn trên

Giới hạn trên là lượng biến lớn nhất mà nếu vượt quá nó thì sẽ hình thành một tổ khác.

Giả thiết không

Giả thiết không là giả thiết cần kiểm định, có đặc điểm là luôn có dấu bằng (=).

Giả thiết đối

Giả thiết đối là giả thiết đối lập với giả thiết không, có đặc điểm là không có dấu bằng, chỉ có dấu >, < hoặc ≠ nhưng phải bao hàm hết các trường hợp có thể xảy ra.

Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn

Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn là chỉ tiêu phản ánh sự kết hợp giữa số tương đối và số tuyệt đối. Cụ thể, nó biểu hiện cứ 1% tăng hay giảm liên hoàn thì tương ứng với 1 trị số tuyệt đối là bao nhiêu.

Page 214: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

214 v1.0

H

Hiện tượng số lớn

Hiện tượng số lớn là hiện tượng mà trong đó bao gồm nhiều đơn vị hoặc hiện tượng cá biệt tạo thành.

Hệ số biến thiên

Hệ số biến thiên là số tương đối (lần, %) rút ra từ sự so sánh giữa độ lệch tiêu chuẩn với số bình quân cộng.

Hệ số hồi quy

Hệ số hồi quy phản ánh ảnh hưởng trực tiếp của tiêu thức nguyên nhân x đến tiêu thức kết quả y.

Hệ số tự do

Hệ số tự do là điểm xuất phát của đường hồi quy lý thuyết, nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác)

ngoài x tới sự biến động của y.

Hệ số tương quan

Hệ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ tương quan tuyến

tính đơn.

Hệ số xác định

Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ lệ % thay đổi của

y được giải thích bởi mô hình.

Hàm xu thế

Hàm xu thế là một hàm số (hay còn gọi là phương trình hồi quy) biểu diễn mối liên hệ

của hiện tượng theo thời gian.

Hệ thống chỉ số

Hệ số chỉ số là một đẳng thức phản ánh mối liên hệ giữa các chỉ số.

K

Khoảng cách tổ

Khoảng cách tổ là chênh lệch giữa giới hạn trên và giới hạn dưới của một tổ.

Khoảng biến thiên Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu.

L

Lượng biến Lượng biến là các trị số biểu hiện mức độ cụ thể của tiêu thức số lượng.

Lượng biến không liên tục (rời rạc) Lượng biến không liên tục (rời rạc) là lượng biến mà các trị số của nó chỉ có thể biểu hiện bằng các số nguyên.

Lượng biến liên tục Lượng biến liên tục là lượng biến mà các trị số của nó có thể được biểu hiện bằng số nguyên hay số thập phân.

Lượng tăng (giảm) tuyệt đối Lượng tăng (giảm) tuyệt đối là chỉ tiêu phản ánh sự biến động về trị số tuyệt đối của chỉ tiêu giữa hai thời gian nghiên cứu.

M Mật độ phân phối Mật độ phân phối là tỷ số giữa tần số (hoặc tần suất) với trị số khoảng cách tổ.

Mốt Mốt là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể hay trong 1 dãy số phân phối.

Mức ý nghĩa Mức ý nghĩa là xác suất mắc sai lầm khi bác bỏ giả thiết không dù nó đúng.

Mức độ bình quân theo thời gian Mức độ bình quân theo thời gian là chỉ tiêu tổng hợp phản ánh mức độ đại biểu của hiện tượng trong toàn bộ thời gian nghiên cứu hoặc từng giai đoạn nghiên cứu.

N Nội dung điều tra Nội dung điều tra là toàn bộ các đặc điểm cơ bản của từng đối tượng, từng đơn vị điều tra

Page 215: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

v1.0 215

mà ta cần thu được thông tin hay nói cách khác, đó là danh mục về các tiêu thức hay đặc trưng của các đơn vị điều tra cần thu thập.

P

Phân tích và dự đoán thống kê Phân tích và dự đoán thống kê là nêu lên một cách tổng hợp bản chất cụ thể và tính quy luật của các hiện tượng và quá trình kinh tế xã hội trong điều kiện nhất định qua biểu hiện bằng số lượng và tính toán các mức độ trong tương lai, nhằm đưa ra những căn cứ cho quyết định

quản lý.

Phân tổ thống kê

Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nhất định để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành

các tổ và các tiểu tổ có tính chất khác nhau.

Phương án điều tra thống kê

Phương án điều tra thống kê là một văn bản được xây dựng trong bước chuẩn bị điều tra, trong đó qui định rõ những vấn đề cần phải được giải quyết hoặc cần hiểu thống nhất trước, trong và sau khi tiến hành điều tra

thống kê.

Phân tích hồi quy

Phân tích hồi quy là phương pháp nghiên cứu mối quan hệ giữa một biến phụ thuộc với một

hoặc nhiều biến độc lập khác.

Phân tích tương quan

Phân tích tương quan là phương pháp nhằm đo mức độ chặt chẽ của mối liên hệ giữa

hai biến.

Phân tích hồi quy tương quan

Phân tích hồi quy tương quan là phương pháp

phân tích mối liên hệ tương quan giữa các biến.

Phương pháp bình phương nhỏ nhất

Phương pháp bình phương nhỏ nhất là tổng bình phương các độ lệch giữa giá trị thực tế

và giá trị lý thuyết của biến phụ thuộc (tiêu

thức kết quả) là nhỏ nhất.

Phương trình hồi quy tuyến tính đơn

Phương trình hồi quy tuyến tính đơn là

phương trình có dạng: xy = b0 + b1x, được

xây dựng nhằm xác định mối liên hệ giữa hai biến. Nó được dùng để dự đoán giá trị của biến phụ thuộc y trên cơ sở giá trị nhất định của biến độc lập x.

Phương trình hồi quy phi tuyến đơn

Phương trình hồi quy phi tuyến đơn là phương trình biểu diễn mối liên hệ giữa hai biến nhưng đồ thị của nó không có dạng đường thẳng mà là các đường cong khác.

Phạm vi sai số chọn mẫu (hay độ chính xác của suy rộng)

Phạm vi sai số chọn mẫu (hay độ chính xác của suy rộng) là chênh lệch giữa các chỉ tiêu của tổng thể mẫu và các chỉ tiêu tương ứng của tổng thể chung với độ tin cậy nhất định.

S

Sai số trong điều tra thống kê

Sai số trong điều tra thống kê là chênh lệch giữa các trị số của tiêu thức điều tra mà ta thu thập được so với trị số thực tế của hiện tượng nghiên cứu.

Số tuyệt đối trong thống kê

Số tuyệt đối trong thống kê là mức độ phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.

Số tương đối trong thống kê

Số tương đối trong thống kê là mức độ phản ánh quan hệ so sánh giữa hai mức độ của hiện tượng nghiên cứu.

Số bình quân trong thống kê

Số bình quân trong thống kê là mức độ biểu hiện mức độ đại biểu cho tất cả các lượng

Page 216: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

216 v1.0

biến theo một tiêu thức nào đó của các đơn vị cùng loại.

Số bình quân trượt

Số bình quân trượt là số bình quân của một nhóm nhất định các mức độ trong dãy số được tính bằng cách lần lượt loại trừ dần mức độ đầu, đồng thời thêm vào các mức độ tiếp theo sao cho số lượng các mức độ tham gia

tính số bình quân là không đổi.

Sai số bình quân chọn mẫu

Sai số bình quân chọn mẫu là một trị số sai số chọn mẫu đại diện cho các giá trị của sai số chọn mẫu hay nói cách khác đó là bình quân của tất cả các sai số chọn mẫu do việc lựa

chọn mẫu có kết cấu thay đổi.

Sai số chọn mẫu

Sai số chọn mẫu là phần chênh lệch giữa kết quả thu được qua điều tra và giá trị thực tế

của nó trong tổng thể chung.

Suy rộng (ước lượng)

Suy rộng (ước lượng) là từ các tham số (mức độ) tính toán được trên các đơn vị điều tra suy ra các tham số tương ứng của toàn bộ

hiện tượng.

T

Thống kê

Thống kê là các hoạt động về thu thập, xử lý và phân tích các dữ liệu về các hiện tượng nhằm rút ra kết luận làm căn cứ cho quyết

định quản lý.

Thống kê học

Thống kê học là môn khoa học xã hội nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong những điều kiện địa điểm và thời gian

cụ thể.

Tiêu thức thống kê

Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tùy theo

mục đích nghiên cứu khác nhau.

Tổng thể thống kê

Tổng thể thống kê là hiện tượng kinh tế – xã hội số lớn mà trong đó bao gồm nhiều đơn vị hoặc hiện tượng cá biệt có một hoặc một số

đặc điểm chủ yếu là giống nhau.

Tần số

Tần số là số lượng biến của từng tổ được sắp xếp vào trong từng tổ hay là số lần lặp lại của

các lượng biến.

Tần suất

Tần suất là tỷ trọng của từng bộ phận trong tổng thể, là tần số được biểu hiện bằng số

tương đối.

Thời điểm điều tra

Thời điểm điều tra là mốc thời gian (ngày, giờ cụ thể) được xác định để tiến hành thu thập tài liệu một cách thống nhất trên tất cả

các đơn vị của hiện tượng nghiên cứu.

Thời hạn điều tra

Thời hạn điều tra là khoảng thời gian kể từ lúc bắt đầu tiến hành điều tra cho đến khi hoàn thành việc thu thập tài liệu trên tất cả

các đơn vị điều tra.

Thời kỳ điều tra

Thời kỳ điều tra là độ dài (khoảng) thời gian có sự tích luỹ về mặt lượng của hiện tượng

nghiên cứu.

Tiêu thức phân tổ

Tiêu thức phân bổ là tiêu thức thống kê được

chọn làm căn cứ để phân tổ thống kê.

Tổng hợp thống kê

Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học

Page 217: Nguyen ly thong ke

Thuật ngữ – Nguyên lý thống kê

v1.0 217

toàn bộ tài liệu thu thập được trong điều tra

thống kê.

Trị số giữa của tổ

Trị số giữa của tổ là trung bình cộng giữa giới hạn trên và giới hạn dưới của tổ điều tra

thống kê.

Tiêu chuẩn kiểm định

Tiêu chuẩn kiểm định là quy luật phân phối xác suất nào đó được dùng để kiểm định với điều kiện, trong một tập hợp các kiểm định thống kê có cùng mức ý nghĩa α, kiểm định nào có xác suất mắc sai lầm khi thừa nhận H0

dù nó sai là nhỏ nhất sẽ được xem là tốt nhất.

Tỷ số tương quan

Tỷ số tương quan là chỉ tiêu đánh giá trình độ

chặt chẽ của mối liên hệ tương quan phi tuyến.

Tốc độ phát triển

Tốc độ phát triển là chỉ tiêu phản ánh xu

hướng phát triển của hiện tượng qua thời gian.

Tốc độ tăng (giảm)

Tốc độ tăng (giảm) là chỉ tiêu phản ánh mức độ của hiện tượng trong hai thời gian nghiên cứu tăng lên hay giảm đi bao nhiêu lần hay

bao nhiêu %.

Tổng thể chung

Tổng thể chung là tổng thể bao gồm toàn bộ

các đơn vị thuộc đối tượng điều tra.

Tổng thể mẫu

Tổng thể mẫu là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng thể

chung để tiến hành điều tra thực tế.

Page 218: Nguyen ly thong ke