su dung stata 3

10
Lp Phng pháp NCKH – Chng trình CUD UPNT03 1 S DNG STATA 10.0 PHÂN TÍCH THNG KÊ TRONG NGHIÊN CU KHOA HC KIM NH GI THIT TS. BS Tng Kim Hng 1. Kim nh s trung bình 1.1 Kim nh 1 s trung bình M file “PULSE” phân tích. - Lnh s dng trong STATA nh sau: + Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One sample mean comparison test -> Chn bin s cn kim nh và giá tr cn kim nh, d chn bin s Pulse1và hypothezied value la 80 -> Submit (Gi s gi nh v phân phi bình thng ca bin s ã c tha)

Upload: lop-ckii-dh-pham-ngoc-thach

Post on 26-Jun-2015

992 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

1

���������������

S� D�NG STATA 10.0 �� PHÂN TÍCH TH�NG KÊ

TRONG NGHIÊN C�U KHOA H�C

KI�M ��NH GI THIT

TS. BS T�ng Kim H�ng

1. Ki�m � nh s� trung bình 1.1 Ki�m � nh 1 s� trung bình

� M� file “PULSE” �� phân tích.

- Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One

sample mean comparison test -> Ch�n bi�n s� c�n ki�m ��nh và giá tr� c�n ki�m ��nh, ví

d� ch�n bi�n s� Pulse1và hypothezied value la 80 -> Submit

(Gi� s gi� � nh v� phân ph�i bình th��ng c�a bi�n s� �ã ���c th�a)

Page 2: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

2

�����t qu� có ���c nh� sau: . ttest pulse1 == 80 One-sample t test ------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- pulse1 | 92 72.86957 1.147737 11.00871 70.58973 75.1494 ------------------------------------------------------------------------------ mean = mean(pulse1) t = -6.2126 Ho: mean = 80 degrees of freedom = 91 Ha: mean < 80 Ha: mean != 80 Ha: mean > 80 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

T� k�t qu� này, ta th�y r�ng: Vì giá tr p <0.0001, nên chúng ta lo�i b� H0 và k�t lu�n

r�ng d�a trên m�u này, trung bình m�ch c�a bnh nhân trong dân s� khác bit v�i giá tr 80 l�n/phút m�t cách có ý ngh�a

- Tính v�i s� có s�n, lnh s d�ng trong STATA nh� sau:

ttesti n x s µ0

Ví d� v�i m�u 50 bnh nhân, có trung bình amylase huy�t thanh là 96�v/ml, �� lch

chu n 35, ta có th� ch!ng minh trung bình amylase huy�t thanh trong dân s� có th�c s�

khác v�i giá tr 120�v/ml không?

- Lnh trong SATAT:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One

sample mean comparison calculator

Page 3: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

3

����t qu� có ���c nh� sau: . ttesti 50 96 35 120 One-sample t test ------------------------------------------------------------------------------ | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x | 50 96 4.949747 35 86.05311 105.9469 ------------------------------------------------------------------------------ mean = mean(x) t = -4.8487 Ho: mean = 120 degrees of freedom = 49 Ha: mean < 120 Ha: mean != 120 Ha: mean > 120 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

T� k�t qu� này, ta th�y r�ng: Vì giá tr p <0.0001, nên chúng ta lo�i b� H0 và k�t lu�n

r�ng d�a trên m�u này, trung bình amylase huy�t thanh c�a dân s� khác bit v�i giá tr 120�v/ml m�t cách có ý ngh�a

1.2 Ki�m � nh s� khác bi�t c�a 2 s� trung bình 1.2.1 Ki�m ��nh s� khác bi�t c�a 2 s� trung bình l�y t 2 mu khác

nhau

- Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two

sample mean comparison test -> Ch�n 2 bi�n s� c�n so sánh s� trung bình -> Submit

- Tính v�i s� có s�n, lnh s d�ng trong STATA nh� sau:

ttesti n1 x1 s1 n2 x2 s2

Ví d�: M�t nhóm nghiên c!u thu th�p s� liu amylase huy�t thanh t� m�t m�u g�m

nh"ng ng��i kh�e m�nh và 1 m�u t� nh"ng bnh nhân trong bnh vin. Nhóm NC mu�n

bi�t trung bình amylase huy�t thanh c�a 2 dân s� có khác nhau hay không. D" liu v� 2

m�u nh� sau:

M�u n x SD

Ng��i kh�e m�nh 50 96 35

Bnh nhân 60 120 40

Page 4: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

4

- Lnh trong STATA:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two

sample mean comparison calculator

����t qu� có ���c nh� sau: . ttesti 50 96 35 60 120 40 Two-sample t test with equal variances ------------------------------------------------------------------------------ | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x | 50 96 4.949747 35 86.05311 105.9469 y | 60 120 5.163978 40 109.6669 130.3331 ---------+-------------------------------------------------------------------- combined | 110 109.0909 3.766917 39.50776 101.625 116.5568 ---------+-------------------------------------------------------------------- diff | -24 7.240735 -38.35239 -9.647607 ------------------------------------------------------------------------------ diff = mean(x) - mean(y) t = -3.3146 Ho: diff = 0 degrees of freedom = 108 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0006 Pr(|T| > |t|) = 0.0013 Pr(T > t) = 0.9994

T� k�t qu� này, ta th�y r�ng: Vì giá tr p = 0.0013 <0.05, nên chúng ta lo�i b� H0 và k�t

lu�n r�ng d�a trên s� liu này, chúng ta có th� k�t lu�n � m!c ý ngh�a 5% r�ng trung bình

amylase huy�t thanh c�a dân s� ng��i bình th��ng và ng��i bnh khác bit nhau m�t

cách có ý ngh�a.

* L�u ý: Tr��c khi so sánh 2 s� trung bình c�n ph�i ki�m � nh xem ph��ng sai có b�ng

nhau hay không �� quy�t � nh ch#n ph��ng sai b�ng nhau hay không b�ng nhau khi làm

phép ki�m t (s$ gi�i thích rõ trong ph�n d��i �ây)

* Ki�m ��nh s� khác bi�t c�a 2 s� trung bình l�y t 2 nhóm

� M� file “PULSE” �� phân tích.

- Ví d�: chúng ta c�n so sánh trung bình cân n%ng c�a 2 nhóm nam và n"

- Tr��c tiên chúng ta c�n so sánh ph��ng sai c�a hai nhóm �� xem ph��ng sai có b�ng

nhau hay không.

Page 5: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

5

Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group

variance comparison test -> Ch�n bi�n s� c�n ki�m ��nh (weigh) và bi�n s� phân nhóm

(sex) -> Submit

(Gi� s gi� � nh v� phân ph�i bình th��ng c�a bi�n s� �ã ���c th�a)

�����t qu� có ���c nh� sau: . sdtest weight, by(sex) Variance ratio test ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- 1 | 57 69.82456 1.100274 8.306888 67.62045 72.02868 2 | 35 54.57143 .9977165 5.90257 52.54382 56.59903 ---------+-------------------------------------------------------------------- combined | 92 64.02174 1.098035 10.53198 61.84063 66.20285 ------------------------------------------------------------------------------ ratio = sd(1) / sd(2) f = 1.9806 Ho: ratio = 1 degrees of freedom = 56, 34 Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.9825 2*Pr(F > f) = 0.0351 Pr(F > f) = 0.0175

H0: T& s� 2 ph��ng sai (sd1 và sd2) b�ng 1, t!c là sd1 = sd2

T� k�t qu� này, ta th�y r�ng: Vì giá tr p = 0.0351 <0.05, nên chúng ta lo�i b� H0 (2

ph��ng sai b�ng nhau) và k�t lu�n r�ng d�a trên s� liu này, chúng ta có th� k�t lu�n �

m!c ý ngh�a 5% r�ng ph��ng sai c�a cân n%ng � nam và � n" khác bit nhau m�t cách có

ý ngh�a.

- Sau khi �ã xác � nh là ph��ng sai c�a 2 m�u không b�ng nhau, ta so sánh 2 s� trung

bình c�a 2 m�u (v�i �i�u kin ph��ng sai không b�ng nhau)

Lnh s d�ng trong STATA nh� sau:

Page 6: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

6

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group

mean comparison test -> Ch�n bi�n s� c�n ki�m ��nh (weigh) và bi�n s� phân nhóm (sex)

-> Ch�n unequal variances -> Submit

(Gi� s gi� � nh v� phân ph�i bình th��ng c�a bi�n s� �ã ���c th�a)

����t qu� có ���c nh� sau: . ttest weight, by(sex) unequal Two-sample t test with unequal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- 1 | 57 69.82456 1.100274 8.306888 67.62045 72.02868 2 | 35 54.57143 .9977165 5.90257 52.54382 56.59903 ---------+-------------------------------------------------------------------- combined | 92 64.02174 1.098035 10.53198 61.84063 66.20285 ---------+-------------------------------------------------------------------- diff | 15.25313 1.485275 12.30145 18.20481 ------------------------------------------------------------------------------ diff = mean(1) - mean(2) t = 10.2696 Ho: diff = 0 Satterthwaite's degrees of freedom = 87.9805 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000

H0: S� khác bit 2 s� trung bình (mean1 và mean2) b�ng 0, t!c là mean1 = mean2

T� k�t qu� này, ta th�y r�ng: Vì giá tr p < 0.0001, nên chúng ta lo�i b� H0 (2 trung bình

b�ng nhau) và k�t lu�n r�ng d�a trên s� liu này, chúng ta có th� k�t lu�n � m!c ý ngh�a

5% r�ng trung bình cân n%ng c�a nam và n" khác bit nhau m�t cách có ý ngh�a.

1.2.2 Ki�m ��nh s� khác bi�t c�a 2 s� trung bình l�y t cùng 1 mu (so

sánh tr��c-sau, so sánh c p

� M� file “PULSE” �� phân tích.

- Ví d�: chúng ta c�n so sánh trung bình m�ch tr��c và sau khi dùng thu�c có khác nhau

không

Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Mean

comparison test, paired data -> Ch�n bi�n s� c�n ki�m ��nh -> Submit

(Gi� s gi� � nh v� phân ph�i bình th��ng c�a bi�n s� �ã ���c th�a)

Page 7: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

7

�����t qu� có ���c nh� sau: . ttest pulse1 == pulse2 Paired t test ------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- pulse1 | 90 72.53333 1.141237 10.82673 70.26572 74.80095 pulse2 | 90 78.8 1.601981 15.19772 75.6169 81.9831 ---------+-------------------------------------------------------------------- diff | 90 -6.266667 1.294259 12.27842 -8.838332 -3.695002 ------------------------------------------------------------------------------ mean(diff) = mean(pulse1 - pulse2) t = -4.8419 Ho: mean(diff) = 0 degrees of freedom = 89 Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

H0: Trung bình c�a s� khác bit (pulse1 - pulse2) b�ng 0

T� k�t qu� này, ta th�y r�ng: Vì giá tr p < 0.0001, nên chúng ta lo�i b� H0 (trung bình

c�a s� khác bit =0) và k�t lu�n r�ng d�a trên s� liu này, chúng ta có th� k�t lu�n � m!c

ý ngh�a 5% r�ng trung bình c�a s� khác bit nh p m�ch c�a bnh nhân tr��c và sau khi

�i�u tr khác 0, hay nói cách khác trung bình m�ch c�a bnh nhân tr��c và sau khi �i�u

tr khác nhau m�t cách có ý ngh�a.

2. Ki�m � nh t� l� 2.1 Ki�m � nh 1 t� l�

- Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One

sample proportion test -> Ch�n bi�n s� c�n ki�m ��nh và giá tr� c�n ki�m ��nh, ví d� ch�n bi�n s� smoke và hypothezied value là 0.15 -> Submit

Page 8: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

8

2.2 Ki�m � nh 2 t� l� - Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two

sample proportion test -> Ch�n bi�n s� c�n ki�m ��nh -> Submit

* Ki�m ��nh s� khác bi�t c�a 2 t� l� l�y t 2 nhóm

� M� file “PULSE” �� phân tích.

- Ví d�: chúng ta c�n so sánh t& l hút thu�c lá c�a nam và n"

- Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group

proportion test -> Ch�n bi�n s� c�n ki�m ��nh (smokes) và bi�n s� phân nhóm (sex) ->

Submit

Page 9: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

9

3. Phép ki�m chi-bình ph��ng (chi-square) ��M� file “PULSE” �� phân tích.

Page 10: Su dung stata 3

L�p Ph��ng pháp NCKH – Ch��ng trình CUD UPNT03

10

- Lnh s d�ng trong STATA nh� sau:

+ Statistics -> Summaries, tables and tests -> Tables -> Two way tables with measures

of association -> Nhp bi�n s� cho hàng và ct -> Ch�n phép ki�m c�n s� d�ng (ví d� Chi-square hay Fisher’s exact test -> Submit

(N�u mu�n có t� l theo hàng thì ch�n thêm “within- row relative frequency”, n�u mu�n

có t� l theo ct thì ch�n thêm “within- column relative frequency”)

�- Tính v�i s� có s�n, lnh s d�ng trong STATA nh� sau:

tabi a b\c d\e f, chi 2

hay

tabi a b\c d\e f, exact