basic using spss v11.5

Post on 08-Apr-2015

1.450 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

การใชโปรแกรม SPSS version 11.5 เบื้องตน เพื่อการวิเคราะหขอมูล

สารบัญ

ชัยเทพ พูลเขตต ภาควิชาสัตวแพทยสาธารณสุขศาสตรและการบริการวินิจฉัย

คณะสัตวแพทยศาสตร มหาวิทยาลัยเกษตรศาสตร

สารบัญ..................................................................................................................................................1 1. ขอมูลและตัวแปร.........................................................................................................................2 2. การติดต้ังโปรแกรม .....................................................................................................................4 3. เมนูและคําสั่งที่สําคัญ ..................................................................................................................9 4. การจัดการขอมูลเบื้องตน...........................................................................................................13 5. การตรวจสอบการแจกแจงของขอมูลเชิงปรมิาณ.........................................................................16 6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา......................................................................................24 7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA ........30 8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation .....................38 9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ .......................................................41

1. ขอมูลและตัวแปร

ขอมูล (Data) a. ขอเท็จจริงที่เกิดขึ้น b. ขอความหรือตัวเลข c. อาจเกี่ยวของกับคน พืช สัตว ส่ิงของ d. จํานวนสุกรทั้งหมดของประเทศไทยในเดือนมกราคม พ.ศ. 2550 เปนขอมูลเชิงตัวเลข e. ระดับความชอบของนิสิตป 5 ตอวิชาชีวสถิติ

ตัวแปร (Variable) ขอมูลท่ีไดจากการสังเกต วัด นับ สอบถาม หนวยที่ศึกษาอาจเปนคน สัตว พืช และส่ิงของ หนวยศึกษาที่แตกตางกันทําใหไดขอมูลท่ีแตกตางกัน จึงเรียกขอมูลนั้นวา “ตัวแปร” จํานวนโคนมในเขตอําเภอกําแพงแสน หนวยศึกษา = โคนมในเขตอําเภอกําแพงแสน ตัวแปร = จํานวนโคนม

คาของตัวแปรคือขอมูล

สาเหตุท่ีทําใหคาของตัวแปรหรือขอมูลมีคาแตกตางกัน คุณลักษณะที่แตกตางกัน เชน อายุโคที่แตกตางกัน น้ําหนักโค ปริมาณน้ํานมที่ได ฯลฯ หรืออาจกลาวไดวาหนวยที่ศึกษา

มีลักษณะที่แตกตางกัน เวลาที่แตกตางกัน เชน ปริมาณน้ํานมของแตละชวงเวลา (day in milk)

สถานที่แตกตางกัน ฟารมที่เล้ียง

ประเภทของขอมูล แบงตามแหลงที่มาของขอมูล Primary data

เปนขอมูลท่ีผูใชเก็บเอง มีความละเอียดสูง สัมภาษณ ทดลอง สังเกตการณ Raw data (ยังไมมีการวิเคราะห) เสียเวลาในการเก็บ คาใชจายสูง

Secondary data ผูใชไมไดเก็บรวบรวมเอง แตมีหนวยงานหรือผูอื่นเก็บรวบรวมไวแลว ประหยัดเวลาและคาใชจายกวาการเก็บ Primary data

2

ขอมูลบางสวนอาจไมตรงกับความตองการของผูใชหรือรายละเอียดไมเพียงพอ มีการวิเคราะหเบ้ืองตนมาบางแลว (Information) ผูใชสามารถนําไปใชไดเลย แตอาจมีความผิดพลาดได

แบงตาม Scale ของการวัด Nominal Scale Color

Ordinal Scale Ranking topics

Interval Scale Temperature

Ratio Scale Salary

แบงตามลักษณะของขอมูล Quantitative Data Ratio and Interval Scale Discrete Data and Continuous Data

Qualitative Data (Categorical Data) Nominal and Ordinal Scale

Quantitative Data <--> Qualitative Data

การวิเคราะหขอมูลประเภทตางๆ Quantitative Data >> สามารถใชเทคนิคการวิเคราะหไดทุกเทคนิค Qualitative Data >> ใชเทคนิคการวิเคราะหไดบางเทคนิค ไมสามารถหาคาเฉล่ีย คาเบ่ียงเบนมาตรฐานได

Data Calculation Methods Nominal Scale Frequency, percentage, mode, crosstab, chi-square test, binomial test Ordinal Scale Median, mode, percentile, rank-order correlation, sign test, crosstab, chi-square test,

nonmetric multidimensional scaling Interval Scale Mean, standard deviation, average, correlation analysis, discriminant analysis,

regression analysis, ANOVA, metric multidimensional scaling Ratio Scale All of mean, standard deviation, coefficient of variance, correlation analysis, regression

analysis, ANOVA, average, discriminant analysis, factor analysis, cluster analysis, metric multidimensional scaling

3

2. การติดตั้งโปรแกรม

2.1. การติดตั้งโปรแกรม SPSS version 11.5 สามารถทําไดดังนี้ a. นําแผนซีดีของโปรแกรม SPSS for windows version 11.5 ใสในซีดีรอม b. คอมพิวเตอรจะตรวจสอบไดรฟอัตโนมัติ (Autorun) จากนั้นใหทําการติดตั้งตามขั้นตอน d เปนตน

ไป แตถาคอมพิวเตอรไมสามารถตรวจสอบไดรฟอัตโนมัติใหติดตั้งโปรแกรมตั้งแตขั้นตอนที่ c c. ดับเบิลคลิกที่ My Computer d. ดับเบิลคลิกที่โฟลเดอร SPSS version 11.5 e. ดับเบิลคลิกที่ไอคอน setup (ดูภาพขางลางประกอบ)

f. คลิกปุม Next และ Yes (ดูภาพขางลางประกอบ)

4

g. คลิกปุม Next เพ่ือติดตั้งโปรแกรม (ดูภาพขางลางประกอบ)

h. ใส Serial number เปนหมายเลข xxxxx และคลิก Next (ดูภาพขางลางประกอบ)

i. คลิกเลือกการติดงตั้งแบบ Personal installation (ดูภาพขางลางประกอบ)

5

j. ใส License code หมายเลข xxxxxxxxxxx แลวคลิก Update จากนั่นใหใส Update code หมายเลข xxxxxxxxxxx ในชองเดิมและคลิก Update อีกครั้ง เมื่อเสร็จแลวใหคลิก Next 2 ครั้ง และรอจนกระทั่งการติดตั้งในขั้นตอนแรกแลวเสร็จ (ดูภาพขางลางประกอบ)

6

k. คลิก Next 2 ครั้ง และรอโปรแกรมติดตั้งใหแลวเสร็จ (ดูภาพขางลางประกอบ)

l. เมื่อโปรแกรมติดตั้งใหเสร็จแลว จะปรากฏหนาจอเพ่ือถามการลงทะเบียนผูใช ใหเลือก Register later แลวคลิก Next (ดูภาพขางลางประกอบ)

7

m. เมื่อโปรแกรม SPSS version 11.5 แลวเสร็จสมบูรณแลวจะปรากฏหนาจอเหมือนภาพดานลาง ใหทําการคลิกเลือก Finish เปนอันส้ินสุดขบวนการติดตั้งโปรแกรม ทั้งนี้หากผูใชคลิกเลือก Launch tutorial now? และ/หรือ Display the ReadMe file now โปรแกรม SPSS จะแนะนําการใชโปรแกรมและขอควรทราบเกี่ยวกับการใชโปรแกรม SPSS version 11.5 (ดูภาพขางลางประกอบ)

2.2 การเรียกใชโปรแกรม SPSS version 11.5

a. คลิก Start > All programs > SPSS for Windows > SPSS 11.5 for Windows

8

3. เมนูและคําสั่งที่สําคัญ

ผูใชโปรแกรม SPSS จําเปนตองทราบถึงเมนูและคําสั่งพ้ืนฐานเพื่อการใชโปรแกรมที่ถูกตอง ซึ่งจําเปนอาศัยความคุนเคยกับตัวโปรแกรม เพ่ือใหไดประสิทธิภาพในการใชประโยชนจากโปรแกรม SPSS สูงสุด ผูใชจําเปนตองมีการฝกปฏิบัติเปนประจําและสม่ําเสมอในการใชโปรแกรม

a. สวนประกอบของหนาจอ เมื่อเปดโปรแกรม SPSS version 11.5 จะปรากฏหนาจอคลายภาพดานลาง

Run the tutorial หมายถึง การเปดบทเรียนการใช SPSS ในโปรแกรม Type in data หมายถึง การเริ่มตนใชโปรแกรมโดยการปอนตัวแปรและคาของตัวแปร Run an existing query หมายถึง การทํางาน SPSS รวมกับระบบฐานขอมูล Create new query using Database Wizard หมายถึง การสรางสวนทํางานรวมกับระบบฐานขอมูล

Open an existing data source หมายถึง การนําเปดขอมูลจากโปรแกรม SPSS มาทําการแกไข เชน เพ่ิมตัวแปร ใหคาตัวแปรและวิเคราะหผล เปนตน

Open another type of file หมายถึง การนําขอมูลโปรแกรมอื่นๆ มาทํางานรวมกับโปรแกรม SPSS

9

b. สวนประกอบของหนาจอหลักที่สําคัญ

Menu bar

พ้ืนที่สําหรับการกําหนดคาตัวแปร Variables

Variable View

Data View

Data View เปนสวนที่กําหนดคาของตัวแปรในแตละชุด หรือเปนสวน Data entry ในลักษณะ spreadsheet คลายกับการทํางานของ Microsoft Excel (ดูภาพดานลางประกอบ)

10

Variable View เปนสวนกําหนดคุณสมบัติของตัวแปร (ดูภาพดานลางประกอบ)

Name หมายถึง กําหนดชื่อตัวแปรซึ่งตองมีความยาวไมเกิน 8 ตัวอักษร

Type หมายถึง ชนิดของตัวแปร เมื่อคลิกที่เซลลนี้จะปรากฏชนิดของตัวแปรทั้งหมด 8 ชนิด ซึ่งตัวแปรหนึ่งๆ จะตองเปนชนิดใดชนิดหนึ่งเทานั่น โดยทั่วไปแลวมักจะเลือกใหเปน Numeric (ตัวเลข) หรือ String (ตัวอักษร)

Width หมายถึง จํานวนความกวางของคาตัวแปรหรือจํานวนของคาตัวแปร Decimals หมายถึง จํานวนหลักหลังจุดทศนิยม Label หมายถึง ความหมายของตัวแปร Value หมายถึง กําหนดความหมายของคาของตัวแปร เชน 1 หมายถึง male

11

Missing หมายถึง การกําหนดเมื่อไมพบคาตัวแปร มี 3 ทางเลือกคือ No missing values กรณีที่ไมมีการพิมพขอมูล โปรแกรมจะใหคาเปนจุด (.) Discrete missing values ผูใชเปนผูกําหนดรหัสของ missing value เอง Range plus one optimal discrete missing value เปนการกําหนดรหัสของขมูลที่

ตองขามไปอีกรหัสหนึ่ง มักใชในกรณีที่ผูวิจัยออกแบบสอบถามแลวผูตอบไมจําเปนตองตอบในขอนี้ และใหถามไปตอบขอถัดไป

Align หมายถึง การจัดคาของชุดตัวแปรใหชิดซาย กลางหรือขวา Measure หมายถึง Scale ของการวัด มี 3 ชนิดคือ Scale หมายถึง Interval หรือ Ration Scale Ordinal หมายถึง Ordinal Scale Nominal หมายถึง Nominal Scale

12

4. การจัดการขอมูลเบื้องตน

4.1 การ Import ขอมูลจาก Microsoft Excel a. คลิกเลือกเพ่ือเปดโฟลเดอรใหม

b. คลิกเลือกไฟลเปาหมายและเลือก Files of type ใหเปนสกุล Excel

c. คลิก Open และเลือก Worksheet จากนั่นคลิก OK

13

4.2 การเปล่ียนแปลงขอมูลดวยคําสั่ง Transform ในบางครั้งการเก็บขอมูลไมสามารถทําใหเกิดการกระจายตัวขอมูลแบบปกติได จึงจําเปนตองมีการเปล่ียนแปลงขอมูลโดยอาจทําการ take log หรือยกกําลังสองเปนตน ตัวอยางของขอมูลท่ีจําเปนตองมีการ Transform เชน คา Titer, คา Somatic cell count ฯลฯ

a. เปดไฟลหรือปอนคาของตัวแปร

b. คลิกเลือกที่ Transform คลิกเลือก Compute

c. คลิกเลือก Function, Variable รวมทั้งตั้งชื่อ Variable ที่ทําการ Transform เสร็จแลว

14

d. คลิก OK

15

5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ

เปนการตรวจสอบวาขอมูลท่ีไดมีการแจกแจงเปนแบบ Normal Distribution หรือไม จะทําในตัวแปรเชิงปริมาณ โดยการตรวจสอบสามารถทําได 2 วิธีคือ

การตรวจสอบดวยกราฟ เชน Histogram, Boxplot, Stem and Leaf และ Normal Probability Plot เปนตน

การตรวจสอบโดยการใชสถิติทดสอบ เชน Kolmogorov-Smirnov, Shapiro-Wilk และ Lilliefor’s test หรือแมกระทั่งการทดสอบความแปรปรวนของประชากรในแตละกลุมดวยวิธี Levene’s test ก็สามารถทําได

โปรแกรม SPSS มีคําสั่งที่สามารถตรวจสอบการแจกแจงดวยกราฟ โดยเขาไปที่ Menu > Descriptive Statistics > Frequency แตในที่นี้จะใชคําส่ังที่สามารถแสดงผลออกมาทั้งคาทางสถิติและกราฟเพื่อดูการกระจายตัวของขอมูล

5.1 การตรวจสอบการกระจายตัวของขอมูล a. โดยปกติแลวหากมีการติดตั้งโปรแกรม SPSS ทั้งหมดและสมบูรณ ในโฟลเดอรของ

SPSS ใน Drive: C > Program Files > SPSS จะมีขอมูลท่ีมาพรอมกับโปรแกรม ซึ่งในที่นี้จะนําขอมูลดังกลาวมาเพื่อมาใชในการเรียนรู ใหนิสิตทําการเปดโฟลเดอรดังกลาวและเลือกไฟล 1991 U.S. General Social Survey แลวคลิก Open

b. จะพบขอมูลตามภาพดานลาง

16

c. เลือก Analyze > Descriptive Statistics > Explore

d. เลือก column ที่ตองการทดสอบการกระจายตัวของขอมูลตัวแปรตาม ซึ่งในที่นี้เลือก Age of Respondent (age) ซึ่งเปนตัวแปรเชิงปริมาณใสในชอง Dependent List สวนชอง Factor List เปนตัวแปรที่ใชในการแบงกลุมของขอมูล ไมจําเปนตองใส (ยกเวนในกรณีที่ตองการแบงกลุม) และชอง Label Cases by เปนชองที่ใชเพ่ือระบุ Outlier ของ Boxplot ในที่นี้ก็ไมใสเชนกัน

e. ตรวจสอบลักษณะการแสดงของ output ในชอง Display ใหเปน Both เพ่ือใหผลการวิเคราะหแสดงทั้งกราฟและคาสถิติ

17

f. คลิกเลือก Statistics เพ่ือตรวจสอบสิ่งที่ตองการแสดงใน Output

g. คลิกเลือก Descriptives เพ่ือแสดงคาสถิติเชิงพรรณา เชน คาเฉล่ีย คามัธยฐาน คาเบ่ียงเบนมาตรฐาน ความโดงของกราฟ ความเบของกราฟ เปนตน สวนคา M-estimators เปนคา Robust maximum-likelihood estimator ซึ่งในที่นี้จะไมเลือก แลวคลิกเลือก Outlier และ Percentiles เพ่ือแสดงคาที่หลุดออกจากขอมูลรวมทั้งคา Percentiles ที่ 5, 10, 25, 50, 75, 90 และ 95 โดยตั้งคา Confidence Interval for Mean ใหเปน 95% แลวคลิกเลือก Continue

h. ตรวจสอบลักษณะของ Plot โดยคลิกเลือก Plot แลวคลิกเลือก Factor levels together หมายถึงการสั่งใหโปรแกรมแสดงคาแยกตามตัวแปรใน Dependent แตละตัว (ซึ่งตองมีการระบุใน factor variable แตถาไมระบุโปรแกรมจะแสดงเปนภาพรวม) สวน Stem-and-Leaf และ Histogram เปนกราฟที่แสดงที่สามารถดูการกระจายตัวได และ Normality plots with tests จะแสดงกราฟและคาทางสถิติของ Shapiro-Wilks และ Komogorov-Smirnov เพ่ือทดสอบวาขอมูลมีการแจกแจงเปยแบบปกติหรือไม ในกรณีที่ตัวอยางมากกวา 50 โปรแกรมจะไมคํานวณ Shapiro-Wilks’s statistic ให จากนั้นคลิก Continue สําหรับ Spread vs. Level with Levene Test เปนการตรวจสอบการกระจายของขอมูลโดยใช Levene Test โดยคาของสถิติ Levene

18

จะคํานวณจากคาจริง หรือคาของขอมูลท่ีมีการเปล่ียนแปลงรูปแบบ (Transformed data) ก็ได ผูวิเคราะหจะตองเลือกทางเลือกใดทางเลือกหนึ่งดังนี้

None เมื่อไมตองการคํานวณคา Levene Test Power estimation สําหรับแตละกลุม จะพล็อตคา log ของมัธยฐานกับ log ของ

พิสัยควอไทล (IQR) จะใชเมื่อตองการหาการเปลี่ยแปลงรูปแบบที่เหมาะสมของขอมูล Transformed ผูวิเคราะหสามารถเลือกรูปแบบของขอมูล ถาเลือกทางเลือกนี้แล

วจะทําใหคําวา Power มีสีเขม จากนั้นคลิกเลือกทางเลือกที่ตองการหลังคําวา Power Untransformed ใชเมื่อตองการใชคาของขอมูลจริง โดยไมมีการเปล่ียนแปลงขอมูล

i. คลิกเลือก Options เพ่ือจัดการ Missing values ในที่นี้ใหเลือก Exclude cases listwise ซึ่งจะทําใหโปรแกรมคํานวณโดยตัด Case ที่มี Missing value แลงคลิก Continue

19

j. คลิกเลือก OK ได output ตามภาพดานลาง

k. การแปลผลขอมูลในตารางแรกจะเปนนับจํานวนขอมูลหรือ Cases ทั้งหมด พบวามีจํานวนขอมูลท้ังหมด 1517 ขอมูล โดยมี 3 ขอมูลเปน missing cases

Case Processing Summary

Cases Valid Missing Total

N Percent N Percent N Percent Age of Respondent 1514 99.8% 3 .2% 1517 100.0%

20

l. ตารางถัดเปนเปนตารางที่แสดงถึงคาของ Descriptive statistics ซึ่งสามารถดูลักษณะการกระจายตัวของขอมูลไดแบบคราวๆ โดยเปรียบเทียบจากคา Mean กับ Median ในกรณีที่เปนการกระจายตัวแบบ Normal distribution คาทั้งสองควรมีคาใกลเคียงกันมากที่สุดหรือเทากัน นอกจากนี้ส่ิงที่จําเปนตองพิจารณาคือคา Skewness โดยขอมูลใดที่มีคาใกลเคียงศูนยแสดงวาขอมูลนั้นมีแนวโนมเปน Normal distribution ทั้งนี้หากคาที่ไดมากกวาศูนยแสดงวาขอมูลมีลักษณะเบขวา และขอมูลใดมีคา Skewness ติดลบแสดงวาขอมูลเบซาย และคา Kurtosis ปกติแลวในขอมูลท่ีมีลักษณะ Normal distribution แบบมาตรฐานจะมีคาประมาณ 3

Descriptives

Statistic Std. Error Mean 45.63 .458

Lower Bound 44.73 95% Confidence Interval for Mean Upper Bound

46.52

5% Trimmed Mean 44.97 Median 41.00 Variance 317.140 Std. Deviation 17.808 Minimum 18 Maximum 89 Range 71 Interquartile Range 28.00 Skewness .524 .063

Age of Respondent

Kurtosis -.786 .126

m. ตารางถัดไปเปนคาแสดง Percentiles ตางๆ

Percentiles

Percentiles

5 10 25 50 75 90 95 Weighted Average (Definition 1)

Age of Respondent 22.00 24.00 32.00 41.00 60.00 73.00 78.00

Tukey's Hinges

Age of Respondent 32.00 41.00 60.00

21

n. ตารางถัดไปเปนการแสดงคาที่สูงสุดและต่ําสุด (Extreme value) จํานวน 5 คา และในแตละคาอยูในชุดขอมูล (cases) ลําดับที่เทาไร

Extreme Values

Case Number Value 1 295 89 2 312 89 3 346 89 4 569 89

Highest

5 620 89(a) 1 1120 18 2 679 18 3 188 18 4 1053 19

Age of Respondent

Lowest

5 1029 19(b) a Only a partial list of cases with the value 89 are shown in the table of upper extremes. b Only a partial list of cases with the value 19 are shown in the table of lower extremes.

o. ตารางถัดไปเปนการแสดงคาวาชุดของขอมูลมีการกระจายตัวแบบใด โดยในที่นี้การทดสอบลักษณะการกระจายตัวจะมีสมมติฐานในการทดสอบกลาวคือ

Ho: ขอมูลมีการกระจายตัวแบบปกติ Ha: ขอมูลมีการกระจายตัวแบบไมปกติ

การพิจารณาวาจะใชสถิติตัวใดใหพิจารณาจากจํานวนขอมูลหรือขนาดของตัวอยาง โดยที่ Shapiro-Wilk จะใชเมื่อตัวอยางมีขาดไมเกิน 50 ตัวอยางเทานั้น ซึ่งปกติแลวเราจะพิจารณาจาก Kolmogorov-Smirnov ในที่นี้พบวา p-value เปน .000 ซึ่งมีคานอยกวา 0.01 ที่ระดับความเชื่อมั่น 99% แสดงวาปฏิเสธ Null hypothesis ดังนั้นขอมูลชุดน้ีจึงมีการแจกแจงแบบไมปกติ และหากพิจารณาจากกราฟดานลางทั้งหมดจะพบวากราฟมีลักษณะเบขวาเล็กนอย ดังนั้นการวิเคราะหสถิติสําหรับขอมูลชุดนี้ควรเลือกแบบ Non-parametric statistics

Tests of Normality

Kolmogorov-Smirnov(a) Shapiro-Wilk

Statistic df Sig. Statistic df Sig. Age of Respondent .105 1514 .000 .944 1514 .000

a Lilliefors Significance Correction

22

Age of Respondent

90.085.0

80.075.0

70.065.0

60.055.0

50.045.0

40.035.0

30.025.0

20.0

Histogram

Freq

uenc

y

300

200

100

0

Std. Dev = 17.81

Mean = 45.6

N = 1514.00

Age of Respondent Stem-and-Leaf Plot Frequency Stem & Leaf 12.00 1 . 899 143.00 2 . 000011111111222222233333344444 150.00 2 . 5555556666666777777888888899999 187.00 3 . 00000001111111222222222333333334444444 195.00 3 . 555555555556666666777777788888889999999 167.00 4 . 0000000111111112222223333333444444 113.00 4 . 5555667777778888889999 87.00 5 . 000011122223334444 78.00 5 . 555667778888999 87.00 6 . 00011112223333444 84.00 6 . 555566677778888999 95.00 7 . 0001111222233333444 53.00 7 . 5566677889 43.00 8 . 001122234 20.00 8 . 5799& Stem width: 10 Each leaf: 5 case(s) & denotes fractional leaves

Normal Q-Q Plot of Age of Respondent

Observed Value

100806040200-20

Expe

cted

Nor

mal

3

2

1

0

-1

-2

-3

-4

Detrended Normal Q-Q Plot of Age of Re

Observed Value

100806040200

Dev

fro

m N

orm

al

1.5

1.0

.5

0.0

-.5

1514N =

Age of Respondent

100

80

60

40

20

0

23

6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา

สถิติเชิงพรรณาเปนการคํานวณคาสถิติพ้ืนฐาน เชน การวัดคากลาง การวัดการกระจายตัวของขอมูล และการนําเสนอขอมูลในรูปกราฟหรือตาราง ความถี่ รอยละ เปนตน เพ่ืออธิบายลักษณะของขอมูล ทั้งในเชิงปริมาณและเชิงคุณภาพ

6.1 การหาจํานวนหรือความถี่ดวยการสรางตารางแจกแจงความถี่ (Frequencies) ใชคําส่ัง Analyze > Descriptive Statistics > Frequencies เพ่ือแสดงความถี่ เปอรเซ็นต

คาสถิติเชิงพรรณาตางๆ กราฟ และอ่ืนๆ ขึ้นอยูกับการเลือกของผูวิเคราะห โดยสามารถวิเคราะหไดทั้งขอมูลเชิงคุณภาพและเชิงปริมาณ โดยการเลือกวาจะวิเคราะหขอมูลแบบใด นิสิตตองเลือกชนิดของตัวแปรและ Output ใหสอดคลองกัน ซึ่งในที่นี้ใหเปดไฟท 1991 U.S. General Social Survey เพ่ือทําการวิเคราะหขอมูลเชิงปริมาณโดยการเลือกตัวแปรที่เกี่ยวของกับอายุ จากนั้นทําการเลือกในชอง Statistics, Charts และ Format ใหเหมาะสมแลวคลิกเลือก OK

24

จะได Output ออกมาดังตารางและภาพดานลาง โดยที่การแปลผลจะคลายกับที่ไดกลาวมาแลวในหัวขอท่ี 5

Statistics

Age of Respondent Valid 1514 N Missing 3

Mean 45.63 Std. Error of Mean .458 Median 41.44(a) Mode 35 Std. Deviation 17.808 Variance 317.140 Skewness .524 Std. Error of Skewness .063 Kurtosis -.786 Std. Error of Kurtosis .126 Range 71 Minimum 18 Maximum 89 Sum 69078

10 24.32(b) 20 29.36 25 31.53 30 33.44 40 37.20 50 41.44 60 47.22 70 54.87 75 59.71 80 63.98

Percentiles

90 72.70 a Calculated from grouped data. b Percentiles are calculated from grouped data.

25

Age of Respondent

Frequency Percent Valid Percent Cumulative

Percent 18 3 .2 .2 .2 19 9 .6 .6 .8 20 18 1.2 1.2 2.0 21 38 2.5 2.5 4.5 22 35 2.3 2.3 6.8 23 28 1.8 1.8 8.7 24 24 1.6 1.6 10.2 25 28 1.8 1.8 12.1 26 33 2.2 2.2 14.3 27 29 1.9 1.9 16.2 28 33 2.2 2.2 18.4 29 27 1.8 1.8 20.1 30 35 2.3 2.3 22.5 31 35 2.3 2.3 24.8 32 44 2.9 2.9 27.7 33 38 2.5 2.5 30.2 34 35 2.3 2.3 32.5 35 55 3.6 3.6 36.1 36 35 2.3 2.3 38.4 37 33 2.2 2.2 40.6 38 37 2.4 2.4 43.1 39 35 2.3 2.3 45.4 40 36 2.4 2.4 47.8 41 38 2.5 2.5 50.3 42 30 2.0 2.0 52.2 43 33 2.2 2.2 54.4 44 30 2.0 2.0 56.4 45 22 1.5 1.5 57.9 46 12 .8 .8 58.7 47 28 1.8 1.8 60.5 48 29 1.9 1.9 62.4 49 22 1.5 1.5 63.9 50 20 1.3 1.3 65.2 51 15 1.0 1.0 66.2 52 20 1.3 1.3 67.5 53 14 .9 .9 68.4 54 18 1.2 1.2 69.6 55 16 1.1 1.1 70.7 56 12 .8 .8 71.5 57 17 1.1 1.1 72.6 58 18 1.2 1.2 73.8 59 15 1.0 1.0 74.8

Valid

60 16 1.1 1.1 75.8

26

61 20 1.3 1.3 77.1 62 17 1.1 1.1 78.3 63 19 1.3 1.3 79.5 64 15 1.0 1.0 80.5 65 18 1.2 1.2 81.7 66 13 .9 .9 82.6 67 18 1.2 1.2 83.8 68 18 1.2 1.2 84.9 69 17 1.1 1.1 86.1 70 15 1.0 1.0 87.1 71 20 1.3 1.3 88.4 72 19 1.3 1.3 89.6 73 24 1.6 1.6 91.2 74 17 1.1 1.1 92.3 75 10 .7 .7 93.0 76 13 .9 .9 93.9 77 12 .8 .8 94.6 78 11 .7 .7 95.4 79 7 .5 .5 95.8 80 11 .7 .7 96.6 81 9 .6 .6 97.2 82 13 .9 .9 98.0 83 5 .3 .3 98.3 84 5 .3 .3 98.7 85 6 .4 .4 99.1 87 4 .3 .3 99.3 88 2 .1 .1 99.5 89 8 .5 .5 100.0

Total 1514 99.8 100.0 Missing NA 3 .2 Total 1517 100.0

Age of Respondent

90.085.0

80.075.0

70.065.0

60.055.0

50.045.0

40.035.0

30.025.0

20.0

Age of Respondent

Freq

uenc

y

300

200

100

0

Std. Dev = 17.81

Mean = 45.6

N = 1514.00

27

6.2 การสรางตารางแจกแจงความถี่แบบ 2 ทาง (Crosstabs) ในโปรแกรม SPSS สามารถสรางตารางแจกแจงตั้งแต 2 ทางขึ้นไปได แตในที่นี้จะขอกลาว

เฉพาะการสรางตารางแจกแจง 2 ทาง (ตัวแปรที่ใสในตารางอาจมีมากกวา 2 ตัวแปร) ซึ่งจะใชคําส่ัง Analyze > Descriptive Statistics > Crosstabs โดยขอมูลท่ีใสในตารางแจกแจงควรเปนขอมูลท่ีไดจากการนับหรือขอมูลเชิงคุณภาพ ในที่นี้เลือกตัวแปร Respondent’s sex ลงใน Row(s) และเลือกตัวแปร Region of the United States ลงใน Column(s) (การตั้งคาใน Statistics นั้นโดยมากเปนคํานวณคาทางสถิติ เชน Chi-square ซึ่งจะไดกลาวถึงในบทถดัไป) แลวคลิก OK (หากตองการแสดงผลเปน Percentage ใหคลิกเลือก Cell แลวกําหนดโดยเลือก Percentage)

28

ไดลักษณะของขอมูลตามตารางดานลาง

Case Processing Summary

Cases

Valid Missing Total N Percent N Percent N Percent Respondent's Sex * Region of the United States * R's Federal Income Tax

932 61.4% 585 38.6% 1517 100.0%

Respondent's Sex * Region of the United States * R's Federal Income Tax Crosstabulation

Count

R's Federal Income Tax Region of the United States North East South East West Total

Respondent's Sex

Male 99 66 68 233

Female 140 76 92 308

Too High

Total 239 142 160 541Male 84 45 48 177Respondent's

Sex Female 92 54 57 203

About Right

Total 176 99 105 380Male 3 1 2 6Respondent's

Sex Female 1 2 2 5

Too Low

Total 4 3 4 11

ในหนาจอของ Crosstabs คําส่ัง Display clustered bar chart เมื่อเลือกจะแสดง clustered bar chart ซึ่งชวยในการสรุปขอมูลได สวน Suppress tables จะใชเมื่อไมตองการแสดงตาราง Crosstabs ที่แสดงความถี่ของขอมูล แตตองการแสดงเฉพาะคาทางสถิตินั้น

29

7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA

7.1 การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test เปนการวิเคราะหขอมูลเชิงปริมาณที่เปนอิสระตอกันจํานวน 2 กลุม วามีความแตกตางกันหรือไม โดยเลือกคําสั่ง Analyze > Compare Means > Independent-Sample T Test โดยสมมติวาขอมูลท่ีจะวิเคราะหมีการกระจายตัวแบบปกติ

เมื่อปรากฏหนาจอตามรูปดานบนแลวใหใสตัวแปรตามเชิงปริมาณที่ตองการวิเคราะหในชอง Test Variable(s) แลวตัวแปรตนในชอง Grouping Variable เมื่อใสตัวแปรตนในชองนี้แลว Define Group จะ active ใหทําการคลิกเพ่ือกําหนดคาของตัวแปรตามคุณลักษณะของตัวแปรนั้นๆ ในกรณีที่นิสิตลืมคุณลักษณะของตัวแปรสามารถดูไดจาก Utilities > File Info ตามรูปดานลาง

30

คลิกเลือก Options แลวกําหนดระดับความเชื่อมั่นไวที่ 95% สําหรับคา Missing Values ใหเลือก Exclude cases analysis by analysis ซึ่งหมายถึงไมรวมเอาขอมูลของ Case ที่มี missing values ในการวิเคราะห จากนั้นคลิกเลือก Continue แลวตามดวย OK

ไดผลการทดสอบออกมาตามตารางดานลาง โดยตารางแรกจะแสดงลักษณะขอมูล

แบบสถิติเชิงพรรณา โดยแบงตาม

Group Statistics

Respondent's Sex N Mean Std. Deviation Std. Error

Mean Male 636 44.18 17.033 .675Age of Respondent Female 878 46.67 18.288 .617

31

Independent Samples Test

Levene's Test for Equality of Variances t-test for Equality of Means

95% Confidence Interval of the Difference

F Sig. t df Sig. (2-tailed) Mean

Difference Std. Error Difference Lower Upper

Equal variances assumed 9.697 .002 -2.693 1512 .007 -2.49 .925 -4.307 -.677 Age of Respondent

Equal variances not assumed -2.724 1420.931 .007 -2.49 .915 -4.287 -.698

การวิเคราะหขอมูลจําเปนตองตรวจสอบความแปรปรวนของประชากรที่นํามาทดสอบกอนวาเทากันหรือไม โดยพิจารณาจาก Levene’s Test for Equality of Variances ซึ่งในกรณีนี้จะมีสมมติฐานเพื่อการวิเคราะหความแปรปรวนโดย o Ho: ความแปรปรวนของขอมูลทั้ง 2 ชุดเทากัน o Ha: ความแปรปรวนของขอมูลทั้ง 2 ชุดไมเทากัน ในกรณีนี้พบวาคา Probability Value (p-value) ของ Levene’s Test เทากับ 0.002 ซึ่งนอยกวา 0.05 ดังนั้นจึงปฏิเสธ Null hypothesis แลวสรุปวาความแปรปรวนของขอมุลทั้ง 2 ชุดไมเทากัน ดังนั้นการทดสอบ Independent Samples Test จึงพิจารณาจากคา Equal variance not assumed ไดคา P-value เปน 0.007 ซึ่งนอยกวา 0.05 แสดงวาขอมูลทั้ง 2 ชุด แตกตางกันอยางมีนัยสําคัญทางสถิติ (p<0.05) สําหรับในกรณีที่ขอมูลมีความแปรปรวนเทากันใหพิจารณาคา p-value ของ Independent Samples Test จาก Equal variances assumed

7.2 การวิเคราะหขอมูลเชิงปริมาณแบบ One-Way ANOVA เปนการวิเคราะหขอมูลเชิงปริมาณตัวแปรเดียวที่เปนอิสระตอกันจํานวน 3 กลุม (ขึ้นไป) วามีความแตกตางกันหรือไม โดยเลือกคําส่ัง Analyze > Compare Means > One-Way ANOVA ในที่นี้สมมติตัวแปรโดยเลือกจากไฟท 1991 U.S. General Social Survey โดย assumed ขอมูลมีการกระจายตัวแบบปกติ

จากนั้นคลิกเลือกตัวแปรตามเชิงปริมาณในชอง Dependent List และตัวแปรตนใน Factor จากนั้นส่ิงจําเปนที่ตองพิจารณาคือ Post Hoc Multiple Comparison Test ซึ่งเปนการใชสถิติเพ่ือทดสอบวาถาคาสถิติแบบ One-way ANOVA ใหผลมีนัยสําคัญทางสถิติแลวคูใดที่มีความแตกตางกันโดยสมมติฐานของ One-way ANOVA โดยทั่วไปคือ

• Ho: คา mean ของทุกกลุมไมแตกตางกัน

• Ha: คา mean ของกลุมที่ทดสอบอยางนอยหนึ่งคูที่แตกตางกัน โดย Post Hoc จะบอกไดวาคูใดที่ตางกันในกรณีที่ปฏิเสธ Null hypothesis ในที่นี้คลิกเลือก LSD, Bonferroni, Tukey, Duncan, Tamhane’s T2 และ Dunnett’s T3 แลตั้ง Significant level ไวที่ .05 (โดยปกติแลว Post Hoc จะมี 2 กลุมคือกลุม Equal Variances Assumed และ Equal Variances Not Assumed ซึ่งควรจะเลือกทั้ง 2 กลุม) แลวคลิก Continue

คลิก Options เพ่ือเลือก Descriptive, Homogeneity-of-Variance (เพ่ือทดสอบความแปรปรวน), Brown-Forsythe หรือ Welch (เพ่ือทดสอบความแตกตางของคาเฉล่ียกลุมตางๆ เมื่อคาความแปรปรวนในแตละกลุมไมเทากัน จากนั้นเลือก Continue แลว OK

ไดผลการวิเคราะหตามตารางดานลาง

34

Descriptives Age of Respondent

95% Confidence Interval for Mean

N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum White 1262 46.20 18.032 .508 45.20 47.20 18 89Black 203 43.27 16.794 1.179 40.95 45.60 19 88Other 49 40.59 14.467 2.067 36.44 44.75 19 77Total 1514 45.63 17.808 .458 44.73 46.52 18 89

สิ่งที่ตองพิจารณานอกจากสถิติเชิงพรรณาคือคาความแปรปรวนวาเปนอยางไร จากตารางพบวา Levene Statistic มีคา p-value< 0.05 แสดงวาคาความแปรปรวนของขอมูลแตละชุดตางกัน ดังนั้นสถิติของ One-way ANOVA ที่ตองพิจารณาคือ Brown-Forsythe หรือ Welch แตในกรณีที่ความแปรปรวนเทากัน (p>0.05) ใหพิจารณาคาสถิติแบบ F Test ในตาราง ANOVA แทน

Test of Homogeneity of Variances Age of Respondent

Levene Statistic df1 df2 Sig.

5.478 2 1511 .004

ANOVA Age of Respondent

Sum of Squares df Mean Square F Sig.

Between Groups 2784.189 2 1392.095 4.409 .012Within Groups 477048.21

5 1511 315.717

Total 479832.404 1513

Robust Tests of Equality of Means

Age of Respondent

Statistic(a) df1 df2 Sig. Welch 5.529 2 118.615 .005Brown-Forsythe 5.559 2 217.762 .004a Asymptotically F distributed.

ในกรณีนี้พิจารณาจากคา Welch พบวาคา p=0.005 ซึ่งนอยกวา 0.05 แสดงวาพบนัยสําคัญทางสถิติกลาวคือมีอยางนอยหนึ่งคูที่มีคา mean แตกตางกันอยางมีนัยสําคัญทางสถิติ ซึ่งคูใดบางเราจะพิจารณาจาก Post Hoc Multiple Comparison Test ตอไป

Multiple Comparisons

Dependent Variable: Age of Respondent

95% Confidence Interval

(I) Race of Respondent

(J) Race of Respondent

Mean Difference (I-

J) Std. Error Sig. Lower Bound Upper Bound Black 2.93 1.344 .075 -.22 6.08White Other 5.61 2.587 .077 -.46 11.68

Black White -2.93 1.344 .075 -6.08 .22 Other 2.68 2.828 .610 -3.96 9.31Other White -5.61 2.587 .077 -11.68 .46

Tukey HSD

Black -2.68 2.828 .610 -9.31 3.96LSD White Black 2.93(*) 1.344 .029 .29 5.57

Other 5.61(*) 2.587 .030 .53 10.68Black White -2.93(*) 1.344 .029 -5.57 -.29 Other 2.68 2.828 .344 -2.87 8.23Other White -5.61(*) 2.587 .030 -10.68 -.53

Black -2.68 2.828 .344 -8.23 2.87Bonferroni White Black 2.93 1.344 .088 -.29 6.15

Other 5.61 2.587 .091 -.59 11.81 Black White -2.93 1.344 .088 -6.15 .29

36

Other 2.68 2.828 1.000 -4.10 9.46Other White -5.61 2.587 .091 -11.81 .59

Black -2.68 2.828 1.000 -9.46 4.10Tamhane White Black 2.93 1.283 .068 -.15 6.01

Other 5.61(*) 2.128 .032 .36 10.85Black White -2.93 1.283 .068 -6.01 .15 Other 2.68 2.379 .600 -3.12 8.48Other White -5.61(*) 2.128 .032 -10.85 -.36

Black -2.68 2.379 .600 -8.48 3.12Dunnett T3 White Black 2.93 1.283 .068 -.15 6.01

Other 5.61(*) 2.128 .032 .37 10.85Black White -2.93 1.283 .068 -6.01 .15 Other 2.68 2.379 .597 -3.12 8.47Other White -5.61(*) 2.128 .032 -10.85 -.37

Black -2.68 2.379 .597 -8.47 3.12* The mean difference is significant at the .05 level.

ในกรณีนี้พบวาความแปรปรวนไมเทากันดังนั้น Post Hoc จึงพิจารณาจาก Tamhane’s Ts หรือ Dunnett’s T3 ที่ไดเลือกไวพบวา Tamhane ใหคา p<0.05 คู White กับ Other สวนคูอื่นๆ ใหคามากกวา 0.05 แสดงวาคูนี้มีคา mean แตกตางกันอยางมีนัยสําคัญทางสถิติที่ p<0.05

37

8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation

8.1 การวิเคราะหสัมประสิทธิ์สหสัมพันธ (Correlation Coefficient) เปนการวิเคราะหหาความสัมพันธของตัวแปร X และ Y เชิงปริมาณ วามีความสัมพันธในเชิงเสนหรือไม โดยที่ไมทราบวาตัวแปรใดเปนตัวแปรตนหรือตัวแปรตาม ในที่นี้สมมติเลือกตัวแปร age กับ educ วามีความสัมพันธกันหรือไม ซึ่งสามารถใชคําส่ัง Analyze > Correlate > Bivariate แลวเลือกตัวแปรที่ตองการหาความสัมพันธลงในชอง Variables จากนั้นคลิกเลือก Pearson ในกรณีที่ขอมูลชุดนี้มีการกระจายตัวแบบปกติ และเลือก Kendall’s tau-n หรือ Spearman กรณีที่การกระจายไมเปนปกติ และควรคลิกเลือกการทดสอบแบบ Two-tailed สําหรับ Flag significant correlations เปนกําหนดใหโปรแกรมทําเครื่องหมาย * และ ** เพ่ือดูระดับนัยสําคัญที่ 0.05 และ 0.01 ที่ขอมูล นอกจากนี้ตรวจสอบ Options โดยคลิกเลือก Mean and standard deviations (เปนการหาจํานวน case คาเฉล่ียและ คาเบ่ียงเบนมาตรฐานของขอมูลแตละตัว จะใชเมื่อคลิกเลือกการทดสอบแบบ Pearson correlation สวน Cross-product deviation and covariance จะไมกลาวถึง) และ Exclude cases pairwise (เปนการคํานวณคา r เปนคูๆ ในกรณีที่ตัวแปรมากกวา 2 ตัวขึ้นไป และถามีคา missing โปรแกรมจะตัดออกเฉพาะเปนคูๆ ไป แตถาเลือก Exclude cases listwise โปรแกรมจะตัด missing ออกในทุกๆ ตัวแปรเพื่อใหเหลือคูที่เทากันทุกตัวแปร)

ไดผลการคํานวณออกมาตามตารางดานลาง

Descriptive Statistics

Mean Std. Deviation N Age of Respondent 45.63 17.808 1514 Highest Year of School Completed 12.88 2.984 1510

ตารางลางดานลางนี้พิจารณาคา p-value ของแตละคูในกรณีที่ขอมูลมีการกระจายตัวแบบปกติ จากตารางแสดงวา Age of Respondent มีความสัมพันธเชิงเสนแบบตรงกันขาม โดยมีคา r = -.254 อยางมีนัยสําคัญทางสถิติที่ p<0.01 จากตัวอยางทั้งหมด 1508 ตัวอยาง สําหรับในกรณีที่การกระจายตัวของขอมูลเปนแบบไมปกติใหใชตาราง Nonparametric correlation โดยอาจเลือกใชไดทั้งสถิติแบบ Kendall’s หรือ Spearman’s และการแปลผลก็คลายๆ กัน

Correlations

Age of

Respondent

Highest Year of School

Completed Pearson Correlation 1 -.254(**) Sig. (2-tailed) . .000

Age of Respondent

N 1514 1508 Pearson Correlation -.254(**) 1 Sig. (2-tailed) .000 .

Highest Year of School Completed

N 1508 1510 ** Correlation is significant at the 0.01 level (2-tailed).

39

Nonparametric Correlations

Age of

Respondent

Highest Year of School

Completed Correlation Coefficient 1.000 -.146(**)

Sig. (2-tailed) . .000

Age of Respondent

N 1514 1508Correlation Coefficient -.146(**) 1.000

Sig. (2-tailed) .000 .

Kendall's tau_b

Highest Year of School Completed

N 1508 1510Correlation Coefficient 1.000 -.209(**)

Sig. (2-tailed) . .000

Age of Respondent

N 1514 1508Correlation Coefficient -.209(**) 1.000

Sig. (2-tailed) .000 .

Spearman's rho

Highest Year of School Completed

N 1508 1510** Correlation is significant at the 0.01 level (2-tailed).

40

9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ

10.1 การวิเคราะหสถิติแบบ Chi-square ในประชากร 2 กลุมขึ้นไป เปนการทดสอบลักษณะตางๆ ของสัดสวนในประชากร 2 กลุมวามีความสัมพันธกันหรือไม โดยใชคําส่ัง Analyze > Descriptive Statistics > Crosstabs เหมือนขอท่ี 6.2 แตกตางกันคือนิสิตตองใสคาทางสถิติในตัวเลือก Statistics เพ่ือส่ังใหโปรแกรมคํานวณคา Chi-square ดวย ขณะที่ตัวเลือก Cell ใหคลิกเลือกทั้ง Observed และ Expected โดยเลือกตัวอยางจากไฟท AML survival

ในการเลือกตัวแปรใหอยูในแนว Row(s) หรือ Column(s) ตามที่ตองการ แลวคลิกเลือก Display clustered bar charts เพ่ือให output แสดงกราฟแทงเปรียบเทียบ นอกจากนี้ในสวนของ Statistics ใหเลือก Chi-square และใน Cells ใหเลือกทั้ง Observed และ Expected เพ่ือให output แสดงคาทั้งคู

41

ไดขอมูลตามตารางดานลาง

Case Processing Summary

Cases

Valid Missing Total N Percent N Percent N Percent Chemotherapy * Status 23 100.0% 0 .0% 23 100.0%

ตารางดานลางเปนการแสดงคา Observed หรือ Count กับ Expected Value ในแตละ cell

Chemotherapy * Status Crosstabulation

Status Censored Relapsed Total

Count 1 11 12 No Expected Count 2.6 9.4 12.0

Count 4 7 11

Chemotherapy

Yes Expected Count 2.4 8.6 11.0

Count 5 18 23 Total Expected Count 5.0 18.0 23.0

42

ตารางดานลางเปนการแสดงคา Chi-square พบวา p=.104 ซึ่งมากกวา 0.05 แสดงวาไมสามารถปฏิเสธ Null hypothesis ได ดังนั้นปจจัยทั้ง 2 ตัวไมมีความสัมพันธกัน หรือปจจัยทั้งคูที่นํามาทดสอบเปนอิสระตอกัน

Chi-Square Tests

Value df Asymp. Sig. (2-sided)

Exact Sig. (2-sided)

Exact Sig. (1-sided)

Pearson Chi-Square 2.650(b) 1 .104 Continuity Correction(a) 1.259 1 .262

Likelihood Ratio 2.780 1 .095 Fisher's Exact Test .155 .131Linear-by-Linear Association 2.535 1 .111

N of Valid Cases 23 a Computed only for a 2x2 table b 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.39.

Chemotherapy

YesNo

Coun

t

12

10

8

6

4

2

0

Status

Censored

Relapsed

43

10.2 การเปรียบเทียบขอมูล 2 ชุดที่เปนอิสระตอกัน จะใชเมื่อขอมูลมีการแจกแจงไมเปนปกติ เปนการทดสอบวาขอมูล 2 ชุดมีคากลางอยูที่ตําแหนงเดียวกันหรือไม ตางกันอยางไร ซึ่งในกรณีนี้จะทดสอบเฉพาะ Mann-Whitney U Test โดยใชคําส่ัง Analyze > Nonparametric Test > 2 Independent Sample และเลือกใชตัวอยางจากไฟท 1991 U.S. General Social Survey โดยสมมติใหขอมูลท่ีจะใชมีการแจกแจงแบบไมปกติ (การใชโปรแกรมจะคลายกับกรณีของ Parametric แตตางกันที่นิสิตตองคลิกเลือกสถิติแบบ Mann-Whitney U Test ซึ่งการวิเคราะหจะคลายๆ กับ T-test

Descriptive Statistics

Percentiles N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00Respondent's Sex 1517 1.58 .494 1 2 1.00 2.00 2.00

Mann-Whitney Test

Ranks

Respondent's Sex N Mean Rank Sum of Ranks Male 636 726.92 462319.50 Female 878 779.65 684535.50

Age of Respondent

Total 1514

44

Test Statistics(a)

Age of

Respondent Mann-Whitney U 259753.500Wilcoxon W 462319.500Z -2.317Asymp. Sig. (2-tailed) .021

a Grouping Variable: Respondent's Sex

จากตารางดานบนพบวาสถิติของ Mann-Whitney U ไดคา p=0.021 แสดงวาปฏิเสธ Null hypothesis เน่ืองจากคา p<0.05 ดังนั้นจึงสรุปไดวาคากลางของขอมูลสองชุดที่นํามาวิเคราะหมีความแตกตางกันอยางมีนัยสําคัญทางสถิติ (p<0.05)

10.3 การเปรียบเทียบขอมูลมากกวา 2 ชุดที่เปนอิสระตอกัน เปนกรณีเดียวกับการทดสอบแบบ

One-Way ANOVA แตกตางกันเพียงในหัวขอนี้ขอมูลจะสมมติใหมีการกระจายตัวไมเปนปกติ และสถิติที่จะกลาวถึงคือ Kruskal-Wallis H ที่ขยายมาจาก Mann-Whitney U Test แตจะมีจํานวนกลุมของตัวแปรตนมากกวา 2 กลุม คําส่ังที่เลือกใชคือ Analyze > Nonparametric Tests > K Independent Sample ซึ่งการวิเคราะหจะคลายๆ กับ One-way ANOVA

45

Descriptive Statistics

Percentiles N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00Race of Respondent 1517 1.20 .473 1 3 1.00 1.00 1.00

Kruskal-Wallis Test

Ranks

Race of Respondent N Mean Rank White 1262 770.78 Black 203 700.81 Other 49 650.27

Age of Respondent

Total 1514

Test Statistics(a,b)

Age of

Respondent Chi-Square 7.529df 2Asymp. Sig. .023

a Kruskal Wallis Test b Grouping Variable: Race of Respondent

จากตารางดานบนพบวาสถิติของ Kruskal Waliis ไดคา p=0.023 แสดงวาปฏิเสธ Null hypothesis เน่ืองจากคา p<0.05 ซึ่งในกรณีนี้สมมติฐานคือ

• Ho: median ของขอมูลท้ังสามชุดไมแตกตางกัน

• Ha: median ของขอมูลอยางนอยหนึ่งคูที่แตกตางกัน ในกรณีนี้พบวา median อยางนอยหนึ่งคูที่แตกตางกันอยางมีนัยสําคัญทางสถิติ โดยหากตองการทราบวาคูใดที่แตกตางกันตองไปวิเคราะหหา Post Hoc Multiple Comparison Test โดยควรที่จะตองพิจารณาวิธีที่ใช median ในการคํานวณ

******************************************************************************************************

46

top related