pengukuran, kesahan (validity) dan kebolehpercayaan (reliability) instrumen

2014 Dr. Ferlis bin Bullare @ Bahari

PENGUKURAN, KESAHAN (VALIDITY)

DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN

Dr. Ferlis Bin Bullare @ Hj. Bahari

Pensyarah Kanan/Ketua

Unit Penyelidikan Psikologi & Kesihatan Sosial

Universiti Malaysia Sabah

Tel (O) : 088 320 000 (8979)

H/P : 016 520 2070

e-mel : [email protected]; [email protected]

A. PENGUKURAN

1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa: ... jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika ia

wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah

data atau khususnya pembolehubah.

2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu simbol yang diberikan perangkaan atau nilai.

3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya dikomputerkan.

4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua jenis:

(i) Pemboleh ubah bebas dan terikat (ii) Pemboleh ubah berterusan dan kategorikal

mailto:[email protected]:[email protected]


5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang menyebabkan berlakunya pemboleh ubah terikat; ia juga melibatkan

kesan atau pengaruhnya ke atas pemboleh ubah terikat.

6. Pemboleh ubah berterusan mengambil nilai perangkaan berjulat. Misalnya umur memperlihatkan perbezaan seorang bayi berumur

dua bulan dengan seorang tua berumur 70 tahun.

7. Pemboleh ubah kategorikal mempunyai ukuran berbentuk nominal, iaitu objek dimasukkan ke dalam satu kategori yang ditentukan.

Misalnya jantina (lelaki dikodkan dengan nombor 1 dan perempuan

dikodkan dengan nombor 2). Komputer tidak membezakan antara

peringkat-peringkat ukuran yang berlainan seperti contoh umur dan

jantina di atas. Komputer akan memproses sebarang jenis angka

yang diberikan kepadanya tanpa membezakan sama ada sesuatu

ukuran itu bersifat mutlak (umur) atau bersifat sembarangan

(jantina).

8. Mengukur pemboleh ubah bererti memberi angka kepada objek, kejadian atau manusia mengikut aturan tertentu (Stevens, 1951).

Cohen & Nagel (1934) mendefinisikan ukuran sebagai mengkorelasi

entiti yang bukan angka dengan angka.


9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala pengukuran:

(i) Nominal atau kategori (Nominal)

Setiap nilai yang diberikan sebagai kategori tersendiri (label dan tanda semata-mata).

Tidak boleh melakukan operasi aritmetik (menjumlah, menolak, mendarab dan membahagi) terhadap data angka

tersebut kerana hasilnya tidak memberi apa-apa makna.

Contohnya jantina (1 = lelaki; 2 = perempuan);

Contohnya Etnik (1 = Melayu; 2 = Kadazan; 3 = Bajau; 4 = Murut; 5 = Bisaya; 6 = Iban; 7 = Lain-lain)

Statistik perihalan (mod dan frekuensi) boleh digunakan untuk memerihalkan pembolehubah yang diukur. Statistik

tak berparameter (ujian khi kuasa dua dan ujian binomial)

sesuai digunakan menganalisis data yang melibatkan skala

nominal.

(ii) Ordinal atau darjah (Ordinal)

Untuk pembolehubah yang boleh diatur atau disusun mengikut pangkat atau darjah.

Jarak antara dua paras ukuran masih belum diketahui. Kita tidak ketahui berapa tingginya SES kelas atasan daripada SES kelas

menengah atas atau antara kelas menengah atas dengan menengah

bawah. Kita Cuma tahu SES kelas atasan lebih tinggi daripada kelas


menengah atas, yang lebih tinggi pula daripada kelas bawahan.

Tidak lebih daripada itu.

Dengan kata lain, susunan pangkat yang dibuat hanya memberikan kategori manakah yang tinggi atau rendah dan BUKAN berapa

banyakkah ia lebih besar, lebih baik atau lebih tinggi dipilih

berbanding kategori lain.

Kita tidak boleh melakukan apa-apa operasi aritmetik.

Namun, statistik yang sesuai untuk menghuraikan kecenderungan memusat untuk kategori-kategori dalam skala ordinal ialah

penengah dan mod.

Bagi menentukan perbezaan antara kategori-kategori dalam skala ordinal, ujian-ujian statistik tak parametrik yang sesuai digunakan

seperti Ujian Kolmogorov-Smirnov, Ujian Larian Satu Sampel,

Ujian Tanda, Ujian Wilcoxon, Ujian Median, Ujian Mann-Whitney,

Ujian Wald-Wolfowitz, Ujian Friedman dan Ujian Kruskal-Wallis.

Untuk menentukan perkaitan antara pembolehubah, pekali korelasi pangkat Spearman dan pekali korelasi pangkat Kendall sesuai

digunakan.

Contohnya, jawapan berbentuk skala Likert iaitu, 1 = sangat tidak setuju;

2 = tidak setuju; 3 = tidak pasti; 4 = setuju; 5 = sangat setuju

Contoh lain ialah status ekonomi social (SES) seseorang iaitu, 1 = kelas

atasan; 2 = kelas menengah atas; 3 = kelas menengah bawah; 4

= kelas bawahan


(iii) Sela atau selang (Interval)

Pengukuran yang menggunakan skel sela tidak mempunyai titik sifar yang mutlak (nilai sifar sebenar), misalnya sukatan suhu Celsius dan

Fahrenheit.

Operasi aritmatik (campur dan tolak) boleh dilakukan ke atas cerapan skala sela. Skala sela adalah skala pertama yang bersifat

kuantitatif.

Semua statistik parametrik umum (min, sisihan piawai dan pekali korelasi Pearson) boleh digunakan.

Angka sela boleh dijumlah dan ditolak antara satu sama lain, misalnya kita boleh mencampurkan suhu beberapa tempat di

Malaysia pada hari tertentu dan mengira puratanya. Namun kita

tidak boleh mengira nisbah dua suhu kerana kita tidak boleh

membahagi angkubah yang bersifat sela. Dengan kata lain, operasi

bahagi dan darab tidak boleh dilakukan bagi data sela (interval).

Contohnya 32F31F=1F. Jarak 1 darjah ini sama dengan 1 darjah bagi perbezaan 85F84F atau 78F77F. Tapi salah sama sekali jika

kita mengatakan bahawa haba 100F bernilai dua kali ganda haba

yang ada pada 50F.


(iv) Nisbah (Ratio)

Pengukuran secara nisbah mempunyai sifat pengukuran sela, dengan ditambah satu sifat lagi, iaitu titik sifar mutlak sudah dapat

ditakrifkan baginya (ataupun mempunyai nilai sifar sebenar).

Contohnya, markah pelajar bagi subjek Matematik dalam

peperiksaan antara 0 hingga 100. Angka 0 merupakan sifar yang

sebenar kerana pelajar yang mendapat markah 0 menunjukkan

mereka menjawab salah dalam semua soalan.

Apabila ada titik sifar yang mutlak, semua operasi aritmetik dapat dilakukan. Misalnya timbangan berat, jarak jauh, umur, keluasan

tanah, jumlah pendapatan (RM).

Misalnya berat badan seorang kanak-kanak 30kg semestinya melebihi berat badan seorang yang berat badan 15kg sebanyak dua

kali ganda (30/15=2).

Contoh lain ialah pendapatan sebanyak RM 4,000 sebulan adalah RM1,000 lebih tinggi daripada pendapatan RM3,000 sebulan.

Pendapatan RM 5,000 sebulan ini adalah dua kali lebih tinggi

daripada RM2,000. Oleh yang demikian, semua operasi aritmetik

(campur, tolak, darab dan bahagi) boleh digunakan bagi data nisbah

(ratio).


B. KESAHAN (VALIDITY)

B1 Pendahuluan

1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana alat itu mengukur data yang sepatutnya ia dikehendaki mengukur.

2. Anastasi (1967) mendefinisikan kesahan sebagai satu ujian yang menekankan tentang apa yang hendak diukur dan sejauhmana ia

boleh berbuat demikian.

3. Kerlinger (1973) menyatakan bahawa kesahan alat ujian mempunyai ciri-ciri kestabilan (stabiliti), konsistensi, keramalan dan ketepatan.

4. Sekiranya data yang dikehendaki ialah ketinggian pelajar, alat ukur yang digunakan mestilah dapat mengukur ketinggian pelajar dengan

tepat. Misalnya, timbang adalah alat sah mengukur berat dan tidak

sah digunakan untuk mengukur ketinggian. Ketinggian pelajar sah

diukur menggunakan pembaris.

5. Persoalan utama yang perlu diambilkira tentang pengukur yang digunakan dalam sesuatu kajian ialah:

Apakah yang alat itu telah ukur?

Adakah alat itu benar-benar mengukur apa yang kita ingin ukur?

Adakah dengan menggunakannya, alat itu membenarkan pengutipan data yang relevan dengan apa yang menjadi

tumpuan kajian?

6. Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh ubah iaitu pemboleh ubah fizikal atau kuantitatif (ketinggian pembaris;

berat timbang) dan kualitatif/gagasan/konsep (pencapaian, stres,

kecerdasan, sikap, motivasi).


7. Satu konsep yang digunakan dalam kajian sains sosial ialah satu yang abstrak seperti kecerdasan. Ujian diberikan untuk melihat tahap

kecerdasan. Adakah ujian kecerdasan ini menguji kecerdasan

seseorang? Oleh itu pengukuran bagi sesuatu yang abstrak biasanya

menimbulkan keraguan.

8. Seperkara lagi iaitu tentang penerimaan satu ujian sebagai sah atau tidak. Kesahan ujian bagi satu kumpulan di sesuatu tempat tidak

semestinya sah bagi ujian lain di tempat berasingan. Misalnya ujian

kecerdasan atau kesulitan ekonomi di Afrika tidak tentu sama

keberkesanan kesahannya di negara Malaysia kerana masing-masing

mempunyai kebudayaan dan gaya hidup yang berlainan.

9. Gronlund (1985) menyatakan bahawa perkara yang perlu diingat semasa menggunakan kesahan ialah:

9.1 Kesahan berhubung rapat dengan keputusan ujian dan

hubungannya terhadap alat ukuran itu sendiri.

9.2 Kesahan sepatutnya tidak dilihat dari segi sah atau tidak sah tetapi

dari segi darjah kesahannya sama ada tinggi, sederhana atau rendah.

9.3 Kesahan perlu dirujuk kepada satu kegunaan yang khusus dan ujian

tidak akan menunjukkan kesahan untuk semua tujuan.


B2 Jenis Kesahan

B2.1 Kesahan Muka (Face Validity)

1. Bailey (1984) menyatakan bagi mengetahui sama ada instrumen atau soal selidik mempunyai kesahan, penyelidik perlu tahu bagaimana

konsep hendak diukur itu didefinisikan dan sama ada maklumat

yang dikumpulkan itu berkaitan dengan konsep itu. Kesahan muka

adalah perkara yang perlu dipertimbangkan oleh pengkaji sendiri,

kumpulan penyelidik ataupun pakar.

2. Kesahan muka juga dapat dinilai berdasarkan penyelidikan pengkaji tentang konsep yang hendak diukur dan pertimbangan berdasarkan

sama ada alat itu berjaya mendekati satu konsep itu dengan

sepenuhnya atau tidak. Jika ukuran itu mengukur satu konsep pada

keseluruhannya, maka pengkaji berjaya dengan mengemukakan

kesahan muka.

3. Misalnya seorang penyelidik ingin membentuk instrumen kajian. Penyelidik itu akan memberikan instrumen kepada pakar dalam

bidang yang hendak dikaji bagi dinilai sekali imbas. Pengesahan

awal soal selidik itu memperlihatkan ciri-ciri pengukuran yang

hendak diukur adalah merupakan kesahan muka bagi instrumen

tersebut. Dengan kata lain, apabila dilihat kali pertama, instrumen

ini mengukur apa yang hendak diukur dan nampak sesuai.

4. Bagi mengetahui suatu alat pengukur itu mempunyai kesahan muka atau tidak; definisi konsep yang hendak dikur serta maklumat yang

dikumpulkan itu bersesuaian ataupun tidak dengan konsep tersebut

perlu diketahui.

5. Contohnya, seorang pelajar ingin menjalankan kajian tentang penyusuan susu ibu tetapi item-item atau soalan-soalan dalam soal

selidik yang digunakan berkaitan dengan stres, maka dapat

dikatakan item-item tersebut tidak mempunyai kesahan muka.


6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat tentang sesuatu konsep. Misalnya percanggahan tentang sesuatu

ujian / soalan peperiksaan antara pensyarah dengan pelajar.

Pensyarah yakin bahawa ujian yang dijalankan mempunyai kesahan

muka yang tinggi, namun para pelajar mungkin ada pendapat

tersendiri.

7. Satu isu lagi yang wujud iaitu dimensi atau gagasan sesuatu konsep itu berubah dari semasa ke semasa.

8. LATIHAN 1: Tentukan dan kenal pasti kesahan muka bagi

IKSOKU-F.

B2.2 Kesahan Kandungan (Content Validity)

1. Ia adalah kesahan kedua selepas kesahan muka. Ia lebih mendalam di mana soal selidik akan dipastikan memang mengukur konsep-

konsep yang hendak diukur. Contohnya pengukuran kepuasan

kerja meliputi pelbagai komponen seperti gaji, rakan sekerja,

pangkat, penghargaan, pengiktirafan dan sebagainya. Oleh itu,

semua komponen ini perlu diambilkira sewaktu memilih item.

2. Item-item ini akan diperiksa dari segi perkataan, ayat, dan istilah yang digunakan.

3. Kesahan kandungan dapat dilakukan dengan menggunakan khidmat panel / pakar bagi menimbangkan sejauhmana instrumen itu

memenuhi piawaian. Cadangan pakar dalam bidang yang diukur

perlu bagi tujuan pembaikan, pembetulan, penambahan ataupun

pengurangan ke atas skala dan item dalam soal selidik yang

digunakan.


4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu dipenuhi sebelum sesuatu ujian itu dikatakan mempunyai kesahan

kandungan:

Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku secara umum diterima maknanya

Bidang mestilah dihuraikan dengan jelas

Bidang mestilah relevan dengan tujuan penggunaan ujian

Hakim-hakim/ panel/ pakar yang berkelayakan mestilah bersetuju bahawa bidang telah disampel secara mencukupi

Gerak balas mestilah diperhati dan dinilai secara tekal

5. Latihan: Tentukan dan kenal pasti kesahan kandungan (content

validity) bagi IKSOKU-F.

B2.3 Kesahan Kriteria (Kesahan Serentak & Kesahan Peramal)

1. Kesahan ini diperolehi apabila sesuatu ujian yang dijalankan membezakan ukuran melalui sesuatu kriteria yang ingin dilihat

dalam sesuatu soal selidik.

2. Tujuan kesahan kriteria ialah untuk menggunakan ujian sebagai pentaksir terhadap satu tingkah laku atau sikap. Misalnya, apabila

seseorang itu telah melalui ujian memandu dan disahkan lulus, kita

akan mentaksirkan bahawa dia akan dapat memandu dengan baik

dan cermat.

3. Kesahan Serentak/ Selari (Concurrent Validity) : Ialah kriteria yang ditunjukkan pada masa yang sama atau hampir sama dengan

pengukuran yang dikenakan ke atas kriteria tersebut. Ia digunakan

untuk mengukur sesuatu fenomena pada masa kini.


Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik dikatakan mempunyai kesahan kriteria serentak yang tinggi jika

seseorang pelajar yang mencapai kebolehan yang cemerlang

dalam ujian tersebut juga pada masa itu boleh menunjukkan

kebolehannya bermain muzik dengan baik.

Contoh 2 : Di dalam satu kilang, seorang pengkaji telah mendapatkan ukuran bahawa mereka yang mengikuti latihan

jasmani pada tiap-tiap pagi adalah mereka yang menunjukkan

prestasi dan dapat mengeluarkan produktiviti yang lebih tinggi

berbanding pekerja lain. Masa yang sama, penyelia diminta

memberikan laporan samada benar bahawa pekerja yang

mengikuti latihan jasmani tersebut mencatat daya pengeluaran

yang tinggi. Jika ini betul, maka pihak kilang akan melakukan

ujian jasmani tersebut kerana ia ada kaitan dengan daya

pengeluaran pekerja.

4. Kesahan Peramal (Predictive Validity) : Merujuk kepada keupayaan ukuran itu meramalkan peristiwa masa akan datang atau

sejauhmanakah sesuatu /soal selidik ujian (peramal) itu dapat

meramalkan sesuatu yang sebenar (kriteria). Bagi menentukan

kesahan ramalan, korelasi antara ujian ramalan dengan kejadian

sebenar akan dibuat. Jika korelasi yang diperoleh tinggi, ini

bermakna ujian itu mempunyai kesahan ramalan yang tinggi.

Contoh 1: Sejauhmana ujian percubaan SPM dapat meramal kejayaan akademik seterusnya iaitu peperiksaan SPM sebenar.

Ujian SPM sebenar akan dibandingkan dengan ujian

percubaan SPM; yang mana penyelidik merasa yakin dapat

mengukur konstruk ini iaitu prestasi akademik di sekolah

menengah. Indeks statistik bagi kesahan ramalan ini ialah

ukuran korelasi di antara peramal (agregat dalam ujian

percubaan SPM) dengan kriteria (agregat dalam ujian SPM

sebenar).


Contoh 2: Kesahan STPM sebagai pengukur kejayaan seseorang itu dalam universiti kelak.

Contoh 3 : Apabila seseorang itu lulus dan dapat sijil memandu, dia akan dapat memandu kenderaan dengan baik.

Namun, keadaan ini tidak selalu benar.

Contoh 4 : Majikan mengadakan ujian seperti temuduga, ujian bertulis dan lisan bagi calon-calon yang akan diterima bekerja

di dalam syarikat/organisasi.

LATIHAN 3: Tentukan dan kenal pasti kesahan peramal

IKSOKU-F.

B2.4 Kesahan Konstruk/ Gagasan, Kesahan

Konvergens dan Kesahan Discriminant

Pengenalan

1. Gagasan (construct) merujuk kepada sekumpulan pemikiran yang ada dalam fikiran tetapi tidak dapat dilihat objek tersebut secara

langsung / dengan mata kasar.

2. Kesahan gagasan melibatkan hubungan di antara satu kerangka teori yang menyeluruh supaya dapat menentukan sama ada alat ukuran

yang digunakan mempunyai hubungan dengan konsep dan andaian

yang digunakan.

3. Kesahan gagasan digunakan bagi mengukur sifat-sifat yang tidak dapat diukur oleh kriteria luaran, misalnya kepuasan. Kelebihan

menggunakan kesahan gagasan ialah ia mengukur kesahan sifat yang

tersembunyi bagi satu-satu ukuran. Ia membolehkan pengkaji

menentukan komponen satu-satu sifat yang ditunjukkan oleh sesuatu

alat (Siti Saleha Samsuddin, 2002).


4. LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan SSKSOKU-F menggunakan analisis faktor.

Kesahan Convergens

1. Cara mendapatkan kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk dengan

soal selidik yang lain yang telah ada yang mengukur konsep yang

sama. Sekiranya keputusan menunjukkan hasil korelasi yang tinggi,

maka kesahan konvergen dikatakan telah diperolehi. Ini adalah

kerana kedua-dua soal selidik tadi mengukur konsep yang sama.

2. Sebaliknya sekiranya keputusan korelasi rendah atau tidak signifikan, ini bermakna soal selidik yang baru dibentuk itu

mungkin tidak sesuai dengan teori kerana tidak mempunyai

hubungan dengan konsep yang sama dalam soal selidik yang telah

ada (piawai).

3. LATIHAN 5: Uji kesahan konvergen kedua-dua skala dengan PWB dan SWLS dengan menggunakan korelasi Pearson.


Kesahan Discriminant

1. Cara memperolehi kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk itu

dengan soal selidik yang lain yang telah ada yang tidak mengukur

konsep yang sama. Sekiranya tidak ada korelasi yang signifikan yang

dicatatkan, ini bermakna berdasarkan teori konsep dalam soal

selidik baru mempunyai kesahan diskriminan.

2. Sekiranya ada korelasi yang signifikan, ini bermakna konsep dalam soal selidik yang baru tadi tidak mengukur apa yang hendak diukur

kerana ia berkorelasi dengan konsep yang tidak sepatutnya dalam

soal selidik yang ada.

3. LATIHAN 6: Uji kesahan diskriminan kedua-dua instrumen dengan skala tertentu dengan menggunakan korelasi Pearson.

Jadual 1: Perbezaan antara Kesahan Konvergen dan Kesahan

Diskriminan

Kesahan Konvergen (KK) Kesahan Diskriminan/Divergent

(KD)

1. A construct-validated

instrument should have high

correlations with other measures

or methods of measuring the

same construct samb

1. samb but low correlations

with measure of different

constructs

2. KK baik apabila nilai korelasi

tinggi

2. KD baik apabila nilai korelasi

rendah


C. KEBOLEHPERCAYAAN (RELIABILITY)

C1 Pengenalan

1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada pengukuran atau instrumen yang digunakan oleh pengkaji terhadap

sesuatu konstruk teorinya.

2. Menurut Carmines dan Zeller (1979), kebolehpercayaan ialah sejauhmana satu uji kaji, ujian atau prosedur kajian apabila

diulangkan akan memberikan keputusan yang sama.

3. Ia juga merujuk kepada ketekalan dalam pengukuran berkenaan sesuatu set data yang diperoleh.

4. Kerlinger (1973) menyatakan bahawa ujian yang amat tinggi kebolehpercayaannya mempunyai ciri-ciri stabiliti, konsistensi,

keramalan dan ketepatan.

Contoh 1 : Apabila rakan rapat anda mempunyai sikap dan tabii yang konsisten, tepat dan dapat diramalkan, anda akan

menganggap rakan anda itu boleh dipercayai.

Contoh 2 : Jam sebagai ukuran masa. Jika sebuah jam itu sentiasa memberikan waktu yang tepat, tekal dan stabil, kita yakin

akan tahap kebolehpercayaan jam tersebut sebagai pengukur

masa.

5. Satu pengukur yang mempunyai tahap kebolehpercayaan yang tinggi akan mempunyai ralat yang kecil (tiada langsung). Lebih kecil ralat,

maka lebih tinggi tahap kebolehpercayaan sesuatu pengukur atau

alat ujian/kajian.

Misalnya dalam ujian A (jam tangan A), kita akan dapati bahawa ralatnya ialah 10% sahaja, sementara dalam ujian B (jam tangan


B), kita akan dapati ralatnya ialah 40%. Ini bermakna bahawa

sekali dalam 10 kali, jam tangan A tidak akan menunjukkan

waktu yang tepat, manakala bagi jam tangan B, 4 kali dalam 10

kali jam tangan itu akan memberikan waktu yang salah. Kita

akan lebih mengharapkan jam A daripada jam tangan B.

6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan sesuatu alat ujian boleh dipertingkat dengan beberapa cara iaitu:

Pernyataan item yang tepat dan jelas

Item-item yang digunakan hendaklah homogenous

Arahan-arahan ujian mestilah jelas, ringkas dan padat

Mengelakkan gangguan semasa subjek menjawab ujian

Pengumpulan data dilakukan dalam keadaan yang piawai, serupa dan terkawal.

7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item bagi mengukur kepuasan perkahwinan di kalangan responden ibu

etnik Rungus, Sabah. Item-item tersebut dibahagikan kepada dua

item positif dan dua item negatif seperti berikut:

V1 Saya berpuas hati dengan perkahwinan saya (+)

V2 Saya tidak berpuas hati dengan suami saya (-)

V3 Saya berpuas hati dgn kasih sayang yang suami saya berikan (+)

V4 Saya tidak berpuas hati dgn layanan yang suami saya berikan (-)


8. Jawapan bagi item positif dan negatif yang boleh dipilih oleh responden berdasarkan Jadual 9.1 berikut:

Jadual 9.1 Skor Bagi Item Positif dan Negatif

Item Positif (+) Item Negatif (-)

5 = Sangat Setuju 5 = Sangat Tidak Setuju

4 = Setuju 4 = Tidak Setuju

3 = Tidak Pasti 3 = Tidak Pasti

2 = Tidak Setuju 2 = Setuju

1 = Sangat Tidak Setuju 1 = Sangat Setuju

Nota: Recode boleh dibuat pada program SPSS

9. Kebolehpercayaan sesuatu alat ujian boleh diukur melalui tiga cara iaitu:

C2 Jenis Kebolehpercayaan

C2.1 Ketekalan/Kebolehpercayaan Luaran

1. Kaedah Uji-Uji Kembali (Test-Retest)

Sesuatu ujian/soal selidik diberikan kepada responden yang sama pada dua masa berlainan. Contohnya, ujian/soal selidik

diberikan pada hari ini, dan kemudian ujian/soal selidik yang

sama diberikan semula seminggu kemudian kepada

responden yang sama. Ujian korelasi dilakukan dan semakin

tinggi korelasi antara dua ujian/soal selidik ini, maka semakin

boleh dipercayai ujian/soal selidik tersebut.

Dalam kebolehpercayaan Uji-Uji Kembali, ujian yang sama diberikan semula kepada subjek yang sama selepas satu

jangkamasa tertentu. Jangkamasa yang diberikan boleh jadi


daripada beberapa minit kepada beberapa tahun (Brown,

1976).

Bila reliabiliti ujian semula ini dilaporkan di dalam test manual, jarak masa yang digunakan mestilah dinyatakan.

Korelasi ujian kembali akan menjadi rendah jika jarak masa

terlalu lama. Perkara ini terjadi disebabkan oleh beberapa

angkubah lain seperti umur, kematangan dan pembelajaran

yang mungking mempengaruhi subjek (Anastasi, 1968).

Di samping itu pekali kebolehpercayaan juga akan menjadi tinggi jika jangka masa yang digunakan terlalu singkat kerana

individu itu masih dapat mengingati kembali jawapan pada

item-item yang tertentu (Mehrens & Lehmann, 1978).

Namun begitu, kelesuan dan jemu pada satu ujian itu juga mungkin mempengaruhi prestasi subjek untuk menjawab ujian

yang diberikan dan akibatnya reliabiliti akan menjadi rendah.

Mohd Majid Konting (1990) menyatakan kaedah test-retest merupakan kaedah bagi mendapatkan dua set markat dengan

mentadbir alat ukur yang sama ke atas subjek yang sama

sebanyak dua kali. Skor-skor yang diperoleh pada

pengukuran pertama dan pengukuran kedua dikorelasikan.

Pengkaji mengandaikan responden dapat mencapai keputusan yang sama dalam ujian pertama dan kedua. Sekiranya kedua-

dua skor dalam ujian pertama dan kedua itu mempunyai

korelasi yang tinggi, menunjukkan alat pengukuran (alat

ujian/soal selidik) itu mempunyai kebolehpercayaan yang

tinggi.

Contoh 1 : Mesin pemberat untuk mengukur berat badan A. Dua hari kemudian kita ukur semula berat A. Kita berharap

mendapatkan ukuran yang sama jika pengukur (mesin

pemberat) adalah dalam keadaan yang sama. Masalah yang

timbul ialah jika kita ulangi pengukuran ini 4 bulan kemudian,

mungkin A telah mengurangkan berat badannya dengan


berdiet, maka berat badannya akan lebih ringan berbanding

permulaannya. Ini tidak bermakna mesin mengukur berat

badan yang salah, tetapi yang telah berubah ialah berat badan

A.

Contoh 2 : Soalan bertanyakan tarikh lahir responden B dan jawapannya ialah 30 November 1947, maka pada ujian yang

kedua kita menanyakan soalan sama, sudah tentu kita akan

mendapat jawapan yang sama. Masalahnya ialah, jika

ditanya pada waktu lain, responden lupa bila tarikh lahirnya,

maka soalan yang kita reka sebagai pengukur bukanlah salah.

Yang silap ialah jawapan responden.

TUGASAN 7: Uji kebolehpercayaan uji-uji kembali

IKSOKU-F dengan menggunakan korelasi Pearson.

2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)

Dalam ujian ini, pengkaji mempunyai dua ujian (2 bahagian soal selidik), tetapi kedua-duanya mengukur perkara yang

sama. Ia ditadbir ke atas kumpulan orang/ responden yang

sama bagi mendapat hubung kait antara dua ujian.

Mohd Majid Konting (1990) menyatakan bahawa kaedah ini menggunakan satu alat ukur yang dibina dan satu alat ukur

yang piawai. Kedua-dua alat ukur tersebut adalah setara dari

segi kandungannya tetapi mungkin berbeza dari segi

penyampaian. Kedua-dua alat ukur ditadbir pada subjek yang

sama dan skor yang diperoleh daripada kedua-dua alat ukuran

itu dikorelasikan.


Perkara yang sama seperti dilakukan dalam prosedur test-retest. Cuma perkataan dan susunan item dalam alat

ujian/soal selidik ditukar supaya nampak berbeza namun

isinya tetap sama.

Sekiranya korelasi yang dicatat tinggi, maka alat ujian/soal selidik itu boleh dipercayai.

Masalah yang dihadapi ialah untuk menentukan supaya kedua-dua ujian tersebut mengukur fenomena yang sama.

C2.2 Ketekalan Dalaman (Internal Consistency)

1. Menurut Brown (1984), analisis kebolehpercayaan

ketekalan dalaman merujuk kepada sejauh mana item-

item dalam sesuatu ujian saling berhubung kait. Ini

bermakna semakin tinggi korelasi antara item, semakin

tinggi kebolehpercayaan item itu.

2. Ketekalan dalaman berhubung kait dengan korelasi

purata antara item. Sesuatu ujian dikatakan seragam

sekiranya skor bagi keseluruhan item dalam ujian

tesebut adalah berkorelasi positif.

3. Bagi memaksimumkan korelasi antara item ini,

kepayahan item sepatutnya adalah sama. Jika dua item

mengukur tingkah laku yang sama tetapi berbeza dalam

kepayahan masing-masing, kedua-dua item ini


dikatakan mempunyai korelasi antara item yang sangat

rendah.

4. Secara umumnya, boleh dikatakan bahawa

kebolehpercayaan sesuatu ujian itu sangat berhubung

kait dengan darjah kepayahan iaitu pelbagai item dalam

sesuatu ujian adalah berkorelasi di antara satu sama

lain.

5. Kebolehpercayaan sesuatu ujian dijelaskan sebagai satu

nombor perpuluhan positif yang melingkungi sifar

(0.00) hingga satu (1.00). Nilai 1.00 menunjukkan

kebolehpercayaan yang sempurna. Manakla 0.00

menunjukkan ketiadaan nilai kebolehpercayaan

(Aiken, 1988).

6. Anastasi (1982) menyatakan bahawa pekali

kebolehpercayaan yang memuaskan dan tinggi adalah

di antara 0.70 dan 0.90. Kaplan dan Succuzoo (2001)

pula mencadangkan nilai kebolehpercayaan dalam

lingkungan 0.70 hingga 0.80 adalah cukup baik untuk

kebanyakan penyelidikan.

7. Kerlingger (1973) berpendapat nilai kebolehpercayaan

yang tinggi ialah 0.80.

8. Terdapat pelbagai kaedah yang boleh digunakan untuk

mengukur ketekalan dalaman seperti kaedah pekali alfa


Cronbach, Split Half, dan analisis varians ukuran

berulang Hoyt.

1. Alfa Cronbach

1. Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah satu

teknik yang digunakan untuk menganggarkan kebolehpercayaan

ketekalan dalaman.

2. Ianya digunakan dalam situasi di mana format jawapan adalah lebih

daripada alternatif misalnya pilihan jawapan betul atau salah.

3. Alfa yang disarankan oleh Cronbach dan rakan-rakan (1955) boleh

digunakan untuk melihat kebolehpercayaan ketekalan dalaman dan

keseragaman item bagi sesuatu ujian.

4. Anastasi (1982) menyatakan bahawa pekali Cronbach merupakan

satu kaedah kebohpercayaan ketekalan dalaman sesuatu alat ukuran

yang menggunakan jawapan tidak dikotomi. Kaedah ini sesuai

digunakan bagi alat ukuran yang mempunyai skala jawapan lebih

daripada dua seperti skala likert. Formula pekali alfa Cronbach

adalah seperti berikut:

1

N Sa SiCr

N Sa

Di mana,

Cr = pekali alfa

N = jumlah item dalam ujian


Sa = varians alat ukuran

Si = varians item

TUGASAN 8: Uji kebolehpercayaan ketekalan dalaman Cronbach

alfa IKSOKU-F.

2. Berbahagi-Dua (Split-Half)

1. Menurut Anastasi (1982) kaedah split-half merupakan kaedah yang

digunakan untuk melihat kebolehpercayaan dengan membahagikan

item-item kepada dua bahagian dan mengkorelasikan item-item di

antara kedua-dua bahagian masing-masing dengan menggunakan

kaedah indeks ketekalan dalaman.

2. Kaedah bahagi dua dilakukan dengan menggunakan statistik pekali

korelasi Pearson dan diperbaiki dengan menggunakan formula

Spearman Brown (Anastasi, 1982).

3. Pembahagian juga boleh dibahagikan dengan dua cara. Pertama

ialah apabila ujian adalah panjang maka ujian tersebut dibahagikan

kepada dua bahagian. Cara pertama ini mungkin akan

menimbulkan masalah akibat kesukaran membezakan item antara

dua bahagian.

4. Bagi mengatasi masalah ini, cara kedua perlu diaplikasikan iaitu

dengan membahagikan ujian kepada dua berdasarkan nombor ganjil

dan nombor genap soal selidik (Kaplan & Saccuzzo, 1993; Murphy

& Davidshofer, 1991). Formula split half adalah sperti berikut:


2

1

RR

r

Di mana,

R = kebolehpercayaan keseluruhan item dalam ujian

r = korelasi antara item bernombor ganjil dan genap

5. Jika diteliti split half ini hanya merupakan sebahagian daripada

keseluruhan ujian. Jadi, keseluruhan kebolehpercayaan sesuatu alat

ujian itu perlu diubahsuai dengan formula Spearman-Brown (1910)

seperti di bawah:

'

'1 1

llll

ll

nrr

n r

Di mana,

rII = estimate coefficient

nrII = korelasi yang telah diperolehi daripada dua split-half

n = berapa kali item-item itu telah dibahagikan daripada jumlah item-item

secara keseluruhannya.

6. Korelasi antara dua bahagian itu dinamakan correlation between forms.

Pekali yang dinamakan equal length Spearman-Brown memberi anggaran kebolehpercayaan skel lapan item

seandainya skel tersebut terbina daripada dua bahagian sama

panjang.

Satu cara lagi untuk mengukur kebolehpercayaan ialah dengan mengira pekali Guttman split-half yang kebetulannya boleh

dilakukan serentak dalam satu prosedur.


7. TUGASAN 9: Uji kebolehpercayaan ketekalan dalaman Split-

Half IKSOKU-F.

Kuder-Richardson (KR)

1. Kaedah ini berasaskan sisihan piawai alat ukur dan sisihan piawai item-item yang berlainan.

2. Pekali kebolehpercayaan melalui kaedah ini juga dikenali sebagai alfa Cronbach.

3. Menurut Sidek Mohd Noah (1990) dan Tuckman (1978), apabila item-item ujian yang dibina mempunyai skor sama ada A atau B,

Salah atau Betul, Ya atau Tidak pada suatu ujian, kaedah ini sesuai

digunakan.

Menggunakan kaedah ini, skor yang diperolehi dari setiap item akan dikorelasikan dengan skor keseluruhan item.

C2.3 Kebolehpercayaan interrater/interscorer

1. Sesuatu kajian kadangkala perlukan rater atau pakar bagi membuat penilaian ke atas sesuatu fenomena. Oleh kerana data yang

diperoleh mungkin melibatkan pemerhatian, pengkategorian

ataupun temubual, maka pengkaji perlu memastikan sejauh mana

tekalnya jawapan atau maklum balas yang mereka berikan.

2. Sebagai contoh, adakah ketekalan dalam ujian memastikan sama ada 10 jenis air yang diminum itu panas, suam ataupun biasa.

Mungkin 5 orang akan diminta menilai. Sejauhmana tekal dan

sama jawpan yang diberikan merupakan kebolehpercayaan

interrater.


D. ANALISIS ITEM

D1. Pengenalan

1. Analisis item ialah satu kaedah yang digunakan bagi menilai kualiti

item-item alat ujian dengan menggunakan beberapa cara

berdasarkan sifat yang ingin dikaji.

2. Analisis item bertujuan untuk memperbaiki sesuatu ujian dengan

menyemak dan menggugurkan item-item yang tidak berkenaan

(Aiken 1988).

3. Alat pengukuran yang baik adalah alat pengukuran berkualiti yang

didakwa sesuai bagi mengukur perkara yang ingin diuji. Bagi

menghasilkan item yang baik dalam alat ujian, ahli psikometrik

biasanya akan menjalankan proses pemilihan item bagi memastikan

item-item yang berjaya menjadi ujian yang terakhir adalah item-item

yang dianggap berkualiti untuk mengukur sesuatu trait yang hendak

diukur.

4. Menurut Aiken (1988), analisis item yang baik dapat memberi

maklumat mengapa sesuatu alat ukuran itu tidak boleh dipercayai

atau gagal menunjukkan tahap kesahan yang dijangkakan.

5. Analisis item juga dapat menunjukkan mengapa ukuran itu boleh

dipercayai dan dapat digunakan sebagai peramal kepada sesuatu

kriteria tetapi tidak kepada kriteria pengukuran (Murphy &

Davidshofer, 1988).


6. Hasil dari analisis item dapat memberi satu petunjuk apakah ukuran

itu dapat difahami oleh sampel kajian (Iran Herman, 1988).

7. Murphy dan Davidshofer (1988) menyatakan bahawa sesuatu

kriteria dapat diramal dan dijangka oleh analisis item tetapi

sesetengah pula tidak dapat diramal.

8. Allen dan Yen (1982) menyatakan bahawa sesuatu alat yang baik

dan sesuai harus mengalami satu proses analisis item bagi

memastikan hanya item-item yang baik sahaja yang dapat dijadikan

edisi ujian. Ini adalah penting untuk membuat kesimpulan

keputusan dalam menentukan sama ada ukuran itu sah atau tidak

sah.

9. Anastasi (1982) menyatakan bahawa analisis item dapat

memendekkan ujian dan pada masa yang sama meningkatkan

kebolehpercayaan dan kesahan alat ujian tersebut.

10. Wolman (1973) berpendapat bahawa analisis item adalah

sesuatu penentu kepayahan, kemampuan mendiskriminasi,

ketekalan dalaman dan kebolehpercayaan item-item di dalam ujian.

Ia juga merupakan penentu kesahan item.


D2. Indeks Kepayahan Item

1. Kepayahan item didefinisikan sebagai kebolehan individu menjawab

betul sesuatu item (Anastasi, 1982). Sesuatu item yang senang akan

menghasilkan peratus jawapan yang tinggi. Item yang terlalu susah

pula akan menunjukkan nilai peratus jawapan betul yang rendah.

2. Kedua-dua keadaan tersebut sama ada item yang terlalu senang dan

terlalu susah adalah bentuk item yang kurang baik untuk dijadikan

ujian terhadap sesuatu tret.

3. Sesuatu item ujian yang baik dan ideal diperolehi sekiranya jawapan

dapat menunjukkan 50% jawapan betul dan 50% jawapan salah.

D3. Indeks Kebolehpercayaan Item

1. Indeks Kebolehpercayaan item melihat fungsi keperbezaan dan

serakan markat item dan juga korelasi di antara markat item dengan

keseluruhan ujian. Secara formula indeks ini ialah hasil darab di

antara item dengan markat keseluruhan. Jumlah keseluruhan

markat dianggap sebagai kriteria dalam sesuatu item. Formulanya

adalah berikut:

kl i itI SP r


Di mana,

Iki = indeks kebolehpercayaan item

spi = sisihan piawai item.

rit = korelasi item dengan keseluruhan item.

D4. Indeks Kesahan Item

1. Indeks kesahan item diperolehi dengan mengkorelasikan markat

item dengan markat pembolehubah kriterium (ric). Indeks kesahan

item adalah hasil darab sisihan piawai item sebagai petunjuk

keperbezaan dan serakan dengan korelasi item dengan kriterium.

Formulanya adalah seperti berikut:

icISi SP r

Di mana

Isi = Indeks Kesahan item

Spi = Sisihan piawai item

ric = Korelasi item dengan kriterium.

pengukuran, kesahan (validity) dan kebolehpercayaan (reliability) instrumen

Documents