pengukuran, kesahan (validity) dan kebolehpercayaan (reliability) instrumen
DESCRIPTION
niceTRANSCRIPT
-
2014 Dr. Ferlis bin Bullare @ Bahari
PENGUKURAN, KESAHAN (VALIDITY)
DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN
Dr. Ferlis Bin Bullare @ Hj. Bahari
Pensyarah Kanan/Ketua
Unit Penyelidikan Psikologi & Kesihatan Sosial
Universiti Malaysia Sabah
Tel (O) : 088 320 000 (8979)
H/P : 016 520 2070
e-mel : [email protected]; [email protected]
A. PENGUKURAN
1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa: ... jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika ia
wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah
data atau khususnya pembolehubah.
2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu simbol yang diberikan perangkaan atau nilai.
3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya dikomputerkan.
4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua jenis:
(i) Pemboleh ubah bebas dan terikat (ii) Pemboleh ubah berterusan dan kategorikal
-
2014 Dr. Ferlis bin Bullare @ Bahari
5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang menyebabkan berlakunya pemboleh ubah terikat; ia juga melibatkan
kesan atau pengaruhnya ke atas pemboleh ubah terikat.
6. Pemboleh ubah berterusan mengambil nilai perangkaan berjulat. Misalnya umur memperlihatkan perbezaan seorang bayi berumur
dua bulan dengan seorang tua berumur 70 tahun.
7. Pemboleh ubah kategorikal mempunyai ukuran berbentuk nominal, iaitu objek dimasukkan ke dalam satu kategori yang ditentukan.
Misalnya jantina (lelaki dikodkan dengan nombor 1 dan perempuan
dikodkan dengan nombor 2). Komputer tidak membezakan antara
peringkat-peringkat ukuran yang berlainan seperti contoh umur dan
jantina di atas. Komputer akan memproses sebarang jenis angka
yang diberikan kepadanya tanpa membezakan sama ada sesuatu
ukuran itu bersifat mutlak (umur) atau bersifat sembarangan
(jantina).
8. Mengukur pemboleh ubah bererti memberi angka kepada objek, kejadian atau manusia mengikut aturan tertentu (Stevens, 1951).
Cohen & Nagel (1934) mendefinisikan ukuran sebagai mengkorelasi
entiti yang bukan angka dengan angka.
-
2014 Dr. Ferlis bin Bullare @ Bahari
9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala pengukuran:
(i) Nominal atau kategori (Nominal)
Setiap nilai yang diberikan sebagai kategori tersendiri (label dan tanda semata-mata).
Tidak boleh melakukan operasi aritmetik (menjumlah, menolak, mendarab dan membahagi) terhadap data angka
tersebut kerana hasilnya tidak memberi apa-apa makna.
Contohnya jantina (1 = lelaki; 2 = perempuan);
Contohnya Etnik (1 = Melayu; 2 = Kadazan; 3 = Bajau; 4 = Murut; 5 = Bisaya; 6 = Iban; 7 = Lain-lain)
Statistik perihalan (mod dan frekuensi) boleh digunakan untuk memerihalkan pembolehubah yang diukur. Statistik
tak berparameter (ujian khi kuasa dua dan ujian binomial)
sesuai digunakan menganalisis data yang melibatkan skala
nominal.
(ii) Ordinal atau darjah (Ordinal)
Untuk pembolehubah yang boleh diatur atau disusun mengikut pangkat atau darjah.
Jarak antara dua paras ukuran masih belum diketahui. Kita tidak ketahui berapa tingginya SES kelas atasan daripada SES kelas
menengah atas atau antara kelas menengah atas dengan menengah
bawah. Kita Cuma tahu SES kelas atasan lebih tinggi daripada kelas
-
2014 Dr. Ferlis bin Bullare @ Bahari
menengah atas, yang lebih tinggi pula daripada kelas bawahan.
Tidak lebih daripada itu.
Dengan kata lain, susunan pangkat yang dibuat hanya memberikan kategori manakah yang tinggi atau rendah dan BUKAN berapa
banyakkah ia lebih besar, lebih baik atau lebih tinggi dipilih
berbanding kategori lain.
Kita tidak boleh melakukan apa-apa operasi aritmetik.
Namun, statistik yang sesuai untuk menghuraikan kecenderungan memusat untuk kategori-kategori dalam skala ordinal ialah
penengah dan mod.
Bagi menentukan perbezaan antara kategori-kategori dalam skala ordinal, ujian-ujian statistik tak parametrik yang sesuai digunakan
seperti Ujian Kolmogorov-Smirnov, Ujian Larian Satu Sampel,
Ujian Tanda, Ujian Wilcoxon, Ujian Median, Ujian Mann-Whitney,
Ujian Wald-Wolfowitz, Ujian Friedman dan Ujian Kruskal-Wallis.
Untuk menentukan perkaitan antara pembolehubah, pekali korelasi pangkat Spearman dan pekali korelasi pangkat Kendall sesuai
digunakan.
Contohnya, jawapan berbentuk skala Likert iaitu, 1 = sangat tidak setuju;
2 = tidak setuju; 3 = tidak pasti; 4 = setuju; 5 = sangat setuju
Contoh lain ialah status ekonomi social (SES) seseorang iaitu, 1 = kelas
atasan; 2 = kelas menengah atas; 3 = kelas menengah bawah; 4
= kelas bawahan
-
2014 Dr. Ferlis bin Bullare @ Bahari
(iii) Sela atau selang (Interval)
Pengukuran yang menggunakan skel sela tidak mempunyai titik sifar yang mutlak (nilai sifar sebenar), misalnya sukatan suhu Celsius dan
Fahrenheit.
Operasi aritmatik (campur dan tolak) boleh dilakukan ke atas cerapan skala sela. Skala sela adalah skala pertama yang bersifat
kuantitatif.
Semua statistik parametrik umum (min, sisihan piawai dan pekali korelasi Pearson) boleh digunakan.
Angka sela boleh dijumlah dan ditolak antara satu sama lain, misalnya kita boleh mencampurkan suhu beberapa tempat di
Malaysia pada hari tertentu dan mengira puratanya. Namun kita
tidak boleh mengira nisbah dua suhu kerana kita tidak boleh
membahagi angkubah yang bersifat sela. Dengan kata lain, operasi
bahagi dan darab tidak boleh dilakukan bagi data sela (interval).
Contohnya 32F31F=1F. Jarak 1 darjah ini sama dengan 1 darjah bagi perbezaan 85F84F atau 78F77F. Tapi salah sama sekali jika
kita mengatakan bahawa haba 100F bernilai dua kali ganda haba
yang ada pada 50F.
-
2014 Dr. Ferlis bin Bullare @ Bahari
(iv) Nisbah (Ratio)
Pengukuran secara nisbah mempunyai sifat pengukuran sela, dengan ditambah satu sifat lagi, iaitu titik sifar mutlak sudah dapat
ditakrifkan baginya (ataupun mempunyai nilai sifar sebenar).
Contohnya, markah pelajar bagi subjek Matematik dalam
peperiksaan antara 0 hingga 100. Angka 0 merupakan sifar yang
sebenar kerana pelajar yang mendapat markah 0 menunjukkan
mereka menjawab salah dalam semua soalan.
Apabila ada titik sifar yang mutlak, semua operasi aritmetik dapat dilakukan. Misalnya timbangan berat, jarak jauh, umur, keluasan
tanah, jumlah pendapatan (RM).
Misalnya berat badan seorang kanak-kanak 30kg semestinya melebihi berat badan seorang yang berat badan 15kg sebanyak dua
kali ganda (30/15=2).
Contoh lain ialah pendapatan sebanyak RM 4,000 sebulan adalah RM1,000 lebih tinggi daripada pendapatan RM3,000 sebulan.
Pendapatan RM 5,000 sebulan ini adalah dua kali lebih tinggi
daripada RM2,000. Oleh yang demikian, semua operasi aritmetik
(campur, tolak, darab dan bahagi) boleh digunakan bagi data nisbah
(ratio).
-
2014 Dr. Ferlis bin Bullare @ Bahari
B. KESAHAN (VALIDITY)
B1 Pendahuluan
1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana alat itu mengukur data yang sepatutnya ia dikehendaki mengukur.
2. Anastasi (1967) mendefinisikan kesahan sebagai satu ujian yang menekankan tentang apa yang hendak diukur dan sejauhmana ia
boleh berbuat demikian.
3. Kerlinger (1973) menyatakan bahawa kesahan alat ujian mempunyai ciri-ciri kestabilan (stabiliti), konsistensi, keramalan dan ketepatan.
4. Sekiranya data yang dikehendaki ialah ketinggian pelajar, alat ukur yang digunakan mestilah dapat mengukur ketinggian pelajar dengan
tepat. Misalnya, timbang adalah alat sah mengukur berat dan tidak
sah digunakan untuk mengukur ketinggian. Ketinggian pelajar sah
diukur menggunakan pembaris.
5. Persoalan utama yang perlu diambilkira tentang pengukur yang digunakan dalam sesuatu kajian ialah:
Apakah yang alat itu telah ukur?
Adakah alat itu benar-benar mengukur apa yang kita ingin ukur?
Adakah dengan menggunakannya, alat itu membenarkan pengutipan data yang relevan dengan apa yang menjadi
tumpuan kajian?
6. Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh ubah iaitu pemboleh ubah fizikal atau kuantitatif (ketinggian pembaris;
berat timbang) dan kualitatif/gagasan/konsep (pencapaian, stres,
kecerdasan, sikap, motivasi).
-
2014 Dr. Ferlis bin Bullare @ Bahari
7. Satu konsep yang digunakan dalam kajian sains sosial ialah satu yang abstrak seperti kecerdasan. Ujian diberikan untuk melihat tahap
kecerdasan. Adakah ujian kecerdasan ini menguji kecerdasan
seseorang? Oleh itu pengukuran bagi sesuatu yang abstrak biasanya
menimbulkan keraguan.
8. Seperkara lagi iaitu tentang penerimaan satu ujian sebagai sah atau tidak. Kesahan ujian bagi satu kumpulan di sesuatu tempat tidak
semestinya sah bagi ujian lain di tempat berasingan. Misalnya ujian
kecerdasan atau kesulitan ekonomi di Afrika tidak tentu sama
keberkesanan kesahannya di negara Malaysia kerana masing-masing
mempunyai kebudayaan dan gaya hidup yang berlainan.
9. Gronlund (1985) menyatakan bahawa perkara yang perlu diingat semasa menggunakan kesahan ialah:
9.1 Kesahan berhubung rapat dengan keputusan ujian dan
hubungannya terhadap alat ukuran itu sendiri.
9.2 Kesahan sepatutnya tidak dilihat dari segi sah atau tidak sah tetapi
dari segi darjah kesahannya sama ada tinggi, sederhana atau rendah.
9.3 Kesahan perlu dirujuk kepada satu kegunaan yang khusus dan ujian
tidak akan menunjukkan kesahan untuk semua tujuan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
B2 Jenis Kesahan
B2.1 Kesahan Muka (Face Validity)
1. Bailey (1984) menyatakan bagi mengetahui sama ada instrumen atau soal selidik mempunyai kesahan, penyelidik perlu tahu bagaimana
konsep hendak diukur itu didefinisikan dan sama ada maklumat
yang dikumpulkan itu berkaitan dengan konsep itu. Kesahan muka
adalah perkara yang perlu dipertimbangkan oleh pengkaji sendiri,
kumpulan penyelidik ataupun pakar.
2. Kesahan muka juga dapat dinilai berdasarkan penyelidikan pengkaji tentang konsep yang hendak diukur dan pertimbangan berdasarkan
sama ada alat itu berjaya mendekati satu konsep itu dengan
sepenuhnya atau tidak. Jika ukuran itu mengukur satu konsep pada
keseluruhannya, maka pengkaji berjaya dengan mengemukakan
kesahan muka.
3. Misalnya seorang penyelidik ingin membentuk instrumen kajian. Penyelidik itu akan memberikan instrumen kepada pakar dalam
bidang yang hendak dikaji bagi dinilai sekali imbas. Pengesahan
awal soal selidik itu memperlihatkan ciri-ciri pengukuran yang
hendak diukur adalah merupakan kesahan muka bagi instrumen
tersebut. Dengan kata lain, apabila dilihat kali pertama, instrumen
ini mengukur apa yang hendak diukur dan nampak sesuai.
4. Bagi mengetahui suatu alat pengukur itu mempunyai kesahan muka atau tidak; definisi konsep yang hendak dikur serta maklumat yang
dikumpulkan itu bersesuaian ataupun tidak dengan konsep tersebut
perlu diketahui.
5. Contohnya, seorang pelajar ingin menjalankan kajian tentang penyusuan susu ibu tetapi item-item atau soalan-soalan dalam soal
selidik yang digunakan berkaitan dengan stres, maka dapat
dikatakan item-item tersebut tidak mempunyai kesahan muka.
-
2014 Dr. Ferlis bin Bullare @ Bahari
6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat tentang sesuatu konsep. Misalnya percanggahan tentang sesuatu
ujian / soalan peperiksaan antara pensyarah dengan pelajar.
Pensyarah yakin bahawa ujian yang dijalankan mempunyai kesahan
muka yang tinggi, namun para pelajar mungkin ada pendapat
tersendiri.
7. Satu isu lagi yang wujud iaitu dimensi atau gagasan sesuatu konsep itu berubah dari semasa ke semasa.
8. LATIHAN 1: Tentukan dan kenal pasti kesahan muka bagi
IKSOKU-F.
B2.2 Kesahan Kandungan (Content Validity)
1. Ia adalah kesahan kedua selepas kesahan muka. Ia lebih mendalam di mana soal selidik akan dipastikan memang mengukur konsep-
konsep yang hendak diukur. Contohnya pengukuran kepuasan
kerja meliputi pelbagai komponen seperti gaji, rakan sekerja,
pangkat, penghargaan, pengiktirafan dan sebagainya. Oleh itu,
semua komponen ini perlu diambilkira sewaktu memilih item.
2. Item-item ini akan diperiksa dari segi perkataan, ayat, dan istilah yang digunakan.
3. Kesahan kandungan dapat dilakukan dengan menggunakan khidmat panel / pakar bagi menimbangkan sejauhmana instrumen itu
memenuhi piawaian. Cadangan pakar dalam bidang yang diukur
perlu bagi tujuan pembaikan, pembetulan, penambahan ataupun
pengurangan ke atas skala dan item dalam soal selidik yang
digunakan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu dipenuhi sebelum sesuatu ujian itu dikatakan mempunyai kesahan
kandungan:
Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku secara umum diterima maknanya
Bidang mestilah dihuraikan dengan jelas
Bidang mestilah relevan dengan tujuan penggunaan ujian
Hakim-hakim/ panel/ pakar yang berkelayakan mestilah bersetuju bahawa bidang telah disampel secara mencukupi
Gerak balas mestilah diperhati dan dinilai secara tekal
5. Latihan: Tentukan dan kenal pasti kesahan kandungan (content
validity) bagi IKSOKU-F.
B2.3 Kesahan Kriteria (Kesahan Serentak & Kesahan Peramal)
1. Kesahan ini diperolehi apabila sesuatu ujian yang dijalankan membezakan ukuran melalui sesuatu kriteria yang ingin dilihat
dalam sesuatu soal selidik.
2. Tujuan kesahan kriteria ialah untuk menggunakan ujian sebagai pentaksir terhadap satu tingkah laku atau sikap. Misalnya, apabila
seseorang itu telah melalui ujian memandu dan disahkan lulus, kita
akan mentaksirkan bahawa dia akan dapat memandu dengan baik
dan cermat.
3. Kesahan Serentak/ Selari (Concurrent Validity) : Ialah kriteria yang ditunjukkan pada masa yang sama atau hampir sama dengan
pengukuran yang dikenakan ke atas kriteria tersebut. Ia digunakan
untuk mengukur sesuatu fenomena pada masa kini.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik dikatakan mempunyai kesahan kriteria serentak yang tinggi jika
seseorang pelajar yang mencapai kebolehan yang cemerlang
dalam ujian tersebut juga pada masa itu boleh menunjukkan
kebolehannya bermain muzik dengan baik.
Contoh 2 : Di dalam satu kilang, seorang pengkaji telah mendapatkan ukuran bahawa mereka yang mengikuti latihan
jasmani pada tiap-tiap pagi adalah mereka yang menunjukkan
prestasi dan dapat mengeluarkan produktiviti yang lebih tinggi
berbanding pekerja lain. Masa yang sama, penyelia diminta
memberikan laporan samada benar bahawa pekerja yang
mengikuti latihan jasmani tersebut mencatat daya pengeluaran
yang tinggi. Jika ini betul, maka pihak kilang akan melakukan
ujian jasmani tersebut kerana ia ada kaitan dengan daya
pengeluaran pekerja.
4. Kesahan Peramal (Predictive Validity) : Merujuk kepada keupayaan ukuran itu meramalkan peristiwa masa akan datang atau
sejauhmanakah sesuatu /soal selidik ujian (peramal) itu dapat
meramalkan sesuatu yang sebenar (kriteria). Bagi menentukan
kesahan ramalan, korelasi antara ujian ramalan dengan kejadian
sebenar akan dibuat. Jika korelasi yang diperoleh tinggi, ini
bermakna ujian itu mempunyai kesahan ramalan yang tinggi.
Contoh 1: Sejauhmana ujian percubaan SPM dapat meramal kejayaan akademik seterusnya iaitu peperiksaan SPM sebenar.
Ujian SPM sebenar akan dibandingkan dengan ujian
percubaan SPM; yang mana penyelidik merasa yakin dapat
mengukur konstruk ini iaitu prestasi akademik di sekolah
menengah. Indeks statistik bagi kesahan ramalan ini ialah
ukuran korelasi di antara peramal (agregat dalam ujian
percubaan SPM) dengan kriteria (agregat dalam ujian SPM
sebenar).
-
2014 Dr. Ferlis bin Bullare @ Bahari
Contoh 2: Kesahan STPM sebagai pengukur kejayaan seseorang itu dalam universiti kelak.
Contoh 3 : Apabila seseorang itu lulus dan dapat sijil memandu, dia akan dapat memandu kenderaan dengan baik.
Namun, keadaan ini tidak selalu benar.
Contoh 4 : Majikan mengadakan ujian seperti temuduga, ujian bertulis dan lisan bagi calon-calon yang akan diterima bekerja
di dalam syarikat/organisasi.
LATIHAN 3: Tentukan dan kenal pasti kesahan peramal
IKSOKU-F.
B2.4 Kesahan Konstruk/ Gagasan, Kesahan
Konvergens dan Kesahan Discriminant
Pengenalan
1. Gagasan (construct) merujuk kepada sekumpulan pemikiran yang ada dalam fikiran tetapi tidak dapat dilihat objek tersebut secara
langsung / dengan mata kasar.
2. Kesahan gagasan melibatkan hubungan di antara satu kerangka teori yang menyeluruh supaya dapat menentukan sama ada alat ukuran
yang digunakan mempunyai hubungan dengan konsep dan andaian
yang digunakan.
3. Kesahan gagasan digunakan bagi mengukur sifat-sifat yang tidak dapat diukur oleh kriteria luaran, misalnya kepuasan. Kelebihan
menggunakan kesahan gagasan ialah ia mengukur kesahan sifat yang
tersembunyi bagi satu-satu ukuran. Ia membolehkan pengkaji
menentukan komponen satu-satu sifat yang ditunjukkan oleh sesuatu
alat (Siti Saleha Samsuddin, 2002).
-
2014 Dr. Ferlis bin Bullare @ Bahari
4. LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan SSKSOKU-F menggunakan analisis faktor.
Kesahan Convergens
1. Cara mendapatkan kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk dengan
soal selidik yang lain yang telah ada yang mengukur konsep yang
sama. Sekiranya keputusan menunjukkan hasil korelasi yang tinggi,
maka kesahan konvergen dikatakan telah diperolehi. Ini adalah
kerana kedua-dua soal selidik tadi mengukur konsep yang sama.
2. Sebaliknya sekiranya keputusan korelasi rendah atau tidak signifikan, ini bermakna soal selidik yang baru dibentuk itu
mungkin tidak sesuai dengan teori kerana tidak mempunyai
hubungan dengan konsep yang sama dalam soal selidik yang telah
ada (piawai).
3. LATIHAN 5: Uji kesahan konvergen kedua-dua skala dengan PWB dan SWLS dengan menggunakan korelasi Pearson.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Kesahan Discriminant
1. Cara memperolehi kesahan ini ialah dengan mendapatkan keputusan korelasi di antara soal selidik yang baru dibentuk itu
dengan soal selidik yang lain yang telah ada yang tidak mengukur
konsep yang sama. Sekiranya tidak ada korelasi yang signifikan yang
dicatatkan, ini bermakna berdasarkan teori konsep dalam soal
selidik baru mempunyai kesahan diskriminan.
2. Sekiranya ada korelasi yang signifikan, ini bermakna konsep dalam soal selidik yang baru tadi tidak mengukur apa yang hendak diukur
kerana ia berkorelasi dengan konsep yang tidak sepatutnya dalam
soal selidik yang ada.
3. LATIHAN 6: Uji kesahan diskriminan kedua-dua instrumen dengan skala tertentu dengan menggunakan korelasi Pearson.
Jadual 1: Perbezaan antara Kesahan Konvergen dan Kesahan
Diskriminan
Kesahan Konvergen (KK) Kesahan Diskriminan/Divergent
(KD)
1. A construct-validated
instrument should have high
correlations with other measures
or methods of measuring the
same construct samb
1. samb but low correlations
with measure of different
constructs
2. KK baik apabila nilai korelasi
tinggi
2. KD baik apabila nilai korelasi
rendah
-
2014 Dr. Ferlis bin Bullare @ Bahari
C. KEBOLEHPERCAYAAN (RELIABILITY)
C1 Pengenalan
1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada pengukuran atau instrumen yang digunakan oleh pengkaji terhadap
sesuatu konstruk teorinya.
2. Menurut Carmines dan Zeller (1979), kebolehpercayaan ialah sejauhmana satu uji kaji, ujian atau prosedur kajian apabila
diulangkan akan memberikan keputusan yang sama.
3. Ia juga merujuk kepada ketekalan dalam pengukuran berkenaan sesuatu set data yang diperoleh.
4. Kerlinger (1973) menyatakan bahawa ujian yang amat tinggi kebolehpercayaannya mempunyai ciri-ciri stabiliti, konsistensi,
keramalan dan ketepatan.
Contoh 1 : Apabila rakan rapat anda mempunyai sikap dan tabii yang konsisten, tepat dan dapat diramalkan, anda akan
menganggap rakan anda itu boleh dipercayai.
Contoh 2 : Jam sebagai ukuran masa. Jika sebuah jam itu sentiasa memberikan waktu yang tepat, tekal dan stabil, kita yakin
akan tahap kebolehpercayaan jam tersebut sebagai pengukur
masa.
5. Satu pengukur yang mempunyai tahap kebolehpercayaan yang tinggi akan mempunyai ralat yang kecil (tiada langsung). Lebih kecil ralat,
maka lebih tinggi tahap kebolehpercayaan sesuatu pengukur atau
alat ujian/kajian.
Misalnya dalam ujian A (jam tangan A), kita akan dapati bahawa ralatnya ialah 10% sahaja, sementara dalam ujian B (jam tangan
-
2014 Dr. Ferlis bin Bullare @ Bahari
B), kita akan dapati ralatnya ialah 40%. Ini bermakna bahawa
sekali dalam 10 kali, jam tangan A tidak akan menunjukkan
waktu yang tepat, manakala bagi jam tangan B, 4 kali dalam 10
kali jam tangan itu akan memberikan waktu yang salah. Kita
akan lebih mengharapkan jam A daripada jam tangan B.
6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan sesuatu alat ujian boleh dipertingkat dengan beberapa cara iaitu:
Pernyataan item yang tepat dan jelas
Item-item yang digunakan hendaklah homogenous
Arahan-arahan ujian mestilah jelas, ringkas dan padat
Mengelakkan gangguan semasa subjek menjawab ujian
Pengumpulan data dilakukan dalam keadaan yang piawai, serupa dan terkawal.
7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item bagi mengukur kepuasan perkahwinan di kalangan responden ibu
etnik Rungus, Sabah. Item-item tersebut dibahagikan kepada dua
item positif dan dua item negatif seperti berikut:
V1 Saya berpuas hati dengan perkahwinan saya (+)
V2 Saya tidak berpuas hati dengan suami saya (-)
V3 Saya berpuas hati dgn kasih sayang yang suami saya berikan (+)
V4 Saya tidak berpuas hati dgn layanan yang suami saya berikan (-)
-
2014 Dr. Ferlis bin Bullare @ Bahari
8. Jawapan bagi item positif dan negatif yang boleh dipilih oleh responden berdasarkan Jadual 9.1 berikut:
Jadual 9.1 Skor Bagi Item Positif dan Negatif
Item Positif (+) Item Negatif (-)
5 = Sangat Setuju 5 = Sangat Tidak Setuju
4 = Setuju 4 = Tidak Setuju
3 = Tidak Pasti 3 = Tidak Pasti
2 = Tidak Setuju 2 = Setuju
1 = Sangat Tidak Setuju 1 = Sangat Setuju
Nota: Recode boleh dibuat pada program SPSS
9. Kebolehpercayaan sesuatu alat ujian boleh diukur melalui tiga cara iaitu:
C2 Jenis Kebolehpercayaan
C2.1 Ketekalan/Kebolehpercayaan Luaran
1. Kaedah Uji-Uji Kembali (Test-Retest)
Sesuatu ujian/soal selidik diberikan kepada responden yang sama pada dua masa berlainan. Contohnya, ujian/soal selidik
diberikan pada hari ini, dan kemudian ujian/soal selidik yang
sama diberikan semula seminggu kemudian kepada
responden yang sama. Ujian korelasi dilakukan dan semakin
tinggi korelasi antara dua ujian/soal selidik ini, maka semakin
boleh dipercayai ujian/soal selidik tersebut.
Dalam kebolehpercayaan Uji-Uji Kembali, ujian yang sama diberikan semula kepada subjek yang sama selepas satu
jangkamasa tertentu. Jangkamasa yang diberikan boleh jadi
-
2014 Dr. Ferlis bin Bullare @ Bahari
daripada beberapa minit kepada beberapa tahun (Brown,
1976).
Bila reliabiliti ujian semula ini dilaporkan di dalam test manual, jarak masa yang digunakan mestilah dinyatakan.
Korelasi ujian kembali akan menjadi rendah jika jarak masa
terlalu lama. Perkara ini terjadi disebabkan oleh beberapa
angkubah lain seperti umur, kematangan dan pembelajaran
yang mungking mempengaruhi subjek (Anastasi, 1968).
Di samping itu pekali kebolehpercayaan juga akan menjadi tinggi jika jangka masa yang digunakan terlalu singkat kerana
individu itu masih dapat mengingati kembali jawapan pada
item-item yang tertentu (Mehrens & Lehmann, 1978).
Namun begitu, kelesuan dan jemu pada satu ujian itu juga mungkin mempengaruhi prestasi subjek untuk menjawab ujian
yang diberikan dan akibatnya reliabiliti akan menjadi rendah.
Mohd Majid Konting (1990) menyatakan kaedah test-retest merupakan kaedah bagi mendapatkan dua set markat dengan
mentadbir alat ukur yang sama ke atas subjek yang sama
sebanyak dua kali. Skor-skor yang diperoleh pada
pengukuran pertama dan pengukuran kedua dikorelasikan.
Pengkaji mengandaikan responden dapat mencapai keputusan yang sama dalam ujian pertama dan kedua. Sekiranya kedua-
dua skor dalam ujian pertama dan kedua itu mempunyai
korelasi yang tinggi, menunjukkan alat pengukuran (alat
ujian/soal selidik) itu mempunyai kebolehpercayaan yang
tinggi.
Contoh 1 : Mesin pemberat untuk mengukur berat badan A. Dua hari kemudian kita ukur semula berat A. Kita berharap
mendapatkan ukuran yang sama jika pengukur (mesin
pemberat) adalah dalam keadaan yang sama. Masalah yang
timbul ialah jika kita ulangi pengukuran ini 4 bulan kemudian,
mungkin A telah mengurangkan berat badannya dengan
-
2014 Dr. Ferlis bin Bullare @ Bahari
berdiet, maka berat badannya akan lebih ringan berbanding
permulaannya. Ini tidak bermakna mesin mengukur berat
badan yang salah, tetapi yang telah berubah ialah berat badan
A.
Contoh 2 : Soalan bertanyakan tarikh lahir responden B dan jawapannya ialah 30 November 1947, maka pada ujian yang
kedua kita menanyakan soalan sama, sudah tentu kita akan
mendapat jawapan yang sama. Masalahnya ialah, jika
ditanya pada waktu lain, responden lupa bila tarikh lahirnya,
maka soalan yang kita reka sebagai pengukur bukanlah salah.
Yang silap ialah jawapan responden.
TUGASAN 7: Uji kebolehpercayaan uji-uji kembali
IKSOKU-F dengan menggunakan korelasi Pearson.
2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)
Dalam ujian ini, pengkaji mempunyai dua ujian (2 bahagian soal selidik), tetapi kedua-duanya mengukur perkara yang
sama. Ia ditadbir ke atas kumpulan orang/ responden yang
sama bagi mendapat hubung kait antara dua ujian.
Mohd Majid Konting (1990) menyatakan bahawa kaedah ini menggunakan satu alat ukur yang dibina dan satu alat ukur
yang piawai. Kedua-dua alat ukur tersebut adalah setara dari
segi kandungannya tetapi mungkin berbeza dari segi
penyampaian. Kedua-dua alat ukur ditadbir pada subjek yang
sama dan skor yang diperoleh daripada kedua-dua alat ukuran
itu dikorelasikan.
-
2014 Dr. Ferlis bin Bullare @ Bahari
Perkara yang sama seperti dilakukan dalam prosedur test-retest. Cuma perkataan dan susunan item dalam alat
ujian/soal selidik ditukar supaya nampak berbeza namun
isinya tetap sama.
Sekiranya korelasi yang dicatat tinggi, maka alat ujian/soal selidik itu boleh dipercayai.
Masalah yang dihadapi ialah untuk menentukan supaya kedua-dua ujian tersebut mengukur fenomena yang sama.
C2.2 Ketekalan Dalaman (Internal Consistency)
1. Menurut Brown (1984), analisis kebolehpercayaan
ketekalan dalaman merujuk kepada sejauh mana item-
item dalam sesuatu ujian saling berhubung kait. Ini
bermakna semakin tinggi korelasi antara item, semakin
tinggi kebolehpercayaan item itu.
2. Ketekalan dalaman berhubung kait dengan korelasi
purata antara item. Sesuatu ujian dikatakan seragam
sekiranya skor bagi keseluruhan item dalam ujian
tesebut adalah berkorelasi positif.
3. Bagi memaksimumkan korelasi antara item ini,
kepayahan item sepatutnya adalah sama. Jika dua item
mengukur tingkah laku yang sama tetapi berbeza dalam
kepayahan masing-masing, kedua-dua item ini
-
2014 Dr. Ferlis bin Bullare @ Bahari
dikatakan mempunyai korelasi antara item yang sangat
rendah.
4. Secara umumnya, boleh dikatakan bahawa
kebolehpercayaan sesuatu ujian itu sangat berhubung
kait dengan darjah kepayahan iaitu pelbagai item dalam
sesuatu ujian adalah berkorelasi di antara satu sama
lain.
5. Kebolehpercayaan sesuatu ujian dijelaskan sebagai satu
nombor perpuluhan positif yang melingkungi sifar
(0.00) hingga satu (1.00). Nilai 1.00 menunjukkan
kebolehpercayaan yang sempurna. Manakla 0.00
menunjukkan ketiadaan nilai kebolehpercayaan
(Aiken, 1988).
6. Anastasi (1982) menyatakan bahawa pekali
kebolehpercayaan yang memuaskan dan tinggi adalah
di antara 0.70 dan 0.90. Kaplan dan Succuzoo (2001)
pula mencadangkan nilai kebolehpercayaan dalam
lingkungan 0.70 hingga 0.80 adalah cukup baik untuk
kebanyakan penyelidikan.
7. Kerlingger (1973) berpendapat nilai kebolehpercayaan
yang tinggi ialah 0.80.
8. Terdapat pelbagai kaedah yang boleh digunakan untuk
mengukur ketekalan dalaman seperti kaedah pekali alfa
-
2014 Dr. Ferlis bin Bullare @ Bahari
Cronbach, Split Half, dan analisis varians ukuran
berulang Hoyt.
1. Alfa Cronbach
1. Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah satu
teknik yang digunakan untuk menganggarkan kebolehpercayaan
ketekalan dalaman.
2. Ianya digunakan dalam situasi di mana format jawapan adalah lebih
daripada alternatif misalnya pilihan jawapan betul atau salah.
3. Alfa yang disarankan oleh Cronbach dan rakan-rakan (1955) boleh
digunakan untuk melihat kebolehpercayaan ketekalan dalaman dan
keseragaman item bagi sesuatu ujian.
4. Anastasi (1982) menyatakan bahawa pekali Cronbach merupakan
satu kaedah kebohpercayaan ketekalan dalaman sesuatu alat ukuran
yang menggunakan jawapan tidak dikotomi. Kaedah ini sesuai
digunakan bagi alat ukuran yang mempunyai skala jawapan lebih
daripada dua seperti skala likert. Formula pekali alfa Cronbach
adalah seperti berikut:
1
N Sa SiCr
N Sa
Di mana,
Cr = pekali alfa
N = jumlah item dalam ujian
-
2014 Dr. Ferlis bin Bullare @ Bahari
Sa = varians alat ukuran
Si = varians item
TUGASAN 8: Uji kebolehpercayaan ketekalan dalaman Cronbach
alfa IKSOKU-F.
2. Berbahagi-Dua (Split-Half)
1. Menurut Anastasi (1982) kaedah split-half merupakan kaedah yang
digunakan untuk melihat kebolehpercayaan dengan membahagikan
item-item kepada dua bahagian dan mengkorelasikan item-item di
antara kedua-dua bahagian masing-masing dengan menggunakan
kaedah indeks ketekalan dalaman.
2. Kaedah bahagi dua dilakukan dengan menggunakan statistik pekali
korelasi Pearson dan diperbaiki dengan menggunakan formula
Spearman Brown (Anastasi, 1982).
3. Pembahagian juga boleh dibahagikan dengan dua cara. Pertama
ialah apabila ujian adalah panjang maka ujian tersebut dibahagikan
kepada dua bahagian. Cara pertama ini mungkin akan
menimbulkan masalah akibat kesukaran membezakan item antara
dua bahagian.
4. Bagi mengatasi masalah ini, cara kedua perlu diaplikasikan iaitu
dengan membahagikan ujian kepada dua berdasarkan nombor ganjil
dan nombor genap soal selidik (Kaplan & Saccuzzo, 1993; Murphy
& Davidshofer, 1991). Formula split half adalah sperti berikut:
-
2014 Dr. Ferlis bin Bullare @ Bahari
2
1
RR
r
Di mana,
R = kebolehpercayaan keseluruhan item dalam ujian
r = korelasi antara item bernombor ganjil dan genap
5. Jika diteliti split half ini hanya merupakan sebahagian daripada
keseluruhan ujian. Jadi, keseluruhan kebolehpercayaan sesuatu alat
ujian itu perlu diubahsuai dengan formula Spearman-Brown (1910)
seperti di bawah:
'
'1 1
llll
ll
nrr
n r
Di mana,
rII = estimate coefficient
nrII = korelasi yang telah diperolehi daripada dua split-half
n = berapa kali item-item itu telah dibahagikan daripada jumlah item-item
secara keseluruhannya.
6. Korelasi antara dua bahagian itu dinamakan correlation between forms.
Pekali yang dinamakan equal length Spearman-Brown memberi anggaran kebolehpercayaan skel lapan item
seandainya skel tersebut terbina daripada dua bahagian sama
panjang.
Satu cara lagi untuk mengukur kebolehpercayaan ialah dengan mengira pekali Guttman split-half yang kebetulannya boleh
dilakukan serentak dalam satu prosedur.
-
2014 Dr. Ferlis bin Bullare @ Bahari
7. TUGASAN 9: Uji kebolehpercayaan ketekalan dalaman Split-
Half IKSOKU-F.
Kuder-Richardson (KR)
1. Kaedah ini berasaskan sisihan piawai alat ukur dan sisihan piawai item-item yang berlainan.
2. Pekali kebolehpercayaan melalui kaedah ini juga dikenali sebagai alfa Cronbach.
3. Menurut Sidek Mohd Noah (1990) dan Tuckman (1978), apabila item-item ujian yang dibina mempunyai skor sama ada A atau B,
Salah atau Betul, Ya atau Tidak pada suatu ujian, kaedah ini sesuai
digunakan.
Menggunakan kaedah ini, skor yang diperolehi dari setiap item akan dikorelasikan dengan skor keseluruhan item.
C2.3 Kebolehpercayaan interrater/interscorer
1. Sesuatu kajian kadangkala perlukan rater atau pakar bagi membuat penilaian ke atas sesuatu fenomena. Oleh kerana data yang
diperoleh mungkin melibatkan pemerhatian, pengkategorian
ataupun temubual, maka pengkaji perlu memastikan sejauh mana
tekalnya jawapan atau maklum balas yang mereka berikan.
2. Sebagai contoh, adakah ketekalan dalam ujian memastikan sama ada 10 jenis air yang diminum itu panas, suam ataupun biasa.
Mungkin 5 orang akan diminta menilai. Sejauhmana tekal dan
sama jawpan yang diberikan merupakan kebolehpercayaan
interrater.
-
2014 Dr. Ferlis bin Bullare @ Bahari
D. ANALISIS ITEM
D1. Pengenalan
1. Analisis item ialah satu kaedah yang digunakan bagi menilai kualiti
item-item alat ujian dengan menggunakan beberapa cara
berdasarkan sifat yang ingin dikaji.
2. Analisis item bertujuan untuk memperbaiki sesuatu ujian dengan
menyemak dan menggugurkan item-item yang tidak berkenaan
(Aiken 1988).
3. Alat pengukuran yang baik adalah alat pengukuran berkualiti yang
didakwa sesuai bagi mengukur perkara yang ingin diuji. Bagi
menghasilkan item yang baik dalam alat ujian, ahli psikometrik
biasanya akan menjalankan proses pemilihan item bagi memastikan
item-item yang berjaya menjadi ujian yang terakhir adalah item-item
yang dianggap berkualiti untuk mengukur sesuatu trait yang hendak
diukur.
4. Menurut Aiken (1988), analisis item yang baik dapat memberi
maklumat mengapa sesuatu alat ukuran itu tidak boleh dipercayai
atau gagal menunjukkan tahap kesahan yang dijangkakan.
5. Analisis item juga dapat menunjukkan mengapa ukuran itu boleh
dipercayai dan dapat digunakan sebagai peramal kepada sesuatu
kriteria tetapi tidak kepada kriteria pengukuran (Murphy &
Davidshofer, 1988).
-
2014 Dr. Ferlis bin Bullare @ Bahari
6. Hasil dari analisis item dapat memberi satu petunjuk apakah ukuran
itu dapat difahami oleh sampel kajian (Iran Herman, 1988).
7. Murphy dan Davidshofer (1988) menyatakan bahawa sesuatu
kriteria dapat diramal dan dijangka oleh analisis item tetapi
sesetengah pula tidak dapat diramal.
8. Allen dan Yen (1982) menyatakan bahawa sesuatu alat yang baik
dan sesuai harus mengalami satu proses analisis item bagi
memastikan hanya item-item yang baik sahaja yang dapat dijadikan
edisi ujian. Ini adalah penting untuk membuat kesimpulan
keputusan dalam menentukan sama ada ukuran itu sah atau tidak
sah.
9. Anastasi (1982) menyatakan bahawa analisis item dapat
memendekkan ujian dan pada masa yang sama meningkatkan
kebolehpercayaan dan kesahan alat ujian tersebut.
10. Wolman (1973) berpendapat bahawa analisis item adalah
sesuatu penentu kepayahan, kemampuan mendiskriminasi,
ketekalan dalaman dan kebolehpercayaan item-item di dalam ujian.
Ia juga merupakan penentu kesahan item.
-
2014 Dr. Ferlis bin Bullare @ Bahari
D2. Indeks Kepayahan Item
1. Kepayahan item didefinisikan sebagai kebolehan individu menjawab
betul sesuatu item (Anastasi, 1982). Sesuatu item yang senang akan
menghasilkan peratus jawapan yang tinggi. Item yang terlalu susah
pula akan menunjukkan nilai peratus jawapan betul yang rendah.
2. Kedua-dua keadaan tersebut sama ada item yang terlalu senang dan
terlalu susah adalah bentuk item yang kurang baik untuk dijadikan
ujian terhadap sesuatu tret.
3. Sesuatu item ujian yang baik dan ideal diperolehi sekiranya jawapan
dapat menunjukkan 50% jawapan betul dan 50% jawapan salah.
D3. Indeks Kebolehpercayaan Item
1. Indeks Kebolehpercayaan item melihat fungsi keperbezaan dan
serakan markat item dan juga korelasi di antara markat item dengan
keseluruhan ujian. Secara formula indeks ini ialah hasil darab di
antara item dengan markat keseluruhan. Jumlah keseluruhan
markat dianggap sebagai kriteria dalam sesuatu item. Formulanya
adalah berikut:
kl i itI SP r
-
2014 Dr. Ferlis bin Bullare @ Bahari
Di mana,
Iki = indeks kebolehpercayaan item
spi = sisihan piawai item.
rit = korelasi item dengan keseluruhan item.
D4. Indeks Kesahan Item
1. Indeks kesahan item diperolehi dengan mengkorelasikan markat
item dengan markat pembolehubah kriterium (ric). Indeks kesahan
item adalah hasil darab sisihan piawai item sebagai petunjuk
keperbezaan dan serakan dengan korelasi item dengan kriterium.
Formulanya adalah seperti berikut:
icISi SP r
Di mana
Isi = Indeks Kesahan item
Spi = Sisihan piawai item
ric = Korelasi item dengan kriterium.