artikel 17 kesahan dan kebolehpercayaan intrumen kajian _ coretan pemikiran

4/6/2015 Artikel 17 Kesahan dan Kebolehpercayaan Intrumen Kajian | CORETAN PEMIKIRAN

http://kamaruzamanmoidunny.blogspot.com/2013/07/artikel17kesahandankebolehpercayaan.html 1/13

29th July 2013

KESAHAN DAN KEBOLEHPERCAYAAN INSTRUMEN KAJIAN

Kamaruzaman Moidunny, PhDJabatan Pembangunan Pengurus, Pemimpin dan Eksekutif Pendidikan

Institut Aminuddin Baki, Genting Highlands

Pengenalan

Kertas penulisan ini akan membincangkan konsep kesahan dan kebolehpercayaansebagaimana yang dialami oleh penulis dalam menyiapkan kajian dengan judul KeberkesananProgram Kelayakan Profesional Kepengetuaan Kebangsaan (NPQH) (Kamaruzaman, 2009) yangmelibatkan soal selidik, ujian pencapaian, Program Sandaran dan temu bual. Definisi kesahan dankebolehpercayaan sebagaimana yang dikemukakan oleh pakarpakar penyelidikan diutarakan olehpenulis dengan memberikan contoh yang relevan, agar mudah difahami oleh pembaca. Adalahdiharapkan dengan penulisan ini, dapat memberikan gambaran yang lebih jelas kepada pembacatentang bagaimana usaha dijalankan untuk menentukan kesahan dan kebolehpercayaan sesuatuinstrumen.

Kesahan Soal Selidik

Kesahan sesuatu instrumen merujuk kepada sejauh manakah sesuatu instrumen mengukur apa yangsepatutnya diukur (Alias 1992; Creswell 2002, 2005, 2010; Pallant 2001; Siti Rahayah 2003; Tuckman1999). Sesuatu instrumen tersebut dikatakan mempunyai kesahan yang tinggi jika darjahkebolehannya mengukur apa yang sepatutnya diukur adalah tinggi (Mohd Majid 1990).

Soal selidik dan soalan temu bual yang dibina oleh seseorang pengkaji perlu diuji kesahanmuka dan kesahan kandungannya. Sebagai contoh, seramai lima orang pensyarah kanan InstitutAminuddin Baki (IAB) dirujuk untuk mendapatkan pengesahan tentang kesahan muka dan kesahankandungan bagi soal selidik dan temu bual. Soal selidik dan temu bual ini terdapat dalam kajiandengan judul, Keberkesanan Program Kelayakan Profesional Kepengetuaan Kebangsaan (NPQH)(Kamaruzaman, 2009).

Kesahan konstruk sesuatu soal selidik pula boleh diukur dengan menggunakan nilai korelasiantara skor setiap item dengan jumlah skor berkenaan. Hal ini dapat dilakukan dengan menggunakananalisis korelasi Pearson antara skor setiap item dengan jumlah skor mengikut konstruk yangberkenaan. Kaedah ini adalah bersesuaian dengan teori yang dikemukakan oleh Abu Bakar (1987)dan Nunnally (1967). Menurut Abu Bakar (1995) pula, nilai pekali korelasi yang minimum dan bolehditerima pakai adalah 0.30. Manakala Nunally (1967, 1978) serta Nunally dan Bernstein (1994)menyatakan bahawa nilai korelasi antara item dengan jumlah skor yang melebihi 0.25 adalah dianggaptinggi.

Bagi Cohen (1988), nilai pekali korelasi antara 0.10 hingga 0.29 dianggap kecil, nilai pekalikorelasi antara 0.30 hingga 0.49 dianggap sederhana dan nilai pekali korelasi antara 0.50 hingga1.00 dianggap sebagai tinggi. Bagi Norusis (1977) pula, kesahan sesuatu instrumen boleh dilihat padanilai korelasi item yang diperbetulkan dengan jumlah skor (Corrected ItemTotal Correlation) iaitu

Artikel 17 Kesahan dan Kebolehpercayaan IntrumenKajian

http://kamaruzamanmoidunny.blogspot.com/2013/07/artikel-17-kesahan-dan-kebolehpercayaan.html

http://kamaruzamanmoidunny.blogspot.com/2013/07/artikel-17-kesahan-dan-kebolehpercayaan.html



pekali korelasi Pearson antara skor setiap item dengan jumlah skor tanpa item berkenaan.

Dalam konteks kajian tersebut, penulis telah menggunakan dua kaedah untuk menentukankesahan konstruk soal selidik iaitu (1) Menggunakan nilai korelasi antara skor setiap item denganjumlah skor, dan (2) Menggunakan nilai korelasi item yang diperbetulkan dengan jumlah skor(Corrected ItemTotal Correlation). Penulis juga akan merujuk kepada kurikulum Program LatihanNPQH untuk menentukan kesahan konstruk.

Bagi itemitem ujian pencapaian dan skima permarkahan Program Sandaran penulismenggunakan khidmat tiga orang pakar dalam bidang pengurusan dan kepimpinan. Komen danteguran yang diterima daripada pakarpakar ini diambil kira dan diguna pakai bagi memantapkan lagimaksud, bahasa dan kandungan soal selidik dan soalan temu bual yang akan digunakan. Di sampingitu, komen dan teguran digunakan dalam menilai itemitem yang digunakan dalam ujian dan skimapermarkahan Program Sandaran.

Kebolehpercayaan Soal Selidik

Kebolehpercayaan pula seringkali dirujuk untuk menggambarkan kestabilan dan ketekalan dalaman(Creswell 2002, 2005, 2010; Pallant 2001; Sekaran 1992). Nilai Cronbach Alpha pula seringkali dirujuksemasa pengukuran ketekalan dalaman sesuatu konstruk (Cronbach 1946; Norusis 1977). NilaiCronbach Alpha yang melebihi 0.60 sering kali diguna pakai sebagai indeks kebolehpercayaan sesuatuinstrumen (Mohd Majid 1990; Pallant 2001; Siti Rahayah 2003). Bagi Sekaran (1992) pula, nilaikebolehpercayaan yang kurang daripada 0.60 adalah dianggap rendah dan tidak boleh diterima, nilaiAlfa antara 0.60 hingga 0.80 adalah diterima manakala nilai Alfa yang melebihi 0.80 adalah dianggapbaik. Berdasarkan penerangan di atas, penulis telah menggunakan nilai Cronbach Alpha bagimenentukan kebolehpercayaan soal selidik.

Kesahan dan Kebolehpercayaan Ujian

Bagi kes di IAB, ujian pencapaian (Ujian Akhir Kursus – UAK) yang berbentuk item berbentuk objektifseringkali digunakan. Itemitem ini berbentuk aneka pilihan atau aneka penlengkap dengan empatpilihan jawapan iaitu A, B C atau D. Manakala dalam Program Sandaran, memfokuskan kepada (1)Pengenalpastian masalah, (2) Perancangan strategik, (3) Pelaksanaan dan penilaian strategik, serta(4) Kualiti peribadi. Skorskor diberikan oleh pensyarahpensyarah apabila mereka menyemak hasilkerja peserta Program Sandaran. Kesahan itemitem yang digunakan dalam ujian pencapaian danProgram Sandaran ditentukan dengan membuat analisis item. Analisis item akan dilakukan untukmembezakan item yang baik dengan item yang lemah. Dalam konteks kajian tersebut, semua itemujian pencapaian dan Program Sandaran telahpun dibina oleh IAB.

Analisis item bagi setiap ujian dan Program Sandaran dilaksanakan dengan menentukanIndeks Kesukaran (Facility Index, F) dan Indeks Pembezaan (Discrimination Index, D) seperti yangdisarankan oleh Macintosh dan Morrison (1969). Wood (1961) menyatakan bahawa kesukaran itemmerujuk kepada pecahan yang mendapat jawapan yang betul. Semakin besar indeks kesukaran, itemitu semakin senang. Bagi aras kesukaran yang baik, nilai F berada di antara 40 peratus hingga 60peratus iaitu 0.4 hingga 0.6. Nilai F yang tinggi menunjukkan item mempunyai aras kesukaran yangrendah iaitu soalansoalan adalah senang. Nilai F yang rendah menunjukkan item mempunyai araskesukaran yang tinggi iaitu soalansoalan yang dikemukakan kepada peserta adalah sukar. Macintoshdan Morrisson (1969), menyatakan bahawa item dengan nilai F yang rendah boleh dibaiki. Jadual 1 dibawah ini menjelaskan aras kesukaran (F) dan indeks pembezaan (D) sebagaimana yangdikemukakan oleh Macintosh dan Morrisson (1969).



Jadual 1: Aras Kesukaran dan Indeks Pembezaan

Aras Kesukaran (F)Indeks Pembezaan

(D)Kurangdaripada40 %

40 %hingga60 %

Lebihdaripada60 %

Lebih daripada 0.40 Sukar Diterima Senang0.30 – 0.39 Sukar Perlu dibaiki Senang0.20 – 0.29 Sukar Marginal SenangKurang daripada 0.20 Dibuang Dibuang Dibuang

Sumber: Macintosh dan Morrisson (1969): 67

Indeks Pembezaan, D, pula digunakan untuk membezakan antara kumpulan peserta yangmemperolehi skor tinggi dengan kumpulan peserta yang memperolehi skor rendah. IndeksPembezaan, D, mempunyai nilai antara – 1.00 hingga + 1.00. Nilai D yang negatif menunjukkan itemtersebut gagal membezakan kumpulan peserta yang memperolehi skor tinggi dengan yangmemperolehi skor rendah. Jika nilai D bersamaan dengan 1.00, ini menunjukkan bahawa 27 peratusdaripada kumpulan yang memperolehi skor tinggi berjaya memberi jawapan betul dan 27 peratusdaripada kumpulan yang memperolehi skor rendah memberi jawapan salah. Manakala jika nilai Dbersamaan dengan sifar, menunjukkan keduadua kumpulan peserta memberi jawapan yang serupabagi item berkenaan. Ini bermaksud bahawa item tersebut gagal membezakan antara kumpulanpeserta yang memperolehi skor tinggi dengan memperolehi skor rendah. Bagi Sax dan Newton (1997),nilai D antara 0.10 hingga 1.00 menggambarkan bahawa item tersebut boleh diguna pakai. SementaraEbel (1979) pula menyatakan bahawa nilai D yang bersamaan atau lebih besar daripada 0.20 adalahsesuai bagi item ujian.

Bagi konteks kajian tersebut, penulis telah menggunakan item yang mempunyai nilai D yangbersamaan atau lebih besar daripada 0.20 seperti yang disarankan oleh Ebel (1979). Sementara baginilai F pula, penulis telah menggunakan semua item yang dianalisis untuk mengelakkan kekuranganitem bagi setiap konstruk yang dikaji. Dengan kata lain, item yang dipilih akan melibatkan item sukar,marginal dan senang seperti yang ditunjukkan dalam Jadual 1. Dalam hal ini, penulis menghadapikesukaran untuk memilih item yang mempunyai nilai F antara 0.40 dengan 0.60 (Nunally 1978). Iniadalah kerana nilai F tidak mampu dikawal oleh penulis kerana semua item dibina oleh pihak IAB dantelah ditadbirkan kepada peserta Program Latihan NPQH. Oleh itu penulis berpendapat, pemilihansemua item yang mempunyai nilai D bersamaan atau lebih besar daripada 0.20 merupakan langkahpaling baik bagi kajian tersebut .

Selepas menentukan nilainilai F dan D, kebolehpercayaan ujian pencapaian dan ProgramSandaran dihitung dengan menggunakan rumus KuderRichardson 20 (KR20). Bagi Siti Rahayah(2003) dan Yap et al. (1985), rumus KuderRichardson digunakan untuk mengelakkan memberi ujiansebanyak dua kali dan mengelakkan masalah membahagi ujian kepada dua bahagian. Rumus iniboleh digunakan bagi ujian yang homogen iaitu setiap item ujian mengukur faktorfaktor kebolehan amatau personaliti yang sama. Bagi Yap et al. (1985), rumus KuderRichardson ini bergantung kepadakonsistensi prestasi individu daripada satu item ke satu item iaitu berdasarkan sisihan piawai ujian.

Nilai KR20 adalah antara sifar (0) hingga 1.00, walaupun nilai negatif adalah mungkin. Nilai KR20 yang tinggi menunjukkan ujian mempunyai ketekalan dalaman. Bagi Carey (1994), nilai yangmelebihi 0.90 menunjukkan kebolehpercayaan yang sangat tinggi. Nilai yang hampir dengan 0.80



adalah biasa didapati untuk ujian bilik darjah kepada peserta heterogen. Manakala nilai serendah 0.50biasa didapati bagi kumpulan pesertapeserta homogen. Sementara bagi Ebel (1979), nilai KR20 0.50atau kurang adalah nilai yang biasa didapati bagi ujian pencapaian di sekolah rendah, menengah atauuniversiti. Bagi Carey (1994), nilai KR20 bergantung kepada kehomogenan kumpulan, kehomogenankandungan, panjang ujian dan kesukaran item. Seterusnya Ebel (1979) pula menambah bahawa untukmenjadikan kebolehpercayaan ujian meningkat daripada 0.50 ke 0.90, ujian perlu lebih panjangsebanyak sembilan kali daripada panjang asal.

Kesahan dan Kebolehpercayaan Soal Selidik

Satu contoh hasil analisis yang telah dibuat untuk menentukan kesahan dan kebolehpercayaan soalselidik dipaparkan dalam Jadual 2 seperti yang ditunjukkan di bawah ini. Kesahan item soal selidikmenggunakan nilai (1) Korelasi antara skor setiap item dengan jumlah skor, dan (2) Korelasi itemyang diperbetulkan dengan jumlah skor (Corrected ItemTotal Correlation). Manakala nilai CronbachAlpha digunakan bagi mendapatkan indeks kebolehpercayaan setiap aspek atau konstruk berkenaan.Jadual 2 menunjukkan bahawa konstruk penyampaian pensyarah mempunyai nilai korelasi skor itemdengan jumlah skor antara 0.73 hingga 0.88. Manakala nilai korelasi item yang diperbetulkan denganjumlah skor (Corrected ItemTotal Correlation) adalah antara 0.65 hingga 0.85. Nilai Cronbach Alphapula adalah 0.92.

Jadual 2: Nilai korelasi dan Alfa bagi konstruk Penyampaian Pensyarah

Konstruk Item KorelasiSkor Itemdengan

Jumlah Skor

Korelasi Itemyang

Diperbetulkandengan

Jumlah Skor

Nilai Alfa jikaitem

digugurkan

Nilai AlfaKeseluruhan

PenyampaianPensyarah

2829303132333435

0.840.790.800.880.730.840.770.82

0.780.720.740.850.650.800.690.75

0.910.920.920.910.920.910.920.91

0.92

Jadual 2 menunjukkan (1) Nilai korelasi skor item dengan jumlah skor dan (2) Nilai korelasi itemyang diperbetulkan dengan jumlah skor (Corrected ItemTotal Correlation) adalah melebihi 0.30. Hal inimemberikan kesimpulan bahawa item mempunyai nilai kesahan yang tinggi sebagaimana yangdisarankan oleh Abu Bakar (1987), Cohen (1988), Norusis (1977) dan Nunally (1987). Sementara itu,nilai Cronbach Alpha adalah melebihi 0.60 yang memberikan kesimpulan bahawa item mempunyaikestabilan dan ketekalan dalaman yang baik (Cresswell 2005, 2010; Pallant 2001; Sekaran 1992). NilaiCronbach Alpha ini merumuskan bahawa item mempunyai kebolehpercayaan yang baik dan bolehdiguna pakai seperti yang dinyatakan oleh Mohd Majid (1990), Pallant (2001), Sekaran (1992) dan SitiRahayah (2003).

Kesahan dan Kebolehpercayaan Ujian Pencapaian

Sebanyak 450 item ditadbirkan oleh IAB kepada semua peserta program latihan NPQH daripadaambilan pertama hinggalah ambilan kesepuluh. Item ini ditadbirkan melalui empat fasa kursus yangmengandungi lima kertas ujian. Terdapat dua kertas ujian dalam Fasa Asas dan satu kertas ujian bagi



tiga fasa kursus berikutnya. Dan bagi memilih item yang sesuai dalam kajian tersebut, penulis telahmelaksanakan proses yang dinamakan sebagai analisis item.

Analisis item telah dibuat terhadap 450 item iaitu bagi ujian Fasa Asas Kertas 1 (75 item), FasaAsas Kertas 2 (75 item), Fasa Pertengahan (100 item), Fasa Khas (100 item) dan Fasa Berterusan(100 item). Analisis item dilaksanakan untuk menentukan Indeks Kesukaran (Facility Index, F) danIndeks Pembezaan (Discrimination Index, D) dalam usaha menentukan kesahan konstruk setiap item.Rumus yang digunakan dalam analisis ini ditunjukkan dalam Lampiran J dan K. Sehubungan denganitu, cuma item yang mempunyai nilai D bersamaan atau melebihi 0.20 serta item yang mempunyai nilaiF bersamaan atau melebihi 40 peratus sahaja dipilih oleh penulis untuk analisis seterusnya sepertiyang disarankan oleh Macintosh dan Morrisson (1969). Manakala bagi menentukan kebolehpercayaansetiap item, nilai KuderRichardson 20 (KR20) bagi setiap konstruk dihitung seperti yang disarankanoleh Carey (1994).

Oleh kerana semua ujian pencapaian dalam Program Latihan NPQH ini dilaksanakan secaratertutup, IAB tidak membenarkan sebarang item dipaparkan untuk tatapan umum. Oleh itu penulistelah menggunakan kod bagi setiap item yang dipilih. Sebagai contoh, Jadual 3 di bawah ini akanmemaparkan hasil analisis item yang telah dilaksanakan bagi item ujian pencapaian.

Jadual 3 di bawah menunjukkan konstruk Pengurusan dan Kepimpinan Organisasi yangmempunyai nilai F antara 41 peratus hingga 79 peratus, nilai D antara 0.21 hingga 0.54 dan nilai KR20adalah 0.65. Bagi konstruk ini, terdapat 25 item yang terdiri daripada item yang dikemukakan dalamFasa Asas Kertas 1 (lapan item), Fasa Berterusan (14 item) dan Fasa Pertengahan (tiga item).

Jadual 3: Nilai F, D dan KR20 bagi konstruk Pengurusan dan Kepimpinan Organisasi

Konstruk Bil Kod ArasKesukaran

(F)/%

IndeksPembezaan

(D)

Nilai KR20(r)

Pengurusan danKepimpinan

1 AS04 76 0.21 0.65

Organisasi 2 AS20 53 0.333 AS25 53 0.374 AS33 77 0.305 AS35 59 0.496 AS46 54 0.257 AS47 59 0.218 AS53 73 0.219 BT07 60 0.4410 BT10 79 0.2611 BT11 74 0.3012 BT16 59 0.2113 BT17 47 0.2314 BT18 57 0.2315 BT19 75 0.3316 BT20 42 0.2517 BT22 41 0.2118 BT23 66 0.2819 BT24 43 0.5420 BT25 45 0.3021 BT26 49 0.32



22 BT27 64 0.2523 PT02 53 0.3124 PT07 51 0.2225 PT09 76 0.27

Jumlah item = 25AS – Fasa Asas Kertas 1 BT – Fasa Berterusan PT – Fasa Pertengahan

Berdasarkan nilai yang terdapat dalam Jadual 3, nilai D adalah melebihi 0.20 serta nilai Fadalah bersamaan atau melebihi 40 peratus. Hal ini adalah selaras seperti dinyatakan oleh Macintoshdan Morrisson (1969). Manakala KR20 yang dihitung mempunyai nilai di antara 0.62 hingga 0.70. NilaiKR20 melebihi 0.60 yang memberikan kesimpulan bahawa item mempunyai kestabilan dan ketekalandalaman (Cresswell 2005; Sekaran 1992). Nilai KR20 ini merumuskan bahawa item mempunyaikebolehpercayaan yang baik dan boleh diguna pakai seperti yang dinyatakan oleh Mohd Majid (1990),Pallant (2001), Sekaran (1992) dan Siti Rahayah (2003). Oleh itu, item objektif bagi ujian pencapaianyang telah dipilih oleh penulis boleh diguna pakai untuk analisis seterusnya kerana mempunyaikesahan dan kebolehpercayaan seperti yang dikehendaki.

Semua item ujian pencapaian yang digunakan dalam kajian tersebut telah ditentukan dengankesahan muka dan kesahan kandungannya oleh tiga orang pakar. Pendapat semua pakar telahdiambil kira dalam menentukan pemilihan item ujian pencapaian ini. Di samping itu, kesahan konstrukpula ditentukan dengan melaksanakan analisis item. Dalam konteks kajian tersebut, nilai (1) IndeksKesukaran (Facility Index) dan (2) Indeks Pembezaan (Discrimination Index) digunakan untukmenentukan kesahan konstruk item ujian pencapaian. Semua nilai indeks menunjukkan itemmempunyai kesahan yang boleh diguna pakai. Sementara itu, nilai KR20 pula ditentukan yangmemberikan kesimpulan bahawa item mempunyai kestabilan dan ketekalan dalaman yang baik. NilaiKR20 ini merumuskan bahawa item mempunyai kebolehpercayaan yang baik dan boleh diguna pakaidalam kajian tersebut.

Kesahan dan Kebolehpercayaan Program SandaranAnalisis item juga dilaksanakan bagi empat item Program Sandaran iaitu (1) Pengenalpastian masalah,(2) Perancangan strategik, (3) Pelaksanaan dan penilaian strategik, serta (4) Kualiti peribadi. Rumusyang digunakan bagi tujuan analisis ditunjukkan dalam Lampiran A. Jadual 4 di bawah ini menunjukkannilai yang diperoleh daripada analisis tersebut.

Jadual 4: Nilai F, D dan KR20 bagi Program Sandaran

Konstruk Aspek ArasKesukaran

(F)/%

IndeksPembezaan

(D)

NilaiKR20

Program Sandaran Pengenalpastian Masalah 83 0.22 0.84Perancangan Strategik 82 0.25Pelaksanaan dan PenilaianStrategik

81 0.25

Kualiti Peribadi 88 0.23

Daripada Jadual 4, didapati bahawa aspek Pengenalpastian Masalah mempunyai nilai F = 83peratus dan D = 0.22, aspek Perancangan Strategik mempunyai nilai F = 82 peratus dan D = 0.25,aspek Pelaksanaan dan Penilaian Strategik mempunyai nilai F = 81 peratus dan D = 0.23, serta aspek



Kualiti Peribadi mempunyai nilai F = 88 peratus dan D = 0.23. Nilai F yang tinggi menunjukkan pesertamampu melaksanakan tugasan yang diberikan dengan baik. Manakala nilai D yang melebihi 0.20 pulamenunjukkan bahawa item mempunyai tahap kesahan yang boleh diguna pakai seperti yangdisarankan oleh Macintosh dan Morrisson (1969). Seterusnya, nilai KR20 adalah 0.84 yang dianggaptinggi (Cohen 1988) dan merupakan nilai biasa yang didapati bagi Ujian Rujukan Kriteria seperti yangditegaskan oleh Ebel (1979). Nilai KR20 yang tinggi ini dihasilkan oleh korelasi antara item yang tinggikerana mengukur objektif atau kriteria yang sama.

Bagi menentukan kebolehpercayaan antara penilai (interrater reliability) untuk ProgramSandaran, penulis menghitung nilai indeks kebolehpercayaan seperti yang disarankan oleh Black(1999). Oleh kerana Program Sandaran merupakan Ujian Rujukan Kriteria maka apa yangdipentingkan adalah markah lulus yang mempunyai nilai sebanyak 40 markah. Rumus yang terdapatdalam Lampiran A digunakan oleh penulis untuk menghitung nilai indeks ini. Berdasarkan rumus ininilai indeks kebolehpercayaan (k2) yang didapati adalah bersamaan dengan 0.85. Nilai ini merupakansatu nilai kebolehpercayaan yang sangat baik berdasarkan pendapat Landis dan Kosh (1977) (dalamZamri dan Noriah, 2003) seperti yang terdapat dalam Jadual 5. Dengan kata lain, itemitem yangdigunakan dalam menentukan skor bagi Program Sandaran mempunyai kebolehpercayaan yangtinggi. Ini juga menunjukkan bahawa instrumen Program Sandaran adalah sesuai digunakan untukmenilai peserta Program Latihan NPQH.

Semua item ujian pencapaian Program Sandaran yang digunakan dalam kajian tersebut telahditentukan dengan kesahan muka dan kesahan kandungannya oleh tiga orang pakar. Pendapatsemua pakar telah diambil kira dalam menentukan pemilihan item ujian pencapaian Program Sandaranini. Di samping itu, kesahan konstruk pula ditentukan dengan melaksanakan analisis item. Dalamkonteks kajian tersebut, nilai (1) Indeks Kesukaran (Facility Index) dan (2) Indeks Pembezaan(Discrimination Index) digunakan untuk menentukan kesahan konstruk item ujian pencapaian. Semuanilai indeks menunjukkan item mempunyai kesahan yang boleh diguna pakai. Sementara itu, nilai KR20 pula ditentukan yang memberikan kesimpulan bahawa item mempunyai kestabilan dan ketekalandalaman yang baik. Nilai KR20 ini merumuskan bahawa item mempunyai kebolehpercayaan yang baikdan boleh diguna pakai dalam kajian tersebut. Sehubungan dengan itu, nilai kebolehpercayaan antarapenilai (interrater reliability) sebanyak 0.85 juga menunjukkan bahawa item dalam Program Sandaranboleh diguna pakai dalam kajian tersebut . Dan dapat disimpulkan di sini bahawa empat item ujianpencapaian Program Sandaran ini sesuai digunakan dalam usaha penulis menentukan pencapaianobjektif kajian ketiga dan kelima.

Kesahan dan Kebolehpercayaan Temu Bual

Protokol temu bual dibina oleh penulis menyentuh isuisu yang terdapat dalam penilaian reaksi,penilaian pembelajaran dan penilaian tingkah laku (Kamaruzaman, 2009). Isu seperti reaksi respondenterhadap Program Latihan NPQH, pengetahuan dan kemahiran yang diperoleh, pemindahanpengetahuan dan kemahiran semasa Program Sandaran, masalah yang dihadapi dan cadangan untukmeningkatkan kualiti program ini dimasukkan dalam protokol temu bual. Ini merupakan satu usahauntuk menguatkan bukti daripada data yang didapati melalui soal selidik, skor ujian pencapaian danskor Program Sandaran. Tegasnya, temu bual ini merupakan satu triangulasi iaitu satu proses untukmenguatkan bukti daripada sumber yang berlainan.

Semua item dalam protokol temu bual yang digunakan dalam kajian tersebut telah ditentukandengan kesahan muka dan kesahan kandungannya oleh lima orang pakar. Pendapat semua pakartelah diambil kira dalam menentukan pemilihan item temu bual ini. Bagi tujuan menentukankebolehpercayaan temu bual, analisis Indeks Cohen Kappa digunakan bertujuan untuk menentukan

artikel 17 kesahan dan kebolehpercayaan intrumen kajian _ coretan pemikiran

Documents