konsep kesahan - joedavian · pdf filekonsep kesahan merujuk kepada keseluruhan apa yang kita...
TRANSCRIPT
30-Dec-10 1
KONSEP KESAHAN
Sesuatu ujian sepatutnya mengukur apa yang sepatutnya diukur (Umum)
30-Dec-10 2
KONSEP KESAHAN
Wood (1991) menekankan bahawa kesahan adalah lebih penting daripada kebolehpercayaan tetapi bergantung semata-mata kepadanya dianggap sebagai kesahan pemerhatian.
30-Dec-10 3
KESAHAN
Mengikut Thorndike (1991), konsep kesahan merujuk kepada keseluruhan apa yang kita hendak diukur dan tiada lain selain apa yang kita hendak ukur.
30-Dec-10 4
KESAHAN
Anastasi (1988) menjelaskan
kesahan ialah ujian yang
mengukur sebaik mana ia
sepatutnya mengukur.
30-Dec-10 5
Huck dan Cormier (1996) menyatakan bahawa intipati kesahan berkait rapat dengan perkataan ketepatan.
KESAHAN
30-Dec-10 6
Jenis Kesahan
Kesahan Kandungan (Content Validity) Kesahan Semasa (Concurrent Validity) Kesahan Ramalan (Predictive Validity Kesahan Berkaitan Kriteria (Criterian-
related Validity) Kesahan Konstruk (construct validity) Kesahan Muka (Face Validity)
30-Dec-10 7
Kesahan Kandungan
(content validity)
Item ujian merangkumi kandungan ujian yang hendak diukur
30-Dec-10 8
Kesahan Kandungan (content
validity)
Merujuk kepada objektif pengajaran yang jelas dan bahan-bahan pengajaran yang ditentukan atau kepada bidang pengajaran yang dikhususkan.
30-Dec-10 9
Ciri-ciri Kesahan Kandungan
Kandungan ujian mewakili perkara yang hendak diukur atau diuji
Digunakan dalam ujian pencapaian
Mengukur penguasaan pengetahuan atau kemahiran tertentu bagi mata pelajaran tertentu
30-Dec-10 10
Memastikan setiap konstruk yang diuji mewakili setiap aspek penting pelajaran yang diajar
Bergantung kepada relevensi atau kesesuaian tingkah laku yang ingin diperhatikan atau diketahui
Perlu memenuhi Huraian Sukatan Pelajaran, JSU dan Spesifikasi Ujian
Ciri-ciri Kesahan Kandungan
30-Dec-10 11
Kesahan Semasa/Serentak
(Concurrent Validity )
Hubungkait antara skor ujian dengan kumpulan pelajar berdasarkan kriterian tertentu
Ditadbir pada masa yang sama atau dalam jangka masa yang pendik.
30-Dec-10 12
Skor ujian/pep. akhir tahun bagi sampel pelajar dibandingkan dengan jangkaan guru tentang kebolehan pelajar, misalnya skor Sejarah dalam pep. SPM
30-Dec-10 13
Kesahan Ramalan
Kesahan Ramalan dapat ditentukan dengan membuat penilaian setepat mana ramalan yang dibuat (menggunakan instrumen untuk mengumpul data) masa kini dapat disahkan daripada maklumat yang dikumpulkan pada masa hadapan.
30-Dec-10 14
Kesahan Ramalan
Contoh:-
Maklumat dikumpul melalui
ujian/kriteria/ tingkahlaku dan
tunggu sehingga tingkah laku yang
hendak diukur oleh ujian berlaku
Buat perbandingan antara maklumat
yang dikumpul dan skor yang
diperolehi daripada pelajar
mengambil ujian tersebut.
30-Dec-10 15
Kesahan Berkaitan Kriteria
(Criterian-related Validity ) Perbezaan antara kesahan semasa dengan
kesahan ramalan bergantung kepada
prosedur mentadbir ujian:-
Pentadbiran ujian pada jangka masa yang
singkat bagi ujian piawaian (concurrent),
atau setelah masa beberapa bulan
(predictive).
30-Dec-10 16
Kesahan Konstruk
Sejauh mana sesuatu ujian dapat mengukur
konstruk hipotetikal berkenaan dengan sifat
semula jadi & tingkah laku manusia,
misalnya, kecerdasan, kreativiti, atau
ketidaktentuan perasaan (emosi)
Tidak boleh diperhatikan secara langsung
tetapi boleh dibuat telahan berdasarkan
kepada kesan tingkah laku (kemahiran) yang
boleh diperhatikan.
30-Dec-10 17
Contoh:-
Satu ujian ditadbir kepada pelajar yang
merangkumi julat pencapaian yang luas.
Jika keputusan ujian dapat membezakan
antara pelajar yang pencapaiannya tinggi
dengan yang rendah ujian tersebut
dianggap mengukur kebolehan konstruk.
30-Dec-10 18
Kesahan Muka
Satu peringkat dimana ujian dilihat mengukur apa yang sepatutnya diukur.
Pelajar/calon akan bertindak lebih
baik kepada ujian yang
mempunyai kesahan muka yang
tinggi.
30-Dec-10 19
Kepetingan Kesahan Muka
Meningkatkan motivasi semasa pelajar
mengambil ujian
Mengurangkan perasaan kurang puas
hati atau tidak adil kepada golongan
yang skornya rendah
Membantu menyakinkan pengguna
yang berpotensi (e.g. guru, pentadbir
sekolah) untuk menggunakan ujian
tersebut)
30-Dec-10 20
Menyakinkan orang ramai, apabila mereka dapat hubungkaitkan antara ujian dengan pencapaian atau ciri-ciri ujian itu sepatutnya mengukur
30-Dec-10 21
FAKTOR YANG MENYUMBANG
KEPADA KETIDAKSAHAN SKOR
30-Dec-10 22
KEBOLEHPERCAYAAN
30-Dec-10 23
KEBOLEHPERCAYAAN
Tahap ketekalan antara skor-skor ujian yang senantiasa tetap dengan tidak adanya ralat pengukuran
(Test Style Manual, ETS, New Jersey, USA).
30-Dec-10 24
Merupakan satu pertunjuk bagi konsistensi skor-skor; antara pemeriksa
mengikut masa
tugasan-tugasan yang berlainan
item-item yang mengukur perkara yang sama (parallel test)
(www.cresst96.cse.ucla.edu/glossary)
30-Dec-10 25
Prosedur pentadbiran pengujian yang baik dijangka akan menghasilkan keputusan baik
Tidak bergantung kepada satu set soalan tertentu yang digunakan
Masa ujian dilaksanakan
Pemeriksa ujian tersebut
Pengaruh Terhadap
Kebolehpercayaan
30-Dec-10 26
o Pengaruh faktor luaran (set soalan, masa, pemeriksaan kertas) yang menjejaskan sesuatu ujian dikenali sebagai skor ralat/ralat pengukuran (error measurement).
30-Dec-10 27
o Kebolehpercayaan ujian bergantung
kepada ketekalan skor yang
dihasilkannya walaupun diulang uji
beberapa kali.
30-Dec-10 28
o Ujian yang mempunyai kebolehpercayaan
yang tinggi bagi sesuatu kumpulan itu
tidak semestinya mempunyai
kebolehpercyaan yang tinggi bagi
kumpulan yang lain
30-Dec-10 29
Jika kumpulan pelajar yang sama mendapat skor yang berlainan terhadap ujian yang sama akibat pengaruh faktor-faktor luaran (yang tidak berkaitan dengan tujuan pengkukuran), ujian tersebut tidak mempunyai kebolehpercayaan.
30-Dec-10 30
Format ujian juga mempengaruhi kesukaran sesuatu item itu dan seterusnya kebolehpercayaan ujian
Arahan yang jelas, mudah difahami dan penyusunan mengikut kesukaran item boleh memberi kesan kepada kebolehpercayaan ujian
30-Dec-10 31
Lebih panjang sesuatu ujian, atau lebih banyak bilangan itemnya, lebih tinggi kebolehpercayaannya
Kebolehpercayaan ujian objektif akan meningkat dengan meningkatnya bilangan pilihan jawapan bagi setiap item
30-Dec-10 32
Betul-Salah atau dua pilihan jawapanpada item adalah paling kurang kebolehpercayaannya
Item yang sukar atau terlalu sukarakan membawa kepada kebolehpercayaan yang rendah
30-Dec-10 33
Item seharusnya mendiskriminasi
antara pelajar yang pandai dengan
lemah
Item mestilah bebas daripada ayat-
ayat yang mengelirukan atau
masalah-masalah teknikal
30-Dec-10 34
Ujian hendaklah ditadbirkan dalam suasana yang sesuai:-
Mengikut masa yang ditetapkan
Bebas daripada gangguan/ bising
Langkah-langkah untuk mengelakkan penipuan
Mengelakkan Ralat Pengukuran
(Keboleh-percayaan Rendah )
30-Dec-10 35
Had masa hendaklah memadai untuk mengelakkan daripada kelajuan dijadikan sebagai satu faktor pengujian
Kunci jawapan hendaklah senantiasa betul bagi setiap item
Perlu mempunyai dua atau lebih pemeriksa atau pemberi gred untuk menilai kertas ujian yang sama
30-Dec-10 36
Elemen Yang Mempengaruhi
Kebolehpercayaan
Dorongan pelajar untuk meneka apabila
mereka tidak mengetahui jawapan betul
Sekiranya ramai pelajar meneka jawapan
sewenang-wenangnya, skor mereka tidak
akan tekal dari satu ujian kepada ujian
yang lain.
30-Dec-10 37
Konsep kebolehpercayaan ini tidak
terhad kepada skor ujian, malah lain-
lain jenis maklumat terhadap pelajar.
Misalnya rekomen guru terhadap
seseorang pelajarnya. Adakah guru
yang berlainan dapat memberikan
testimoni yang sama apabila mereka
menilai pelajarnya?
30-Dec-10 38
Cara Mengukur
Kebolehpercayaan
• Internal consistency
• Alternate-forms reliability
• Split-halves reliability
30-Dec-10 39
Alternate-forms reliability : -memberikan pelajar dua set kertas soalan yang berlainan tetapi mengandungi soalan-soalan khusus / hampir sama (parallel) dari segi mengukur dan menguji kemahiran yang sama
30-Dec-10 40
Buku Ujian
A
50 Soalan
Lembaga Peperiksaan
Kementerian Pendidikan
Malaysia
2002
Buku Ujian
B
50 Soalan
Lembaga Peperiksaan
Kementerian Pendidikan
Malaysia
2002
Contoh Dua Ujian yang setara
30-Dec-10 41
Split-halves reliability : -
– Membahagikan satu set / kertas soalan kepada dua bahagian.
– Kebolehpercayaan dikira bagi setiap dua bahagian tersebut.
– Kebolehpercayaan dikira bagi keseluruhan kertas soalan tersebut
– Skor kedua-dua bahagian ini dibandingkan dengan skor set soalan keseluruhannya
30-Dec-10 42
KERTAS SOALAN 50 ITEM DIBAHAGI KEPADA DUA
BAHAGIAN
Soalan Jawapan
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
48
50
A
C
D
B
A
C
D
B
C
A
D
A
C
A
C
B
A
C
D
A
C
B
C
A
C
Soalan Jawapan
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
23
25
A
C
D
B
A
C
D
B
C
A
D
A
C
A
C
B
A
C
D
A
C
B
C
A
C
A2 A3
KR 20 = .87 KR 20 = .84
Soalan Jawapan
1
2
3
4
5
6
7
48
49
50
A
C
D
B
A
C
D
C
A
C
A1
KR 20 = .88
30-Dec-10 43
Internal consistency :-
Menganalisa data setiap soalandengan andaian bahawa semua soalan bagi ujian tersebut bertujuan mengukur kebolehan yang sama (KR-20 dan Alpha adalah internal consistencykoefisyen)
30-Dec-10 44
Akhir Sekali!
Sekian sahaja.
Kalau tuan/puan beroleh ilmu
Jangan disimpan di dalam dada
Jangan ilmu dijadikan harta
Ramai lagi guru tidak tahu
Tuan/puanlah harapan mereka
Balik nanti sebar serata