evaluasi hasil belajar

32
EVALUASI HASIL BELAJAR FISIKA (Indrawati, Staf Pengajar P Fisika-PMIPA, FKIP Universitas Jember) 1. Evaluasi, Pengukuran, dan Tes Masih sering kita jumpai bahwa para guru fisika kurang benar dalam menafsirkan istilah evaluasi, pengukuran, dan tes. Ketiganya sering digunakan secara sinonim. Pada kenyataannya, ketiganya mempunyai hubungan dekat, tetapi berbeda dalam proses. Untuk menghindari kesalahtafsiran ketiga istilah tersebut, maka masing-masing istilah perlu didefinisikan. Evaluasi atau penilaian didefinisikan sebagai suatu proses untuk mengambilt keputusan terhadap kriteria yang dipilih sebagai nilai tentang benda-benda atau ide-ide, didasarkan pada data yang relevan (Farmer dan Farrell, 1979). Zainul dan Nasoetion (1996) mendefinisikan peilaian sebagai proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes maupun non-tes. Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas (Zainul dan Nasoetion, 1996). Ketika kita mengukur kemampuan siswa kelas I SMU dalam menggunakan jangka sorong, yang kita ukur bukan siswa tetapi atribut atau karakteristik siswa, yaitu: kemampuannya menggunakan jangka sorong. Pengukuran pendidikan adalah salah satu pekerjaan profesional guru, instruktur, dan guru. Sehingga apabila ada guru yang tidak dapat melakukan pengukuran pendikan dapat dikatakan guru yang kurang atau tidak profesional. Tes yang dimaksud di sini didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan atau psikologik yang

Upload: henry-ayouu

Post on 04-Aug-2015

261 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: EVALUASI HASIL BELAJAR

EVALUASI HASIL BELAJAR FISIKA

(Indrawati, Staf Pengajar P Fisika-PMIPA, FKIP Universitas Jember)

1. Evaluasi, Pengukuran, dan Tes

Masih sering kita jumpai bahwa para guru fisika kurang benar dalam menafsirkan istilah

evaluasi, pengukuran, dan tes. Ketiganya sering digunakan secara sinonim. Pada kenyataannya,

ketiganya mempunyai hubungan dekat, tetapi berbeda dalam proses. Untuk menghindari

kesalahtafsiran ketiga istilah tersebut, maka masing-masing istilah perlu didefinisikan.

Evaluasi atau penilaian didefinisikan sebagai suatu proses untuk mengambilt keputusan

terhadap kriteria yang dipilih sebagai nilai tentang benda-benda atau ide-ide, didasarkan pada

data yang relevan (Farmer dan Farrell, 1979). Zainul dan Nasoetion (1996) mendefinisikan

peilaian sebagai proses untuk mengambil keputusan dengan menggunakan informasi yang

diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes maupun non-

tes.

Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau karakteristik

tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang

jelas (Zainul dan Nasoetion, 1996). Ketika kita mengukur kemampuan siswa kelas I SMU dalam

menggunakan jangka sorong, yang kita ukur bukan siswa tetapi atribut atau karakteristik siswa,

yaitu: kemampuannya menggunakan jangka sorong. Pengukuran pendidikan adalah salah satu

pekerjaan profesional guru, instruktur, dan guru. Sehingga apabila ada guru yang tidak dapat

melakukan pengukuran pendikan dapat dikatakan guru yang kurang atau tidak profesional.

Tes yang dimaksud di sini didefinisikan sebagai suatu pertanyaan atau tugas atau

seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut

pendidikan atau psikologik yang setiap butir pertanyaan atau tugas mempunyai jawaban atau

ketentuan yang dianggap benar (Zainul dan Nasoetion, 1996). Hasil belajar fisika merupakan

salah satu contoh atribut pendidikan. Kematangan seseorang adalah salah satu contoh atribut

psikologik. Pedoman wawancara dan observasi merupakan contoh-contoh dari instrumen non-

tes.

Dari uraian di atas dapat kita pahami bahwa tes atau non-tes merupakan instrumen atau

alat untuk mengukur atribut pendidikan. Tes Hasil Belajar (THB) Siswa Kelas I SMU tentang

Besaran, Satuan, dan Angka Penting merupakan contoh alat atau instrumen untuk mengukur

Tugas 1:

Dari definisi evaluasi, pengukuran, dan tes di atas jelaskan hubungan antara ketiganya dan berikan contohnya dalam pembelajaran fisika!

Page 2: EVALUASI HASIL BELAJAR

kemampuan konsep besaran, satuan, dan angka penting siswa. Di sini kita hanya akan belajar

tentang tes, sedangkan instrumen non-tes akan kita pelajari pada bahasan berikutnya.

Pembahasan tentang tes meliputi: bagaimana merencanakan tes, mengkonstruksi butir soal,

mengolah hasil tes, dan menganalisis soal.

2. Merencanakan Tes

Beberapa hal yang perlu dipikirkan dalam merencanakan tes adalah pengambilan sampel

dan pemilihan butir soal, tipe tes yang digunakan, aspek yang akan diuji, format butir soal, jumlah

butir soal, dan distribusi tingkat kesukaran butir soal.

a. Pengambilan sampel dan pemilihan butir soal

THB terdiri atas butir-butir soal yang terpilih, yang secara akademik dapat

dipertanggungjawabkan sebagai sampel yang representatif dari ilmu atau bidang studi yang

diuji dengan perangkat tes tersebut. Pemilihan sampel ini didasarkan pada pertimbangan

pentingnya konsep, generalisasi, dalil, atau teori yang diuji dalam hubungannya dengan

peranannya terhadap bidang studi tersebut secara keseluruhan. Untuk mendapatkan sampel

yang representatif, biasanya bidang studi itu dipilah-pilah menjadi beberapa pokok bahasan

dan sub pokok bahasan. Jumlah pokok bahasan atau sub pokok bahasan tidak ada batasan,

yang penting adalah tingkat kontribusinya terhadap keluasan pokok dan atau sub pokok

bahasan itu.

b. Tipe-tipe Tes

Menurut Ebel dan Frisbie (1986), tes dibagi menjadi tiga, yakni: obyektif, esai, dan

problematika. Selain itu juga dikenal tes lisan dan tes penampilan. Anggapan bahwa tipe

soal satu lebih baik dari yang lain adalah tidak benar. Pemilihan tipe tes tergantung pada

kemampuan dan waktu yang tersedia pada penyusunan tes, bukan aspek yang akan diukur.

c. Aspek kemampuan yang akan diukur/diuji

Aspek yang akan diuji ini merupakan kemampuan apa yang ditargetkan dalam rumusan

tujuan pembelajaran. Jika menggunakan taksonomi Bloom, kemampuan ini bisa pada ranah

kognitif, psikomotor, atau afektif. Setiap kemampuan inipun masih dipilah dalam tingkat-

tingkat. Misalnya untuk ranah kognitif pada tingkat c1, c2, c3, c4, c5, atau c6. Begitupula untuk

ranah psikomotor dan afektif.

d. Format butir soal

Baik tipe soal obyektif maupun esai mengenal berbagai format biasa. Misalnya pada tes

obyektif, format A untuk pilihan ganda biasa; format B untuk pilihan ganda nalisis hubungan

antar hal, dan lain-lain.Perbedaan antar format tidak terletak pada efektivitasnya mengukur

tingkat kemampuan, tetapi pada penerkaannya (peserta tes kurang menguasai materi yang

diteskan).

e. Jumlah butir soal

Tidak ada ketentuan berapa jumlah butir soal yang harus dibuat dalam suatu perangkat tes.

Jumlah butir soal berkaitan dengan reliabilitas dan representasi isi bidang studi yang

Page 3: EVALUASI HASIL BELAJAR

diteskan. Walaupun tidak ada ketentuan tentang jumlah butir soal, tetapi jumlahnya harus

direncanakan, yaitu: berapa jumlah keseluruhan, jumlah untuk setiap pokok/sub pokok

bahasan, jumlah setiap format, jumlah tiap kategori tingjat kesukaran, dan jumlah untuk

setiap tingkat pada setiap ranah. Selain itu juga perlu mempertimbangkan waktu, biaya yang

tersedia, dan kekpmpleksitasan yang dituntut dalam tes.

f. Distribusi tingkat kesukaran

Tingkat kesukaran butir soal pertimbangannya ada pada penulis soal.Tes yang baik adalah

tes yang mampu membedakan antara siswa yang belajar dan yang tidak belajar. Para ahli

berpendapat bahwa tes yang baik mempunyai tingkat kesukaran di sekitar 0,5. Ada

pertimbangan bahwa butir soal yang tingkat kesukaran rendah sebaiknya diletakkan pada

awal tes dan yang tingkat kesukarannya tinggi pada akhir perangkat tes. Pertimbangan ini

dimaksudkan agar siswa termotivasi untuk mengerjakan seluruh butir soal.

g. Kisi-kisi tes

Untuk menggambarkan proporsi banyaknya butir soal pada setiap pokok/sub pokok bahasan

dan setiap kategori untuk setiap ranah (kognitif, afektif, dan/atau psikomotor) dapat dibuat

dalam bentuk kisi-kisi, baik untuk tipe tes obyektif maupun esai. Kisi-kisi (tabel spesifikasi) tes

memuat pokok/sub pokok bahasan/materi, kemampuan yang diuji, dan tingkat kesukaran

butir soal (menurut petimbangan guru). Beikut ini diberikan contoh model membuat kisi-kisi

untuk tes obyektif dan esai.

KISI-KISI TES OBYEKTIF

Mata Pelajaran : Fisika

Kelas : I SMA

Semester/Tahun : I/2008

Waktu :

Tipe Tes :

Jumlah Butir Tes :

No. Pokok/Sub Jenjang Kemampuan & Tingkat Kesukaran %

Pokok Bahasan

(Materi)

C1 C2 C3 C4,5,6 butir soal

Md Sd Sk Md Sd Sk Md Sd Sk Md Sd Sk

butir soal

%

Catatan: Jika perangkat tes memuat ranah afektif dan psikomotor, maka kisi-kisi ini bisa

dikembangkan dengan menambah kolom atau baris untuk Jenjang Kemampuan &

Tingkat Kesukaran.

Page 4: EVALUASI HASIL BELAJAR

KISI-KISI TES ESAI

Mata Pelajaran : Fisika

Kelas : I SMA

Cawu/Tahun : I/2008

Waktu :

Tipe Tes :

Jumlah Butir Tes :

No.SK/KD Tipe soal

Jenjang Kemapuan/ Tk. Kesukaran butir soal %

I/TP/Materi Terbatas Bebas

butir soal

%

3. Mengkonstruksi Butir Soal

Kualitas suatu butir soal tidak ditentukan oleh tipe atau bentuk tes, tetapi tergantung pada

bagaimana butir soal itu dikonstruk oleh guru dengan baik. Tipe dan bentuk tes apapun dapat

digunakan untuk mengukur hasil belajar bila butir soal itu dikonstruk dengan baik dan sesuai

dengan tujuan pembelajaran yang ingin dicapai. Tes semacam ini disebut tes hasil belajar karena

berfungsi untuk mengukur keberhasilan belajar siswa atau mahasiswa.

Kemampuan guru untuk menyusun butir soal dengan baik tidak hanya dibutuhkan

kemampuan yang bersifat pengetahuan dan pemahaman, tetapi perlu keterampilan dan kiat. Agar

mempunyai kemampuan mengkonstruksi soal pada taraf mahir diperlukan latihan secara terus

menerus. Untuk mengkonstruk THB harus memahami dasar-dasar penyusunannya, dan

bagaimana cara menulis butir soal esai dan obyektif tersebut.

3.1 Dasar-dasar menyususn THB

Ada beberapa dasar yang perlu diperhatikan dalam menyususn THB, yaitu: (a) THB

harus sesuai dengan indikator atau tujuan pembelajaran yang dirumuskan, (b) THB harus

mewakili bahan yang dipelajari, (c) THB hendaknya sesuai dengan penggunaan tes itu sendiri

Tugas 2:

Buatlah kisi-kisi THB dalam bentuk obyektif dan esai suatu Pokok/Sub Pokok Bahasan IPA/Fisika SLTP atau Fisika SMU untuk waktu 10-15 menit!

Page 5: EVALUASI HASIL BELAJAR

(untuk pre dan post-tes, menentukan ketuntasan penguasaan materi, diagnostik, tes formatif,

atau untuk tes sumatif), (d) THB disesuaikan dengan pendekatan pengukuran yang dianut, yaitu:

PAP atau PAN., dan (e) THB hendaknya dapat digunakan untuk memperbaiki PBM.

3.2 Cara Penulisan Butir Soal Esai

Butir soal esai atau uraian adalah butir soal yang mengandung pertanyaan atau tugas

yang jawaban atau pengerjaan soal tes tersebut harus dilakukan dengan cara mengekspresikan

pikiran peserta tes, dan jawaban tidak disediakan oleh orang yang mengkonstruk butir soal. Tes

tipe ini secara umum dibagi menjadi dua jenis, yaitu: tes uraian bebas (extended response) dan

tes uraian terbatas (restricted response).

3.2.1 Tes Uraian Bebas

Ciri dari tes uraian bebas adalah hampir tidak ada pembatasan terhadap peserta tes dalam

memberikan jawabannya. Jawaban peserta tes bersifat terbuka, luwes, dan tidak terstruktur.

Contoh tes ini dapat kita pada butir soal nomor E-35, yaitu:

E-35 Jelaskan secara singkat dan jelas bagamana cara menentukan ukuran suatu

kertas (misalnya A4) yang meliputi pengukuran panjang, lebar, dan tebalnya?

3.2.2 Tes Uraian Terbatas

Ciri tes uraian terbatas adalah jawaban peserta tes dibatasi dengan berbagai rambu-rambu

yang ditentukan dalam butir soal. Keterbatasan itu mencakup format, isi, dan ruang lingkup

jawaban. Soal tes uraian terbatas ini harus menentukan batas jawaban yang dikehendaki,

meliputi konteks jawaban yang diinginkan, jumlah butir jawaban yang diharapkan, keluasan

uraian jawaban, arah dan luas jawaban yang diminta. Tes uraian terbatas ada beberapa ragam,

antara lain ragam tes melengkapi dan ragam tes jawaban singkat. Butir soal melengkapi adalah

butir soal yang meminta atau memerintah peserta tes untuk melengkapi suatu kalimat

(pernyataan) dengan satu frasa, satu angka, atau satu formula. Butir soal melengkapi dapat kita

lihat pada contoh butir soal nomor E-31 dan 32, masing-masing adalah:

E-31 Dalam fisika ada …… besaran pokok.

E-32 Gaya termasuk besaran ……..

Ada beberapa petunjuk untuk mengkonstruksi butir soal melengkapi, yaitu: (1)

konstruksilah butir soal yang mengukur hasil belajar yang penting saja; (2) butir soal harus

spesifik, artinya harus dapat dijamin bahwa butir soal hanya dapat dijawab oleh peserta tes yang

menguasai degan baik isi pelajaran; (3) konstruksilah butir soal yang mengharuskan peserta tes

memberi jawaban yang secara faktual benar; (4) gunakan bahasa yang jelas (tidak mendua arti);

(5) Bila yang ditanyakan menyangkut angka atau jumlah dari satu satuan tertentu, sebaiknya

nyatakan satuan tersebut dalam soal, misalnya luas bidang tanah yang panjangnya 12 m dan

Page 6: EVALUASI HASIL BELAJAR

lebarnya 7 m adalah ……… m2; (6) setiap butir soal sebaiknya hanya berisi satu jawaban,

misalnya butir soal E-31 dan E-32.

Butir soal jawaban singkat adalah butir soal berbentuk pertanyaan yang dapat dijawab dengan

satu kata, frasa, angka, atau formula. Butir soal ini dapat dicontohkan pada butir soal nomor E-

33 dan 34, yaitu:

E-33 Apakah dimensi dari kecepatan?

E-32 Berapakah orde dari bilangan 2078605 J?

Ada beberapa petunjuk untuk mengkonstruk bentuk tes jawaban singkat, yaitu: (1) gunakan

kalimat tanya yang menuntut jawaban satu kata, frasa, angka, atau simbol; (2) hindari kalimat

yang langsung diambil dari buku atau catatan; (3) pertanyaan jangan sampai menjadi tes bahasa,

maksud tes adalah untuk menguji materi pelajaran; (4) untuk menanyakan definisi atau istilah

sebaiknya digunakan kalimat tanya secara lansung, misalnya soal E-33 akan tidak tepat bila

ditulis: Setiap besaran fisika yang bersatuan dapat dinyatakan dengan dimensi. Dimensi besaran

kecepatan itu apa? (5) untuk menanyakan masalah hitungan, harus ditentukan tingkat

ketepatannya, terutama untuk agka desimal; (6) sebaiknya hanya satu jawaban untuk satu

pertanyaan, misalnya: Apakah dimesi dari besaran pokok? adalah pertanyaan yang jawabannya

bisa lebih dari satu simbol (bisa M, L, atau T).

3.2.3 Pedoman Penskoran Butir Soal Esai

Butir soal esai atau uraian memeriksanya tidak mudah dan lama karena jawabannya

bervariasi, hasil penilainnya cenderung subyektif. Untuk mengurangi subyektivitas dan

meningkatkan obyektivitas dalam penilain tes esai ada beberapa hal yang perlu diperhatikan,

yakni: (1) apakah jawaban yang terbaik untuk satu butir pertanyaan esai; (2) butir apa saja yang

harus terdapat dalam jawaban pertanyaan esai; (3) apakah ada butir yang leih penting di antara

butir-butir jawaban yang diharapkan. Dalam mengkonstruk tes penyusun tes sudah harus

menyediakan jawaban tiga pertanyaan tersebut. Dengan kata lain penyusun tes ketika

mengembangkan butir tes sekaligus juga harus menyusun jawabannya yang berpedoman pada

tiga buah pertanyaan di atas. Jawaban yang ditulis tidak perlu dinarasikan tetapi cukup dengan

mencantumkan butir-butir penting yang harus termuat pada jawaban peserta tes. Penentuan skor

pada setiap butir tidak tentu sama, tergantung pada bobot konsep pada butir jawaban tersebut.

Konsep yang bobotnya lebih penting diberi bobot lebih besar. Jika setiap konsep memiliki bobot

sama maka diberi skor yang sama. Skor maksimum tidak perlu dikonverskan pada skor 10 atau

100, biarkan sebagaimana adanya.

Contoh pembuatan pedoman penskoran butir soal esai untuk butir-butir soal nomor E-31

sampai dengan E-35 dapat dilihat sebagai berikut:

Butir soal E-31 sampai dengan E-35 (lihat Lampiran)

Page 7: EVALUASI HASIL BELAJAR

Pedoman Penskoran

No.

Soal Aspek/Kata Kunci Skor

E-31 7 (tujuh) 1

E-32 Turunan 1

E-33 [LT-1] 2

E-34 10-6 2

E-35 Panjang dan lebar diukur dengan mistar. Massa diukur dengan neraca.

Hasil pegukuran panjang (p) = …….. cm

Hasil pengukuran lebar (l) = ………cm

Hasil pengukuran massa (m) = ……… gr

Jadi ukuran kertas adalah ….. x …… cm, ……gram

6

3

Skor maksimum 15

3.3 Cara Penulisan Butir Soal Obyektif

Butir soal obyektif adalah butir soal yang telah mengandung kemungkinan jawaban yang

harus dipilih atau dikerjakan oleh peserta tes. Jadi jawaban telah disediakan atau dipasok oleh

pembuat soal. Sehingga pemeriksaan atau penskoran jawaban peserta tes dapat dilakukan

secara obyektif oleh pemeriksa. Karena sifat obyektif ini, maka pemeriksaan tidak harus dilakukan

oleh manusia, tetapi bisa dengan mesin.

Secara umum tes obyektif dibedakan menjadi tiga tipe, yakni tipe: benar-salah (true-

false), menjodohkan (matching), dan pilihan ganda (multiple choice). Tes pilihan ganda dapat

dimodifikasi dalam lima bentuk, yaitu pilihan ganda biasa, analisis hubungan antar hal, analisis

kasus, kompleks, dan pilihan ganda yang menggunakan diagram, grafik, tabel, atau gambar.

Semua bentuk tes pilihan ganda tersebut mempunyai struktur (format) yang sama, yaitu

ada pokok soal (stem) dan sejumlah pilihan (options). Di antara pilihan itu ada satu pilihan yang

benar disebut kunci (key) dan pilihan lainnya disebut pengecoh (distractors). Penulisan setiap tipe

tes obyektif dapat diuraikan seperti berikut.

3.3.1 Penulisan Tes Benar-Salah

Jika ujian dibatasi pada pertanyaan-pertanyaan benar-salah, statistik menunjukkan

bahwa 75 item atau lebih adalah perlu untuk mengatasi faktor menebak (guessing). Dalam tes

100 pertanyaan benar-salah, siswa harus dapat menjawab sekitar 50 pertanyaan tepat dengan

menebak. Beberapa instruksi mengeliminasi masalah ini dengan mengurangi jumah jawaban-

jawaban salah dari jumlah jawaban benar untuk menentukan skor; mereka menghukum untuk

menebak. Prosedur ini tidak direkomendasi karena siswa biasanya berpikir bahwa instruktur

mengunakan teknik ini secara dendam/dengki. Hal ini juga tidak dapat diinginkan karena siswa

Page 8: EVALUASI HASIL BELAJAR

dihukum untuk menebak; dalam sains umumnya dan fisika khususnya kita ingin mempunyai

siswa membuat hipotesis, yaitu, tebakan-tebakan yang baik.

Hindari ketidak-seimbangan tes dengan cukup banyak pertanyaan benar-salah. Coba

membuatnya agak baik rata dalam jumlah, sehingga siswa yang mengetahui sedikit tentang

bahan tidak dapat memperoleh skor tinggi dengan sederhana dengan berasumsi bahwa lebih

banyak pertanyaan adalah benar (atau salah).

Hindari menggunakan pernyataan-pernyatan yang dapat menipu siswa. Jangan

menggunakan bahasa yang sama seperti dalam teks atau siswa cenderung untuk mengingat.

Hindari pernyataan-pernyataan yang mendua-arti. Misalnya, jangan menulis, “panjang bidang

diukur dengan pengukur panjang”. Hindari menggunakan kalimat-kalimat kompleks dalam

pernyataan-pernyataan anda. Jangan menggunakan bahasa kualitatif jika anda dapat

memungkinkan menghindarinya. Jangan menulis, misalnya, logam-logam yang lebih baik

menghantarkan listrik lebih cepat. Susun pernyataan-pernyataan anda dalam 10 sampai dengan

20 pertanyaan. Prosedur ini menggantikan terlalu banyak ketegangan untuk siswa. Ambil

blok/tempat jawaban ada dalam satu margin sehingga mereka dapat diperiksa dengan mudah

dengan menggunakan suatu kunci.

3.3.2 Konstruksi Tes Menjodohkan

Tipe soal menjodohkan ditulis dalam dua kolom. Kolom pertama untuk pokok soal (stem)

atau premis dan kolom kedua untuk kolom jawaban. Tugas peserta tes adalah menjodohkan

antara kolom pertama dan kolom kedua.

Untuk menulis butir soal menjodohkan ada beberapa syarat, yaitu: (1) pernyataan di bawah

kolom pertama dan kolom kedua harus terdiri atas kelompok yang homogen; dan (2) jumlah

pernyataan di bawah kolom kedua harus lebih banyak dari pernyataan di bawah kolom petama.

Tipe tes ini dapat dicontohkan sebagai berikut:

Petunjuk: Pasangkan pernyataan pada kolom pertama dengan pilihan yang cocok pada

kolom kedua dengan menulis huruf di muka nomor pernyataan kolom pertama!

Tugas 3:

Berdasarkan 10 butir soal benar-salah pada contoh THB besaran, satuan, dan angka penting, apakah semua soal telah memenuhi syarat untuk tipe soal benar-salah yang baik? Berikan penjelasan!

Page 9: EVALUASI HASIL BELAJAR

………

……….

………

dst.

1. Besaran yang mempunyai besar dan arah

2. Dimensi percepatan adalah

3. Perbandingan antara gaya tarik atau gaya

tekan dan pemanjangan atau pemendekan

pegas adalah konstan.

Dst.

A. [LT-2]

B. Skalar

C. [LT2]

D. Vektor

E. Hukum II Newton

F. Hukum Hooke

Dst.

3.3.3 Konstruksi Tes Pilihan Ganda

Butir tes pilihan ganda (majemuk) adalah butir tes yang alternatif jawabannya lebih dari

dua, pada umumnya berkisar antara 4 (empat) atau 5 (lima). Alternatif pilihan ini tidak boleh

terlalu banyak, sebab selain menyulitkan peserta tes untuk menjawab juga kesulitan dalam

mengkonstruknya.

Trowbridge dan Bybee (1990) menyebutkan ada beberapa unsur yang perlu diperhatikan

dalam mengkonstruksi tes pilihan-ganda, yaitu:

(1) Inti permasalahan harus ditempatkan pada pokok soal (steam);

(2) Hindari pengulangan kata-kata yang sama dalam piliham;

(3) Hindari rumusan kata yang berlebihan;

(4) Jika pokok soal merupakan pernyataan yang belum lengkap, maka kata atau kata-kata yang

melengkapi harus diletakkan pada ujung peryataan, bukan di tengah-tengah kalimat;

(5) Susunan alternatif jawaban dibuat teratur dan sederhana;

(6) Hindari penggunaan kata-kata teknis atau ilmiah atau yang aneh atau mentereng;

(7) Semua pilihan jawaban harus homogen dan dimungkinkan sebagai jawaban yang benar;

(8) Hindari keadaan dimana jawaban yang benar selalu ditulis lebih panjang dari jawaban yang

salah;

(9) Hindari adanya petunjuk/indikator pada jawaban yang benar;

(10)Hindari menggunakan pilihan yang berbunyi “semua yang di atas benar” atau “tidak satupun

yang di atas benar”;

(11)Gunakan tiga atau lebih alternatif pilihan;

(12)Pokok soal diusahakan tidak menggunakan ungkapan atau kata-kata yang bermakna tidak

tentu, misalnya: kebanyakan, seringkali, kadang-kadang, dan yang sejenis;

Tugas 4:

Tulislah 5 butir soal tipe menjodohkan untuk suatu pokok bahasan fisika SLTP atau SMU dan lengkapi pula dengan kunci jawabannya!

Page 10: EVALUASI HASIL BELAJAR

(13)Pokok soal sedikit mungkin dalam pernyataan atau pertanyaan negatif. Jika terpaksa

menggunakan pernyataan negatif maka kata negatif tersebut digaris-bawahi atau ditulis

miring atau tebal.

Tes pilihan ganda dapat berupa tes pilihan ganda biasa, analisis hubungan antarhal,

analisis kasus, kompleks, dengan menggunakan diagram, grafik, atau tabel. Pilihan ganda biasa

dicontohkan pada contoh soal bagian B (lihat lampiran), yaitu tes pilihan ganda yang setiap butir

soal memuat pokok soal dan alternatif jawaban lebih dari dua (3-5 pilihan). Untuk tes pilihan

ganda yang lain diuraikan berikut ini.

a. Tes Pilihan Ganda Analisis Hubungan Antarhal

Tes pilihan ganda analisis hubungan antarhal terdiri atas dua pernyataan yang kedua nya

dihubungkan dengan kata “SEBAB”. Jadi sifat hubungannya bisa berupa sebab akibat atau

tidak ada hubungan sebab akibat. Agar kedua pernyataan termasuk pilihan ganda maka harus

dicari variabel lain yang dapat mengukur kemampuan siswa. Variabel tersebut adalah kualitas

pernyataan yaitu apakah pernyataan pertama benar atau salah dan sebaliknya. Hubungan

antar duapernyataan tersebut dapat dikembangkan lagi seperti yang dicontohkan pada contoh

soal bagian C (lihat lampiran), yaitu: A jika penyataan benar dan alasan benar, keduanya

merupakan hubungan sebab akibat, B jika pernyataan benar dan alasan benar, keduanya

tidak ada hubungan sebab akibat, dan seterusnya..

b. Tes Pilihan Ganda Analisis Kasus

Pada tes pilihan ganda analisis kasus, peserta tes disajikan kasus dalam bentuk cerita,

peristiwa, dan sejenisnya dan disertai dengan beberapa pertanyaan. Setiap pertanyaan dibuat

dalam bentuk melengkapi pilihan. Kasus tersebut bisa diambil dari jurnal, surat kabar, majalah,

dan media yang lain.

c. Tes Pilihan Ganda Kompleks

Tes pilihan ganda kompleks biasa disebut Asosiasi pilihan ganda. Struktur pertanyaan sama

dengan pilihan ganda biasa, perbedaannya adalah, kalau pada pilihan ganda biasa hanya ada

satu jawaban yang benar atau paling benar, sedangkan untuk pilihan ganda kompleks

jawabannya bisa lebih dari satu, mungkin bisa A jika 1 dan 2 benar , B: 1 dan 3 benar, C: 2

dan 3 benar, atau D: jika semuanya benar.

d. Tes Pilihan Ganda dengan Gambar, Diagram, Grafik, atau Tabel

Tes pilihan ganda dengan diagram, gambar, grafik, atau tabel mirip dengan analisis kasus

baik struktur maupun pola pertanyaannya. Perbedaannya pada tes ini tidak disajikan kasus

dalam bentuk ceritera atau peristiwa tetapi kasus tersebut berupa diagram, gambar, tabel,

atau grafik.

Tugas 5:

Tulislah masing-masing dua butir soal fisika SLTP atau SMU untuk soal pilihan ganda analisis kasus dan pilihan ganda dengan menggunakan gambar, tabel, atau grafik.

Page 11: EVALUASI HASIL BELAJAR

4. Mengadministrasi Tes

Kegiatan mengadministrasi tes meliputi penyusunan perangkat tes dan pelaksanaan tes.

Kedua kegiatan tersebut dapat kita lakukan seperti berikut.

4.1 Penyusunan Tes

Ada dua hal yang perlu dipertimbangkan dalam menyusun tes, yaitu proses penyuntingan

naskah tes dan penggandaan tes. Ada beberapa hal yang perlu dipertimbangkan dalam

penyuntingan tes, yaitu:

a. Tes bentuk obyektif sebaiknya tidak dilaksanakan secara lisan.

b. Butir tes disusun mulai dari pokok bahasan yag dibahas paling awal ke yang dibahas paling

akhir.

c. Butir soal disusun mulai dari yang termudah ke yang paling sulit.

d. Butir tes yang setipe dijadikan dalam satu kelompok.

e. Petunjuk pengerjaan harus jelas, sehingga tidak memungkinkan untuk dipertanyaan lagi cara

pengerjaannya.

f. Setiap butir tes hendaknya disusun sedemikian rupa sehingga memudahkan peserta tes

untuk membacanya.

g. Stem dan options upayakan dalam satu halaman.

h. Letakkan wacana yang digunakan sebagai rujukan di atas butir tes yang bersangkutan.

i. Hindari meletakkan kunci jawaban dalam suatu pola tertentu.

Setelah naskah disunting, langkah selanjutnya adalah digandakan (termasuk

pengetikan). Prosedur penggandaan harus dapat menjamin kerahasiaan naskah tes. Dalam

penggandaan, sebaiknya lembaran tes dan lembaran jawaban dipisah. Sehingga mudah

menempatkan jawabannya dan guru mudah dalam penskoran.

4.2 Pelaksanaan Tes

Dalam pengadministrasian tes juga harus mempertimbangkan cara-cara

pelaksanaannya. Cara pelaksanaan tersebut antara lain meliputi:

a. tes catatan terbuka (open books) atau catatan tertutup (close books,

b. tes diumumkan atau tes dirahasiakan (mendadak),

c. tes lisan atau tertulis, dan

d. tes tindakan (praktek)

Setiap pelaksanaan tes tersebut ada kelebihan dan kekurangannya. Untuk itu kerjakan

tugas 6 berikut ini.

Tugas 6:

Jelaskan kelebihan dan kekurangan setiap pelaksanaan tes di atas!

Page 12: EVALUASI HASIL BELAJAR

5. Pengolahan dan Penilaian Hasil Tes

Setelah pelaksanaan tes kegitan berikutnya adalah mengolah hasil tes tersebut dan

melakukan penilaian.

5.1 Pengolahan Hasil Tes

Pengolahan hasil tes adalah kegiatan memeriksa hasil ujian dan mencocokkan jawaban

peserta tes dengan kunci jawaban. Mengolah tes bentuk tes obyektif lebih mudah dan cepat

dibandingkan dengan bentuk tes esai. Setelah hasil tes diperiksa berikutnya adalah memberikan

skor.

Jika peserta tes tidak diperkenankan menerka jawaban, artinya mereka yang menerka

akan didenda, yaitu skor yang benar dikurangi skor yang salah, maka pada petunjuk umum

mengerjakan soal harus mencantumkan: “Pikirkan dengan baik-baik sebelum menjawab, karena

setiap jawaban yang salah akan mengurangi nilai anda”. Pengurangan nilai ini dihiting dengan

rumus:

Skor = jumlah jawaban benar – jumlah kawaban salah/(n-1)

(n adalah jumalternatif jawaban)

Pada contoh soal (dalam lampiran) terdapat 30 butir soal obyektif, Badu menjawab benar

25 nomor dan salah 5 nomor, maka dengan rumus tersebut

Skor Badu = 25 – 5/(5-1)

= 25 – 5/4 = 23,75

Jika tidak ada denda dalam menerka jawaban, maka skor Badu adalah 25. Angka 5/4 atau 1,25

merupakan angka denda.

Untuk soal esai baik terbatas maupun bebas pemberian skor didasarkan pada Pedoman

Penskoran (Marking Scheme) yang telah dirancang. Berdasarkan pedoman penskoran yang telah

dirancang untuk contoh soal pada lampiran, skor maksimum untuk tes esai adalah 15. Jika pada

tes esai skor Badu 10, maka

skor total Badu = 23,75 + 10 = 33,75 (jika ada denda)

skor total Badu = 25 + 10 = 35 (jika tidak ada denda)

Dari contoh di atas, periksalah semua jawaban (soal pada lampiran) anda dan berikan

skornya (anda bisa menggunakan aturan yang menggunakan denda atau yang tanpa denda).

Setelah itu kerjakan tugas 7 berikut:

Page 13: EVALUASI HASIL BELAJAR

5.2 Pendekatan Penilaian

Ada dua pendekatan untuk melakukan penilaian hasil belajar siswa, yaitu dengan

menggunakan pendekatan Penilaian Acuan Norma (PAN) dan Penilaian Acuan Patokan. Kedua

pendekatan itu digunakan sebagai acuan untuk memberikan nilai siswa. Di dalam proses

pendidikan biasanya setiap pendekatan itu tidak dapat dilaksanakan secara murni, namun perlu

diadakan penyesuaian yang kadang-kadang merupakan kombinasi dari kedua pendekatan

tersebut.

5.2.1 Pendekatan Penilaian Acuan Norma (PAN)

Yang dimaksud pendekatan PAN adalah pendekatan untuk memberikan nilai didasarkan

pada perolehan kelompoknya. Misalnya sekelompok siswa ada 10 anak mendapat skor (nilai

mentah): 70, 65, 60, 55, 40, 35, 35, 30, 30, dan 25. Jika jumlah kelompok tidak terlalu besar

(<30), maka untuk menentukan skor setiap anak berdasarkan kelompoknya dapat dilakukan

dengan dua cara. Pertama, dengan cara skor tertinggi diberi nilai 10 dan skor di bawahnya

ditetapkan secara proporsional. Cara yang kedua adalah dengan menghitung persentase

jawaban benar yang dijawab oleh setiap anak. Kemudian persentase tertinggi diberi nilai tertinggi.

Dari contoh soal yang diberikan, misalnya skor maksimum (semua jawaban benar) adalah 75,

maka anak yang mempunyai skor tetinggi 70, maka persentase yang benar adalah 70/75x100%

atau 93,3%. Persentase tertinggi ini diberi skor tertinggi, yaitu 10 untuk skala 1-10.

Pengolahan kelompok nilai mentah menjadi skor 1-10 dapat ditabelkan sebagai berikut:

Tabel 5-1: Pengolahan Nilai Mentah menjadi 1-10

a. Nilai

mentah 70 65 60 55 40 35 35 30 30 25

b. % yang

benar 93,3 86,6 80 73,3 53,3 46,6 46,6 40 40 33,3

c. Nilai

1-10 10 9 8 7 6 5 5 4 4 3

Apabila jumlah anggota kelompok besar (>30 orang) atau lebih dari satu kelas, maka

untuk memberi nilai setiap anggota kelompok dapat digunakan statistik sederhana, yaitu dengan

menentukan skor rata-rata (X) dan simpangan baku () kelompok. Untuk anggota kelompok yang

Tugas 7:

Kumpulkan semua skor teman-teman anda, kemudian buatlah tabel yang memuat nomor, nama, dan skor mahasiswa (sebagai siswa), urutkan skor dari skor tertinggi ke yang oaling rendah atau sebaliknya.

Page 14: EVALUASI HASIL BELAJAR

besar, distribusi kemampuan anak dapat dimulai dari paling pandai, pandai, sedang, kurang, dan

sangat kurang. Distribusi (penyebaran) tersebut dapat digambarkan dengan kurve normal.

Misalnya ada sekelompok siswa memiliki skor rata-rata X, maka jumlah peserta antara:

X sampai dengan (X+1) adalah 34,13%

(X+1) sampai dengan (X+2) adalah 13,59%

(X+2) sampai dengan (X+3) adalah 2,14%

X sampai dengan (X-1) adalah 34,13%

(X+1) sampai dengan (X-2) adalah 13,59%

(X+2) sampai dengan (X-3) adalah 2,14%

Harga rata-rata skor dapat dihitung dengan rumus:

X = skor seluruh anggota kelompok/ seluruh anggota kelompok

Dan

Simpangan Baku dirumuskan:

skor 1/6 dari anggota kelompok tinggi - skor 1/6 dari anggota kelompok rendah = ½ seluruh anggota kelompok

Apabila terdapat data skor fisika siswa SMU dari 35 anak yang telah diurutkan dari tertinggi

sampai terrendah adalah sebagai berikut:

60 60 55 55 55 50 50 50 50 50

45 45 45 40 40 40 40 35 35 35

35 35 30 30 30 30 25 25 25 25

25 20 20 15 10

Dalam kurikulum 1975, penentuan nilai menggunakan konversi seperti pada tabel 5-2

berikut:

Tabel 5-2: Konversi skor mentah ke dalam nilai 1-10

Skor

Mentah X-2 1/4 X-1 3/4 X-1 1/4 X-1/4 X+1/4 X+3/4 X+11/4 X+3/4 X+13/4 X+21/4

Nilai

1-10 1 2 3 4 5 6 7 8 9 10

5.2.2 Pendekatan Penilaian Acuan Patokan (PAP)

Tugas 8:

Berdasarkan data skor fisika dari 35 siswa SMU di atas hitungX dan kemudian tentukan skor ke-35 siswa tersebut dengan nilai 1-10.

Page 15: EVALUASI HASIL BELAJAR

Pendekatan PAP adalah suatu pendekatan yang digunakan untuk menentukan

keberhasilan atau kelulusan seseorang berdasarkan patokan atau kriteria yang telah ditentukan.

Dalam Proses pembelajaran mengacu pada tujuan pembelajaran umum dan khusus. Sehinga

keberhasilan siswa dalam suatu mata pelajaran ditentukan oleh kemampuan siswa dalam

mencapai tujuan pembelajaran yang telah dirumuskan. Inilah yang membedakan dengan

pendekatan PAN, yaitu kelulusan atau keberhasilan siswa ditentukan oleh kelompoknya. PAP

digunakan dalam sistem belajar tuntas. Misalnya dalam rumusan tujuan pembelajaran khusus

dirumuskan dengan “Siswa kelas 1 SMU dapat menulis dimensi besaran fisika”. Untuk

penguasaan yang tuntas, kriteria yang dikembangkan antara lain siswa dapat: (1) menulis

dimensi besaran pokok dan (2) menulis dimensi beberapa dimensi besaran turunan. Untuk

mengetahui apakan kedua tujuan tersebut telah dikuasai oleh siswa, maka untuk setiap tujuan

harus ada butir soalnya. Jika siswa dapat mengerjakan dengan benar butir-butir soal tersebut

maka dikatakan bahwa siswa telah menguasai tujuan tersebut dengan tuntas. Jika belum

dikuasai maka perlu ada pembelajaran remedial (perbaikan).

Perencanaan dan konstruksi butir soal baik untuk PAN maupun PAP kedua mempunyai

kesamaan, yaitu keduanya menentukan lebih dahulu tujuan (TPK) atau hasil apa yang akan

diukur dan bagaimana cara mengukurnya yang paling tepat. Perbedaannya, pada

pengembangan butir soal PAN, tingkat kesukaran soal harus diperhatikan, harus

mengombinasikan butir soal yang mudah, sedang, dan sukar, sehingga tingkat keseluruhn butir

soal adalah sekitar 50%. Pada pengembangan butir soal PAP tingkat kesukaran dan daya beda

tidak diperhatikan karena maksud soal bukan untuk membedakan siswa yang pintar dari siswa

yang kurang pintar, tetapi melihat tingkat penguasaan seseorang terhadap materi atau tujuan

pembelajaran. Ynag dipentingkan dalam PAP adalah daya serap siswa. Seharusnya sumua

tujuan pembelajaran dapat dikuasai siswa 100%. Penguasaan 100% ini sulit dicapai, sehingga

ada beberapa sekolah yang menetapkan ketuntasan ini 80%.

Jika syarat ketuntasan adalah 80%, maka apakah semua siswa yang mendapat skor 80%

ke atas akan mendapat nilai yang sama? Jawabnya tergantung pada sistem penilaian yang

digunakan. Ada penilaian yang menggunakan kriteria lulus dan tidak lulus, yaitu: anak yang lulus

adalah anak yang mempunyi skor 80% dan yang tidak lulus adalah anak yang skornya <80%.

Ada pula yang menggunakan kategori A, B, C, D, dan E, dengan rentangan:

> 95% nilai A, (90,5-95)% nilai B, (85,5-90)% nilai C, (80-85)% nilai D, dan < 80% nilai E (tidak

lulus). Rentangan skor untuk mendapat nilai A-E tidak baku seperti dicontohkan, misalnya batas

kelulusan bisa > 80% atau < 80%, dan nilai A bisa 90%

6. Menganalisis Soal

Kegiatan menganalisis soal merupakan kegiatan untuk menentukan mutu butir dan

perangkat soal. Setiap guru harus memiliki kemampuan untuk menentukan mutu butir soal dan

perangkat soal agar mereka dapat merancang soal yang baik. Penilaian mutu butir soal

ditentukan oleh karakter dari butir soal itu sendiri, yang meliputi tingkat kesukaran, daya beda,

Page 16: EVALUASI HASIL BELAJAR

dan berfungsi tidaknya pilihan untuk tipe soal pilihan ganda. Penilaian mutu perangkat soal

meliputi validitas dan reliabilitasnya.

6.1 Karakteristik dan Spesifikasi Butir Soal

Yang dimaksud karakteristik butir soal adalah parameter kuantitatif dari butir soal.

Sebaliknya, parameter kualitatif butir soal disebut dengan spesifikasi butir soal. Spesifikasi butir

soal ditentukan atas dasar penilaian ahli (expert judgment). Kedua hal ini akan diuraikan seperti

berikut.

6.1.1 Karakteristik Butir Soal

Karakteristik butir soal untuk tes hasil belajar dipertimbangkan berdasarkan tingkat

kesukaran (p), daya beda (D), dan berfungsi atau tidaknya pilihan.

6.1.1.1 Tingkat Kesukaran

Tingkat kesukaran butir soal dimaknai sebagai proporsi peserta tes menjawab benar

terhadap butir soal tersebut, yang dirumuskan dengan:

b = peserta yang menjawab benar/ peserta keseluruhan

Misalnya soal nomor 1, jumlah peserta tes yang menjawab benar 3 orang dan jumlah seluruh

peserta tes 15 orang, maka tingkat kesukaran butir soal nomor satu adalah 0,2. Butir soal ini

dikatakan sukar. Jika dalam suatu perangkat soal terdapat 10 butir soal, dengan tingkat

kesukaran setiap butirnya berturut-turut 0,2; 0,6; 0,4; 0,5; 0,7; 0,5; 0,35; 0,45, 0,8; dan 1,0, maka

tingkat kesukaran perangkat soal (p naskah ujian) tersebut adalah:

p naskah ujian = (0,2 + 0,6 + 0,4+ 0,5+ 0,7+ 0,5+ 0,35+ 0,45+ 0,8 + 1,0)/10

= 5,5/10

= 0,55

atau p naskah ujian = b/butir soal

Tingkat kesukaran butir soal atau perangkat soal biasanya dikategorikan mudah, sedang, dan

sukar. Penentuan ketiga kategori tersebut dapat menggunakan pedoman:

Tingkat kesukaran Kategori

0,00 - 0,25 Sukar

0,26 - 0,75 Sedang

0,76 - 1,00 Mudah

Page 17: EVALUASI HASIL BELAJAR

Contoh perangkat soal tersebut termasuk kategori sedang. Untuk menyusun suatu naskah ujian

atau tes hasil belajar sebaiknya digunakan butir soal yang tingkat kesukarannya berimbang, yaitu:

sukar (25%), sedang (50%), dan mudah (25%). Komposisi ini dapat diterapkan pada PAN dan

PAP. Jika komposisi butir soal tidak seimbang maka penggunaan PAN tidak tepat, sebab

informasi kemampuan yang dihasilkan tidak berdistribusi normal. Jadi ukuran butir soal atau

perangkat soal yang baik tidak ditentukan oleh tiinggi atau rendahnya tingkat kesukaran tetapi

pada komposisi tingkat kesukarannya.

6.1.1.2 Daya Beda

Dalam suatu kelompok peserta tes, biasanya kita jumpai kelompok yang berprestasi

tinggi (kelompok atas) dan kelompok yang berprestasi rendah (kelompok bawah). Indeks yang

menunjukkan tingkat kemampuan butir soal yang dapat membedakan kelompok atas dan bawah

disebut daya beda butir soal. Daya beda biasanya disimbolkan dengan D dan dirumuskan:

D = (Ba – Bb)/1/2T

Dimana D = daya beda

Ba = kelompok atas yang menjawab benar

Bb = kelompok bawah yang menjawab benar

T = peserta tes (jika jumlah ganjil = T-1)

Jika jumlah peserta banyak, maka kelompok atas dan bawah masing-masing diambil 27%. Untuk

memudahkan analisis, apabila jumlah peserta besar maka kelompok dibuat menjadi tiga, yakni:

kelompok atas, tengah dan bawah.

Andaikan jumlah seluruh peserta tes 10 orang. Untuk soal nomor X misalnya, kelompok

atas yang menjawab benar adalah 4 orang dan kelompok bawah yang menjawab benar hanya

satu orang, maka proporsi kelompok atas yang menjawab benar adalah 0,8 dan proporsi

kelompok bawah yang menjawab benar adalah 0,2. Jadi daya beda soal nomor X adalah:

0,8 – 0,2 = 0,6 atau dapat dihitung dengan rumus:

D = (4 – 1)/5 = 0,6

Koefisien atau indeks daya beda berkisar antara –1 sampai dengan +1. Daya beda

berharga +1 berarti semua kelompok atas menjawab benar dan semua kelompok bawah

menjawab salah terhadap suatu butir soal. Sebaliknya untuk daya beda yang berharga –1. Harga

daya beda yang dianggap masih memadai untuk sebutir soal adalah 0,25. Kurang dari 0,25,

butir soal dianggap kurang mampu membedakan peserta tes yang siap menghadapi tes dari

peserta yang tidak siap. Jika daya beda negatif, maka butir soal tidak dapat digunakan untuk

mengukur hasil belajar siswa. Sehingga butir soal ini harus dibuang atau tidak dihitung dalam

Page 18: EVALUASI HASIL BELAJAR

penentuan skor mahasiswa. Jadi, makin tinggi daya beda suatu butir soal, makin baik butir soal

tersebut, dan sebaliknya makin rendah daya beda makin tidak baik butir soal tersebut.

6.1.1.3 Berlaku Tidaknya Pilihan

Dalam tipe soal obyektif, khususnya untuk soal pilihan ganda, untuk menentukan

berfungsi tidaknya pengecoh suatu butir soal, maka butir soal tersebut perlu dianalisis. Untuk

menganalisis setiap butir soal tersebut, lembar jawaban peserta kelompok atas dan bawah

dijadikan sebagai sumber informasi. Distribusi dari jawaban kedua kelompok ini untuk setiap butir

soal dimasukkan dalam satu tabel 6-1 berikut:

Andaikan butir soal nomor 12

Tabel 6-1 : Distribusi jawaban soal nomor 12

Pilihan

Kelompok A* B C D E

Atas 3 0 1 0 0

Bawah 1 1 1 2 1

Jumlah 4 1 2 2 1

Jawaban yang benar adalah A (tanda *), jumlah peserta yang memilih A adalah banyak,

khususnya untuk kelompok atas. Pengecoh B, C, D, dan E ada yang memilih terutama kelompok

bawah. Jadi dapat disimpulkan bahwa pengecoh berfungsi sebagai jawaban yang salah.

Sehingga semua pilihan pada soal nomor 12 sudah berfungsi.

Andaikan tabel di atas jumlah yang menjawab benar A lebih banyak kelompok bawah,

maka pilihan ini harus diperbaiki. Apabila pada pengecoh ditemukan kelompok atas lebih banyak

dibandingkan kelompok bawah, pilihan ini juga kurang baik dan perlu diperbaiki. Selain itu, bila

pada pengecoh tidak ada satupun yang memilih, maka pilihan ini harus diperbaiki pula.

Dari uraian di atas, cocokkan secara bersama jawaban THB tentang besaran, satuan

dan angka penting anda di kelas, kemudian kerjakan bersama tugas 9 berikut di kelas.

6.1.2 Spesifikasi Butir Soal

Untuk menganalisis suatu butir soal ada dua spesifikasi yang harus dipertimbangkan,

yakni: validitas isi dan keakuratan pengukuran tujuan yang ingin dicapai.

Tugas 9:

a. Tentukan tingkat kesukaran setiap butir soal!b. Tentukan daya beda setiap butir soal dan tentukan pula kelayakannya untuk

digunakan sebagai THB!c. Apakah pada butir-butir soal obyektif ada pilihan-pilihan yang perlu diperbaiki?

Sebutkan!

Page 19: EVALUASI HASIL BELAJAR

Validitas isi (konten) pelajaran sangat diperlukan untuk menentukan apakah suatu butir

soal merupakan alat ukur yang baik untuk suatu hasil belajar tertentu. Analisis validitas isi ini

hanya bisa dilakukan oleh seorang yang menguasai bidang studi tersebut dengan baik. Analisis

dimulai dengan mengadakan kajian terhadap kisi-kisi soal. Dalam kisi-kisi itu ditentukan bahwa

butir soal tertentu dimaksudkan untuk mengukur pokok bahasan atau sub pokok bahasan

tertentu. Jadi kisi-kisi soal digunakan sebagai tolok ukur untuk memvalidasi butir soal.

Selain memvalidasi, aspek yang harus dianalisis secara kualitatif oleh seorang ahli bidang

studi adalah apakah butir soal yang digunakan apakah mengukur tujuan pendidikan tertentu yang

ditetapkan dalam kisi-kisi. Untuk menganalisis ini perlu penguasaan tentang tujuan pendidikan.

Yang perlu diperhatikan bahwa butir soal yang tidak secara akurat mengukur tujuan yang telah

ditetapkan akan merupakan butir soal yang sia-sia. Berbahayanya, bila butir soal itu digunakan

untuk menentukan keputusan bagi seseorang, hal ini akan berakibat jauh bagi siswa di masa

yang akan datang. Di Indonesia, perumusan tujuan pendidikan masih cenderung mengacu pada

tujuan pendidikan menurut Bloom dan kawan-kawan.

6.2 Karakteristik Perangkat Tes

Meskipun suatu tes terdiri atas butir-butir soal yang baik, belum tentu akan membuat

perangkat tes (soal ujian) menjadi baik. Selain penilaian terhadap setiap butir soal, ada dua hal

yang harus diperhatikan dalam menilai soal ujian, yakni: validitas dan reliabilitasnya. Kedua hal ini

dapat dijelaskan sebagai berikut.

6.2.1 Reliabilitas Tes

Ketika kita mengamati skor hasil tes siswa, muncul pertanyaan atau keraguan pada diri

kita, yaitu apakah skor itu benar-benar menggambarkan tingkat kemampuan siswa kita. Keraguan

atau pertanyaan ini sulit dijawab, karena dalam setiap tes selalu akan terdapat unsur kekeliruan

(error). Kekeliruan ini bisa bersumber pada alat ukurnya atau mungkin faktor yang lain. Untuk

melihat apakah perangkat tes itu dapat dipercaya sebagai alat ukur yang dapat menggambarkan

kemampuan peserta tes, maka dapat dilihat dari aspek reliabilitasnya. Secara umum, reliabilitas

dimaknai sebagai sejauh mana suatu alat ukur dapat diyakini memberikan informsi yang

konsisten (ajeg) dan tidak mendua tentang karakteristik peserta tes yang diujikan.

Skor yang diperoleh peserta es pada dasarnya merupakan skor yang secara langsung

berhubungan dengan alat ukur dan kondisi eksternal saat tes berlangsung. Kondisi eksternal

tidak dapat didefinisikan sepenuhnya, begitupula alat ukur yang digunakan tidak dapat diketaui

sepenuhnya kekuatan dan kelemahannya. Sehingga skor yang diperoleh peserta tes adalah skor

yang kemungkinan besar mengandung kekeliruan yang tidak dapat diketahui. Andaikan skor

peserta tes itu tidak mengandung unsur kekeliruan, maka skor itu merupakan skor yang

sesungguhnya. Tetapi skor sesungguhnya itupun tidak kita ketahui. Untuk itu kita kenal adanya

tiga bentuk skor dalam setiap hasil tes, yaitu: skor yang diperoleh (obtained score), skor

Page 20: EVALUASI HASIL BELAJAR

sesungguhnya (true score), dan kekeliruan skor (score error). Hubungan ketiganya dinyatakan

dengan:

Skor yang diperoleh = skor sesungguhnya – kekeliruan

Secara operasional reliabilitas tes didefinisikan sebagai koefisien korelasi antara dua

perangkat skor yang dihasilkan oleh perangkat tes yang sama atau paralel yang

diadministrasikan kepada sekelompok peserta tes yang sama. Karena reliabilitas merupakan

salah satu bentuk khusus korelasi yang menggambarkan keajegan alat ukur (tes), maka ada

beberapa prosedur untuk memperoleh koefisien korelasi yang menggambarkan reliabilitasnya.

Reliabilitas tes dapat ditinjau dari unsur stabilitas, ekuivalensi dari dua tes yang paralel, dan

konsistensi atau homogenitas tes.

Reliabilitas ditinjau dari stabilitas dapat ditentukan dengan mengkorelasikan anatardua

skor dari satu tes yang diadministrasikan dua kali kepada kelompok peserta tes yang sama.

Selang waktu antara dua pengadministrasian tes harus dekat, mengapa?

Reliabilitas dalam arti ekuivaensi dari dua tes yang paralel. Dalam hal ini, kita harus

mengkonstruk dua perangkat tes yang paralel. Kedua perangkat tes diadministrasikan pada

kelompok peserta tes yang sama dalam waktu berurutan. Hasil tes dari dua perangkat tes

tersebut dikorelasikan.

Reliabilitas dalam arti konsistensi tes merupakan koefisien korelasi yang menunjukkan

seberapa jauh suatu perangkat tes homogen, dalam arti mengukur mata pelajaran atau bidang

studi yang sama. Untuk menentukan koefisien korelasi ini dapat dilakukan dengan dua cara,

yaitu: teknik split-half dan teknik Kuder-Richardson (KR). Teknik split-half dapat dilakukan dengan

mengkorelasikan skor setengah pertama dengan skor setengah kedua dari suatu tes. Untuk

memperoleh skor setengah pertama dan kedua dapat dilakukan dengan mengkorelasikan skor

pada nomor ganjil dan nomor genap. Tenik Kuder-Richardson dikembangkangkan oleh Kuder

dan Richardson, dengan rumus ke-20nya (KR-20):

n SB2 - pq

KR-20 = [ ]

n-1 SD2

dimana n = butir soal

SB = simpangan baku skor-skor tes

p = tingkat kesukaran tes (perangkat tes)

q = 1 - p

Setelah anda mempelajari reliabilitas tes di atas, diskusikan dan kerjakan secara

kelompok tugas 10 berikut ini.

Page 21: EVALUASI HASIL BELAJAR

6.2.2 Validitas Tes

Seperti halnya pada butir soal, perangkat tes yang baik juga harus memenuhi kriteria

valid (tepat). Validitas tes didefinisikan sebagai seberapa jauh perangkat tes itu berguna dalam

mengambil keputusan yang relevan dengan tujuan yang telah ditentukan. Untuk tes hasil belajar,

aspek validitas yang paling penting adalah validitas isi (content validity), yaitu: ukuran yang

menunjukkan sejauh mana skor dalam tes berasosiasi dengan penguasaan peserta dalam

bidang studi yang diuji melalui perangkat tes tersebut. Validitas isi ini ditentukan oleh ahli yang

menguasai bidang studi tersebut. Jadi untuk validitas ini analisisnya lebih bersifat kualitatif. Oleh

karena itu, yang bisa menganalisis tes harus orang mempunyai latar belakang bidang studi yang

baik.

Selain validitas isi, juga kita kenal jenis validitas tes yang lain, yaitu: validitas prediktif,

validitas serempak, dan validitas konstruk. Ketiga jenis validitas tersebut tidak dibahas di sini

karena ketekaitannya dengan keperluan terhadap penilaian perangkat tes hasil belajar tidak

terlalu kuat.

Setelah anda mempelajari validitas tes, diskusikan secara kelompok tugas 11 berikut.

SUMBER

Bloom B. S., Madaus G. F., dan Hastings, Evaluation to Improve Learning, McGraw-Hill Book Company, New York.

Depdikbud., 1995, Kurikulum Sekolah Menengah Umum: GBPP Mata Pelajaran Fisika, Depdikbud., Jakarta.

Djamarah S. B. & Zain A., 1995, Strategi Belajar Mengajar, Rineka Cipta, Jakarta.

Farmer W. A., Farrel M. A., (1980), Systematic Instruction in Science for The Middle and High School Years, Addison-Wesley Publishing Company, Inc., Sydney.

Giancoli D., 1995, Physics, Fourth edition, Prentice-Hall International, Inc., Englewood Clifs, New Jersey.

Tugas 10:

a. Apakah penskoran tes yang kurang obyektif berpengaruh terhadap reliabilitas tes? Jelaskan.

b. Apakah peserta tes yang bervariasi berpengaruh terhadap reliabilitas tes? Jelaskan.c. Apakah jumlah butir soal dalam perangkat tes berpengaruh terhadap reliabilitas tes?

Jelaskan.

Tugas 11: Apakah reliabilitas tes berpengaruh terhadap validitas tes? Jelaskan.

Page 22: EVALUASI HASIL BELAJAR

Kertiasa N, 1993, Fisika 1 untuk Sekolah Menengah Umum Kelas 1, Depdikbud., Jakarta.

Trowbridge L. W., Bybee R. W., 1990, Becoming a Secondary School Science Teacher, Merrill Publishing Company, Columbus.

Zainul A., Nasoetion N., 1996, Program Pengembangan Keterampilan Teknik Instruksional (Pekerti): Penilaian Hasil Belajar, Depdikbud, Jakarta.

CATATAN: KERJAKAN TUGAS 1 S/D 11 DENGAN SUNGGUH-SUNGGUH DAN KUMPULKAN PADA PERTEMUAN BERIKUTNYA!!!!

Page 23: EVALUASI HASIL BELAJAR

Materi Kuliah

EVALUASI HASIL BELAJAR:

(Tes Hasil Belajar)

Handout digunakan terbatas untuk:

Matakuliah Evaluasi Hasil belajar Fisika

Oleh:

Indrawati

(Staf Pengajar Pendidikan Fisika FKIP Unej)

Jember, 2010

Page 24: EVALUASI HASIL BELAJAR