makalah reliabilitas
TRANSCRIPT
RELIABILITAS
A. Pengertian Reliabilitas
Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian
pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran
yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes
adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat
dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun
diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu
tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah
kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi
diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara
mengukur atau mengamati sama – sama memegang peranan penting dalam waktu
yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka
dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat
dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hsil
yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relative
sama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan
oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat
ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.
Berkaitan dengan penilaian, suatu alat penilaian disebut reliabel jika hasil
penilaian tersebut relative tetap jika digunakan untuk subjek yang sama. Yang sering
ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan
sebagai “sama”. Dalam pembicaraan penilaian ini tidak demikian. Ajeg atau tetap
tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan Si A
mula – mula berada lebih rendah dibanding dengan si B, maka jika diadakan
pengukuran ulang, si A juga berada lebih rendah dari B. itulah yang dikatakan ajeg
atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain.
Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan
tingginya reliabilitas instrumen.
RELIABILITAS Page 1
Sehubungan dengan reliabilitas ini, Scarvia . Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini sangat
penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena
menyongkong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid.
Sebalinya, sebuah tes yang valid biasanya reliabel.
Apa yang dimaksud reliabilitas instrumen riset?
Reliabilitas suatu instrumen pengukuran adalah tingkatan konsistensi yang
mengukur apakah ini merupakan ukuran. Kualitas ini adalah penting dalam jenis
pengukuran. Seseorang yang mempergunakan instrumen pengukuran semacam itu
harus mengidentifikasi dan mempergunakan teknik-teknik yang akan membantunya
menentukan apa perluasan instrumen pengukurannya yang sesuai dan reliabel.
Sebagaimana sebuah cara membedakan konsep reliabilitas dari konsep
validitas, hal yang berguna adalah mengidentifikasi kesalahan acak pengukuran.
Kesalahan acak adalah kesalahan yang merupakan suatu hasil perubahan yang
murni. Kesalahan acak pengukuran mungkin menekan skor subyek dalam persoalan
yang tak dapat diprediksi. Reliabilitas adalah mengenai pengaruh kesalahan acak
pengukuran dalam konsistensi skor. Namun beberapa kesalahan yang dicakup dalam
pengukuran dapat diprediksi atau sistematis.
Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan
keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan
yang berbeda.
Bagaimana Hubungan Antara Validitas Dan Reliabilitas ?
Validitas adalah sebuah evaluasi terhadap ketepatan interpretasi dan
penggunaan hasil asesmen. Validitas mempunyai arti sejauh mana ketepatan dan
kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain validitas, alat ukur
yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah alat ukur
yang valid dan reliabel.
Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk
memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid).
Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu
secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang
RELIABILITAS Page 2
dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat
memberikan informasi yang salah tentang apa yang ingi anda ukur. Sebagai ilustrasi
berikut ini disajikan hasil perlombaan memanah yang diikuti oleh Aldi, Reni dan
Fano. Dari 10 anak panah yang telah mereka lepaskan diperoleh hasil sebagai
berikut :
Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan
siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan
RELIABILITAS Page 3
reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah
dijelaskan di depan, maka anda akan dapat menjawab ketiga pertanyaan tersebut.
Hasil bidikan Reno adalah hasil bidikan yang tidak valid dan tidak reliabel.
Mengapa? Hal ini disebabkan karena dari 10 anak panah yang dilepaskan Reni selalu
mengenai sasaran yang berbeda.
Bagaimana hasil bidikan Fano? Kalau anda perhatikan hasil bidikan Fano
ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat
mengenai sasaran. Walaupun ke 10 anak panah yang dilepaskan tidak tepat pada
sasaran yang di tentukan, tetpai hasil bidikan Fano selalu mengenai sasaran yang
relative sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah
dijelaskan didepan maka dapat dikatakan bahwa hasil bidikan Fano adalah tidak
valid tetapi reliabel. Hasil bidikan Aldi lah yang dikatakan valid dan reliabel.
Mengapa ? Hal ini disebabkan karena ke 10 hasil bidikan Aldi tepat dan tetap
mengenai sasaran yang ditentukan.
B. Pelaksanaan Tes Untuk Menentukan Reliabilitas
Untuk mengestimasi reliabilitas suatu alat penilaian (tes dan non tes) ada tiga
cara yang paling banyak dipergunakan, yaitu tes tunggal (single test), tes ulang (test
re-test), dan tes ekuivalen (alternate test).
1. Tes Tunggal (single Test)
Tes tunggal adalah tes yang terdiri dari satu perangkat (satu set) yang
diberikan terhadap sekelompok subyek dalam satu kali pelaksanaan. Dengan
demikian hasil tes ini hanya terdapat satu kelompok data berupa skor hasil tes.
Ada bermacam – macam teknik yang bisa digunakan untuk menentukan
reliabilitas jenis tes tunggal ini.
2. Tes Ulang (test re-test)
Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan kepada
sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara
mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang adalah
penggunaan tes yang sama dua kali pada sejumlah peserta tes yang sama).
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri
tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua
RELIABILITAS Page 4
kali, maka metode ini dapat disebut dengan single-test-double-trial method.
Kemudian hasil dari kedua tes tersebut dihitung korelasinya.
3. Tes Ekuivalen (alternate test)
Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal – soal
pada perangkat pertama ekuivalen dengan soal – soal pada perangkat kedua.
Pengertian ekuivalen disini adalah soal – soal yang memuat konsep yang sama,
tetapi soal tersebut tidak persis sama. Selain memuat konsep yang sama, tingkat
kesukarannya pun harus sama. Misalkan untuk soal pemfaktoran suku tiga
bentuk x2−5 x+6 ekuivalen dengan bentuk x2−6 x+8 , tetapi tidak ekuivalen
dengan bentuk 5 x2+7 x−4 sebab meskipun konsep suku tiga dan pemfaktoranya
sama tetapi tingkat kesukarannya berbeda. Untuk menentukan reliabilitasnya
dihitung dengan cara mengkorelasikan hasil tes untuk soal perangkat pertama
dengan hasil tes dari perangkat kedua.
Tes parallel atau tes ekuivalen bisa juga adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method
(parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel,
misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan
pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien
korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes
Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode
paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing
dicobakan pada kelompok siswa yang sama.
C. Jenis – Jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur
reliabilitas, yaitu :
1. Reliabilitas Stabilitas.
Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap
orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini
menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur
pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk
RELIABILITAS Page 5
dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah
sama atau hampir sama.
2. Reliabilitas Terwakili
Mengacu pada keterandalan masing-masing grup. Menguji apakah
penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang
berbeda-beda.
3. Reliabilitas Seimbang (equivqlence reliability)
Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran
yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama
tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional,
peralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama
bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-
tengah.
Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan
yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-
pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau
pengubahan sering digunakan untuk teknik belah tengah ini). Hasil masing-
masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing
bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing
bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah
reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik
pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan
pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor
yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang
tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila
tekanan darahnya yang diukur.
D. Faktor – Faktor Yang Mempengaruhi Reliabilitas
1. Jumlah butir soal
Banyaknya soal pada suatu instrumen ikut mempengaruhi derajat
reliabilitasnya. Semakin banyaknya soal-soal maka tes yang bersangkutan
cenderung semakin menjadi reliabel.
RELIABILITAS Page 6
2. Homogenitas Soal Tes
Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya
tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi
berbeda isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan
dan yang satunya tentang kemampuan fisika akan menghasilkan tingkat
reliabilitas yang berbeda. Tes fisikan cenderung menghasilkan tingkat reliabilitas
yang lebih tinggi daripada tes kebahasaan karena dari segi isi kemampuan
menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.
3. Waktu Yang diperlukan untuk menyelesaikan Tes
Semakin terbatasnya waktu dalam pengerjaan tes maka akan mendorong tes
untuk memiliki reliabilitas yang tinggi.
4. Keseragaman Kondisi Pada Saat Tes Diberikan
Kondisi pelaksanaan tes yang semakin seraga akan memunculkan reliabilitas
yang makin tinggi
5. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes
Bahwa soal-soal dengan tingkat kesukaran sedang cenderung lebih reliabel
dibandingkan dengan soal-soal yang sangat sukar atau sangat mudah
6. Heterogenitas Kelompok
Semakin heterogen suatu kelompok dalam pengerjaan suatu tes maka tes
tersebut cenderung untuk menunjukkan tingkat reliabilitas yang tinggi
7. Motivasi Individu
Motivasi masing-masing individu dalam mengerjakan suatu instrumen akan
mampu mempengaruhi realibilitas. Perbedaan motiviasi antar individu dalam
kelompok akan menimbulkan kesalahan acak pada pengukurannya karena
individu yang tidak memiliki motivasi tidak akan mengerjakan instrumen tersebut
dengan sungguh-sungguh sehingga jawaban yang diberikan tidak akan
mencerminkan kenyataan yang sebenarnya.
8. Variabilitas Skor
Instrumen yang menghasilkan rentangan skor yang lebh luas atau lebih
tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada
menghasilkan rentangan skor yang lebih sempit , seperti bentuk pilihan ganda
cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk
benar – salah
RELIABILITAS Page 7
Faktor – Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur.
2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah.
4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil yang sama.
E. Cara – cara Mencari Besarnya Reliabilitas
1. Pendekatan Tes Tunggal Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam 2 (dua) macam
teknik, yaitu Teknik Belah Dua (Spilt-Half Technique) danTeknik Non Belah Dua
(Non Spilt-Half Techique).
a. Teknik Belah Dua
Dalam menentukan reliabilitas suatu tes dengan menggunakan teknik belah
dua, dilakukan dengan cara membelah tes tersebut menjadi dua bagian yang
sama (relative sama), sehingga masing – masing peserta tes memiliki dua macam
skor. Kedua macam skor itu adalah skor untuk bagian (belahan) pertama dan
kelompok skor untuk belahan kedua dari tes tadi. Dengan demikian ada dua
kelompok skor untuk sekelompok peserta tes.
Karena kedua belahan harus sama, maka salah satu syarat yang harus
dipenuhi untuk teknik belah dua ini adalah banyaknya butir soal dalam tes
tersebut harus genap, supaya kedua bagian itu banyaknya butir soal sama.
Ada dua cara untuk membelah banyaknya butir soal tes, yaitu :
RELIABILITAS Page 8
1. Membelah atas item – item (butir – butir) genap dan item – item (butir –
butir) ganjil yang selanjutnya disebut belahan ganjil genap.
2. Membelah atas item – item (butir – butir) awal dan item – item (butir –
butir) akhir yaitu separoh junlah pada nomor-nomor awal dan separo pada
nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.
Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan
hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada
seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili
reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat
digunakan untuk mengoreksi koefisien yang didapat.
Seperti halnya koefisien validitas yang telah dibahas pada bab terdahulu,
untuk koefisien reliabilitas yang menyatakan tingkat keterandalan tes,
dinyatakan dengan r11. Tolak ukur menginterprestasikan tingkat reliabilitas tes
dapat digunakan tolak ukur yang dibuat oleh Guilford (1956) sebagai berikut :
0,80<r11 ≤1,00 reliabilitas sangat tinggi
0,60<r11 ≤0,80 reliabilitas tinggi
0,40<r11 ≤0,60 reliabilitas sedang
0,20<r11 ≤0,40 reliabilitas rendah
r11 ≤ 0,20 reliabilitas sangat rendah
Untuk menentukan koefisien reliabilitas suatu tes dengan teknik belah dua,
ada tiga macam teknik perhitungan, yaitu formula Spearman – Brown, Formula
Flanagan, dan formula Rulon.
Formula Spearman – Brown
Prinsip penggunaan formula Spearman – Brown adalah menghitung koefisien
korelasi di antara kedua belahan sebagai koefisien reliabilitas bagian (setengah)
dari tes tersebut, yang dinotasikan dengan (r ½ ½) . Untuk menghitung (r ½ ½) bisa
digunakan rumus product moment dengan angka kasar dari karl Pearson, yaitu :
RELIABILITAS Page 9
r ½ ½ ¿ N∑ XY−¿¿¿
N = banyaknya subyekX = Kelompok data belahan pertamaY = Kelompok data belahan kedua
Untuk menghitung koefisien reliabilitas suatu tes keseluruhan, Spearman –
Brown mengemukakan rumus :
Dengan r11 : reliabilitas Instrumen
r ½ ½ : Indeks Korelasi antara dua belahan Instrumen
Syarat yang harus dipenuhi dalam menggunakan rumus di atas adalah
butir soal pada kedua belahan harus setara, yaitu banyaknya butir soal harus
sama, memiliki rata – rata nilai sama, mempunyai variabilitas yang sama, dan
bentuk distribusi frekuensi yang sama pula. Untuk mendekati kondisi tersebut
soal harus disusun sedemikian rupa sehingga butir soal pada belahan pertama
dengan pasangannya pada belahan kedua memuat konsep yang sama, dengan
indikator yang sama pula. Sehingga setiap butir berpasangan kesetaraannya
pada kedua belahan itu.
Contoh perhitungan reliabilitas dengan Formula Spearman – Brown :
No. Subyek Skor Item1 2 3 4 5 6 7 8 9 10
1 A 3 4 3 4 4 3 3 3 3 32 B 4 3 3 4 3 3 3 3 3 33 C 2 2 1 3 2 2 3 1 2 34 D 3 4 4 3 3 3 4 3 3 45 E 3 4 3 3 3 4 3 4 4 36 F 3 2 4 4 3 4 4 3 4 47 G 2 3 3 4 4 4 3 4 3 28 H 1 2 2 1 2 2 1 3 4 39 I 4 2 3 3 4 2 1 1 4 410 J 3 3 3 4 4 4 4 4 3 311 K 4 4 3 4 4 3 4 4 4 212 L 3 2 1 2 3 1 1 2 3 313 M 4 3 4 3 3 4 3 3 3 414 N 2 3 3 4 4 4 3 2 3 415 O 3 4 3 2 3 2 4 3 3 3
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil – genap adalah
sebagai berikut
Subyek Skor Skor X . Y
RELIABILITAS Page 10
Item Ganjil(X)
Item Genap(Y)
A 16 17 272B 16 16 256C 10 11 110D 17 17 289E 16 18 288F 18 17 306G 15 17 255H 10 11 110I 16 12 192J 17 18 306K 19 17 323L 11 10 110M 17 17 289N 15 17 255O 16 14 224
∑ X=229 ∑Y =229 ∑ X .Y =3585 ∑ X2=3603 ∑Y 2=3609
r=N∑ XY−¿¿¿
¿ 15 x 3585−229 x229
√(15 x 3603−52441 )(15 x3609−52441)
¿ 1334
√1604 : 1694
¿ 13341648,386
=0,809
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diperoleh bahwa rxy = 0,809. Harga tersebut baru menunjukkan reliabilitas
separo tes. Sehingga r ½ ½ = 0,809. Untuk mencari reliabilitas seluruh tes
digunakan rumus formulasi Spearman – Brown sebagai berikut :
r11=2 r 1
212
1+r 12
12
=2x 0,8091+0,809
=1,6181,809
=0,895
Jika dihitung dengan teknik belah dua metode awal – akhir, akan diperoleh dua
kelompok data seperti tabel di bawah ini :
Subyek SkorBagian Awal
(X)
SkorBagian Akhir
(Y)
X . Y
A 18 15 270B 17 15 255C 10 11 110D 17 17 289E 16 18 288
RELIABILITAS Page 11
F 16 19 304G 16 16 256H 8 13 104I 16 12 192J 17 18 306K 19 17 323L 11 10 110M 17 17 289N 16 16 256O 15 15 225
∑ X=229 ∑Y =229 ∑ X .Y =3577
∑ X2=3631 ∑Y 2=3597
r=N∑ XY−¿¿¿
¿ 15 x 3577−229 x 229
√(15 x 3631−52441 )(15 x3597−52441)
¿ 1214
√2024 :1514
¿ 12141750,48
=0,6935
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diperoleh bahwa rxy = 0,6935. Harga tersebut baru menunjukkan reliabilitas
separo tes. Sehingga r ½ ½ = 0,6935. Untuk mencari reliabilitas seluruh tes
digunakan rumus formulasi Spearman – Brown sebagai berikut :
r11=2 r 1
212
1+r 12
12
=2 x 0,69351+0,6935
= 1,3871,6935
=0,819
Dari kedua contoh perhitungan diatas ternyata hasilnya ada perbedaan, tetapi jika
dirujuk pada tolak ukur reliabilitas, keduanya menunjukkan tingkat reliabilitas
yang sama, yaitu tergolong tinggi. Jadi reliabilitas tes soal tersebut adalah tinggi
atau baik.
Formula Flanagan
Menghitung reliabilitas tes dengan menggunakan rumus formula Flanagan
tidak didasarkan atas nilai korelasi antara kedua belahan tes, melainkan
didasarkan atas varians masing – masing belahan dan varians totalnya. Untuk
menghitung koefisien reliabilitas tes, Flanagan mengemukakan formula :
RELIABILITAS Page 12
r11=2(1− S12+S2
2
S t2 )
Keterangan :
r11=¿ koefisien reliabilitas seluruh tes
S12=¿ varians belahan pertama
S22=¿ varians belahan kedua
St2=¿ varians skor total
Untuk menghitung varians digunakan rumus sebagai berikut :
S2=∑ X
2−
(∑ X )2
NN
Sebagai contoh dalam menggunakan formulasi Flanagan ini akan dihitung
koefisien reliabilitas untuk tes dengan data seperti di atas dengan menggunakan
metode ganjil – genap.
Subyek SkorItem Ganjil
(X)
SkorItem Genap
(Y)
SkorTotal(Xt)
A 16 17 33B 16 16 32C 10 11 21D 17 17 34E 16 18 34F 18 17 35G 15 17 32H 10 11 21I 16 12 28J 17 18 35K 19 17 36L 11 10 21M 17 17 34N 15 17 32O 16 14 30
∑ X=229 ∑Y =229 ∑ X t=458 ∑ X2=3603 ∑Y 2=3609
RELIABILITAS Page 13
∑ X t2=14382
Sx2=7,1287 SY
2 =7,5287 St2=26,5153
Setelah diperoleh nilai – nilai varians dari data belahan 1, belahan 2, dan varians
total kemudian dimasukkan ke dalam rumus.
r11=2(1− S12+S2
2
S t2 )
r11=2(1−7,1287+7,528726,5153 )
r11=2(1−146,57426,5153 )=0,9
Jika dirujuk pada tolak ukur reliabilitas tergolong tinggi.
Formula Rulon
Formula Rulon didasarkan atas konsep perbedaan antara skor subyek pada
belahan pertama dan kedua, yang dapat dipandang sebagai kekeliruan (error) dari
proses penilaian. Dengan demikian varians yang diperhitungkan adalah varians
perbedaan skor antara kedua belahan itu, yaitu varians kekeliruan. Rumus Rulon
sebagai berikut :
r11=1−Sd
2
St2
Keterangan :Sd
2=¿ Varians selisih skor subyek pada kedua belahan
St2=¿ Varians skor totalUntuk penggunaan rumus tersebut, kita menggunakan kembali data hasil tes
di atas dengan metode awal – akhir. Data yang harus dipersiapkan disusun dalam
bentuk tabel seperti dibawah ini.
Subyek SkorBagian Awal
(X)
SkorBagian Akhir
(Y)
d=|X−Y|X t
A 18 15 3 33B 17 15 2 32C 10 11 -1 21D 17 17 0 34E 16 18 -2 34F 16 19 -3 35G 16 16 0 32H 8 13 -5 21I 16 12 4 28J 17 18 -1 35K 19 17 2 36
RELIABILITAS Page 14
L 11 10 1 21M 17 17 0 34N 16 16 0 32O 15 15 0 30
Sd=2,22 St=5,15
Sd2=4,93 St
2=26,51
Selanjutnya dimasukkan ke dalam rumus :
r11=1−Sd
2
St2
r11=1− 4,9326,51
=0,8 1
Jika dirujuk pada tolak ukur reliabilitas, tergolong sangat tinggi.
b. Teknik Non Belah Dua
Pakar yang mengemukakan teknik non belah dua adalah Kuder dan
Richardson. Mereka berpendapat bahwa teknik belah dua kurang baik dalam
mencari koefisien reliabilitas, sebab bisa dilakukan dengan cara yang berbeda
sehingga menghasilkan yang berbeda pula. Disamping itu dalam
pelaksanaannya, teknik belah dua sulit sekali memperoleh dua belahan yang
setara satu sama lain. Untuk menghindari hal tersebut, Kuder dan Richardson
mengemukkan cara untuk menghitung koefisien reliabilitas tanpa membelah tes
menjadi dua bagian, tetapi membagi tes menurut banyak nya butir soal yang
disajikan, yaitu dengan menganalisis masing – masing butir soal tersebut. Rumus
yang digunakan untuk menghitung koefisien reliabilitas tes tanpa membelah tes
menjadi bagian adalah rumus KR-20 dan KR-21.
Rumus KR-20
r11=[ nn−1 ][ S t
2−∑ pi qi
st2 ]
Keterangan :
n=¿ banyaknya butir soal
pi=¿ proporsi banyak subyek yang menjawab benar pada butir soal ke - i
q i=¿ proporsi banyak subyek yang menjawab salah pada butir soal ke - i
RELIABILITAS Page 15
St2=¿ vaarians skor total
r11=¿ koefisien reliabilitas
Sebagai contoh kita gunakan hasil tes matematika yang terdiri dari 15 butir
soal yang diikuti 10 subyek siswa seperti yang digunakan sebelumnya. Tabel di
bawah ini adalah tabel persiapan untuk menghitung koefisien reliabilitas dengan
KR-20.
Tabel persiapan penggunaan rumus KR-20.
No Nama Nomor soal Total1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 Aan N. Efendi 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 102 Arif Kristanto 0 1 1 1 1 0 0 0 0 0 0 1 0 1 0 63 Bayu Inggar 0 1 1 0 1 1 0 0 1 1 1 1 1 0 0 94 Aulia 0 1 1 1 1 1 0 0 1 1 1 0 0 0 1 95 Novita 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 66 Septian Hadi 0 1 1 1 1 0 0 0 1 1 0 1 0 1 0 87 Riska Maulana 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 138 Adi Susianto 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 149 Meydin Kartika 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1010 Riswanda 1 1 0 0 1 1 1 0 1 1 1 0 1 0 1 10
np6 10 6 6 10 7 3 0 8 8 6 7 5 6 7 ∑ X t=¿
95
∑ X t2=¿
963
∑ pi q i=¿ 2,61
nq4 0 4 4 0 3 7 10 2 2 4 3 5 4 3
pi.6 1 .6 .6 1 .7 .3 0 .8 .8 .6 .7 .5 .6 .7
q i.4 0 .4 .4 0 .3 .7 1 .2 .2 .4 .3 .5 .4 .3
pi qi.24 0 .24 .24 0 .21 .21 0 .16 .16 .24 .21 .25 .24 .21
Keterangan : Untuk menyingkat tulisan 0,6 ditulis .6, 0,24 ditulis .24 dan
seterusnya.
Selanjutnya hasil perhitungan diatas dimasuk kan ke dalam rum,us KR-20
sebagai berikut:
r11=[ nn−1 ][ S t
2−∑ pi qi
st2 ]
r11=[ 1515−1 ][ 6,05−2,61
6,05 ]r11=1,07 x0,56=0,5992
Jika dirujuk pada tolak ukur reliabilitas, tergolong sedang.
Rumus KR-21
RELIABILITAS Page 16
r11=( nn−1 )(1−
X t (n−X t )nS t
2 )Keterangan :
n=¿ banyaknya butir soal
X t=¿ rata – rata skor total
St2=¿ varians skor total
r11=¿ koefisien reliabilitas
Keuntungan yang dapat diperoleh dari penggunaan rumus KR-21 adalah
kemudahan dalam membuat tabel persiapan karena data nilai yang dibutuhkan
hanyalah rata – rata dan varians skor total. Dengan menggunakan kalkulator akan
diperoleh :
X t=9,5 dan St2=6,05
Dimasukkan ke dalam rumus KR-21 di atas
r11=( nn−1 )(1−
X t (n−X t )nS t
2 )r11=( 15
15−1 )(1−9,5 (15−9,5 )15 (6,05) )
r11=1,07 x0,43=0,4601
Yang termasuk ke dalam kategori reliabilitas sedang.
F. Mencari Koefisien Reliabilitas Tes bentuk Uraian
Untuk mencari koefisien reliabilitas tes bentuk uraian tidak bisa dilakukan
seperti di atas karena penilaian tidak hanya diberikan pada hasil akhir, melainkan
dilakukan pula terhadap proses pengerjaannya. Oleh karena itu skor yang diperoleh
karena setiap soal tidak dikotomi (dua kategori benar atau salah). Skor yang
diperoleh untuk hasil pekerjaan siswa dinilai setiap soal dan setiap langkah
pengerjaan. Jadi skornya bisa berlainan tergantung dari setiap bobot soal. Rumus
yang digunakan untuk mencari koefisien reliabilitas tes bentuk uraian dikenal
dengan rumus alpha seperti debawah ini.
Rumus Alpha
RELIABILITAS Page 17
r11=( nn−1 )(1−
∑ Si2
S t2 )
Keterangan :
n=¿ banyaknya butir soal
∑ S i2=¿ jumlah varians skor setiap butir soal
St2=¿ varians skor total
r11=¿koefisien reliabilitas
Subyek
Nomor Soal Skor Total(X ¿¿ t)¿
1 2 3 4 5 6 7 8 9 10
A 10 10 9 10 4 10 10 6 10 4 83B 10 10 8 6 7 8 10 10 8 6 83C 10 8 10 10 6 10 5 6 4 9 78D 10 8 10 10 4 10 8 10 6 10 86E 10 10 10 8 10 7 8 7 9 8 87F 10 8 10 10 4 8 10 8 6 8 82G 10 10 6 10 4 7 10 10 10 10 87H 10 7 10 10 6 10 7 7 8 6 81I 10 10 10 10 10 10 10 9 10 9 98J 10 10 7 10 4 5 8 10 9 6 79
X i100 91 90 94 59 85 86 83 80 76 844
X i2 1000 841 830 900 401 751 766 715 678 614 71526
Si30 1,14 1,41 1,282 2,3 1,69 1,62 1,61 1,95 1,91 5,41
Si2 0 1,29 2 1,64 5,29 2,85 2,64 2,61 3,8 3,64 29,24
Dari data pada tabel di atas diperoleh
n=1 0
∑ S i2=0+1,29+2+1,64+5,29+2,85+2,64+2,61+3,8+3,6 4
¿25,76
St2=29,24
Dimasukkan ke dalam rumus alpha
r11=( nn−1 )(1−
∑ Si2
S t2 )
r11=( 1010−1 )(1−25,76
29,24 )r11=(1,11) (0,12 )=0,13
RELIABILITAS Page 18
Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat reliabilitasnya
sangat rendah.
G. ANCAMAN TERHADAP RELIABILITAS
Semua jenis instrumen tes atau nontes tidak terlepas kesalahan. Hal ini
berlaku untuk instrumen tes dalam ilmu-ilmu eksakta dan dalam ilmu-ilmu psikologi
dan pendidikan. Misalnya, dalam mengukur panjang dengan suatu penggaris,
mungkin ada kesalahan sistematis berhubungan dengan di mana titik nol dicetak
pada penggaris dan kesalahan acak berhubungan dengan kemampuan mata dalam
membaca tanda-tanda dan memperhitungkan tanda-tanda tersebut. Juga
memungkinkan bahwa panjang obyek dapat berubah dari waktu ke waktu dan pada
lingkungan yang berbeda (misalnya perubahan temperatur). Salah satu tujuan
penilaian adalah untuk mengurangi kesalahan tersebut hingga ke tingkatan yang
sesuai dengan tujuan tes. Tes yang beresiko tinggi (high-stakes tes), seperti ujian
untuk mendapatkan SIM, harus mempunyai kesalahan yang sangat kecil. Tes di
kelas dapat mentolerir kesalahan yang lebih tinggi secara wajar kesalahan tersebut
mudah dikoreksi sepanjang proses pengujian. Reliabilitas hanya mengacu pada
derajat tingkat kesalahan yang tidak sistematis, yang disebut kesalahan acak.
Ada tiga sumber kesalahan utama, yaitu: faktor dalam tes itu sendiri, faktor
siswa yang dites, dan faktor penskoran. Umumnya tes berisi suatu koleksi butir yang
mengukur keterampilan tertentu. Adakalanya guru secara khas menggeneralisasikan
masing-masing butir tes ke semua materi yang diukur oleh tes itu. Sebagai contoh,
jika seorang siswa dapat memecahkan beberapa permasalahan seperti 7x8, maka
mungkin akan disamaratakan kemampuannya dalam mengalikan angka tunggal
bilangan bulat. Juga mungkin akan menyamaratakan suatu kumpulan materi kepada
suatu domein yang lebih luas. Jika siswa dapat menyelesaikan penjumlahan,
pengurangan, perkalian, dan pembagian, maka mungkin akan disimpulkan bahwa
siswa tersebut mampu menyelesaikan operasi pecahan.
Kesalahan dapat pula disebabkan oleh pemilihan butir untuk mengukur
domein dan keterampilan tertentu. Materi yang tercakup dalam tes berbeda menurut
format masing-masing tes, kesalahan pensampelan, pembatasan butir tes, dan karena
menyamaratakan ke data yang tidak diamati, yakni, kemampuan siswa terhadap
keseluruhan butir yang mungkin terdapat dalam tes. Ketika keterampilan dan domain
yang diukur menjadi lebih rumit, mungkin akan terjadi lebih banyak kesalahan yang
RELIABILITAS Page 19
disebabkan oleh pensampelan materi. Sumber lain kesalahan tes adalah
ketidakefektifan pengecoh dalam tes pilihan ganda, seperti jawaban benar yang lebih
banyak, dan tingkat kesukaran butir tes.
Sebagai manusia, para siswa tidaklah selalu konsisten dan juga tidak terlepas
dari kesalahan dalam menyelesaikan tes. Apakah tes itu dimaksudkan untuk
mengukur kemampuan khusus atau kemampuan siswa secara optimal, perubahan
dalam berbagai hal seperti sikap siswa, kesehatan, dan rasa kantuk dapat
mempengaruhi kualitas usaha dan konsistensi siswa dalam menyelesaikan tes.
Sebagai contoh, peserta tes mungkin membuat kesalahan karena teledor, salah
menafsirkan petunjuk tes, melupakan instruksi tes, melupakan beberapa butir tes,
atau salah baca butir tes.
Kesalahan penskoran merupakan sumber sepertiga dari kesalahan potensial.
Pada bentuk tes objektif, penskoran bersifat mekanik, dan kesalahan penskoran harus
diperkecil. Pada tes uraian, sumber kesalahan meliputi ketidakjelasan rubrik
penskoran, ketidakjelasan apa yang diharapkan dari siswa, dan beberapa kesalahan
yang bersumber dari penilai. Para penilai tidaklah selalu konsisten, kadang-kadang
merubah ukuran-ukuran mereka selagi menskor, dan terkadang terpengaruh oleh hal-
hal yang tidak berhubungan dengan skor tes seperti efek halo, latar belakang siswa,
perbedaan persepsi, kebaikan hati atau kepelikan, dan kesalahan dalam penskalaan.
RELIABILITAS Page 20