makalah reliabilitas

RELIABILITAS

A. Pengertian Reliabilitas

Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian

pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran

yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes

adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat

dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun

diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu

tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.

Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien

tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah

kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi

diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara

mengukur atau mengamati sama – sama memegang peranan penting dalam waktu

yang bersamaan.

Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka

dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk

mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat

dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hsil

yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relative

sama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan

oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat

ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.

Berkaitan dengan penilaian, suatu alat penilaian disebut reliabel jika hasil

penilaian tersebut relative tetap jika digunakan untuk subjek yang sama. Yang sering

ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan

sebagai “sama”. Dalam pembicaraan penilaian ini tidak demikian. Ajeg atau tetap

tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan Si A

mula – mula berada lebih rendah dibanding dengan si B, maka jika diadakan

pengukuran ulang, si A juga berada lebih rendah dari B. itulah yang dikatakan ajeg

atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain.

Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan

tingginya reliabilitas instrumen.

RELIABILITAS

Sehubungan dengan reliabilitas ini, Scarvia . Anderson dan kawan-kawan

menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini sangat

penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena

menyongkong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid.

Sebalinya, sebuah tes yang valid biasanya reliabel.

Apa yang dimaksud reliabilitas instrumen riset?

Reliabilitas suatu instrumen pengukuran adalah tingkatan konsistensi yang

mengukur apakah ini merupakan ukuran. Kualitas ini adalah penting dalam jenis

pengukuran. Seseorang yang mempergunakan instrumen pengukuran semacam itu

harus mengidentifikasi dan mempergunakan teknik-teknik yang akan membantunya

menentukan apa perluasan instrumen pengukurannya yang sesuai dan reliabel.

Sebagaimana sebuah cara membedakan konsep reliabilitas dari konsep

validitas, hal yang berguna adalah mengidentifikasi kesalahan acak pengukuran.

Kesalahan acak adalah kesalahan yang merupakan suatu hasil perubahan yang

murni. Kesalahan acak pengukuran mungkin menekan skor subyek dalam persoalan

yang tak dapat diprediksi. Reliabilitas adalah mengenai pengaruh kesalahan acak

pengukuran dalam konsistensi skor. Namun beberapa kesalahan yang dicakup dalam

pengukuran dapat diprediksi atau sistematis.

Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan

keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan

yang berbeda.

Bagaimana Hubungan Antara Validitas Dan Reliabilitas ?

Validitas adalah sebuah evaluasi terhadap ketepatan interpretasi dan

penggunaan hasil asesmen. Validitas mempunyai arti sejauh mana ketepatan dan

kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain validitas, alat ukur

yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah alat ukur

yang valid dan reliabel.

Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk

memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid).

Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu

secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang

RELIABILITAS

dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat

memberikan informasi yang salah tentang apa yang ingi anda ukur. Sebagai ilustrasi

berikut ini disajikan hasil perlombaan memanah yang diikuti oleh Aldi, Reni dan

Fano. Dari 10 anak panah yang telah mereka lepaskan diperoleh hasil sebagai

berikut :

Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan

siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan

RELIABILITAS

reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah

dijelaskan di depan, maka anda akan dapat menjawab ketiga pertanyaan tersebut.

Hasil bidikan Reno adalah hasil bidikan yang tidak valid dan tidak reliabel.

Mengapa? Hal ini disebabkan karena dari 10 anak panah yang dilepaskan Reni selalu

mengenai sasaran yang berbeda.

Bagaimana hasil bidikan Fano? Kalau anda perhatikan hasil bidikan Fano

ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat

mengenai sasaran. Walaupun ke 10 anak panah yang dilepaskan tidak tepat pada

sasaran yang di tentukan, tetpai hasil bidikan Fano selalu mengenai sasaran yang

relative sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah

dijelaskan didepan maka dapat dikatakan bahwa hasil bidikan Fano adalah tidak

valid tetapi reliabel. Hasil bidikan Aldi lah yang dikatakan valid dan reliabel.

Mengapa ? Hal ini disebabkan karena ke 10 hasil bidikan Aldi tepat dan tetap

mengenai sasaran yang ditentukan.

B. Pelaksanaan Tes Untuk Menentukan Reliabilitas

Untuk mengestimasi reliabilitas suatu alat penilaian (tes dan non tes) ada tiga

cara yang paling banyak dipergunakan, yaitu tes tunggal (single test), tes ulang (test

re-test), dan tes ekuivalen (alternate test).

1. Tes Tunggal (single Test)

Tes tunggal adalah tes yang terdiri dari satu perangkat (satu set) yang

diberikan terhadap sekelompok subyek dalam satu kali pelaksanaan. Dengan

demikian hasil tes ini hanya terdapat satu kelompok data berupa skor hasil tes.

Ada bermacam – macam teknik yang bisa digunakan untuk menentukan

reliabilitas jenis tes tunggal ini.

2. Tes Ulang (test re-test)

Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan kepada

sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara

mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang adalah

penggunaan tes yang sama dua kali pada sejumlah peserta tes yang sama).

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.

Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri

tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua

RELIABILITAS

kali, maka metode ini dapat disebut dengan single-test-double-trial method.

Kemudian hasil dari kedua tes tersebut dihitung korelasinya.

3. Tes Ekuivalen (alternate test)

Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal – soal

pada perangkat pertama ekuivalen dengan soal – soal pada perangkat kedua.

Pengertian ekuivalen disini adalah soal – soal yang memuat konsep yang sama,

tetapi soal tersebut tidak persis sama. Selain memuat konsep yang sama, tingkat

kesukarannya pun harus sama. Misalkan untuk soal pemfaktoran suku tiga

bentuk x2−5 x+6 ekuivalen dengan bentuk x2−6 x+8 , tetapi tidak ekuivalen

dengan bentuk 5 x2+7 x−4 sebab meskipun konsep suku tiga dan pemfaktoranya

sama tetapi tingkat kesukarannya berbeda. Untuk menentukan reliabilitasnya

dihitung dengan cara mengkorelasikan hasil tes untuk soal perangkat pertama

dengan hasil tes dari perangkat kedua.

Tes parallel atau tes ekuivalen bisa juga adalah dua buah tes yang

mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir

soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method

(parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel,

misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan

pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien

korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes

Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat

digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode

paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing

dicobakan pada kelompok siswa yang sama.

C. Jenis – Jenis Reliabilitas

Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur

reliabilitas, yaitu :

1. Reliabilitas Stabilitas.

Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap

orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini

menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur

pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk

RELIABILITAS

dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah

sama atau hampir sama.

2. Reliabilitas Terwakili

Mengacu pada keterandalan masing-masing grup. Menguji apakah

penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang

berbeda-beda.

3. Reliabilitas Seimbang (equivqlence reliability)

Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran

yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama

tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional,

peralatan pengumpulan data, dan / atau pengamat-pengamat.

Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama

bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-

tengah.

Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan

yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-

pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau

pengubahan sering digunakan untuk teknik belah tengah ini). Hasil masing-

masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing

bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing

bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah

reliabilitas belah tengah.

Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik

pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan

pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor

yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang

tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila

tekanan darahnya yang diukur.

D. Faktor – Faktor Yang Mempengaruhi Reliabilitas

1. Jumlah butir soal

Banyaknya soal pada suatu instrumen ikut mempengaruhi derajat

reliabilitasnya. Semakin banyaknya soal-soal maka tes yang bersangkutan

cenderung semakin menjadi reliabel.

RELIABILITAS

2. Homogenitas Soal Tes

Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya

tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi

berbeda isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan

dan yang satunya tentang kemampuan fisika akan menghasilkan tingkat

reliabilitas yang berbeda. Tes fisikan cenderung menghasilkan tingkat reliabilitas

yang lebih tinggi daripada tes kebahasaan karena dari segi isi kemampuan

menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.

3. Waktu Yang diperlukan untuk menyelesaikan Tes

Semakin terbatasnya waktu dalam pengerjaan tes maka akan mendorong tes

untuk memiliki reliabilitas yang tinggi.

4. Keseragaman Kondisi Pada Saat Tes Diberikan

Kondisi pelaksanaan tes yang semakin seraga akan memunculkan reliabilitas

yang makin tinggi

5. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes

Bahwa soal-soal dengan tingkat kesukaran sedang cenderung lebih reliabel

dibandingkan dengan soal-soal yang sangat sukar atau sangat mudah

6. Heterogenitas Kelompok

Semakin heterogen suatu kelompok dalam pengerjaan suatu tes maka tes

tersebut cenderung untuk menunjukkan tingkat reliabilitas yang tinggi

7. Motivasi Individu

Motivasi masing-masing individu dalam mengerjakan suatu instrumen akan

mampu mempengaruhi realibilitas. Perbedaan motiviasi antar individu dalam

kelompok akan menimbulkan kesalahan acak pada pengukurannya karena

individu yang tidak memiliki motivasi tidak akan mengerjakan instrumen tersebut

dengan sungguh-sungguh sehingga jawaban yang diberikan tidak akan

mencerminkan kenyataan yang sebenarnya.

8. Variabilitas Skor

Instrumen yang menghasilkan rentangan skor yang lebh luas atau lebih

tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada

menghasilkan rentangan skor yang lebih sempit , seperti bentuk pilihan ganda

cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk

benar – salah

RELIABILITAS

Faktor – Faktor Yang Mempengaruhi Reliabilitas Instrumen

Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh

waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau

terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga

mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::

1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item

materi pembelajaran diukur.

2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk

sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran,

semakin tinggi estimasi koefisien reliable.

3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,

cenderung menghasilkan skor reliabilitas rendah.

4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan

kompetensi sama, mencapai hasil yang sama.

E. Cara – cara Mencari Besarnya Reliabilitas

1. Pendekatan Tes Tunggal Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam 2 (dua) macam

teknik, yaitu Teknik Belah Dua (Spilt-Half Technique) danTeknik Non Belah Dua

(Non Spilt-Half Techique).

a. Teknik Belah Dua

Dalam menentukan reliabilitas suatu tes dengan menggunakan teknik belah

dua, dilakukan dengan cara membelah tes tersebut menjadi dua bagian yang

sama (relative sama), sehingga masing – masing peserta tes memiliki dua macam

skor. Kedua macam skor itu adalah skor untuk bagian (belahan) pertama dan

kelompok skor untuk belahan kedua dari tes tadi. Dengan demikian ada dua

kelompok skor untuk sekelompok peserta tes.

Karena kedua belahan harus sama, maka salah satu syarat yang harus

dipenuhi untuk teknik belah dua ini adalah banyaknya butir soal dalam tes

tersebut harus genap, supaya kedua bagian itu banyaknya butir soal sama.

Ada dua cara untuk membelah banyaknya butir soal tes, yaitu :

RELIABILITAS

1. Membelah atas item – item (butir – butir) genap dan item – item (butir –

butir) ganjil yang selanjutnya disebut belahan ganjil genap.

2. Membelah atas item – item (butir – butir) awal dan item – item (butir –

butir) akhir yaitu separoh junlah pada nomor-nomor awal dan separo pada

nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.

Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan

hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada

seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili

reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat

digunakan untuk mengoreksi koefisien yang didapat.

Seperti halnya koefisien validitas yang telah dibahas pada bab terdahulu,

untuk koefisien reliabilitas yang menyatakan tingkat keterandalan tes,

dinyatakan dengan r11. Tolak ukur menginterprestasikan tingkat reliabilitas tes

dapat digunakan tolak ukur yang dibuat oleh Guilford (1956) sebagai berikut :

0,80<r11 ≤1,00 reliabilitas sangat tinggi

0,60<r11 ≤0,80 reliabilitas tinggi

0,40<r11 ≤0,60 reliabilitas sedang

0,20<r11 ≤0,40 reliabilitas rendah

r11 ≤ 0,20 reliabilitas sangat rendah

Untuk menentukan koefisien reliabilitas suatu tes dengan teknik belah dua,

ada tiga macam teknik perhitungan, yaitu formula Spearman – Brown, Formula

Flanagan, dan formula Rulon.

Formula Spearman – Brown

Prinsip penggunaan formula Spearman – Brown adalah menghitung koefisien

korelasi di antara kedua belahan sebagai koefisien reliabilitas bagian (setengah)

dari tes tersebut, yang dinotasikan dengan (r ½ ½) . Untuk menghitung (r ½ ½) bisa

digunakan rumus product moment dengan angka kasar dari karl Pearson, yaitu :

RELIABILITAS

r ½ ½ ¿ N∑ XY−¿¿¿

N = banyaknya subyekX = Kelompok data belahan pertamaY = Kelompok data belahan kedua

Untuk menghitung koefisien reliabilitas suatu tes keseluruhan, Spearman –

Brown mengemukakan rumus :

Dengan r11 : reliabilitas Instrumen

r ½ ½ : Indeks Korelasi antara dua belahan Instrumen

Syarat yang harus dipenuhi dalam menggunakan rumus di atas adalah

butir soal pada kedua belahan harus setara, yaitu banyaknya butir soal harus

sama, memiliki rata – rata nilai sama, mempunyai variabilitas yang sama, dan

bentuk distribusi frekuensi yang sama pula. Untuk mendekati kondisi tersebut

soal harus disusun sedemikian rupa sehingga butir soal pada belahan pertama

dengan pasangannya pada belahan kedua memuat konsep yang sama, dengan

indikator yang sama pula. Sehingga setiap butir berpasangan kesetaraannya

pada kedua belahan itu.

Contoh perhitungan reliabilitas dengan Formula Spearman – Brown :

No. Subyek Skor Item1 2 3 4 5 6 7 8 9 10

1 A 3 4 3 4 4 3 3 3 3 32 B 4 3 3 4 3 3 3 3 3 33 C 2 2 1 3 2 2 3 1 2 34 D 3 4 4 3 3 3 4 3 3 45 E 3 4 3 3 3 4 3 4 4 36 F 3 2 4 4 3 4 4 3 4 47 G 2 3 3 4 4 4 3 4 3 28 H 1 2 2 1 2 2 1 3 4 39 I 4 2 3 3 4 2 1 1 4 410 J 3 3 3 4 4 4 4 4 3 311 K 4 4 3 4 4 3 4 4 4 212 L 3 2 1 2 3 1 1 2 3 313 M 4 3 4 3 3 4 3 3 3 414 N 2 3 3 4 4 4 3 2 3 415 O 3 4 3 2 3 2 4 3 3 3

Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil – genap adalah

sebagai berikut

Subyek Skor Skor X . Y

RELIABILITAS

Item Ganjil(X)

Item Genap(Y)

A 16 17 272B 16 16 256C 10 11 110D 17 17 289E 16 18 288F 18 17 306G 15 17 255H 10 11 110I 16 12 192J 17 18 306K 19 17 323L 11 10 110M 17 17 289N 15 17 255O 16 14 224

∑ X=229 ∑Y =229 ∑ X .Y =3585 ∑ X2=3603 ∑Y 2=3609

r=N∑ XY−¿¿¿

¿ 15 x 3585−229 x229

√(15 x 3603−52441 )(15 x3609−52441)

¿ 1334

√1604 : 1694

¿ 13341648,386

=0,809

Setelah dihitung dengan rumus korelasi product moment dengan angka

kasar diperoleh bahwa rxy = 0,809. Harga tersebut baru menunjukkan reliabilitas

separo tes. Sehingga r ½ ½ = 0,809. Untuk mencari reliabilitas seluruh tes

digunakan rumus formulasi Spearman – Brown sebagai berikut :

r11=2 r 1

212

1+r 12

12

=2x 0,8091+0,809

=1,6181,809

=0,895

Jika dihitung dengan teknik belah dua metode awal – akhir, akan diperoleh dua

kelompok data seperti tabel di bawah ini :

Subyek SkorBagian Awal

(X)

SkorBagian Akhir

(Y)

X . Y

A 18 15 270B 17 15 255C 10 11 110D 17 17 289E 16 18 288

RELIABILITAS

F 16 19 304G 16 16 256H 8 13 104I 16 12 192J 17 18 306K 19 17 323L 11 10 110M 17 17 289N 16 16 256O 15 15 225

∑ X=229 ∑Y =229 ∑ X .Y =3577

∑ X2=3631 ∑Y 2=3597

r=N∑ XY−¿¿¿

¿ 15 x 3577−229 x 229

√(15 x 3631−52441 )(15 x3597−52441)

¿ 1214

√2024 :1514

¿ 12141750,48

=0,6935

Setelah dihitung dengan rumus korelasi product moment dengan angka

kasar diperoleh bahwa rxy = 0,6935. Harga tersebut baru menunjukkan reliabilitas

separo tes. Sehingga r ½ ½ = 0,6935. Untuk mencari reliabilitas seluruh tes

digunakan rumus formulasi Spearman – Brown sebagai berikut :

r11=2 r 1

212

1+r 12

12

=2 x 0,69351+0,6935

= 1,3871,6935

=0,819

Dari kedua contoh perhitungan diatas ternyata hasilnya ada perbedaan, tetapi jika

dirujuk pada tolak ukur reliabilitas, keduanya menunjukkan tingkat reliabilitas

yang sama, yaitu tergolong tinggi. Jadi reliabilitas tes soal tersebut adalah tinggi

atau baik.

Formula Flanagan

Menghitung reliabilitas tes dengan menggunakan rumus formula Flanagan

tidak didasarkan atas nilai korelasi antara kedua belahan tes, melainkan

didasarkan atas varians masing – masing belahan dan varians totalnya. Untuk

menghitung koefisien reliabilitas tes, Flanagan mengemukakan formula :

RELIABILITAS

r11=2(1− S12+S2

2

S t2 )

Keterangan :

r11=¿ koefisien reliabilitas seluruh tes

S12=¿ varians belahan pertama

S22=¿ varians belahan kedua

St2=¿ varians skor total

Untuk menghitung varians digunakan rumus sebagai berikut :

S2=∑ X

2−

(∑ X )2

NN

Sebagai contoh dalam menggunakan formulasi Flanagan ini akan dihitung

koefisien reliabilitas untuk tes dengan data seperti di atas dengan menggunakan

metode ganjil – genap.

Subyek SkorItem Ganjil

(X)

SkorItem Genap

(Y)

SkorTotal(Xt)

A 16 17 33B 16 16 32C 10 11 21D 17 17 34E 16 18 34F 18 17 35G 15 17 32H 10 11 21I 16 12 28J 17 18 35K 19 17 36L 11 10 21M 17 17 34N 15 17 32O 16 14 30

∑ X=229 ∑Y =229 ∑ X t=458 ∑ X2=3603 ∑Y 2=3609

RELIABILITAS

∑ X t2=14382

Sx2=7,1287 SY

2 =7,5287 St2=26,5153

Setelah diperoleh nilai – nilai varians dari data belahan 1, belahan 2, dan varians

total kemudian dimasukkan ke dalam rumus.

r11=2(1− S12+S2

2

S t2 )

r11=2(1−7,1287+7,528726,5153 )

r11=2(1−146,57426,5153 )=0,9

Jika dirujuk pada tolak ukur reliabilitas tergolong tinggi.

Formula Rulon

Formula Rulon didasarkan atas konsep perbedaan antara skor subyek pada

belahan pertama dan kedua, yang dapat dipandang sebagai kekeliruan (error) dari

proses penilaian. Dengan demikian varians yang diperhitungkan adalah varians

perbedaan skor antara kedua belahan itu, yaitu varians kekeliruan. Rumus Rulon

sebagai berikut :

r11=1−Sd

2

St2

Keterangan :Sd

2=¿ Varians selisih skor subyek pada kedua belahan

St2=¿ Varians skor totalUntuk penggunaan rumus tersebut, kita menggunakan kembali data hasil tes

di atas dengan metode awal – akhir. Data yang harus dipersiapkan disusun dalam

bentuk tabel seperti dibawah ini.

Subyek SkorBagian Awal

(X)

SkorBagian Akhir

(Y)

d=|X−Y|X t

A 18 15 3 33B 17 15 2 32C 10 11 -1 21D 17 17 0 34E 16 18 -2 34F 16 19 -3 35G 16 16 0 32H 8 13 -5 21I 16 12 4 28J 17 18 -1 35K 19 17 2 36

RELIABILITAS

L 11 10 1 21M 17 17 0 34N 16 16 0 32O 15 15 0 30

Sd=2,22 St=5,15

Sd2=4,93 St

2=26,51

Selanjutnya dimasukkan ke dalam rumus :

r11=1−Sd

2

St2

r11=1− 4,9326,51

=0,8 1

Jika dirujuk pada tolak ukur reliabilitas, tergolong sangat tinggi.

b. Teknik Non Belah Dua

Pakar yang mengemukakan teknik non belah dua adalah Kuder dan

Richardson. Mereka berpendapat bahwa teknik belah dua kurang baik dalam

mencari koefisien reliabilitas, sebab bisa dilakukan dengan cara yang berbeda

sehingga menghasilkan yang berbeda pula. Disamping itu dalam

pelaksanaannya, teknik belah dua sulit sekali memperoleh dua belahan yang

setara satu sama lain. Untuk menghindari hal tersebut, Kuder dan Richardson

mengemukkan cara untuk menghitung koefisien reliabilitas tanpa membelah tes

menjadi dua bagian, tetapi membagi tes menurut banyak nya butir soal yang

disajikan, yaitu dengan menganalisis masing – masing butir soal tersebut. Rumus

yang digunakan untuk menghitung koefisien reliabilitas tes tanpa membelah tes

menjadi bagian adalah rumus KR-20 dan KR-21.

Rumus KR-20

r11=[ nn−1 ][ S t

2−∑ pi qi

st2 ]

Keterangan :

n=¿ banyaknya butir soal

pi=¿ proporsi banyak subyek yang menjawab benar pada butir soal ke - i

q i=¿ proporsi banyak subyek yang menjawab salah pada butir soal ke - i

RELIABILITAS

St2=¿ vaarians skor total

r11=¿ koefisien reliabilitas

Sebagai contoh kita gunakan hasil tes matematika yang terdiri dari 15 butir

soal yang diikuti 10 subyek siswa seperti yang digunakan sebelumnya. Tabel di

bawah ini adalah tabel persiapan untuk menghitung koefisien reliabilitas dengan

KR-20.

Tabel persiapan penggunaan rumus KR-20.

No Nama Nomor soal Total1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

1 Aan N. Efendi 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 102 Arif Kristanto 0 1 1 1 1 0 0 0 0 0 0 1 0 1 0 63 Bayu Inggar 0 1 1 0 1 1 0 0 1 1 1 1 1 0 0 94 Aulia 0 1 1 1 1 1 0 0 1 1 1 0 0 0 1 95 Novita 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 66 Septian Hadi 0 1 1 1 1 0 0 0 1 1 0 1 0 1 0 87 Riska Maulana 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 138 Adi Susianto 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 149 Meydin Kartika 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1010 Riswanda 1 1 0 0 1 1 1 0 1 1 1 0 1 0 1 10

np6 10 6 6 10 7 3 0 8 8 6 7 5 6 7 ∑ X t=¿

95

∑ X t2=¿

963

∑ pi q i=¿ 2,61

nq4 0 4 4 0 3 7 10 2 2 4 3 5 4 3

pi.6 1 .6 .6 1 .7 .3 0 .8 .8 .6 .7 .5 .6 .7

q i.4 0 .4 .4 0 .3 .7 1 .2 .2 .4 .3 .5 .4 .3

pi qi.24 0 .24 .24 0 .21 .21 0 .16 .16 .24 .21 .25 .24 .21

Keterangan : Untuk menyingkat tulisan 0,6 ditulis .6, 0,24 ditulis .24 dan

seterusnya.

Selanjutnya hasil perhitungan diatas dimasuk kan ke dalam rum,us KR-20

sebagai berikut:

r11=[ nn−1 ][ S t

2−∑ pi qi

st2 ]

r11=[ 1515−1 ][ 6,05−2,61

6,05 ]r11=1,07 x0,56=0,5992

Jika dirujuk pada tolak ukur reliabilitas, tergolong sedang.

Rumus KR-21

RELIABILITAS

r11=( nn−1 )(1−

X t (n−X t )nS t

2 )Keterangan :


X t=¿ rata – rata skor total


r11=¿ koefisien reliabilitas

Keuntungan yang dapat diperoleh dari penggunaan rumus KR-21 adalah

kemudahan dalam membuat tabel persiapan karena data nilai yang dibutuhkan

hanyalah rata – rata dan varians skor total. Dengan menggunakan kalkulator akan

diperoleh :

X t=9,5 dan St2=6,05

Dimasukkan ke dalam rumus KR-21 di atas

r11=( nn−1 )(1−

X t (n−X t )nS t

2 )r11=( 15

15−1 )(1−9,5 (15−9,5 )15 (6,05) )

r11=1,07 x0,43=0,4601

Yang termasuk ke dalam kategori reliabilitas sedang.

F. Mencari Koefisien Reliabilitas Tes bentuk Uraian

Untuk mencari koefisien reliabilitas tes bentuk uraian tidak bisa dilakukan

seperti di atas karena penilaian tidak hanya diberikan pada hasil akhir, melainkan

dilakukan pula terhadap proses pengerjaannya. Oleh karena itu skor yang diperoleh

karena setiap soal tidak dikotomi (dua kategori benar atau salah). Skor yang

diperoleh untuk hasil pekerjaan siswa dinilai setiap soal dan setiap langkah

pengerjaan. Jadi skornya bisa berlainan tergantung dari setiap bobot soal. Rumus

yang digunakan untuk mencari koefisien reliabilitas tes bentuk uraian dikenal

dengan rumus alpha seperti debawah ini.

Rumus Alpha

RELIABILITAS

r11=( nn−1 )(1−

∑ Si2

S t2 )

Keterangan :


∑ S i2=¿ jumlah varians skor setiap butir soal


r11=¿koefisien reliabilitas

Subyek

Nomor Soal Skor Total(X ¿¿ t)¿

1 2 3 4 5 6 7 8 9 10

A 10 10 9 10 4 10 10 6 10 4 83B 10 10 8 6 7 8 10 10 8 6 83C 10 8 10 10 6 10 5 6 4 9 78D 10 8 10 10 4 10 8 10 6 10 86E 10 10 10 8 10 7 8 7 9 8 87F 10 8 10 10 4 8 10 8 6 8 82G 10 10 6 10 4 7 10 10 10 10 87H 10 7 10 10 6 10 7 7 8 6 81I 10 10 10 10 10 10 10 9 10 9 98J 10 10 7 10 4 5 8 10 9 6 79

X i100 91 90 94 59 85 86 83 80 76 844

X i2 1000 841 830 900 401 751 766 715 678 614 71526

Si30 1,14 1,41 1,282 2,3 1,69 1,62 1,61 1,95 1,91 5,41

Si2 0 1,29 2 1,64 5,29 2,85 2,64 2,61 3,8 3,64 29,24

Dari data pada tabel di atas diperoleh

n=1 0

∑ S i2=0+1,29+2+1,64+5,29+2,85+2,64+2,61+3,8+3,6 4

¿25,76

St2=29,24

Dimasukkan ke dalam rumus alpha

r11=( nn−1 )(1−

∑ Si2

S t2 )

r11=( 1010−1 )(1−25,76

29,24 )r11=(1,11) (0,12 )=0,13

RELIABILITAS

Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat reliabilitasnya

sangat rendah.

G. ANCAMAN TERHADAP RELIABILITAS

Semua jenis instrumen tes atau nontes tidak terlepas kesalahan. Hal ini

berlaku untuk instrumen tes dalam ilmu-ilmu eksakta dan dalam ilmu-ilmu psikologi

dan pendidikan. Misalnya, dalam mengukur panjang dengan suatu penggaris,

mungkin ada kesalahan sistematis berhubungan dengan di mana titik nol dicetak

pada penggaris dan kesalahan acak berhubungan dengan kemampuan mata dalam

membaca tanda-tanda dan memperhitungkan tanda-tanda tersebut. Juga

memungkinkan bahwa panjang obyek dapat berubah dari waktu ke waktu dan pada

lingkungan yang berbeda (misalnya perubahan temperatur). Salah satu tujuan

penilaian adalah untuk mengurangi kesalahan tersebut hingga ke tingkatan yang

sesuai dengan tujuan tes. Tes yang beresiko tinggi (high-stakes tes), seperti ujian

untuk mendapatkan SIM, harus mempunyai kesalahan yang sangat kecil. Tes di

kelas dapat mentolerir kesalahan yang lebih tinggi secara wajar kesalahan tersebut

mudah dikoreksi sepanjang proses pengujian. Reliabilitas hanya mengacu pada

derajat tingkat kesalahan yang tidak sistematis, yang disebut kesalahan acak.

Ada tiga sumber kesalahan utama, yaitu: faktor dalam tes itu sendiri, faktor

siswa yang dites, dan faktor penskoran. Umumnya tes berisi suatu koleksi butir yang

mengukur keterampilan tertentu. Adakalanya guru secara khas menggeneralisasikan

masing-masing butir tes ke semua materi yang diukur oleh tes itu. Sebagai contoh,

jika seorang siswa dapat memecahkan beberapa permasalahan seperti 7x8, maka

mungkin akan disamaratakan kemampuannya dalam mengalikan angka tunggal

bilangan bulat. Juga mungkin akan menyamaratakan suatu kumpulan materi kepada

suatu domein yang lebih luas. Jika siswa dapat menyelesaikan penjumlahan,

pengurangan, perkalian, dan pembagian, maka mungkin akan disimpulkan bahwa

siswa tersebut mampu menyelesaikan operasi pecahan.

Kesalahan dapat pula disebabkan oleh pemilihan butir untuk mengukur

domein dan keterampilan tertentu. Materi yang tercakup dalam tes berbeda menurut

format masing-masing tes, kesalahan pensampelan, pembatasan butir tes, dan karena

menyamaratakan ke data yang tidak diamati, yakni, kemampuan siswa terhadap

keseluruhan butir yang mungkin terdapat dalam tes. Ketika keterampilan dan domain

yang diukur menjadi lebih rumit, mungkin akan terjadi lebih banyak kesalahan yang

RELIABILITAS

disebabkan oleh pensampelan materi. Sumber lain kesalahan tes adalah

ketidakefektifan pengecoh dalam tes pilihan ganda, seperti jawaban benar yang lebih

banyak, dan tingkat kesukaran butir tes.

Sebagai manusia, para siswa tidaklah selalu konsisten dan juga tidak terlepas

dari kesalahan dalam menyelesaikan tes. Apakah tes itu dimaksudkan untuk

mengukur kemampuan khusus atau kemampuan siswa secara optimal, perubahan

dalam berbagai hal seperti sikap siswa, kesehatan, dan rasa kantuk dapat

mempengaruhi kualitas usaha dan konsistensi siswa dalam menyelesaikan tes.

Sebagai contoh, peserta tes mungkin membuat kesalahan karena teledor, salah

menafsirkan petunjuk tes, melupakan instruksi tes, melupakan beberapa butir tes,

atau salah baca butir tes.

Kesalahan penskoran merupakan sumber sepertiga dari kesalahan potensial.

Pada bentuk tes objektif, penskoran bersifat mekanik, dan kesalahan penskoran harus

diperkecil. Pada tes uraian, sumber kesalahan meliputi ketidakjelasan rubrik

penskoran, ketidakjelasan apa yang diharapkan dari siswa, dan beberapa kesalahan

yang bersumber dari penilai. Para penilai tidaklah selalu konsisten, kadang-kadang

merubah ukuran-ukuran mereka selagi menskor, dan terkadang terpengaruh oleh hal-

hal yang tidak berhubungan dengan skor tes seperti efek halo, latar belakang siswa,

perbedaan persepsi, kebaikan hati atau kepelikan, dan kesalahan dalam penskalaan.

RELIABILITAS

makalah reliabilitas

Documents