evaluasi program pembelajaran full

8/2/2019 Evaluasi Program Pembelajaran Full

1/45

Evaluasi Program Pembelajaran/Kurikulum

Konsep Dasar Evaluasi Program

Evaluasi adalah suatu proses yang digunakan untuk mengukur kualitas suatu pekerjaan.

Evaluasi jika digunakan secara tepat, akan mengadakan kontrol kualitas yang menentukan

seberapa jauh gap antara apa yang terjadi dan apa yang seharusnya terjadi....

Akhirnya tujuan dari pada evaluasi adalah untuk mengumpulkan data (hasil), mengubah datamenjadi informasi ( yang dijadikan alat dalam membuat keputusan yang berguna), dan

menggunakan informasi untuk membuat keputusan. Evaluasi adalah suatu bidang yangmeliputi bidang yang luas baik pengalaman, pertumbuhan, perkembangan, dan perubahan.

Hal ini digunakan perhatian terutama hubungan antara tujuan yang diinginkan dan penampilan, tetapi sering kali lebih luas dari pada itu. Dengan perluasan bidang ini, ada

beberapa definisi dari istilah dan nama, dan secara jujur, menjadi sangat membingungkan.Evaluasi program yaitu evaluasi yang menaksir kegiatan pendidikan yang memberikan

pelayanan pada suatu dasar yang kontinu dan sering melibatkan tawaran-tawaran kurikuler.

Beberapa contoh di antaranya ialah evaluasi-evaluasi program membaca di suatu sekolah

daerah, evaluasi program pendidikan khusus di negara bagian atau evaluasi program

pendidikan berlanjut di suatu universitas.

Evaluasi proyek adalah evaluasi yang menaksir kegiatan-kegiatan yang menyangkut suatu jangka waktu untuk menyajikan suatu tugas khusus. Beberapa contoh, misalnya lokakarya

tiga hari tentang tujuan behavioral, percobaan dua tahun tentang pengembangan tes atau

proyek tiga tahun tentang pendidikan karir. Suatu perbedaan antara program dan proyek

adalah bahwa program diharapkan berlangsung untuk jangka waktu yang tidak terbatas,

sedangkan proyek untuk jangka waktu singkat. Proyek yang diintitusionalkan bisa menjadi

program.

Evaluasi materi yaitu evaluasi yang menaksir nilai soal-soal fisik yang berhubungan dengan

isi, termasuk buku, pentunjuk kurikuler, film, tape, dan hasil-hasil instruksional nyatalainnya. Sedangkan evaluasi material ialah evaluasi yang negukur kebaikan-kebaikan atau

nilai-nilai dari butir-butir fisik yang berhubungan dengan isi, meliputi buku, panduankurikulum, film, pita, lain lain-lain (hasil) pengajaran.

Evaluasi kurikulum ialah suatu proses mendeskripsikan suatu nilai dan keputusan tentang

kurikulum baik dari dimensi konsep, dimensi rencana, dimensi kegiatan dan dimensi hasil belajar. Dalam evaluasi program/kurikulum dikenal adanya evaluasi internal dan evaluasi

eksternal. Evaluasi internal ialah evaluasi dilakukan oleh seorang anggota staf di dalam

organisasi yang sedang diteliti. Sedangkan evaluasi eksternal ialah evaluasi yang

dilaksanakan oleh evaluator di luar organisasi dalam mana objek dari evaluasi ditempatkan.

Evaluasi program/kurikulum juga dibedakan dengan evaluasi formatif dan evaluasi sumatif.

Evaluasi formatif ialah evaluasi yang dirancang dan digunakan untuk memperbaiki suatu

objek, khususnya apabila objek itu sedang dikembangkan. Sedangkan evaluasi sumatif ialah

evaluasi yang dirancang untuk menyajikan kesimpulan-kesimpulan tentang kelebihan atau

harga suatu objek, dan saran-saran (anjuran-anjurannya) apakah objek itu harusdipertahankan, diubah atau dibuang.

Evaluasi bebas tujuan: evaluasi dari suatu hal (akibat, hasil) di mana evaluator berfungsi

tanpa tahu tujuan evaluasi itu.

Seringkali terjadi pembedaan yang tidak jelas tentang pengertian evaluasi dan penelitian

dalam pemakaian sehari-hari. Para ilmuwan sudah lama berusaha mencari dan menemukankesepakatan untuk membedakan kedua pengertian tersebut. Apabila kita membaca secara

cermat sesungguhnya antara kedua istilah evaluasi dan penelitian secara prinsip terdapatperbedaan.


2/45

Ditinjau dari sudut tujuan kegiatan, evaluasi dilaksanakan dengan tujuan untuk menemukan

nilai dan makna dari evaluasi. Dengan nilai dan makna tersebut evaluator dapat memberikan

informasi kepada pembuat keputusan (decision maker) atau kepada penanggungjawaban

program. Evaluator dapat memberikan alternatif pemecahan masalah, namun keputusan tetap

menjadi wewenang pembuat keputusan atau penanggungjawab program. Sedangkan

penelitian dilaksanakan dengan tujuan untuk menjelaskan hubungan empirik antar berbagai

variabel. Kegiatan penelitian terutama diarahkan untuk mengembangkan terori dalam disiplnilmu tertentu. Ada jenis penelitian tertentu yang memang dekat hubungannya dengan evaluasi

yaitu penelitian tindakan (action research). Gambaran garis besar penelitian tindakandibedakan menjadi penelitian dasar (basic research) dan penelitian praktis (practical

research). Penelitian praktis dapat diklasifikasikan menjadi peneltian evaluasi (evaluationresearch), penelitian terapan (application research) dan penelitian tindakan (action research).

Penelitian praktis sejak munculnya bermaksud menemukan pemecahan masalah-masalahdalam dunia kerja. Namun dalam pengembangannya mengalami perubahan dengan variasi

pada sasaran penelitian, keterlibatan sponsor dan peneliti pada saran penelitian. Penelitian

evaluasi lazimnya dimaksudkan untuk melakukan evaluasi terhadap suatu aspek atau

beberapa aspek dari program serta mengkaji efektivitas program-program yang dirancang

untuk melakukan perubahan-perubahan program dalam skala yang lebih luas. Prosedur yang

lazim dilakukan adalah (a) mengidentifikasi tujuan program, (b) memilih tujuan programyang menjadi acuan, (c) menetapkan kriteria evaluasi, (d) melakukan pengukuran terhadap

sasaran penelitian, (e) membandingkan hasil pengukuran dengan tujuan, dengan

menggunakan kriteria yang telah ditetapkan dan (f) merumuskan perbedaan antara data

dengan tujuan.

Ditinjau dari sudut onbjek kegiatan, pelaksanaan evaluasi selalu harus berhubungan dengan

kegiatan yang memang nyata dan telah terjadi. Sedangkan penelitian, objek kegiatannya lebih

luas dan tidak terbatas. Namum hendaknya memperhatikan dan mengikuti aturan-aturan atau

norma-norma yang telah ditetapkan, yang disebut dengan istilah etika penelitian. Etika inidijadikan patokan atau pedoman yang sangat penting dalam pelaksanakan penelitian.

Penelitian dilaksanakan secara sistematis artinya dilaksanakan berdasarkan suatu sistem,prosedur, aturan tertentu sehingga hasil penelitian benar-benar dapat diyakini secara kritis.

Antara penelitian dan evaluasi, dua istilah yang secara historis berawal dari penelitian- penelitian tentang ilmu-ilmu tingkah laku (behavioral sciences). Mula-mula timbulnya

psikologi sebagai disiplin ilmu sejak tahun 1800-an. Sebagai ilmu psikologi yang dewasa, halini disusun suatu metodologi dan teknik yang dipinjam dari ilmu-ilmu fisika dan biologi.

Termasuk prinsip-prinsip penemuan ilmu pengetahuan (principles scientific inquiry),

pengukuran (measurement) dan analisis data. Kemudian memasuk-kan model-model statistik

yang dikembangkan untuk aplikasi agrikultur, antropologi, sosiologi, pendidikan dan tinjauan

bidang ilmu tingkah laku yang lain, yang disesuaikan dengan metodologi penelitian dalam

bidang yang baru.

Penelitian memiliki sumber pengetahuan yang merupakan tinjauan terhadap pengembangan

teori dan paradigma yang sudah lazim dikenal dalam metode penelitian eksperimental. Di

mana hipotesis diperoleh atau dirumuskan secara logis dari teori dan melakukan tes di bawahkondisi yang terkontrol. Evaluasi memiliki cara teknologi dari pada ilmu. Penekanannya

bukan pada pembangunan teori, tetapi pada pencapaian hasil atau prestasi dalam

melaksanakan tugas (unjuk kerja). Esensinya adalah memberikan feedback terbimbing untuk

mencapai keberhasilan. Menurut Stufflebeam (dalam Isaac, 1984) yang membedakan antara

kegiatan evaluasi dan penelitian adalah bahwa tujuan evaluasi antara lain adalah to improve(meningkatkan atau memperbaiki), bukan to prove (membuktikan).

B. Kriteria Evaluasi Program


3/45

Pada umunya evaluasi program memiliki tiga kerangka pokok, yaitu: (1) deskripsi program,

(2) adanya kriteria dan (3) pertimbangan. Ketiga komponen tersebut saling berkaitan.

Evaluasi dilaksanakan berdasarkan kriteria tertentu yang disusun dengan berpedoman pada

deskripsi program. Hasil analisis data selanjutnya dibuatlah suatu pertimbangan dan

keputusan terhadap program tersebut.

Deskripsi Program

Pengumpulan data pada umumnya didasarkan atas konsep deskripsi program yangdikembangkan sebelumnya dengan menggunakan pendekatan tertentu, program dijabarkan

menjadi beberapa unsur atau aspek. Selanjutnya dapat dirumuskan beberapa panduan ataupedoman yang berguna untuk pengumpulan data.

Ada tiga pendekatan yang dapat dipergunakan dalam rangka penentuan unsur-unsur pokoksuatu program, yaitu:

Pendekatan Struktural Pendekatan Fungsional Pendekatan Sistematis Pendekatan struktural, pusat perhatian ditujukan kepada komponen-komponen yang membentuk program.

Komponen-komponen tersebut dijadikan panduan dalam rangka pengumpulan data.

Contoh unsur-unsur program yang didasarkan atas pendekatan struktural adalah:

Tujuan-tujuan program Seleksi dasar rancangan program Seleksi kegiatan-kegiatan program

Rasional dan pendekatan terhadap evaluasi Karakteristik audiens Sistem penunjang

administrasi Karakteristik pelaksana program Implementasi program Pendekatan fungsionalpusat perhatiannya ditujukan kepada fungsi-fungsi utama dalam suatu program.

Sebagai contoh, penekatan fungsional terdapat unsur-unsur program, yaitu:

Evaluasi dan seleksi program Diagnosis dan remidiasi Community Outreach Penjadwalan

Kompetensi Functional literacy Penempatan tenaga Latihan jabatan Testing program

Pendekatan sistematis pusat perhatiannya ditujukan kepada keseluruhan program. Unsur-

unsur di dalam program terdiri dari:

Komponen masukan (in-put) Komponen proses (process) Komponen hasil (product)

C. Manfaat, Peranan, Tujuan dan Fungsi Evaluasi Program

Manfaat evaluasi program bagi program pendidikan dan pelatihan, maupun proyek adalahsebagai berikut:

Memungkinkan pengecekan program yang telah disusun, apakah program tersebut dapatdilaksanakan (applicable).

2. Melakukan pengkajian sejauhmana program yang dilaksanakan relevan dengan tujuanprogram dan membuahkan hasil sebagaimana yang diharapkan.

3. Memberikan petunjuk apakah pelaksanan program masih sejalan dengan apa yang telah

direncanakan semula. Melalui teknik pengamatan dan monitoring, evaluasi dapat

dilaksanakan selama pelaksanaan program berlangsung (evaluasi proses).

4. Memungkinkan pengkoordinasian kegiatan program dengan baik.

Peranan dan Tujuan Evaluasi Program

Peranan evaluasi peogram antara lain:

Menetapkan kebijakan dan pembuatan keputusan. Menilai hasil yang dicapai setelah prgramdilaksanakan. Mengevaluasi pelaksanaan kurikulum pada salah satu jenjang pendidikan

tertentu. Memberikan kepercayaan kepada lembaga tertentu (pemerintah atau swasta) yang

mempunyai program, proyek atau kursus. Memonitor dana yang dikeluarkan untuk

membiayai pelaksanaan program agar tidak terjadi penyalahgunaan. Memperbaiki dan

menyempurnakan materi dan program yang telah dilaksanakan. Tujuan Evaluasi ProgramEvaluasi program dilaksanakan untuk kepentingan penentuan kebijakan dan pengambilan

keputusan. Menetukan kebijakan dana pengambilan keputusan dapat dapatdilaksanakandengan tepat apabila didukung oleh informasi (data ) yang lengkap, benar dan akurat


4/45

mengenai hal-hal yang berkaitan dengan permasalahannya, serta untuk mengukur

keberhasilan pelaksanaan program. Bentuk keputusan tersebut dapat berupa angka/nilai

tertentu setelah melalui pertimbangan tertentu pula. Sedangkan tingkat keterandalan dan

keberadaan suatu keputusan pada dasarnya ditentukan oleh tingkat kebenaran dan

keterandalan informasi (data) yang diperoleh. Untuk mengumpulkan data yang diperlukan,

maka menggunakan instrumen pengumpul data yang memiliki tingkat keterandalan yang

memadai pula.Secara spesifik dapat dijabarkan tujuan evaluasi program adalah untuk menetapkan:

Apakah program yang telah disusun memenuhi kebutuhan sasaran dan apakah layak untukdilaksanakan? Apakah pelaksanaan program berjalan sesuai dengan tujuan yang diharapkan?

Berapa besar pengaruh program terhadap sararan yang telah ditetapkan? Seberapa besarprogram mampu memberikan nilai tambah (plus) apabila dibandingkan dengan biaya, tenaga

dan waktu yang telah digunakan? Kelemahan-kelemahan apa yang terdapat dalam programdan bagaimana upaya-upaya yang dilakukan untuk memperbaiki atau menyempurna-kannya?

Memberikan bahan pertimbangan bagi pengambil keputusan untuk menetapkan apakah

program tersebut dapat dilanjutkan penyelenggaraan, diperluas atau dibatalkan/dihentikan.

Memberikan bahan pertimbangan bagi penyelenggara program untuk mengadakan perbaikan

dan penyempurnaan program, organisasi penyelenggara, komponen-kopmponen program dan

aspek-aspek penyelenggara program sepanjang tahap-tahap penyelenggaraan program.Informasi yang diperoleh dapat dipakai sebagai bahan pertimbangan dalam mengambil

keputusan mengenai perlu tidaknya diadakan modifikasi atau revisi guna meningkatkan

efisiensi dan efektivitas penyelenggaraan program berikutnya.

Berdasarkan tujuan yang dikemukakan di atas selanjutnya dapat ditetapkan dan dipilih

instrumen pengumpul data yang cocok serta teknik analisis data apa seyogyanya digunakan.

Fungsi Evaluasi Program

Para perencana, pengelola dan pelaksana program perlu mengetahui tingkat keberhasilan dari

usahanya menyelenggarakan program, terutama perencana program. Untuk merealisasimaksud tersebut pada waktu merencanakan suatu program hendaknya sudah diperkirakan

bahwa program tersebut akan baik. Namun tanpa terasa ternyata kurang baik hasilnya. Dalamkeadaan demikian evaluasi dalam konteks ini sangat penting karena telah berfungsi

memberikan informasi kepada pelaksana program untuk membantu mengontrol pelaksanaanprogram agar dapat diketahui kelemahan-kelemahan atau penyimpangan-penyimpangan atau

kekeliruan yang tenjadi selama program berjalan sehingga dapat memberikan tindak lanjut

terhadap pelaksanaan program selanjutnya.

Beberapa kontribusi yang dapat diberikan oleh evaluasi program dalam hubungannya dengan

tipe keputusan serta kebijakan yang ditempuh seperti yang ditunjukkan berikut ini:

Memberikan kontribusi terhadap keputusan tentang instalasi program (program installation).

Banyak program yang berjalan namun terputus-putus dan bahkan gulung tikar karena tidak

mampu front-end-analysis kebutuhan dan tuntutan program, tersedianya staf dan fasilitas

yang dibutuhkan untuk membuahkan hasil yang diharapkan. Memberikan kontribusi terhadapkeutusan tentang kelangsungan/ kontinuitas program, ekspansi dan sertifikasi. Hal ini

termasuk menentu-kan apakah progran yang dilaksanakan memberikan suatu keuntungan

atau pengaruh sampingan (side effect) yang sangat bermanfaat. Memberikan kontribusi

terhadap keputusan tentang modifikasi program. Sasarannya adalah matapelajaran/bidang

studi, yaitu memberikan informasi bagi pengembang program, pengelola dan pelaksana program yang dapat membantu memperbaiki disain program dan pelayanan peralatan.

Evaluator mencari dan mengumpulkan informasi tentang pengaruh program atau sumbangan program dalam membantu pengambilan keputusan mengenai ekspansi. Dapat juga


5/45

menyeleksi data untuk memperbaiki program. Memberikan keterangan/informasi kepada

rally support tentang program yang telah dilaksanakan. Memberikan keterangan/informasi

kepada rally opposition tentang program yang telah dilaksanakan. Memberikan kontribusi

agar memahami dasar kejiwaan (psikologis), sosial dan proses lainnya.

D. Prinsip-Prinsip, Syarat-Syarat Evaluasi dan Evaluator Program

Pelaksanaan evaluasi program didasarkan atas tujuan tertentu. Setiap program evaluasi

diarahkan untuk mencapai tujuan yang telah ditetapkan secara jelas dan spesifik. Tujuan-tujuan itu pulalah yang mengarahkan kegiatan-kegiatan sepanjang proses evaluasi

dilaksanakan. Evaluasi harus bersifat obyektif. Pelaksanaan evaluasi dan hasil evaluasi harusbersifat obyektif, berpijak pada apa adanya dan bersumber dari data yang nyata dan akurat,

yang diperoleh melalui pengumpulan data dengan instrumen yang terandalkan. Evaluasi bersifat komprehensif. Pelaksanaan evaluasi hendaknya mencakup semua aspek (dimensi)

yang terdapat dalam program. Evaluasi bersifat komprehensif. Tanggungjawab dalam perencanaan, pelaksanaan dan keberhasilan suatu program merupakan tanggungjawab

bersama semua pihak yang terlibat dalam peroses evaluasi. Evaluasi hendaknya dilaksanakan

secara efisien, khususnya dalam penggunaan waktu,niaya dan tenaga serta peralatan yang

menajdi unsur penunjang. Evaluasi harus dilaksanakan secara berkesinambungan. Hal ini

perlu mengingat tututan diadakannya perbaikan dan poenyempurnaan program dan

perbaaikan sistem. Evaluasi program dalam pelaksanaannya hendaknya berpijak padabeberapa asumsi:

Evaluasi program hendaknya didisain sebaik-baiknya guna memperoleh informasi yang baik

dan akurat. Evaluasi program hendaknya dibatasi pada penemuan-penemuan yang didukung

oleh data kuantitatif, kendatipun tidak dapat mengabaikan informasi (data) kualitatif.

Informasi (data) yang diperoleh melalui pelaksanaan evaluasi hendaknya dapat menjadi alat

yang efisien dan efektif dalam rangka perbaikan, penyempurnaan dan peningkatan program.

Evaluasi program dapat dilaksanakan secara berkesinambungan dan mencakup evaluasi

terhadap komponen input, proses dab output (product).Syarat-Syarat Evaluasi Program.

Berorientasi pada tujuan. Tujuan program dijadikan patokan/arah dalam melakukan kegiatanevaluasi. Sebagai patokan/arah, tujuan program harus dirumuskan secara operasional, dapat

diukur serta indikator keberhasilannya dapat diamati.Berorientasi kepada kriteria keberhasilan. Evaluator harus merumuskan indikator-indikator

keberhasilan sebagai dasar/ pedoman untuk menetapkan keberhasilan dan atau kegagalanpelaksanaan suatu program.

Menyeluruh (komprehensif) maksudnya mencakup seluruh kegiatan dalam program dan

penyelengaraannya dilaksanakan secara terpadu seluruh komponen program. Serasi dan

berkesinambungan. Kegiatan evaluasi hendaknya serasi dengan komponen-komponen dan

aspek-aspek yang akan dievaluasi dan dilaksanakan secara berkesinambungan dari langkah

penjajagan, perencanaan, persiapan, pelaksanaan hingga selesainya kegiatan program.

Menggunakan berbagai sumber informasi dan teknik. Penggunaan berbagai sumber informasi

dan teknik untuk evalusi program dapat diperoleh dari berbagai sumber antara lain:

instruktur/pengajar/pelatih, peserta, lembaga atau instansi yang berkepentingan baik milik pemerintah maupun lembaga yang diadakan oleh masyarakat (swasta). Teknik yang

digunakan dapat bervariasi, di antaranya: dengan menggunakan daftar pertanyaan (angket),

wawancara (interview), pengamatan langsung (observation), dokumentasi (document), skala

sikap, tes (tertulus/lisan) dan sebagainya. Berfungsi ganda. Evaluasi program selain berfungsi

untuk memperoleh informasi yang lengkap, teliti, objektif dan akurat sebagai bahan pertimbangan dalam menyusun rekomendasi perbaikan atau penyempurnaan; tetapi juga

berfungsi sebagai suatu media komunikasi antara pihak penyelenggara program denganpihak-pihak yang menajdi sumber informasi mengenai komponen dan aspek progrtam serta


6/45

tujuan program yang tidak dievaluasi. Evaluator baik perseorangan maupun tim dapat berasal

dari dalam (evaluator intern) maupun dari luar (evaluator extern).

Evaluator yang berasal dari dalam (evaluator intern) yaitu seseorang atau sebuah tim yang

ditunjuk oleh sebuah organisasi profesional, perusahaan ataupun pusat pendidikan dan

pelatihan (Pusdiklat) yang melaksanakan program, berasal dari orang-orang yang menjadi

anggota sebuah organisasi atau orang-orang yang terlibat dalam keanggotaan panitia

pelaksana Diklat.Contoh: Sebuah Pusat Pendidikan dan Pelatihan atau sebuah Balai Latihan Kerja (BLK),

sebuah Diklat Penyuluhan Pertanian, menyelenggarakan kegiatan selama tiga bulan.Pusdiklat/BLK membentuk panitia dan menunjuk beberapa orang yang bukan panitia

bertugas mengevaluasi atau monitoring selama Diklat berlangsung.Evaluator dari luar (evaluator extern), yakni seseorang atau sebuah tim yang ditunjuk oleh

pihak penguasa (penanggungjawab dan pengambil keputusan) untuk melaksanaakn evaluasiterhadap efektivitas dan efisiensi sebuah program. Dengan demikian hasil yang diperoleh

dapat dipergunakan sebagai bahan pertimbangan dalam pengambilan keputusan, untuk

menentukan tindak lanjut terhadap kelangsungan program (perbaikan, modifikasi atau

dihentikan). Evaluator ekstern hendaknya berasal dari sekelompok orang atau tim yang sudah

profesional, suatu tim/kelompok yang berasal dari suatu lembaga/organisasi profesi yang siap

dibayar oleh penanggungjawab program. Evaluator ekstern dapat berasal dari perwakilanbeberapa instansi yang berwenang yang ditunjuk.

Contoh: Evaluasi terhadap Diklat BKKBN: penyelenggaran Diklat menunjuk perwakilan dari

instansi terkait yang tidak menyelenggarakan Diklat sebagai evaluator, namun

berkepentingan dengan Diklat tersebut.

Sebelum melaksanakan evaluasi terhadap program, evaluator hendaknya menguasai prinsip-

prinsip dasar evaluasi, yaitu:

Evaluator seyogyanya tidak memberikan jawaban terhadap pertanyaan khusus dan tidak

dapat memberikan pertimbangan kepada pihak lain. Tugas evaluator hanya sebatasmemberikan informasi dan beberapa pilihan alternatif. Evaluator tidak terikat pada suatu

lembaga/instansi penyelengara Diklat. Evaluasi merupakan suatu proses yang berlangsungterus-menerus, sehingga dimungkinkan untuk mengadakan perbaikan ataupun modifikasi

apabila terjadi hambatan atau kurang efektif ditinjau dari segi tenaga, biaya dan waktu. Hasilevaluasi yang dilaporkan kepada pihak pengambil keputusan merupakan tanggungjawab tim

dan tidak mempunyai hak untuk memberikan peertimbangan, apakah diperbaiki,dimodifikasi, dihentikan atau dilanjutkannya suatu program. Evaluator hendaknya

merumuskan pertanyaan-pertanyaan yang operasional untuk menggali informasi (data) serta

menyelami semua permasalahan yang dihadapi. Evaluator hendaknya menggunakan variasi

metode, teknik dan instrumen dalam pengumpulan data sebanyak mungkin, sehingga dapat

mengungkapkan data sebanyak mungkin dari aspek-aspek yang dievaluasi. Evaluasi

hendaknya dilakukan dengan teliti, cermat dan obyektif. Kesimpulan hasil evaluasi

hendaknya merupakan deskripsi yang tegas dan jelas menunjukkan sebab-akibat. Untuk

memperkaya deskripsi, evaluator dapat mengajukan beberapa asumsi yang didukung oleh

data yang valid dan reliabel. Persyaratan sebagai Evaluator.Agar memperoleh hasil evaluasi yang sebaik-baiknya dan benar-benar onyektif, maka

evaluator program dituntut memenuhi persyaratan-persyaratan berikut.

Memahami materi, maksudnya memahami seluk beluk program yang akan dievaluasi

antaralain: 1) Tujuan program yang telah dirumuskan sebelum memulai program.

2) Komponen-komponen program.3) Jangka waktu dan jadwal kegiatan.

4) Mekanisme pelaksanaan program.5) Pelaksanaan program.


7/45

6) Sistem monitoring kegiatan program.

Menguasai teknik, yaitu menguasai cara-cara/teknik-teknik yang digunakan dalam

pelaksanaan evaluasi program. Oleh karena itu evaluator program hendaknya menguasai: 1)

Cara menyusun desain evaluasi program.

2) Teknik penentuan populasi dan sampel.

3) Teknik penyusunan instrumen evaluasi program.

4) Teknik dan prosedur pelaksanaan evaluasi.5) Prosedur dan teknik pengumpulan data.

6) Teknik pengolahan data.7) Teknik menganasisis dan menginterpretasi data.

8) Cara menyusun laporan hasil evaluasi.

Obyektif dan Cermat. Tim evaluator adalah sekelompok orang yang mengemban tugas

penting dan ditopang oleh data yang dikumpulkan secara cermat, teliti dan obyektif.

Berdasarkan data yang dikumpulkan, diharapkan tim evaluator dapat mengklasifikasikan,

mentabulasikan, mengolah dan menganalisis serta menginterpretasi data dengan cermat dan

obyektif. Di dalam mennentukan strategi penyusunan laporan, evaluator tidak diperkenankan

untuk membedakan serta memandang salah satu atau dua asepek sebagai satu hal atauperistiwa yang istimewa atau luar biasa dan tidak boleh memihak.

Jujur dan dapat dipercaya. Tim evaluator dalam melaksanakan tugasnya hendaknya berlaku

jujur dan dapar dipercaya. Jujur artinya, data/informasi yang dikumpulkan benar-benar

berasal dari sumber yang dapat dipertanggungjawabkan serta apa adanya. Tidak

dimanipulasi, tidak ditambah dan dikurangi serta jujur melaporkan hasilnya kepada pihak

pengambil keputusan (penguasa). Kejujuran dalam melaporkan hasil akan mempengaruhi

keputusan yang diambil serta tidak lanjut yang dilakukan. Di samping itu, tidak bias dalam

pengamatan ataupun salah dalam persepsi.Evaluator hendaknya orang luar yang tidak ada kaitan dengan pengambil kebijakan

(keputusan) maupun pengelola dan pelaksana program. Evaluator hendaknya mengadakanhubungan yang baik dengan para responden maupun klient, dapat memahami wataknya,

kebiasaan dan cara hidup responnden yang dijadikan sumber data. Evaluator hendaknyatangap terhadap masalah politik dan sosial budaya, apalagi tujuan evaluasi adalah untuk

pengembangan program. Evaluator harus memiliki konsep diri yang tinggi sehingga tidakmudah terpengaruh atau terbawa arus. Evaluator hendaknya menguasai teknik untuk memilih

desain dan metodologi yang tepat untuk program yang akan dievaluasi. Evaluator hendaknya

bersikap terbuka terhadap kritik dan memberikan kesempatan kepada orang lain/pihak luar

untuk melihat apa yang sedang dan akan terjadi. Evaluator hendaknya menyadari kekurangan

dan keterbatasannya serta bersikap jujur, menyampaikan kelemahan dan kekurangan tentang

evaluasi yang dilakukan. Evaluator hendaknya bersikap pasrah kepada umum mengenai

penemuan yang positif maupun yang negatif. Evaluator bersedia menyebarluaskan hasil

evaluasi, teutama bagi pihak-pihak yang membutuhkan. Hasil evaluasi yang tidak secara

eksplisit dinyatakan sebagai informasi terbuka, sebaiknya tidak disebarluaskan. Evaluatortidak mudah membuat kontrak. Evaluator yang tidak memenuhi persyaratan-persyaratan yang

disebutkan di atas, sebaiknya tidak mudah menyanggupi menerima tugas-tugas, karena secara

etis dan moral akan merupakan sesuatu yang kurang dapat dibenarkan.

E. Context Evaluation.

Context Evaluation, according to Stufflebeam (90), addresses this questions:


8/45

What unmet needs exist in the context served by a particular institution? What objectives

should be pursued in order to order to meet this needs? What objectives will receive support

from the community? What set of objectives in most feasible to achieve?

Stufflebeam (90) suggest five questions that input evaluation should be capable of answering:

Does a given project strategy provide a logical response to a set of specified objectives? Is a

given strategy legal? What strategies already exist with potential relevance for meeting

previously established objectives? What specific procedures and time schedules will beneeded to implement a given strategy? What are the oprerating characteristics and effects of

competing strategy ubder pilot conditions?Stufflebeam (90) suggest the folowing questions to be addresed by process evaluation:

Is the project on schedule? Should be staff be retrained or reoriented prior to completions ofthe process priject cycle? Are the facilities and materials being used adequately and

appropiately? What major procedural barriers need to be overcome during the present cycle?The checlist consists of six major steps:

Focusing the evaluation, which means identifying and defining the decision situations or

goals of the evaluatuon, the setting within which it is be conducted, and the polities within

which it is to operate; Planning the data cillection; Planning the organization odf the data;

Planning the data analysis; Specifying audience, format, means, and schedule for reporting

the finding; Adminstrating the evaluation, or providing an overal plan for executing theevaluation design.

Dressel (21) offers a more comprehensive and useful checklist plan for planning an

evaluation:

What is the purpose and background of the evaluation?What inputs, environment factors,

processes, or outcomes are to be evaluated? What are the critical points at which evidence

will be required for decisions? What rules, procedures, assumsions, and principles are

involved in the decisions? Who will make decisions and what is the process by which these

will be made? Does the overall situation suggest. Require, or prohibit certain tactics andstrategies? What timing considerations are involved? What are the litimitation on costs? What

are the specific evaluation tasks?What information is to be collected?Are the particular items unambigiously defined and

collectible by objective and reliable means? Frome where or from whom id the evidence tobe collected? By whom is it to be collected? What instruments or procedures are to be used?

Will the collections of evidence in itself seriously affect the input, environment, process, oroutcomes? Will the collections of evidence become a regular part of the process, or is it an

add-on for one-time evaluation? What is the schedule for collection of information?

What procedures will be used for organizing and analysing data?In what form is information

to be collected? Will coding be required? If subjective judgements wiil be required in coding,

are the criteria for the adequate? Who will do the coding? How will the data be stored,

received, and processed? What analytic procedures are to be used?

Is the reporting procedure clear?Who will receive reports? Will reports be organized by

analytic procedures, by type of data, or by decisions to be made? Will report include the

practical implications regarding the various possible decisions to be made or leave theseimplications for the project staff of admnistrators to the evidence? Is the evaluator to state

explisitly the particular decisions which be believes are supported by the evidence? When

and in what detail are reports to be made?

How is the evaluation to be evaluated?Who will be involvedproject staff, the evaluator,

decision-makers, some presumably more objective individual? What will the criteria used inthis second-level evaluation becosts, program improvement, impact on further planning of

related enterprises? To whom and when is this report to be presented? What decisions are to


9/45

be anticipated as a result of the report? Will they include improvement of evaluation

processes in the future?

F. Beberapa Model Evaluasi Program

1. Model Tyler

Model ini dinamakan model Tyler karena tidak ada nama resmi yang diberikan oleh

pengembangnya. Tyler yang mengajukan model ini menuliskan buah pikirannya tersebuttidak dalam suatu tulisan lepas mengenai evaluasi. Ia mengemukakan pikiran-nya mengenai

evaluasi program ini dalam suatu buku kecil tentang kurikulum. Dengan buku kecil ini pulanamannya terangkat sebagai seorang ahli yang disegani baik dalam kurikulum maupun dalam

evaluasi. Buku yang diberi judul Basic principles of curriculum and instruction ditulis ketikaia bertugas sebagai tenaga pengajar di Universutas Chicago. Idenya tentang evaluasi

dituangkan dalam bab 4 yang diberi judul How can the efeffectiveness of leraningexperiences be evaluated?

Model yang dikemukakannya dibangun atas dua dasar, yaitu: evaluasi yang ditujukan kepada

tingkah laku siswa dan evaluasi harus dilakukan pada tingkah laku awal siswa sebelum suatu

pelaksanaan kurikulum serta pada saat siswa telah melaksana-kan kurikulum tersebut.

Dengan kedua dasar ini ia ingin mengatakan bahwa evaluasi kurikulum yang sebenarnya

hanya berhubungan dengan hasil belajar menurut pengertian yang dikemukakan terdahulu.Evaluasi kurikulum sebagai rencana yang dinamakan sebagai intermediate or preliminary

stages of evaluation (Tyler 1949:104) dianggap bukan merupakan suatu penghargaan yang

adekuat terhadap kurikulum. Evaluasi terhadap kurikulum sebagai kegiatan tidak dimasukkan

dalam ruang lingkup evaluasi oleh Tyler.

Dengan dasar evaluasi yang kedua, Tyler menghendaki evaluasi dapat menentukan

perubahan tingkah laku yang terjadi adalah memang perubahan yang disebabkan oleh

kurikulum. Kenyataan seperti itu menurut Tyler tidak mungkin dapat ditetapkan apabila

evaluator hanya melihat tingkah laku siswa setelah mereka mengikuti kurikulum tersebut.Dalam kata-katanya sendiri Tyler 1949:108 menulis:

On this basic, one is not able to evaluate an instructional prgram by testing students only atthe end odfthe program. Without knowing where the students were at the beginning, it is not

possible to tell how far changes have taken place.

Karena itu evaluasi yang dilakukan di mana model Tyler dipergunakan sebagaimanamestinya memerlukan informasi perubahan tingkah laku paling tidak pada dua saat yaitu

sebelum dan sesudah siswa mengikuti suatu kurikulum. Dalam istilah yang banyak

dipergunakan sekarang ini diperlukan adanya tes awal (pretest) dan tes akhir (posttest) untuk

mengumpulkan kedua informasi tersebut.

Berdasarkan informasi yang diperoleh dari hasil tes awal dan tes akhir ini kemudian model

yang dikembangkan Tyler ini mensyaratkan bahwa informasi yang diperoleh dari tes awal

adalah gambaran tingkah laku siswa yang ada sebelum mengikuti program. Sedangkan

informasi dari tes akhir adalah gambaran tingkah laku siswa karena pengalaman yang

diperolehnya selama mengikuti program tersebut. Oleh karena itu Tyler juga mengisyaratkanvaliditas informasi tes akhir tersebut. Usaha untuk menjamin validitas ini memerlukan cara

yang dianggap sangat tepat.

Lebih lanjut karena model ini sangat menekankan adanya tes awal dan tes akhir maka model

Tyler ini dikenal pula dengan nama black box. Nama ini mencerminkan bahwa apa yang

terjadi dalam proses tidak memerlukan perhatian oleh evaluator. Bagian ini sudah terjamindengan desain eksperimen tadi walalupun sesungguhnya evaluator tidak tahu persis apa yang

terjadi pada diri siswa. Karena itu bagian dari proses ini dianggap sebagai kotak hitam yangmenyimpan segala macam teka-teki.


10/45

Dalam pelaksanaannya, Tyler mengemukakan ada tga prosedur utama yang harus dilakukan.

Ketiga prosedur tersebut itu adalah:

menentukan tujuan kurikulum yang akan dievaluasi. menentukan situasi di mana siswa

mendapatkan kesempatan untuk memperlihatkan tingkahlaku yang berhubungan dengan

tujuan. memnentukan alat evaluasi yang akan dipergunakan untuk mengukur tingkah laku

siswa. Ketika menentukan tujuan kurikulum yang akan dievaluasi harus pula

dipertimbangkan mengenai tingkah laku yang bagaimana yang dianggap merupakanpernyataan bahwa tujuan tersebut telah tercapai. Artinya, evaluator harus dapat menentukan

jenis tingkah laku yang harus diperlihatkan siswa sesuai dengan materi yang telahdipelajarinya. Disini evaluator dituntut untuk mengembangkan kisi-kisi tujuan yang akan

dievaluasi dalam tabel dua dimensi: dimensi tingkahlaku dan dimensi materi. Oleh karena itudiharapkan para pengembang kurikulum telah merumuskan tujuan tersebut dalam bentuk

behavioral objectives.Konsekuensi dari persyaratan ini seringkali evaluator yang mempergunakan model Tyler

mengharapkan pula agar para pengembang program merumuskan tujuan program dalam

bentuk behavioral objectives. Seringkali terjadi, evaluator harus berkonsultasi terlebih dahulu

dengan para pengembang kurikulum mengenai tujaun apa yang akan dievaluasi mengenai

tingkat pencapaiannya. Pekerjaan evaluasi yang dilakukan oleh Braithwaite dan Koop (1982)

merupakan contoh model ini. Mereka mendapat tugas untuk mengevaluasi penataran yangdilakukan di bagian barat metropolitan Sidney. Untuk itu mereka membicarakan mengenai

tujuan program yang akan dievaluasi dan mengembangkan tujuan tersebut dalam bentuk

behavioral atau juga sering diistilahkan dengan operasional.

Persoalan pengembangan tujuan program menurut ukuran behavioral seperti yang

dipersyaratkan poleh Tyler memang sudah umum dilakukan di Indonesia, terutama setelah

PPSI diperkenalkan melalui Kurikulum 1975. tetapi harus diingat bahwa pada waktu Tyler

mengemukakan persyaratan tersebut, tujuan dengan rumusan yang demikian masih

merupakan sesuatu yang baru bagi dunia pendidikan di A.S. Justru gagasam Tyler ini yangkemudian mengilhami Bloom dan kawan-kawan mengembang-kan ide tersebut menjadi

taksonomi tujuan pendidikan yang terkenal tersebut. Taksonomi ini kemudian yangditerapkan di Indoensia melalui cara pengembangan tujuan instruksional yang tercakup dalam

model PPSI.Tujuan kurikulum yang akan dievaluasi, seperti yang juga dikembangkan dalam taksonomi

tujuan pendidikan Bloom dan kanwan-kawan, tidak selalu hanya berhubung-an dengan tujuanyang bersifat kognitif saja. Tetapi kurikulum yang menyangkut asepek afektif dan juga

psikomotorik dapat pula dievaluasi apabila tujuan tersebut dianggap penting oleh para

pengembang kurikulum dan dapat dinyatakan dalam bentuk operasional sehingga tujuan itu

dapat diamati. Dengan demikian ruang lingkup pekerjan evaluator dapat menjadi sangat luas.

Langkah kedua adalah menentukan situasi atau keadaan yang memberikan kesempatan

kepada siswa untuk menunjukkan kemampuan yang akan dievaluasi. Langkah ini sangat

berhubungan erat dengan langkah pertama. Pada langkah pertama dikatakan bahwa yang

dievaluasi adalah tingkat pencapaian tujuan kurikulum dan siswa dijadikan sumber utama

untuk mendapat informasi mengenai tingkat pencapaian tujuan tersebut. Oleh karena itudalam langkah kedua ini evaluator harus dapat menentukan situasi apa yang dianggap terbaik

agar kemampuan yang akan diperlihatkan siswa sebagai sumber informasi betul-betul

memperlihatkan kemampuan sebenarnya. Dengan demikian validitas data evaluasi terjamin.

Dalam langkah ini evaluator dapat saja mempergunakan lebih dari satu situasi, sesuai dengan

jenis data yang diharapkan yang sebetulnya merupakan konsekuensi dari tujuan yang akandievaluasi. Misalkan seorang evaluator akan menilai pencapaian tujuan kognitif kurikulum.

Katakanlah, evaluasi tadi ingin mengetahui tingkat pencapai-an tujuan kurikulum dalamsetiap jenjang kemampuan kognitif seperti yang dipersyarat-kan oleh kurikulum. Dengan


11/45

demikian evaluator tersebut akan berhubungan dengan kemampuan siswa dalam jenjang

pengetahuan, pemahaman, aplikasi, analisis, sintesis, dan evaluasi. Maka dalam langkah

kedua ini evaluator tadi harus menentukan situasi yang paling sesuai untuk mengevaluasi

kemampuan-kemampuan tersebut. Misalnya evaluator tida dapat menentukan bahwa

kemampuan-kemampuan tadi akan diperlihat-kan oleh siswa dalam suatu tes. Dengan

demikian, seluruh siswa yang dijadikan sumber informasi harus menyatakan kemampuan

mereka dalam situasi tes yang mungkin pula berupa situasi tes tertulis, tes lisan, tesperformansi, dan sebagainya.

Mungkin pula evaluator tersebut menentukan bahwa untuk tujuan seperti di atas akandipergunakan beberapa situasi yang berbeda. Untuk jenjang pengetahuan, pemahaman, dan

evaluasi akan dipergunakan situasi tes. Untuk jenjang aplikasi, analisis, dan sintesis akandipergunakan situasi bekerja di laboratorium. Barangkali pula kombinasi situasi lainnya yang

dipergunakan sesuai dengan hekikat bidang studi (konten kurikulum), karakteristik tujuan,waktu dan dana yang tersedia, serta kemampu-an evaluator yang melakukan tugas tersebut.

Pertimbangan profesional evaluator terhadap faktor-faktor yang baru disebutkan menentukan

situasi apa yang akan dipergunakannya.

Langkah kedua ini nampaknya sederhana. Tetapi ia sangat menentukan keberhasilan evaluasi

yang dulakukan. Apabila situasi yang ditetapkan tidak tepat, tingkah laku siswa yang

diharapkan tidak akan terungkapkan dengan baik. Artinya, apa yang ingin kita ketahui tidakterungkapkan dengan sebenarnya validitas data yang diperoleh sangat diragukan. Dengan

perkataan lain, tujuan kurikulum tidak terevaluasi sebagaimana seharusnya. Oleh karena itu

walaupun tampaknya sederhana, sebaiknya evaluator memberikan perhatian yang seksama

terhadap pelaksanaan langkah kedua ini.

Seperti hubungan antara langkah pertama dan langkah kedua, demikian pula keeratan

hubungan antara langkah kedua dengan langkah ketiga. Pada waktu evaluator menentukan

situasi dalam langkah kedua secara eksplisit sebenarnya ia telah pula menentukan langkah

ketiga, yaitu penetuan alat evaluasi yang akan dipergunakan. Alat evaluasi dapat berbentuktes seperti yang banyak dipergunakan orang. Tapi ia dapat pula berbentuk alat bukan tes

seperti alat observasi, kuesioner, panduan wawancara, dan lain sebagainya. Ketika iamenentukan situasi di mana siswa diharapkan dapat mengemukakan hasil belajar dengan

baik, evaluator harus memiliki pengetahuan tentang alat evaluasi: karakteristik alat tersebut,kekuatan dan kelemahan yang ada dihubungkan dengan tujuan yang akan diukur.

Meskipun secara eksplisit ia telah menentukan alat evaluasi yang akan dipergunakan, secaraeksplisit hal itu perlu dilakukan evaluator yang bersangkutan. Ia harus menyebutkan jenis alat

evaluasi tersebut. Setelah itu, model evaluasi kurikulum Tyler ini menghendaki evaluator

untuk melakukan kajian mengenai alat evaluasi yang tersedia. Pertanyaan pokok di sini ialah

apakah alat evaluasi yang tersedia sesuai dengan tujuan yang akan diukur. Dalam kata-

katanya sendiri Tyler (1949:113) menulis:

It is only after the objectives have been identified, clearly defined, and situations listed which

give opportunity for the expression of the behavior desired that it is possible to examine

available evaluation instruments to see how far they may serve the evaluation purposes

desired.

Apabila di antara instrumen yang tersedia ada yang memang mengukur tujuan yang sama

dengan tujuan yanga akan diukur, instrumen tersebut sudah barang tentu dapat dipergunakan.

Katakanlah bahwa seorang evaluator bertugas untuk mengukur pencapaian tujuan suatu

kurikulum tertentu. Untuk mudahnya sebut saja tujuan yang akan diukur tersebut sebagai X.kemudian setelah ia menentukan situasi bagi siswa untuk menyatakan kapasitasnya terhadap

tujuan tersebut, ia menelaah alat evaluasi yang telah dikembangkan orang. Apabila di antaraalat evaluasi yang tersedia ada yang memang sesuai dengan situasi yang telah ditentukan dan


12/45

untuk mengukur tujuan X tadi maka tidak ada salahnya apabila ia mempergunakan instrumen

tersebut. Hal ini bahkan sangat dianjurkan oleh model ini.

Tetapi kalau tidak ada, evaluator yang bersangkutan harus mengembangkan instrumen yang

sesuai dengan tujuan dan situasi yang telah ditetapkan. Dalam model ini sangat ditekankan

bahwa penggunaan suatu insrumen janganlah didasarkan atas pertimbangan kecanggihan

ataupun popularitas yang dipunyainya. Tujuan yang ingin diukurlah yang menentukanpemakaian suatu instrumen. Memang tugas mengembang-kan instrumen ini merupakan tugas

yang tidak ringan. Meskipun demikian, evaluator tersebut tidak dapat mengindarkan tugasini. Instrumen yang dikembangkan haruslah pula memenuhi persyaratan objektif, terandal

(reliabel) dan sahih (valid).Dilihat dari prosedur kerja evaluasi yang mempergunakan model Tyler ini, proses

pengembangan kriteria evaluasi dapat dilakukan melalui pendekatan pengembangan pre-ordinate maupun fidelity. Model ini memberikan keleluasaan kepada penggunaan kedua

pendekata ini. Pada waktu evaluator bersama dengan para pengembang kurikulum

menentukan tujuan mana yang akan diukur, disaat itulah kemungkinan penggunaan salah satu

dari kedua pendekatan pengembangan kriteria itu terjadi. Kalau pada waktu itu ditentukan

bahwa tujuan yang akan diukur adalah tujuan yang bersifat umum untuk setiap kurikulum

tanpa memperhatikan karakteristiknya, maka evaluator akan bekerja dengan pendekatanpengembangan kriteria pre-ordinate. Dengan demikian, alat evaluasi yang akan dipergunakan

cenderung pada alat evaluasi yang sudah ada karena alat evaluasi yang demikian banyak

dikembangkan orang. Biasanya tujuan yang akan diukur dengan pendekatan ini adalah tujuan

generik.

Apabila pada waktu penentuan tujuan yanga akan diukur ditentukan hanya tujuan-tujuan

yang spesifik terhadap kurikulum itu sendiri maka pendekatan pengembangan kriteria fidelity

akan dilakukan. Dengan pendekatan ini evaluator mempunyai kemungkinan besar harus

mengembangkan alat evaluasi khusus. Perbedaan kerakteristik antar setiap kurikulummenyebabkan tidak ada alat evaluasi yang tersedia akan sesuai dengan tujuan kurikulum yang

akan diuji. Terkecuali apabila evaluator tersebut mengevaluasi kurikulum yang sama denganevaluator atau tugas sebelumnya, hanya lingkungan pendidikan yang berbeda antara kedua

tugas tersebut. Dalam keadaan demikian tentu saja evaluator tersebut dapat mempergunakaninstrumen yang sudah ada. Jadi sebagian kerja sudah dapat diselesaikan.

Seperti pada setiap model, model evaluasi Tyler inipun memiliki kelebihan dan kelemahan.Keunggulan utamanya ialah kesederhanaanya. Jika dibandingkan dengan model evaluasi

lainnya, model evaluasi Tyler ini lebih sederhana, terlihat dalam peosedur kerja sepeeti

dibicara terdahulu. Evaluator hanya perlu memberikan perhatian kepada pengukuran hasil

belajar siswa yang belajar dari kurikulum yang dinilai. Bagi mereka yang terlatih dalam

pengukuran, kesederhanaan model ini memberikan kesempatan yang luas untuk melakukan

evaluasi kurikulum tanpa perlu pendidikan khusus lagi. Perbedaannya dengan prosedur

pengukuran adalah sangat kecil. Kalau dalam pengukuran mereka tidak perlu memperhatikan

karakteristik evaluan, sekarang mereka harus melakukannya. Tetapi, identifikasi karakteristik

itu segera dapat dilakukan dengan berkonsentrasi kepada pihak pengembang kurikulum.Keunggulan ini pada sisi lain merupakan kelemahan model evaluasi Tyler. Perhatiannya yang

hanya terpusatkan pada kurikulum sebagai hasil belajar menjadikan model ini tidak cukup

luas dipakai sebagai model evaluasi komprehensif. Seperti telah dibahas sebelumnya, hasil

belajar hanyalah merupakan salah satu dimensi kurikulum. Dengan demikian, dimensi

kurikulum lainnya tidak dapat dievaluasi dengan memper-gunakan model Tyler ini. Dimensikurikulum sebagai rencana dan proses tidak dapat dievaluasi dengan mempergunakan model

ini.


13/45

Asumsi yang dipergunakan model ini mengenai dimensi kurikulum sebagai proses sukar

dipertahankan. Studi-studi yang mengkaji mengenai dimensi proses memperlihatkan bahwa

implementasi kurikulum seringkali tidak sesuai dengan apa yang dikehendaki oleh kurikulum

sebagai rencana. Kenyataan dari hasil studi tentang proses ini menyebabkan sukar untuk

melakukan claim bahwa hasil yang diperlihatkan siswa adalah hasil yang ditimbulkan oleh

kurikulum yang dievaluasi. Oleh karena itu, proses merupakan variabel penting yang harus

diperhatikan dalam suatu kegiatan evaluasi.

2. Model Countenance Stake

Ini adalah model pertama evaluasi kurikulum yang dikembangkan oleh Stake. Dalamtulisannya ia sendiri tidak memberikan nama khusus tehadap model ini. Nama countenance di

sini disesuaikan dengan judul artikel yang ditulis walaupun pengertian countenance itusendiri mempunyai makna ambigous. Dalam suatu pengertian ia adalah keseluruhan

sedangkan dalam pengertian lain kata itu bermakna sesuatu yang disenangi (favourable).

Dalam tulisan itu, Stake ingin mengemukakan keseluruhan kegiatan evaluasi yang harus yang

harus dilakukan dan cara yang diinginkannya bagaimana evaluasi tersebut dilakukan. Oleh

karena itu, walaupun beberapa penulis lain yang membicarakan model ini memprgunakan

judul seperti model concruence atau model contingency, nama nama tersebut tidakdipergunakan di sini karena baik congruence maupun contingency merupakan dua konsep

utama dalam model pengolahan data yang dikemukakan oleh Stake. Tetapi kedua konsep itu

tidak dapat mewakili keseluruhan ide Stake mengenai evaluasi kurikulum. Jadi nama

countenance dipertahankan sebagai nama model ini secara keseluruhan.

Dalam model ini, Stake mendasarkan dirinya pada evaluasi formal, di mana dikatakannya

sebagai suatu kegiatan evaluasi yang sangat tergantung pada pemakaian checklist, structured

visitation by peers, controlled comparisons, and standardized testing of students (Stake,

1972:93). Lebih lanjut, model ini dikembangkan atas keyakinan bahwa suatu evaluasiharuslah memberikan deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dasat ini

masih menjadi keyakinannya ketika ia mengembangkan model-model evaluasi lain dikemudian hari, yang memberikan tekanan pada pendekatan kualitatif.

Model ini dimasukkan dalam model kuantitatif, karena dalam model ini jelas Stake masihmengutamakan data kuantitatif dan pendekatan kuantitatif dalam mengumpulkan data.

Bahkan mengenai peertimbangan yang duberikan berbagai kelompok sumber haruslahdikumpulkan secara obyektif; suatu sikap yang berubah ketika ia kemudian lebih cenderung

mempergunakan model-model kualitatif. Seperti yang diungkapkannya ketika ia

menguraikan tentang pertimbangan (Stake, 1872:95):

Evaluation will seek out and record the opinions of persons of special qulification. These

opinion, though subjective, can be very useful and can be gathered objectively, independent

of the solicitors opinions.

Bahkan dalam model ini Stake sangat menekankan peran evaluator dalam mengembangkan

tujuan kurikulum menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisipengukuran yang behavioristik dan kuantitatif.

Dalam model ini, Stake mengemukakan bahwa suatu evaluasi forma harus memberikan

perhatian terhadap keadaan sebelum suatu kegiatan kelas berlangsung dan terhadap kegiatan

kelas itu sendiri, serta menghubungkan dengan berbagai bentuk hasil belajar. Keadaan

sebelum suatu kegiatan kelas berlangsung dinamakannya antecendent. Sedangkan kegiataninteraksi yang terjadi di sekolah dinamakannya dengan istilah transactions.

Lebih lanjut dikemukakannya, bahwa ketiga tingkatan tersebut, antecendent, transaction danhasil (outcome), terbagi atas dua kategori. Kategori pertama ialah apa yang diinginkan


14/45

(intent) oleh pengembang program. Seorang guru, sebagai seorang pengembang program,

merencanakan mengenai keadaan (persyaratan) yang diingin-kannya, untuk suatu kegiatan

kelas tertentu. Apakah persyaratan tersebut berhubungan dengan siswanya seperti minat,

kemampuan, pengalaman, dan lain sebagainya yang biasa diisitilahkan dengan entry

behavior. Mungkin pula ersyaratan itu berhubungan dengan lingkungan di kelas. Lebih lanjut,

guru tersebut merencanakan apa yang diperkirakan akan terjadi pada waktu interaksi dikelas,

dan kemampuan apa yang diharapkan dimiliki siswa setelah proses interaksi berlangsung.Dengan kata lain, perencanaan yang dilakukan guru dalam satuan pelajaran, merupakan apa

yang diingin-kan guru tersebut (intent).Kategori kedua ialah kategori yang berhubungan dengan apa yang sesungguhnya terjadi,

bukan lagi apa yang diinginkan. Misalnya keadaan apa yang ada pada waktu suatu interaksikelas akan dilakukan; bagaimana dengan kemampuan siswa yang akan belajar; apakah siswa

telah belajar mengenai topik yang akan dibicarakan pada malam hari sebelum pelajaran berlangsung. Apakah atlas yang akan digunakan guru memang tersedia; demikian pula

dengan OHP yang akan dipakai oleh guru yang bersangkutan? Bagaimana interaksi tersebut

berlangsung? Apakah setelah guru mencoba memberikan pertanyaan kepada siswa untuk

mengetahui kemajuan yang mereka peroleh dari proses interaksi yang terjadi? Karena Stake

membuat ketegorinya berdasarkan apa yang dilakukan evaluator, kategori kedua ini

dinamakan observasi. Jadi seperti juga dengan intent, data mengenai observasi ini meliputiantecendent, transaction, dan hasil yang diperoleh.

Baik data yang dikelompokkan ke dalam intent maupun observasi adalah data yang

mengungkapkan tentang apa dan bagaimana kurikulum itu. Data ini baru merupakan sebagian

dari data yang harus dikumpulkan evaluator yang bekerja mempergunakan model evaluasi

ini. Oleh karena itu, pekerjan belumlah selesai. Ia baru menyelesaikan sebagian dari kegiatan

pengumpulan data yang harus dilakukannya.

Stake juga beranggapan bahwa, suatu evaluasi harus sampai kepada pemberian pertimbangan.

Stake yang menyadari banyak di antara evaluator yang enggan memberikan pertimbangandan untuk mengatasi hail tersebut, dalam model ini ia mengemukakan jalan keluar yaitu

evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orangyang dianggap memiliki kualifikasi untuk memberikan pertimbangan tersebut. Data

pertimbangan ini yang kemudian dimasukkan ke dalam matriks sebagai bagian dari modelini.

Data pertimbangan ini meliputi tiga jenjang yang dikemukakan oleh Stake, yaituantecendent, transactions, dan hasil yang diperoleh. Di samping meliputi tiga jenjang ini, data

mengenai pertimbangan tersebut terbagi pula atas tiga kategori, yaitu standar dan

pertimbangan. Oleh karena itu matriks pertimbangan, seperti juga metriks deskripsi, terdiri

dari atas 6 kotak. Tiga kotak untuk data pertimbangan dan tiga kotak lagi mengenai data

standar.

Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak. Di samping itu,

ada sebuat kotak lagi yang dinamakan kotak rasional. Setiap pengembang kurikulum/guru

harus memiliki rasional untuk setiap intent yang dikembangkan. Mungkin sekali mereka tidak

mempunyai rasional yang tertulis, dan mungkin pula mereka tidak dapat mengemukakannyadalam susunan kalimat yang baik tapi mereka pasti memilikinya.

Cara kerja model evaluasi Stake ini adalah sebagai berikut. Evaluator mengumpulkan data

mengenai apa yang diinginkan pengembangan program baik yang berhubungan dengan

antecendents (persyaratan awal), transaksi (interaksi), dan juga hasil. Data dapat

dikumpulkan melalui studi dokumen tetapidapat pula dilakukan dengan jalan wawancara.Cara terakhir ini dilakukan apabila dokumen tidak diperoleh karena sesuatu dan lain hal. Cara

terbaik tentulah melalui studi dokumen.


15/45

Bersamaan dengan pengumpulan data mengenai intents (tujuan) ini dapat pula dikumpulkan

resional dari setiap tujuan tersebut. Di sini Stake memperingatkan agar data mengenai

rasional janganlah dikumpulkan dengan jalan mendikte pengembang program/guru tersebut.

Biarkanlah mereka berbicara dengan pengertian dan bahasa yang ada pada diri mereka.

Evaluator mendengarkan dan mencatat apa yang dikemukakan oleh pengembang program.

Suatu hal yang perlu diperhatikan, walaupun dalam gambar kotak rasional berada di sebelah

kiri matriks deskripsi, hal itu tidaklah berarti bahwa pengumpulan data tentang rasionaldilakukan terlebih dahulu. Dalam kenyataannya, data tentang rasional tak mungkin

dikumpulkan sebelum data mengenai tujuan telah dikumpulkan. Oleh karena itu waktu yangpaling cepat untuk segera mengumpulkan data mengenai rasional adalah bersamaan dengan

waktu pengeumpulan data mengenai tujuan.Kegiatan berikutnya ialah pengumpulan data observasi mengenai persyaratan awal, transaksi

dan hasil. Sesuai dengan namanya, data untuk bagian ini dikumpulkan melalui observasi.Dan, seperti ditekankan Stake, observasi ini haruslah observasi formal. Maksudnya, observasi

tersebut haruslah dilakukan denga mepergunakan instrumen (alat pengumpul data yang

dikembangkan khusus). Stake (1972:98) mengemukakan bahwa instrumen yang dipakai

dapat meliputi daftar inventori, daftar pertanyaan tentang data biografis, daftar wawancara,

daftar cek, pertanyaan tentang pendapat (optionares), dan semua jenis tes psikometrik. Yang

penting, data tersebut berhubungan dengan apa yang dikembangkan dalam tujuan.Dalam pengolahan data matriks deskripsi, Stake mengemukakan dua konsep yaitu

contingency dan cungruency. Kedua konsep ini berbeda dalam penggnnaannya. Contingency

dipegunakan untuk menganalisis data secara vertikal, mencari kesesuaian antara kotak di atas

dengan kotak di bawahnya. Ada dua analisis mengenai kesesuaian ini. Pertama adalah

kesesuaian secara logika, yaitu kesesuaian menurut pemikiran logika evaluator. Evaluator

mempertimbangkan apakah hubungan yang satu dengan lainnya masuk akal, apakah yang

satu itu mungkin tercapai melalui apa yang ada pada kotak lainnya.

Analisis logis ini dipergunakan Stake dalam memberikan pertimbangan mengenaiketerhubungan antara persyaratan awal, transaksi, dan hasil dari kotak-kotak tujuan (intent).

Evaluator harus dapat menentukan apakah persyaratan awal yang telah dikemukakanpengembang program/guru. Ataukah sebetulnya ada model transaksi lain yang lebih efektif

untuk mencapai apa yang dikemukakan dalam prasyarat. Demikian pula mengenai hubunganantara transaksi dengan hasil yang diharapkan.

Analisis kedua adalah analisis empirik kontingensi. Dasar bekerjanya adalah sama dengananalisis logis tapi data yang dipergunakan adalah data empirik. Jadi, dalam analisis ini

evaluator harus mempertimbangkan keterhubungan tersebut berdasarkan data empirik yang

telah dikumpulkannya. Pertanyaan-pertanyaan yang diajukan untuk analisis logus

dipergunakan untuk analisis empirik ini.

Masih dalam analisis mengenai data deskriptif, pekerjaan evaluator berikutnya ialah

mengadakan analisis congruence (kesesuaian) antara apa yang dikemukakan dalam tujuan

(intent) dengan apa yang terjadi dalam kegiatan observasi. Pertanyaan yang dapat diajukan di

sini ialah apakah yang telah direncanakan dalam tujuan memang sesuai dalam

pelaksanaannya di lapangan (observasi). Apakah terjadi penyimpangan-penyimpangan antaraapa yang direncanakan (intent) dengan apa yang terjadi dan kalau ada penyimpangan faktor-

faktor apa yang berperan dalam penyimpangan tersebut.

Apabila analisis contingency dan concruency tersebut telah diselesaikan, adalah tugas

evaluator untuk menyerahkan hasilnya kepada tim yang terdiri dari para ahli dan orang yang

terlibat dalam program. Tim ini yang akan meneliti kasahihan hasil analisis evaluatortersebut. Lebih lanjut tim ini pula yang akan memberikan persepsinya mengenai faktor

penting baik dalam contingency maupun congruency.


16/45

Tugas berikut evaluator ialah memberikan pertimbangan mengenai program yang sedang

dikaji. Untuk itu evaluator memerlukan standar. Dalam model keseluruhan digambarkan

bahwa dalam matriks pertimbangan ada yang dinamakan standar dan pertimbangan. Standar

dapat berbentuk standar mutlak dan relatif. Standar mutlak adalah standar yang dianggap

belaku untuk suatu kurikulum atau program. Katakanlah untuk program IPS ditentukan

adanya standar-standar tertentu baik mengenai tujuan yang akan dicapai, proses belajar

mengajar, dan hasil belajar. Mungkin saja standar itu datang dari individu para ahli tetapistandar itu adalah standar yang diinginkan bagi setiap program studi IPS, terlepas dari

karakteristik khusus yang dimiliki program tersebut.Standar relatif berhubungan dengan komparasi antara satu program dengan program lainnya

dalam satu bidang studi yang sama. Untuk konteks pendidikan di AS dan beberapa negaralainnya, adanya beberapa program dalam satu bidang studi yang sama adalah jamak. Suatu

negara bagian tertentu atau bahkan satu lingkungan otoritas pendidikan tertentu memiliki program IPA yang berbeda dengan negara bagian atau lingkungan otoritas pendidikan

lainnya. Dalam konteks pendidikan Indonesia perbedaan semacam itu mungkin tidak akan

terjadi. Oleh karena itu komparasi untuk konteks pendidikan di Indonesia hanya dapat

dilakukan antara program yang lama dengan program yang baru.

Menurut Stake (1972:101), evaluator yang harus mempergunakan kedua standar tersebut.

Jadi, evaluator harus memberikan pertimbangan baik yang bersifat mutlak maupun relatif.Hanya dengan kedua pertimbangan tersebut arti dari kurikulum tersebut dapat ditetapkan

terlebih mantap. Dengan demikian, pada waktu evaluator memberikan umpan balik kepada

pembuat keputusan, pertimbangan yang diberikannya adalah pertimbangan yang bersifat

menyeluruh (komprehensif).

Model Stake ini lebih dapat dipergunakan untuk melakukan evaluasi mengenai pelaksanaan

implementasi kurikulum dalam konteks pendidikan Indonesia. Proses pengembangan

kurikulum di Indoensia sedemikian rupa sehungga kurikulum sebagai rencana dibuat di

tingkat basional dan bersifat tidak siap pakai. Guru masih harus mengembangkan rencanabesar tersebut menjadi rencana yang lebih operasional, yang dalam istilah kependidikan di

Indonesia disebut satuan pelajaran (SP). Satuan pelajaran inilah yang dapat dipergunakanuntuk mengisi matriks intent model yang dikemukakan Stake.

Mengenai standar yang diinginkan Stake dapat dikembangkan dari komponen yang adadalam rencana besar kurikulum tersebut. Meskipun demikian, tidak ada salahnya apabila

evaluator juga mempergunakan standar yang dikembangkan dari para ahli bidang studibersangkutan. Tentu saja masalah akan timbul apabila antara standar yang dikembangkan dari

rencana besar tidak bersesuaian dengan yang dikembangkan dari para ahli tadi. Tapi

persoalan yang demikian juga dihadapi setiap evaluator yang mempergunakan model Stake

ini, meskipun dalam konteks pendidikan di AS di mana model ini dilahirkan. Hal ini pula

kiranya yang menyebabkan mengapa Stake (1972:100) menganjurkan agar jangan

mengevaluasi kurikulum dengan mikroskop tetapi seharusnya dengan a panoramic view

finder. Adanya beragam standar akan memebrikan kesempatan kepada evaluator untuk

mempergunakan standar tersebut sebagai teorpong panorama dan buka mikroskop.

Meskipun demikian untuk konteks pendidiakn di Indonesia, selain untuk mengevaluasidimensi kurikulum sebagai kegiatan, model Stake ini dapat dipergunakan dalam

pengembangan kurikulum di tringkat nasional apabila eksperimen dilakukan. Pada waktu

eksperimen, pengembang kurikulum dapat menerapkan model ini sepenuhnya karena semua

persyaratan Stake terpenuhi.

3. Model CIPP


17/45

Model ini dikembangkan oleh suatu tim yang diketuai Stufflebeam. Pada waktu memimpin

tim ini ia bekerja di Ohio State University. Meskipun demikian, tim yang dipimpinnya

tersebut terdiri dari para sarjana yang berkerja di berbagai universitas dan salah seorang

anggotanya, Gephart, adalah sarjana yang bekerja di Phi Delta Kappa (PDK). Organisasi ini

pula yang menugaskan Stufflebeam dan kawan-kawannya berkarya mengembangkan

pemikiran tentang evaluasi pendidikan. Oleh karena itu, model yang mereka kembangkan itu

kadang-kadang dinamakan pula dengan model PDK.Nama CIPP, dalam kenyataannya lebih dikenal masyarakat perguruan tinggi dan kalangan

evaluator. Hal ini mungkin sekali disebabkan CIPP adalah singkatan dari Context, Input,Process dan Product. Memang keempat daerah kerja ini adalah komponen utama dari model

ini. Dalam buku yang mereka tulis, model tersebut dikemukakan dalam bab 7, setelah merekamendiskusikan pikiran mereka mengenai evaluasi dan hubungannya dengan pembuatan

keputusan. Dalam buku suntingan Madaus, Scriven dan Stufflebeam (1983) model inidibicarakan kembali dalam bab 7 pula, ditulis oleh Stufflebeam sendiri. Tetapi dalam buku

suntingan ini, Evaluation Model, Stufflebeam membuat semacam penyederhanaan yang

sebenarnya lebih mengena pada pokok ide tentang model itu sendiri.

Menurut Stufflebem (1983:117) model ini telah diterapkan di banyak tempat di A.S. dan

telah dibahas dalam beberapa disertasi doktor. Di antara beberapa disertasi dibuat oleh

mahasiswa di the Ohio State Universiry. Sayangnya, di universitas ini pada saat sekarangsudah tidak menunjukkan bekas-bekas hasil kerja profesor tersebut. Seolah-olah hasil binaan

Stufflebeam di unversitas tersebut sirna begitu saja. Adalah wajar pula kalau model CIPP ini

berkembang di universitas Western Michigan di mana Stufflebeam sekarang ini bekerja.

Penyederhanaan model dalam bentuk diagram dilakukan setelah ia meninggalkan the Ohio

State Unversity.

Meskipun terjadi penyederhanaan, pokok-pokok pikiran CIPP yang dikembang-kan tim PDK

masih tetap merupakan dasar dari penyederhanaan yang dilakukan Stufflebeam. Oleh karena

itu, pembahasan mengenai model CIPP ini tidak akan membandingkan antara keduanya.Pembahasan dilakukan berdasarkan model yang dikembangkan terakhir.

Sesuai dengan namanya, model ini terbentuk dari 4 jenis evaluasi yaitu evaluasi konteks(Context), masukan (Input), proses (Process) dan hasil (Product). Keempat evaluasi ini

merupakan suatu rangkaian keutuhan. Tetapi seperti dikemukakan oleh Stufflebeam sendiri,dalam pelaksanaan seorang evaluator dapat saja hanya melakukan satu jenis atau kombinasi

dari dua atau lebih jenis evaluasi itu (Stufflebeam, 1983:122). Artinya, seorang evaluatortidak selalu harus mempergunakan keempatnya. Walaupun demikian, karena model ini

dikembangkan berdasarkan suatu pandangan tentang kegiatan kurikulum sebagai sesuatu

dalam dimensinya yang utuh, pelaksanaan ke empat jenis evaluasi model ini merupakan hal

yang diharapkan. Lagi pula kekuatan model sebetulnya terletak dari rangkaian kegiatan

keempat jenis evaluasi itu sendiri.

Sesuai dengan namanya, keempat jenis evaluasi Stufflebeam ini mempunyai obyek kejian

yang berbeda. Evaluasi konteks ditujukan untuk menilai keadaan yang sedang dilakukan oleh

suatu lembaga pendidikan. Jadi, evaluasi ini tidak mengharuskan lembaga pendidikan

mempunyai suatu kurikulum baru terlebih dahulu untuk melakukan kegiatan evaluasi.Evaluasi justru dilakukan dari kegiatan awal sebelum suatu inovasi kurikulum direncanakan.

Bahkan adalah fungsi dari evaluasi konteks untuk melihat apakah diperlukan adanya suatu

inovasi atau tidak.

Tujuan evaluasi konteks yang utama ialah untuk mengetahui kekuatan dan kelemahan yang

dimiliki evaluan (Stufflebeam, 1983:128). Dengan mengetahui kekuatan dan kelemahan ini,evaluator dapat memberikan arah perbaikan yang diperlukan. Dalam melakukan evaluasi ini

evaluator harus dapat menemukan kebutuhan yang diperlukan evaluan. Oleh karena itu,evaluan konteks ini sebagian tigasnya adalah melakukan need assesment. Tetapi, selain dari


18/45

need asesment, evaluasi konteks ini harus pula dapat memberikan pertimbangan apakah

tujuan yang akan dicapai sesuai dengan kebutuhan yang telah ditentukan.

Dari tugas yang harus dilakukan terlihat nahwa evaluasi konteks mencoba untuk memberikan

pertimbangan mengenai nilai dan arti dari auatu keadaan. Nilai diperlihat-kan dengan

mengemukakan mengenai keadaan evaluan. Kekuatan dan kelemahan yang dimiliki evaluan

merupakan hasil pertimbangan evaluator tentang nilai evaluan. Sedangkan arti evaluan

diperlihatkan dengan memberikan pertimbangan apakah tujuan yang akan dicapai sesuaidengan kebutuhan.

Dari evaluasi konteks ini terlihat perbedaan antara model CIPP ini dengan model-modelevaluasi yang telah dibahas terdahulu. Model-model lain mulai dengan adanya suatu inovasi

yang sedang dilaksanakan oleh suatu lembaga pendidikan. Inovasi itu yang kemudiandijadikan evaluan. CIPP bahkan membantu evaluan untuk memutus-kan apakah inovasi

diperlukan atau tidak. Kalau perlu, evaluator yang mempergunakan model CIPP tidak lantasberpangku tangan. Evaluator harus dapat menentukan skala inovasi yang dilakukan.

Dalam model aslinya dikenal ada tiga jenis skala inovasi yang mungkin dilakukan. Ketiganya

diberi label yang cukup klasik walaupun cukup jelas menggambarkan skala yang dimaksud.

Ketiganya ialah homeostatic, incremental, dan neobolistic. Homeostatic merupakan skala

terendah di mana inovasi yang akan dilakukan hanya memasukkan unsur baru yang tidak

berarti. Dapat dikatakan bahwa skala inovasi homeostatic tidak akan mengubah pola kegiatanyang sudah ada. Hanya elemen tertentu dari pola yang ada yang harus diubah. Dampak

perubahan hanya bersifat mikro. Oleh karena itu, apabila inovasi yang akan dilakukan

bersifat homeostatic, evaluasi berikutnya tidak dapat dikatakan tidak diperlukan. Tetapi

apabila skala inovasi yang akan dilakukan bersifat incremental (penambahan), apalagi dalam

skala noebolistic, evaluasi berikutnya yaitu evaluasi masukan merupakan suatu yang

dipersyaratkan.

Mengapa demikian? Seperti dikemukakan oleh Stufflebeam (1983:130), bahwa orientasi

utama evaluasi ialah mengemukakan suatu program yang dapat mencapai apa yangdiinginkan lembaga tersebut. Program yang dimaksudkan ialah program yang membawa

perubahan yang membawa perubahan berskala penambahan dan pembaharu-an. Lebih lanjut,Staufflebeam menulis:

This type of study should identify and rate relevant approaches (including any that arealready in operation) and assist and explicating and shaking down the one that is chosen for

instalation or continuation. It should also search the clients environment for barriers,constraints, and potentially available resources that need to be taken info account in the

process of activating the program.

Dengan demikian evaluasi masukan tidak hanya melihat apa yang ada pada lingkungan

lembaga tersebut ( baik material maupun personal) tetapi juga harus dapat memperkira-kan

kemungkinan-kemungkinan yang akan dihadapi di waktu mendatang ketika suatu inovasi

kurikulum dilaksanakan.

Dari apa yang telah dibicarakan mengenai evaluasi masukan ini, makin jelas bahwa CIPP

tidak hanya dilaksanakan dalam situasi di mana suatu inovasi sedang dilaksanakan tetapi justru model ini dilakukan ketika inovasi itu akan atau belum dilaksanakan. Meskipun

demikian, tidaklah berarti bahwa CIPP tidak dapat dapat dilaksanakan apabila suatu inovasi

kurikulum sedang dalam proses pelaksanaan. CIPP tetap dapat dilakukan kendati suatu

lembaga pendidikan telah melaksanakan suatu inovasi kurikulum dalam waktu tertentu.

Seperti telah dikemukakan, Stufflebeam telah mengatakan CIPP tidak mutlak harusdigunakan dalam keseluruhan model, CIPP dapat digunakan dalam salah satu atau kombinasi

dari dua atau lebih kegiatan evaluasi. Jadi, CIPP dapat digunakan hanya denganmenggunakan evaluasi proses saja. Mengingat obyek kajian dan tujuan yang akan dicapai


19/45

evaluasi proses, CIPP dapat digunakan walaupun bukan dari sejak awal ketika akan

menemukan ide inovasi.

Evaluasi proses adalah evaluasi mengenai pelaksanan dari suatu inovasi kurikulum. Jadi,

kalau evaluasi konteks adalah evaluasi kurikulum dalam dimensi pengertian sebagai ide,

evaluasi masukan adalah evaluasi kurikulum dalam dimensi pengertian sebagai rencana,

evaluasi proses adalah evaluasi kurikulum dalam dimensi pengertian sebagai realita atau

kegiatan. Artinya, evaluasi proses ini baru dapat dilakukan apabila inovasi kurikulum tersebuttelah dilaksanakan di lapangan, bukan pada waktu ia dirancang. Oleh karena itu, evaluator

dapat saja menggunakan model CIPP walaupun ia baru diminta berpartisipasi ketika suatuprogram inovasi sedang dilaksanakan.

Dalam pelaksanaannya, model CIPP ini bertujuan memperbaiki keadaan yang ada. Evaluatordiminta untuk menentukan sampai sejauh mana rencana inovasi itu dilaksanakan di lapangan,

hambatan-hambatan apa yang ditemui yang tak dapat diperkirakan sebelumnya, dan perubahan-perubahan apa yang harus dilakukan terhadap inovasi tersebut. Informasi yang

dikumpulkan disajikan sebagai umpan balik bagi para pengelola dan juga staf. Dengan

demikian, keputusan-keputusan yang diperlukan dalam usaha memperbaiki proses yang

sedang berlangsung dapat dilaksanakan.

Dari tujuan yang akan dicapai oleh evaluasi proses CIPP ini terlihat jelas bahwa CIPP

mempergunakan pendekatan pengembangan kriteria baik yang bersifat fidelity maupun yang bersifat mutual adaptive. Kriteria yang bersifat fidelity terlihat dari tujuan untuk

menentukan sampai sejauh mana rencana inovasi yang dibuat telah tercapai. Pendekatan

mutual adaptive terlihat dari adanya usaha untuk memperbaiki keadaan lapangan agar

inovasi itu sendiri. Artinya, evaluator yang melaksanakan evaluasi proses ini harus pula dapat

memberikan informasi mengenai hal-hal apa dari lapangan yang harus diubah dan komponen

apa dari inovasi yang harus pula diubah. Dengan perubahan-perubahan tersebut diharapkan

inovasi dan lapangan mencapai kesesuaian.

Evaluasi hasil adalah kegiatan evaluasi berikutnya dalam model CIPP. Tujuan utama darievaluasi hasil ini adalah untuk menentukan sampai sejauh mana kurikulum yang

dimplementasikan tersebut telah dapat memenuhi kebutuhan kelompok yangmempergunakannya (Stufflebeam, 1983:134). Dalam hal ini, diharapkan pula bahwa evaluasi

hasil memperlihatkan pengaruh program tidak hanya yang bersifat langsung tapi jugapengaruh tidak langsung. Pengaruh tersebut tidak saja yang bersifat positif (biasanya evaluasi

hasil hanya melihat pengaruh dari sudut pandangan positif ini), tetapi juga pengaruh negatifdari kurikulum tersebut.

Adanya pengaruh negatif ini kedengarannya aneh tetapi sebenarnya realistis. Bukankah suatu

hal yang mustahil bahwa suatu kurikulum menghasilkan pengaruh sampingan yang bersifat

negatif yang tidak pernah diperkirakan oleh para pengembang-nya. Misalnya, suatu

kurikulum yang dikembangkan berdasarkan tradisi intelektual. Hasilnya, mungkin

memberikan kemampuan intelektual tinggi bagi siswa tapi dapat pula kemampuan intelektual

tinggi tersebut menyebabkan siswanya menjadi ingkar terhadap agama. Dalam suatu studi di

AS, misalnya, ditemukan bahwa program yang dikembangkan berdasarkan pandangan

humanistik, memberikan pengaruh negatif dalam aspek disiplin. Evaluasi hasil dalam konsepCIPP ini memberikan laporan komprehensif mengenai pengaruh dari program tersebut.

Untuk itu barangkali suatu perbandingan dengan kurikulum lainnya perlu dilakukan sehingga

pendekatan pengembangan kriteria preordinate yang dipergunakan.

Adanya ruang lingkup pengaruh yang luas sebagai fokus kajian evaluasi hasil CIPP

memberikan kesan ada pengaruh model evaluasi Goal Free dari Scriven. Sayangnya, haltersebut tidak dapat dinyatakan secara pasti. Paling tidak adanya pengaruh tersebut tidak

dapat diidentifikasi dari bacaan yang dipergunakan Stufflebeam. Kiranya korespondensi pribadi dapat lebih menjelaskan persoalan. Sayangnya, korespondensi semacam itu belum


20/45

dapat dilakukan penulis buku ini. Hanya pada bagian awal tulisannya, dikatakan ia

berhubungan dengan Scriven. Bahkan mereka berdua pernah diminta untuk membicarakan

model masing-masing pada beberapa lembaga. Bukan tidak mungkin pengaruh tersebut

berkembang selama masa ini. Atau, ide tersebut memang muncul secara terpisah pada kedua

diri pengembang model tersebut walaupun keduanya sering berdiskusi.

Suatu hal yang pasti dan diakui oleh Stufflebeam bahwa terdapat perbedaan pandangan

mengenai peran evaluasi yang cukup prinsipil antara dia dengan Scriven. Sementara modelCIPP lebih menekankan pada peran formatif sedangkan model Scriven, baik formatif-sumatif

maupun Goal Free, sangat memberikan perhatian yang besar terhadap peran sumatif. Olehkarena itu dalam evaluasi hasil inipun model CIPP memberikan posisi penting bagi peran

formatif. Artinya, informasi yang dihasilkan evaluasi hasil CIPP tidak dipergunakan untukmenentukan apakah suatu program harus diganti. Informasi yang diberikan digunakan untuk

menetapkan apakah ada komponen kurikulum yang harus diperbaiki.Karena sifatnya yang demikian, adalah sangat berbahaya kalau evaluasi hasil model CIPP ini

dilakukan secara terpisah. Keterbatasan ruang lingkup evaluasi hasil merupakan hambatan

sehingga informasi yang diberikan tidak cukup kuat untuk dipergunakan sebagai landasan

dalam memperbaiki program. Misalnya, katakanlah kalau evaluasi hasil menunjukkan bahwa

hasil belajar siswa sangat rendah dibanding-kan dengan apa yang direncanakan. Lantas,

kesimpulan apa yang dapat diambil? Apakah kelemahan tersebut disebabkan oleh faktormasukan ataukah faktor proses.

Atau, mungkin kelemahan itu disebabkan kelemahan dalam kurikulum itu sebagai suatu ide?

Adanya kelemahan semacam ini bukannya tidak disadari oleh Stufflebeam. Oleh karena itu ia

menganjurkan, kalaulah jenis-jenis evaluasi yang ada dalam CIPP akan dilakukan tidak

seutuhnya, sebaiknya pekerjaan evaluasi meng-gabungkan dua atau lebih dari jenis evaluasi

yang ada. Dengan adanya penggabungan ini tentu saja kelemahan seperti yang diungkapkan

di atas tidak perlu dikhawatirkan. Keunggulan suatu jenis evaluasi dapat menutupi kelemahan

jenis evaluasi lainnya.Tampaknya, kalau model CIPP ini diperhatikan, yang paling dapat diper-tanggungjawabkan

ialah evaluasi konteks di sati pihak, evaluasi masukan, proses, dan hasil di lain pihak.Pemisahan semacam ini merupakan suatu penyelesaian terutama apabila evaluasi hasil akan

dilakukan. Apabila evaluasi hasil tidak diikutsertakan, persoalannya tidaklah begitumengkhawatirkan. Setiap gabungan lainnya tidak akan membawa persoalan yang

mengandung resiko tinggi bagi pengambil keputusan.Sudah tentu yang terbaik ialah apabila keseluruhan model CIPP dapat dilaksana-kan. Gambar

6 memperlihatkan alur kerja keseluruhan model tersebut. Seperti terlihat dalam gambar

tersebut, dalam model ini perbedaan kegiatan dinyatakan dengan perbedaan bentuk. Bentuk

kotak persegi empat digunakan untuk menggambarkan kegiatan pelaksanaan. Bentuk belah

ketupat digunakan untuk menggambarkan keputusan yang harus diambil. Oleh karena itu

dalam setiap keputusan itu ada garis ya yang berarti keputusan yang diambil mengiyakan

pertanyaan ayanga ada dalam bentuk belah ketupat itu. Sedangkan tidak berarti menolak

pertanyaan yang diajukan. Bentuk lonjong (oval) menunjukkan kegiatan evaluasi yang

dilakukan. Bagi pembaca yang kenal dnegan program komputer tentu saja bentuk-bentuktersebut bukanlah sesuatu yang baru.

Dalam diagram asli mengenal CIPP kotak untuk kegiatan evaluasi proses dan hasil

dipisahkan. Dalam diagram terbaru ini Stufflebeam menggabungkan kedua kegiatan evaluasi

itu dalam satu kotak. Kiranya, penggabungan ini merupakan sesuatu yang sugestif bahwa

paling tidak evaluasi hasil harus digabungkan dalam pelaksanaan-nya dengan evaluasi proses.Gambar 6 yang memperlihatkan alur kerja model CIPP itu sangat jelas memperlihatkan

kapan suatu evaluasi diadakan dan jenis keputusan apa diharapkan, serta tindak lanjut apayang dapat dilakukan berdasarkan keputusan yang diambil. Sebagai contoh, evaluasi konteks


21/45

secara berkala melakukan kajian terhadap pelaksanaan sistem yang berlaku. Dari hasil kajian

itu harus dapat diputuskan apakah suatu inovasi diperlukan. Kalau tidak, kembali

melaksanakan apa yang sedang dilakukan oleh lembaga pendidikan itu. Kalau suatu inovasi

diperlukan (ya), masalah yang dihadapi harus diidentifikasi dan tujuan yang akan dicapai

harus pula dirumuskan. Setelah itu, keputusan yang harus diambil adalah apakah pemecahan

masalah sudah memuaskan. Kalau sudah, solusi itu dilaksanakan. Kalau tidak, evaluasi

masukan dilaksanakan. Demikian seterusnya.Model CIPP ini memiliki keunggulan terutama apabila keseluruhan model dilaksanakan.

Keempat dimensi kurikulum, seperti yang dibicaraan dalam buku ini dapat dilayani dengan baik oleh model ini. Kurikulum dalam dimensi ide dapat dievaluasi meklakui evaluasi

konteks. Pertnyaan keputusan tentang apakah suatu ide inovasi kurikulum mempunyaikekuatan justifikasi adalah pertanyaan dasar dalam kajian dimensi ide. Evaluasi masukan

dapat ditujukan kepada kurikulum dalam dimensi sebagai rencana. Seperti diketahui dalam pendekatan sistem, yang juga sebenarnya merupakan dasar pemikiran model CIPP ini,

kurikulum sebagai rencana adalah suatu masukan (kadang-kadang disebut dengan istilah

instrumental input. Sedangkan evaluasi proses dan hasil, sesuai dengan namanya, ditujukan

untuk mengkaji dimensi proses dan hasil suatu kurikulum.

Keunggulan lain dari model ini ialah peran aktif evaluator sejak awal. Seperti telah

dikemukakan, evaluasi konteks dilaksanakan bahkan sebelum suatu ide inovasi dirumuskansecara kongkrit. Evaluator harus melihat keadaan yang barlaku dan kemudian, berdasarkan

hasil kajian tersebut, mempertanyakan apakah suatu inovasi diperlukan. Di sini evaluator

bertindak sebagai orang yang mempunyai posisi penting dalam membantu memberikan

penyelesaian terhadap masalah yang dihadapi suatu lembaga pendidikan. Sepanjang

pengetahuan penulis, model lain tidak memberikan pesan yang sedemikian penting bagi

evaluator terkecuali kejian need assessment yang biasanya dimasukkan dalam ruang

lingkup kajian perencanaan. Tetapi model CIPP menempatkan kajian need assessment

sebagai salah satu teknik evaluasi konteks dan memberikan kedudukan yang penting bagievaluator dalam suatu usaha inovasi.

Kelemahan model ini ialah apabila ia diterapkan secara bagian demi bagian (partial).Penerapan yang demikian melemahkan ide dasar model. Pelaksanaan kombinasi antar dua

atau lebih jenis evaluasi menyebabkan alur kegiatan evaluasi menjadi tidak utuh. Dengan pelaksanaan yang demikian, hubungan antara satu keputusan dengan keputusan lain dapat

kehilangan kesinambungan.

4. Model Evaluasi Scriven

Menurut Michael Scriven, evaluasi program dibedakan atas dasr fungsinya yaitu: evaluasi

formative dan evaluasi sumatif.

Evaluasi formatif berfungsi untuk mengumpulkan data selama kegiatan sedang dilaksanakan.

Data yang dikumpulkan dapat pula digunakan oleh pengembang program untuk membentuk

dan memodifikasi program. Dalam beberapa hal, penemuan-penemuan dari evaluasi dapat

digunakan sebagai bahan acuan bagi pelaksana dalam melaksanakan program selanjutnya,agar tidak terjadi pemborosan biaya, tenaga dan waktu.

Evaluasi sumatif berfungsi untuk mengmpulkan data ketika kegiatan program benar-benar

selesai. Evaluasi sumatif dilaksanakan dengan tujuan untuk mengetahui kemanfaatan

program, terutama jika dibandingkan dengan program lain yang sejenis. Data yang

dikumpulkan selama evaluasi sumatif sangat berguna bagi pihak pembuat keputusan ataupenanggungjawab program dalam menentukan kebijakan dan tindak lanjut.

Oleh Scriven, evaluasi formatif dan sumatif menunjuk model evaluasi karena mengandungpengertian tentang:


22/45

a. Komponen

1) Formatif : Evaluasi sebagian program

2) Sumatif : Evaluasi seluruh program

b. Instrumen

1) Formatif : Disusun oleh evaluator

2) Sumatif : Terstandar

c. Pelaksana1) Formatif : Dilakukan orang dalam

2) Sumatif : Dilakukan orang luard. Langkah-langkah

1) Formatif : Terus menerus disusun, memperoleh hasil sambilmenggunakan langsung, tidak perlu desain lengkap.

2) Sumatif : Satu kali pelaksanaan: menyeluruh, memperolehdata, mengolah dan menyimpulkan data dan

menyebarkan kepada pihak pengambil

keputusan. Memerlukan penyusunan desain

secara lengkap.

Langkah-langkah pelaksanaan evaluasi formatif dan evaluasi sumatif.

5. Evaluasi formatif dilaksanakan selama program berlangsung dengan tujuan untukmenyediakan informasi yang bermanfaat kepada pimpinan atau penanggungjawab program

untuk kepentingan perbaikan dan penyempurnaan program. Setiap langkah pelaksanaan

evaluasi akan menghasilkan umpan balik segera. Selanjutnya berdasarkan informasi yang

telah dikumpulkan dapat dipergunakan untuk merevisi dan menyempurnakan progran apabila

diperlukan.

6. Evaluasi sumatif dilaksanakan pada akhir kegiatan untuk memberi-kan informasi kepada

kemampuan potensial tentang manfaat atau kegunaan program.

7. Evaluasi formatif hendaknya menarah kepada keputusan tentang program, termasuk perbaikan, modifikasi dan penyempurnaan. Sedangkan evaluasi sumatif mengarah kepada

kebutuhan mengenai kelanjutan program berikutnya atau program yang ditersukanpengabdosiannya.

8. Jelasnya bahwa kedua evaluasi ini penting karena keputusan yang diperlukan selama proses, tingkat pengembangan program, untuk memperbaiki dan memperkuat keputusan

progran yang diambil. Dan apabila sudah stabil dapat dipakai untuk mengevaluasi manfaatprogran atau untuk memutuskan masa depan/kelanjutan program yang bersangkutan.

5. Model Evaluasi Discrepancy (Kesenjangan)

Malcolm Provus sebagai perintis dan pengembang model ini berpendapat bahwa evaluasi

kesenjangan berfungsi untuk mengetahui tingkat kesesuaian antara standar yang sudah

ditetapkan dengan penampilan aktual program yang bersangkutan. Sedangkan menurut

AECT (1979), evaluasi kesenjangan adalah suatu metode untuk mengidentifikasi

perbedaan/kesenjangan antara tujuan khusus yang ditetapkan dengan penampilan aktual.Adapun langkah-langkah dalam pelaksanaan model evaluasi kesenjangan adalah:

Tahap Penyusunan Desain, kegiatan yang dilakukan antara lain:Merumuskan tujuan program.

Menyiapkan audience, personil dan kelengkapan lainnya. Menentukan kriteria dalam bentuk

rumusan yang menunjuk pada sesuatu yang dapat diukur. Tahap pemasangan Instalasi,

kegiatan yang dilakukan antara lain:Menilai kembali penetapan kriteria (standar) yang telahditetapkan pada tahap penyusunan desain. Meninjau/memonitor program yang sedang

dilaksanakan. Meneliti kesenjangan antara apa yang telah direncanakan dengan apa yangtelah dicapai. Taha

evaluasi program pembelajaran full

Documents

evaluasi pembelajaran ppt

ppt evaluasi pembelajaran

panduan evaluasi pembelajaran

evaluasi pembelajaran instrumen

evaluasi pembelajaran

evaluasi pembelajaran berbicara

evaluasi media pembelajaran

evaluasi media pembelajaran ellis sebagai sumber … ·...

evaluasi proses pembelajaran

pengelolaan evaluasi pembelajaran kurikulum … fileevaluasi...

evaluasi pembelajaran(portofolio)

8. evaluasi pembelajaran

evaluasi pembelajaran sd

materi evaluasi pembelajaran

manajemen evaluasi pembelajaran

evaluasi pembelajaran _makalah_

tujuan evaluasi pembelajaran

laporan evaluasi pembelajaran

sholat (evaluasi pembelajaran)

evaluasi pembelajaran ips