evaluasi program pembelajaran full
Post on 06-Apr-2018
239 Views
Preview:
TRANSCRIPT
-
8/2/2019 Evaluasi Program Pembelajaran Full
1/45
Evaluasi Program Pembelajaran/Kurikulum
Konsep Dasar Evaluasi Program
Evaluasi adalah suatu proses yang digunakan untuk mengukur kualitas suatu pekerjaan.
Evaluasi jika digunakan secara tepat, akan mengadakan kontrol kualitas yang menentukan
seberapa jauh gap antara apa yang terjadi dan apa yang seharusnya terjadi....
Akhirnya tujuan dari pada evaluasi adalah untuk mengumpulkan data (hasil), mengubah datamenjadi informasi ( yang dijadikan alat dalam membuat keputusan yang berguna), dan
menggunakan informasi untuk membuat keputusan. Evaluasi adalah suatu bidang yangmeliputi bidang yang luas baik pengalaman, pertumbuhan, perkembangan, dan perubahan.
Hal ini digunakan perhatian terutama hubungan antara tujuan yang diinginkan dan penampilan, tetapi sering kali lebih luas dari pada itu. Dengan perluasan bidang ini, ada
beberapa definisi dari istilah dan nama, dan secara jujur, menjadi sangat membingungkan.Evaluasi program yaitu evaluasi yang menaksir kegiatan pendidikan yang memberikan
pelayanan pada suatu dasar yang kontinu dan sering melibatkan tawaran-tawaran kurikuler.
Beberapa contoh di antaranya ialah evaluasi-evaluasi program membaca di suatu sekolah
daerah, evaluasi program pendidikan khusus di negara bagian atau evaluasi program
pendidikan berlanjut di suatu universitas.
Evaluasi proyek adalah evaluasi yang menaksir kegiatan-kegiatan yang menyangkut suatu jangka waktu untuk menyajikan suatu tugas khusus. Beberapa contoh, misalnya lokakarya
tiga hari tentang tujuan behavioral, percobaan dua tahun tentang pengembangan tes atau
proyek tiga tahun tentang pendidikan karir. Suatu perbedaan antara program dan proyek
adalah bahwa program diharapkan berlangsung untuk jangka waktu yang tidak terbatas,
sedangkan proyek untuk jangka waktu singkat. Proyek yang diintitusionalkan bisa menjadi
program.
Evaluasi materi yaitu evaluasi yang menaksir nilai soal-soal fisik yang berhubungan dengan
isi, termasuk buku, pentunjuk kurikuler, film, tape, dan hasil-hasil instruksional nyatalainnya. Sedangkan evaluasi material ialah evaluasi yang negukur kebaikan-kebaikan atau
nilai-nilai dari butir-butir fisik yang berhubungan dengan isi, meliputi buku, panduankurikulum, film, pita, lain lain-lain (hasil) pengajaran.
Evaluasi kurikulum ialah suatu proses mendeskripsikan suatu nilai dan keputusan tentang
kurikulum baik dari dimensi konsep, dimensi rencana, dimensi kegiatan dan dimensi hasil belajar. Dalam evaluasi program/kurikulum dikenal adanya evaluasi internal dan evaluasi
eksternal. Evaluasi internal ialah evaluasi dilakukan oleh seorang anggota staf di dalam
organisasi yang sedang diteliti. Sedangkan evaluasi eksternal ialah evaluasi yang
dilaksanakan oleh evaluator di luar organisasi dalam mana objek dari evaluasi ditempatkan.
Evaluasi program/kurikulum juga dibedakan dengan evaluasi formatif dan evaluasi sumatif.
Evaluasi formatif ialah evaluasi yang dirancang dan digunakan untuk memperbaiki suatu
objek, khususnya apabila objek itu sedang dikembangkan. Sedangkan evaluasi sumatif ialah
evaluasi yang dirancang untuk menyajikan kesimpulan-kesimpulan tentang kelebihan atau
harga suatu objek, dan saran-saran (anjuran-anjurannya) apakah objek itu harusdipertahankan, diubah atau dibuang.
Evaluasi bebas tujuan: evaluasi dari suatu hal (akibat, hasil) di mana evaluator berfungsi
tanpa tahu tujuan evaluasi itu.
Seringkali terjadi pembedaan yang tidak jelas tentang pengertian evaluasi dan penelitian
dalam pemakaian sehari-hari. Para ilmuwan sudah lama berusaha mencari dan menemukankesepakatan untuk membedakan kedua pengertian tersebut. Apabila kita membaca secara
cermat sesungguhnya antara kedua istilah evaluasi dan penelitian secara prinsip terdapatperbedaan.
-
8/2/2019 Evaluasi Program Pembelajaran Full
2/45
Ditinjau dari sudut tujuan kegiatan, evaluasi dilaksanakan dengan tujuan untuk menemukan
nilai dan makna dari evaluasi. Dengan nilai dan makna tersebut evaluator dapat memberikan
informasi kepada pembuat keputusan (decision maker) atau kepada penanggungjawaban
program. Evaluator dapat memberikan alternatif pemecahan masalah, namun keputusan tetap
menjadi wewenang pembuat keputusan atau penanggungjawab program. Sedangkan
penelitian dilaksanakan dengan tujuan untuk menjelaskan hubungan empirik antar berbagai
variabel. Kegiatan penelitian terutama diarahkan untuk mengembangkan terori dalam disiplnilmu tertentu. Ada jenis penelitian tertentu yang memang dekat hubungannya dengan evaluasi
yaitu penelitian tindakan (action research). Gambaran garis besar penelitian tindakandibedakan menjadi penelitian dasar (basic research) dan penelitian praktis (practical
research). Penelitian praktis dapat diklasifikasikan menjadi peneltian evaluasi (evaluationresearch), penelitian terapan (application research) dan penelitian tindakan (action research).
Penelitian praktis sejak munculnya bermaksud menemukan pemecahan masalah-masalahdalam dunia kerja. Namun dalam pengembangannya mengalami perubahan dengan variasi
pada sasaran penelitian, keterlibatan sponsor dan peneliti pada saran penelitian. Penelitian
evaluasi lazimnya dimaksudkan untuk melakukan evaluasi terhadap suatu aspek atau
beberapa aspek dari program serta mengkaji efektivitas program-program yang dirancang
untuk melakukan perubahan-perubahan program dalam skala yang lebih luas. Prosedur yang
lazim dilakukan adalah (a) mengidentifikasi tujuan program, (b) memilih tujuan programyang menjadi acuan, (c) menetapkan kriteria evaluasi, (d) melakukan pengukuran terhadap
sasaran penelitian, (e) membandingkan hasil pengukuran dengan tujuan, dengan
menggunakan kriteria yang telah ditetapkan dan (f) merumuskan perbedaan antara data
dengan tujuan.
Ditinjau dari sudut onbjek kegiatan, pelaksanaan evaluasi selalu harus berhubungan dengan
kegiatan yang memang nyata dan telah terjadi. Sedangkan penelitian, objek kegiatannya lebih
luas dan tidak terbatas. Namum hendaknya memperhatikan dan mengikuti aturan-aturan atau
norma-norma yang telah ditetapkan, yang disebut dengan istilah etika penelitian. Etika inidijadikan patokan atau pedoman yang sangat penting dalam pelaksanakan penelitian.
Penelitian dilaksanakan secara sistematis artinya dilaksanakan berdasarkan suatu sistem,prosedur, aturan tertentu sehingga hasil penelitian benar-benar dapat diyakini secara kritis.
Antara penelitian dan evaluasi, dua istilah yang secara historis berawal dari penelitian- penelitian tentang ilmu-ilmu tingkah laku (behavioral sciences). Mula-mula timbulnya
psikologi sebagai disiplin ilmu sejak tahun 1800-an. Sebagai ilmu psikologi yang dewasa, halini disusun suatu metodologi dan teknik yang dipinjam dari ilmu-ilmu fisika dan biologi.
Termasuk prinsip-prinsip penemuan ilmu pengetahuan (principles scientific inquiry),
pengukuran (measurement) dan analisis data. Kemudian memasuk-kan model-model statistik
yang dikembangkan untuk aplikasi agrikultur, antropologi, sosiologi, pendidikan dan tinjauan
bidang ilmu tingkah laku yang lain, yang disesuaikan dengan metodologi penelitian dalam
bidang yang baru.
Penelitian memiliki sumber pengetahuan yang merupakan tinjauan terhadap pengembangan
teori dan paradigma yang sudah lazim dikenal dalam metode penelitian eksperimental. Di
mana hipotesis diperoleh atau dirumuskan secara logis dari teori dan melakukan tes di bawahkondisi yang terkontrol. Evaluasi memiliki cara teknologi dari pada ilmu. Penekanannya
bukan pada pembangunan teori, tetapi pada pencapaian hasil atau prestasi dalam
melaksanakan tugas (unjuk kerja). Esensinya adalah memberikan feedback terbimbing untuk
mencapai keberhasilan. Menurut Stufflebeam (dalam Isaac, 1984) yang membedakan antara
kegiatan evaluasi dan penelitian adalah bahwa tujuan evaluasi antara lain adalah to improve(meningkatkan atau memperbaiki), bukan to prove (membuktikan).
B. Kriteria Evaluasi Program
-
8/2/2019 Evaluasi Program Pembelajaran Full
3/45
Pada umunya evaluasi program memiliki tiga kerangka pokok, yaitu: (1) deskripsi program,
(2) adanya kriteria dan (3) pertimbangan. Ketiga komponen tersebut saling berkaitan.
Evaluasi dilaksanakan berdasarkan kriteria tertentu yang disusun dengan berpedoman pada
deskripsi program. Hasil analisis data selanjutnya dibuatlah suatu pertimbangan dan
keputusan terhadap program tersebut.
Deskripsi Program
Pengumpulan data pada umumnya didasarkan atas konsep deskripsi program yangdikembangkan sebelumnya dengan menggunakan pendekatan tertentu, program dijabarkan
menjadi beberapa unsur atau aspek. Selanjutnya dapat dirumuskan beberapa panduan ataupedoman yang berguna untuk pengumpulan data.
Ada tiga pendekatan yang dapat dipergunakan dalam rangka penentuan unsur-unsur pokoksuatu program, yaitu:
Pendekatan Struktural Pendekatan Fungsional Pendekatan Sistematis Pendekatan struktural, pusat perhatian ditujukan kepada komponen-komponen yang membentuk program.
Komponen-komponen tersebut dijadikan panduan dalam rangka pengumpulan data.
Contoh unsur-unsur program yang didasarkan atas pendekatan struktural adalah:
Tujuan-tujuan program Seleksi dasar rancangan program Seleksi kegiatan-kegiatan program
Rasional dan pendekatan terhadap evaluasi Karakteristik audiens Sistem penunjang
administrasi Karakteristik pelaksana program Implementasi program Pendekatan fungsionalpusat perhatiannya ditujukan kepada fungsi-fungsi utama dalam suatu program.
Sebagai contoh, penekatan fungsional terdapat unsur-unsur program, yaitu:
Evaluasi dan seleksi program Diagnosis dan remidiasi Community Outreach Penjadwalan
Kompetensi Functional literacy Penempatan tenaga Latihan jabatan Testing program
Pendekatan sistematis pusat perhatiannya ditujukan kepada keseluruhan program. Unsur-
unsur di dalam program terdiri dari:
Komponen masukan (in-put) Komponen proses (process) Komponen hasil (product)
C. Manfaat, Peranan, Tujuan dan Fungsi Evaluasi Program
Manfaat evaluasi program bagi program pendidikan dan pelatihan, maupun proyek adalahsebagai berikut:
Memungkinkan pengecekan program yang telah disusun, apakah program tersebut dapatdilaksanakan (applicable).
2. Melakukan pengkajian sejauhmana program yang dilaksanakan relevan dengan tujuanprogram dan membuahkan hasil sebagaimana yang diharapkan.
3. Memberikan petunjuk apakah pelaksanan program masih sejalan dengan apa yang telah
direncanakan semula. Melalui teknik pengamatan dan monitoring, evaluasi dapat
dilaksanakan selama pelaksanaan program berlangsung (evaluasi proses).
4. Memungkinkan pengkoordinasian kegiatan program dengan baik.
Peranan dan Tujuan Evaluasi Program
Peranan evaluasi peogram antara lain:
Menetapkan kebijakan dan pembuatan keputusan. Menilai hasil yang dicapai setelah prgramdilaksanakan. Mengevaluasi pelaksanaan kurikulum pada salah satu jenjang pendidikan
tertentu. Memberikan kepercayaan kepada lembaga tertentu (pemerintah atau swasta) yang
mempunyai program, proyek atau kursus. Memonitor dana yang dikeluarkan untuk
membiayai pelaksanaan program agar tidak terjadi penyalahgunaan. Memperbaiki dan
menyempurnakan materi dan program yang telah dilaksanakan. Tujuan Evaluasi ProgramEvaluasi program dilaksanakan untuk kepentingan penentuan kebijakan dan pengambilan
keputusan. Menetukan kebijakan dana pengambilan keputusan dapat dapatdilaksanakandengan tepat apabila didukung oleh informasi (data ) yang lengkap, benar dan akurat
-
8/2/2019 Evaluasi Program Pembelajaran Full
4/45
mengenai hal-hal yang berkaitan dengan permasalahannya, serta untuk mengukur
keberhasilan pelaksanaan program. Bentuk keputusan tersebut dapat berupa angka/nilai
tertentu setelah melalui pertimbangan tertentu pula. Sedangkan tingkat keterandalan dan
keberadaan suatu keputusan pada dasarnya ditentukan oleh tingkat kebenaran dan
keterandalan informasi (data) yang diperoleh. Untuk mengumpulkan data yang diperlukan,
maka menggunakan instrumen pengumpul data yang memiliki tingkat keterandalan yang
memadai pula.Secara spesifik dapat dijabarkan tujuan evaluasi program adalah untuk menetapkan:
Apakah program yang telah disusun memenuhi kebutuhan sasaran dan apakah layak untukdilaksanakan? Apakah pelaksanaan program berjalan sesuai dengan tujuan yang diharapkan?
Berapa besar pengaruh program terhadap sararan yang telah ditetapkan? Seberapa besarprogram mampu memberikan nilai tambah (plus) apabila dibandingkan dengan biaya, tenaga
dan waktu yang telah digunakan? Kelemahan-kelemahan apa yang terdapat dalam programdan bagaimana upaya-upaya yang dilakukan untuk memperbaiki atau menyempurna-kannya?
Memberikan bahan pertimbangan bagi pengambil keputusan untuk menetapkan apakah
program tersebut dapat dilanjutkan penyelenggaraan, diperluas atau dibatalkan/dihentikan.
Memberikan bahan pertimbangan bagi penyelenggara program untuk mengadakan perbaikan
dan penyempurnaan program, organisasi penyelenggara, komponen-kopmponen program dan
aspek-aspek penyelenggara program sepanjang tahap-tahap penyelenggaraan program.Informasi yang diperoleh dapat dipakai sebagai bahan pertimbangan dalam mengambil
keputusan mengenai perlu tidaknya diadakan modifikasi atau revisi guna meningkatkan
efisiensi dan efektivitas penyelenggaraan program berikutnya.
Berdasarkan tujuan yang dikemukakan di atas selanjutnya dapat ditetapkan dan dipilih
instrumen pengumpul data yang cocok serta teknik analisis data apa seyogyanya digunakan.
Fungsi Evaluasi Program
Para perencana, pengelola dan pelaksana program perlu mengetahui tingkat keberhasilan dari
usahanya menyelenggarakan program, terutama perencana program. Untuk merealisasimaksud tersebut pada waktu merencanakan suatu program hendaknya sudah diperkirakan
bahwa program tersebut akan baik. Namun tanpa terasa ternyata kurang baik hasilnya. Dalamkeadaan demikian evaluasi dalam konteks ini sangat penting karena telah berfungsi
memberikan informasi kepada pelaksana program untuk membantu mengontrol pelaksanaanprogram agar dapat diketahui kelemahan-kelemahan atau penyimpangan-penyimpangan atau
kekeliruan yang tenjadi selama program berjalan sehingga dapat memberikan tindak lanjut
terhadap pelaksanaan program selanjutnya.
Beberapa kontribusi yang dapat diberikan oleh evaluasi program dalam hubungannya dengan
tipe keputusan serta kebijakan yang ditempuh seperti yang ditunjukkan berikut ini:
Memberikan kontribusi terhadap keputusan tentang instalasi program (program installation).
Banyak program yang berjalan namun terputus-putus dan bahkan gulung tikar karena tidak
mampu front-end-analysis kebutuhan dan tuntutan program, tersedianya staf dan fasilitas
yang dibutuhkan untuk membuahkan hasil yang diharapkan. Memberikan kontribusi terhadapkeutusan tentang kelangsungan/ kontinuitas program, ekspansi dan sertifikasi. Hal ini
termasuk menentu-kan apakah progran yang dilaksanakan memberikan suatu keuntungan
atau pengaruh sampingan (side effect) yang sangat bermanfaat. Memberikan kontribusi
terhadap keputusan tentang modifikasi program. Sasarannya adalah matapelajaran/bidang
studi, yaitu memberikan informasi bagi pengembang program, pengelola dan pelaksana program yang dapat membantu memperbaiki disain program dan pelayanan peralatan.
Evaluator mencari dan mengumpulkan informasi tentang pengaruh program atau sumbangan program dalam membantu pengambilan keputusan mengenai ekspansi. Dapat juga
-
8/2/2019 Evaluasi Program Pembelajaran Full
5/45
menyeleksi data untuk memperbaiki program. Memberikan keterangan/informasi kepada
rally support tentang program yang telah dilaksanakan. Memberikan keterangan/informasi
kepada rally opposition tentang program yang telah dilaksanakan. Memberikan kontribusi
agar memahami dasar kejiwaan (psikologis), sosial dan proses lainnya.
D. Prinsip-Prinsip, Syarat-Syarat Evaluasi dan Evaluator Program
Pelaksanaan evaluasi program didasarkan atas tujuan tertentu. Setiap program evaluasi
diarahkan untuk mencapai tujuan yang telah ditetapkan secara jelas dan spesifik. Tujuan-tujuan itu pulalah yang mengarahkan kegiatan-kegiatan sepanjang proses evaluasi
dilaksanakan. Evaluasi harus bersifat obyektif. Pelaksanaan evaluasi dan hasil evaluasi harusbersifat obyektif, berpijak pada apa adanya dan bersumber dari data yang nyata dan akurat,
yang diperoleh melalui pengumpulan data dengan instrumen yang terandalkan. Evaluasi bersifat komprehensif. Pelaksanaan evaluasi hendaknya mencakup semua aspek (dimensi)
yang terdapat dalam program. Evaluasi bersifat komprehensif. Tanggungjawab dalam perencanaan, pelaksanaan dan keberhasilan suatu program merupakan tanggungjawab
bersama semua pihak yang terlibat dalam peroses evaluasi. Evaluasi hendaknya dilaksanakan
secara efisien, khususnya dalam penggunaan waktu,niaya dan tenaga serta peralatan yang
menajdi unsur penunjang. Evaluasi harus dilaksanakan secara berkesinambungan. Hal ini
perlu mengingat tututan diadakannya perbaikan dan poenyempurnaan program dan
perbaaikan sistem. Evaluasi program dalam pelaksanaannya hendaknya berpijak padabeberapa asumsi:
Evaluasi program hendaknya didisain sebaik-baiknya guna memperoleh informasi yang baik
dan akurat. Evaluasi program hendaknya dibatasi pada penemuan-penemuan yang didukung
oleh data kuantitatif, kendatipun tidak dapat mengabaikan informasi (data) kualitatif.
Informasi (data) yang diperoleh melalui pelaksanaan evaluasi hendaknya dapat menjadi alat
yang efisien dan efektif dalam rangka perbaikan, penyempurnaan dan peningkatan program.
Evaluasi program dapat dilaksanakan secara berkesinambungan dan mencakup evaluasi
terhadap komponen input, proses dab output (product).Syarat-Syarat Evaluasi Program.
Berorientasi pada tujuan. Tujuan program dijadikan patokan/arah dalam melakukan kegiatanevaluasi. Sebagai patokan/arah, tujuan program harus dirumuskan secara operasional, dapat
diukur serta indikator keberhasilannya dapat diamati.Berorientasi kepada kriteria keberhasilan. Evaluator harus merumuskan indikator-indikator
keberhasilan sebagai dasar/ pedoman untuk menetapkan keberhasilan dan atau kegagalanpelaksanaan suatu program.
Menyeluruh (komprehensif) maksudnya mencakup seluruh kegiatan dalam program dan
penyelengaraannya dilaksanakan secara terpadu seluruh komponen program. Serasi dan
berkesinambungan. Kegiatan evaluasi hendaknya serasi dengan komponen-komponen dan
aspek-aspek yang akan dievaluasi dan dilaksanakan secara berkesinambungan dari langkah
penjajagan, perencanaan, persiapan, pelaksanaan hingga selesainya kegiatan program.
Menggunakan berbagai sumber informasi dan teknik. Penggunaan berbagai sumber informasi
dan teknik untuk evalusi program dapat diperoleh dari berbagai sumber antara lain:
instruktur/pengajar/pelatih, peserta, lembaga atau instansi yang berkepentingan baik milik pemerintah maupun lembaga yang diadakan oleh masyarakat (swasta). Teknik yang
digunakan dapat bervariasi, di antaranya: dengan menggunakan daftar pertanyaan (angket),
wawancara (interview), pengamatan langsung (observation), dokumentasi (document), skala
sikap, tes (tertulus/lisan) dan sebagainya. Berfungsi ganda. Evaluasi program selain berfungsi
untuk memperoleh informasi yang lengkap, teliti, objektif dan akurat sebagai bahan pertimbangan dalam menyusun rekomendasi perbaikan atau penyempurnaan; tetapi juga
berfungsi sebagai suatu media komunikasi antara pihak penyelenggara program denganpihak-pihak yang menajdi sumber informasi mengenai komponen dan aspek progrtam serta
-
8/2/2019 Evaluasi Program Pembelajaran Full
6/45
tujuan program yang tidak dievaluasi. Evaluator baik perseorangan maupun tim dapat berasal
dari dalam (evaluator intern) maupun dari luar (evaluator extern).
Evaluator yang berasal dari dalam (evaluator intern) yaitu seseorang atau sebuah tim yang
ditunjuk oleh sebuah organisasi profesional, perusahaan ataupun pusat pendidikan dan
pelatihan (Pusdiklat) yang melaksanakan program, berasal dari orang-orang yang menjadi
anggota sebuah organisasi atau orang-orang yang terlibat dalam keanggotaan panitia
pelaksana Diklat.Contoh: Sebuah Pusat Pendidikan dan Pelatihan atau sebuah Balai Latihan Kerja (BLK),
sebuah Diklat Penyuluhan Pertanian, menyelenggarakan kegiatan selama tiga bulan.Pusdiklat/BLK membentuk panitia dan menunjuk beberapa orang yang bukan panitia
bertugas mengevaluasi atau monitoring selama Diklat berlangsung.Evaluator dari luar (evaluator extern), yakni seseorang atau sebuah tim yang ditunjuk oleh
pihak penguasa (penanggungjawab dan pengambil keputusan) untuk melaksanaakn evaluasiterhadap efektivitas dan efisiensi sebuah program. Dengan demikian hasil yang diperoleh
dapat dipergunakan sebagai bahan pertimbangan dalam pengambilan keputusan, untuk
menentukan tindak lanjut terhadap kelangsungan program (perbaikan, modifikasi atau
dihentikan). Evaluator ekstern hendaknya berasal dari sekelompok orang atau tim yang sudah
profesional, suatu tim/kelompok yang berasal dari suatu lembaga/organisasi profesi yang siap
dibayar oleh penanggungjawab program. Evaluator ekstern dapat berasal dari perwakilanbeberapa instansi yang berwenang yang ditunjuk.
Contoh: Evaluasi terhadap Diklat BKKBN: penyelenggaran Diklat menunjuk perwakilan dari
instansi terkait yang tidak menyelenggarakan Diklat sebagai evaluator, namun
berkepentingan dengan Diklat tersebut.
Sebelum melaksanakan evaluasi terhadap program, evaluator hendaknya menguasai prinsip-
prinsip dasar evaluasi, yaitu:
Evaluator seyogyanya tidak memberikan jawaban terhadap pertanyaan khusus dan tidak
dapat memberikan pertimbangan kepada pihak lain. Tugas evaluator hanya sebatasmemberikan informasi dan beberapa pilihan alternatif. Evaluator tidak terikat pada suatu
lembaga/instansi penyelengara Diklat. Evaluasi merupakan suatu proses yang berlangsungterus-menerus, sehingga dimungkinkan untuk mengadakan perbaikan ataupun modifikasi
apabila terjadi hambatan atau kurang efektif ditinjau dari segi tenaga, biaya dan waktu. Hasilevaluasi yang dilaporkan kepada pihak pengambil keputusan merupakan tanggungjawab tim
dan tidak mempunyai hak untuk memberikan peertimbangan, apakah diperbaiki,dimodifikasi, dihentikan atau dilanjutkannya suatu program. Evaluator hendaknya
merumuskan pertanyaan-pertanyaan yang operasional untuk menggali informasi (data) serta
menyelami semua permasalahan yang dihadapi. Evaluator hendaknya menggunakan variasi
metode, teknik dan instrumen dalam pengumpulan data sebanyak mungkin, sehingga dapat
mengungkapkan data sebanyak mungkin dari aspek-aspek yang dievaluasi. Evaluasi
hendaknya dilakukan dengan teliti, cermat dan obyektif. Kesimpulan hasil evaluasi
hendaknya merupakan deskripsi yang tegas dan jelas menunjukkan sebab-akibat. Untuk
memperkaya deskripsi, evaluator dapat mengajukan beberapa asumsi yang didukung oleh
data yang valid dan reliabel. Persyaratan sebagai Evaluator.Agar memperoleh hasil evaluasi yang sebaik-baiknya dan benar-benar onyektif, maka
evaluator program dituntut memenuhi persyaratan-persyaratan berikut.
Memahami materi, maksudnya memahami seluk beluk program yang akan dievaluasi
antaralain: 1) Tujuan program yang telah dirumuskan sebelum memulai program.
2) Komponen-komponen program.3) Jangka waktu dan jadwal kegiatan.
4) Mekanisme pelaksanaan program.5) Pelaksanaan program.
-
8/2/2019 Evaluasi Program Pembelajaran Full
7/45
6) Sistem monitoring kegiatan program.
Menguasai teknik, yaitu menguasai cara-cara/teknik-teknik yang digunakan dalam
pelaksanaan evaluasi program. Oleh karena itu evaluator program hendaknya menguasai: 1)
Cara menyusun desain evaluasi program.
2) Teknik penentuan populasi dan sampel.
3) Teknik penyusunan instrumen evaluasi program.
4) Teknik dan prosedur pelaksanaan evaluasi.5) Prosedur dan teknik pengumpulan data.
6) Teknik pengolahan data.7) Teknik menganasisis dan menginterpretasi data.
8) Cara menyusun laporan hasil evaluasi.
Obyektif dan Cermat. Tim evaluator adalah sekelompok orang yang mengemban tugas
penting dan ditopang oleh data yang dikumpulkan secara cermat, teliti dan obyektif.
Berdasarkan data yang dikumpulkan, diharapkan tim evaluator dapat mengklasifikasikan,
mentabulasikan, mengolah dan menganalisis serta menginterpretasi data dengan cermat dan
obyektif. Di dalam mennentukan strategi penyusunan laporan, evaluator tidak diperkenankan
untuk membedakan serta memandang salah satu atau dua asepek sebagai satu hal atauperistiwa yang istimewa atau luar biasa dan tidak boleh memihak.
Jujur dan dapat dipercaya. Tim evaluator dalam melaksanakan tugasnya hendaknya berlaku
jujur dan dapar dipercaya. Jujur artinya, data/informasi yang dikumpulkan benar-benar
berasal dari sumber yang dapat dipertanggungjawabkan serta apa adanya. Tidak
dimanipulasi, tidak ditambah dan dikurangi serta jujur melaporkan hasilnya kepada pihak
pengambil keputusan (penguasa). Kejujuran dalam melaporkan hasil akan mempengaruhi
keputusan yang diambil serta tidak lanjut yang dilakukan. Di samping itu, tidak bias dalam
pengamatan ataupun salah dalam persepsi.Evaluator hendaknya orang luar yang tidak ada kaitan dengan pengambil kebijakan
(keputusan) maupun pengelola dan pelaksana program. Evaluator hendaknya mengadakanhubungan yang baik dengan para responden maupun klient, dapat memahami wataknya,
kebiasaan dan cara hidup responnden yang dijadikan sumber data. Evaluator hendaknyatangap terhadap masalah politik dan sosial budaya, apalagi tujuan evaluasi adalah untuk
pengembangan program. Evaluator harus memiliki konsep diri yang tinggi sehingga tidakmudah terpengaruh atau terbawa arus. Evaluator hendaknya menguasai teknik untuk memilih
desain dan metodologi yang tepat untuk program yang akan dievaluasi. Evaluator hendaknya
bersikap terbuka terhadap kritik dan memberikan kesempatan kepada orang lain/pihak luar
untuk melihat apa yang sedang dan akan terjadi. Evaluator hendaknya menyadari kekurangan
dan keterbatasannya serta bersikap jujur, menyampaikan kelemahan dan kekurangan tentang
evaluasi yang dilakukan. Evaluator hendaknya bersikap pasrah kepada umum mengenai
penemuan yang positif maupun yang negatif. Evaluator bersedia menyebarluaskan hasil
evaluasi, teutama bagi pihak-pihak yang membutuhkan. Hasil evaluasi yang tidak secara
eksplisit dinyatakan sebagai informasi terbuka, sebaiknya tidak disebarluaskan. Evaluatortidak mudah membuat kontrak. Evaluator yang tidak memenuhi persyaratan-persyaratan yang
disebutkan di atas, sebaiknya tidak mudah menyanggupi menerima tugas-tugas, karena secara
etis dan moral akan merupakan sesuatu yang kurang dapat dibenarkan.
E. Context Evaluation.
Context Evaluation, according to Stufflebeam (90), addresses this questions:
-
8/2/2019 Evaluasi Program Pembelajaran Full
8/45
What unmet needs exist in the context served by a particular institution? What objectives
should be pursued in order to order to meet this needs? What objectives will receive support
from the community? What set of objectives in most feasible to achieve?
Stufflebeam (90) suggest five questions that input evaluation should be capable of answering:
Does a given project strategy provide a logical response to a set of specified objectives? Is a
given strategy legal? What strategies already exist with potential relevance for meeting
previously established objectives? What specific procedures and time schedules will beneeded to implement a given strategy? What are the oprerating characteristics and effects of
competing strategy ubder pilot conditions?Stufflebeam (90) suggest the folowing questions to be addresed by process evaluation:
Is the project on schedule? Should be staff be retrained or reoriented prior to completions ofthe process priject cycle? Are the facilities and materials being used adequately and
appropiately? What major procedural barriers need to be overcome during the present cycle?The checlist consists of six major steps:
Focusing the evaluation, which means identifying and defining the decision situations or
goals of the evaluatuon, the setting within which it is be conducted, and the polities within
which it is to operate; Planning the data cillection; Planning the organization odf the data;
Planning the data analysis; Specifying audience, format, means, and schedule for reporting
the finding; Adminstrating the evaluation, or providing an overal plan for executing theevaluation design.
Dressel (21) offers a more comprehensive and useful checklist plan for planning an
evaluation:
What is the purpose and background of the evaluation?What inputs, environment factors,
processes, or outcomes are to be evaluated? What are the critical points at which evidence
will be required for decisions? What rules, procedures, assumsions, and principles are
involved in the decisions? Who will make decisions and what is the process by which these
will be made? Does the overall situation suggest. Require, or prohibit certain tactics andstrategies? What timing considerations are involved? What are the litimitation on costs? What
are the specific evaluation tasks?What information is to be collected?Are the particular items unambigiously defined and
collectible by objective and reliable means? Frome where or from whom id the evidence tobe collected? By whom is it to be collected? What instruments or procedures are to be used?
Will the collections of evidence in itself seriously affect the input, environment, process, oroutcomes? Will the collections of evidence become a regular part of the process, or is it an
add-on for one-time evaluation? What is the schedule for collection of information?
What procedures will be used for organizing and analysing data?In what form is information
to be collected? Will coding be required? If subjective judgements wiil be required in coding,
are the criteria for the adequate? Who will do the coding? How will the data be stored,
received, and processed? What analytic procedures are to be used?
Is the reporting procedure clear?Who will receive reports? Will reports be organized by
analytic procedures, by type of data, or by decisions to be made? Will report include the
practical implications regarding the various possible decisions to be made or leave theseimplications for the project staff of admnistrators to the evidence? Is the evaluator to state
explisitly the particular decisions which be believes are supported by the evidence? When
and in what detail are reports to be made?
How is the evaluation to be evaluated?Who will be involvedproject staff, the evaluator,
decision-makers, some presumably more objective individual? What will the criteria used inthis second-level evaluation becosts, program improvement, impact on further planning of
related enterprises? To whom and when is this report to be presented? What decisions are to
-
8/2/2019 Evaluasi Program Pembelajaran Full
9/45
be anticipated as a result of the report? Will they include improvement of evaluation
processes in the future?
F. Beberapa Model Evaluasi Program
1. Model Tyler
Model ini dinamakan model Tyler karena tidak ada nama resmi yang diberikan oleh
pengembangnya. Tyler yang mengajukan model ini menuliskan buah pikirannya tersebuttidak dalam suatu tulisan lepas mengenai evaluasi. Ia mengemukakan pikiran-nya mengenai
evaluasi program ini dalam suatu buku kecil tentang kurikulum. Dengan buku kecil ini pulanamannya terangkat sebagai seorang ahli yang disegani baik dalam kurikulum maupun dalam
evaluasi. Buku yang diberi judul Basic principles of curriculum and instruction ditulis ketikaia bertugas sebagai tenaga pengajar di Universutas Chicago. Idenya tentang evaluasi
dituangkan dalam bab 4 yang diberi judul How can the efeffectiveness of leraningexperiences be evaluated?
Model yang dikemukakannya dibangun atas dua dasar, yaitu: evaluasi yang ditujukan kepada
tingkah laku siswa dan evaluasi harus dilakukan pada tingkah laku awal siswa sebelum suatu
pelaksanaan kurikulum serta pada saat siswa telah melaksana-kan kurikulum tersebut.
Dengan kedua dasar ini ia ingin mengatakan bahwa evaluasi kurikulum yang sebenarnya
hanya berhubungan dengan hasil belajar menurut pengertian yang dikemukakan terdahulu.Evaluasi kurikulum sebagai rencana yang dinamakan sebagai intermediate or preliminary
stages of evaluation (Tyler 1949:104) dianggap bukan merupakan suatu penghargaan yang
adekuat terhadap kurikulum. Evaluasi terhadap kurikulum sebagai kegiatan tidak dimasukkan
dalam ruang lingkup evaluasi oleh Tyler.
Dengan dasar evaluasi yang kedua, Tyler menghendaki evaluasi dapat menentukan
perubahan tingkah laku yang terjadi adalah memang perubahan yang disebabkan oleh
kurikulum. Kenyataan seperti itu menurut Tyler tidak mungkin dapat ditetapkan apabila
evaluator hanya melihat tingkah laku siswa setelah mereka mengikuti kurikulum tersebut.Dalam kata-katanya sendiri Tyler 1949:108 menulis:
On this basic, one is not able to evaluate an instructional prgram by testing students only atthe end odfthe program. Without knowing where the students were at the beginning, it is not
possible to tell how far changes have taken place.
Karena itu evaluasi yang dilakukan di mana model Tyler dipergunakan sebagaimanamestinya memerlukan informasi perubahan tingkah laku paling tidak pada dua saat yaitu
sebelum dan sesudah siswa mengikuti suatu kurikulum. Dalam istilah yang banyak
dipergunakan sekarang ini diperlukan adanya tes awal (pretest) dan tes akhir (posttest) untuk
mengumpulkan kedua informasi tersebut.
Berdasarkan informasi yang diperoleh dari hasil tes awal dan tes akhir ini kemudian model
yang dikembangkan Tyler ini mensyaratkan bahwa informasi yang diperoleh dari tes awal
adalah gambaran tingkah laku siswa yang ada sebelum mengikuti program. Sedangkan
informasi dari tes akhir adalah gambaran tingkah laku siswa karena pengalaman yang
diperolehnya selama mengikuti program tersebut. Oleh karena itu Tyler juga mengisyaratkanvaliditas informasi tes akhir tersebut. Usaha untuk menjamin validitas ini memerlukan cara
yang dianggap sangat tepat.
Lebih lanjut karena model ini sangat menekankan adanya tes awal dan tes akhir maka model
Tyler ini dikenal pula dengan nama black box. Nama ini mencerminkan bahwa apa yang
terjadi dalam proses tidak memerlukan perhatian oleh evaluator. Bagian ini sudah terjamindengan desain eksperimen tadi walalupun sesungguhnya evaluator tidak tahu persis apa yang
terjadi pada diri siswa. Karena itu bagian dari proses ini dianggap sebagai kotak hitam yangmenyimpan segala macam teka-teki.
-
8/2/2019 Evaluasi Program Pembelajaran Full
10/45
Dalam pelaksanaannya, Tyler mengemukakan ada tga prosedur utama yang harus dilakukan.
Ketiga prosedur tersebut itu adalah:
menentukan tujuan kurikulum yang akan dievaluasi. menentukan situasi di mana siswa
mendapatkan kesempatan untuk memperlihatkan tingkahlaku yang berhubungan dengan
tujuan. memnentukan alat evaluasi yang akan dipergunakan untuk mengukur tingkah laku
siswa. Ketika menentukan tujuan kurikulum yang akan dievaluasi harus pula
dipertimbangkan mengenai tingkah laku yang bagaimana yang dianggap merupakanpernyataan bahwa tujuan tersebut telah tercapai. Artinya, evaluator harus dapat menentukan
jenis tingkah laku yang harus diperlihatkan siswa sesuai dengan materi yang telahdipelajarinya. Disini evaluator dituntut untuk mengembangkan kisi-kisi tujuan yang akan
dievaluasi dalam tabel dua dimensi: dimensi tingkahlaku dan dimensi materi. Oleh karena itudiharapkan para pengembang kurikulum telah merumuskan tujuan tersebut dalam bentuk
behavioral objectives.Konsekuensi dari persyaratan ini seringkali evaluator yang mempergunakan model Tyler
mengharapkan pula agar para pengembang program merumuskan tujuan program dalam
bentuk behavioral objectives. Seringkali terjadi, evaluator harus berkonsultasi terlebih dahulu
dengan para pengembang kurikulum mengenai tujaun apa yang akan dievaluasi mengenai
tingkat pencapaiannya. Pekerjaan evaluasi yang dilakukan oleh Braithwaite dan Koop (1982)
merupakan contoh model ini. Mereka mendapat tugas untuk mengevaluasi penataran yangdilakukan di bagian barat metropolitan Sidney. Untuk itu mereka membicarakan mengenai
tujuan program yang akan dievaluasi dan mengembangkan tujuan tersebut dalam bentuk
behavioral atau juga sering diistilahkan dengan operasional.
Persoalan pengembangan tujuan program menurut ukuran behavioral seperti yang
dipersyaratkan poleh Tyler memang sudah umum dilakukan di Indonesia, terutama setelah
PPSI diperkenalkan melalui Kurikulum 1975. tetapi harus diingat bahwa pada waktu Tyler
mengemukakan persyaratan tersebut, tujuan dengan rumusan yang demikian masih
merupakan sesuatu yang baru bagi dunia pendidikan di A.S. Justru gagasam Tyler ini yangkemudian mengilhami Bloom dan kawan-kawan mengembang-kan ide tersebut menjadi
taksonomi tujuan pendidikan yang terkenal tersebut. Taksonomi ini kemudian yangditerapkan di Indoensia melalui cara pengembangan tujuan instruksional yang tercakup dalam
model PPSI.Tujuan kurikulum yang akan dievaluasi, seperti yang juga dikembangkan dalam taksonomi
tujuan pendidikan Bloom dan kanwan-kawan, tidak selalu hanya berhubung-an dengan tujuanyang bersifat kognitif saja. Tetapi kurikulum yang menyangkut asepek afektif dan juga
psikomotorik dapat pula dievaluasi apabila tujuan tersebut dianggap penting oleh para
pengembang kurikulum dan dapat dinyatakan dalam bentuk operasional sehingga tujuan itu
dapat diamati. Dengan demikian ruang lingkup pekerjan evaluator dapat menjadi sangat luas.
Langkah kedua adalah menentukan situasi atau keadaan yang memberikan kesempatan
kepada siswa untuk menunjukkan kemampuan yang akan dievaluasi. Langkah ini sangat
berhubungan erat dengan langkah pertama. Pada langkah pertama dikatakan bahwa yang
dievaluasi adalah tingkat pencapaian tujuan kurikulum dan siswa dijadikan sumber utama
untuk mendapat informasi mengenai tingkat pencapaian tujuan tersebut. Oleh karena itudalam langkah kedua ini evaluator harus dapat menentukan situasi apa yang dianggap terbaik
agar kemampuan yang akan diperlihatkan siswa sebagai sumber informasi betul-betul
memperlihatkan kemampuan sebenarnya. Dengan demikian validitas data evaluasi terjamin.
Dalam langkah ini evaluator dapat saja mempergunakan lebih dari satu situasi, sesuai dengan
jenis data yang diharapkan yang sebetulnya merupakan konsekuensi dari tujuan yang akandievaluasi. Misalkan seorang evaluator akan menilai pencapaian tujuan kognitif kurikulum.
Katakanlah, evaluasi tadi ingin mengetahui tingkat pencapai-an tujuan kurikulum dalamsetiap jenjang kemampuan kognitif seperti yang dipersyarat-kan oleh kurikulum. Dengan
-
8/2/2019 Evaluasi Program Pembelajaran Full
11/45
demikian evaluator tersebut akan berhubungan dengan kemampuan siswa dalam jenjang
pengetahuan, pemahaman, aplikasi, analisis, sintesis, dan evaluasi. Maka dalam langkah
kedua ini evaluator tadi harus menentukan situasi yang paling sesuai untuk mengevaluasi
kemampuan-kemampuan tersebut. Misalnya evaluator tida dapat menentukan bahwa
kemampuan-kemampuan tadi akan diperlihat-kan oleh siswa dalam suatu tes. Dengan
demikian, seluruh siswa yang dijadikan sumber informasi harus menyatakan kemampuan
mereka dalam situasi tes yang mungkin pula berupa situasi tes tertulis, tes lisan, tesperformansi, dan sebagainya.
Mungkin pula evaluator tersebut menentukan bahwa untuk tujuan seperti di atas akandipergunakan beberapa situasi yang berbeda. Untuk jenjang pengetahuan, pemahaman, dan
evaluasi akan dipergunakan situasi tes. Untuk jenjang aplikasi, analisis, dan sintesis akandipergunakan situasi bekerja di laboratorium. Barangkali pula kombinasi situasi lainnya yang
dipergunakan sesuai dengan hekikat bidang studi (konten kurikulum), karakteristik tujuan,waktu dan dana yang tersedia, serta kemampu-an evaluator yang melakukan tugas tersebut.
Pertimbangan profesional evaluator terhadap faktor-faktor yang baru disebutkan menentukan
situasi apa yang akan dipergunakannya.
Langkah kedua ini nampaknya sederhana. Tetapi ia sangat menentukan keberhasilan evaluasi
yang dulakukan. Apabila situasi yang ditetapkan tidak tepat, tingkah laku siswa yang
diharapkan tidak akan terungkapkan dengan baik. Artinya, apa yang ingin kita ketahui tidakterungkapkan dengan sebenarnya validitas data yang diperoleh sangat diragukan. Dengan
perkataan lain, tujuan kurikulum tidak terevaluasi sebagaimana seharusnya. Oleh karena itu
walaupun tampaknya sederhana, sebaiknya evaluator memberikan perhatian yang seksama
terhadap pelaksanaan langkah kedua ini.
Seperti hubungan antara langkah pertama dan langkah kedua, demikian pula keeratan
hubungan antara langkah kedua dengan langkah ketiga. Pada waktu evaluator menentukan
situasi dalam langkah kedua secara eksplisit sebenarnya ia telah pula menentukan langkah
ketiga, yaitu penetuan alat evaluasi yang akan dipergunakan. Alat evaluasi dapat berbentuktes seperti yang banyak dipergunakan orang. Tapi ia dapat pula berbentuk alat bukan tes
seperti alat observasi, kuesioner, panduan wawancara, dan lain sebagainya. Ketika iamenentukan situasi di mana siswa diharapkan dapat mengemukakan hasil belajar dengan
baik, evaluator harus memiliki pengetahuan tentang alat evaluasi: karakteristik alat tersebut,kekuatan dan kelemahan yang ada dihubungkan dengan tujuan yang akan diukur.
Meskipun secara eksplisit ia telah menentukan alat evaluasi yang akan dipergunakan, secaraeksplisit hal itu perlu dilakukan evaluator yang bersangkutan. Ia harus menyebutkan jenis alat
evaluasi tersebut. Setelah itu, model evaluasi kurikulum Tyler ini menghendaki evaluator
untuk melakukan kajian mengenai alat evaluasi yang tersedia. Pertanyaan pokok di sini ialah
apakah alat evaluasi yang tersedia sesuai dengan tujuan yang akan diukur. Dalam kata-
katanya sendiri Tyler (1949:113) menulis:
It is only after the objectives have been identified, clearly defined, and situations listed which
give opportunity for the expression of the behavior desired that it is possible to examine
available evaluation instruments to see how far they may serve the evaluation purposes
desired.
Apabila di antara instrumen yang tersedia ada yang memang mengukur tujuan yang sama
dengan tujuan yanga akan diukur, instrumen tersebut sudah barang tentu dapat dipergunakan.
Katakanlah bahwa seorang evaluator bertugas untuk mengukur pencapaian tujuan suatu
kurikulum tertentu. Untuk mudahnya sebut saja tujuan yang akan diukur tersebut sebagai X.kemudian setelah ia menentukan situasi bagi siswa untuk menyatakan kapasitasnya terhadap
tujuan tersebut, ia menelaah alat evaluasi yang telah dikembangkan orang. Apabila di antaraalat evaluasi yang tersedia ada yang memang sesuai dengan situasi yang telah ditentukan dan
-
8/2/2019 Evaluasi Program Pembelajaran Full
12/45
untuk mengukur tujuan X tadi maka tidak ada salahnya apabila ia mempergunakan instrumen
tersebut. Hal ini bahkan sangat dianjurkan oleh model ini.
Tetapi kalau tidak ada, evaluator yang bersangkutan harus mengembangkan instrumen yang
sesuai dengan tujuan dan situasi yang telah ditetapkan. Dalam model ini sangat ditekankan
bahwa penggunaan suatu insrumen janganlah didasarkan atas pertimbangan kecanggihan
ataupun popularitas yang dipunyainya. Tujuan yang ingin diukurlah yang menentukanpemakaian suatu instrumen. Memang tugas mengembang-kan instrumen ini merupakan tugas
yang tidak ringan. Meskipun demikian, evaluator tersebut tidak dapat mengindarkan tugasini. Instrumen yang dikembangkan haruslah pula memenuhi persyaratan objektif, terandal
(reliabel) dan sahih (valid).Dilihat dari prosedur kerja evaluasi yang mempergunakan model Tyler ini, proses
pengembangan kriteria evaluasi dapat dilakukan melalui pendekatan pengembangan pre-ordinate maupun fidelity. Model ini memberikan keleluasaan kepada penggunaan kedua
pendekata ini. Pada waktu evaluator bersama dengan para pengembang kurikulum
menentukan tujuan mana yang akan diukur, disaat itulah kemungkinan penggunaan salah satu
dari kedua pendekatan pengembangan kriteria itu terjadi. Kalau pada waktu itu ditentukan
bahwa tujuan yang akan diukur adalah tujuan yang bersifat umum untuk setiap kurikulum
tanpa memperhatikan karakteristiknya, maka evaluator akan bekerja dengan pendekatanpengembangan kriteria pre-ordinate. Dengan demikian, alat evaluasi yang akan dipergunakan
cenderung pada alat evaluasi yang sudah ada karena alat evaluasi yang demikian banyak
dikembangkan orang. Biasanya tujuan yang akan diukur dengan pendekatan ini adalah tujuan
generik.
Apabila pada waktu penentuan tujuan yanga akan diukur ditentukan hanya tujuan-tujuan
yang spesifik terhadap kurikulum itu sendiri maka pendekatan pengembangan kriteria fidelity
akan dilakukan. Dengan pendekatan ini evaluator mempunyai kemungkinan besar harus
mengembangkan alat evaluasi khusus. Perbedaan kerakteristik antar setiap kurikulummenyebabkan tidak ada alat evaluasi yang tersedia akan sesuai dengan tujuan kurikulum yang
akan diuji. Terkecuali apabila evaluator tersebut mengevaluasi kurikulum yang sama denganevaluator atau tugas sebelumnya, hanya lingkungan pendidikan yang berbeda antara kedua
tugas tersebut. Dalam keadaan demikian tentu saja evaluator tersebut dapat mempergunakaninstrumen yang sudah ada. Jadi sebagian kerja sudah dapat diselesaikan.
Seperti pada setiap model, model evaluasi Tyler inipun memiliki kelebihan dan kelemahan.Keunggulan utamanya ialah kesederhanaanya. Jika dibandingkan dengan model evaluasi
lainnya, model evaluasi Tyler ini lebih sederhana, terlihat dalam peosedur kerja sepeeti
dibicara terdahulu. Evaluator hanya perlu memberikan perhatian kepada pengukuran hasil
belajar siswa yang belajar dari kurikulum yang dinilai. Bagi mereka yang terlatih dalam
pengukuran, kesederhanaan model ini memberikan kesempatan yang luas untuk melakukan
evaluasi kurikulum tanpa perlu pendidikan khusus lagi. Perbedaannya dengan prosedur
pengukuran adalah sangat kecil. Kalau dalam pengukuran mereka tidak perlu memperhatikan
karakteristik evaluan, sekarang mereka harus melakukannya. Tetapi, identifikasi karakteristik
itu segera dapat dilakukan dengan berkonsentrasi kepada pihak pengembang kurikulum.Keunggulan ini pada sisi lain merupakan kelemahan model evaluasi Tyler. Perhatiannya yang
hanya terpusatkan pada kurikulum sebagai hasil belajar menjadikan model ini tidak cukup
luas dipakai sebagai model evaluasi komprehensif. Seperti telah dibahas sebelumnya, hasil
belajar hanyalah merupakan salah satu dimensi kurikulum. Dengan demikian, dimensi
kurikulum lainnya tidak dapat dievaluasi dengan memper-gunakan model Tyler ini. Dimensikurikulum sebagai rencana dan proses tidak dapat dievaluasi dengan mempergunakan model
ini.
-
8/2/2019 Evaluasi Program Pembelajaran Full
13/45
Asumsi yang dipergunakan model ini mengenai dimensi kurikulum sebagai proses sukar
dipertahankan. Studi-studi yang mengkaji mengenai dimensi proses memperlihatkan bahwa
implementasi kurikulum seringkali tidak sesuai dengan apa yang dikehendaki oleh kurikulum
sebagai rencana. Kenyataan dari hasil studi tentang proses ini menyebabkan sukar untuk
melakukan claim bahwa hasil yang diperlihatkan siswa adalah hasil yang ditimbulkan oleh
kurikulum yang dievaluasi. Oleh karena itu, proses merupakan variabel penting yang harus
diperhatikan dalam suatu kegiatan evaluasi.
2. Model Countenance Stake
Ini adalah model pertama evaluasi kurikulum yang dikembangkan oleh Stake. Dalamtulisannya ia sendiri tidak memberikan nama khusus tehadap model ini. Nama countenance di
sini disesuaikan dengan judul artikel yang ditulis walaupun pengertian countenance itusendiri mempunyai makna ambigous. Dalam suatu pengertian ia adalah keseluruhan
sedangkan dalam pengertian lain kata itu bermakna sesuatu yang disenangi (favourable).
Dalam tulisan itu, Stake ingin mengemukakan keseluruhan kegiatan evaluasi yang harus yang
harus dilakukan dan cara yang diinginkannya bagaimana evaluasi tersebut dilakukan. Oleh
karena itu, walaupun beberapa penulis lain yang membicarakan model ini memprgunakan
judul seperti model concruence atau model contingency, nama nama tersebut tidakdipergunakan di sini karena baik congruence maupun contingency merupakan dua konsep
utama dalam model pengolahan data yang dikemukakan oleh Stake. Tetapi kedua konsep itu
tidak dapat mewakili keseluruhan ide Stake mengenai evaluasi kurikulum. Jadi nama
countenance dipertahankan sebagai nama model ini secara keseluruhan.
Dalam model ini, Stake mendasarkan dirinya pada evaluasi formal, di mana dikatakannya
sebagai suatu kegiatan evaluasi yang sangat tergantung pada pemakaian checklist, structured
visitation by peers, controlled comparisons, and standardized testing of students (Stake,
1972:93). Lebih lanjut, model ini dikembangkan atas keyakinan bahwa suatu evaluasiharuslah memberikan deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dasat ini
masih menjadi keyakinannya ketika ia mengembangkan model-model evaluasi lain dikemudian hari, yang memberikan tekanan pada pendekatan kualitatif.
Model ini dimasukkan dalam model kuantitatif, karena dalam model ini jelas Stake masihmengutamakan data kuantitatif dan pendekatan kuantitatif dalam mengumpulkan data.
Bahkan mengenai peertimbangan yang duberikan berbagai kelompok sumber haruslahdikumpulkan secara obyektif; suatu sikap yang berubah ketika ia kemudian lebih cenderung
mempergunakan model-model kualitatif. Seperti yang diungkapkannya ketika ia
menguraikan tentang pertimbangan (Stake, 1872:95):
Evaluation will seek out and record the opinions of persons of special qulification. These
opinion, though subjective, can be very useful and can be gathered objectively, independent
of the solicitors opinions.
Bahkan dalam model ini Stake sangat menekankan peran evaluator dalam mengembangkan
tujuan kurikulum menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisipengukuran yang behavioristik dan kuantitatif.
Dalam model ini, Stake mengemukakan bahwa suatu evaluasi forma harus memberikan
perhatian terhadap keadaan sebelum suatu kegiatan kelas berlangsung dan terhadap kegiatan
kelas itu sendiri, serta menghubungkan dengan berbagai bentuk hasil belajar. Keadaan
sebelum suatu kegiatan kelas berlangsung dinamakannya antecendent. Sedangkan kegiataninteraksi yang terjadi di sekolah dinamakannya dengan istilah transactions.
Lebih lanjut dikemukakannya, bahwa ketiga tingkatan tersebut, antecendent, transaction danhasil (outcome), terbagi atas dua kategori. Kategori pertama ialah apa yang diinginkan
-
8/2/2019 Evaluasi Program Pembelajaran Full
14/45
(intent) oleh pengembang program. Seorang guru, sebagai seorang pengembang program,
merencanakan mengenai keadaan (persyaratan) yang diingin-kannya, untuk suatu kegiatan
kelas tertentu. Apakah persyaratan tersebut berhubungan dengan siswanya seperti minat,
kemampuan, pengalaman, dan lain sebagainya yang biasa diisitilahkan dengan entry
behavior. Mungkin pula ersyaratan itu berhubungan dengan lingkungan di kelas. Lebih lanjut,
guru tersebut merencanakan apa yang diperkirakan akan terjadi pada waktu interaksi dikelas,
dan kemampuan apa yang diharapkan dimiliki siswa setelah proses interaksi berlangsung.Dengan kata lain, perencanaan yang dilakukan guru dalam satuan pelajaran, merupakan apa
yang diingin-kan guru tersebut (intent).Kategori kedua ialah kategori yang berhubungan dengan apa yang sesungguhnya terjadi,
bukan lagi apa yang diinginkan. Misalnya keadaan apa yang ada pada waktu suatu interaksikelas akan dilakukan; bagaimana dengan kemampuan siswa yang akan belajar; apakah siswa
telah belajar mengenai topik yang akan dibicarakan pada malam hari sebelum pelajaran berlangsung. Apakah atlas yang akan digunakan guru memang tersedia; demikian pula
dengan OHP yang akan dipakai oleh guru yang bersangkutan? Bagaimana interaksi tersebut
berlangsung? Apakah setelah guru mencoba memberikan pertanyaan kepada siswa untuk
mengetahui kemajuan yang mereka peroleh dari proses interaksi yang terjadi? Karena Stake
membuat ketegorinya berdasarkan apa yang dilakukan evaluator, kategori kedua ini
dinamakan observasi. Jadi seperti juga dengan intent, data mengenai observasi ini meliputiantecendent, transaction, dan hasil yang diperoleh.
Baik data yang dikelompokkan ke dalam intent maupun observasi adalah data yang
mengungkapkan tentang apa dan bagaimana kurikulum itu. Data ini baru merupakan sebagian
dari data yang harus dikumpulkan evaluator yang bekerja mempergunakan model evaluasi
ini. Oleh karena itu, pekerjan belumlah selesai. Ia baru menyelesaikan sebagian dari kegiatan
pengumpulan data yang harus dilakukannya.
Stake juga beranggapan bahwa, suatu evaluasi harus sampai kepada pemberian pertimbangan.
Stake yang menyadari banyak di antara evaluator yang enggan memberikan pertimbangandan untuk mengatasi hail tersebut, dalam model ini ia mengemukakan jalan keluar yaitu
evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orangyang dianggap memiliki kualifikasi untuk memberikan pertimbangan tersebut. Data
pertimbangan ini yang kemudian dimasukkan ke dalam matriks sebagai bagian dari modelini.
Data pertimbangan ini meliputi tiga jenjang yang dikemukakan oleh Stake, yaituantecendent, transactions, dan hasil yang diperoleh. Di samping meliputi tiga jenjang ini, data
mengenai pertimbangan tersebut terbagi pula atas tiga kategori, yaitu standar dan
pertimbangan. Oleh karena itu matriks pertimbangan, seperti juga metriks deskripsi, terdiri
dari atas 6 kotak. Tiga kotak untuk data pertimbangan dan tiga kotak lagi mengenai data
standar.
Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak. Di samping itu,
ada sebuat kotak lagi yang dinamakan kotak rasional. Setiap pengembang kurikulum/guru
harus memiliki rasional untuk setiap intent yang dikembangkan. Mungkin sekali mereka tidak
mempunyai rasional yang tertulis, dan mungkin pula mereka tidak dapat mengemukakannyadalam susunan kalimat yang baik tapi mereka pasti memilikinya.
Cara kerja model evaluasi Stake ini adalah sebagai berikut. Evaluator mengumpulkan data
mengenai apa yang diinginkan pengembangan program baik yang berhubungan dengan
antecendents (persyaratan awal), transaksi (interaksi), dan juga hasil. Data dapat
dikumpulkan melalui studi dokumen tetapidapat pula dilakukan dengan jalan wawancara.Cara terakhir ini dilakukan apabila dokumen tidak diperoleh karena sesuatu dan lain hal. Cara
terbaik tentulah melalui studi dokumen.
-
8/2/2019 Evaluasi Program Pembelajaran Full
15/45
Bersamaan dengan pengumpulan data mengenai intents (tujuan) ini dapat pula dikumpulkan
resional dari setiap tujuan tersebut. Di sini Stake memperingatkan agar data mengenai
rasional janganlah dikumpulkan dengan jalan mendikte pengembang program/guru tersebut.
Biarkanlah mereka berbicara dengan pengertian dan bahasa yang ada pada diri mereka.
Evaluator mendengarkan dan mencatat apa yang dikemukakan oleh pengembang program.
Suatu hal yang perlu diperhatikan, walaupun dalam gambar kotak rasional berada di sebelah
kiri matriks deskripsi, hal itu tidaklah berarti bahwa pengumpulan data tentang rasionaldilakukan terlebih dahulu. Dalam kenyataannya, data tentang rasional tak mungkin
dikumpulkan sebelum data mengenai tujuan telah dikumpulkan. Oleh karena itu waktu yangpaling cepat untuk segera mengumpulkan data mengenai rasional adalah bersamaan dengan
waktu pengeumpulan data mengenai tujuan.Kegiatan berikutnya ialah pengumpulan data observasi mengenai persyaratan awal, transaksi
dan hasil. Sesuai dengan namanya, data untuk bagian ini dikumpulkan melalui observasi.Dan, seperti ditekankan Stake, observasi ini haruslah observasi formal. Maksudnya, observasi
tersebut haruslah dilakukan denga mepergunakan instrumen (alat pengumpul data yang
dikembangkan khusus). Stake (1972:98) mengemukakan bahwa instrumen yang dipakai
dapat meliputi daftar inventori, daftar pertanyaan tentang data biografis, daftar wawancara,
daftar cek, pertanyaan tentang pendapat (optionares), dan semua jenis tes psikometrik. Yang
penting, data tersebut berhubungan dengan apa yang dikembangkan dalam tujuan.Dalam pengolahan data matriks deskripsi, Stake mengemukakan dua konsep yaitu
contingency dan cungruency. Kedua konsep ini berbeda dalam penggnnaannya. Contingency
dipegunakan untuk menganalisis data secara vertikal, mencari kesesuaian antara kotak di atas
dengan kotak di bawahnya. Ada dua analisis mengenai kesesuaian ini. Pertama adalah
kesesuaian secara logika, yaitu kesesuaian menurut pemikiran logika evaluator. Evaluator
mempertimbangkan apakah hubungan yang satu dengan lainnya masuk akal, apakah yang
satu itu mungkin tercapai melalui apa yang ada pada kotak lainnya.
Analisis logis ini dipergunakan Stake dalam memberikan pertimbangan mengenaiketerhubungan antara persyaratan awal, transaksi, dan hasil dari kotak-kotak tujuan (intent).
Evaluator harus dapat menentukan apakah persyaratan awal yang telah dikemukakanpengembang program/guru. Ataukah sebetulnya ada model transaksi lain yang lebih efektif
untuk mencapai apa yang dikemukakan dalam prasyarat. Demikian pula mengenai hubunganantara transaksi dengan hasil yang diharapkan.
Analisis kedua adalah analisis empirik kontingensi. Dasar bekerjanya adalah sama dengananalisis logis tapi data yang dipergunakan adalah data empirik. Jadi, dalam analisis ini
evaluator harus mempertimbangkan keterhubungan tersebut berdasarkan data empirik yang
telah dikumpulkannya. Pertanyaan-pertanyaan yang diajukan untuk analisis logus
dipergunakan untuk analisis empirik ini.
Masih dalam analisis mengenai data deskriptif, pekerjaan evaluator berikutnya ialah
mengadakan analisis congruence (kesesuaian) antara apa yang dikemukakan dalam tujuan
(intent) dengan apa yang terjadi dalam kegiatan observasi. Pertanyaan yang dapat diajukan di
sini ialah apakah yang telah direncanakan dalam tujuan memang sesuai dalam
pelaksanaannya di lapangan (observasi). Apakah terjadi penyimpangan-penyimpangan antaraapa yang direncanakan (intent) dengan apa yang terjadi dan kalau ada penyimpangan faktor-
faktor apa yang berperan dalam penyimpangan tersebut.
Apabila analisis contingency dan concruency tersebut telah diselesaikan, adalah tugas
evaluator untuk menyerahkan hasilnya kepada tim yang terdiri dari para ahli dan orang yang
terlibat dalam program. Tim ini yang akan meneliti kasahihan hasil analisis evaluatortersebut. Lebih lanjut tim ini pula yang akan memberikan persepsinya mengenai faktor
penting baik dalam contingency maupun congruency.
-
8/2/2019 Evaluasi Program Pembelajaran Full
16/45
Tugas berikut evaluator ialah memberikan pertimbangan mengenai program yang sedang
dikaji. Untuk itu evaluator memerlukan standar. Dalam model keseluruhan digambarkan
bahwa dalam matriks pertimbangan ada yang dinamakan standar dan pertimbangan. Standar
dapat berbentuk standar mutlak dan relatif. Standar mutlak adalah standar yang dianggap
belaku untuk suatu kurikulum atau program. Katakanlah untuk program IPS ditentukan
adanya standar-standar tertentu baik mengenai tujuan yang akan dicapai, proses belajar
mengajar, dan hasil belajar. Mungkin saja standar itu datang dari individu para ahli tetapistandar itu adalah standar yang diinginkan bagi setiap program studi IPS, terlepas dari
karakteristik khusus yang dimiliki program tersebut.Standar relatif berhubungan dengan komparasi antara satu program dengan program lainnya
dalam satu bidang studi yang sama. Untuk konteks pendidikan di AS dan beberapa negaralainnya, adanya beberapa program dalam satu bidang studi yang sama adalah jamak. Suatu
negara bagian tertentu atau bahkan satu lingkungan otoritas pendidikan tertentu memiliki program IPA yang berbeda dengan negara bagian atau lingkungan otoritas pendidikan
lainnya. Dalam konteks pendidikan Indonesia perbedaan semacam itu mungkin tidak akan
terjadi. Oleh karena itu komparasi untuk konteks pendidikan di Indonesia hanya dapat
dilakukan antara program yang lama dengan program yang baru.
Menurut Stake (1972:101), evaluator yang harus mempergunakan kedua standar tersebut.
Jadi, evaluator harus memberikan pertimbangan baik yang bersifat mutlak maupun relatif.Hanya dengan kedua pertimbangan tersebut arti dari kurikulum tersebut dapat ditetapkan
terlebih mantap. Dengan demikian, pada waktu evaluator memberikan umpan balik kepada
pembuat keputusan, pertimbangan yang diberikannya adalah pertimbangan yang bersifat
menyeluruh (komprehensif).
Model Stake ini lebih dapat dipergunakan untuk melakukan evaluasi mengenai pelaksanaan
implementasi kurikulum dalam konteks pendidikan Indonesia. Proses pengembangan
kurikulum di Indoensia sedemikian rupa sehungga kurikulum sebagai rencana dibuat di
tingkat basional dan bersifat tidak siap pakai. Guru masih harus mengembangkan rencanabesar tersebut menjadi rencana yang lebih operasional, yang dalam istilah kependidikan di
Indonesia disebut satuan pelajaran (SP). Satuan pelajaran inilah yang dapat dipergunakanuntuk mengisi matriks intent model yang dikemukakan Stake.
Mengenai standar yang diinginkan Stake dapat dikembangkan dari komponen yang adadalam rencana besar kurikulum tersebut. Meskipun demikian, tidak ada salahnya apabila
evaluator juga mempergunakan standar yang dikembangkan dari para ahli bidang studibersangkutan. Tentu saja masalah akan timbul apabila antara standar yang dikembangkan dari
rencana besar tidak bersesuaian dengan yang dikembangkan dari para ahli tadi. Tapi
persoalan yang demikian juga dihadapi setiap evaluator yang mempergunakan model Stake
ini, meskipun dalam konteks pendidikan di AS di mana model ini dilahirkan. Hal ini pula
kiranya yang menyebabkan mengapa Stake (1972:100) menganjurkan agar jangan
mengevaluasi kurikulum dengan mikroskop tetapi seharusnya dengan a panoramic view
finder. Adanya beragam standar akan memebrikan kesempatan kepada evaluator untuk
mempergunakan standar tersebut sebagai teorpong panorama dan buka mikroskop.
Meskipun demikian untuk konteks pendidiakn di Indonesia, selain untuk mengevaluasidimensi kurikulum sebagai kegiatan, model Stake ini dapat dipergunakan dalam
pengembangan kurikulum di tringkat nasional apabila eksperimen dilakukan. Pada waktu
eksperimen, pengembang kurikulum dapat menerapkan model ini sepenuhnya karena semua
persyaratan Stake terpenuhi.
3. Model CIPP
-
8/2/2019 Evaluasi Program Pembelajaran Full
17/45
Model ini dikembangkan oleh suatu tim yang diketuai Stufflebeam. Pada waktu memimpin
tim ini ia bekerja di Ohio State University. Meskipun demikian, tim yang dipimpinnya
tersebut terdiri dari para sarjana yang berkerja di berbagai universitas dan salah seorang
anggotanya, Gephart, adalah sarjana yang bekerja di Phi Delta Kappa (PDK). Organisasi ini
pula yang menugaskan Stufflebeam dan kawan-kawannya berkarya mengembangkan
pemikiran tentang evaluasi pendidikan. Oleh karena itu, model yang mereka kembangkan itu
kadang-kadang dinamakan pula dengan model PDK.Nama CIPP, dalam kenyataannya lebih dikenal masyarakat perguruan tinggi dan kalangan
evaluator. Hal ini mungkin sekali disebabkan CIPP adalah singkatan dari Context, Input,Process dan Product. Memang keempat daerah kerja ini adalah komponen utama dari model
ini. Dalam buku yang mereka tulis, model tersebut dikemukakan dalam bab 7, setelah merekamendiskusikan pikiran mereka mengenai evaluasi dan hubungannya dengan pembuatan
keputusan. Dalam buku suntingan Madaus, Scriven dan Stufflebeam (1983) model inidibicarakan kembali dalam bab 7 pula, ditulis oleh Stufflebeam sendiri. Tetapi dalam buku
suntingan ini, Evaluation Model, Stufflebeam membuat semacam penyederhanaan yang
sebenarnya lebih mengena pada pokok ide tentang model itu sendiri.
Menurut Stufflebem (1983:117) model ini telah diterapkan di banyak tempat di A.S. dan
telah dibahas dalam beberapa disertasi doktor. Di antara beberapa disertasi dibuat oleh
mahasiswa di the Ohio State Universiry. Sayangnya, di universitas ini pada saat sekarangsudah tidak menunjukkan bekas-bekas hasil kerja profesor tersebut. Seolah-olah hasil binaan
Stufflebeam di unversitas tersebut sirna begitu saja. Adalah wajar pula kalau model CIPP ini
berkembang di universitas Western Michigan di mana Stufflebeam sekarang ini bekerja.
Penyederhanaan model dalam bentuk diagram dilakukan setelah ia meninggalkan the Ohio
State Unversity.
Meskipun terjadi penyederhanaan, pokok-pokok pikiran CIPP yang dikembang-kan tim PDK
masih tetap merupakan dasar dari penyederhanaan yang dilakukan Stufflebeam. Oleh karena
itu, pembahasan mengenai model CIPP ini tidak akan membandingkan antara keduanya.Pembahasan dilakukan berdasarkan model yang dikembangkan terakhir.
Sesuai dengan namanya, model ini terbentuk dari 4 jenis evaluasi yaitu evaluasi konteks(Context), masukan (Input), proses (Process) dan hasil (Product). Keempat evaluasi ini
merupakan suatu rangkaian keutuhan. Tetapi seperti dikemukakan oleh Stufflebeam sendiri,dalam pelaksanaan seorang evaluator dapat saja hanya melakukan satu jenis atau kombinasi
dari dua atau lebih jenis evaluasi itu (Stufflebeam, 1983:122). Artinya, seorang evaluatortidak selalu harus mempergunakan keempatnya. Walaupun demikian, karena model ini
dikembangkan berdasarkan suatu pandangan tentang kegiatan kurikulum sebagai sesuatu
dalam dimensinya yang utuh, pelaksanaan ke empat jenis evaluasi model ini merupakan hal
yang diharapkan. Lagi pula kekuatan model sebetulnya terletak dari rangkaian kegiatan
keempat jenis evaluasi itu sendiri.
Sesuai dengan namanya, keempat jenis evaluasi Stufflebeam ini mempunyai obyek kejian
yang berbeda. Evaluasi konteks ditujukan untuk menilai keadaan yang sedang dilakukan oleh
suatu lembaga pendidikan. Jadi, evaluasi ini tidak mengharuskan lembaga pendidikan
mempunyai suatu kurikulum baru terlebih dahulu untuk melakukan kegiatan evaluasi.Evaluasi justru dilakukan dari kegiatan awal sebelum suatu inovasi kurikulum direncanakan.
Bahkan adalah fungsi dari evaluasi konteks untuk melihat apakah diperlukan adanya suatu
inovasi atau tidak.
Tujuan evaluasi konteks yang utama ialah untuk mengetahui kekuatan dan kelemahan yang
dimiliki evaluan (Stufflebeam, 1983:128). Dengan mengetahui kekuatan dan kelemahan ini,evaluator dapat memberikan arah perbaikan yang diperlukan. Dalam melakukan evaluasi ini
evaluator harus dapat menemukan kebutuhan yang diperlukan evaluan. Oleh karena itu,evaluan konteks ini sebagian tigasnya adalah melakukan need assesment. Tetapi, selain dari
-
8/2/2019 Evaluasi Program Pembelajaran Full
18/45
need asesment, evaluasi konteks ini harus pula dapat memberikan pertimbangan apakah
tujuan yang akan dicapai sesuai dengan kebutuhan yang telah ditentukan.
Dari tugas yang harus dilakukan terlihat nahwa evaluasi konteks mencoba untuk memberikan
pertimbangan mengenai nilai dan arti dari auatu keadaan. Nilai diperlihat-kan dengan
mengemukakan mengenai keadaan evaluan. Kekuatan dan kelemahan yang dimiliki evaluan
merupakan hasil pertimbangan evaluator tentang nilai evaluan. Sedangkan arti evaluan
diperlihatkan dengan memberikan pertimbangan apakah tujuan yang akan dicapai sesuaidengan kebutuhan.
Dari evaluasi konteks ini terlihat perbedaan antara model CIPP ini dengan model-modelevaluasi yang telah dibahas terdahulu. Model-model lain mulai dengan adanya suatu inovasi
yang sedang dilaksanakan oleh suatu lembaga pendidikan. Inovasi itu yang kemudiandijadikan evaluan. CIPP bahkan membantu evaluan untuk memutus-kan apakah inovasi
diperlukan atau tidak. Kalau perlu, evaluator yang mempergunakan model CIPP tidak lantasberpangku tangan. Evaluator harus dapat menentukan skala inovasi yang dilakukan.
Dalam model aslinya dikenal ada tiga jenis skala inovasi yang mungkin dilakukan. Ketiganya
diberi label yang cukup klasik walaupun cukup jelas menggambarkan skala yang dimaksud.
Ketiganya ialah homeostatic, incremental, dan neobolistic. Homeostatic merupakan skala
terendah di mana inovasi yang akan dilakukan hanya memasukkan unsur baru yang tidak
berarti. Dapat dikatakan bahwa skala inovasi homeostatic tidak akan mengubah pola kegiatanyang sudah ada. Hanya elemen tertentu dari pola yang ada yang harus diubah. Dampak
perubahan hanya bersifat mikro. Oleh karena itu, apabila inovasi yang akan dilakukan
bersifat homeostatic, evaluasi berikutnya tidak dapat dikatakan tidak diperlukan. Tetapi
apabila skala inovasi yang akan dilakukan bersifat incremental (penambahan), apalagi dalam
skala noebolistic, evaluasi berikutnya yaitu evaluasi masukan merupakan suatu yang
dipersyaratkan.
Mengapa demikian? Seperti dikemukakan oleh Stufflebeam (1983:130), bahwa orientasi
utama evaluasi ialah mengemukakan suatu program yang dapat mencapai apa yangdiinginkan lembaga tersebut. Program yang dimaksudkan ialah program yang membawa
perubahan yang membawa perubahan berskala penambahan dan pembaharu-an. Lebih lanjut,Staufflebeam menulis:
This type of study should identify and rate relevant approaches (including any that arealready in operation) and assist and explicating and shaking down the one that is chosen for
instalation or continuation. It should also search the clients environment for barriers,constraints, and potentially available resources that need to be taken info account in the
process of activating the program.
Dengan demikian evaluasi masukan tidak hanya melihat apa yang ada pada lingkungan
lembaga tersebut ( baik material maupun personal) tetapi juga harus dapat memperkira-kan
kemungkinan-kemungkinan yang akan dihadapi di waktu mendatang ketika suatu inovasi
kurikulum dilaksanakan.
Dari apa yang telah dibicarakan mengenai evaluasi masukan ini, makin jelas bahwa CIPP
tidak hanya dilaksanakan dalam situasi di mana suatu inovasi sedang dilaksanakan tetapi justru model ini dilakukan ketika inovasi itu akan atau belum dilaksanakan. Meskipun
demikian, tidaklah berarti bahwa CIPP tidak dapat dapat dilaksanakan apabila suatu inovasi
kurikulum sedang dalam proses pelaksanaan. CIPP tetap dapat dilakukan kendati suatu
lembaga pendidikan telah melaksanakan suatu inovasi kurikulum dalam waktu tertentu.
Seperti telah dikemukakan, Stufflebeam telah mengatakan CIPP tidak mutlak harusdigunakan dalam keseluruhan model, CIPP dapat digunakan dalam salah satu atau kombinasi
dari dua atau lebih kegiatan evaluasi. Jadi, CIPP dapat digunakan hanya denganmenggunakan evaluasi proses saja. Mengingat obyek kajian dan tujuan yang akan dicapai
-
8/2/2019 Evaluasi Program Pembelajaran Full
19/45
evaluasi proses, CIPP dapat digunakan walaupun bukan dari sejak awal ketika akan
menemukan ide inovasi.
Evaluasi proses adalah evaluasi mengenai pelaksanan dari suatu inovasi kurikulum. Jadi,
kalau evaluasi konteks adalah evaluasi kurikulum dalam dimensi pengertian sebagai ide,
evaluasi masukan adalah evaluasi kurikulum dalam dimensi pengertian sebagai rencana,
evaluasi proses adalah evaluasi kurikulum dalam dimensi pengertian sebagai realita atau
kegiatan. Artinya, evaluasi proses ini baru dapat dilakukan apabila inovasi kurikulum tersebuttelah dilaksanakan di lapangan, bukan pada waktu ia dirancang. Oleh karena itu, evaluator
dapat saja menggunakan model CIPP walaupun ia baru diminta berpartisipasi ketika suatuprogram inovasi sedang dilaksanakan.
Dalam pelaksanaannya, model CIPP ini bertujuan memperbaiki keadaan yang ada. Evaluatordiminta untuk menentukan sampai sejauh mana rencana inovasi itu dilaksanakan di lapangan,
hambatan-hambatan apa yang ditemui yang tak dapat diperkirakan sebelumnya, dan perubahan-perubahan apa yang harus dilakukan terhadap inovasi tersebut. Informasi yang
dikumpulkan disajikan sebagai umpan balik bagi para pengelola dan juga staf. Dengan
demikian, keputusan-keputusan yang diperlukan dalam usaha memperbaiki proses yang
sedang berlangsung dapat dilaksanakan.
Dari tujuan yang akan dicapai oleh evaluasi proses CIPP ini terlihat jelas bahwa CIPP
mempergunakan pendekatan pengembangan kriteria baik yang bersifat fidelity maupun yang bersifat mutual adaptive. Kriteria yang bersifat fidelity terlihat dari tujuan untuk
menentukan sampai sejauh mana rencana inovasi yang dibuat telah tercapai. Pendekatan
mutual adaptive terlihat dari adanya usaha untuk memperbaiki keadaan lapangan agar
inovasi itu sendiri. Artinya, evaluator yang melaksanakan evaluasi proses ini harus pula dapat
memberikan informasi mengenai hal-hal apa dari lapangan yang harus diubah dan komponen
apa dari inovasi yang harus pula diubah. Dengan perubahan-perubahan tersebut diharapkan
inovasi dan lapangan mencapai kesesuaian.
Evaluasi hasil adalah kegiatan evaluasi berikutnya dalam model CIPP. Tujuan utama darievaluasi hasil ini adalah untuk menentukan sampai sejauh mana kurikulum yang
dimplementasikan tersebut telah dapat memenuhi kebutuhan kelompok yangmempergunakannya (Stufflebeam, 1983:134). Dalam hal ini, diharapkan pula bahwa evaluasi
hasil memperlihatkan pengaruh program tidak hanya yang bersifat langsung tapi jugapengaruh tidak langsung. Pengaruh tersebut tidak saja yang bersifat positif (biasanya evaluasi
hasil hanya melihat pengaruh dari sudut pandangan positif ini), tetapi juga pengaruh negatifdari kurikulum tersebut.
Adanya pengaruh negatif ini kedengarannya aneh tetapi sebenarnya realistis. Bukankah suatu
hal yang mustahil bahwa suatu kurikulum menghasilkan pengaruh sampingan yang bersifat
negatif yang tidak pernah diperkirakan oleh para pengembang-nya. Misalnya, suatu
kurikulum yang dikembangkan berdasarkan tradisi intelektual. Hasilnya, mungkin
memberikan kemampuan intelektual tinggi bagi siswa tapi dapat pula kemampuan intelektual
tinggi tersebut menyebabkan siswanya menjadi ingkar terhadap agama. Dalam suatu studi di
AS, misalnya, ditemukan bahwa program yang dikembangkan berdasarkan pandangan
humanistik, memberikan pengaruh negatif dalam aspek disiplin. Evaluasi hasil dalam konsepCIPP ini memberikan laporan komprehensif mengenai pengaruh dari program tersebut.
Untuk itu barangkali suatu perbandingan dengan kurikulum lainnya perlu dilakukan sehingga
pendekatan pengembangan kriteria preordinate yang dipergunakan.
Adanya ruang lingkup pengaruh yang luas sebagai fokus kajian evaluasi hasil CIPP
memberikan kesan ada pengaruh model evaluasi Goal Free dari Scriven. Sayangnya, haltersebut tidak dapat dinyatakan secara pasti. Paling tidak adanya pengaruh tersebut tidak
dapat diidentifikasi dari bacaan yang dipergunakan Stufflebeam. Kiranya korespondensi pribadi dapat lebih menjelaskan persoalan. Sayangnya, korespondensi semacam itu belum
-
8/2/2019 Evaluasi Program Pembelajaran Full
20/45
dapat dilakukan penulis buku ini. Hanya pada bagian awal tulisannya, dikatakan ia
berhubungan dengan Scriven. Bahkan mereka berdua pernah diminta untuk membicarakan
model masing-masing pada beberapa lembaga. Bukan tidak mungkin pengaruh tersebut
berkembang selama masa ini. Atau, ide tersebut memang muncul secara terpisah pada kedua
diri pengembang model tersebut walaupun keduanya sering berdiskusi.
Suatu hal yang pasti dan diakui oleh Stufflebeam bahwa terdapat perbedaan pandangan
mengenai peran evaluasi yang cukup prinsipil antara dia dengan Scriven. Sementara modelCIPP lebih menekankan pada peran formatif sedangkan model Scriven, baik formatif-sumatif
maupun Goal Free, sangat memberikan perhatian yang besar terhadap peran sumatif. Olehkarena itu dalam evaluasi hasil inipun model CIPP memberikan posisi penting bagi peran
formatif. Artinya, informasi yang dihasilkan evaluasi hasil CIPP tidak dipergunakan untukmenentukan apakah suatu program harus diganti. Informasi yang diberikan digunakan untuk
menetapkan apakah ada komponen kurikulum yang harus diperbaiki.Karena sifatnya yang demikian, adalah sangat berbahaya kalau evaluasi hasil model CIPP ini
dilakukan secara terpisah. Keterbatasan ruang lingkup evaluasi hasil merupakan hambatan
sehingga informasi yang diberikan tidak cukup kuat untuk dipergunakan sebagai landasan
dalam memperbaiki program. Misalnya, katakanlah kalau evaluasi hasil menunjukkan bahwa
hasil belajar siswa sangat rendah dibanding-kan dengan apa yang direncanakan. Lantas,
kesimpulan apa yang dapat diambil? Apakah kelemahan tersebut disebabkan oleh faktormasukan ataukah faktor proses.
Atau, mungkin kelemahan itu disebabkan kelemahan dalam kurikulum itu sebagai suatu ide?
Adanya kelemahan semacam ini bukannya tidak disadari oleh Stufflebeam. Oleh karena itu ia
menganjurkan, kalaulah jenis-jenis evaluasi yang ada dalam CIPP akan dilakukan tidak
seutuhnya, sebaiknya pekerjaan evaluasi meng-gabungkan dua atau lebih dari jenis evaluasi
yang ada. Dengan adanya penggabungan ini tentu saja kelemahan seperti yang diungkapkan
di atas tidak perlu dikhawatirkan. Keunggulan suatu jenis evaluasi dapat menutupi kelemahan
jenis evaluasi lainnya.Tampaknya, kalau model CIPP ini diperhatikan, yang paling dapat diper-tanggungjawabkan
ialah evaluasi konteks di sati pihak, evaluasi masukan, proses, dan hasil di lain pihak.Pemisahan semacam ini merupakan suatu penyelesaian terutama apabila evaluasi hasil akan
dilakukan. Apabila evaluasi hasil tidak diikutsertakan, persoalannya tidaklah begitumengkhawatirkan. Setiap gabungan lainnya tidak akan membawa persoalan yang
mengandung resiko tinggi bagi pengambil keputusan.Sudah tentu yang terbaik ialah apabila keseluruhan model CIPP dapat dilaksana-kan. Gambar
6 memperlihatkan alur kerja keseluruhan model tersebut. Seperti terlihat dalam gambar
tersebut, dalam model ini perbedaan kegiatan dinyatakan dengan perbedaan bentuk. Bentuk
kotak persegi empat digunakan untuk menggambarkan kegiatan pelaksanaan. Bentuk belah
ketupat digunakan untuk menggambarkan keputusan yang harus diambil. Oleh karena itu
dalam setiap keputusan itu ada garis ya yang berarti keputusan yang diambil mengiyakan
pertanyaan ayanga ada dalam bentuk belah ketupat itu. Sedangkan tidak berarti menolak
pertanyaan yang diajukan. Bentuk lonjong (oval) menunjukkan kegiatan evaluasi yang
dilakukan. Bagi pembaca yang kenal dnegan program komputer tentu saja bentuk-bentuktersebut bukanlah sesuatu yang baru.
Dalam diagram asli mengenal CIPP kotak untuk kegiatan evaluasi proses dan hasil
dipisahkan. Dalam diagram terbaru ini Stufflebeam menggabungkan kedua kegiatan evaluasi
itu dalam satu kotak. Kiranya, penggabungan ini merupakan sesuatu yang sugestif bahwa
paling tidak evaluasi hasil harus digabungkan dalam pelaksanaan-nya dengan evaluasi proses.Gambar 6 yang memperlihatkan alur kerja model CIPP itu sangat jelas memperlihatkan
kapan suatu evaluasi diadakan dan jenis keputusan apa diharapkan, serta tindak lanjut apayang dapat dilakukan berdasarkan keputusan yang diambil. Sebagai contoh, evaluasi konteks
-
8/2/2019 Evaluasi Program Pembelajaran Full
21/45
secara berkala melakukan kajian terhadap pelaksanaan sistem yang berlaku. Dari hasil kajian
itu harus dapat diputuskan apakah suatu inovasi diperlukan. Kalau tidak, kembali
melaksanakan apa yang sedang dilakukan oleh lembaga pendidikan itu. Kalau suatu inovasi
diperlukan (ya), masalah yang dihadapi harus diidentifikasi dan tujuan yang akan dicapai
harus pula dirumuskan. Setelah itu, keputusan yang harus diambil adalah apakah pemecahan
masalah sudah memuaskan. Kalau sudah, solusi itu dilaksanakan. Kalau tidak, evaluasi
masukan dilaksanakan. Demikian seterusnya.Model CIPP ini memiliki keunggulan terutama apabila keseluruhan model dilaksanakan.
Keempat dimensi kurikulum, seperti yang dibicaraan dalam buku ini dapat dilayani dengan baik oleh model ini. Kurikulum dalam dimensi ide dapat dievaluasi meklakui evaluasi
konteks. Pertnyaan keputusan tentang apakah suatu ide inovasi kurikulum mempunyaikekuatan justifikasi adalah pertanyaan dasar dalam kajian dimensi ide. Evaluasi masukan
dapat ditujukan kepada kurikulum dalam dimensi sebagai rencana. Seperti diketahui dalam pendekatan sistem, yang juga sebenarnya merupakan dasar pemikiran model CIPP ini,
kurikulum sebagai rencana adalah suatu masukan (kadang-kadang disebut dengan istilah
instrumental input. Sedangkan evaluasi proses dan hasil, sesuai dengan namanya, ditujukan
untuk mengkaji dimensi proses dan hasil suatu kurikulum.
Keunggulan lain dari model ini ialah peran aktif evaluator sejak awal. Seperti telah
dikemukakan, evaluasi konteks dilaksanakan bahkan sebelum suatu ide inovasi dirumuskansecara kongkrit. Evaluator harus melihat keadaan yang barlaku dan kemudian, berdasarkan
hasil kajian tersebut, mempertanyakan apakah suatu inovasi diperlukan. Di sini evaluator
bertindak sebagai orang yang mempunyai posisi penting dalam membantu memberikan
penyelesaian terhadap masalah yang dihadapi suatu lembaga pendidikan. Sepanjang
pengetahuan penulis, model lain tidak memberikan pesan yang sedemikian penting bagi
evaluator terkecuali kejian need assessment yang biasanya dimasukkan dalam ruang
lingkup kajian perencanaan. Tetapi model CIPP menempatkan kajian need assessment
sebagai salah satu teknik evaluasi konteks dan memberikan kedudukan yang penting bagievaluator dalam suatu usaha inovasi.
Kelemahan model ini ialah apabila ia diterapkan secara bagian demi bagian (partial).Penerapan yang demikian melemahkan ide dasar model. Pelaksanaan kombinasi antar dua
atau lebih jenis evaluasi menyebabkan alur kegiatan evaluasi menjadi tidak utuh. Dengan pelaksanaan yang demikian, hubungan antara satu keputusan dengan keputusan lain dapat
kehilangan kesinambungan.
4. Model Evaluasi Scriven
Menurut Michael Scriven, evaluasi program dibedakan atas dasr fungsinya yaitu: evaluasi
formative dan evaluasi sumatif.
Evaluasi formatif berfungsi untuk mengumpulkan data selama kegiatan sedang dilaksanakan.
Data yang dikumpulkan dapat pula digunakan oleh pengembang program untuk membentuk
dan memodifikasi program. Dalam beberapa hal, penemuan-penemuan dari evaluasi dapat
digunakan sebagai bahan acuan bagi pelaksana dalam melaksanakan program selanjutnya,agar tidak terjadi pemborosan biaya, tenaga dan waktu.
Evaluasi sumatif berfungsi untuk mengmpulkan data ketika kegiatan program benar-benar
selesai. Evaluasi sumatif dilaksanakan dengan tujuan untuk mengetahui kemanfaatan
program, terutama jika dibandingkan dengan program lain yang sejenis. Data yang
dikumpulkan selama evaluasi sumatif sangat berguna bagi pihak pembuat keputusan ataupenanggungjawab program dalam menentukan kebijakan dan tindak lanjut.
Oleh Scriven, evaluasi formatif dan sumatif menunjuk model evaluasi karena mengandungpengertian tentang:
-
8/2/2019 Evaluasi Program Pembelajaran Full
22/45
a. Komponen
1) Formatif : Evaluasi sebagian program
2) Sumatif : Evaluasi seluruh program
b. Instrumen
1) Formatif : Disusun oleh evaluator
2) Sumatif : Terstandar
c. Pelaksana1) Formatif : Dilakukan orang dalam
2) Sumatif : Dilakukan orang luard. Langkah-langkah
1) Formatif : Terus menerus disusun, memperoleh hasil sambilmenggunakan langsung, tidak perlu desain lengkap.
2) Sumatif : Satu kali pelaksanaan: menyeluruh, memperolehdata, mengolah dan menyimpulkan data dan
menyebarkan kepada pihak pengambil
keputusan. Memerlukan penyusunan desain
secara lengkap.
Langkah-langkah pelaksanaan evaluasi formatif dan evaluasi sumatif.
5. Evaluasi formatif dilaksanakan selama program berlangsung dengan tujuan untukmenyediakan informasi yang bermanfaat kepada pimpinan atau penanggungjawab program
untuk kepentingan perbaikan dan penyempurnaan program. Setiap langkah pelaksanaan
evaluasi akan menghasilkan umpan balik segera. Selanjutnya berdasarkan informasi yang
telah dikumpulkan dapat dipergunakan untuk merevisi dan menyempurnakan progran apabila
diperlukan.
6. Evaluasi sumatif dilaksanakan pada akhir kegiatan untuk memberi-kan informasi kepada
kemampuan potensial tentang manfaat atau kegunaan program.
7. Evaluasi formatif hendaknya menarah kepada keputusan tentang program, termasuk perbaikan, modifikasi dan penyempurnaan. Sedangkan evaluasi sumatif mengarah kepada
kebutuhan mengenai kelanjutan program berikutnya atau program yang ditersukanpengabdosiannya.
8. Jelasnya bahwa kedua evaluasi ini penting karena keputusan yang diperlukan selama proses, tingkat pengembangan program, untuk memperbaiki dan memperkuat keputusan
progran yang diambil. Dan apabila sudah stabil dapat dipakai untuk mengevaluasi manfaatprogran atau untuk memutuskan masa depan/kelanjutan program yang bersangkutan.
5. Model Evaluasi Discrepancy (Kesenjangan)
Malcolm Provus sebagai perintis dan pengembang model ini berpendapat bahwa evaluasi
kesenjangan berfungsi untuk mengetahui tingkat kesesuaian antara standar yang sudah
ditetapkan dengan penampilan aktual program yang bersangkutan. Sedangkan menurut
AECT (1979), evaluasi kesenjangan adalah suatu metode untuk mengidentifikasi
perbedaan/kesenjangan antara tujuan khusus yang ditetapkan dengan penampilan aktual.Adapun langkah-langkah dalam pelaksanaan model evaluasi kesenjangan adalah:
Tahap Penyusunan Desain, kegiatan yang dilakukan antara lain:Merumuskan tujuan program.
Menyiapkan audience, personil dan kelengkapan lainnya. Menentukan kriteria dalam bentuk
rumusan yang menunjuk pada sesuatu yang dapat diukur. Tahap pemasangan Instalasi,
kegiatan yang dilakukan antara lain:Menilai kembali penetapan kriteria (standar) yang telahditetapkan pada tahap penyusunan desain. Meninjau/memonitor program yang sedang
dilaksanakan. Meneliti kesenjangan antara apa yang telah direncanakan dengan apa yangtelah dicapai. Taha
top related