Pengantar
Pendidikan dan pembelajaran pada hakikatnya merupakan suatu proses untuk mencapai sejumlah tujuan. Penilaian yang dimaksudkan untuk mengukur kadar pencapaian tujuan itu, yang dengan sendirinya juga harus merupakan suatu proses hendaknya dilakukan secara berkesinambungan selama berlangsungnya kegiatan pembelajaran. Pemahaman guru terhadap proses penilaian merupakan bagian penting dalam pelaksanaan pendidikan di sekolah. Selama ini, beberapa guru (pendidik) menilai hanya berdasarkan perasaan atau hanya mengandalkan observasi sehingga nilai yang dihasilkan cederung subjektif.
Pada hakikatnya, kegiatan penilaian yang dilakukan tidak semata-mata untuk menilai hasil belajar peserta didik saja, tetapi juga menilai berbagai faktor, antara lain kegiatan pengajaran yang dilakukan itu sendiri. Artinya, berdasarkan informasi hasil belajar dapat dijadikan umpan-balik terhadap pembelajaran yang dilakukan. Ketidakberhasilan ujian bukan semata-mata kegagalan peserta didik tetapi mungkin karena kegagalan pendidik dalam mengajar.
Hasil penilaian pendidik yang diberikan kepada peserta didik dipandang sebagai nasib bagi peserta didik itu sendiri. Artinya, peserta didik yang tidak mendapatkan nilai yang tinggi sulit untuk mendapatkan sekolah yang diinginkan karena lapangan pekerjaan dan sekolah tertentu menjadikan nilai sebagai ukuran. Profesionalisme pendidik dalam penilaian turut menjadi pendukung untuk menentukan nilai seobjektif mungkin. Dengan demikian, maka yang perlu dipahami oleh pendidik adalah hakikat penilaian dan fungsinya, tujuan pembelajaran dan penilaian, serta alat penilaian.
A. Hakikat Penilaian dan Fungsinya
Penilaian berurusan dengan data kuantitatif dan kualitatif, sedangkan pengukuran yang hanya bagian penilaian itu selalu berhubungan dengan data kuantitatif. Penilaian memerlukan data kuantitatif dari pengukuran. Sebaliknya, pengukuran juga sangat terikat pada penilaian khusus yang berkaitan dengan masalah tujuan dan kriteria yang dipergunakan. Pengukuran dan penilaian ini dilakukan hanya dengan mengambil sampel tentang suatu hal yang akan diketahui karena tak mungkin mengukur semua kemampuan peserta didik, dan peserta didik sendiri tak mungkin menunjukkan semua kemampuannya dalam sebuah proses pengukuran.
Penilaian adalah proses memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang dipergunakan sebagai dasar pengambilan keputusan. Dengan demikian, terdapat tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan. Informasi memberikan data-data (baik kuantitatif maupun kualitatif) yang berguna untuk pembuatan pertimbangan. Pertimbangan dimungkinkan tepat jika informasi yang diperoleh dan interpretasi terhadapnya juga tepat. Pertimbangan adalah taksiran kondisi yang ada kini dan prediksi keadaan pada masa mendatang. Keputusan yang diambil berdasarkan kedua komponen tersebut adalah pilihan di antara berbagai arah tindakan atau sejumlah alternatif yang ada.
Langkah-langkah penilaian menurut Buchori (1972) adalah persiapan (berisi penetapan tujuan, aspek yang dinilai, metode, penyusunan alat, penetapan kriteria, dan frekuensi penilaian), pengumpulan data, pengolahan data hasil penilaian, penafsiran, dan penggunaan hasil. Langkah-langkah penilaian menurut Ten Brink (1974) terdiri tahap-tahap persiapan yang berupa pemerincian pertimbangan dan keputusan yang akan dibuat, informasi yang diperlukan dan pemanfaatan yang ada, penentuan waktu dan cara, dan penyusunan alat, tahap pengumpulan data yang diteruskan analisis terhadapnya, dan tahap penilaian yang berupa pembuatan pertimbangan dan keputusan, dan diteruskan dengan pembuatan laporan hasil penilaian.
Tujuan dan fungsi penilaian antara lain adalah untuk mengetahui kadar pencapaian tujuan, memberikan sifat objektivitas pengamatan tingkah laku hasil belajar siswa, mengetahui kemampuan siswa dalam hal-hal tertentu, menentukan layak tidaknya seorang siswa dinyatakan naik kelas atau lulus, dan untuk memberikan umpan-balik bagi kegiatan belajar-mengajar yang dilakukan.
B. Tujuan Pembelajaran dan Penilaian
Tujuan pembelajaran dan penilaian yang memberi arah dan pegangan yang jelas, memaksa kita untuk berpijak pada kenyataan dan berpikir secara konkret. Bagi pendidik, pembelajaran dan penilian akan membantu untuk memilih bahan, metode, teknik, dan alat penilaian. Bagi peserta didik, ia dapat dimanfaatkan sebagai pengorganisator dan kerangka kerja untuk memperoleh ilmu.
Tujuan pembelajaran dan output hasil belajar adalah dua hal yang erat berkaitan. Tujuan menyarankan bentuk-bentuk tertentu output pembelajaran, sebaliknya, tingkah laku keluaran belajar merupakan realisasi pencapaian tujuan. Output pembelajaran, oleh Gagne, dibedakan dalam bentuk keterampilan intelektual (yang berisi kemampuan membedakan, konsep, aturan, dan aturan tingkat tinggi), strategi kognitif, informasi verbal, keterampilan motor, dan sikap. Pembagian Bloom yang terkenal dengan sebutan taksonomi Bloom yang terdiri atas aspek kognitif, afektif, dan psikomotor banyak diikuti orang, termasuk kurikulum di Indonesia.
Proses identifikasi tujuan khusus merupakan proses analisis dan identifikasi output pembelajaran. Tujuan khusus menyaran pada tingkah laku output pembelajaran yang operasional, artinya mudah diamati diukur dengan alat penilaian. Tiap tujuan khusus harus mengandung unsur sasaran, tingkah laku yang diharapkan, kondisi sewaktu dinilai, dan kriteria keberhasilan. Tidak seperti halnya tujuan umum, tujuan khusus memiliki cakupan bahan yang terbatas.
Penyusunan alat penilaian harus mendasarkan diri pada tujuan agar dapat berfungsi sebagaimana mestinya. Alat penilaian dikatakan memenuhi kriteria kelayakan jika dapat mengukur output yang konsisten dengan tujuan. Tujuan akan menentukan tingkah laku guru dan murid dan bentuk output yang terukur.
Bahan pembelajaran merupakan pengantara tujuan dan alat penilaian. Dengan kata lain, ia merupakan sarana tercapainya tujuan dan sumber penyusunan alat penilaian. Karena bahan pembelajaran memegang peranan penting, ia perlu dideskripsikan secara terinci karena hal itu juga dapat dimanfaatkan untuk menguji kesahihan isi alat penilaian itu sendiri.
C. Alat Penilaian
Ada dua macam alat penilaian yaitu, teknik tes dan teknik nontes. Baik teknik tes maupun nontes keduanya dapat dimanfaatkan secara efektif jika dipergunakan secara tepat, dan itu tergantung dari tujuan penilaian. Teknik nontes misalnya berupa kegiatan kuesioner, wawancara, pengamatan, dan pengukuran kecenderungan tertentu dengan mempergunakan skala. Skala merupakan suatu kesatuan sebagai penanda unit-unit yang bersifat angka yang disusun secara berjenjang. Tiap jenjang melambangkan sikap dan keyakinan tertentu.
Teknik wawancara baik secara bebas maupun terpimpin, dalam kaitannya dengan penilaian kebahasaan, dapat dipergunakan juga untuk menilai keterampilan, kelancaran, dan kefasihan berbicara siswa dalam bahasa yang diajarkan. Kegiatan pengamatan baik yang berstruktur maupun tak berstruktur dapat dimanfaatkan untuk menilai tingkah laku hasil belajar bahasa peserta didik yang terlihat dalam kegiatan sehari-hari. Tingkah laku dalam situasi seperti itu bersifat wajar, tidak dibuat-buat, dan lebih mencerminkan keadaan yang sesungguhnya.
Tes adalah seperangkat tugas atau pertanyaan yang dipergunakan untuk mengukur keterampilan, pengetahuan, intelegensi, kemampuan, atau bakat yang dimiliki seseorang atau kelompok. Dan segi jawaban siswa, tes dapat dibedakan ke dalam tes perbuatan dan tes verbal. Tes buatan pendidik disusun berdasarkan tujuan-tujuan khusus dan deskripsi bahan yang disusun guru untuk mengukur keberhasilan siswa mencapai tujuan, jadi yang terpenting dapat dipertanggungjawabkan dari jenis kesahihan isi. Tes buatan guru biasanya tingkat ketepercayaannya rendah atau tak diketahui.
Tes standar disusun berdasarkan tujuan-tujuan umum seperti yang terdapat dalam kurikulum. Oleh karena telah mengalami beberapa kali uji coba dan revisi, tes standar dapat dipertanggungjawabkan dari segi kelayakan, kesahihan, ketepercayaan, dan ketertafsiran. Tes standar berguna untuk melengkapi informasi tertentu tingkat hasil belajar peserta didik, membuat perbandingan prestasi peserta didik, dan berfungsi diagnostik.
Tes kemampuan awal dapat dibedakan menjadi pretes, yang dimaksudkan untuk mengetahui kemampuan peserta didik sebelum mengalami proses belajar, tes prasyarat, yang dimaksudkan untuk mengetahui kemampuan tertentu disyaratkan untuk masuk pendidikan tertentu, dan tes penempatan yang dimaksudkan untuk menempatkan siswa sesuai dengan kemampuannya.
Tes diagnostik dimaksudkan untuk menemukan kelemahan-kelemahan peserta didik dalam hal tertentu untuk kemudian diremidi. Tes formatif dimaksudkan untuk mengukur kadar keberhasilan peserta didik mencapai tujuan, yaitu berkaitan dengan pokok bahasan yang baru saja diselesaikan dalam proses belajar-mengajar. Bagi pendidik, tes formatif dapat untuk menilai efektivitas pengajaran, sedang bagi peserta didik dapat berfungsi sebagai penguat.
Tes sumatif dimaksudkan untuk mengukur kadar pencapaian peserta didik terhadap tujuan umum, yang meliputi seluruh bahan yang diprogramkan pada periode tertentu. Informasi tes sumatif dipergunakan untuk menentukan prestasi peserta didik, naik-tidak dan atau lulustidak-nya seorang peserta didik, serta untuk membuat laporan kepada pihak tertentu.
Tes esai merupakan tes proses berpikir yang melibatkan aktivitas kognitif tingkat tinggi, menuntut kemampuan peserta didik untuk menerapkan pengetahuan, menganalisis, menghubungkan konsep-konsep, menilai, dan memecahkan masalah. Kelemahan pokok tes esai adalah rendahnya kadar kesahihan dan ketepercayaan akibat terbatasnya sampel bahan, jawaban peserta didik yang bervariasi, dan penilaian yang bersifat subjektif. Untuk mengurangi sifat subjektif dalam penilaian, perlu ditentukan kriteria penilaian yang menyangkut isi, organisasi, proses, kesimpulan dan alasan dengan bobot yang tidak harus sama.
Tes objektif menghendaki hanya satu jawaban yang benar, maka penilaiannya dapat secara objektif, cepat, dan dapat dipercaya. Karena jumlah soal relatif banyak, tes objektif dapat mencakup bahan secara lebih menyeluruh. Tes objektif yang baik tidak mudah disusun, memerlukan waktu lama, dan ada kecenderungan pendidik hanya terpusat pada pokok bahasan dan tingkatan aspek kognitif tertentu. Dalam mengerjakannya, siswa dapat bersifat untung-untungan.
Tes objektif dapat berupa benar-salah, pilihan ganda, melengkapi, dan penjodohan. Tes benar-salah bisa dipakai karena hasil belajar yang berupa penguasaan pengetahuan verbal yang dinyatakan dalam bentuk proposisi dapat dinyatakan secara benar atau salah. Tes pilihan ganda merupakan tes benar-salah dengan pernyataan salah lebih banyak. Tes isian adalah tes pilihan ganda tapi siswa mengisi sendiri pilihan yang benar, sedang penjodohan semua pernyataan yang benar ditunjukan sekaligus.
Tes yang baik adalah yang dapat dipertanggungjawabkan dari segi kelayakan (appropriateness), kesahihan (validity), ketepercayaan (reliability), efektivitas butir soal, dan kepraktisan (practicality). Kelayakan tes berkaitan dengan masalah apakah suatu tes dapat mengukur output hasil belajar yang konsisten dengan tujuan; apakah semua tujuan telah memiliki alat ukur yang sesuai; apakah jumlah butir soal per tujuan telah mencerminkan kadar pentingnya tujuan; dan apakah semua butir soal telah mengacu ke tujuan tertentu.
Butir-butir tes harus mencerminkan materi pelajaran yang diajarkan. Semua bahan yang diajarkan perlu diambil tesnya, dan sebaliknya, tes harus hanya terbatas pada bahan yang diajarkan. Untuk memudahkan pengecekan hal itu, pembuatan soal hendaknya mendasarkan diri pada tabel spesifikasi. Kelayakan tes dalam hal ini, merupakan salah satu jenis kesahihan, kesahihan isi.
Kesahihan tes menunjuk pada pengertian apakah suatu tes dapat mengukur apa yang akan diukur. Tes yang sahih akan dapat membedakan siswa yang memang berkemampuan yang lebih baik daripada yang sebaliknya. Kesahihan tes yang baik akan mengungkap semua tingkatan aspek kognitif, dan tidak hanya terbatas pada beberapa tingkatan kognitif yang sederhana saja.
Kesahihan tes dibedakan berdasarkan analisis rasional, kesahihan isi dan konstruk atau konsep, dan berdasarkan data empirik, serta kesahihan kriteria atau ukuran. Kesahihan isi menunjuk pada pengertian apakah suatu tes mempunyai kesejajaran dengan tujuan deskripsi bahan yang diajarkan. Tujuan dan bahan biasanya dikembalikan kepada kurikulum, maka kesahihan isi disebut juga sebagai kesahihan kurikuler. Di pihak lain, kesahihan konstruk menunjuk pada pengertian apakah tes yang disusun telah sesuai dengan konstruk ilmu bidang studi yang diteskan. Kesahihan ukuran mempermasalahkan seberapa jauh peserta didik yang sudah diajar dalam bidang tertentu mempunyai kemampuan yang tinggi daripada yang belum diajar. Jika subjeknya sama, membandingkan hasil belajar itu dapat mendasarkan diri pada hasil pretes dan postes.
Pengujian kesahihan dalam berbagai jenis di atas merupakan pengujian kesahihan secara keseluruhan. Pengujian tingkat kesahihan dapat dilakukan secara per butir soal, yaitu dengan mengorelasikan skor-skor tiap butir tes dengan skor keseluruhan. Tes yang kesahihannya tinggi, biasanya tinggi pula kesahihan butirbutirnya, walau mungkin terdapat beberapa butir tes yang kurang sahih.
Ketepercayaan tes menunjuk pada pengertian apakah suatu tes dapat mengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu. Konsisten berarti (i) tes dapat memberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (ii) jawaban siswa terhadap butir-butir tes relatif tetap, (iii) hasil tes diperiksa siapa pun menghasilkan skor yang kurang lebih sama.
Hasil pengukuran tidak hanya mencerminkan berapa banyak peserta didik berhasil dalam belajar, tetapi juga bagaimana keakuratan tes itu sendiri. Keakuratan tes akan memengaruhi skor yang diperoleh siswa, maka skor itu tidak akan secara sempurna mencerminkan kemampuan yang sebenarnya.
Pengujian reliabilitas tes dengan teknik bentuk paralel dilakukan dengan menyediakan dua perangkat tes yang bersifat paralel atau ekuivalen. Setelah kedua perangkat tes itu dicobakan, hasilnya dikorelasikan. Untuk meningkatkan keterpercayaan butir tes, hendaknya dibuat butir-butir tes yang secukupnya. Butir tes yang semakin banyak akan semakin mempertinggi tingkat ketepercayaan tes, walau setelah dalam jumlah tertentu peningkatan itu kecil.
Peningkatan ketepercayaan tes juga dilakukan dengan memilih butir-butir soal yang indeks tingkat kesulitan dan daya bedanya memenuhi persyaratan. Untuk keperluan ini, kita perlu melakukan analisis butir soal. Bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami, tidak bersifat ambigu, dan tidak membingungkan, agar tidak menimbulkan kesalahpahaman.
Kondisi pelaksanaan tes harus dikontrol sebaik-baiknya agar hal itu tidak memengaruhi penampilan peserta didik. Dalam memeriksa pekerjaan peserta didik, kita harus menghindari sifat subjektivitas diri, terutama dalam tes esai. Oleh karena itu, sebelum memeriksa pekerjaan peserta didik hendaknya membuat pedoman penilaian.
Analisis butir adalah analisis hubungan antara skor-skor butir soal dengan skor keseluruhan, membandingkan jawaban peserta didk terhadap suatu butir soal dengan jawaban terhadap keseluruhan tes. Tujuan analisis adalah membuat tiap butir tes konsisten dengan keseluruhan tes dan menilai efektivitas tes sebagai alat pengukuran.
Analisis butir dilakukan untuk mencari indeks tingkat kesulitan, daya beda, dan efektivitas distraktor. Butir soal yang baik adalah yang tidak terlalu sukar atau terlalu mudah yang indeksnya berkisar antara 0,20 sampai dengan 0,80, yang mampu membedakan antara peserta kelompok kelompok tinggi dan rendah yang indeks daya bedanya paling tidak sebesar 0,20 serta semua distraktor yang disediakan dipilih.
Penghitungan indeks tingkat kesulitan dan daya beda dapat dilakukan dengan mempergunakan tabel analisis butir soal. Untuk maksud ini, kita harus mencapai proporsi jawaban betul kelompok tinggi dan kelompok rendah, baru kemudian mengkonsultasikannya kepada tabel. Butir soal yang indeks tingkat kesulitan dan daya bedanya tidak memenuhi persyaratan disarankan untuk direvisi.
Distraktor seharusnya dipilih oleh siswa kelompok rendah secara lebih banyak. Jika terjadi sebaliknya, kelompok tinggi yang lebih banyak memilih, atau ada distraktor yang tak dipilih, distraktor yang bersangkutan disarankan untuk direvisi. Tingkat ketepercayaan tes esai dihitung dengan rumus alpha, sedang indeks tingkat kesulitan serta indeks daya bedanya dicari dengan mempergunakan rumus yang berbeda dengan tes objektif.
Sebuah tes yang baik di samping layak, sahih, dan tepercaya, juga harus memenuhi kriteria kepraktisan. Kriteria kepraktisan dapat dilihat dari segi keekonomisan, kemudahan pelaksanaan, penskoran, dan penafsiran. Sebagai bagian dari kegiatan pembelajaran, penilaian adalah sebuah proses yang melibatkan banyak aspek yang saling terkait. Pelaksanaan penilain yang baik harus dilakukan secara terencana dengan baik yang melibatkan komponen terkait. Hal ini dimaksudkan agar penilaian dapat dipertanggungjawabkan hasilnya sehingga dapat dimanfaatkan sesuai dengan keperluan. Untuk itu, kegiatan pengembangan alat penilaian perlu mengikuti langkah-langkah sebagi berikut. Alat penilaian yang dimaksud dapat berupa ujian semester, tengah semester, atau untuk keperluan yang lain.
1. Penentuan Spesifikasi Ujian
Dalam penentuan spesifikasi ujian (tes) ini paling tidak terdapat empat hal yang perlu dilakukan, yaitu penentuan kompetensi dasar, pembuatan deskripsi bahan uji, pembuatan kisi-kisi, dan penentuan bentuk soal dan lama (waktu) ujian.
a. Penentuan Kompetensi Dasar
Semua kegiatan pengujian pasti dimaksudkan untuk mencapai tujuannya. Dalam kaitannya dengan kegiatan pembelajaran, ujian dimaksudkan untuk mengukur seberapa banyak peserta didik dapat mencapai kompetensi yang dibelajarkan atau dipelajari. Kompetensi yang diukur kadar capaiannya adalah kompetensi dasar, dan kompetensi dasar itu dijabarkan dari standar kompetensi. Dalam kurikulum yang digunakan, yaitu Kurikulum Tingkat Satuan Pendidikan (KTSP), pengujian dilakukan dengan berangkat dari kompetensi dasar. Standar kompetensi dan kompetensi dasar telah dituliskan pada kurikulum. Dalam pelajaran Bahasa dan Sastra Indonesia, standar kompetensi dikaitkan dengan keempat lemampuan berbahasa, yaitu menyimak, membaca, berbicara, dan menulis, serta kesastraan sehingga kompetensi dasar juga akan terkait pokok-pokok bahasan tersebut. kompetensi dasar mana saja yang akan diujikan dalam sebuah ujian tinggal mengambil dari kurikulum.
b. Pembuatan Deskripsi Bahan Uji
Jika kompetensi dasar yang akan ditagih capaiannya telah jelas, pengembangan bahan ajar yang akan dibelajarkan untuk meraih kompetensi yang dimaksud akan relatif mudah dilakukan. Pembuatan deskripsi bahan ajar yang meliputi materi pokok dan uraian materi haruslah dilakukan untuk memastikan bahan ajar apa saja yang akan diujikan. Sebetulnya, dalam pembuatan rencana program pembelajaran (RPP) tentunya deskripsi bahan ajar yang dimaksud juga telah dilakukan. Dengan demikian, dalam rangkaian pengembangan alat pengujian, kita tinggal menunjuk kembali bahan-bahan yag telah disebut RPP itu.
c. Pembuatan Kisi-kisi Pengujian
Pengembangan alat pengujian harus mengukur semua kompetensi dasar (yang tercermin dalam bahan ajar dan indikator) secara proporsional terhadap semua kompetensi dasar yang diujikan. Proporsional tidak dimaknakan sma persis jumlah butir soal untuk tiap indikator, melainkan berdasarkan pertimbangan tertentu, misalnya pentingnya sebuah kompetensi dasar untuk mendukung capaian standar kompetensi atau diperlukan untuk mendukung capaian konpetensi yang lain. Agar kegiatan pengembangan dapat dilakukan dengan baik dan dapat dipertanggungjawabkan, pembuatan butir-butir soal harus mendasakran diri pada kisi-kisi yang sengaja dirancang untuk maksud itu. Dengan kata lain, sebelum menulis butir-butir soal, terlebih dahulu harus membuat kisi-kisi. Kisi-kisi itulah yang harus dijadikan acuan menulis butir-butir soal.
d. Penentuan Bentuk Soal dan Lama Ujian
Selanjutnya harus juga direncanakan bentuk soal yang akan dipilih, misalnya apakah bentuk objektif dengan segala subjenisnya (pilihan ganda, benar-salah, pejodohan, isian singkat), uraian objektif, uraian esai (nonobjektif), atau gabungan dari beberapa bentuk tersebut. dalam ujian akhir di sekolah,pilihan yang banyak dilakukan adalah soal objektif pilihan ganda. Selain itu, untuk menentukan berapa jumlah butir soal yang akan diujikan, harus memperhitungkan waktu yang tersedia. Lama waktu ujian menentukan berapa banyak soal yang mesti dibuat. Kiranya tidak bijaksana jika waktu yang tersedia relatif pendek, tetapi jumlah butir soal yang dibuat banyak. Demikian pula sebaliknya. Untuk itu, perlu dibuat perkiraan berapa lama waktu yang diperlukan untuk mengerjakan tiap butir soal sehingga antara keduanya terdapat kesesuaian.
2. Penulisan Butir Soal
Penulisan butir soal tidak lain adalah membuat tagihan sesuai dengan tuntutan indikator dan yang sesuai pula dengan bahan ajar. Jadi, butir-butir soal haruslah cocok dengan bunyi “tuntutan” indikator yang bersangkutan sebagaimana tercermin pada kata kerja operasionalnya. Misalnya, jika indikator menuntut peserta didik untuk mampu menulis, maka mereka harus benar-benar berunjuk kerja menulis, dan tidak sekadar memilih. Secara umum, penulisan butir-butir soal harus mendasarkan diri pada kisi-kisi yang telah dibuat sebelumnya. Selain terkait dengan tuntutan tiap indikator, penulisan itu juga terikat dengan bentuk soal, jumlah soal per indikator, dan jumlah keseluruhan butir soal. Yang pasti, ketika menulis butir-butir soal juga melihat rambu-rambu yang digunakan untuk telaah butir soal agar tidak banyak revisi.
3. Penelaahan Butir Soal
Kebiasaan yang sering terlihat adalah begitu guru selesai menulis soal, baik untuk ujian tengah semester, akhir semester, atau untuk tagihan yang lain, akan langsung diujikan kepada peserta didik tanpa melakukan telaah terlebih dahulu terhadap alat tes yang bersangkutan. Kebiasaan itu, walaupun terlihat praktis, sebenarnya kurang baik dan kurang dapat dipertanggungjawabkan. Hal itu disebabkan alat tes yang ditulis tersebut belum tentu memenuhi berbagai tuntutan butir soal yang baik yang meliputi unsur materi, konstruksi, maupun bahasa. Padahal, sebagai alat uji keberhasian pembelajaran, agar hasilnya dapat dipertanggungjawabkan, ia harus memenuhi persyaratan sebagai alat tes yang baik.
Untuk memastikan bahwa butir-butir soal yang ditulis telah memenuhi tuntutan soal yang baik, sebelum diujicobakan haruslah terlebih dahulu dilakukan telaah butir soal. Dengan telaah butir soal akan ditemukan berbagai kesalahan atau kekeliruan yang dapat mengganggu, dan sebaliknya, juga dapat dipastikan kualitas butir soal yang bersangkutan. Jika terdapat sejumlah kesalahan, kekeliruan, dan kekurangtepatan akan dapat dilakukan revisi, pembenahan-pembenahan yang diperlukan. Penelaahan sebaiknya dilakukan oleh orang lain yang ahli di bidangnya (sekaligus berfungsi sebagai “penilai”, expert judgement) atau oleh sejawat. Jika telaah dilakukan oleh penulis soal sendiri, biasanya kurang teliti karena penulis boleh jadi hanya “membaca” yang ada di konsep pikiran dan bukan yang di atas kertas.
Penelaahan butir soal dapat disebut juga sebagai telaah kualitatif-redaksional. Kegiatan ini mengandalkan pertimbangan logika, baik yang menyangkut logika keilmuwan (materi), logika penyusunan butir soal (konstruksi), maupun cara membahasakan soal (bahasa). Itulah sebabnya penelaah haruslah dilakukan oleh orang yang ahli di bidang atau sebidang dengan mata pelajaran yang bersangkutan. Dengan demikian, jika terjadi kesalahan atau kekeliruan yang terkait dengan latar keilmuwan, ia dapat mengritisi dan menyarankan revisi. Penelaahan harus dilkukan secara cermat dan objektif. Jika dimungkinkan, penelaahan sebaiknya dilakukan oleh lebih dari satu orang sehingga dapat saling melengkapi.
Penelaahan biasanya mempergunakan lembar telaah yang telah disiapkan, dan paling lazim adalah untuk soal objektif bentuk pilihan ganda. Lembar telaah yang dimaksud berisi penyataan-pernyataan yang harus terpenuhi oleh tiap butir soal yang secara garis besar berisi tiga tuntutan dari segi materi, konstruksi, dan bahasa. Tiap aspek dijabarkan menjadi sejumlah pernyataan. Kegiatan penelaahan dilakukan dengan mencermati tiap butir soal dan mencocokkannya dengan butir-butir kriteria pada lembar telaah. Jika sesuai dengan kriteria diberi tanda contreng (√) dan jika sebaliknya diberi tanda hubung (-). Butir-butir yang memunyai ketidaksesuaian dengan tuntutan kriteria harus direvisi atau jika terdapat beberapa ketidaksesuaian harus diganti. Alat evaluasi yang telah ditulis berdasarkan kisi-kisi dan diketahui telah sesuai dengan kriteria lembar telaah dapat dinyatakan sebagai telaah yang memenuhi validitas isi (content validity) sebuah alat tes. Validitas isi adalah validitas alat evaluasi yang harus terpenuhi dalam pengembangan alat evaluasi hasil pembelajaran.
Berikut adalah salah satu bentuk lembar telaah butir soal tes bentuk pilihan ganda. Namun, perlu dicatat bahwa lembar telaah memiliki beberapa model. Model-model itu biasanya menampilkan unsur-unsur kriteria (persyaratan) untuk tiap komponen, yaitu materi, konstruksi, dan bahasa, yang belum tentu sama. Tetapi, ada juga model yang tidak menyebut ketiga komponen itu. Namun, pada intinya tiap model menampilkan sederet persyaratan yang harus dipenuhi oleh tiap butir soal yang akan diujikan. Hasil telaah yang dilakukan sejawat harus ditindaklanjuti dengan revisi jika ada saran-saran perbaikan. Penulis soal harus berbesar hati jika diberi saran perbaikan.
4. Pelaksanaan Uji Coba
Jika semua persyaratan penyusunan butir soal telah selesai dilakukan, langkah berikutnya adalah melakukan uji coba alat evaluasi di kelas. Uji coba adalah pelaksanaan pengukuran dengan mempergunakan instrumen tes yang telah dikembangkan. Dari pelaksanaan pengukuran inilah diperoleh data empirik yang menunjukkan kualitas dan informasi tentang alat tes yang bersangkutan. Misalnya, informasi tentang efektivitas butir-butir soal (tingkat kesulitan, daya beda, butir pengecoh), validitas empirik, reliabilitas, dan lain-lain yang dibutuhkan. Agar hasil uji coba mampu memberikan informasi yang benar, pelaksanaannya harus dilakukan sedemikian rupa sehingga semua berjalan sesuai dengan harapan.
Uji coba alat tes ini amat dibutuhkan jika kita bermaksud menghasilkan alat tes yang benar-benar baik dan dapat dipertanggungjawabkan. Namun, untuk keperluan pengujian di kelas sendiri, uji coba tersebut sekaligus dimaknai sebagai pelaksanaan tes yang sebenarnya. Artinya, hasil ujian itulah yang dimaknai sebagai capaian peserta didik menguasai berbagai kompetensi yang dibelajarkan. Para guru, tampaknya, tidak melakukan uji coba terhadap alat tes yang dikembangkannya untuk mengukur capaian peserta didik sendiri.
5. Analisis Butir Soal dan Jawaban
Hasil uji coba alat tes memberikan data empirik untuk keperluan berbagai analisis kuantitatif untuk menilai kualitas alat tes yang bersangkutan dan/ atau melakukan tindak lanjut penilaian. Analisis kuantitatif yang dimaksud bermacam-macam yang pelaksanaanya tergantung kebutuhan, dan beberapa di antaranya adalah analisis butir soal dan analisis jawaban per indikator. Analisis butir soal amat diperlukan kita bermaksud mengembangkan alat evaluasi yang baik dan dapat dipertanggungjawabkan terutama jika kita bermaksud, misalnya menggunakannya dalam penelitian. Di pihak lain, analisis jawaban butir soal per indikator per kemampuan dasar dipergunakan sebagai masukan umpan balik pembelajaran.
a. Analisis Butir Soal
Analisis butir soal dapat pula dilakukan dengan mendasarkan pada teori pengukuran klasik dapat pula dengan teori pengukuran modern. Analisis butir soal untuk teori pengukuran klasik biasanya dilakukan untuk menghitung indeks tingkat kesulitan (ITK), indeks daya beda (IDB), dan efektivitas distraktor. Indeks tingkat kesulitan akan memberikan informasi tentang seberapa mudah atau sulit sebuah butir soal, indeks daya beda tentang daya sebuah butir membedakan kelompok tinggi dan kelompok rendah, sedangkan efektivitas distraktor tentang kemampuan distraktor untuk mengecoh peserta ujian.
Jika untuk keperluan penilaian kelas sendiri, teori pengukuran klasik lebih praktis digunakan para pengajar. Analisis butir soal dapat dilakukan secara manual dan lewat program komputer. Analisis yang mempergunakan komputer (program Iteman) sekaligus menghasilkan indeks reliabilitas Alpha Cronbach. Namun, apapun teori yang dijadikan dasar analisis, analisis butir soal memberikan informasi yang berharga tentang kualitas tiap butir soal yang diujicobakan. Berdasarkan informasi dari kerja analisis butir inilah kemudian dilakukan pernaikan-perbaikan seperlunya.
b. Analisis Jawaban
Analisis jawaban tidak lain adalah hasil pengukuran per indikator per kemampuan dasar yang dilakukan dengan menghitung jawaban benar dan salah peserta didik untuk seluruh butis soal yang diujikan. Analisis dimaksudkan untuk mengetahui kemampuan dasar mana saja yang sudah dikuasai peserta didik dan mana yang belum. Seorang peserta didik, misalnya, telah mampu menjawab dengan benar sebesar 80% dari seluruh butir soal yang diujikan dan sisanya yang 20% gagal dijawab dengan benar. Untuk mengetahui dengan pasti indikator dan kemampuan dasar mana saja yang sudah dikuasai dan sebaliknya diperlukan informasi tentang hal tersebut. hal itu berarti diperlukan kerja analisis jawabana per peserta didik per indikator per kemampuan dasar. Berdasarkan hasil telaah itu dapat ditentukan tindak lanjut yang akan diambil, apakah perlu adanya program remidial, pengayaan, atau akselerasi.
Sebuah indikator dan kemampuan dasar dinyatakan dikuasai oleh peserta didik jika tingkat penguasaannya minimal 75%. Jika indikator tertentu dan kemampuan dasar tertentu masih rendah tingkat ketercapaiannya, harus kembali dibelajarkan lewat program remidial. Peserta didik yang tingkat pencapaiannya masih di bawah standar minimal harus diberi program remidial, sedangkan yang sudah memenuhi diberi program pengayaan. Program remidial dapat bersifat individual atau klasikal jika hampir seluruh kelas masih belum mencapai tingkat penguasaan. Jadi, pada intinya adalah ada umpan balik pembelajaran berdasarkan hasil pengukuran sebelumnya, dan hal ini merupakan salah satu fungsi penilaian. Untuk itu, analisis jawaban soal ujian menjadi sebuah keniscayaan.
6. Perbaikan Butir Soal dan Perakitan Soal Ujian
Hasil kerja analisis butir soal memberikan informasi tentang kondisi tiap buti soal yang diujicobakan. Hasil kerja itu antara lain berupa informasi tentang butir-butir soal yang berindeks kesulitan memenuhi persyaratan dan yang tidak, berdaya beda cukup dan yang tidak, serta butir-butir pengecoh yang efektif dan yang kurang efektif. Bahkan, jika analisis dilakukan dengan komputer, masih banyak informasi lain yang diperoleh dan di antaranya yang amat penting adalah indeks reliabilitas dan kesalahan baku pengukuran. Berdasarkan informasi tersebut dapat dilakukan perbaikan terhadap butir-butir soal tertentu yang perlu diperbaiki, sedangkan yang sudah baik tidak perlu. Bahkan, terhadap butir-butir soal tertentu yang tidak memenuhi persyaratan harus dibuang dan diganti butir soal yang lain jika jumlah keseluruhan butir yang dibutuhkan kurang. Setelah butir-butir soal diperbaiki, butir soal tersebut dirakit untuk dijadikan sebuah perangkat tes yang jadi dan siap digunakan untuk keperluan pengujian.
7. Pelaksanaan Ujian
Setelah melewati berbagai langkah di atas, penyusunan alat tes sudah selesai dan tinggal kegiatan ujian, sesuai dengan temat dan waktu yang tentunya sudah direncanakan. Agar hasil pengukuran dapat memberikan hasil yang benar, pelaksanaannya harus dilakukan sebaik mungkin dengan pengawasan yang cermat, tetapi tidak mengganggu peserta ujian. Pelaksanaan ujian harus dilakukan dengan serius tetapi tidak menimbulkan tekanan bagi peserta didik.
8. Penafsiran Hasil Ujian
Pelaksanaan pengujian (setelah diskor) akan menghasilkan data empirik kuantitatif yang berwujud skor-skor untuk tiap peserta didik. Sejalan dengan proses penilaian, skor-skor tersebut ditafsirkan untuk memberikan makna capaian peserta didik. Paling tidak ada tiga makna yang dapat ditafsirkan dari hasil pengujian. Pertama, pemberian makna untuk menentukan nilai seorang peserta didik yang lazimnya diberikan dalam wujud angka atau huruf. Ada dua cara menafsirkan hasil ujian tersebut, yaitu berdasarkan pendekatan acuan kriteria dan pendekatan acuan norma. Namun, untuk menilai hasil belajar peserta didik yang lebih tepat adalah menggunakan acuan kriteria.
Kedua, skor seorang peserta didik dapat juga dimaknai sebagai seberapa banyak ia dapat menyerap, menguasai, atau melakukan berbagai kompetensi yang dibelajarkan. Jika seorang peserta didik mendapat skor 51 dari kemungkinan skor tertinggi 60, hal itu dapat dimaknai bahwa ia mampu menguasai materi pembelajaran sebesar 85%. Artinya, ia telah mencapai tingkat penguasaan. Ketiga, tinggi-rendahnya capaian peserta didik juga dapat diartikan sebagai keberhasilan atau kegagalan guru mereka. Tinggi-rendahnya capaian tersebut dapat dilihat dari rata-rata hitung peserta didik dalam satu kelas. Jika rata-rata hitung ≥75%, hal itu dapat ditafsirkan kelas yang bersangkutan telah mencapai penguasaan minimal.
Kesimpulan
Penilaian adalah proses memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang dipergunakan sebagai dasar pengambilan informasi. Dengan demikian, terdapat tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan.
Tujuan dan fungsi penilaian antara lain adalah untuk mengetahui kadar pencapaian tujuan, memberikan sifat objektivitas pengamatan tingkah-laku hasil belajar peserta didik, mengetahui kemampuan peserta didik dalam hal-hal tertentu, menentukan layak-tidaknya seorang peserta didk dinyatakan naik kelas atau lulus, dan untuk memberikan umpan-balik bagi kegiatan belajar-mengajar yang dilakukan.
Alat penilaian dapat dibedakan menjadi dua macam, teknik tes dan teknik nontes. Baik teknik tes maupun nontes keduanya dapat dimanfaatkan secara efektif jika dipergunakan secara tepat, dan itu tergantung dari tujuan penilaian.
Daftar Pustaka
Burhan Nurgiantoro. (1994). Penilaian dalam pengajaran bahasa dan sastra. Yogyakarta: BBFE-Yogyakarta.
Depdikbud. (1983). Penilaian dalam pendidikan. Jakarta: Dikti.
Abdul Ghofur. (2004). Pedoman umum pengembangan penilaian. Jakarta: Puskur.
Dali S. Naga. (1992). Pengantar teori skor pada pengukuran pendidikan. Jakarta: Gunadarma.
Ngalim Purwanto. (2002). Prinsip-prinsip dan teknik evaluasi pengajaran. Bandung: Remaja Rosdakarya.
Sumarna Surapranata. (2004). Panduan penulisan tes tertulis implementasi kurikulum 2004. Bandung: Remaja Rosdakarya.