Selasa, 22 Oktober 2013

Pendekatan dan Metode Pengajaran Bahasa sebagai Dasar Pengembangan Kurikulum

A.    Pengantar
Sampai tahun 1950-an pendekatan rancangan silabus yang diuraikan dalam bab I sebagian besar sudah cukup untuk mendukung pengajaran bahasa. Fokus pengajaran bahasa Inggris umumnya dalam kesulitan linguistik yaitu pada penggunaan tingkat kosakata. Bahasa Inggris diajarkan hanya pada struktur dan kosakata. Darian (1972, 94) mengomentari materi yang berpengaruh di Michigan yang diproduksi oleh Universitas Michigan, mengeluhkan:

Ada cara “contextual material”, yaitu memilih kalimat untuk latihan. Kalimat yang dipilih adalah kalimat yang sempurna, sedangkan ungkapan yang wajar, tetapi jarang ada kaitan dengan yang lain.

Zaman sekarang banyak pendekatan pengajaran bahasa yang disediakan, seperti pengadaan buku bahasa Inggris untuk perjalan dan perdagangan yang membicarakan beberapa topik, situasi, dan kalimat yang baik dan memfokuskan pada teknik berbahasa Inggris untuk pekerjaan. Tetapi akhirnya, tipe buku atau kursus bahasa yang secara kebetulan menjadi trend di pengajaran bahasa Inggris juga mengajarkan bahasa Inggris secara umum, atau kadang-kadang mengarah ke lain hal. Bahasa Inggris bukan hanya untuk tujuan khusus.

Guru dan peserta didik merupakan komponen utama dalam pembelajaran. Dalam pembelajaran, guru bertanggung jawab mengatur dan mengelola lingkungan sekolah dan pencapaian tujuan pendidikan sesuai arah yang diinginkan. Guru harus mampu mengelola seluruh proses kegiatan pembelajaran dengan menciptakan kondisi-kondisi belajar sedemikian rupa sehingga setiap peserta didik dapat belajar secara efektif dan efisien (Slameto, 2003: 98). Dalam menciptakan kondisi belajar yang kondusif tidak terlepas dari kemampuan guru dalam memilih pendekatan ataupun metode pembelajaran yang tepat yang sehingga dapat mengarahkan pembelajar pada tujuan yang telah ditetapkan.

Dalam bidang pengajaran, metode adalah rencana penyajian bahan secara menyeluruh dengan urutan yang sistematis berdasarkan pendekatan tertentu. Pendekatan adalah seperangkat asumsi korelatif yang menangani hakikat pengajaran dan pembelajaran bahasa. Metode merupakan rencana keseluruhan bagi penyajian bahan bahasa secara rapi dan tertib, bagian-bagiannya tidak ada yang berkontradiksi, dan kesemuanya itu didasarkan pada pendekatan terpilih.

B.    Pencarian Metode Baru
Pengajaran bahasa Inggris sebagai bahasa asing menjadi semakin berkembang setelah Perang Dunia ke II. Para imigran, pengungsi, dan mahasiswa asing yang membutuhkan kursus bahasa Inggris semakin meningkat di Inggris, Kanada, Amerika, dan Australia. Peran bahasa Inggris sebagai bahasa komunikasi internasional telah meluas secara cepat pada tahun 1950-an. Banyak mobilitas yang jauh lebih besar dari masyarakat sebagai akibat dari pertumbuhan perjalanan udara dan turis internasional. Pertumbuhan cepat bahasa Inggris sangat penting di dunia perdagangan internasional. Peran bahasa Inggris didukung oleh pertumbuhan radio, film, dan televisi. White (1988: 9) berkomentar:

Pada zaman pertengahan, bahasa Inggris adalah bahasa yang digunakan di daerah-daerah tertentu, sementara bahasa Prancis adalah bahasa negara. Pada abad keduapuluh, bahasa Inggris menjadi bahasa dunia berkat warisan linguistik dari Kerajaan Inggris, munculnya USA sebagai kekuatan terbesar English-Speaking, serta secara kebetulan berkembang pula industri dan teknologi di abad 19 dan 20.

Semua perkembangan ini mendukung perlunya pembelajaran praktis bahasa Inggris bagi orang-orang di berbagai belahan dunia. Penguasaan bahasa secara akademis mungkin bisa didapat salah satunya dalam kursus-kursus tertentu.

Respon awal dari profesi pengajaran bahasa Inggris adalah untuk mengeksplorasi arah baru dalam metodologi. Ini diasumsikan bahwa dalam rangka memenuhi perubahan kebutuhan pelajar bahasa, metode pengajaran yang lebih modern yang diperlukan adalah metode pengajaran yang mencerminkan pemahaman terbaru dari sifat bahasa dan pembelajaran bahasa. Linguistik adalah sumber teori tentang organisasi dan struktur bahasa yang diterapkan dalam penyebab baru "berbasis ilmiah" dalam metode pengajaran. Dalam makalah ini akan dijelaskan mengenai beberapa topik di antaranya adalah pendekatan struktural, pendekatan audiolingual, pergantian kebutuhan bagi bahasa asing di Eropa, English for specific purposes, pendekatan komunikatif, dan  munculnya pendekatan kurikulum dalam pengajaran bahasa.

C.    Pendekatan Struktural
Tahun 1950-an dan 1960-an pengajaran bahasa mulai mengembangkan adanya metode. Di Kerajaan Inggris Raya, para linguis mengembangkan metodologi di abad 20-an dan 30-an yang menghubungkan secara hati-hati tingkatan tata bahasa dan leksikal syllabus. Pendekatan itu memiliki ciri-ciri sebagai berikut.
  • Silabus yang terstruktur dengan tingkatan level kosakata.
  • Presentasi yang bermakna dengan struktur situasi untuk konteks pengajaran baru.
  • Aktivitas kegiatan kelas dengan metode PPP (Presentasi–Praktik– Produksi).
Pengajaran bahasa situasional, yaitu bahasa diajarkan dengan mempraktikkan atau melatih struktur-struktur dasar dalam kegiatan-kegiatan berdasarkan situasi yang bermakna. Titik pembelajarannya pada penguasaan bahasa lisan. Sebelum pembelajaran, diteliti terlebih dahulu persamaan dan perbedaan bahasa ibu dengan bahasa yang akan diajarkan, terutama persamaan dan perbedaan mengenai; bunyi-bunyi bahasa, perbendaharaan kata-kata, serta struktur kata dan kalimat.

Metode ini dikenal sebagai Pendekatan Situasi atau Pendekatan Struktural-Situasi atau Pendekatan Situasi Mengajar Bahasa. Metode ini kemudian menjadi metode paling mutakhir di lingkungan bahasa Inggris British sejak tahun 1950-an. Buku-buku kursus yang terkenal dengan metode ini adalah seri Robert O’Neill’s Kernal (Longman, 1978). Di negara-negara kolonial, seperti Singapura, administrasi “Kurikulum Bahasa Inggris di sekolah-sekolah menengah pada awal tahun 1950-an diikuti tradisi pengajaran bahasa Inggris di sekolah–sekolah Inggris, dengan fokus studi bahasa dan sastra” (Ho, 1994: 222). Diaplikasikan juga oleh negara koloni yang lain seperti Malaysia, India, dan Hongkong.

Tidak ada ketentuan untuk pekerjaan dan tata bahasa yang dirancang khusus untuk membantu para pelajar. Bahasa Inggris diajarkan di sekolah-sekolah sebagai subjek diskrit dan bertujuan untuk menyiapkan pengetahuan membaca bahasa Inggris siswa melalui studi tata bahasa Inggris dan teks yang dipilih serta menerapkan prinsip-prinsip tata bahasa seperti kosakata. Untuk pemahaman teks-teks tersebut diperlukan bantuan sebuah kamus dwibahasa (Ho, 1994: 222-226).

Kemudian metode ini digantikan oleh sebuah TESL (Teaching English as a Second Language) atau TEFL (Teaching English as a Foreign Language), yaitu pendekatan yang didasari pada silabus struktural dan situasi latihan berbasis metodologi. Pendekatan struktural silabus juga dipakai di Australia sebagai basis untuk mengajar program bahasa Inggris untuk para imigran sejak tahun 1950-an (Ozolins 1993).

D.    Metode Audiolingual
Audiolingual method atau metode audiolingual ini seringkali dinamakan Aural-Oral Approach atau Pendekatan Dengar-Ucap (Djunaidi, 1988: 40). Adapula yang menamakannya Mimicry-Memorization Method atau Metode Meniru-Menghapal. Kadang metode ini juga dikenal sebagai Informant-Drill Method. Metode ini mulai dikenal pada saat Amerika Serikat memasuki Perang Dunia II. Untuk melatih personilnya agar dapat menguasai bermacam-macam bahasa asing secara aktif dalam waktu yang singkat, angkatan darat Amerika Serikat dengan bantuan universitas menyelenggarakan program pengajaran bahasa asing di bawah program latihan khusus angkatan darat.

Pelajaran bahasa asing diberikan dengan sangat intensif dan menggunakan pendekatan aural-oral atau listening-speaking. Karena penyelenggara program sekolah bahasa ini adalah angkatan darat maka tidak mengherankan kalau metode yang digunakannya sering didengar dengan Army Method atau Metode Tentara. Hasil yang dicapai sangat mengesankan sehingga setelah perang berakhir banyak sekolah bahasa atau lembaga bahasa didirikan atas dasar sistem dan metode tersebut, baik di Amerika Serikat atau di negara-negara lain. 

Teori bahasa yang mendasari Aural-Oral Approach adalah teori linguistik struktural. Menurut teori ini bahasa adalah speech atau ujaran dan tulisan merupakan alata perekam bahasa. Ujaran terdiri atas pola-pola kalimat dasar atau struktur bahasa. Bahasa diajarkan melalui latihan-latihan lisan yang intensif dan sistematis dari pola-pola kalimat dasar. Tata urutan bahasa yaitu aural (listening) atau mendengarkan, kemudian oral (speaking) atau berbicara, selanjutnya reading atau membaca, dan writing atau menulis. 

Para penganut teori ini menganggap bahwa bahasa merupakan manifestasi dari tingkah laku manusia yang telah menjadi kebiasaan dan belajar bahasa asing pada hakikatnya adalah pembentukan kebiasaan-kebiasaan baru. Kebiasaan yang baik dibentuk dengan cara memberikan respon atau tanggapan yang benar dan bukannya pembuatan kesalahan. Kesalahan dapat dikurangi dengan latihan penggunaan pola-pola kalimat yang benar. Keterampilan berbahasa akan dipelajari dengan lebih efektif kalau penyajian lisan mendahului menyajian tulisan. Selanjutnya, analogi memberikan dasar yang lebih baik untuk belajar bahasa daripada analisis. Penjelasan tentang kaidah bahasa tidak diberikan sampai pelajar mendapat cukup latihan untuk dapat menarik kesimpulan secara analogis. Drills atau latihan-latihan memungkinkan pelajar menarik analogi yang benar. Karena itu pengajaran tata bahasa lebih bersifat induktif daripada deduktif.

Tujuan pengajaran bahasa pada tahap awal dipusatkan pada keterampilan mendengarkan dan berbicara. Secara bertahap keterampilan membaca diberikan berdasarkan apa yang telah dikuasi secara lisan dan keterampilan menulis diajarkan berdasarkan apa yang telah dibicarakan dan dibaca. Silabus metode audiolingual adalah silabus linguistik yang berisi pokok-pokok bahasan tentang fonologi, morfologi, dan sintaksis bahasa tersebut yang diatur berdasarkan urutan penyajiannya. Tata urutan pengajaran pola kalimat biasanya didasarkan pada prinsip bahwa pola kalimat sederhana diajarkan terlebih dahulu dari pola kalimat yang lebih kompleks.

Kegiatan belajar-mengajar di kelas sebagian besar terdiri dari dialog dan drill atau latihan-latihan. Dialog digunakan untuk memberikan konteks pola kalimat dan menggambarkan situasi penggunaannya dan mungkin juga aspek kebudayaan dari bahasa tersebut. Latihan yang digunakan ada beberapa macam, yaitu; pengulangan, perubahan bentuk kata yang diulang, penyempurnaan kalimat yang diberikan, perubahan kalimat, dan penggabungan dua kalimat menjadi satu. Metode audiolingual adalah metode yang berpusat pada guru, sedangkan teknik pengajarannya dipusatkan pada ketepataan ujaran. Penjelasan tentang kaidah bahasa diberi porsi sedikit. Bahasa asing yang diajarkan dipergunakan sebagai bahasa pengantar pelajaran.

Di Amerika pada tahun 1960-an, pengajaran bahasa juga di bawah kekuasaan kekuatan Metode Audiolingual. Stern (1974: 63), menjelaskan periode dari tahun 1958 s/d 1964 sebagai “Zaman keemasan aliran audiolingual.” Ini menarik pada karya linguistik struktural Amerika, yang menetukan dasar untuk silabus tata bahasa dan pendekatan pengajaran bahwa tarikan itu lebih ringan di teori aliran Behavioris. Belajar bahasa sudah dipelajari tergantung kelakuan yang dapat dibuktikan dengan cara pengulangan. Linguis Bloomfield (1942:12) menyatakan sebuah prinsip yang menjadi prinsip inti dari audiolingualism: teknik pengajaran yang memanfaatkan pengulangan dialog dan praktik sebagai dasar, untuk otomatisasi diikuti oleh latihan-latihan yang melibatkan pola belajar menransfer ke situasi baru. Rivers (1964) sebelumnya berasumsi tentang audiolingualism sebagai berikut.
  • Kebiasaan diperkuat oleh penguatan.
  • Kebiasaan bahasa asing dibentuk lebih efektif dengan memberikan jawaban yang benar, bukan membuat kesalahan.
  • Bahasa adalah perilaku dan perilaku dapat dipelajari hanya dengan mendorong pelajar untuk berperilaku.
Seri bahasa Inggris Lado (Lado, 1978) adalah didasari pendekatan ini. Metode yang serupa telah dikembangkan di Eropa dan dikenal menjadi metode Audiovisual Disebut metode Audiovisual karena menggunakan visual yang berarti menyajikan dan melatih jenis-jenis bahasa baru.

Daya tarik dengan metode dan pencarian metode yang terbaik menjadi sebuah keasyikan pengajaran bahasa untuk 20 tahun ke depan. Lange mengobservasi (1990: 253) mengungkapkan pernyataan sebagai berikut.

Pengajaran bahasa asing … memiliki orientasi dasar untuk metode mengajar. Sayangnya, “metodologi” baru ini menjadi menonjol tanpa banyak dikaji. Keprihatinan pada metode ini tentunya bukan karena ia adalah metode baru. Daya tarik metode ini berawal dari akhir 1950-an, ketika guru bahasa asing amatir dituntun untuk percaya bahwa ada metode untuk memperbaiki "masalah belajar-mengajar bahasa".

E.    Pergantian Kebutuhan bagi Bahasa Asing di Eropa
Unsur yang hilang dalam untuk metode baru adalah sejauh mana pertimbangan metode pengajaran diperuntukkan bagi kebutuhan pelajar. Jupp dan Hodlin mengangkat masalah ini  tahun 1975.

Peningkatan pengajaran bahasa Inggris (sejak pertengahan 1950-an) disertai pengenalan metode dan materi baru di kelas, terutama sekali sejak 1960-an. Perubahan ini sangat radikal dan dapat disebut pengajaran revolusi. Tapi revolusi ini sudah diikuti dengan situasi atau motivasi pelajar; mengenai bagaimana orang belajar dan apa bahasa itu… mempertimbangkan kenapa orang belajar bahasa kedua atau evaluasi hasil yang lebih ataupun kurang.

Tahun 1969, Konsul Eropa (daerah organisasi negara-negara Eropa memperkenalkan kebudayaan dan pendidikan), yang memperkenalkan pembelajaran bahasa asing yang lebih efektif, memutuskan bahwa:
  • pemahaman penuh akan tercapai antara negara-negara Eropa, jika rintangan bahasa antara mereka dapat dihapus,
  • perbedaan linguistik adalah bagian warisan kebudayaan dan itu harus melewati pelajaran bahasa modern, menambah sumber kekayaan intelektual daripada rintangan kesatuan,
  • hal di atas dapat terpenuhi jika studi mengenai bakan bahasa Eropa modern menjadi pengertian umum di Eropa. (Concil of Europe, 1969: 8).
Agar mendapat tanggapan, pertimbangan ini dapat didasari pada informasi sosial. Van Els, T. Bongaerts, G. Extra, C. Van Os, dan A. Janssen-van Dieten (1984, 159) mengajukan beberapa pertanyaan untuk mempertimbangkan waktu:
  • Apakah mempertimbangkan kepentingan semua anggota komunitas yang tahu bahasa asing ataukah hanya untuk tujuan profesional?
  • Berapa banyak bahasa, dan bahasa apa saja, yang dipelajari/ dibutuhkan?
  • Bagaimana permintaan untuk masing-masing bahasa? Apakah setiap orang membutuhkan keahlian yang sama, atau keahlian tingkat yang sama?
  • Apakah membutuhkan kestabilan pola?

F.    English for Specific Purposes
Berfokus untuk membuat kursus bahasa lebih relevan membutuhkan beberapa periode menjadi Languages for Specific Purposes (LSP), yang sekarang dikenal sebagai English for Specific Purposes (ESP). ESP berfokus pada berikut ini.
  • Kebutuhan dalam menyiapkan pertumbuhan jumlah mahasiswa berlatar belakang nonbahasa Inggris untuk belajar di kampus Amerika dan Inggris dari tahun 1950-an.
  • Kebutuhan dalam menyiapkan materi-materi untuk mengajarkan mahasiswa yang secara umum sudah mahir berbahasa Inggris, namun membutuhkan bahasa Inggris untuk dipakai dalam kepegawaian. Misalnya, mahasiswa yang bukan berlatar belakang bahasa Inggris dokter, namun sedang belajar/ bekerja di negara yang berbahasa Inggris sebagai perawat, Insinyur, atau peneliti.
  • Kebutuhan materi untuk orang yang membutuhkan bahasa Inggris dengan tujuan bisnis.
  • Kebutuhan untuk mengajarkan bahasa yang dibutuhkan untuk urasan pekerjaan pada para imingran.
Martin (1976, mengutip melalui Jordan, 1997: 53) mendeskripsikan daftar kosakata akademi ke dalam 3 kategori:
  1. Proses penelitian: kosakata pertama adalah kata kerja dan kata benda dan menyajikan di konteks yang mendiskusikan 5 langkah penelitian: bentuk, investigasi, menganalisis, menggambarkan kesimpulan, dan melaporkan hasil.
  2. Kosakata analisis: termasuk didalamnya frekuensi dan dua kata akta kerja dibutuhkan agar menyajikan informasi yang rapi. Contohnya, terdiri atas, hasil dari kelompok, menyimpulkan, dasar, dicatat untuk.
  3. Kosakata evaluasi: termasuk di dalamnya kata sifat dan kata keterangan yang ditinjau kembali, kritik, dan beberapa laporan.

Identifikasi pola sebuah teks organisasi fokus pada pendekatan ini. Hoey (1979, 1983) menguraikan, sebagai berikut.
1.    Pembukaan
a)    Menarik pemembaca langsung ke subjek atau masalah.
b)    Menjelaskan mengapa Anda menulis.
c)    Buktikanlah kepada pembaca dengan menunjukkan keyakinan, sikap, dan pengalaman.
2.    Latar belakang
a)    Jelaskan masalah alaminya, sejarah, dan penyebab.
b)    Jelaskan revelansi masalah pembaca,
keinginan dan alasan ketertarikan pada masalah penting kepada pembaca.
3.    Argumentasi
a)    Menyatakan premis mayor.
Termasuk di dalam informasi penting untuk membuat jelas dan dapat diterima.
b)    Menyatakan premis minor, dan termasuk di dalam informasi.
c)    Menyatakan kesimpulan.
d)    Tunjukkan posisi Anda lebih baik.
4.    Kesimpulan
a)    Jelaskan implikasi argumen Anda.
b)    Ringkaskan argument Anda: masalah, kesimpualn dan alasan-alasan untuk diterimanya.

G.    Communicative Language Teaching (CTL)
Communicative Language Teaching adalah pengajaran bahasa secara komunikatif (Djunaidi, 1988: 44).  Menurut pendekatan komunikatif ini tujuan pengajaran bahasa ialah untuk mengembangkan kemampuan komunikatif serta prosedur pengajaran keempat keterampilan berbahasa (mendengarkan, berbicara, membaca, dan menulis) yang mengakui interdependensi atau saling ketergantungan antara bahasa dan komunikatif. 

Pengajaran bahasa komunikatif  merupakan pendekatan yang luas untuk pengajaran bahasa. Pendekatan komunikatif difokuskan pada komunikasi sebagai prinsip organisasi pada pengajaran, serta difokus pada sistem ketatabahasaan pada bahasa. Pada tahun 1970-an merupakan periode ketika orang-orang menjadi lebih komunikatif.

Pada poin ini, hal yang terpenting adalah untuk menciptakan sebuah perubahan dalam pengajaran bahasa berdasarkan kebutuhan sosial dan kebutuhan pembelajar sebagai sebuah titik awal pada praevaluasi pengajaran bahasa. Ketika satu kebutuhan telah teridentifikasi, target pengajaran akan dapat diidentifikasikan.

Belajar bahasa pada hakikatnya adalah belajar komunikasi. Oleh karena itu, pembelajaran bahasa diarahkan untuk meningkatkan kemampuan pembelajar dalam berkomunikasi, baik lisan maupun tulis. Hal ini relevan bahwa kompetensi pembelajar bahasa diarahkan ke dalam empat subaspek, yaitu menyimak, membaca, berbicara, serta menulis. 

Pendekatan komunikatif memandang bahwa bahasa adalah sarana berkomunikasi. Adapun tujuan dari pendekatan ini adalah agar para pembelajar terampil berbahasa, dapat berkomunikasi dengan baik dalam bahasa sasaran. Munculnya pendekatan komunikatif disebabkan adanya ketidakpuasan dari para praktisi dan ahli terhadap pendekatan audiolingual, dikarenakan para pelajar setelah belajar beberapa tahun, tetap belum lancar berkomunikasi dalam bahasa target.

Pendekatan komunikatif adalah istilah yang umum tentang pendekatan yang bertujuan untuk melatih kompetensi komunikatif. Kompetensi komunikatif  yaitu kemampuan untuk berkomunikasi dengan tepat secara sosial tidak hanya membuat kalimat-kalimat yang benar secara gramatikal. Pendekatan komunikatif dimaksudkan agar para pembelajar pada akhirnya dapat menguasai seluruh komunikasi tanpa menganalisis bahasa menjadi satuan-satuan gramatikal atau unsur-unsur kebahasaan seperti pola kalimat, kosakata, dan sebagainya. Maka dari itu, dalam proses pengajarannya pun para peserta didik lebih banyak diberi pengayaan dalam pengalaman-pengalaman berkomunikasi. 

Pendekatan  pengajaran ini berusaha agar kejadian real di masyarakat dapat masuk ke dalam kelas (Yusman, 2010).  Dengan demikian  peserta didik dapat melihat dan mempraktikkan situasi real yang dimaksudkan. Contoh, dalam kelas bahasa, percakapan untuk membeli baju di sebuah toko menjadi sebuah kenyataan.  Artinya kelas tersebut sejauh mungkin dapat diubah seakan-akan menjadi toko mini, di mana peserta didik dapat melihat baju dan bertemu dengan seorang pedagang.

Pendekatan komunikatif berdasarkan pada teori bahasa yang menyatakan bahwa pada hakikatnya bahasa itu merupakan suatu sistem untuk mengekspresikan makna. Teori ini lebih memberi tekanan pada dimensi  semantik dan komunikatif dibandingkan pada ciri-ciri gramatikal bahasa. Oleh karena itu, dalam pembelajaran bahasa yang berdasarkan pada pendekatan komunikatif, menekankan pembelajar pada belajar berkomunikasi bukan menekankan pada pengetahuan tentang bahasa.

Kegiatan belajar dikembangkan dengan  mengarahkan pembelajar ke dalam komunikasi nyata. Pembelajar dituntut pula untuk menggunakan bahasa yang dipelajarinya. Teori belajar yang cocok untuk pendekatan ini adalah pemerolehan bahasa kedua secara alamiah. Teori ini beranggapan bahwa proses belajar bahasa lebih efektif apabila bahasa diajarkan secara informal melalui komunikasi langsung di dalam bahasa yang sedang dipelajari.

Perbedaan pokok antara metode audiolingual dan pendekatan komunikatif (Djunaidi, 1988: 44).
  • Metode audiolingual lebih menekankan struktur dan bentuk dari pada makna, sedangkan pendekatan komunikatif lebih menekankan makna dan fungsi daripada bentuk dan struktur.
  • Menurut metode audiolingual belajar bahasa bertujuan untuk menguasai sistem tata bunyi, tata bahasa, dan kosakata. Sedangkan menurut pendekatan komunikatif,  belajar bahasa bertujuan untuk mendapatkan kemampuan komunikatif.
  • Dalam metode audiolingual, guru berperan sebagai pengarah dan pengawas proses belajar. Sedangkan dalam pendekatan komunikatif guru berperan sebagai fasilitator dan motivator proses belajar. 
Communicative language teaching (CTL) adalah pendekatan pengajaran bahwa hasil dari fokus komunikasi sebagai organisasi utama untuk mengajar daripada fokus ke tata bahasa sistem bahasa. Wilkins menguraikan daftar komponen-komponen kemampuan komunikasi lebih efisien, yaitu sebagai berikut.
  1. Mempertimbangkan kemungkinan detail untuk tujuan sebagi target bahasa.
  2. Beberapa ide dijadikan setting ketika mereka ingin menggunakan target bahasa.
  3. Peran sosial akan mengasumsikan para pelajar untuk target bahas mereka.
  4. Acara komunikasi yang mana para partisipans dapat turut serta.
  5. Fungsi bahasa dalam acara komunikasi tersebut, apa yang para pelajar dapat lakukan dan sampaikan.
  6. Pengembanagn nosi.
  7. Keahlian kerjasama, bisa pidato atau keahlian teatrikal.
  8. Varietas target bahasaakan diperlukan dan level ini dalam kemampuan berbahasa bicara maupun menulis.
  9. Isi tata bahasa akan dibutuhkan.
  10. Isi leksikal akan dibutuhkan.

H.    Munculnya Pendekatan Kurikulum dalam Pengajaran Bahasa
Ada emapat pertanyaan yang paling fundamental yang harus dijawab mengenai perkembangan kurikulum dan rencana pembelajaran, sebagai berikut.
  1. Apa tujuan pendidikan yang harus sekolah cari untuk berhasil dalam mencapai tujuan?
  2. Apa pengalaman pendidikan dapat dijadikan tambahan tujuan untuk berhasil dalam mencapai tujuan?
  3. Bagaimana pengalaman pendidikan dapat efektif dan teroganisir?
  4. Bagaimana kita dapat menemukan tujuan untuk berhasil dalam mencapai tujuan? (Tyler,  1950: 1)
Model yang lebih sederhana, terlihat seperti berikut ini.

Maksud dan tujuan
Isi
organisasi
evaluasi

Nicholls dan Nicholls (1972, 4), menguraikan perkembangan kurikulum 4 tahap:
  1. Pemeriksaan cermat, menggambar pada semua sumber yang tersedia pengetahuan dan penilaian, tujuan pengajaran, baik dalam kursus mata pelajaran tertentu atau melalui kurikulum secara keseluruhan.
  2. Penggunaan pengembangan dan uji coba di sekolah-sekolah dari metode-metode dan materi yang dinilai paling suka untuk mencapai tujuan yang disepakati guru.
  3. Dalam penilaian sejauh mana pekerjaan pembangunan pada kenyataannya mencapai tujuannya. ini bagian dari proses dapat diharapkan untuk memprovokasi pemikiran baru tentang tujuan sendiri.
  4. Elemen terakhir adalah karena umpan balik dari semua pengalaman yang diperoleh, untuk memberikan titik awal untuk studi lebih lanjut.
Clark mengidentifikasi komponen proses pembaruan kurikulum sebagai berikut.
  1. Penelaahan terhadap prinsip-prinsip untuk memandu bahasa mengajar/ proses belajar dalam terang teori linguistik terapan dan pengalaman kelas.
  2. Dengan pengerjaan ulang silabus mewujudkan tujuan, sasaran, konten, dan metodologi yang luas.
  3. Meninjau kembali strategi kelas mengajar/ strategi pembelajaran.
  4. Pilihan, adaptasi, dan kreasi sumber mewujudkan pengalaman belajar yang sesuai.
  5. Meninjau kembali desain penilaian untuk memonitor, melaporkan, dan memberikan timbal balik kemajuan pembelajar.
  6. Meninjau kembali skema ruang kelas dan bekerjasama.
  7. Meninjau dan penciptaan desain strategi untuk membantu guru untuk mengevaluasi praktik kelas dan untuk meningkatkan mereka.
  8. Identifikasi daerah-daerah penelitian  untuk menentukan kemungkinan cara tercepat di setiap area.
  9. Meninjau kembali dan merancang pelayanan pendidikan yang dirancang untuk membantu para guru untuk memperluas basis konseptual dan pragmatis di bidang tertentu, dan untuk mencari solusi untuk masalah kelas mereka sendiri.
I.    Kesimpulan
Berdasarkan pemaparan makalah di atas, dapat disimpulkan bahwa beberapa pendekatan pembelajaran di atas dapat diaplikasikan dalam pembelajaran bahasa Indonesia.  Di antaranya adalah pendekatan struktural, pendekatan audiolingual, pendekatan  English for Specific Purposes (ESP) atau yang lebih umumnya disebut dengan Languages for Specific Purposes (LSP) untuk pengajaran bahasa Indonesia bagi penutur asing, serta pendekatan komunikatif. Dengan pengaplikasian berbagai pendekatan tersebut, diharapkan pembelajaran bahasa, khususnya bahasa Indonesia berlangsung lebih menyenangkan dan menghasilkan lulusan-lulusan yang berkompeten. Pendekatan serta berbagai metode pembelajaran juga harus selalu berkembang agar mutu pendidikan semakin baik. Berkembangnya pendekatan serta berbagai metode pembelajaran juga memengaruhi perubahan kurikulum yang tentunya mengarah pada perbaikan mutu pendidikan.

J.    Kajian Pustaka

Djunaidi. (1988). Pengembangan materi pengajaran Bahasa Inggris berdasarkan pendekatan linguistik konstransif (teori dan praktek). Jakarta: Depdikbud.

Richard, Jack J. (2001). Curriculum develpomen in language teaching. Cambridge: CambridgeUniversity Press.

Slameto. (2003). Belajar dan faktor-faktor yang mempengaruhinya. Jakarta : PT Rineka Cipta.


Disusun untuk Memenuhi Tugas
Mata Kuliah Kurikulum Pendidikan Bahasa Indonesia
yang Diampu oleh Prof. Dr. Haryadi

oleh:
Immawati Fitri Lestari
Devy Anggraeny Ina Mustafa
Eviana Katika Dewi Yuliati



Penilaian Bahasa: Informasi, Pertimbangan, dan Keputusan

Pengantar
Pendidikan dan pembelajaran pada hakikatnya merupakan suatu proses untuk mencapai sejumlah tujuan. Penilaian yang dimaksudkan untuk mengukur kadar pencapaian tujuan itu, yang dengan sendirinya juga harus merupakan suatu proses hendaknya dilakukan secara berkesinambungan selama berlangsungnya kegiatan pembelajaran. Pemahaman guru terhadap proses penilaian merupakan bagian penting dalam pelaksanaan pendidikan di sekolah. Selama ini, beberapa guru (pendidik) menilai hanya berdasarkan perasaan atau hanya mengandalkan observasi sehingga nilai yang dihasilkan cederung subjektif.

Pada hakikatnya, kegiatan penilaian yang dilakukan tidak semata-mata untuk menilai hasil belajar peserta didik saja, tetapi juga menilai berbagai faktor, antara lain kegiatan pengajaran yang dilakukan itu sendiri. Artinya, berdasarkan informasi hasil belajar dapat dijadikan umpan-balik terhadap pembelajaran yang dilakukan. Ketidakberhasilan ujian bukan semata-mata kegagalan peserta didik tetapi mungkin karena kegagalan pendidik dalam mengajar.

Hasil penilaian pendidik yang diberikan kepada peserta didik dipandang sebagai nasib bagi peserta didik itu sendiri. Artinya, peserta didik yang tidak mendapatkan nilai yang tinggi sulit untuk mendapatkan sekolah yang diinginkan karena lapangan pekerjaan dan sekolah tertentu menjadikan nilai sebagai ukuran. Profesionalisme pendidik dalam penilaian turut menjadi pendukung untuk menentukan nilai seobjektif mungkin. Dengan demikian, maka yang perlu dipahami oleh pendidik adalah hakikat penilaian dan fungsinya, tujuan pembelajaran dan penilaian, serta alat penilaian.

A.    Hakikat Penilaian dan Fungsinya
Penilaian berurusan dengan data kuantitatif dan kualitatif, sedangkan pengukuran yang hanya bagian penilaian itu selalu berhubungan dengan data kuantitatif. Penilaian memerlukan data kuantitatif dari pengukuran. Sebaliknya, pengukuran juga sangat terikat pada penilaian khusus yang berkaitan dengan masalah tujuan dan kriteria yang dipergunakan. Pengukuran dan penilaian ini dilakukan hanya dengan mengambil sampel tentang suatu hal yang akan diketahui karena tak mungkin mengukur semua kemampuan peserta didik, dan peserta didik sendiri tak mungkin menunjukkan semua kemampuannya dalam sebuah proses pengukuran.

Penilaian adalah proses memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang dipergunakan sebagai dasar pengambilan keputusan. Dengan demikian, terdapat tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan. Informasi memberikan data-data (baik kuantitatif maupun kualitatif) yang berguna untuk pembuatan pertimbangan. Pertimbangan dimungkinkan tepat jika informasi yang diperoleh dan interpretasi terhadapnya juga tepat. Pertimbangan adalah taksiran kondisi yang ada kini dan prediksi keadaan pada masa mendatang. Keputusan yang diambil berdasarkan kedua komponen tersebut adalah pilihan di antara berbagai arah tindakan atau sejumlah alternatif yang ada.

Langkah-langkah penilaian menurut Buchori (1972) adalah persiapan (berisi penetapan tujuan, aspek yang dinilai, metode, penyusunan alat, penetapan kriteria, dan frekuensi penilaian), pengumpulan data, pengolahan data hasil penilaian, penafsiran, dan penggunaan hasil. Langkah-langkah penilaian menurut Ten Brink (1974) terdiri tahap-tahap persiapan yang berupa pemerincian pertimbangan dan keputusan yang akan dibuat, informasi yang diperlukan dan pemanfaatan yang ada, penentuan waktu dan cara, dan penyusunan alat, tahap pengumpulan data yang diteruskan analisis terhadapnya, dan tahap penilaian yang berupa pembuatan pertimbangan dan keputusan, dan diteruskan dengan pembuatan laporan hasil penilaian.

Tujuan dan fungsi penilaian antara lain adalah untuk mengetahui kadar pencapaian tujuan, memberikan sifat objektivitas pengamatan tingkah laku hasil belajar siswa, mengetahui kemampuan siswa dalam hal-hal tertentu, menentukan layak tidaknya seorang siswa dinyatakan naik kelas atau lulus, dan untuk memberikan umpan-balik bagi kegiatan belajar-mengajar yang dilakukan.

B.    Tujuan Pembelajaran dan Penilaian
Tujuan pembelajaran dan penilaian yang memberi arah dan pegangan yang jelas, memaksa kita untuk berpijak pada kenyataan dan berpikir secara konkret. Bagi pendidik, pembelajaran dan penilian akan membantu untuk memilih bahan, metode, teknik, dan alat penilaian. Bagi peserta didik, ia dapat dimanfaatkan sebagai pengorganisator dan kerangka kerja untuk memperoleh ilmu.

Tujuan pembelajaran dan output hasil belajar adalah dua hal yang erat berkaitan. Tujuan menyarankan bentuk-bentuk tertentu output pembelajaran, sebaliknya, tingkah laku keluaran belajar merupakan realisasi pencapaian tujuan. Output pembelajaran, oleh Gagne, dibedakan dalam bentuk keterampilan intelektual (yang berisi kemampuan membedakan, konsep, aturan, dan aturan tingkat tinggi), strategi kognitif, informasi verbal, keterampilan motor, dan sikap. Pembagian Bloom yang terkenal dengan sebutan taksonomi Bloom yang terdiri atas aspek kognitif, afektif, dan psikomotor banyak diikuti orang, termasuk kurikulum di Indonesia.

Proses identifikasi tujuan khusus merupakan proses analisis dan identifikasi output pembelajaran. Tujuan khusus menyaran pada tingkah laku output pembelajaran yang operasional, artinya mudah diamati diukur dengan alat penilaian. Tiap tujuan khusus harus mengandung unsur sasaran, tingkah laku yang diharapkan, kondisi sewaktu dinilai, dan kriteria keberhasilan. Tidak seperti halnya tujuan umum, tujuan khusus memiliki cakupan bahan yang terbatas.

Penyusunan alat penilaian harus mendasarkan diri pada tujuan agar dapat berfungsi sebagaimana mestinya. Alat penilaian dikatakan memenuhi kriteria kelayakan jika dapat mengukur output yang konsisten dengan tujuan. Tujuan akan menentukan tingkah laku guru dan murid dan bentuk output yang terukur.

Bahan pembelajaran merupakan pengantara tujuan dan alat penilaian. Dengan kata lain, ia merupakan sarana tercapainya tujuan dan sumber penyusunan alat penilaian. Karena bahan pembelajaran memegang peranan penting, ia perlu dideskripsikan secara terinci karena hal itu juga dapat dimanfaatkan untuk menguji kesahihan isi alat penilaian itu sendiri.

C.    Alat Penilaian
Ada dua macam alat penilaian yaitu, teknik tes dan teknik nontes. Baik teknik tes maupun nontes keduanya dapat dimanfaatkan secara efektif jika dipergunakan secara tepat, dan itu tergantung dari tujuan penilaian. Teknik nontes misalnya berupa kegiatan kuesioner, wawancara, pengamatan, dan pengukuran kecenderungan tertentu dengan mempergunakan skala. Skala merupakan suatu kesatuan sebagai penanda unit-unit yang bersifat angka yang disusun secara berjenjang. Tiap jenjang melambangkan sikap dan keyakinan tertentu.

Teknik wawancara baik secara bebas maupun terpimpin, dalam kaitannya dengan penilaian kebahasaan, dapat dipergunakan juga untuk menilai keterampilan, kelancaran, dan kefasihan berbicara siswa dalam bahasa yang diajarkan. Kegiatan pengamatan baik yang berstruktur maupun tak berstruktur dapat dimanfaatkan untuk menilai tingkah laku hasil belajar bahasa peserta didik yang terlihat dalam kegiatan sehari-hari. Tingkah laku dalam situasi seperti itu bersifat wajar, tidak dibuat-buat, dan lebih mencerminkan keadaan yang sesungguhnya.
Tes adalah seperangkat tugas atau pertanyaan yang dipergunakan untuk mengukur keterampilan, pengetahuan, intelegensi, kemampuan, atau bakat yang dimiliki seseorang atau kelompok. Dan segi jawaban siswa, tes dapat dibedakan ke dalam tes perbuatan dan tes verbal. Tes buatan pendidik disusun berdasarkan tujuan-tujuan khusus dan deskripsi bahan yang disusun guru untuk mengukur keberhasilan siswa mencapai tujuan, jadi yang terpenting dapat dipertanggung­jawabkan dari jenis kesahihan isi. Tes buatan guru biasanya tingkat ketepercayaannya rendah atau tak diketahui.

Tes standar disusun berdasarkan tujuan-tujuan umum seperti yang terdapat dalam kurikulum. Oleh karena telah mengalami beberapa kali uji coba dan revisi, tes standar dapat dipertanggungjawabkan dari segi kelayakan, kesahihan, ketepercayaan, dan ketertafsiran. Tes standar berguna untuk melengkapi informasi tertentu tingkat hasil belajar peserta didik, membuat perbandingan prestasi peserta didik, dan berfungsi diagnostik.

Tes kemampuan awal dapat dibedakan menjadi pretes, yang dimaksudkan untuk mengetahui kemampuan peserta didik sebelum mengalami proses belajar, tes prasyarat, yang dimaksudkan untuk mengetahui kemampuan tertentu disyaratkan untuk masuk pendidikan tertentu, dan tes penempatan yang dimaksudkan untuk menempatkan siswa sesuai dengan kemampuannya.

Tes diagnostik dimaksudkan untuk menemukan kelemahan-kelemahan peserta didik dalam hal tertentu untuk kemudian diremidi. Tes formatif dimaksudkan untuk mengukur kadar keberhasilan peserta didik mencapai tujuan, yaitu berkaitan dengan pokok bahasan yang baru saja diselesaikan dalam proses belajar-mengajar. Bagi pendidik, tes formatif dapat untuk menilai efektivitas pengajaran, sedang bagi peserta didik dapat berfungsi sebagai penguat.

Tes sumatif dimaksudkan untuk mengukur kadar pencapaian peserta didik terhadap tujuan umum, yang meliputi seluruh bahan yang diprogramkan pada periode tertentu. Informasi tes sumatif dipergunakan untuk menentukan prestasi peserta didik, naik-tidak dan atau lulus­tidak-nya seorang peserta didik, serta untuk membuat laporan kepada pihak tertentu.

Tes esai merupakan tes proses berpikir yang melibatkan aktivitas kognitif tingkat tinggi, menuntut kemampuan peserta didik untuk menerapkan pengetahuan, menganalisis, menghubungkan konsep-kon­sep, menilai, dan memecahkan masalah. Kelemahan pokok tes esai adalah rendahnya kadar kesahihan dan ketepercayaan akibat terbatasnya sampel bahan, jawaban peserta didik yang bervariasi, dan penilaian yang bersifat subjektif. Untuk mengurangi sifat subjektif dalam penilaian, perlu ditentukan kriteria penilaian yang menyangkut isi, organisasi, proses, kesimpulan dan alasan dengan bobot yang tidak harus sama.

Tes objektif menghendaki hanya satu jawaban yang benar, maka penilaiannya dapat secara objektif, cepat, dan dapat dipercaya. Karena jumlah soal relatif banyak, tes objektif dapat mencakup bahan secara lebih menyeluruh. Tes objektif yang baik tidak mudah disusun, memerlukan waktu lama, dan ada kecenderungan pendidik hanya terpusat pada pokok bahasan dan tingkatan aspek kognitif tertentu. Dalam mengerjakannya, siswa dapat bersifat untung-untungan.

Tes objektif dapat berupa benar-salah, pilihan ganda, melengkapi, dan penjodohan. Tes benar-salah bisa dipakai karena hasil belajar yang berupa penguasaan pengetahuan verbal yang dinyatakan dalam bentuk proposisi dapat dinyatakan secara benar atau salah. Tes pilihan ganda merupakan tes benar-salah dengan pernyataan salah lebih banyak. Tes isian adalah tes pilihan ganda tapi siswa mengisi sendiri pilihan yang benar, sedang penjodohan semua pernyataan yang benar ditunjukan sekaligus.

Tes yang baik adalah yang dapat dipertanggungjawabkan dari segi kelayakan (appropriateness), kesahihan (validity), ketepercayaan (reliability), efektivitas butir soal, dan kepraktisan (practicality). Kelayakan tes berkaitan dengan masalah apakah suatu tes dapat mengukur output hasil belajar yang konsisten dengan tujuan; apakah semua tujuan telah memiliki alat ukur yang sesuai; apakah jumlah butir soal per tujuan telah mencerminkan kadar pentingnya tujuan; dan apakah semua butir soal telah mengacu ke tujuan tertentu.

Butir-butir tes harus mencerminkan materi pelajaran yang diajarkan. Semua bahan yang diajarkan perlu diambil tesnya, dan sebaliknya, tes harus hanya terbatas pada bahan yang diajarkan. Untuk memudahkan pengecekan hal itu, pembuatan soal hendaknya mendasarkan diri pada tabel spesifikasi. Kelayakan tes dalam hal ini, merupakan salah satu jenis kesahihan, kesahihan isi.

Kesahihan tes menunjuk pada pengertian apakah suatu tes dapat mengukur apa yang akan diukur. Tes yang sahih akan dapat membedakan siswa yang memang berkemampuan yang lebih baik daripada yang sebaliknya. Kesahihan tes yang baik akan mengungkap semua tingkatan aspek kognitif, dan tidak hanya terbatas pada beberapa tingkatan kognitif yang sederhana saja.

Kesahihan tes dibedakan berdasarkan analisis rasional, kesahihan isi dan konstruk atau konsep, dan berdasarkan data empirik, serta kesahihan kriteria atau ukuran. Kesahihan isi menunjuk pada pengertian apakah suatu tes mempunyai kesejajaran dengan tujuan deskripsi bahan yang diajarkan. Tujuan dan bahan biasanya dikembalikan kepada kurikulum, maka kesahihan isi disebut juga sebagai kesahihan kurikuler. Di pihak lain, kesahihan konstruk menunjuk pada pengertian apakah tes yang disusun telah sesuai dengan konstruk ilmu bidang studi yang diteskan. Kesahihan ukuran mempermasalahkan seberapa jauh peserta didik yang sudah diajar dalam bidang tertentu mempunyai kemampuan yang tinggi daripada yang belum diajar. Jika subjeknya sama, membandingkan hasil belajar itu dapat mendasarkan diri pada hasil pretes dan postes.

Pengujian kesahihan dalam berbagai jenis di atas merupakan pengujian kesahihan secara keseluruhan. Pengujian tingkat kesahihan dapat dilakukan secara per butir soal, yaitu dengan mengorelasikan skor-skor tiap butir tes dengan skor keseluruhan. Tes yang kesahihannya tinggi, biasanya tinggi pula kesahihan butir­butirnya, walau mungkin terdapat beberapa butir tes yang kurang sahih.

Ketepercayaan tes menunjuk pada pengertian apakah suatu tes dapat mengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu. Konsisten berarti (i) tes dapat memberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (ii) jawaban siswa terhadap butir-butir tes relatif tetap, (iii) hasil tes diperiksa siapa pun menghasilkan skor yang kurang lebih sama.

Hasil pengukuran tidak hanya mencerminkan berapa banyak peserta didik berhasil dalam belajar, tetapi juga bagaimana keakuratan tes itu sendiri. Keakuratan tes akan memengaruhi skor yang diperoleh siswa, maka skor itu tidak akan secara sempurna mencerminkan kemampuan yang sebenarnya. 

Pengujian reliabilitas tes dengan teknik bentuk paralel dilakukan dengan menyediakan dua perangkat tes yang bersifat paralel atau ekuivalen. Setelah kedua perangkat tes itu dicobakan, hasilnya dikorelasikan. Untuk meningkatkan keterpercayaan butir tes, hendaknya dibuat butir-butir tes yang secukupnya. Butir tes yang semakin banyak akan semakin mempertinggi tingkat ketepercayaan tes, walau se­telah dalam jumlah tertentu peningkatan itu kecil.

Peningkatan ketepercayaan tes juga dilakukan dengan memilih butir-butir soal yang indeks tingkat kesulitan dan daya bedanya memenuhi persyaratan. Untuk keperluan ini, kita perlu melakukan analisis butir soal. Bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami, tidak bersifat ambigu, dan tidak membingungkan, agar tidak menimbulkan kesalahpahaman.

Kondisi pelaksanaan tes harus dikontrol sebaik-baiknya agar hal itu tidak memengaruhi penampilan peserta didik. Dalam memeriksa pekerjaan peserta didik, kita harus menghindari sifat subjektivitas diri, terutama dalam tes esai. Oleh karena itu, sebelum memeriksa pekerjaan peserta didik hendaknya membuat pedoman penilaian.

Analisis butir adalah analisis hubungan antara skor-skor butir soal dengan skor keseluruhan, membandingkan jawaban peserta didk terhadap suatu butir soal dengan jawaban terhadap keseluruhan tes. Tujuan analisis adalah membuat tiap butir tes konsisten dengan keseluruhan tes dan menilai efektivitas tes sebagai alat pengukuran.
Analisis butir dilakukan untuk mencari indeks tingkat kesulitan, daya beda, dan efektivitas distraktor. Butir soal yang baik adalah yang tidak terlalu sukar atau terlalu mudah yang indeksnya berkisar antara 0,20 sampai dengan 0,80, yang mampu membedakan antara peserta kelompok kelompok tinggi dan rendah yang indeks daya bedanya paling tidak sebesar 0,20 serta semua distraktor yang disediakan dipilih.

Penghitungan indeks tingkat kesulitan dan daya beda dapat dilakukan dengan mempergunakan tabel analisis butir soal. Untuk maksud ini, kita harus mencapai proporsi jawaban betul kelompok tinggi dan kelompok rendah, baru kemudian mengkonsultasikannya kepada tabel. Butir soal yang indeks tingkat kesulitan dan daya bedanya tidak memenuhi persyaratan disarankan untuk direvisi.

Distraktor seharusnya dipilih oleh siswa kelompok rendah secara lebih banyak. Jika terjadi sebaliknya, kelompok tinggi yang lebih banyak memilih, atau ada distraktor yang tak dipilih, distraktor yang bersangkutan disarankan untuk direvisi. Tingkat ketepercayaan tes esai dihitung dengan rumus alpha, sedang indeks tingkat kesulitan serta indeks daya bedanya dicari dengan mempergunakan rumus yang berbeda dengan tes objektif.

Sebuah tes yang baik di samping layak, sahih, dan tepercaya, juga harus memenuhi kriteria kepraktisan. Kriteria kepraktisan dapat dilihat dari segi keekonomisan, kemudahan pelaksanaan, penskoran, dan penafsiran. Sebagai bagian dari kegiatan pembelajaran, penilaian adalah sebuah proses yang melibatkan banyak aspek yang saling terkait. Pelaksanaan penilain yang baik harus dilakukan secara terencana dengan baik yang melibatkan komponen terkait. Hal ini dimaksudkan agar penilaian dapat dipertanggungjawabkan hasilnya sehingga dapat dimanfaatkan sesuai dengan keperluan. Untuk itu, kegiatan pengembangan alat penilaian perlu mengikuti langkah-langkah sebagi berikut. Alat penilaian yang dimaksud dapat berupa ujian semester, tengah semester, atau untuk keperluan yang lain.

1.    Penentuan Spesifikasi Ujian
Dalam penentuan spesifikasi ujian (tes) ini paling tidak terdapat empat hal yang perlu dilakukan, yaitu penentuan kompetensi dasar, pembuatan deskripsi bahan uji, pembuatan kisi-kisi, dan penentuan bentuk soal dan lama (waktu) ujian.
a.    Penentuan Kompetensi Dasar
Semua kegiatan pengujian pasti dimaksudkan untuk mencapai tujuannya. Dalam kaitannya dengan kegiatan pembelajaran, ujian dimaksudkan untuk mengukur seberapa banyak peserta didik dapat mencapai kompetensi yang dibelajarkan atau dipelajari. Kompetensi yang diukur kadar capaiannya adalah kompetensi dasar, dan kompetensi dasar itu dijabarkan dari standar kompetensi. Dalam kurikulum yang digunakan, yaitu Kurikulum Tingkat Satuan Pendidikan (KTSP), pengujian dilakukan dengan berangkat dari kompetensi dasar. Standar kompetensi dan kompetensi dasar telah dituliskan pada kurikulum. Dalam pelajaran Bahasa dan Sastra Indonesia, standar kompetensi dikaitkan dengan keempat lemampuan berbahasa, yaitu menyimak, membaca, berbicara, dan menulis, serta kesastraan sehingga kompetensi dasar juga akan terkait pokok-pokok bahasan tersebut. kompetensi dasar mana saja yang akan diujikan dalam sebuah ujian tinggal mengambil dari kurikulum.
b.    Pembuatan Deskripsi Bahan Uji
Jika kompetensi dasar yang akan ditagih capaiannya telah jelas, pengembangan bahan ajar yang akan dibelajarkan untuk meraih kompetensi yang dimaksud akan relatif mudah dilakukan. Pembuatan deskripsi bahan ajar yang meliputi materi pokok dan uraian materi haruslah dilakukan untuk memastikan bahan ajar apa saja yang akan diujikan. Sebetulnya, dalam pembuatan rencana program pembelajaran (RPP) tentunya deskripsi bahan ajar yang dimaksud juga telah dilakukan. Dengan demikian, dalam rangkaian pengembangan alat pengujian, kita tinggal menunjuk kembali bahan-bahan yag telah disebut RPP itu.
c.    Pembuatan Kisi-kisi Pengujian
Pengembangan alat pengujian harus mengukur semua kompetensi dasar (yang tercermin dalam bahan ajar dan indikator) secara proporsional terhadap semua kompetensi dasar yang diujikan. Proporsional tidak dimaknakan sma persis jumlah butir soal untuk tiap indikator, melainkan berdasarkan pertimbangan tertentu, misalnya pentingnya sebuah kompetensi dasar untuk mendukung capaian standar kompetensi atau diperlukan untuk mendukung capaian konpetensi yang lain. Agar kegiatan pengembangan dapat dilakukan dengan baik dan dapat dipertanggungjawabkan, pembuatan butir-butir soal harus mendasakran diri pada kisi-kisi yang sengaja dirancang untuk maksud itu. Dengan kata lain, sebelum menulis butir-butir soal, terlebih dahulu harus membuat kisi-kisi. Kisi-kisi itulah yang harus dijadikan acuan menulis butir-butir soal.
d.    Penentuan Bentuk Soal dan Lama Ujian
Selanjutnya harus juga direncanakan bentuk soal yang akan dipilih, misalnya apakah bentuk objektif dengan segala subjenisnya (pilihan ganda, benar-salah, pejodohan, isian singkat), uraian objektif, uraian esai (nonobjektif), atau gabungan dari beberapa bentuk tersebut. dalam ujian akhir di sekolah,pilihan yang banyak dilakukan adalah soal objektif pilihan ganda. Selain itu, untuk menentukan berapa jumlah butir soal yang akan diujikan, harus memperhitungkan waktu yang tersedia. Lama waktu ujian menentukan berapa banyak soal yang mesti dibuat. Kiranya tidak bijaksana jika waktu yang tersedia relatif pendek, tetapi jumlah butir soal yang dibuat banyak. Demikian pula sebaliknya. Untuk itu, perlu dibuat perkiraan berapa lama waktu yang diperlukan untuk mengerjakan tiap butir soal sehingga antara keduanya terdapat kesesuaian.

2.    Penulisan Butir Soal
Penulisan butir soal tidak lain adalah membuat tagihan sesuai dengan tuntutan indikator dan yang sesuai pula dengan bahan ajar. Jadi, butir-butir soal haruslah cocok dengan bunyi “tuntutan” indikator yang bersangkutan sebagaimana tercermin pada kata kerja operasionalnya. Misalnya, jika indikator menuntut peserta didik untuk mampu menulis, maka mereka harus benar-benar berunjuk kerja menulis, dan tidak sekadar memilih. Secara umum, penulisan butir-butir soal harus mendasarkan diri pada kisi-kisi yang telah dibuat sebelumnya. Selain terkait dengan tuntutan tiap indikator, penulisan itu juga terikat dengan bentuk soal, jumlah soal per indikator, dan jumlah keseluruhan butir soal. Yang pasti, ketika menulis butir-butir soal juga melihat rambu-rambu yang digunakan untuk telaah butir soal agar tidak banyak revisi.

3.    Penelaahan Butir Soal
Kebiasaan yang sering terlihat adalah begitu guru selesai menulis soal, baik untuk ujian tengah semester, akhir semester, atau untuk tagihan yang lain, akan langsung diujikan kepada peserta didik tanpa melakukan telaah terlebih dahulu terhadap alat tes yang bersangkutan. Kebiasaan itu, walaupun terlihat praktis, sebenarnya kurang baik dan kurang dapat dipertanggungjawabkan. Hal itu disebabkan alat tes yang ditulis tersebut belum tentu memenuhi berbagai tuntutan butir soal yang baik yang meliputi unsur materi, konstruksi, maupun bahasa. Padahal, sebagai alat uji keberhasian pembelajaran, agar hasilnya dapat dipertanggungjawabkan, ia harus memenuhi persyaratan sebagai alat tes yang baik.

Untuk memastikan bahwa butir-butir soal yang ditulis telah memenuhi tuntutan soal yang baik, sebelum diujicobakan  haruslah terlebih dahulu dilakukan telaah butir soal. Dengan telaah butir soal akan ditemukan berbagai kesalahan atau kekeliruan yang dapat mengganggu, dan sebaliknya, juga dapat dipastikan kualitas butir soal yang bersangkutan. Jika terdapat sejumlah kesalahan, kekeliruan, dan kekurangtepatan akan dapat dilakukan revisi, pembenahan-pembenahan yang diperlukan. Penelaahan sebaiknya dilakukan oleh orang lain yang ahli di bidangnya (sekaligus berfungsi sebagai “penilai”, expert judgement) atau oleh sejawat. Jika telaah dilakukan oleh penulis soal sendiri, biasanya kurang teliti karena penulis boleh jadi hanya “membaca” yang ada di konsep pikiran dan bukan yang di atas kertas.

Penelaahan butir soal dapat disebut juga sebagai telaah kualitatif-redaksional. Kegiatan ini mengandalkan pertimbangan logika, baik yang menyangkut logika keilmuwan (materi), logika penyusunan butir soal (konstruksi), maupun cara membahasakan soal (bahasa). Itulah sebabnya penelaah haruslah dilakukan oleh orang yang ahli di bidang atau sebidang dengan mata pelajaran yang bersangkutan. Dengan demikian, jika terjadi kesalahan atau kekeliruan yang terkait dengan latar keilmuwan, ia dapat mengritisi dan menyarankan revisi. Penelaahan harus dilkukan secara cermat dan objektif.  Jika  dimungkinkan, penelaahan sebaiknya dilakukan oleh lebih dari satu orang sehingga dapat saling melengkapi.

Penelaahan biasanya mempergunakan lembar telaah yang telah disiapkan, dan paling lazim adalah untuk soal objektif bentuk pilihan ganda. Lembar telaah yang dimaksud berisi penyataan-pernyataan yang harus terpenuhi oleh tiap butir soal yang secara garis besar berisi tiga tuntutan dari segi materi, konstruksi, dan bahasa. Tiap aspek dijabarkan menjadi sejumlah pernyataan. Kegiatan penelaahan dilakukan dengan mencermati tiap butir soal dan mencocokkannya dengan butir-butir kriteria pada lembar telaah. Jika sesuai dengan kriteria diberi tanda contreng (√) dan jika sebaliknya diberi tanda hubung (-). Butir-butir yang memunyai ketidaksesuaian dengan tuntutan kriteria harus direvisi atau jika terdapat beberapa ketidaksesuaian harus diganti. Alat evaluasi yang telah ditulis berdasarkan kisi-kisi dan diketahui telah sesuai dengan kriteria lembar telaah dapat dinyatakan sebagai telaah yang memenuhi validitas isi (content validity) sebuah alat tes. Validitas isi adalah validitas alat evaluasi yang harus terpenuhi dalam pengembangan alat evaluasi hasil pembelajaran.

Berikut adalah salah satu bentuk lembar telaah butir soal tes bentuk pilihan ganda. Namun, perlu dicatat bahwa lembar telaah memiliki beberapa model. Model-model itu biasanya menampilkan unsur-unsur kriteria (persyaratan) untuk tiap komponen, yaitu materi, konstruksi, dan bahasa, yang belum tentu sama. Tetapi, ada juga model yang tidak menyebut ketiga komponen itu. Namun, pada intinya tiap model menampilkan sederet persyaratan yang harus dipenuhi oleh tiap butir soal yang akan diujikan. Hasil telaah yang dilakukan sejawat harus ditindaklanjuti dengan revisi jika ada saran-saran perbaikan. Penulis soal harus berbesar hati jika diberi saran perbaikan.

4.    Pelaksanaan Uji Coba
Jika semua persyaratan penyusunan butir soal telah selesai dilakukan, langkah berikutnya adalah melakukan uji coba alat evaluasi di kelas. Uji coba adalah pelaksanaan pengukuran dengan mempergunakan instrumen tes yang telah dikembangkan. Dari pelaksanaan pengukuran inilah diperoleh data empirik yang menunjukkan kualitas dan informasi tentang alat tes yang bersangkutan. Misalnya, informasi tentang efektivitas butir-butir soal (tingkat kesulitan, daya beda, butir pengecoh), validitas empirik, reliabilitas, dan lain-lain yang dibutuhkan. Agar hasil uji coba mampu memberikan informasi yang benar, pelaksanaannya harus dilakukan sedemikian rupa sehingga semua berjalan sesuai dengan harapan.

Uji coba alat tes ini amat dibutuhkan jika kita bermaksud menghasilkan alat tes yang benar-benar baik dan dapat dipertanggungjawabkan. Namun, untuk keperluan pengujian di kelas sendiri, uji coba tersebut sekaligus dimaknai sebagai pelaksanaan tes yang sebenarnya. Artinya, hasil ujian itulah yang dimaknai sebagai capaian peserta didik menguasai berbagai kompetensi yang dibelajarkan. Para guru, tampaknya, tidak melakukan uji coba terhadap alat tes yang dikembangkannya untuk mengukur capaian peserta didik sendiri.

5.    Analisis Butir Soal dan Jawaban
Hasil uji coba alat tes memberikan data empirik untuk keperluan berbagai analisis kuantitatif untuk menilai kualitas alat tes yang bersangkutan dan/ atau melakukan tindak lanjut penilaian. Analisis kuantitatif yang dimaksud bermacam-macam yang pelaksanaanya tergantung kebutuhan, dan beberapa di antaranya adalah analisis butir soal dan analisis jawaban per indikator. Analisis butir soal amat diperlukan kita bermaksud mengembangkan alat evaluasi yang baik dan dapat dipertanggungjawabkan terutama jika kita bermaksud, misalnya menggunakannya dalam penelitian. Di pihak lain, analisis jawaban butir soal per indikator per kemampuan dasar dipergunakan sebagai masukan umpan balik pembelajaran.

a.    Analisis Butir Soal
Analisis butir soal dapat pula dilakukan dengan mendasarkan pada teori pengukuran klasik dapat pula dengan teori pengukuran modern. Analisis butir soal untuk teori pengukuran klasik biasanya dilakukan untuk menghitung indeks tingkat kesulitan (ITK), indeks daya beda (IDB), dan efektivitas distraktor. Indeks tingkat kesulitan akan memberikan informasi tentang seberapa mudah atau sulit sebuah butir soal, indeks daya beda tentang daya sebuah butir membedakan kelompok tinggi dan kelompok rendah, sedangkan efektivitas distraktor tentang kemampuan distraktor untuk mengecoh peserta ujian.

Jika untuk keperluan penilaian kelas sendiri, teori pengukuran klasik lebih praktis digunakan para pengajar. Analisis butir soal dapat dilakukan secara manual dan lewat program komputer. Analisis yang mempergunakan komputer (program Iteman) sekaligus menghasilkan indeks reliabilitas Alpha Cronbach. Namun, apapun teori yang dijadikan dasar analisis, analisis butir soal memberikan informasi yang berharga tentang kualitas tiap butir soal yang diujicobakan. Berdasarkan informasi dari kerja analisis butir inilah kemudian dilakukan pernaikan-perbaikan seperlunya.

b.    Analisis Jawaban
Analisis jawaban tidak lain adalah hasil pengukuran per indikator per kemampuan dasar yang dilakukan dengan menghitung jawaban benar dan salah peserta didik untuk seluruh butis soal yang diujikan. Analisis dimaksudkan untuk mengetahui kemampuan dasar mana saja yang sudah dikuasai peserta didik dan mana yang belum. Seorang peserta didik, misalnya, telah mampu menjawab dengan benar sebesar 80% dari seluruh butir soal yang diujikan dan sisanya yang 20% gagal dijawab dengan benar. Untuk mengetahui dengan pasti indikator dan kemampuan dasar mana saja yang sudah dikuasai dan sebaliknya diperlukan informasi tentang hal tersebut. hal itu berarti diperlukan kerja analisis jawabana per peserta didik per indikator per kemampuan dasar. Berdasarkan hasil telaah itu dapat ditentukan tindak lanjut yang akan diambil, apakah perlu adanya program remidial, pengayaan, atau akselerasi.

Sebuah indikator dan kemampuan dasar dinyatakan dikuasai oleh peserta didik jika tingkat penguasaannya minimal 75%. Jika indikator tertentu dan kemampuan dasar tertentu masih rendah tingkat ketercapaiannya, harus kembali dibelajarkan lewat program remidial. Peserta didik yang tingkat pencapaiannya masih di bawah standar minimal harus diberi program remidial, sedangkan yang sudah memenuhi diberi program pengayaan. Program remidial dapat bersifat individual atau klasikal jika hampir seluruh kelas masih belum mencapai tingkat penguasaan. Jadi, pada intinya adalah ada umpan balik pembelajaran berdasarkan hasil pengukuran sebelumnya, dan hal ini merupakan salah satu fungsi penilaian. Untuk itu, analisis jawaban soal ujian menjadi sebuah keniscayaan.

6.    Perbaikan Butir Soal dan Perakitan Soal Ujian
Hasil kerja analisis butir soal memberikan informasi tentang kondisi tiap buti soal yang diujicobakan. Hasil kerja itu antara lain berupa informasi tentang butir-butir soal yang berindeks kesulitan memenuhi persyaratan dan yang tidak, berdaya beda cukup dan yang tidak, serta butir-butir pengecoh yang efektif dan yang kurang efektif. Bahkan, jika analisis dilakukan dengan komputer, masih banyak informasi lain yang diperoleh dan di antaranya yang amat penting adalah indeks reliabilitas dan kesalahan baku pengukuran. Berdasarkan informasi tersebut dapat dilakukan perbaikan terhadap butir-butir soal tertentu yang perlu diperbaiki, sedangkan yang sudah baik tidak perlu. Bahkan, terhadap butir-butir soal tertentu yang tidak memenuhi persyaratan harus dibuang dan diganti butir soal yang lain jika jumlah keseluruhan butir yang dibutuhkan kurang. Setelah butir-butir soal diperbaiki, butir soal tersebut dirakit untuk dijadikan sebuah perangkat tes yang jadi dan siap digunakan untuk keperluan pengujian.

7.    Pelaksanaan Ujian
Setelah melewati berbagai langkah di atas, penyusunan alat tes sudah selesai dan tinggal kegiatan ujian, sesuai dengan temat dan waktu yang tentunya sudah direncanakan. Agar hasil pengukuran dapat memberikan hasil yang benar, pelaksanaannya harus dilakukan sebaik mungkin dengan pengawasan yang cermat, tetapi tidak mengganggu peserta ujian. Pelaksanaan ujian harus dilakukan dengan serius tetapi tidak menimbulkan tekanan bagi peserta didik.

8.    Penafsiran Hasil Ujian
Pelaksanaan pengujian (setelah diskor) akan menghasilkan data empirik kuantitatif yang berwujud skor-skor untuk tiap peserta didik. Sejalan dengan proses penilaian, skor-skor tersebut ditafsirkan untuk memberikan makna capaian peserta didik. Paling tidak ada tiga makna yang dapat ditafsirkan dari hasil pengujian. Pertama, pemberian makna untuk menentukan nilai seorang peserta didik yang lazimnya diberikan dalam wujud angka atau huruf. Ada dua cara menafsirkan hasil ujian tersebut, yaitu berdasarkan pendekatan acuan kriteria dan pendekatan acuan norma. Namun, untuk menilai hasil belajar peserta didik yang lebih tepat adalah menggunakan acuan kriteria.

Kedua, skor seorang peserta didik dapat juga dimaknai sebagai seberapa banyak ia dapat menyerap, menguasai, atau melakukan berbagai kompetensi yang dibelajarkan. Jika seorang peserta didik mendapat skor 51 dari kemungkinan skor tertinggi 60, hal itu dapat dimaknai bahwa ia mampu menguasai materi pembelajaran sebesar 85%. Artinya, ia telah mencapai tingkat penguasaan. Ketiga, tinggi-rendahnya capaian peserta didik juga dapat diartikan sebagai keberhasilan atau kegagalan guru mereka. Tinggi-rendahnya capaian tersebut dapat dilihat dari rata-rata hitung peserta didik dalam satu kelas. Jika rata-rata hitung ≥75%, hal itu dapat ditafsirkan kelas yang bersangkutan telah mencapai penguasaan minimal.

Kesimpulan
Penilaian adalah proses memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang dipergunakan sebagai dasar pengambilan informasi. Dengan demikian, terdapat tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan.

Tujuan dan fungsi penilaian antara lain adalah untuk mengetahui kadar pencapaian tujuan, memberikan sifat objektivitas pengamatan tingkah-laku hasil belajar peserta didik, mengetahui kemampuan peserta didik dalam hal-hal tertentu, menentukan layak-tidaknya seorang peserta didk dinyatakan naik kelas atau lulus, dan untuk memberikan umpan-balik bagi kegiatan belajar-mengajar yang dilakukan.

Alat penilaian dapat dibedakan menjadi dua macam, teknik tes dan teknik nontes. Baik teknik tes maupun nontes keduanya dapat dimanfaatkan secara efektif jika dipergunakan secara tepat, dan itu tergantung dari tujuan penilaian.

Daftar Pustaka
Burhan Nurgiantoro. (1994). Penilaian dalam pengajaran bahasa dan sastra. Yogyakarta: BBFE-Yogyakarta.
Depdikbud. (1983). Penilaian dalam pendidikan. Jakarta: Dikti.
Abdul Ghofur. (2004). Pedoman umum pengembangan penilaian. Jakarta: Puskur.
Dali S. Naga. (1992). Pengantar teori skor pada pengukuran pendidikan. Jakarta: Gunadarma.
Ngalim Purwanto. (2002). Prinsip-prinsip dan teknik evaluasi pengajaran. Bandung: Remaja Rosdakarya.
Sumarna Surapranata. (2004). Panduan penulisan tes tertulis implementasi kurikulum 2004. Bandung: Remaja Rosdakarya.

Penilaian Bahasa: Penjaga Pintu atau Pintu-Pembuka?

Pendahuluan
Telah lama diakui bahwa tes pada umumnya, dan penilaian bahasa pada khususnya, dimaksudkan untuk memberikan pelayanan yang berharga kepada masyarakat. Dalam arti bahwa tes dan penilaian ini menghasilkan informasi yang dapat membantu para pengambil keputusan mengalokasikan sumber daya atas dasar merit (?), bukan keturunan atau patronase. Pada saat yang sama, banyak peneliti telah menunjukkan potensi untuk penilaian bahasa yang akan digunakan untuk tujuan selain yang yang mereka dirancang, sering dengan yang tidak diinginkan negatif terhadap berbagai kelompok pengambil tes (misalnya, Spolsky, 1981; Shohamy, 2001). Terlepas dari apakah penilaian bahasa yang digunakan tepat atau tidak tepat, mereka berfungsi sebagai kedua pintu-pembuka dan gatekeeper. Artinya, keputusan yang dibuat atas dasar bahasa Penilaian akan melibatkan mengalokasikan sumber daya, kesempatan, atau penghargaan kepada beberapa saat menyangkal ini kepada orang lain.

Penilaian bahasa yang digunakan dalam pelayanan berbagai keputusan, termasuk seleksi mahasiswa, sertifikasi, klasifikasi, pelacakan, promosi atau retensi dalam program pendidikan, dan mengalokasikan sumber daya untuk sekolah. Dalam rangka untuk menjamin bahwa keputusan yang dibuat, setidaknya sebagian pada dasar penilaian bahasa, adil dan merata, kita harus mempertimbangkan spesifik menggunakan atau keputusan yang tes dimaksudkan dan dirancang, dan konsekuensi dari keputusan ini untuk berbagai kelompok individu. Sama penting, kita perlu mempertimbangkan kualitas (yaitu, reliabilitas, validitas) dari informasi yang diberikan oleh penilaian, dan relevansi informasi yang keputusan harus dibuat. Hal ini pasti akan mengarah pada pertanyaan tentang apa langkah-langkah tes khusus bahasa dan bagaimana berguna hasilnya untuk menginformasikan yang dimaksudkan decision.

Keputusan yang dibuat atas dasar skor dari tes bahasa dapat diklasifikasikan sebagai relatif atau absolut, baik menurut jumlah individu yang dapat diberikan reward dan tingkat kemampuan atau kecakapan yang dibutuhkan untuk memperolehnya. Dalam beberapa situasi, jumlah individu yang dapat diberikan pahala dibatasi oleh ketersediaan pahala. Dalam situasi seperti itu, cut-nilai yang sesuai dengan tingkat kemampuan yang diperlukan untuk mengalokasikan pahala adalah relatif terhadap jumlah individu yang mengikuti tes. Contoh dari keputusan relatif, di mana keputusan untuk memberikan hadiah ke tertentu individual tergantung pada berdiri relatif nya dalam kelompok pengambil tes, adalah sebuah perguruan tinggi atau keputusan masuk universitas. Beberapa perguruan tinggi dan universitas sangat selektif, sementara yang lain mungkin memiliki sumber daya yang terbatas untuk instruksi dan mentoring. Lembaga tersebut bisa mengakui hanya sebagian kecil dari pelamar, dan dengan demikian akan mengakui biasanya hanya siswa yang nilai tes, antara Kriteria lainnya, berada dalam persentase paling atas dari semua pengambil tes. Jika nomor pelamar, atau nilai ujian mereka, sangat bervariasi dari satu tahun ke tahun berikutnya, kemudian skor kriteria yang digunakan untuk menentukan siapa yang harus mengakui juga dapat bervariasi.

Dalam situasi lain, jumlah individu yang dapat diberikan penghargaan pada dasarnya terbatas, tapi cut-nilai yang sesuai dengan tingkat kemampuan diperlukan untuk mengalokasikan upah tersebut didasarkan pada tingkat absolut kompetensi atau penguasaan yang telah ditetapkan sebelum ujian dikelola oleh user test atau tes pengembang. Sebuah keputusan sertifikasi adalah contoh dari keputusan mutlak, di mana keputusan untuk memberikan penghargaan kepada individu tertentu tergantung pada tingkat sebelumnya ditentukan penguasaan. Di banyak negara, misalnya, individu yang bukan penutur asli dari bahasa yang dominan ingin memperoleh sertifikasi profesi (misalnya, untuk berlatih kedokteran atau hukum, atau untuk mengajar). Sebagai bagian dari sertifikasi profesional mereka, orang tersebut biasanya harus lulus tes bahasa untuk memastikan bahwa tingkat kemahiran bahasa adalah yang cukup bagi mereka untuk melakukan tugas profesional mereka dan tanggung jawab. Di kasus tersebut, tidak ada batas berapa banyak dokter, perawat, pengacara, atau guru dapat disertifikasi. Namun, nilai ujian mereka harus berada pada atau di atas kriteria tingkat kemampuan bahasa yang diperlukan oleh profesi tertentu. Dalam situasi, kriteria untuk sertifikasi tidak bervariasi dari satu waktu ke berikutnya, namun jumlah individu yang mencapai sertifikasi dapat bervariasi.

Ada dua cara di mana kita dapat menafsirkan skor dari tes bahasa yang relevan dengan jenis keputusan yang akan dibuat. Untuk keputusan relatif, kita perlu tes yang akan menyebar di seluruh individu berbagai nilai, sehingga dimungkinkan untuk membuat perbedaan baik antara individu-individu di seluruh tingkat kemampuan. Tes yang dirancang untuk melakukan hal ini memberikan nilai yang dapat ditafsirkan dengan mengacu pada kinerja kelompok tertentu dari tes-taker. Skor dari tes mengacu-norma sehingga mengindikasikan berdiri relatif individu dengan mengacu pada sekelompok pengambil tes, dan yang paling tepat untuk membuat relatif keputusan. Uji Internet Berbasis Bahasa Inggris sebagai Bahasa Asing (iBTOEFL) adalah contoh dari tes mengacu-norma bahasa (www.toefl.org). Untuk keputusan mutlak, kita perlu tes yang cukup mewakili kriteria, apakah ini mengacu pada domain dari konten seperti dalam sebuah tes prestasi (lihat bawah) atau tingkat tertentu dari kemampuan berbahasa. Skor dari criterionreferenced Tes yang demikian menunjukkan pengambil tes telah mencapai kriteria levelof penguasaan atau kecakapan dan mana yang belum, dan yang paling tepat untuk membuat keputusan mutlak.

Wawancara Oral Proficiency dari American Dewan untuk Pengajaran Bahasa Asing (ACTFL) adalah contoh dari kriteria-referenced Tes bahasa (www.languagetesting.com). Dalam bab ini kita akan membahas berbagai tujuan yang bahasa penilaian yang dirancang dan digunakan, dan konsekuensi dari keputusan yang dibuat. Kami kemudian akan membahas apa penilaian bahasa biasanya mengukur, dan relevansi dari kemampuan ini ke berbagai jenis keputusan.

Tujuan Penggunaan Tes Bahasa
Tujuan utama memberikan tes bahasa adalah untuk menghasilkan nilai yang dapat ditafsirkan sebagai indikator dari apa pengambil tes tahu atau dapat dilakukan dengan bahasa untuk beberapa tujuan yang dimaksudkan. Ini skor berbasis interpretasi kemudian dapat digunakan sebagai sumber informasi untuk membuat prestasi berbasis keputusan tentang pengambil tes dalam beberapa konteks penilaian. Penafsiran nilai ujian selalu terkait dengan bagaimana nilai tes akan digunakan, dan keputusan yang akan terjadi dari tersebut kesimpulan. Sebagai contoh di bawah ini menggambarkan, informasi nilai berbasis dari penilaian bahasa dapat digunakan untuk membuat berbagai keputusan, yang dapat membuka pintu untuk beberapa calon dan menutup mereka untuk orang lain.

Salah satu penggunaan umum dari hasil penilaian bahasa adalah untuk menginformasikan keputusan tentang apakah atau tidak siswa akademis dipersiapkan, atau siap untuk mengejar penelitian. Keputusan-keputusan seleksi biasanya dibuat dalam hubungannya dengan lainnya ukuran kemampuan seperti nilai siswa atau surat rekomendasi.

Misalnya, Test Internet Berbasis Bahasa Inggris sebagai Bahasa Asing (iBTOEFL) dirancang untuk mengukur "kemampuan pembicara normatif untuk menggunakan dan memahami Bahasa Inggris seperti yang diucapkan, ditulis, dan mendengar di perguruan tinggi dan universitas pengaturan "(diambil 12 Juni 2006 dari www.toefl.org). Skor dari tes ini dapat ditafsirkan sebagai bukti bahwa calon mahasiswa memiliki bahasa Inggris kemampuan bahasa yang diperlukan untuk melanjutkan studi berhasil dalam media Inggris akademik pengaturan. Oleh karena itu, berdasarkan penilaian ini (dan seleksi lainnya Kriteria), siswa yang memiliki kemampuan bahasa Inggris yang diperlukan dalam hubungannya dengan kualifikasi lainnya (misalnya, nilai) disediakan dengan kesempatan untuk studi di universitas, sedangkan mereka yang tidak memiliki bahasa Inggris minimal keterampilan (dan/ atau kualifikasi lainnya) ditolak kesempatan ini. Mengingat bahwa universitas dapat menampung hanya sejumlah terbatas siswa, meritbased pemilihan keputusan dari aplikasi universitas dapat dilihat sebagai relatif daripada absolut.

Lain penggunaan umum dari penilaian bahasa adalah untuk memberikan nilai-based informasi untuk mengklasifikasikan dan pelacakan siswa sehingga keputusan dapat dibuat tentang instruksi dibedakan bagi berbagai kebutuhan dan kemampuan tingkat. Misalnya, skor dari tes penempatan bahasa memungkinkan pendidik untuk mengklasifikasikan siswa sesuai dengan tingkat kemampuan bahasa (yaitu, mulai atau lanjutan), sehingga mereka dapat menerima tingkat yang sesuai instruksi. Ini penempatan, atau keputusan kesiapan memberikan skor berbasis informasi untuk pelacakan siswa menjadi kelompok-kelompok yang homogen sesuai dengan tingkat kemampuan atau kesiapan mereka untuk terlibat dalam tingkat tertentu dari instruksi. Demikian pula, nilai dari bahasa tes, bersama dengan penilaian lainnya, telah digunakan di sekolah-sekolah AS untuk mengklasifikasikan siswa sebagai pembelajar bahasa Inggris (ELLs) dan untuk menentukan apakah siswa memiliki tingkat yang tepat kemampuan untuk "berpartisipasi secara berarti dan adil "dalam bahasa Inggris-menengah kelas (Heubert & Hauser, 1999: 212) .2 Skor dari penilaian ini digunakan sebagai dasar untuk memutuskan apakah siswa dapat memiliki akses ke berbagai layanan untuk membantu mereka transisi dari mereka asli bahasa Inggris-menengah instruksi (Agustus & Hakuta, 1997). Nilai Tes bahasa ini juga dapat digunakan untuk melacak rendah kemampuan siswa dalam lambat-mondar-mandir ruang kelas, untuk mengecualikan mereka dari tingkat kelas matematika dan ilmu pengetahuan instruksi, atau untuk mereklasifikasi siswa dari ESL untuk mengarusutamakan Inggris-menengah instruksi (Berman et al., 1992).

Sebuah penggunaan ketiga penilaian bahasa adalah untuk memberikan nilai informasi berbasis kemajuan siswa atau efektivitas pembelajaran. interpretasi tentang "Kemajuan" atau "prestasi" yang digunakan untuk memberikan stakeholder dengan informasi untuk membuat keputusan sumatif dan formatif. Sumatif keputusan tentang retensi, promosi ke program berikutnya, atau penugasan nilai dapat dibuat atas dasar penilaian pencapaian siswa. Formatif atau perbaikan-berorientasi keputusan untuk membimbing instruksi dan pembelajaran, pada sisi lain, dapat didasarkan pada penilaian diagnostik kekuatan siswa ' dan kelemahan. Misalnya, prestasi tes untuk menemani ESL.

Pada buku Target 1 (Purpura et al., 2001) dirancang untuk mengukur siswa penguasaan tata bahasa, pengucapan, membaca, dan menulis konten di setiap bab. Skor berbasis interpretasi dari tes ini digunakan untuk memberikan informasi untuk membantu siswa membuat keputusan formatif untuk memfokuskan belajar mereka pada bidang yang mereka butuhkan untuk memperbaiki, dan bagi guru untuk memantau daerah siswa kekuatan, kelemahan, dan kemajuan dalam kursus sehingga untuk membuat keputusan tentang pembelajaran lebih lanjut dan instruksi. Tes ini juga dapat digunakan untuk menentukan nilai kepada siswa pada akhir kursus. Sebagai nomor apapun siswa dapat menerima nilai tinggi berdasarkan kriteria, keputusan ini dapat ditandai sebagai mutlak.

Masih lain penggunaan umum dari penilaian bahasa adalah untuk memberikan nilai-based informasi sehingga efektivitas jangka panjang pengajaran bahasa dalam Program dapat dipantau. Informasi ini kemudian akuntabilitas dapat digunakan untuk memastikan sejauh mana tujuan program diharapkan telah terpenuhi, serta untuk menunjukkan daerah kekurangan. Informasi ini juga dapat digunakan oleh program untuk membuat sekolah-tingkat alokasi sumber daya atau untuk membenarkan kebutuhan dan penggunaan sumber daya (Brindley, 1998). Misalnya, dalam kasus di mana tingkat kinerja telah dipenuhi, administrator dapat memutuskan untuk mengalokasikan tingkat yang sama sumber daya, sedangkan dalam kasus di mana tingkat kinerja di bawah standar, mereka mungkin memutuskan untuk mengalokasikan lebih banyak sumber daya ke program atau, sebaliknya, sanksi program dalam beberapa cara.

Singkatnya, penilaian dimaksudkan untuk memberikan informasi untuk membuat keputusan. Penilaian ini tidak dapat sepenuhnya dipahami atau dievaluasi tanpa pertimbangan penggunaan khusus (s) yang mereka dimaksudkan, serta potensi konsekuensi pemanfaatan ini.

Konsekuensi dan Keadilan dari Keputusan
Menurut Messick (1989), keputusan yang didasarkan pada hasil tes tentu akan
memiliki konsekuensi - baik disengaja dan tidak disengaja. Pertimbangkan, untuk Misalnya, skor dari tes keterampilan lisan, di mana kami berharap siswa yang memiliki mencapai tingkat tinggi kemampuan berbicara dalam domain untuk mendapatkan nilai yang tinggi, dan mereka yang belum mencapai standar untuk mendapatkan skor rendah. Seandainya nilai ini digunakan untuk menentukan apakah asisten pengajar internasional (Itas) telah memperoleh mampu menguasai bahasa target untuk mengajar kursus (misalnya, laboratorium kimia) di universitas. Tujuan lain dari tes ini adalah untuk mengukur pengambil tes 'kemampuan berbahasa untuk memutuskan mana yang dapat dipekerjakan sebagai Itas dan mana yang tidak bisa. Yang dimaksudkan konsekuensi dari penggunaan nilai ujian akan melayani kebutuhan dari sistem pendidikan dengan memastikan bahwa Itas mampu membuat dirinya dipahami dalam kelas. Dalam hal ini highstakes Sebagai contoh, beberapa kelompok stakeholder (misalnya, mahasiswa, fakultas program, Program direktur, pejabat sekolah dan universitas) mungkin akan sangat terpengaruh dalam satu atau lain cara dengan menggunakan hasil tes. Para pemangku kepentingan akan pasti akan tertarik untuk mengetahui bahwa nilai yang digunakan untuk mengklasifikasikan Itas sebagai linguistik kompeten adalah prediktor akurat yang tidak dan tidak memiliki kemampuan berbahasa yang memadai dalam bahasa Inggris untuk mengajar.

Dalam membuat keputusan klasifikasi tersebut (penguasaan, non-penguasaan), kami berharap bahwa skor tingkat penguasaan kompetensi minimum untuk menunjukkan kemampuan beberapa dan bahwa skor tingkat non-penguasaan mencerminkan kurang dari kompetensi minimal. Namun, kita juga harus mempertimbangkan kemungkinan kesalahan klasifikasi, konsekuensi dari kesalahan-kesalahan, dan biaya relatif membuat klasifikasi atau kesalahan keputusan, mengingat taruhannya relatif tes. Dalam penilaian berisiko tinggi contoh di atas untuk Itas, satu jenis penguasaan/ non-penguasaan keputusan Kesalahan akan terjadi jika ITA yang salah diklasifikasikan sebagai "master" ketika pada kenyataannya kemampuan yang sebenarnya berada di bawah tingkat cut-nilai (yaitu, positif palsu). Tipe lain dari kesalahan keputusan akan timbul jika ITA yang salah berlabel sebagai "non-master" padahal sebenarnya kemampuan sebenarnya berada di atas tingkat cut-nilai (yaitu, negatif palsu). Keputusan seperti kesalahan dalam konteks high-stakes penilaian dapat membawa konsekuensi yang tidak diinginkan yang dapat menimbulkan biaya besar untuk stakeholder. Dengan kata lain, keputusan positif palsu dapat menghambat belajar dalam kursus konten, sehingga siswa frustasi dan merampas mereka yang tepat untuk belajar. Sebuah keputusan negatif palsu dapat membahayakan ITA individu oleh menyangkal dirinya atau dana nya diperlukan untuk melanjutkan studi dan akan menyangkal siswa kesempatan untuk belajar dari seorang guru yang kompeten. Dalam berisiko tinggi situasi, dampak dari kesalahan keputusan sulit untuk mundur. Mengingat keseriusan skor berbasis keputusan dalam situasi berisiko tinggi, pengembang tes dan pengguna tes harus memastikan bahwa keputusan berdasarkan pada hasil tes adalah sebagai seakurat mungkin.

Dampak Positif
Penggunaan tes bahasa dalam membuat keputusan berdasarkan jasa umumnya didasarkan pada klaim bahwa beberapa keuntungan akan terjadi dari tujuan penggunaan skor. Dengan kata lain, tes akan digunakan untuk membuka dan menutup pintu bila dianggap sesuai untuk pendidikan, tujuan sosial, dan politik. Penggunaan tes adalah juga didasarkan pada klaim bahwa jika benar dirancang dan dipantau, dan jika digunakan sebagaimana dimaksud, tes akan memaksimalkan peluang untuk perlakuan yang adil dan merata individu dan kelompok dalam hal akses mereka terhadap kesempatan berdasarkan pantas. Beberapa contoh konsekuensi menguntungkan dimaksudkan penggunaan tes melibatkan klaim tentang mencegah mahasiswa linguistik siap dari mengerucutkan mahal studi akademis dalam sebuah program di mana mereka akan gagal (seleksi keputusan) atau jaminan bahwa siswa ditempatkan dalam kelas yang tepat untuk mereka tingkat kemampuan (keputusan penempatan). Contoh lain termasuk penunjukan pekerja seperti penyedia layanan kesehatan atau Itas untuk pekerjaan di mana mereka akan memiliki keterampilan linguistik yang dibutuhkan untuk kontribusi yang bermanfaat untuk misi mereka, dan secara tidak langsung kepada masyarakat (sertifikasi keputusan), atau pengaturan dari prestasi tinggi standar dan kesempatan untuk menerima umpan balik untuk belajar lebih lanjut (prestasi dan keputusan diagnostik). Masih contoh lain dimaksudkan manfaat adalah klaim bahwa tes akan mengubah budaya pendidikan untuk "meninggalkan tidak ada anak di belakang "atau untuk mengubah kualitas instruksi kelas dengan memberlakukan akuntabilitas sanksi dan penghargaan.

Dampak Negatif
Sementara penggunaan tes bahasa umumnya ditujukan untuk memiliki positif pendidikan, konsekuensi sosial, dan politik, bahasa menggunakan uji dibayangkan bisa dikenakan konsekuensi negatif yang tidak diharapkan. Misalnya, jika kekurangan dalam menguji sebagai instrumen pengukuran, seperti skor tidak dapat diandalkan atau interpretasi yang tidak valid, terdeteksi, maka kekhawatiran tentang penggunaan instrumen ini dalam pengambilan keputusan jelas akan dipertanyakan. Dengan kata lain, pengguna tes harus secara serius mempertimbangkan tidak menggunakan nilai dari tes untuk membuat keputusan jika pertanyaan tentang reliabilitas skor atau validitas interpretasi dibangkitkan, atau jika nilai tes secara sistematis lebih tinggi atau lebih rendah karena kelompok Keanggotaan (American Educational Research Association et al., 1999). Demikian mungkin terjadi ketika nilai sebuah ELL pada "masalah cerita" dalam matematika adalah secara signifikan lebih rendah karena kemampuan bahasa Inggris yang terbatas. Kekhawatiran tentang kewajaran penggunaan tes juga mungkin timbul jika ada bukti bahwa pengambil tes tidak diberi perlakuan yang adil dalam administrasi dan skor tes. Misalnya, jika kondisi tes administrasi tidak sesuai atau jika kualitas bahasa ELLs 'dalam jawaban mereka untuk masalah matematika merupakan faktor dalam scoring, ini pasti akan menimbulkan pertanyaan tentang keadilan sehubungan dengan adil pengobatan dalam proses pengujian. Akhirnya, menggunakan uji skor akan dipertanyakan atas dasar keadilan jika pengambil tes belum memiliki kesempatan untuk belajar materi yang diuji, terutama jika nilai yang digunakan untuk meminta pengambil tes untuk mengulang kursus atau menolak pengambil tes sertifikat kelulusan (Darling- Hammond, 1997; American Educational Research Association et al, 1999).. di Dengan kata lain, skor tes mungkin memberikan refleksi akurat tentang apa uji pengambil diketahui dan dapat dilakukan, tetapi nilai rendah mungkin berasal dari tidak memiliki memiliki kesempatan untuk belajar, bukan dari setelah gagal untuk belajar ketika diberikan kesempatan.

Darling-Hammond (1997) menggambarkan dua sekolah New York City. Dalam internasional SMA 450 ELLs dari lebih dari lima negara diajarkan untuk terlibat dalam konten menantang melalui kurikulum berbasis aktivitas. Pedagogi di sekolah ini mendorong siswa "untuk berlatih bahasa Inggris karena mereka juga belajar untuk memeriksa ide-ide melalui ilmu-ilmu sosial dan sastra, berpikir matematis dan ilmiah, dan menguji pandangan mereka terhadap alasan, bukti dan alternatif perspektif "(hal. 3). Sebaliknya, sebuah sekolah tinggi tradisional di pinggiran kota beberapa mil pergi memiliki pendaftaran 2.500 siswa. Dalam hal ini SMA, guru diharapkan untuk mengikuti kurikulum kunci-langkah tradisional yang didasarkan pada transmisi Model pedagogi, dan instruksi adalah guru-diarahkan dengan sedikit waktu untuk melibatkan kerja kelompok. Misalnya, di kelas bahasa Inggris remedial, terdiri sebagian besar dari Afrika Amerika, Latino, dan mahasiswa imigran baru, siswa diharapkan untuk mendengarkan, menyalin, menghafal dan menanggapi, tanpa banyak mempertanyakan.

Tidak mengherankan, sekolah internasional telah memiliki sepuluh tahun kesuksesan tidak hanya lulus hampir setiap siswa, tetapi juga dalam memungkinkan siswa untuk lulus kedua New York ujian kompetensi Negara (NYS) dan lebih menantang sekolah-dikembangkan penilaian kinerja. Sekolah tradisional, di sisi lain, melihat tingkat putus sekolah sangat tinggi dengan kelas dua belas dengan Beberapa melewati ujian kompetensi NYS. Skor pada ujian ini untuk tradisional siswa sekolah itu lebih merupakan refleksi dari kurangnya kesempatan untuk belajar dari kegagalan untuk belajar. Sementara ujian kompetensi NYS mungkin memiliki menghasilkan interpretasi skor yang konsisten dan bermakna uji kemampuan mereka dimaksudkan untuk mengukur untuk populasi umum, penggunaannya dengan siswa sekolah tradisional sebagai indikator kemampuan untuk tujuan pemberian ijazah sekolah tinggi menimbulkan keprihatinan serius tentang ekuitas dan keadilan.

Mendefinisikan Aspek Kemampuan Bahasa untuk akan Dinilai
Jika keputusan tentang pengalokasian sumber daya sistem pendidikan dan masyarakat harus dibuat setidaknya sebagian atas dasar kemampuan bahasa individu, maka kita harus memastikan bahwa kemampuan bahasa yang akan dinilai adalah, pada kenyataannya, yang relevan keputusan harus dibuat. Sebagai contoh, mungkin jelas bahwa 'individu kemampuan membaca akademik akan relevan dengan keputusan tentang mengakui siswa ke perguruan tinggi atau universitas, tetapi informasi tersebut tidak akan relevan jika kita ingin menyewa seseorang untuk melakukan penerjemahan simultan secara lisan dari satu bahasa ke bahasa lain. Dengan demikian kita perlu mempertimbangkan bagaimana kita mendefinisikan kemampuan untuk dikaji sehubungan dengan keputusan yang akan dibuat. Misalnya, jika kita ingin tahu, untuk tujuan promosi ke kelas berikutnya, seberapa baik siswa telah menguasai keterampilan membaca yang telah diajarkan pada awal sekolah dasar, kita kemungkinan besar akan menentukan kemampuan yang akan dinilai dalam hal bagaimana ini telah diajarkan, dan mungkin apa tingkat membaca akan diharapkan dari mereka di kelas-kelas berikutnya. Jika kita tertarik untuk mengetahui jika siswa memiliki pra-keaksaraan keterampilan yang diperlukan untuk mendapatkan keuntungan dari instruksi dalam membaca, kita kemungkinan besar akan menentukan kemampuan yang akan dinilai dalam hal teori literasi sejak dini dan pengembangan membaca. Atau jika kita ingin tahu, untuk pekerjaan yang mungkin, jika seseorang mampu membaca laporan pemasaran, maka kita kemungkinan besar akan menentukan kemampuan yang akan dinilai dari segi pengetahuan dan keterampilan yang dibutuhkan untuk membaca laporan tersebut. Dengan demikian, cara kita mendefinisikan kemampuan yang akan dinilai harus dipertimbangkan dengan mengacu pada keputusan (s) yang akan dibuat.

Pengembang tes juga perlu meyakinkan pengguna uji dan stakeholder lain yang interpretasi dari kemampuan untuk disimpulkan dari penilaian generalisasi untuk bahasa target penggunaan (TLU) domain, yaitu domain yang mendefinisikan konteks di mana keputusan akan dibuat. Bachman dan Palmer (akan datang) mendefinisikan domain TLU "sebagai satu set tugas penggunaan bahasa khusus yang pengambil tes kemungkinan menghadapi luar dari penilaian itu sendiri, dan yang kami ingin kesimpulan kami atau interpretasi tentang kemampuan bahasa untuk menggeneralisasi."

Misalnya, interpretasi dari kemampuan menulis berdasarkan penilaian yang membutuhkan pengambil tes untuk menulis pada berbagai topik umum dan dalam berbagai genre umum mungkin generalisasi ke domain TLU yang sangat luas. Namun, hasil penilaian tidak mungkin generalisasi ke domain TLU di mana tugas menulis seluruhnya terdiri dari genre tertulis yang mengikuti sangat spesifik organisasi format, seperti menulis laporan pemasaran atau proposal hibah. Dengan demikian, jenis tugas penilaian kami sajikan pengambil tes harus dipertimbangkan dengan mengacu pada domain TLU.

Dalam mendefinisikan kemampuan bahasa yang akan dinilai, pengembang tes perlu mempertimbangkan beberapa masalah. Salah satu isu yang telah dibahas dalam pengujian bahasa sastra adalah perbedaan antara kemampuan dan tes prestasi (misalnya, Davies, 1968, 1990, Bachman, 1990, Alderson, Clapham, & Wall, 1995). Bachman (1990) berfokus pada konten yang di atasnya kedua jenis tes didasarkan: tes prestasi didasarkan pada isi kurikulum tertentu atau kursus instruksi, sedangkan tes kemahiran didasarkan pada teori umum bahasa kemampuan, atau kecakapan. Davies (1968, 1990), di sisi lain, berfokus pada penggunaan yang dimaksudkan tes bahasa. Untuk Davies, prestasi Tes ini dimaksudkan untuk menginformasikan pengguna tes tentang berapa banyak bahasa individu telah belajar selama proses instruksi, tes kemahiran, pada sisi lain, digunakan untuk memprediksi kinerja dalam bahasa pada masa tertentu aktivitas. S Bachman dan 'Davies definisi jelas menunjukkan bahwa pengembang uji harus mempertimbangkan baik isi yang di atasnya tes ini didasarkan dan keputusan yang dimaksudkan (cf., Brown, 1996). Contoh-contoh di bagian pada "Penggunaan Ditujukan tes Bahasa" di atas, menggunakan tes bahasa untuk membuat keputusan tentang kesiapan, kemajuan, diagnosis, dan akuntabilitas, akan kemungkinan besar melibatkan mendefinisikan kemampuan yang akan dinilai dalam hal tertentu Tentu saja instruksi. Lain contoh yang diberikan di atas, menggunakan tes bahasa untuk seleksi perguruan tinggi, mengelompokkan siswa sebagai ELLs, dan sertifikasi, akan paling kemungkinan melibatkan mendefinisikan kemampuan yang akan dinilai dari segi baik umum teori kemampuan bahasa atau analisis bidang kemampuan bahasa yang akan dibutuhkan untuk melakukan tugas-tugas tertentu dalam domain TLU.

Isu kedua adalah apakah untuk menentukan kemampuan yang akan dinilai dari segi kemampuan bahasa sendiri, atau untuk mendefinisikannya sebagai kemampuan bahasa ditambah beberapa daerah latar belakang pengetahuan. Bachman dan Palmer (akan datang) membahas dua pilihan, bersama dengan situasi di mana setiap opsi kemungkinan akan yang tepat, dan beberapa potensi masalah dengan masing-masing. Mereka berpendapat bahwa pilihan akan tergantung pada keputusan yang akan dibuat. Jika, misalnya, kita ingin tahu seberapa baik pengambil tes dapat menggunakan bahasa secara akurat dan tepat, kita akan mendefinisikan membangun dalam hal komponen yang relevan kemampuan bahasa. Jika, di sisi lain, kami ingin memprediksi uji kinerja masa depan pengambil 'pada tugas-tugas yang melibatkan penggunaan bahasa, serta daerah lain pengetahuan, maka kita akan menentukan konstruksi yang lebih luas untuk mencakup kemampuan bahasa dan keterampilan dan pengetahuan yang terkait dengan tugas yang akan dilakukan.

McNamara (1996) telah membahas masalah ini dari perspektif yang sedikit berbeda dalam hal apa yang ia sebut "kuat" dan "lemah" indera bahasa penilaian kinerja. Dalam arti "kuat", hasil tes taker 'adalah dinilai dalam hal penyelesaian tugas, yang mungkin memerlukan pengetahuan dan keterampilan selain kemampuan berbahasa. Dalam arti "lemah", namun, kinerja yang dinilai dari segi kualitas bahasa yang dihasilkan, dan skor interpretasi cenderung tentang berbagai aspek pengambil tes ' bahasa, atau sekitar kemampuan bahasa mereka secara keseluruhan. Sementara McNamara berpendapat bahwa "yang kuat" penilaian kinerja tidak benar-benar tes bahasa, nya Titik utama adalah bahwa pengembang tes bahasa dan pengguna tes perlu menentukan lebih jelas apa yang mereka berniat untuk mengukur, dan tidak hanya mengasumsikan bahwa pengetahuan latar belakang atau bukan bagian dari apa tes mengukur mereka.

Douglas (2000) menganggap masalah ini dari perspektif bahasa untuk spesifik tujuan (LSP). Dia berpendapat bahwa tes LSP memerlukan "kuat" McNamara rasa penilaian kinerja, dan mendefinisikan apa yang dia sebut "tujuan tertentu Kemampuan "sebagai termasuk pengetahuan bahasa dan tujuan tertentu latar belakang pengetahuan. Pandangan Douglas sangat relevan dengan situasi di mana tujuannya adalah untuk menilai kemampuan individu untuk menggunakan bahasa untuk melakukan tugas-tugas atau pekerjaan dalam pengaturan tertentu. Kita melihat hal ini, misalnya, ketika menilai "akademis" bahasa pembelajar bahasa kedua di SD sekolah untuk keperluan membuat keputusan tentang kategorisasi, pelacakan, promosi, dan retensi atau ketika menilai bahasa tujuan khusus profesional, untuk membuat keputusan tentang pekerjaan atau sertifikasi profesi.

Singkatnya, cara kita mendefinisikan kemampuan yang akan dinilai harus relevan dengan baik keputusan yang akan dibuat, dan domain bahasa gunakan untuk yang kita inginkan skor berbasis interpretasi kami untuk menggeneralisasi.

Apakah Penilaian Bahasa Penjaga Pintu atau Pembuka Pintu?
Kami telah menyatakan dalam bab ini bahwa tes bahasa digunakan untuk menyediakan scorebased Informasi untuk membuat berbagai keputusan, seperti seleksi, kategorisasi dan pelacakan siswa, penugasan nilai, profesional sertifikasi, dan alokasi sumber daya. Sebagai konsekuensi dari keputusan ini, beberapa orang dihargai dan ada juga yang tidak. Dengan kata lain, bahasa tes berfungsi sebagai gerbang-penjaga untuk beberapa dan pintu-pembuka bagi orang lain.

Sifat tes - sebagai pintu gerbang penjaga atau pintu pembuka - akan dirasakan berbeda oleh berbagai pemangku kepentingan. Uji taker yang melakukannya dengan baik pada tes yang cenderung melihatnya sebagai pembuka pintu-ke penghargaan terkandung keputusan, sementara mereka yang buruk akan melihatnya sebagai penjaga pintu gerbang-, termasuk mereka dari penghargaan ini. Demikian pula, guru dan program sekolah yang dihargai karena skor tinggi siswa mereka 'tes cenderung melihat tes sebagai menguntungkan, sementara mereka yang dihukum atau sanksi karena skor yang rendah mungkin merasa bahwa Tes ini tidak adil. Uji pengembang yang telah dirancang dan dikembangkan tes dan uji pengguna yang telah memutuskan untuk menggunakan tes cenderung melihat tes sebagai menguntungkan, melihatnya sebagai sarana yang efektif untuk secara adil dan tepat mengalokasikan penghargaan yang mereka miliki. Dengan demikian, mereka akan melihat siswa menguntungkan yang melakukan buruk atau menolak penghargaan kepada siswa yang melakukan serta tidak adil, tidak ekonomis, dan mungkin tidak etis.

Akhirnya, ada masalah yang memutuskan. Siapa yang memutuskan bahwa penghargaan harus dialokasikan sesuai dengan prestasi, bukan berdasarkan keturunan atau patronase? Siapa yang memutuskan untuk menggunakan penilaian bahasa, sebagai lawan lainnya jenis informasi, untuk mengalokasikan penghargaan ini? Siapa yang memutuskan mana untuk mengatur cut-nilai yang membagi orang-orang yang akan menerima penghargaan dari orang-orang yang tidak akan? Masalah ini telah dibahas secara luas dalam penilaian bahasa literatur (misalnya, McNamara, 1998, 2001; Shohamy, 2001, McNamara & Roever, 2006), dan tampaknya ada sedikit kesepakatan di antara para peneliti tentang bagaimana penguji bahasa harus mengatasi hal ini. Pada akhirnya, isu yang memutuskan adalah, dalam pandangan kami, yang melibatkan nilai-nilai sosial, budaya, dan masyarakat yang berada di luar kendali pengembang tes bahasa. Namun demikian, nilai-nilai ini perlu dipertimbangkan dengan cermat karena kami merancang, mengembangkan, dan penggunaan penilaian bahasa.

CATATAN
1 Karena reliabilitas dan validitas yang dibahas di tempat lain dalam buku ini, kita tidak akan membicarakannya di sini.
2 Berbagai istilah telah dan digunakan untuk peserta didik di sekolah yang bahasa ibunya bahasa atau bahasa ibu tidak sama dengan bahasa yang merupakan media instruksi. Di AS, istilah "Bahasa Inggris Terbatas Mahir" (LEP) memiliki umumnya telah digantikan oleh "Learner Bahasa Inggris" Istilah (ELL), yang merupakan istilah kami akan menggunakan seluruh.


Dirangkum dari tulisan LYLE F. BACHMAN AND JAMES E. PURPURA yang berjudul "Language Assessments: Gate-Keepers or Door-Openers?" yang terkumpul dalam e-Book yang berjudul "The Handbook of Educational Linguistics" yang diedit oleh Bernard Spolsky and Francis M. Hult