Senin, 11 Agustus 2008

METODE PENETAPAN STANDAR

METODE PENETAPAN STANDAR PERFORMANSI

Ahmad Rohani HM.

(Dosen FAI Unissula Semarang)

Pendahuluan

Menurut Oxford Dictionary English, standard: a definite of excellence, attainment, wealth, or the like, or a definite degree of any quality, viewed as a prescribed object of endeavour or as the measure of what is adequate for some purpose. Istilah standard (ditransliterasi ke dalam bahasa Indonesia menjadi standar) memiliki banyak makna dan interpretasi. Dalam konteks pendidikan, standar dimaksudkan sebagai dasar tujuan pendidikan, sebagai kompetensi minimum, sebagai tujuan kurikulum, sebagai prestasi siswa, dan sebagainya. Linn (1994) mengidentifikasi 3 jenis standar dalam pendidikan: content standards, opportunity to learn standards, dan student performance standards.

  1. Content standards

Standar isi sering disebut sebagai standar kurikulum, terkait dengan hasil belajar pada wilayah isi kurikulum.

  1. Opportunity to learn (OTL) standards

Menurut Porter (1995) standar OTL sebagai kriteria untuk menilai efisiensi atau kualitas sumber, praktik, dan kondisi yang diperlukan pada setiap tingkatan sistem pendidikan…dengan kesempatan untuk mempelajari bahan. Dalam konteks ini pengertian standar terkait dengan masalah equity dalam pendidikan guna menentukan keadilan dan ekualitas hasil bagi semua siswa. Standar OTL dimaksudkan untuk menetapkan apakah semua siswa dapat mengakses kesempatan belajar. Standar OTL mencakup: ketersediaan kurikulum, bahan pelajaran dan teknologi, kualitas pembelajaran, tingkat keamanan, fasilitas terjamin (aman), dan kebijakan non-administrasi.

  1. Student performance standards

Konsep standar performansi pada dasarnya merupakan bentuk aplikasi dari criterion-referenced measurement (CRM). Taylor (1994) mengatakan, dalam penilaian performansi ada dua model yang berbeda: model pengukuran versus model standar. Model yang pertama berdasarkan komparatif, penilaian berdasarkan norma dengan menekankan reliabilitas atau konsistensi pengukuran.

Sedangkan model standar menekankan validitas, sifat umum standar, dan cara-cara siswa dapat menunjukkan penguasaan pengetahuan atau keterampilan. Inilah inti dari standar performansi. Misalnya, jika satu set standar menyatakan bahwa siswa harus berhasil menulis bebas dari kesalahan, misalnya menulis paragraph dengan 5 kalimat. Maka siswa harus dapat menunjukkan bahwa secara aktual ia dapat melakukannya. Gagasan belajar yang dapat didemonstrasikan merupakan basis dari aplikasi CRM to licensing, belajar tuntas, atau pembelajaran berdasarkan kompetensi, kadang-kadang disebut juga dengan benchmarks atau indicators.

Pembahasan selanjutnya dalam tulisan ini difokuskan pada standar performansi siswa [Jaeger (1994) menyebut dengan testing kompetensi minimum], khususnya yang terkait dengan model, metode, atau prosedur dalam penetapan standar kompetensi siswa.

Ada 4 hal yang perlu diperhatikan terkait dengan penetapan standar performansi:

  1. Revisability
  2. Quantitative quicksands
  3. Experience-based standards
  4. Time requirements.

Penetapan standar performansi dipengaruhi oleh 4 faktor:

  1. Analisis konteks keputusan
  2. Kejelasan target kompetensi, ini terkait dengan performansi-performansi yang tidak diajarkan, yang sedang diajarkan, dan yang diajarkan sebelumnya.
  3. Pilihan-pilihan lain.

Beberapa metode penetapan standar performansi menurut Hambleton & Egnor (1980) setidaknya ada 18 prosedur (metode) yang bisa didaftar atau diidentifikasi. Sementara, Meskauskas (1976) mengelompokkannya menjadi dua metode: (1) state models; (2) continuum models.

State Models

State models mengasumsikan bahwa kompetensi itu biner (binary); setiap teruji memiliki kompetensi atau tidak memiliki kompetensi (an examinee either has it or doesn’t). Logikanya adalah penggunaan suatu “state model” mengharuskan skor yang sempurna (lengkap) dalam suatu pengukuran kompetensi yang valid bagi semua teruji, dan memberi ukuran yang reliabel secara keseluruhan. Hanya, kesalahan pengukuran terjadi ketika kita menggunakan kriteria kompetensi berdasarkan performansi yang kurang sempurna.

State models dikembangkan oleh banyak ahli antara lain Berk (1980, 1986). Menurut Berk, ciri-ciri state models ada 3 hal:

1. Beberapa model terkait dengan penguasaan satu atau dua butir tes. Domain-domain yang dinilai oleh kebanyakan tes kompetensi benar-benar heterogen, penilaian menggunakan satu atau dua butir tes yang tidak bisa dijawab.

2. Oleh karena model-model menganggap bahwa kompetensi itu setara dengan penguasaan absolut domain pengetahuan atau keterampilan, model-model tersebut hanya aplikabel untuk domain-domain yang terbatas.

3. Model-model ini mengira bahwa populasi siswa yang diuji dapat dijelaskan secara memadai dengan dua tingkat kompetensi. Kompetensi diharapkan menjawab semua butir tes dengan benar dan diasumsikan mempunyai peluang yang sama dari komiting (committing) penghilangan pada satu butir.

Continuum Models (Model-model Kontinum)

Model-model kontinum mendasarkan pada asumsi bahwa sifat (traits) atau konstruk dapat mengambil suatu nilai dalam suatu interval tertentu. Penentuan derajat sifat yang menegaskan perilaku kompetensi merupakan peranan dari model-model kontinum.

Bahwa standar dimaksudkan untuk memberikan kejelasan sejumlah pernyataan yang bertentangan menyangkut belajar siswa yang dapat diukur. Bahwa aspek-aspek standar umumnya tidak dilaporkan khususnya terkait dengan proses pembuatan keputusan dengan dasar standar yang mana, tidak jelas. Terkait dengan ini, Berk (1986), Robert L. Linn (1994), dan Taylor (1994), mengidentifikasi 2 unsur yang dapat digunakan untuk menetapkan standar, yaitu: judgemental information dan empirical information.

Istilah umum judgement dalam penetapan standar performansi menunjuk pada abilitas atau kemampuan untuk membuat keputusan yang adil (fair) dan akurat berdasarkan pada pengetahuan atau pengalaman. Taylor (1994) mengatakan, expert judge mempunyai domain “internalized” yang mereka kerjakan. Sadler (1987) menyebutnya dengan pengetahuan yang diam-diam (tak diucapkan). Sementara, Jaeger (1991) menjelaskan bahwa expert judge sebagai orang yang mengatasi domain (dalam daerah kekuasaan atau kewenangan), tindakan yang dengan cepat membuat keputusan, melihat lebih dalam tingkat masalah dalam domain, dan memiliki self-monitoring skills.

Pada prinsipnya, proses penetapan standar performansi bisa sepenuhnya judgemental, atau sepenuhnya empirical, atau kombinasi keduanya. Terkait dengan hal ini Hambleton & Egnor (1980), membedakan continuum models menjadi 3 macam:

1. Judgmental models: Model ini membutuhkan judgement isi tes kompetensi seperti kesulitan butir-butir tes. Judgement kemampuan teruji menjadi perhatian utama model-model, sementara domain kemampuan yang dinilai dibatasi oleh isi tes.

  1. Empirical models: Model empirik prosedurnya memerlukan judgement langsung mengenai kompetensi teruji.
  2. Combination models: Model kombinasi memerlukan judgement kemampuan teruji untuk menunjukkan kecukupan pada domain butir-butir yang dinilai oleh tes kompetensi.

Sementara, Berk (1986) membedakannya ke dalam 4 teknik penetapan standar performansi:

1. Judgemental techniques: Teknik ini hanya menggunakan hasil-hasil keputusan yang dibuat panel expert judges (umumnya, expert judges sering digunakan baik norm-referenced measurement maupun pada criterion-referenced measurement).

2. Judgemental-empirical techniques: Teknik ini menggunakan data empirik seperti skor siswa guna membantu menilai set standards.

3. Empirical-judgemental techniques: Dengan teknik ini informasi diperoleh melalui testing siswa yang selanjutnya digunakan dengan mempertimbangkan pada set a standard.

4. Empirical techniques: Dengan teknik ini, keputusan yang dibuat berdasarkan pada basis norma statistic dalam bentuk rerata performasi siswa.

Taylor (1994) menjelaskan bahwa penetapan standar performansi mencakup 4 prosedur:

1. Menggunakan expert judges untuk mengembangkan standar.

2. Menetapkan benchmarks.

3. Mengembangkan kriteria performansi sebagai pelaksanaan standar.

4. Menjelaskan tata-cara penskoran.

Secara umum, akurasi penetapan standar dinyatakan sebagai suatu proses yang menekankan macam-macam form of expert judgment, memperhatikan berbagai jenis informasi empirik. Apapun proses yang digunakan, ia harus mengutamakan penetapan standar sesuai dengan waktu dan biaya yang dibutuhkan dalam proses penetapan standar itu. Proses pengembangan, testing, refining, dan confirming, merupakan suatu yang iteratif yang tidak mungkin dilakukan dengan jalan pintas.

Model-model kontinum untuk menetapkan standar performansi secara garis besar dapat dibedakan menjadi dua (Richard M. Jaegar, 1994):

  1. Test-centered models (model-model yang berpusat pada tes).
  2. Examinee-centered models (model yang berpusat pada teruji).

Model-model Kontinum yang Berpusat pada Tes

Beberapa model kontinum yang memusatkan pada tes antara lain:

  1. The informed-judgment procedure.

Prosedur yang harus ditempuh dalam model ini: (a) menganalisis konteks keputusan; (b) kejelasan kompetensi; (c) memperoleh data performansi yang relevan; (d) mengumpulkan data yang terkait, relevan; (e) menetapkan standar berdasarkan informasi yang ada.

  1. Nedelsky’s Procedure.

Metode Nedelsky ini digunakan untuk tes pilihan ganda dan memusatkan pada analisis opsi jawaban salah dalam tes. Penetapan standar kompetensi dengan menggunakan metode Nedelsky melibatkan 4 langkah: (a) penetapan judges yang menguasai kompetensi sekaligus mengenali siswa-siswa yang menguasai kompetensi; (b) memperhatikan distraktor (pilihan benar-salah) pada setiap butir, dan mengidentifikasi distraktor mana kompetensi minimal seorang siswa terdeteksi sebagai tak benar; (c) untuk setiap butir tes, ubahlah responsi yang tidak dieliminasi pada langkah kedua (responsi benar plus distraktor yang tak tereliminasi) ke peluang “jawaban-benar-kebetulan”; (d) jumlahlah per-butir peluang “jawaban-benar-kebetulan” untuk setiap judge, selanjutnya cari reratanya untuk memperoleh standar performansi kompetensi minimal siswa.

Sebagai ilustrasi metode Nedelsky ini disajikan pada gambar 1 di bagian bawah tuliasan ini.

  1. Prosedur Angoff yang Termodifikasi atau Teradaptasi.

Pendekatan Angoff adaptif ini dapat digunakan untuk berbagai jenis butir tes, pilihan ganda, atau lainnya. Pada hakikatnya pendekatan Angoff sama dengan Nedelsky kecuali bahwa judges yang dicari untuk membuat estimasi setiap butir yang akan dijawab dengan benar dengan kompetensi minimal siswa. Dengan kata lain, tanpa memperhatikan distraktor individual pada setiap butir, judges pindah ke kolom jawaban-benar-kebetulan dalam model Nedlesky.

Model-model kontinum yang Berpusat pada Teruji

Beberapa model kontinum yang memusatkan pada teruji antara lain:

1. Borderline-group procedure (prosedur kelompok perbatasan, passing grade).

Pelaksanaan prosedur ini meliputi 5 langkah: (a) mengidentifikasi judges yang mengenal (menguasai) populasi siswa; (b) menetapkan performansi minimal yang dapat diterima oleh siswa; (c) mengidentifikasi siswa yang berada di garis perbatasan; (d) melaksanakan tes; (e) menghitung median performansi.

2. Contrasting-groups procedure (prosedur kelompok-kelompok berlawanan).

Ada 6 prosedur yang harus dilaksanakan dalam model ini: (a) mengidentifikasi judges yang mengenali populasi siswa; (b) menetapkan performansi minimal yang dapat dietrima siswa; (c) mengidentifikasi siswa yang menguasai performasi dan/atau siswa yang tidak menguasai performansi; (d) melaksanakan tes ke dalam dua kelompok yakni, kelompok masters, dan kelompok nonmasters; (e) menggambar dua kelompok ke dalam kurve; (f) menetapkan standar performansi berdasarkan pada interseksi dua kurve.

Sebagai ilustrasi prosedur kelompok kontras ini, pada bagian bawah disajikan 3 gambar (gambar 2, 3, dan 4) kurve berlawanan antara Masters dan Nonmasters.

Gambar 1: Rekaman Responsi Butir dengan Metode Nedelsky

Nomor Nomor response yang Tak Benar-Kebetulan

Butir Dieliminasi

----------------------------------------------------------------------------------- --------------------------

1 4 3 2 1 0,50

2 4 3 2 1 0,33

3 4 3 2 1 0,25

4 4 3 2 1 1,00

dst.

Jumlah : ….

Butir-butir tes yang benar

Gambar2: Titik Interseksi Kelompok Masters dan Kelompok Nonmasters

Butir-butir tes yang benar

Gambar3: Set Standar untuk Mereduksi Positif-Salah

Butir-butir tes yang benar

Gambar4: Set Standar untuk Mereduksi Negatif-Salah

Bacaan yang bermanfaat :

http://www.usoe.k12.ut.us/bookmarkdescrition.htm.

http://www.usoe.k12.ut.us/UtahStandards.htm.

Jaeger, Richard M. Certification of student competence. Linn, Robert L. (1994). Educational measurement. New York: American Council on Education-Macmillan Publishing Company. p. 485-511.

Noonan, Brian. (2002). Setting standards in education: some principles and practices. Dalam Loraine Thompson Information Services Limited. Setting standards in education: Saskatchewan standards symposium. SSTA Research Centre report.

The Utah State Office of Education. (2000). Utah standard setting using the contrasting group study.

Tidak ada komentar: