Senin, 11 Agustus 2008

validitas konstruk

MODEL KONSTRUK DAN VALIDITAS KONSTRUK*)

Ahmad Rohani

Model Konstruk

Pada awal tahun 1950-an the American Psychological Association (APA) Committee on Psychological Tests memperluas pengertian current validity (validitas ada sekarang) guna mengakomodasi interpretasi dalam penilaian klinis. Dua orang anggota subkomite, Paul Meehl dan Robert Challman, telah mengidentifikasi jenis-jenis bukti (fakta) yang dibutuhkan untuk menjustifikasi interpretasi psikologis peralatan konselor dan ahli klinis (Cronbach, 1989; 148). Mereka mengenalkan pengertian (pikiran) dan terminologi construct validity, yang dimuat dalam Technical Recommendations APA (1954), selanjutnya dibembangkan oleh Cronbach dan Meehl (1955).

Cronbach dan Meehl (1955) mengadopsi model teori hypothetico-deductive (HD) yang pada tahun 1950-an begitu dominan, sebagai kerangka rerja untuk analisis konstruk teoretik. Model HD (Suppe, 1977) merupkan teori yang berkenaan dengan tafsiran sistem aksiomatik. Satu set aksioma berhubungan secara implisit dalam susunan term-term terdefinisikan (konstruk teoretik) yang merupakan inti teori. Aksioma-aksioma ditafsirkan oleh hubungan beberapa term ubahan teramati melalui hukum-hukum atau prinsip-prinsip korespondensi. Model HD mensyaratkan tersedianya beberapa ubahan teramati.

Interpretasi pertama, bahwa aksioma dapat digunakan untuk mebuat prediksi mengenai hubungan antar ubahan teramati, dan hukum-hukum empirik dijelaskan oleh teori (Hempel, 1965). Jaringan kerja nomologik membatasi (mendefinisikan) teori yang terdiri dari sistem aksioma yang ditafsirkan plus semua hukum empirik yang diturunkan darinya. Teori divalidasi oleh hukum-hukum empirik terhadap data.

Term sederhana atau konstruk-konstruk dalam aksioma tidak secara eksplisit terdefinisikan oleh sesuatu jenis pengamatan. Agaknya mereka secara implisit terdefinisikan dengan peranannya di dalam teori, ini diperlukan dengan menggunakan beberapa pengamatan untuk mengestimasi nilai suatu konstruk, tetapi konstruk tidak didefinisikan oleh pengamatan ini. Validitas dari interpretasi skor yang dikemukakan dalam term-term konstruk dievaluasi dengan term-term teori, validitas teori, dan dari prosedur pengukuran yang digunakan untuk mengestimasi konstruk yang terdefinisikan oleh teori, keduanya diperlukan. Jika pengamatan tak konsisten dengan teori, beberapa bagian jaringan kerja harus ditolak, tetapi umumnya ia tak jelas apakah kesalahan terjadi dalam aksioma, hukum korespondensi, atau dalam bagian-bagaian prosedur pengukuran.

Menurut Technical Recommendation (APA, 1954) dan Cronbach & Meehl (1955), validitas konstruk dihadirkan sebagai alternatif terhadap model kriteria maupun model isi, dan dalam hal-hal tertentu terdapat kesamaan di antara mereka. Cronbach & Meehl (1955; 282) mengatakan bahwa validitas konstruk kapanpun dicakup dalam suatu tes yang diinterpretasikan sebagai suatu ukuran dari beberapa atribut atau kualitas, yang adalah tidak didefinisikan secara operasional, dan pada atribut mana tidak memiliki kriteria yang cukup (1955; 299). Technical Recommendation (APA, 1954) dan Cronbach & Meehl (1955), keduanya telah membicarakan validitas konstruk sebagai satu tambahan terhadap model kriteria dan model isi dan tidak ada maksud mengesampingkan.

Cronbach & Meehl (1955; 282) mengatakan bahwa penetapan konstruk psikologik karena untuk performansi tes diperlukan sekali pada hampir setiap tes. Bahkan jika tes yang awalnya divalidasi menggunakan evidensi kriteria atau isi, perkembangan tentang pemahaman yang lebih dalam mengenai konstruk atau proses laporan untuk performansi tes memerlukan satu pertimbangan validitas konstruk. Sehingga Cronbach & Meehl (1955) menganjurkan bahwa validitas konstruk adalah pervasive, tetapi ia tidak hadir sebagai satu kerangka kerja yang mengatur secara umum untuk validitas.

Pada tahun 1966, Sandards membedakan validitas konstruk dari pendekatan validitas lainnya khususnya validitas kriteria: Validitas konstruk lazimnya dipelajari ketika tester menghendaki untuk meningkatkan pemahamannya mengenai kualitas psikologik yang sedang diukur dengan tes… Validitas konstruk adalah relevan ketika tester menerima tanpa ukuran sebagaimana kriteria definitif (APA, AERA, dan NCME, 1966; 3).

Sehingga 10 tahun sesudah Cronbach dan Meehl (1955), model konstruk masih dihadirkan sebagai satu alternatif terhadap model kriteria dan bukan untuk mengesampingkannya. Tidak ada saran atau anjuran bahwa model kriteria atau model isi supaya ditinggalkan atau dimasukkan di bawah validitas konstruk. Tampaknya validitas konstruk lebih memusatkan pada eksplanatori, interpretasi teoretik.

Standards (APA, AERA, dan NCME, 1974; 26) melanjutkan terus jejak atau jalur ini, mendaftar 4 jenis validitas yang dihubungkan dengan 4 jenis interpretasi inferensial yakni validitas prediktif dan validitas konkuren, validitas isi, dan validitas konstruk. Pada tahun 1974 Standards lewat treatment validitas konstruk, ia mengakhiri kerja Cronbach dan Meehl (1955) dengan menghubungkan validitas konstruk pada konstruk teoretik. Sebuah konstruk psikologik merupakan sebuah gagasan yang dikembangkan atau terkonstruk sebagai satu kerja yang diingatkan, imajinasi ilmiah; merupakan sebuah gagasan teoretik yang dikembangkan untuk menjelaskan dan mengatur beberapa aspek pengetahuan yang ada. Term-term seperti kecemasan, bakat klerikal, atau kesiapan baca, merupakan konstruk, tetapi konstruk adalah lebih banyak dari label; ia sebagai sebuah dimensi yang dipahami atau dituntut dari jaringan kerja yang saling berhubungan (APA, AERA, dan NCME, 1974; 29).

Dengan jelas Cronbach (1971; 462-463): membedakan beberapa pendekatan terhadap validasi, termasuk validasi konstruk: Rasional terhadap validasi konstruk (Cronbach dan Meehl, 1955) dihasilkan dari tes kepribadian. Untuk sebuah ukuran , misalnya kekuatan ego, adalah bukan satu-satunya hubungan kriteria terhadap presdiksi, bukan pula sebuah domain isi sampel. Agaknya terdapat sebuah teori yang membuat rancangan kasar sifat trait. Jika skor tes adalah perwujudan valid kekuatan ego, sehingga dipahami, hubungannya dengan ubahan-ubahan yang lain sesuai dengan harapan teoretik. Selanjutnya ia mengatakan: Sebuah deskripsi yang menunjuk pada proses internal person (kecemasan, insight) tanpa kecuali memerlukan validasi konstruk (1971; 451).

Antara awal tahun 1950-an sampai pertengahan 1970-an, dalam praktiknya telah berkembang penggunaan model-model yang berbeda semacam kotak peralatan, dengan tiap model yang digunakan sesuai kebutuhan dalam validati tes pendidikan dan psikologik. Model kriteria umumnya digunakan untuk memvalidasi keputusan seleksi dan penempatan. Model isi digunakan untuk menjustifikasi validitas aneka tes prestasi. Sedangkan validasi konstruk digunakan untuk theory-based, interpretasi eksplanatori. Pada banyak kasus, lebih dari satu model dapat ditekankan ke dalam pelayanan. Sebagai contoh, sebuah tes penempatan kursus mungkin ditafsirkan sebagai ukuran konstruk bakat, tetapi dengan berat mempercayakan pada bukti validitas yang berhubungan dengan kriteria, dengan kriteria meliputi sebuah tes prestasi, yang mana ia termasuk dalam bakat, dijustifikasi dengan bukti yang berhubungan dengan isi. Pendekatan kotak peralatan untuk validasi tertanam dalam sistem melalui Equal Employment Opportunity Commision Guidelines (1979) yang dikembangkan dengan beberapa agen federal untuk implementasi penyusunan undang-undang hak-hak sipil.

Pengembangan Validitas Konstruk Tahun 1955-989

Setidaknya ada 3 aspek model berdasarkan konstruk yang secara gradual muncul sebagai prinsip umum validasi, aplikabel pada semua interpretasi yang diajukan:

Pertama, Cronbach dan Meehl (1955) telah menjelaskan bahwa validasi interpretasi dalam term-term konstruk teoretik mencakup satu upaya yang panjang, termasuk pengembangan sebuah teori, pengembangan prosedur pengukuran untuk merefleksikan (secara langsung atau tak langsung) beberapa konstruk teori, pengembangan hipotesis spesifik berdasarkan pada teori, dan uji hipotesis melalui observasi. Pada model kriteria, karakteristik prosedur pengukuran dievaluasi dalam term-term pendapat pakar mengenai bagaimana ubahan teramati harus diukur. Dalam model validitas konstruk evaluasi validitas biasanya memerlukan suatu analisis yang luas (panjang). Hasilnya, pengembangan model validitas konstruk menitikberatkan ketidak-cukupan kebanyakan usaha validasi berdasarkan satu (sering meragukan) koefisien validitas yang sederhana pada pendapat pakar (Cronbach, 1971).

Kedua, dengan memusatkan pada peranan teori yang kompleks secara potensial dalam membatasi atribut. Cronbach dan Meehl (1955; 300) meningkatkan kesadaran yang dibutuhkan untuk interpretasi khusus sebelum mengevaluasi validitasnya. Mereka mengatakan, pembatasan jaringan kerja konstruk, dan derivasi mengarah pada observasi yang terprediksikan, harus eksplisit secara rasional, dengan demikian bukti validasi mungkin diinterpretasikan dengan tepat. Ubahan minat adalah tidak keluar untuk diestimasi; ubahan minat harus dibatsi atau dieksplisitkan. Dalam model criteria, relatif mudah mengembangkan bukti validitas berdasarkan atas a preexisting criterion (misalnya, korelasi tes-kriteria) tanpa menguji rasional untuk kriteria dengan hati-hati. Kenyataan ini dapat dibantah bahwa kerja validasi berdasarkan kriteria yang paling baik jika kriteria dapat diterima pada nilai tampak muka (face value). Untuk memperluas kriteria memerlukan ujian akhir, yang membuktikan ia cenderung ambigu. Kebalikannya pengembangan bukti validitas yang berhubungan dengan konstruk memerlukan interpretasi (jaringan kerja) yang dispesifikasi dalam beberapa bagian. Penekanan perubahan dari validasi tes (seperti ukuran ubahan yang ada) untuk pengembangan dan validasi interpretasi yang diajukan. Ia bukan tes atau skor tes yang divalidasi, tetapi sebuah interpetasi skor yang diusulkan.

Ketiga, fokus validitas konstruk pada uji teori membimbing pada tumbuhnya kesadaran atas kebutuhan terhadap tantangan interpretasi yang diajukan dan pentingnya pertimbangan interpretasi pengganti. Cronbach dan Meehl (1955) tak banyak memperhatikan secara langsung terhadap evaluasi interpretasi pengganti, tetapi dugaan ini implisit dalam fokusnya pada teori dan uji teori, dan ia secara penuh eskplisit dalam subsekuen kerja validitas konstruk (Cronbach, 1971, 1980a, b; Embretson, 1983; Messick, 1989), yang mana memberi sedikit perhatian pada evaluasi interpretasi bersaing. Evaluasi interpretasi bersaing tidak menjadi issue yang besar untuk model kriteria dan model isi.

Model validitas konstruk telah mengembangkan 3 prinsip metodologi (kebutuhan untuk analisis yang luas dalam validasi, kebutuhan untuk pernyataan eksplisit interpretasi yang diajukan, dan kebutuhan untuk mempertimbangkan interpretasi pengganti) dalam konteks validasi konstruk teoterik (APA, 1954; Cronbach dan Meehl, 1955). Sesudah tahun 1955, 3 prinsip itu secara gradual diperluas ke semua upaya validasi secara serius, dan hasilnya, transcended the theory-dependent context dalam mana mereka diperkenalkan. Hasil jaringan memperluas program metodologi sebelumnya oleh Cronbach dan Meehl (1955) ke dalam metodologi umum untuk validasi.

Validitas Konstruk Sebagai Basis Bagi Validitas Yang Menyatu

Akhir tahun 1970-an, pandangan sebelumnya diartikulasikan oleh Loevinger (1957; 636) bahwa yang sejak validitas prediktif, validitas konkuren, dan validitas isi semuanya secar esensial bersifat sementara, validitas konstruk adalah keseluruhan validitas dari sudut pandang ilmiah, menjadi diterima secara luas. Model validitas konstruk dipandang bukan sebagai satu jenis bukti validitas melainkan sebagai pendekatan umum terhadap validitas yang mencakup semua cakupan metode yang luas yang berhubungan dengan uji teori (Messick, 1975, 1980; Tenopyr, 1977; Guion, 1977; Embretson, 1983; Anastasi, 1986).

Messick (1988; 35) mengatakan: Jadi dari perspektif validitas sebagai konsep yang menyatu, semua pengukuran pendidikan dan psikologi harus construct-referenced sebab interpretasi konstruk undergird semua inferensi berdasarkan skor – tak hanya berhubungan dengan interpretive meaningfulness tetapi juga the content-and rcriterion related inferences khusus untuk keputusan terapan dan aksi berdasarkan pada skor tes.

Sebagaimana telah dimengerti, sumber-sumber konsepsi validitas konstruk yang lebih luas ini sebagai sebuah kerangka kerja umum untuk validitas yang sudah dikembangkan oleh Cronbach dan Meehl (1955). Loeninger (1957) telah memperluas konsepsi eksplisit. Ia secara gradual mendukung dari tahun 1960-an sampai 1970-an, dan Messick mengadopsinya sebagai sebuah kerangka kerja umum untuk validitas (Messick, 1975, 1988, dan 1989).

Penekanan validitas konstruk sebagai kerangka kerja yang menyatu untuk validitas secara khusus bermanfaat untuk menekankan peran pervasive dari asumsi-asumsi dalam interpretasi kita. Sebagaimana penjelasan Cronbach (1988; 13): Pertanyaan validitas konstruk berkaitan dengan the moment of a finding yang terletak dalam kata-kata. Mengambil validitas konstruk sebagai prinsip menyatu bagi validitas, meletakkan validitas secara meningkat di dalam tradisi ilmiah yang panjang menyangkut interpretasi yang diajukan (teori) dengan jelas dan pada pokoknya terhadap tantangan konseptual dan empirik.

Bagaimanapun juga, manfaat validitas konstruk sebagai kerangka kerja untuk model validasi yang menyatu juga mempunyai beberapa kekurangan. Model HD teori (Suppe, 1977) yang diadopsi dari Cronbach dan Meehl (1955) utamanya berkenaan dengan kerja berdasarkan model HD yang mencakup rekonstruksi logika teori yang ada sebagai sistem aksioma yang ditafsirkan. Para pendukung model ini secara eksplisit membedakan antara psikologi discovery dan logika justifikasi, dan memusatkan perhatian mereka pada logika justifikasi. Menurut Feigl (1970), rekonstruksi rasional teori adalah operasi peninjauan hal-hal yang sudah terjadi artifisial yang tinggi yang sedikit melakukan kerja ilmuwan kreatif (p. 13), dan sedikit banyak debatable melakukan dengan kerja guru, pembuat kebijakan, dan membuat kebijakan lainnya dari hari ke hari berdasarkan pada skor tes.

Pengertian dasar batasan konstruk secara implisit dengan peranannya dalam jaringan kerja nomologik mengasumsikan bahwa jaringan kerja didasarkan pada seperangkat aksioma yang berhubungan dengan ketat. Riset pendidikan dan ilmu-ilmu sosial umumnya hanya mempunyai sedikit jaringan kerja. Cronbach dan Meehl (1955; 293-294) mengenalkan batasan ini: Gambaran yang digagas adalah satu set postulat yang teratur yang secara bersamaan memerlukan teorema yang diinginkan; beberapa teorema dikoordinasikan dengan dasar pengamatan, sistem yang membentuk definisi implisit dari teori yang sederhana dan memberinya makna empirik secara langsung. Dalam praktiknya, bahkan kebanyakan ilmu-ilmu fisika lebih maju hanya pendekatan ideal ini … Kerja psikologi dengan mentah, rumusannya setengah eksplisit.

Konflik Antara Program yang Kuat dan Program yang Lemah tentang Validitas Konstruk

Kesulitan dalam menerapkan validitas konstruk ke wilayah mana adalah hanya ada sedikit teori yang kokoh (misalnya kebanyakan ilmu-ilmu sosial) sungguh mengarah ambigu dalam makna validitas konstruk. Secara khusus Cronbach (1988; 12-13) membedakan antara program yang kuat dan program yang lemah tentang validitas konstruk: Program yang lemah adalah sheet exploratory empiricism; sesuatu hubungan skor tes dengan ubahan lain adalah didatangkan … Program yang kuat, telah dibahas tahun 1955 (Cronbach dan Meehl) dan dibahas lagi tahun 1982, oleh Meehl dan Golden, memerlukan satu gagasan teoretik seeksplisit mungkin, selanjutnya memikirkan tantangan dengan tenang dan hati-hati.

Program yang kuat tak mungkin tanpa teori yang kuat, tetapi itu ideal. Program yang lemah dengan cukup terbuka bahwa sesuatu bukti sedikit berhubungan dengan skor tes yang relevan dengan validitas.

Perbedaan antara program yang lemah dan program yang kuat dapat membingungkan. Ia mudah menyimpulkan, menggunakan program yang lemah, yang semua bukti validitas adalah bukti yang berhubungan dengan konstruk, dan karena itu semua interpretasi divalidasi menggunakan validitas konstruk. Program yang lemah tentu saja sesuatu tarikan di bawah satu payung yang menyatu. Kenyataannya, tarikannya juga banyak. Ketiadaan garis pedoman yang eksplisit untuk mengidentifikasi sebagian besar bukti yang relevan, program yang lemah secara esensial memberikan tanpa bimbingan terhadap validator. Pada pihak lain, ia tak begitu jelas bahwa program yang kuat perlu mencakup semua jenis usaha validasi. Sebagaimana dimengerti di atas, pada 2 dekade bentuk validitas konstruk yang kuat was reserved for theory-based, interpretasi eksplanatori (Cronbach dan Meehl, 1955; Cronbach, 1971; APA, 1966, 1974), yang berbeda dengan deskriptif interpretasi berdasarkan performansi.

Dalam peninjauan kembali, perkembangan 2 versi validitas konstruk yang bersaing mungkin tak dapat dielakkan. Formulasi yang pertama validitas konstruk memusatkan pada konstruk teoretik yang terdefinisikan secara implisit dalam term-term teori-teori formal. Formulasi yang bagus, elegant, tetapi jarang dikembangkan teori-teori formal dalam pendidikan dan ilmu-ilmu sosial, program yang kuat dari validitas konstruk yang umumnya tidak aplikabel dalam sesuatu seperti bentuk aslinya. Beberapa kemajuan telah terjadi dalam perkembangan metode untuk mengimplementasikan model yang kuat (Campbell dan Fiske, 1959; Cronbach, 1971; Embretson, 1983; Messick, 1989), tetapi kehadiran model validitas konstruk selanjutnya relatif abstrak. Sehingga definisi validitas konstruk telah lepas untuk membuatnya lebih aplikabel, sementara label validitas konstruk berhubungan kuat dengan teori formal tetap bertahan. Sebagai hasilnya, program yang lemah validitas konstruk mengambil pada banyak keabstrakan dari program yang kuat tanpa dukungan teori formal untuk memberinya gigi (menguatkannya), menghasilkan sheer exploratory empiricism (Cronbach, 1988; 12).

Adopsi implisit dari program yang lemah tidak mempunyai pengaruh yang positif pada riset validasi.Program yang kuat telah di-outline oleh Cronbach dan Meehl (1955) yang mempunyai perhatian lebih terbatas tetapi kuat. Yang adalah merencanakan asumsi teoretik dan konklusi, selanjutnya subjek ini menantang secara empirik. Pendekatan yang teradopsi dalam program yang kuat secara esensial adalah uji teori dalam ilmu. Kesulitannya adalah pendekatan ini mempunyai manfaat terbatas pada ketiadaan teori yang berkembang baik untuk tes.

METODE CERITA

Paper Reviu Karya

ABDUL AZIZ ABDUL MAJID :

AL QISSAH FI AL TARBIYAH, MESIR : DAAR AL MAARIF, T. TH.

(ALIH BAHASA: MENDIDIK DENGAN CERITA

OLEH NENENG YANTI, DKK., BANDUNG : PT REMAJA ROSDAKARYA)1




ahmad rohani hm.2

Dan bacakanlah kepada mereka kisah Ibrahim … (Q.S. asy Syu’ara’; 69, 75-81).

Dan hamba-hamba yang baik dari Tuhan Yang Maha Penyayang itu ialah orang-orang yang berjalan di atas bumi dengan rendah hati dan apabila jahil menanya mereka dengan kata-kata yang tidak sopan, mereka mengucapkan yang mengandung keselamatan (Q.S. al Furqan; 63).

Istiftah

Klarifikasi, bahwa paper ini tidak bermaksud untuk “bedah buku” sebagai yang Panitia minta kepada saya. Ada 2 argumen untuk ini :

q Saya bukan “ahli bedah” yang kompeten, karena saya memang tidak mempunyai alat bedah yang relevan dan memadai, utamanya disiplin linguistik (sastra);

q Konotasi “bedah” atau “membedah” adalah merobek atau memotong bagian tubuh (buku) yang sakit, mengoperasi. Dan ini merupakan pekerjaan berat yang tidak mungkin saya lakukan. Bahwa buku Abdul Majid tersebut “tidak sakit”, artinya tidak mengandung penyakit serius yang membutuhkan pembedahan. Pendek kata, buku tersebut relatif “sehat”, paralel dengan maksud penulis buku yang hendak “menyehatkan” dunia pendidikan persekolahan (utamanya guru) yang tengah “menderita peradangan”. Solusi terapiutik yang penulis buku tawarkan adalah menghidupkan dan mengembangkan kisah atau cerita.

Bahwa paper ini lebih tepat disebut “paper reviu” atas buah karya Abdul Aziz Abdul Majid yang berjudul al Qissah fi al Tarbiyah (tahun …?) yang dialih-bahasakan oleh Neneng Yanti Kh., dkk. menjadi Mendidik Dengan Cerita (cetakan II, 2002). Sayang, hingga paper reviu ini ditulis, saya belum menemukan buku asli, buku pertama sebelum dialih-bahasakan. Sehingga saya hanya bisa berasumsi bahwa buku alih-bahasa tersebut memiliki kualitas presisi yang paralel dengan buku aslinya.

Pengalaman sebagai penulis beberapa buku, saya appreciated dan ber-husnudzan bahwa pengalih-bahasaan karya Abdul Majid tersebut telah mendapatkan “restu” yang bersangkutan, sekalipun tidak dicantumkan dalam cetakan buku. Jika demikian halnya, berarti ada saling menghargai hak karya intelektual sekaligus tidak melanggar peundang-undangan hak cipta. Tetapi, jika tidak demikian, betapa “menyakitkan, biadab, dan dzalim” terhadap pemilik karyanya, tentu saja juga merampas hak cipta atau hak intelektual serta perundang-undangannya. Mengapa demikian, sebagai penulis buku saya telah pernah merasakan betapa sakit dan terdzalimi ketika sebuah karya saya (bersama Pak Nidlomun Ni’am) dibajak (dirampas) orang lain yang pernah menjadi dosen saya.

Isi Pokok Buku

Batang tubuh buku Mendidik dengan Cerita ini core-nya berisi 2 bagian :

Ø Conten loading pada bagian pertama secara garis besar berisi metodologi cerita, yaitu bagaimana membangun cerita yang edukatif terhadap siswa, dengan memperhatikan fase-fase kejiwaan anak beserta irama dan karakteristik perkembangan kejiwaan mereka. Dimulai dari memahami hakikat cerita yang edukatif, mengarang cerita yang tematik, mengkomunikasikan cerita di klas (penceritaan), penyimakan cerita dan ungkapan ulang oleh siswa (menurut istilah Social Learning Theory sebagai retention & reproduction), mempersiapkan cerita (penciptaan setting, atau menurut Behaviorism disebut conditioning), metode penyampaian cerita, contoh membuat satuan pelajaran cerita secara tertulis, dan diakhiri dengan supervisi kepala sekolah terhadap proses penceritaan yang dikelola oleh guru di klas.

Ø Pada bagian kedua buku tersebut, berisi 30 jenis contoh cerita pendek (cerpen, dongeng). Setiap akhir cerita diakhiri dengan petunjuk khusus cerita. Penulis buku mengakui, contoh-contoh cerita ini diambil dari teori cerita atau sastra kurun waktu pertengahan tahun 1950-an, sifatnya sederhana dan tidak aktual (p. vi). Meski sederhana dan tidak aktual, contoh-contoh cerita yang dipaparkan hampir semuanya berisi pesan moral. Misal, cerita 3 (p. 82-86) berisi pesan moral perbuatan hati-hati, jangan lalai, dan saling menolong. Cerita 7 (p. 98-101) berisi pesan moral mencari jalan penyelamatan yang baik, dan cara menolong teman. Beberapa cerita lainnya tampaknya bernuasa mistis seperti cerita 8, 9, dan 26. Personifikasi cerita dominan binatang yaitu hampir 50% tokoh peran dalam contoh-contoh cerita berupa binatang.

Pencermatan Reviewer

v Penulis buku (hanya) berasumsi bahwa kisah atau cerita berpengaruh (tanpa ada dukungan data atau hasil riset yang accountable) pada pembentukan moral, (akhlak) dan akal (mengembangkan pengetahuan) anak, kepekaan rasa, imajinasi, dan bahasa (p. vii, dan 4).

v Buku ringkasan hasil studi eksperimen (metodologinya tidak jelas) di Sudan, Mesir, Yordania, dan Libanon ini merupakan sebuah karya yang membawa 3 misi sekaligus : (1) misi moral, pendidikan moral sebagai substansi dari aktivitas mendidik; (2) misi metodologik, artinya penulis buku mengajak pembaca dan komunitas pendidik moral untuk menggunakan cerita sebagai metode pendidikan moral; (3) misi bahasa (sastra), yaitu penulis buku menganjurkan agar pendidikan sastra menjadi kurikulum yang diprogramkan di sekolah. Bahkan cerita menjadi bagian (cabang) dari ilmu bahasa.

v Keyakinan penulis buku, bahwa dimensi-dimensi afektif, kognitif, dan psikomotorik dapat dikembangkan dalam pendidikan melalui metode cerita.

v Asumsi (implisit) penulis buku, bahwa setiap guru (pendidik) adalah guru dongeng, baik karena tabiat (alami) maupun latihan, artinya bercerita itu learnable atau learned.

v Buku tersebut bernuansa Timur Tengah dengan membawa trade-mark yaitu, cerita Aladin, kotak ajaib, jin, dan nama-nama yang bernuansa Arabiyah.

Plus-Minus Karya Abdul Majid

· Plusnya

o Bagi guru (guru dongeng) : buku tersebut sangat membantu terutama guru yang tidak memiliki tabiat mendongeng maupun tidak memiliki kemampuan sastra.

o Bagi siswa : buku tersebut, terutama 30 cerita yang di paparkan dapat mengembangkan daya afek dan kognisi anak.

o Bahwa 30 contoh cerita yang disajikan pada bagian kedua buku tersebut bukanlah cerpen murahan dan mubadzir. Karena semua isi ceritanya memiliki muatan misi edukatif, moral, dan memiliki orientasi konsep-konsep baru bagi si tercerita.

o Penulis buku menghendaki agar cerita tidak sekedar menjadi metode yang berorientasi verbalistik tanpa makna, sebagaimana ciri kelemahan metode cerita itu sendiri. Cerita agar menjadi metode yang dapat mengembangkan dimensi-dimensi kepribadian anak, seperti akal, rasa, imajinasi, moral.

· Minusnya

o Pada pengantar dijelaskan bahwa buku yang mencakup 30 cerita ini disarankan untuk disampaikan pada anak usia 7, 9, atau 10 tahun. Hal ini tanpa disertai argumen psikologik yang memadai, artinya mengapa 30 cerita tersebut diperuntukkan bagi anak (siswa) usia tertentu. Ada karakteristik apa pada usia-usia itu, dan apa relevansi dengan 30 cerita eksklusif itu. Hemat saya, secara psikologik, anak SD itu dibedakan ke dalam 2 klas psikologik yakni klas 1-3 (atau usia 6-9 tahun) sebagai periode transisi dari kanak-kanak, dan klas 4-6 (atau usia 10-12 tahun) sebagai periode kognitif, periode berfikir formal.

o Penulis buku tidak konsisten, ketika dalam pengantar mengkhususkan anak usia 7, 9, dan 10 tahun, tetapi dalam penjelasan mengarang cerita terutama menyangkut ide justru dengan panjang lebar berbicara tema-tema cerita (p. 12-16), mulai dari tema cerita untuk anak usia 3 tahun sampai anak (remaja) usia 19 tahun atau sesudahnya. Mestinya penulis buku lebih konsisten, jika lebih banyak menjelaskan tema cerita yang psikologik sebagai dikehendaki dalam pengantar.

o Buku panduan teknis cerita tersebut sesungguhnya tidak berisi hal baru, terutama 30 contoh cerpennya, sebagai diakui sendiri oleh penulisnya.

o Buah karya Abdul Majid tersebut, sangat teknis, Hanya cocok dibaca oleh audiens praktisi. Bahkan “saking” teknisnya, buku tersebut terkesan mendikte metodologik. Sementara buku tersebut lahir dari setting Timur Tengah. Kemudian dialih-bahasakan dan disosialisasikan di negeri beriklim tropis, yang tentu saja memiliki setting budaya berbeda. “Metodologi Timur Tengah” dapatkah menjawab tantangan modern-posmodern yang telah mencapai tahap teknologi informasi?

o Oleh penulis buku dijelaskan bahwa buku tersebut sebagai ringkasan studi yang panjang dari ujicoba (p. viii). Sayangnya, tidak dijelaskan (secara metodologik riset) oleh penulis buku, apa yang dimaksud dengan studi yang panjang dan ujicoba, dan bagaimana metodologinya djalankan.

o Penulis buku beberapa kali menyinggung keterkaitan kejiwaan anak dan cerita. Masalahnya, acuan paradigma psikologiknya tidak jelas.

o Teknis, beberapa paragraf dari buku tersebut disertai nomor (maksudnya nomor catatan) tetapi hanya berhenti pada penomoran di dalam batang tubuh, tidak ada catatan kaki, atau catatan akhir bahasan atau catatan akhir buku sesuai penomoran yang dikehendaki.

Aplikasi

Buku tersebut, hemat saya positif untuk menghiasi dan memperkaya dunia perceritaan dalam dunia pendidikan. Setidaknya dapat memotivasi dan menginspirasi guru yang tidak memiliki tabiat mendongeng, menuju kesadaran sebagai guru dongeng seperti harapan penulis buku yaitu setiap guru adalah guru dongeng yang berugas bercerita atau mendongeng, terutama guru TK dan guru SD (p. 5). Dengan menggunakan metodologi cerita yang dikenalkan penulis buku, guru “dituntun” bagaimana bercerita atau mendongeng, mulai dari persiapan tertulis dan tak tertulis sampai pada pelaksanaan dan evaluasi hasil cerita.

Melalui buku tersebut, pembaca, terutama guru mendapat “ujaran” dari Abdul Majid bahwa pesan pendidikan dan moral demikian penting dikomunikasikan melalui cerita. Lebih jauh dari itu, menurut hemat saya, kecerdasan majemuk (Howard Gardner, 1983), kecerdasan emosi (Daniel Goleman, 1995), kecerdasan spiritual (Marsha Sinetar, 2000), atau kecerdasan intelektual, apakah inteligensi umum atau kemampuan spesifik (Charles Spearman) atau kecakapan mental primer (L. L. Thurstone), dapat pula dikembangkan melalui media cerita. Demikian pula untuk menerapkan 10 Prinsip Spiritual Parenting (Mimi Doe dan Marsha Walch, 2001) guna menumbuhkan dan merawat jiwa anak-anak dapat dioperasionalisasikan melalui media cerita.

INSTRUMEN PENELITIAN

ANALISIS INSTRUMEN PENELITIAN

Tiga Persyaratan Isntrumen

Penelitian ilmiah, khususnya penelitian behavioral, lebih khusus lagi penelitian kependidikan, sering melibatkan empat macam instrumen: questionaire, test, observation, dan/atau rating scale. Apapun instrumen yang digunakan dalam suatu penelitian ilmiah, yakni dari keempat macam dimaksud, mereka harus memenuhipersyaratan: kesahihan, keterandalan, ketelitian.

Kesahihan instrumen, adalah tingkat kemampuan suatu instrumen untuk mengungkapkan sesutau yang menjadi sasaran pokok pengukuran yang dilakukan dengan instrumen itu. Artinya, suatu instrumen dipandang sahih jika ia dapat mengukur apa saja yang hendak diukur, dapat mengungkap apa yang hendakdiungkap, dapat menembak tepat sasaran yang akan tembak. Kesahihan instrumen dapat ditempuh dengan beberapa cara: (1) uji kesahihan logik, content validity (validitas teoritik); (2) construct validity (validitas empirik) dengan cara menguji kesahihan butir-butir terhadap faktor (indikator)nya, untuk instrumen yang memiliki lebih dari satu faktor melalui analisis faktor (versi SPSS/PC+ dan sejenisnya), atau melalui uji butir-total (versi SPS); (3) concurrent validity; (3) predictive validity.

Keterandalan instrumen, yakni kemantapan, keajegan, atau stabilitas hasil amatan. Artinya, suatu amatan dalam keadaan tak berubah dalam kurun waktu antara amatan pertama, amatan kedua, atau amatan selanjutnya. Dua cara untuk uji keterandalan: repeated measures, dan one shot. Untuk instrumen observasi, atau instrumen lainnya yang melibatkan dua atau lebih rater terdapat cara tersendiri, cara tambahan, yakni dengan uji keterandalan (uji kesepakatan) inter-rater. Sementara, untuk instrumen yang melibatkan beberapa faktor (aspek, indikator) cara uji keterandalan harus dimulai dari uji keterandalan faktor kemudian dilanjutkan dengan uji keterandalan gabungan.

Ketelitian instrumen, adalah akurasi hasil amatan (pengukuran) yang dicerminkan oleh adanya kedekatan bacaan dari alat ukur dengan keadaan yang sesungguhnya. Artinya, jika mengukur didefinisikan sebagai menyidik, mengidentifikasi

magnitude (besaran) objek, maka ketelitian menunjuk sebagai kemampuan alat ukur untuk memberikan hasil ukur yang mendekati magnitude yang sesungguhnya dari objek ukur (Sutrisno Hadi; 1990). Misal seorang peneliti hendak mengukur "sikap dosen terhadap profesinya" dengan menggunakan skala sikap sebagai alat ukurnya. Perangkat (skala sikap) ini distratifikasi menjadi: SS (Sangat Setuju), S (Setuju), R (Ragu-ragu) atau netral, TS (Tidak Setuju), STS (Sangat Tidak Setuju). Kelima tingkatan jawaban ini dipandang sebagai mendekati keadaan tingkatan sikap yang sesungguhnya. Syarat ketelitian yang demikian memiliki makna penting karena menjadi tumpuhan discriminating power bacaan- bacaan yang dihasilkan oleh instrumen.

Menyusun dan Menguji Instrumen

Banyak peneliti memiliki ketidak-mampuan dalam menyusun instrumen penelitian. Hal ini dipandang wajar tetapi naif, sebab instrumen penelitian merupakan jantungnya kegiatan penelitian. Peneliti yang tidak mampu menyusun instrumen tidak perlu memaksakan diri. Adalah sah, menggunakan instrumen yang relevan yang telah ada sebelumnya, atau instrumen yang telah teruji kesahihannya karena dihasilkan oleh pakar yang berkompeten. Peneliti yang menyusun instrumen sendiri, memerlukan wawasan memadai dibidang materi yang diteliti maupun bidang metodologi instrumentasi, baik menyangkut konstruksi instrumen maupun cara analisisnya. Menyusun atau mengkonstruksi instrumen harus menempuh tiga langkah pokok: (1)

construct definition, definition of concept, atau content definition; (2) identification of factor; (3) items construction. Selanjutnya, secara praktis ditindaklanjuti dengan:

1) Menyusun kisi-kisi instrumen

2) Menyusun butir-butir instrumen

3) Melakukan expert judgment

4) Melakukan ujicoba instrumen

5) Menganalisis hasil ujicoba melalui prosedur:

(1) uji keterandalan antar-rater;

(2) uji kesahihan butir;

(3) uji keterandalan butir;

(4) uji kesahihan faktor (Sutrisno Hadi;1990).

Ujicoba Instrumen

Ujicoba intrumen dilakukan untuk mendapatkan alat ukur yang sahih dan reliable sehingga dapat dipergunakan untuk menjaring data yang dibutuhkan. Dikatakan sahih apabila alat ukur yang dimaksud dapat menggambarkan dengan sebenarnya apa yang diukur, sedangkan dikatakan reliabel atau andal jika alat ukur itu menghasilkan ukuran yang relatif andal, tetap atau ajeg meski dilakukan berulang-ulang dalam waktu yang berbeda. Perhatikan uraian di depan. Melalui ujicoba, alat ukur dapat disempurnakan antara lain dengan cara menghilangkan butir-butir instrumen yang tidak sahih, dan memperbaiki butir-butir instrumen yang kurang dimengerti oleh responden. Pengambilan jumlah responden dan lokasi ujicoba disarankan agar berpijak pada pendapat ini: ujicoba instrumen khususnya angket cukup diambil responden sebanyak 30 orang yang keadaannya relatif sama dengan responden sesungguhnya (Masri Singarimbun & Sofian Effendi, 1989).

Beberapa Formula untuk Uji Instrumen

Uji keterandalan antar-rater

Koefisien kesepakatan antar pengamat (rater), disebut pula koefisien

konkordansi. Koefisien konkordansi ini dicari dengan formula Ebel yang

dikemukakan kembali oleh J. P. Guilford (1954:395) sebagai berikut:

Vp - Ve

rkk = ----------

Vp

di mana,

rkk = koefisien keterandalan rating untuk

2 rater (penilai)

Vp = variance for persons (variansi subjek)

Ve = variance for error (variansi sisa).

Menurut Sutrisno Hadi (1991), dengan formula Ebel itu hasilnya tidak berbeda dengan formula Hoyt (meskipun formula ini lebih sering dipakai untuk menghitung koefisien keandalan butir), sebagaimana dikemukakan kembali oleh J. P. Guilford (1954:384):

Vr Ve - Vr

rtt = 1 - ---- = ----------

Ve Ve

di mana,

rtt = koefisien keterandalan yang dicari

Vr = variansi residu

Ve = variansi subjek.

Koefisien konkordansi bisa diterima jika taraf signifikansi 5 % atau peluang kesalahannya adalah ≤ 0,05 (yang lazim dipakai dalam penelitian sosial, penelitian pendidikan). Jika ternyata peluang kesalahannya lebih besar dari ketentuan itu, yang berarti antar pengamat tidak ada kecocokan pengamatan, maka butir yang dinilai harus digugurkan dan tidak boleh dipakai sebagai bahan analisis penelitian (Sutrisno Hadi, 1991).

Uji kesahihan butir-total

Formula awalnya Pearson Product Moment Correlation, sebagai dikemukakan

Sutrisno Hadi (1995):

NåXY - (åX) (åY)

rxy = -----------------------------------------------

Ö [{NåX² - (åX)²)} {NåY² - (åY)²)}]

di mana,

X = sekor butir tertentu

Y = sekor total

N = jumlah subjek ujicoba.

Supaya koefisien korelasinya (rxy) tidak over-estimate, maka perlu dikoreksi

dengan melakukan part-whole correlation atau korelasi bagian (butir) dengan

total, koefisien korelasinya rbt, sehingga formulanya menjadi:

(rxy) (SBy) - SBx

rbt = -----------------------------------------

Ö{(Vy+Vx) - 2(rxy) (SBy) (SBx)}

di mana,

rbt = korelasi bagian-total

rxy = korelasi momen tangkar

SBy = simpang baku total (komposit)

SBx = simpang baku bagian (butir)

Vy = variansi total

Vx = variansi bagian (butir).

Untuk menentukan kesahihan butir digunakan taraf signifikansi 5 % atau peluang kesalahan ≤ 0,05. Jika ternyata peluang kesalahannya lebih besar dari ketentuan itu, yang berarti butir instrumen yang dinilai harus digugurkan dan tidak boleh dipakai sebagai bahan analisis penelitian.

Keterandalan Instrumen

Butir-butir alat ukur setelah dinyatakan sahih, selanjutnya diuji

reliabilitas atau keterandalannya melalui dua tahap:

(1) Uji keterandalan tiap faktor dengan teknik uji keterandalan one shot (ukur sekali) antara lain dengan formula Hoyt yang dikemukakan kembali oleh J. P. Guilford (1954:384):

Vr Ve - Vr

rtt = 1 - ---- = ---------

Ve Ve

di mana,

rtt = koefisien keterandalan yang dicari

Vr = variansi residu

Ve = variansi subjek.

Karakteristik formula Hoyt ini: (a) digunakan untuk butir dikotomi atau nirdikotomi; (b) jawaban yang kosong bisa digugurkan; (c) tidak terikat oleh persyaratan tertentu; (d) hasilnya akan sama dengan Alpha Cronbach yaitu sebagai generalized model untuk uji keterandalan butir (Sutrisno Hadi, 1991). Selain fortmula Hoyt, bisa digunakan pula formula Alpha dari Cronbach (1951). Formula Alpha digunakan apabila suatu instrumen mengungkap hal yang sama dan konsepnya tunggal yakni satu komponen dan tidak terdapat jawaban yang benar atau salah, jawaban bersifat gradasi. HJX. Fernandes (1984) menjelaskan, apabila instrumen menggunakan model skala Likert, indeks keterandalannya dapat dihitung dengan koefisien Alpha dari Cronbach. Formulanya sebagaimana yang dikemukakan kembali oleh J. P. Guilford (1954):

n åVi

a = (------ } { 1 - ------ }

n - 1 Vt

di mana,

a = koefisien reliabilitas alpha

åVi = jumlah variansi bagian 1

Vt = variansi total

n = jumlah bagian.

(2) Setelah uji keterandalan tiap faktor selesai dilakukan uji keterandalan instrumen secara keseluruhan (keterandalan sekor gabungan), dengan menggunakan formula dari Mosier (1943) sebagaimana dikemukakan kembali oleh J. P. Guilford (1954) sebagai berikut:

åjs²j - åjs²jrjj

rtt = 1 - --------------------------------

åjs²j + 2åwjwksjskrjk

di mana,

rtt = koefisien keterandalan sekor gabungan

wj = bobot relatif komponen j

wk = bobot relatif komponen k

sj = simpangan baku komponen j

sk = simpangan baku komponen k

rjj = koefisien keterandalan masing-masng

komponen

rjk = koefisien korelasi antara dua

komponen (j dan k) yang berbeda.

Kriteria untuk menentukan keterandalan suatu instrumen adalah, jika suatu instrumen memiliki indeks atau koefisien keterandalan > 0,50 dinyatakan sebagai instrumen yang andal (Ebbel, 1979 dalam Fernandes, 1984, dan Guy, 1981).

Analisis Faktor

Kesahihan konstrak dari suatu instrumen dapat (lebih tepat) diuji dengan teknik analisis faktor. Analisis faktor untuk mengetahui sejauhmana suatu instrumen mengukur sifat dan konstrak teoritik (Ary, Jacobs, dan Razavieh, 1985), atau menguji hipotesis mengenai eksistensi konstrak-konstrak dalam kelompok ubahan (Sumadi Suryabrata, 1982), serta untuk menunjukkan hubungan-hubungan antara nilai tiap-tiap butir dan dapat mengelompokkan butir-butir dimaksud pada faktor tertentu (Kerlinger, 1986). Analisis faktor adalah generic term untuk sejumlah teknik matematik dan statistik yang berbeda tetapi berhubungan, yang dirancang untuk meneliti sifat hubungan-hubungan antar variabel- variabel dalam perangkat (set) tertentu, yang lain dari teknik- teknik yang lain. Masalah dasarnya adalah menentukan apakah variabel-variabel n dalam suatu perangkat menunjukkan pola-pola hubungan satu sama lain, hingga perangkat tersebut dapat dipecah menjadi, katakan, sub-perangkat m, yang masing-masing terdiri dari kelompok variabel yang cenderung untuk lebih berhubungan satu dengan lainnya dalam sub-perangkat daripada dengan variabel- variabel lain dalam sub-perangkat yang lain. Tujuan utama analisis faktor adalah menentukan apakah suatu perangkat variabel dapat digambarkan berdasarkan jumlah dimensi atau faktor yang lebih kecil daripada jumlah variabel, dan menentukan apa dimensi-dimensinya. Dengan kata lain, untuk menunjukkan trait atau karakteristik apa yang dimiliki masing-masing faktor dimaksud (Siswoyo Hardjodipuro, 1988).Konsep dasar analisis faktor berakar pada konsep-konsep dari teori regresi: korelasi parsial dan korelasi ganda. Prosedurnya secara umum ada tiga: (a) komputasi correlation matrix; (b) initial factors ekstraksi faktor awal; (c) rotasi sampai diperoleh hasil akhir yang lebih sederhana dan lebih mudah diinterpretasikan. Langkah lebih lanjut bisa diteruskan dengan perhitungan factor scores (sekor faktor) yang dapat dipakai untuk kepentingan analisis data lebih lanjut dalam penelitian, khususnya untuk kepentingan eksploratori, konfirmatori, atau pengembangan alat ukur yang ditargetkan pada pembuatan indeks baru yang akan diolah pada tahap berikutnya (Sumarno, 1996). Untuk memahami analisis faktor sebagai alat untuk mengungkap order (susunan), pattern (pola), atau regularity (keteraturan) dalam data, terlebih dahulu kita perlu memahami tiga konsep utama: (a) patterned variation (variasi berpola); (b) vector; (c) dimensi Identifikasi instrumen yang dapat menggambarkan suatu konstrak yang diteliti dilakukan melalui: (1) analisis muatan faktor masing-masing butir bagi faktornya; (2) komunalitas butir; (3) eigenvalue; (4) cummulative percent of variance faktor.

Kriteria yang dipergunakan untuk melihat konstrak dari suatu instrumen adalah: (1) butir yang baik, yang substansial yakni yang dapat diterima adalah yang memiliki muatan faktor ³ 0,5 bagi faktornya; (2) komunalitasnya ³ 0,25 (berasal dari kuadrat 0,5; (3) faktornya memiliki eigenvalue > 1; (4) cummulative percent of variance ³ 50 % untuk sejumlah faktornya. Kriteria ini merujuk pada Tabachnick & Fidell (1983) dan Marija J. Norusis (1986).Namun, sebelum keempat kriteria itu ditinjau, perlu dilihat terlebih dahulu hasil uji persyaratan analisis faktor yang mencakup: (1) nilai ukuran sampling adequacy atau KMO. Menurut Kaiser nilai KMO 0,60 dikategorikan cukup, sebab itu dalam analisis kita bisa menggunakan patokan KMO ³ 0,60; (2) nilai Bartlett Test of Sphericity yang menunjukkan identitas matrik. Patokannya, nilai Bartlett Test of Sphericity dinyatakan signifikan jika tingkat signifikansinya ³ 0,05; (3) residu yang > 0,05 tidak melebihi 50 % atau > 50 % (Nurosis, 1986, Kim & Muller 1978).

Daftar Bacaan

* Azwar, Saifuddin. (1986). Seri pengukuran psikologi reliabilitas dan validitas interpretasi dan komputasi. Yogyakarta: Liberty.

* ----------------. (1988). Sikap manusia. Yogyakarta: Liberty.

* Badawi, Ahmad. (1985). Penyusunan dan pembakuan alat pengukur kualitas mengajar mahasiswa fakultas keguruan. Disertasi tidak diterbitkan, FIP IKIP YOGYAKARTA, Yogyakarta.

* Fernandes, H.J.X. (1984). Evaluation of education program. Jakarta: National Educational Planning, Evaluation and Curriculum Development.

* ---------------. (1984). Testing and measurement. Jakarta: National Educational Planning, Evaluation and Curriculum Development.

* ---------------. (1984). Attitude measurement in measurement scale. Jakarta: National Educational Planning, Evaluation and Curriculum Development.

* Guildfold, J.P. (1954). Psychometric methods. New York: McGraw Hill Book Company.

* Guy, L.R. (1981). Educational research. Colombus, Ohio: A Bill & Hawell Company.

* Hadi, Sutrisno. (1991). Analisis butir untuk instrumen angket tes dan skala nilai dengan basica. Yogyakarta: Andi Offset.

* --------------. (1995). Buku manual SPS (seri program statistik) paket midi. Yogyakarta: UGM.

* Hardjodipuro, Siswoyo. (1988). Aplikasi komputer dan analisis multivariat: analisis faktor. Jakarta: Detjen Dikti Depdikbud RI.

* Henerson, Marlene E., et al. (1988). How to measure attitudes. London: Sage Publications Beverly Hills.

* Joan, G. & Cooker, Homer. (1979). Classroom observation keyed effectiveness research. Georgia: Observer Trainning Manual, Correlation.

* Kerlinger, F. N. (1978). Foundation of behavioral research (Asas- asas penelitian behavioral); Pent.: Simatupang, Landung R. & Koesoemanto, H.J. Yogyakarta: Gama University Press.

* Norusis, M.J. (1986). SPSS/PC+. USA: SPSS Inc.

* Shaw, Marvin. & Wrigh, Jack M. (1967). Scale for measurement of attitudes. London: McGraw-Hill Book Company.

* Singarimbun, Masri & Effendi, Sofian. (1989). Metode Penelitian Survai. Jakarta: LP3ES.

* Sumarno. (1996). Analisis faktor: penerapannya dalam SPSS. Handout Kuliah PPs Progdi PEP IKIP Yk. Yogyakata.

* Suryabrata, Sumadi. (1982). Metodologi penelitian analisis kuantitatif. Yogyakarta: Lembaga Pendidikan Doktor UGM.

* Tabachnick, B.G. & Fidell, L.S. (1983). Using multivariat statistics. New York: Harper & Row Publication.

SISTEM EVALUASI PENGAJARAN

SISTEM EVALUASI PENGAJARAN

I

Sebagai awal pembahasan dalam paper ini, penulis kemukakan beberapa catatan kritis terlebih dahulu :

Pertama, pemahaman mengenai sistem ada dua, sistem sebagai totalitas yang meliputi banyak komponen yang bersifat komplementer dan interdependensis, dan sistem sebagai teknik, metode atau cara. Yang terakhir ini yang digunakan penulis dalam paper ini.

Kedua, berkaitan dengan penilaian, terdapat beberapa istilah lainnya yang relevan bahkan sering terjadi missconception kalau tidak over-lapping, yaitu evaluasi, pengukuran, tes, ujites atau ujian. Kata penilaian merupakan terjemahan dari assessment yakni proses pengumpulan informasi yang digunakan untuk mengambil keputusan-keputusan tentang … (Anthony J. Nitko, 1996). Evaluasi sebagai transiterasi dari evaluation yaitu suatu proses untuk menilai mutu performansi. Pengukuran sebagai terjemahan dari measurement, suatu proses pendeskripsian performansi dengan menggunakan skala kuantitatif, atau proses kuantifikasi dari kualitas performansi. Tes adalah transiterasi dari kata test. Adapun ujites adalah kata lain dari tes. Tes atau ujites (ujian, examination) adalah sekumpulan pertanyaan yang harus dijawab, suatu / serangkaian tugas yang harus dikerjakan, atau suatu . sejumlah permasalahan yang harus diselesaikan / dipecahkan / dicarikan solusinya. Dalam bahasa sehari-hari istilah penilaian, evaluasi, pengukuran, tes, dan ujites (ujian) tidak mendapat perhatian akan perbedaannya. Semua istilah ini seing diwakili dengan salah satu ungkapan saja, misal penilaian, evaluasi, tes, atau ujian, bahkan menggunakan istilah lain yang maksudnya sama yaitu mid semester atau semesteran. Istilah-istilah ini tidak harus dipisahkan tetapi bisa dibedakan dan hendaknya dipahami secara utuh oleh karena masing-masing memiliki keterkaitan erat :

Venn Diagram Ketiga, bahwa pengajaran adalah perpaduan dari dua aktivitas (proses), belajar dan mengajar (Ahmad Rohani HM., 1995; 4), subjek ajar utamanya adalah pelajar (mahasiswa), sedangkan dosen adalah subjek ajar pertama. Istilah pengajaran itu sendiri sebenarnya istilah lama dalam dunia pendidikan (keguruan). Istilah yang lebih aktual adalah pembelajaran. Baik pengajaran maupun pembelajaran, keduanya menggantikan istilah instructional yang arti lughawinya bahan-bahan pelajaran.

Para pakar pendidikan (Indonesia) kontemporer dan bahkan dunia persekolahan (dan perguruan tinggi ?) kita, dewasa ini menggunakan istilah pembelajaran. Pilihan ini diambil bukan sekedar pertimbangan teknis, melainkan pertimbangan paradigmatik (student oriented, student centered) dan substansial. Penulis cenderung menggunakan istilah yang terakhir meskipun istilah yang pertama tidak salah, sebagaimana yang dipergunakan oleh Panitia Penataran Sistem Belajar-Mengajar. Yang harus dipahami lebih jauh adalah sebagian pihak masih memiliki pemahaman mengajar yang bersifat tradisional dan konvensional (kuno, out of date) yakni mengajar hanya sebagai memberi ilmu pengetahuan atau bahan pelajaran dengan metode ceramah, dosen mengklaim diri sok tahu dan serba tahu sehingga ia ada di pihak yang aktif. Sementara itu, belajar dipahami sebagai bersifat pasif, mahasiswa mendengarkan, mencatat, menelan atau menerima ceramah dosen yang sering dianggap pasti betul. Hal ini dikarenakan dosen memiliki anutan paradigma teacher (lecturer) centered / teacher oriented, yang harus diminimalisasi oleh para dosen sekarang.

II

Sistem penilaian pengajaran (pembelajaran, perkuliahan) dalam konteks ini maksudnya adalah suatu cara kegiatan (proses) pengumpulan informasi guna pengambilan keputusan atau menilai performansi mahasiswa melalui pengukuran dengan menggunakan teknik tes maupun nirtes. Kegiatan ini dilakukan dengan mengikuti prosedur yang sistematis, dan menggunakan paradigma pengajaran sebagai berikut :

Text Box: PELAKSANAAN PENGAJARANText Box: PERENCANAAN PENGAJARANCycle Diagram

Bahwa pengajaran harus direncanakan dengan baik, dan perencanaan harus dilaksanakan dengan baik pula, selanjutnya akibat keduanya dilakukanlah penilaian / evaluasi yang hasilnya bermanfaat untuk penyusunan perencanaan pengajaran kemudian dan perbaikan pelaksanaan pengajaran selanjutnya.

Bagian penting dalam sistem penilaian pengajaran antara lain adalah masalah pengukuran dan tes. Kedua hal inilah yang disajikan dalam pembahasan selanjutnya.

Bahwa pengukuran (menentukan kedudukan objek dalam rentangan sifat yang diukur, harus diketahui dahulu rentangan sifatnya) dalam bidang pendidikan / pengajaran sesungguhnya tercakup dalam domain psikologis, sifatnya latent (tersembunyi, tidak tampak). Artinya, hasil pendidikan / pengajaran (dalam hal ini kemampuan akademik atau prestasi belajar, domain kognitif) tidak dapat diketahui secara langsung dan tampak. Ia baru dapat diketahui setelah dirangsang dengan alat perangsang yang namanya tes (achievement test) yang difungsikan sebagai alat untuk

merekam, memotret, atau mengungkap kemampuan tersembunyi yang berupa prestasi belajar. Tampakan kemampuan ini berupa response atau jawaban atas sejumlah pertanyaan dalam tes. Penjelasan ini dengan mudah dapat digambarkan sebagai berikut :

Paradigma di atas menunjukkan bahwa pengukuran bidang pendidikan / pengajaran yang bersifat psikologis dilakukan secara indirect measurement (tidak langsung), tidak seperti mengukur suhu badan, tinggi badan, berat badan dan selainnya. Oleh karena itu, terdapat beberapa kemungkinan terhadap pengukuran tidak langsung : (1) jika alat ukur (tes) yang dibuat dan dipergunakan tidak berkualitas baik response yang muncul juga tidak baik; (2) secara teoretik error measurement pasti terjadi, besar-kecilnya tergantung kualitas alat ukur yang dibuat; (3) jika skala pengukurannya (nominal, ordinal, interval, dan rasio) tidak jelas, menjadi tidak jelas pula penskoran dan analisis terhadap response yang muncul sehingga hasil akhirnya yang berupa nilai menjadi unrepresentativable.

Untuk menghindari, atau setidak-tidaknya meminimalisasi kemungkinan-kemungkinan di atas pengukuran pendidikan / pengajaran harus dilakukan dengan perencanaan yang baik dan prosedur yang sistematis.

III

Bahwa perencanaan pengukuran pendidikan / pengajaran yang baik adalah apabila telah jelas construct dan indikator-indikator atau dimensi-dimensi yang hendak

diukur, jelas pula skala pengukuran yang digunakan. Terdapat 4 hal pokok yang harus dipahami dalam perencanaan pengukuran pendidikan / pengajaran : (1) jelaskan construct (latent traits, cirri terpendam) yang hendak diukur; (2) untuk mengukurnya stimulus (alat ukur) apa yang digunakan, jika tes prestasi, bagaimana ia dikembangkan; (3) apa bentuk response yang diharapkan muncul dari peserta tes: (4) bagaimana menafsirkan secara memadai atas response yang muncul dari peserta tes. Jika keempat kegiatan ini dilakukan dengan tepat dan kronologis maka akan muncul skor dari kemampuan terpendam yang dikehendaki. Tetapi, betapa tidak mudah melakukan empat kegiatan dimaksud, kalau pun keempatnya telah dapat dilaksanakan masih mungkin muncul sejumlah masalah yakni : (1) validity, khususnya construct validity; (2) reliability; (3) error measurement, bagaimana memaksimalkan kemunculan true score dan meminimalisasi error score, untuk hal ini teori skor harus dipahami. Bahwa secara teoretik, skor tampak (observed score, X) merupakan gabungan dari skor tulen (true score, T) dan skor salah (error score, E), rumus perrsamaannya

Pengukuran pendidikan / pengajaran harus dilakukan melalui prosedur yang sistematis. Artinya pelaksanaan pengukuran pendidikan / pengajaran khususnya yang menggunakan alat ukur tes, tes prestasi belajar, harus dikembangkan melalui tahapan-tahapan pengembangan tes sehingga dapat menghasilkan suatu konstruksi tes yang baik. H.J.X. Fernandes (1984; 9) mengemukakan langkah-langkah pengembangan tes prestasi belajar : pertama, test plan, meliputi (a) define general purposes (b) prepare test blueprint (c) specify item format, types of items to be used (d) plan the leval and range of item difficulty (e) plan the number of items and length of the test (f) prepare the item writing and item review (g) specify the types of norms that will be prepared; kedua, tryout of test items, meliputi (a) tryout sample (b) item tryout and analysis (c) student directions (d) administration directions, time limit; ketiga, technical analysis, meliputi (a) estimate Mean test score (b) estimate tha Standard Deviation of test scores (c) estimate Reliability.

BACAAN YANG BERMANFAAT

  1. Ahmad Rohani HM. (1995). Pengelolaan pengajaran. Jakarta : Rineka Cipta Jakarta.
  2. ------------------------. (1996). Teknik evaluasi pengembangan tes hasil belajar. Materi Penataran Guru Bidang Studi Ciri Khusus SLTP dan SMU / SMK Muhammadiyah Se Jawa Tengah Di Bandungan.
  3. Anthony J. Nitko. (1996). Glossary of educational assessment terms. Jakarta : National Consultans.
  4. Benjamin S. Bloom, et al. (1974). Taxonomy of educational objectives the classification of educational goals. New York : David McKay Company, INC.
  5. Conny Semiawan Stamboel. (1986). Prinsip dan teknik pengukuran dan penilaian di dalam dunia pendidikan. Jakarta : Mutiara Sumber Widya.
  6. Dali S. Naga. (1992). Pengantar teori sekor. Jakarta : Gunadarma.
  7. H.J.X. Fernandes. (1984). Testing and measurement. Jakarta : National Education Planning, Evaluation and Curriculum Development.
  8. Jum C. Nunnally, Jn. (t.th.) Introduction to psychological measurement. New York : McGraw-Hill Book Company.
  9. Ratna Sayekti Rusli. (1988). Tes dan pengukuran dalam pendidikan. Jakarta Ditjen Dikti.
  10. Saifuddin Azwar. (1996). Reliabilitas dan validitas interpretasi dan komputasi. Yogyakarta : Liberty.
  11. --------------------. (1998). Sikap manusia teori dan pengukurannya. Yogyakarta : Liberty
  12. W. James Popham. (1973). Evaluating instruction. New York : Prentice-Hall, Inc., Englewood Cliffs.