A. Pengertian
Pengukuran merupakan proses kuantifikasi suatu atribut. Pengukuran yang diharapkan akan menghasilkan data yang valid harus dilakukan secara sistematis. Berbagai alat ukur telah berhasil diciptakan untuk melakukan pengukuran atribut dalam bidang fisik seperti berat badan, luas bidang datar, dsb. Namun, pengukuran dalam bidang non-fisik, khusunya dalam bidang psikologi, masih dalam perkembangan mungin belum pernah mencapai kesempurnaannya. Beberapa tes dan skala psikologis standar dan yang telah terstandarkan kualitasnya belum dapat dikatakan optimal.
Terus berkembang pesatnya teori pengukuran pun memungkinkan kita untuk meningkatkan usaha guna mencapai keberhasilan dalam penyusunan dan pengembangan alat-alat ukur psikologi yang lebih berkualitas.
Ada beberapa alasan pengukuran psikologis sangat sukar atau bahkan mungkin tidak akan pernah dapat dilakukan dengan validitas, reliabilitas dan objektivitas yang tinggi, antara lain :
a. Atribut psikologi bersifat latent atau tidak tampak, oleh sebab itu, apa yang kita miliki bersifat konstrak yang tidak akan dapat diukur secara langsung. Dan batasan konstrak psikologis tidak dapat dibuat dengan akuransi yang tinggi serta tidak menutup kemungkinan terjadinya tumpang tindih (overlapping) dengan konsep atribut lain. Di samping itu, konstrak psikologis tidak mudah pula untuk dioperasionalkan.
b. Aitem-aitem dalam skala psikologis didasari oleh indikator-indikator perilaku yang jumlahnya terbatas.
c. Respon yang diberikan oleh subjek sedikit-banyak dipengaruhi oleh variabel-variabel tidak relevan seperti suasana hati subjek, kondisi dan situasi di sekitar, kesalahan prosedur administrasi, dsb.
d. Atribut psikologis yang terdapat dalam diri manusia stabilitasnya tidak tinggi. Banyak yang gampang berubah sejalan dengan waktu dan situasi.
e. Interpretasi terhadap hasil ukur psikologi hanya dapat dilakukan secara normatif. Dalam istilah pengukuran, bahwa dalam pengukuran psikologi lebih banyak sumber error.
Keterbatasan-keterbatasan pengukuran dalam bidang psikologi inilah yang menjadikan prosedur konstruksi skala-skala psikologi lebih rumit.
Menurut Syaifuddin Azwar (2005:3-4), skala psikologi sebagai alat ukur yang memiliki karakteristik khusus
a. cenderung digunakan untuk mengatur aspek bukan kognitif melainkan aspek afektif,
b. stimulusnya berupa pertanyaan atau pernyataan yang tidak langsung mengungkap atribut yang hendak diukur, melainkan mengungkap indikator perilaku dari atribut yang bersangkutan,
c. jawabannya lebih bersifat proyektif,
d. selalu berisi banyak item berkenaan dengan atribut yang diukur,
e. respon subyek tidak diklasifikasikan sebagai jawaban “benar” atau “salah”, semua jawaban dianggap benar sepanjang sesuai keadaan yang sebenarnya, jawaban yang berbeda diinterpretasikan berbeda pula.
Menurut Cronbach (1970) karakteristik skala psikologis di atas tersebut sebagai ciri pengukuran terhadap performansi tipikal (typical performance), yaitu performansi yang menjadi karakter tipikal seseorang dan cenderung di munculkan secara sadar atau tidak sadar dalam bentuk respon terhadap situasi-situasi tertentu yang sedang dihadapi. Dalam penerapan psikodiagnostika, skala-skala performansi tipikal digunakan untuk mengungkapkan aspek-aspek afektif seperti minat, sikap, dan berbagai variable kepribadian lain, semisal agresivitas, self-esteem, locus of control, motivasi belajar, kepemimpinan, dsb.
Skala psikologi biasanya digunakan untuk mengungkapkan konstrak atau konsep psikologis yang menggambarkan aspek kepribadian individu seperti : tendensi agresifitas, sikap terhadap sesuatu, self esteem, kecemasan, persepsi, dan motivasi.
Faktor-faktor yang dapat melemahkan validitas
Validitas adalah karakteristik utama yang harus dimiliki oleh setiap skala. Sehingga suatu skala berguna atau tidak ditentukan oleh tinggkat validitasnya. Dalam rangka itu perancang skala harus mengetahui beberapa faktot yang dapat mengancam validitas skala psikologi, antara lain :
a. Identifikasi kawasan ukur yang tidak cukup jelas
Untuk mengukur “sesuatu” maka sesuatu itu harus dikenali terlebih dahulu dengan baik. Apabila atribut psikologi sebagai tujuan ukur tidak diidentifikasi dengan benar maka akan terjadi kekaburan. Kekaburan ini disebabkan perancang skala tidak mengenali dengan baik batas-batas atau definisi yang tepat mengenai kawasan (domain) atribut yang hendak diukur.
Ketidaktepatan identifikasi kawasan ukur dapat pula menyebabkan skala menjadi tidak cukup komprehensif daalam mengungkapkan atribut yang dikehendaki.
b. Operasionalisasi konsep yang tidak tepat
Kejelasan konsep mengenai atribut yang hendak diukur memungkinkan perumusan indikator-indikator perilaku yang menunjukkan ada tidaknya atribut yang bersangkutan. Rumusan indikator perilaku berangkat dari operasionalisasi konsep teoritik mengenai komponen-komponen atau dimensi-dimensi atribut yang bersangkutan menjadi rumusan yang terukur (measurable). Namun, jika rumusan tersebut tidak operasional atau pun masih mempunyai penafsiran ganda akan menimbulkan aitem-aitem yang tidak valid, sehingga menghasilkan skala yang tidak valid pula.
c. Penulisan aitem yang tidak mengikuti kaidah
Aitem-aitem yang maksudnya sukar dimengerti oleh responden karena terlalu panjang ataupun susunan tata bahasnya yang kurang tepat sehingga mendorong responden memilih jawaban tertentu saja, yang memancing reaksi negatif dari responden, yang mengandung muatan social desirability tinggi, dan yang memiliki cacat semacamnya dihasilkan dari proses penulisan aitem yang tidak sesuai dengan kaidah-kaidah standar. Aitem seperti itu tidak akan berfungsi sebagaimana yang diharapkan.
d. Administrasi skala yang tidak berhati-hati
Skala yang isinya sudah dirancang dengan baik dan aitem yang ditulis sudah sesuai dengan kaidah, namun diadministrasikan pada responden dengan sembarangan tidak akan menghasilkan data yang valid mengenai keadaan responden.
Beberapa kehati-hatian administrasi ini, antara lain :
1) Kondisi penampilan skala (validitas tampang)
Skala psikologi bukan sekedar kumpulan aitem-aitem yang diberkas menjadi satu. Melainkan dari segi penampilan, skala psikologi harus dikemas dalam bentuk yang berwibawa sehingga mampu menimbulkan respek dan apresiasi dari responden. Sekalipun tetap tampil sederhana, namun skala psikologi perlu dikemas secara indah, diketik dengan pilihan huruf yang tepat, dicetak dengan tata letak yang menarik. Penampilan skala yang anggun akan memotivasi responden untuk memberikan jawaban dengan serius sehingga diharapkan dapat diperoleh data yang valid.
2) Kondisi subjek
Dalam hal ini, skala psikologi haris disajikan pada subjek yang secara fisik dan psikologis memenuhi syarat. jangan mengharapkan jawaban yang valid, apabila responden harus membaca dan menjawab skala dalam keadaan sakit, lelah, tergesa-gesa, tidak berminat, merasa terpaksa, dsb.
3) Kondisi testing
Situasi juga sangat mempengaruhi hasil skala, misalnya ruangan yang terlalu panas dan sempit, suasana di sekitar yang bising, tempat duduk yang tidak nyaman, penerangan yang kurang, ataupun adanya pihak ketiga di dekat responden akan berpengaruh terhadap perilaku responden.
e. Pemberian skor yang tidak cermat
Kadang-kadang terjadi kesalahan dari pihak pemberi skor karena penggunaan kunci yang keliru walaupun sudah disediakan “kunci” skoring, ataupun salah dalam penjumlahan skor.
f. Interpretasi yang keliru
Penafsiran hasil ukur skala merupakan bagian proses diagnosis psikologi yang sangat penting. Sebaik-baiknya fungsi ukur skala apabila diinterpretasikan dengan tidak benar tentu akan sia-sia. Kesimpulan mengenai individu atau kelompok individu akan tidak tepat.
B. Tahap-tahap penyusunan skala psikologis
Alur kerja dalam penyusunan skala psikologis, sebagai berikut :
Pada tahap penepatan tujuan ini dimulai dari identifikasi tujuan ukur, yaitu memilih suatu definisi dan mengenali teori yang mendasari konstrak psikologis atribut yang hendak diukur.
b. Operasionalisasi konsep
Peneliti melakukan pembatasan pada kawasan (domain) ukur berdasarkan konstrak yang didefinisikan oleh teori yang bersangkutan. Dengan mengenali batasan ukur dan adanya dimensi yang jelas, maka skala akan mengukur secara komprehensif dan relevan, sehingga menunjang validitas isi skala.
Misal, seorang mahasiswa hendak meneliti tentang “konsep diri” siswa, pada tahap ini sebaiknya ia sudah memahami konstrak teori tentang ‘konsep diri” secara benar. Misal : pengertian konsep diri, isi konsep diri, struktur konsep diri, faktor yang mempengaruhi konsep diri, ciri-ciri konsep diri, dan indikator-indikator konsep diri. Mendasarkan konstraknya peneliti mengembangkan item-itemnya.
c. Pemilihan bentuk stimulan
Sebelum penulisan aitem, penyusunan psikologis perlu menetapkan bentuk atau format stimulus yang hendak digunakan. Bentuk ini berkaitan dengan metode penskalaan. Dalam pemilihan bentuk penskalaan ini lebih tergantung pada kelebihan teoritis dan manfaat praktis format yang bersangkutan.
d. Penulisan aitem/reviu aitem
Sutrisno Hadi menyebutkan beberapa kaidah dalam penulisan aitem, sebagai berikut :
1) Gunakan kalimat yang sederhana, jelas dan mudah dimengerti oleh responden, serta mengikuti tata tulis dan tata bahasa yang baku.
2) Hindari penggunaan kata-kata bermakna ganda dan memasukkan kata-kata yang tidak berguna.
3) Hindari penggunaan kata-kata yang terlalu kuat (sugestif, menggiring) karena akan mendorong responden untuk keluar dari pagar fakta-fakta, serta kata-kata yang terlalu lemah (tidak merangsang) karena tidak dapat memancing respon yang memadai atau adekuat.
4) Selalu diingat bahwa dalam penulisan aitem hendaknya selalu mengacu pada indikator perilaku, oleh karena itu, jangan jangan menulis aitem yang langsung mengacu pada atribut yang akan diungkap.
5) Perhatikan indikator perilaku yang hendak diungkap sehingga stimulus dan pilihan jawaban tetap relevan dengan tujuan pengukuran.
6) Perlu menguji pilihan-pilihan jawaban yang ditulis,adakah perbedaan arti atau makna antara dua pilihan yang berbeda sesuai dengan ciri atribut yang sedang diukur. Apabila tidak ada bedanya maka aitem yang bersangkutan tidak memiliki daya beda (discriminating power).
7) Isi aitem tidak boleh mengandung keinginan sosial ataupun yang dianggap baik dalam norma sosial, karena aitem yang mengandung norma sosial cenderung akan disetujui dan didukung oleh semua orang bukan karena sesuai dengan perasaan atau keadaan dirinya, namun karena orang berfikir normativ.
8) Untuk menghindari adanya stereotype jawaban atau memberikan jaawaban pada sisi kanan atau kiri tanpa membaca dan mempertimbangkan dengan diri reaponden, maka sebagian aitem perlu dibuat dalam arah favorabel (positif) dan dalam arah favirabel (negatif) sehingga responden akan membaca lebih teliti dan sungguh-sungguh.
e. Reviu aitem
Reviu pertama dilakukan oleh penulis aitem sendiri, yaitu dengan selalu memeriksa apakah telah sesuai dengan indikator perilaku yang hendak diungkap dan apakah juga tidak keluar dari pedoman penulisan aitem. Setelah itu revieu kedua dilakukan oleh orang lain yang dianggap kompeten untuk mereviu.
Kompeteensi yang diperlukan oleh orang yang diminta untuk mereviu :
1) Menguasai masalah konstruksi
2) Menguasai masalh atribut yang diukur
3) Menguasai bahasa tulis standar
Semua aitem-aitem harus sesuai ketentuan spesifikasi blue-print, jika tidak, aitem tersebut harus ditulis ulang.
f. Uji coba
Tujuan pertama uji coba aitem adalah untuk mengetahui apakah kalimat-kalimat dalam aitem mudah dan dapat dipahami oleh responden. Reaksi-reaksi responden berupa pertanyaan-pertanyaan apakah kalimat yang digunakan dalam aitem merupakan pertanda kurang komunikasinya kalimat yang ditulis dam memerlukan perbaikan. Tujuan kedua, uji coba dijadikan salah satu jawaban praktis untuk memeperoleh data jawaban dari responden yang akan digunakan untuk penskalaan atau evaluasi kualitas aitem secara statistik.
g. Analisis aitem
Analisis aitem merupakan proses pengujian parameter-parameter aitem guna mengetahui apakah aitem memenuhi persyaratan psikometris untuk disertakan sebagai bagian dari skala.
Parameter aitem yang perlu diuji adalah daya beda, daya beda aitem memperlihatkan kemampuan aitem untuk membedakan individu ke dalam berbagai tingkatan kualitatif atribut yang diukur mendasarkan skor kuantitatif. Misalnya, ingin menguji motivasi belajar seseorang, maka aitem tersebut bisa menunjukkan perbedaan individu yng motivasi belajarnya tinggi, sedang dan rendah.
h. Kompilasi I
Berdasarkan dari analisis aitem, maka aitem-aitem yang tidak memenuhi persyratan psikometris harus diperbaiki terlebih dahulu supaya dapat masuk ke dalam skala, begitu pula aitem-aitem yang telah memenuhi persyatan tidak serta merta dapat masuk ke dalam skala, karena proses kompilasi harus mempertimbangkan proporsionalitas skala sebagaimana dideskripsikan oleh blue-printnya. Beberapa yang perlu diperhatikan dalam mengkompilasi aitem-aitem yang sudah memenuhi persyaratan, anatara lain :
1) Apakah suatu aitem memenuhi persyaratan psikometris atau tidak
2) Proposionalitas komponen-komponen skala seperti tertera dalam blue-print
i. Kompilasi II
Aitem-aitem yang terpilih yang jumlahnya disesuaikan dengan jumlah yang telah dispesifikasikan oleh blue-print, selanjutnya dilakukan uji reliabilitas. Jika koefisien reliabilitas kurang memuaskan, maka kembali ke tahap kompilasi dan merakit ulang skala dengan lebih mengutamakan aitem dengan daya deskriminasi tinggi
j. Format akhir
Dalam format akhir skala sebaiknya ditata dalam tampilan yang menarik tetpai tetap memudahkan responden untuk membaca dan menjawabnya. Menurut Syaifuddin Azwar, ada beberapa hal yang harus diperhatikan, yaitu :
1) Perlu dilengkapi dengan pengerjaan dan lebar jawab yang terpisah
2) Ukuran kertas juga disesuaikan dengan panjangnya skala, agar berkas skala tidak nampak terlalu tebal yang menyebabkan responden kehilangan motivasi
3) Ukuran huruf juga perlu mempertimbangkan usia responden.
C. Bentuk-bentuk skala (rating scale)
Aiken (1996:34-42) menunjukkan beberapa bentuk skala (rating scale), sebagai berikut :
a. Skala berkutup tunggal (unipolar) dan berkutup dua (bipolar)
Contoh skala berkutup tunggal :
Bagaimana pendapat saudara tentang kinerja guru X di sekolah saudara?
1. Kehadiran guru di sekolah 1 2 3 4 5
2. Tampilan di depan kelas 1 2 3 4 5
3. Hubungan guru dengan murid 1 2 3 4 5
Pada skala di atas, angka 1 menunjukkan skor terendah, sedang angka 5 menunjukkan skor tertinggi.
Bentuk kutup tunggal ini bisa dikonversi menjadi bentuk dua yaitu dengan cara menggunakan dua kata sifat yang berlawanan dan menempatkan pada dua titik ekstrim.
Contoh skala berkutup dua :
Bagaimana pendapat saudara tentang kinerja guru Y?
1. Hubungan guru dengan murid
Buruk bagus
2. Tampilan di depan kelas
Buruk bagus
3. Penguasaan materi
Buruk bagus
b. Numerical rating scale
Pada bentuk ini, responden (ratee) diminta untuk memberi tanda (v) atau tanda silang pada angka-angka yang menggambarkan kualitas atau indikator atau komponen atribut yang sedang diukur
Misal : responden diminta untuk menilai pelaksanaan pelajaran tambahan yang diselenggarakan oleh sekolah
1. Kehadiran guru di sekolah 1 2 3 4 5
2. Penguasaan materi 1 2 3 4 5
3. Kesesuaian dengan soal-soal UAN 1 2 3 4 5
c. Semantic differential scale
Istilah “semantik” berarti berkenaan dengan kata-kata. Bentuk ini umum digunakaan untuk pemaknaan seseorang terhadap suatu konsep, misal : ayah, ibu, penyakit, dosa, kebencian, olahraga, seni, dll. Skala model ini biasanya disusun dengan skala “berkutup dua”. Contoh konsep tentang “ibu” dinilai dalam bentuk skala seperti berikut :
Ibu
Buruk baik
Lemah kuat
Lambat cepat
Pada bentuk ini responden disuruh memberi tanda (mungkin centak ataupuntanda silang) pada point yang tersedia diantara dua kutup yang berlawanan. Pabila tanda tersebut mendekati dengan sifat yang beada pada ujung kiri dan kanan, maka penilaian responden terhadap konsep cenderung ke arah atau mendekati sifat tersebut.
d. Graphic rating scale
Model ini merupakan bentuk skala yang paling populer. Pada kedua ujungnya, atau di tengah-tengah di antara poin-poin yang ada terdapat titik-titik yang dihubungkan sehingga bentuknya seperti grafik.
Responden diminta untuk memberikan penilaian terhadap suatu indikator pada poin-poin yang tersedia.
Contoh skala model grafik dalam menukur motivasi belajar siswa
!______________!_______________!______________!_______________!
Selama masih selama ortu masih semampu saya selama saya selama saya
ada teman membiayai sehat masih
hidup
e. Standard rating scale
Dalam skala bentuk ini, penilai (ratee) menyediakan satu set standar (sifat-sifat manusia)yang harus dibandingkan oleh responden dengan diri sendiri atau individu lain yang sedang dinilai. Contoh, seorang peneliti ingin mengukur karakteristik perilaku seseorang secara spesifik, maka peneliti menjadikan seseorang sebagai tolak ukur atau pembanding dalam mengukur orang lain.
Dalam mengembangkan skala model ini, peneliti memikirkan lima orang yang mempunyai karakteristik yang berbeda-beda, kemudia responden diminta untuk menilai dengan cara membandingkan lima orang tersebut, karakteristik mana yang oaling mendekati dengan karakteristik individu yang diharapkan. Ataupun bisa dengan deskripsi singkat tentang tingkah laku dari yang paling buruk ke yang paling baik.
dapusnya mana?
BalasHapus