Page |1 KAPITA SELEKTA PENYUSUNAN SKALA PSIKOLOGI 2020 Pengertian Skala Psikologi. Skala psikologi merupakan salah satu instrumen psikologi yang biasa digunakan untuk mengungkap aspek non-kognitif melalui aitem-aitem, dan menghasilkan skor yang dianalisis melalui proses psikometri (Periantalo, 2015). Dalam skala psikologi, hal yang ingin diungkapkan adalah aspek afektif dan perilaku. Skala mengungkap bagaimana manusia merespon, sehingga semua jawaban dianggap sebagai jawaban yang benar. Skala psikologi biasanya diwujudkan dalam bentuk aitem-aitem perilaku atau sikap. Aitem berasal dari indikator perilaku yang dibuat. Aitem mengalami seleksi baik kualitatif maupun kuantitatif. Dari aitemaitem tersebut, skala psikologi menghasilkan skor. Skor pada skala psikologi merupakan suatu kontinum internal, dimana setiap pengukuran menghasilkan skor. Skor memiliki klasifikasi tertentu dan memiliki interpretasi atau makna. Kemudian skor-skor yang dihasilkan akan dianalisis melalui proses psikometris. Skala psikologi diujicobakan melalui proses psikometris. Proses dimulai dari penetapan konstrak yang hendak diungkap. Ujicoba skala menghasilkan validitas, reliabilitas, indeks diskriminasi, norma dan interpretasi. Skala psikologi memiliki manfaat dalam pengembangan ilmu maupun kegunaan praktis. Secara garis besar, skala psikologi bermanfaat sebagai evaluasi untuk memberikan gambaran tentang apa yang telah dilakukan sehingga mampu membuat kebijakan yang tepat dan sesuai (Periantalo, 2015). Perbedaan Skala Dan Angket - Meskipun dalam pemakaian sehari-hari banyak praktisi pengukuran maupun peneliti yang menukar pakaikan saja istilah angket dan istilah skala namun perlu difahami bahwa sebagai sesama alat pengumpulan data kedua istilah tersebut sebenarnya mengandung perbedaan makna. Perbedaan tersebut antara lain adalah (ciri khas angket di bold hitam, ciri khas skala di bold merah): 1. Data yang diungkap oleh angket berupa data faktual atau yang dianggap fakta dan kebenaran yang diketahui oleh subjek, sedangkan data yang diungkap oleh skala psikologi berupa konstrak atau konsep psikologis yang menggambarkan aspek kepribadian individu. Data mengenai pilihan metode KB, pendidikan terakhir, jumlah anggota keluarga, penghasilan rata-rata per bulan, jenis film yang disukai, opini atau pendapat mengenai suatu isu, dan semacamnya merupakan data yang dapat diungkap oleh angket. Data mengenai tendensi agresivitas, sikap terhadap sesuatu, self- esteem, kecemasan laten, strategi menghadapi masalah, orientasi seksual, dan semacamnya merupakan contoh data yang harus diungkap oleh skala psikologi. 2. Pertanyaan dalam angket berupa pertanyaan langsung terarah kepada informasi mengenai data yang hendak diungkap. Data termaksud berupa fakta atau opini yang menyangkut diri responden. Hal ini berkaitan dengan asumsi dasar penggunaan angket yaitu bahwa responden merupakan orang yang palig mengetahui tentang dirinya sendiri. “sejak kapankah Anda berhenti merokok?” merupakan contoh pertanyaan dalam angket. Pada skala-skala psikologi, pertanyaan sebagai stimulus tertuju pada indikator perilaku guna memancing jawaban yang merupakan refleksi dari keadaan diri subjek yang biasanya tidak disadari oleh responden yang bersangkutan. Pertanyaan Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |2 yang diajukan memang dirancang untuk mengumpulkan sebanyak mungkin indikasi dari aspek kepribadian yang lebih abstrak. Pertanyaan seperti “Apakah yang Anda lakukan apabila tiba-tiba disapa oleh seseorang yang tidak Anda kenali?” lebih cocok sebagai stimulus pada skala psikologi. 3. Responden terhadap angket tahu persis apa yang ditanyakan dalam angket dan informasi apa yang dikehendaki oleh pertanyaan yang bersangkutan. Responden terhadap skala psikologi, sekalipun memahami isi pertanyaannya, biasanya tidak menyadari arah jawaban yang dikehendaki dan kesimpulan apa yang sesungguhnya diungkap oleh pertanyaan tersebut 4. Jawaban terhadap angket tidak dapat diberi skor (dalam arti harga atau nilai) melainkan diberi angka coding sebagai identifikasi atau klasifikasi jawaban. Respons terhadap skala psikologi diberi skor melewati proses penskalaan (scaling). 5. Satu angket dapat mengungkap informasi mengenai banyak hal sedangkan satu skala psikologi hanya diperuntukkan guna mengungkap suatu atribut tunggal. 6. Karakteristik yang disebutkan pada poin 2 dan poin 4 menyebabkan data hasil angket tidak perlu diuji lagi reliabilitasnya secara psikometris. Reliabilitas hasil angket terletak pada terpenuhinya asumsi bahwa responden akan menjawab dengan jujur seperti apa adanya. Pada sisi lain, hasil ukur skala psikologi harus teruji reliabilitasnya secara psikometris dikarenakan relevansi isi dan konteks kalimat yang digunakan sebagai stimulus pada skala psikologi lebih terbuka terhadap error/kesalahan. 7. Validitas angket lebih ditentukan oleh kejelasan tujuan dan lingkup informasi yang hendak diungkap sedangkan validitas skala psikologi lebih ditentukan oleh kejelasan konsep psikologis yang hendak diukur dan operasionalisasinya. Perbedaan pokok antara skala psikologi dan angket ini menyebabkan pula perbedaan dalam cara penyusunan, cara pengujian kualitas, cara penggunaan, dan cara interpretasi hasilnya. Skala Psikologi Sebagai Alat Ukur - Guna mencapai tingkat objektivitas yang tinggi, penelitian ilmiah mensyaratkan penggunaan prosedur pengumpulan data yang akurat dan objektif. Pada pendekatan penelitian kuantitatif, data penelitian hanya akan dapat diinterpretasikan dengan lebih objektif apabila diperoleh lewat suatu proses pengukuran yang di samping valid dan reliabel, juga objektif. Pengukuran merupakan proses kuantifikasi suatu atribut. Pengukuran yang diharapkan akan menghasilkan data yang valid harus dilakukan secara sistematis. Berbagai alat ukur telah berhasil diciptakan untuk melakukan pengukuran atribut dalam bidang fisik seperti berat badan, luas bidang datar, kecepatan kendaraan, suhu udara, dan semacamnya yang segi validitasnya semua dapat diterima secara universal. Kuantifikasi berat badan dengan mudah dilakukan dengan bantuan alat timbangan badan dan kuantifikasi kecepatan laju kendaraan dilakukan dengan bantuan speedometer sehingga angka berat badan 45kg atau laju kendaraan 60km/jam memberikan gambaran yang mudah di mengerti oleh hampir semua orang. Validitas, reliabilitas, dan objektivitas hasil pengukuran di bidang fisik tidak lagi menjadi sumber kekhawatiran orang banyak. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |3 Pada sisi lain, pengukuran di bidang non fisik (khususnya di bidang psikologi) masih berada dalam taraf perkembangan yang mungkin tidak akan pernah mencapai kesempurnaannya. Beberapa tes dan skala psikologi standar (standar measure) dan yang telah terstandarkan (standarized measure) kualitasnya belum dapat dikatakan optimal. Kemajuan pesat di bidang teori pengukuran psikologi (psikometri) justru menyingkap sisi lemah dari banyak tes yang sudah ada dan sudah lama digunakan. Untunglah, kemajuan teori pengukuran pun memungkinkan kita untuk meningkatkan usaha guna mencapai keberhasilan dalam penyusunan dan pengembangan alat-alat ukur psikologi yang lebih berkualitas. Pengukuran atribut-atribut psikologis sangat sukar atau bahkan mungkin tidak akan pernah dapat dilakukan dengan validitas, reliabilitas, dan objektivitas yang tinggi. Hal ini antara lain dikarenakan : 1. Atribut psikologi bersifat latent atau tidak tampak. Oleh sebab itu, apa yang kita miliki hanyalah konstrak yang tidak akan dapat diukur secara langsung. Pengukuran terhadap konstrak laten harus dilakukan lewat indikator perilaku yang belum tentu mewakili domain (kawasan) yang tepat dikarenkan batasan konstrak psikologis tidak dapat dibuat dengan akurasi yang tinggi. Selalu ada kemungkinan terjadinya tumpang- tindih (overlapping) dengan konsep atribut lain. Di samping itu, konstrak psikologis tidak mudah pula untuk dioperasionalkan. 2. Aitem-aitem dalam skala psikologi didasari oleh indikator-indikator perilaku yang jumlahnya terbatas. Keterbatasan itu mengakibatkan hasil pengukuran menjadi tidak cukup komprehensif sedangkan bagian dari indikator perilaku yang terbatas itu sangat mungkin pula tumpang-tindih dengan indikator dari atribut psikologiis yang lain. 3. Respons yang diberikan oleh subjek sedikit-banyak dipengaruhi oleh variabel- variabel tidak relevan seperti suasana hati subjek, kondisi dan situasi di sekitar, kesalahan prosedur administrasi, dan semacamnya. 4. Atribut psikologi yang terdapat dalam diri manusia stabilitasnya tidak tinggi. Banyak yang mudah berubah sejalan dengan waktu dan situasi. 5. Interpretasi terhadap hasil ukur psikologi hanya dapat dilakukan secara normatif. Dalam istilah pengukuran, dikatakan bahwa pada pengukuran psikologi terdapat lebih banyak sumber eror. Keterbatasan-keterbatasan pengukuran dalam bidang psikologi inilah yang menjadikan prosedur konstruksi skala-skala psikologi lebih rumit dan harus dilakukan dengan penuh perencanaan dan mengikuti langkah-langkah metodologis sehingga sumber eror yang mungkin ada dapat ditekan sesedikit mungkin. Permasalahan validitas pengukuran sudah harus diperhitungkan dan diusahakan untuk dicapai sejak dari langkah yaang paling awal sampai pada langkah konstruksi yang terakhir. Karakteristik Skala Psikologi - Sebagai alat ukur, skala psikologi memilik karakteristik khusus yang membedakannya dari berbagai bentuk alat pengumpulan data yang lain seperti angket (questionnaire), daftar isian, inventori, dan lain-lainnya. Meskipun dalam percakapan sehari- hari biasanya istilah skala disamakan saja dengan istilah tes namun (dalam pengembangan instrumen ukur) umumnya istilah tes digunakan untuk penyebutan alat ukur kemampuan kognitif sedangkan istilah skala lebih banyak dipakai untuk menamakan alat ukur aspek afektif. Oleh karena itu, dapat diuraikan beberapa di antara karakteristik skala sebagai alat ukur psikologi, yaitu: Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |4 1. Stimulusnya berupa pertanyaan atau pernyataan yang tidak langsung mengungkap atribut yang hendak diukur, supaya bisa menjadi stimulus yang bertujuan mengungkap indikator perilaku dari atribut yang bersangkutan. Dalam hal ini, meskipun subjek yang diukur memahami pertanyaan atau pernyataannya, namun tidak mengetahui arah jawaban yang dikehendaki oleh pertanyaan yang diajukan sehingga jawaban yang diberikan akan tergantung pada interpretasi subjek terhadap pertanyaan tersebut dan jawabannya lebih bersifat proyektif, yaitu berupa proyeksi dari perasaan atau kepribadiannya. 2. Dikarenakan atribut psikologis diungkap secara tidak langsung lewat indikator-indikator perilaku sedangkan indikator perilaku diterjemahkan dalam bentuk aitem-aitem, maka skala psikologi selalu berisi banyak aitem. Jawaban subjek selalu terhadap satu aitem baru merupakan sebagian dari banyak indikasi mengenai atribut yang diukur, sedankan kesimpulan akhir sebagai suatu diagnosis baru dapat dicapai bila semua aitem telah direspons. 3. Respons subjek tidak diklasifikasikan sebagai jawaban “benar” atau “salah”. Semua jawaban dapat diterima sepanjang diberikan secara jujur dan sungguh-sungguh. Hanya saja, jawaban yang berbeda akan diinterpretasikan berbeda pula. Kedua karakteristik tersebut di atas oleh Cronbach (1970) disebut sebagai ciri pengukuran terhadap performansi tipikal (typical performance), yaitu performansi yang menjadi karakter tipikal seseorang dan cenderung dimunculkan secara sadar atau tidak sadar dalam bentuk respons terhadap situasi-situasi tertentu yang sedang dihadapi. Dalam penerapan psikodiagnostika, skala- skala performansi tipikal digunakan untuk pengungkapan aspek-aspek afektif seperti minat, sikap, dan berbagai variabel kepribadian lain semisal agresivitas, self-esteem, locus of control, motivasi belajar, kepemimpinan, dan lain sebagainya. Syarat Skala Psikologi Yang Baik. Adapun syarat untuk membuat skala yang baik, antara lain (Periantalo, 2015): a. Skala harus valid, dimana aitem skala berisi aspek yang hendak diungkap. b. Reliabel, dimana melihat seberapa jauh skor skala tersebut dapat dipercaya. c. Terstandarisasi, dimana skala memiliki sistem yang jelas seperti petunjuk pengerjaan, waktu, subjek, pemberian skor dan cara interpretasi jelas, sehingga siapapun yang menggunakan skala ini melakukan dengan cara yang sama. d. Efisien, dimana skala dapat dikerjakan dalam waktu relatif singkat, sehingga subjek tidak merasa bosan, cara pengerjaan yang mudah, serta metode pemberian skor dan interpretasi mudah. e. Bermanfaat, dimana dapat digunakan untuk berbagai keperluan, sehingga dapat menjelaskan fenomena yang ada, dan memprediksi masa depan Langkah-Langkah Dasar Penyusunan Skala Psikologi. Berikut adalah uraian ringkas mengenai langkah-langkah dasar dalam perancangan dan penyusunan skala psikologi. Langkah-langkah tersebut akan memberi gambaran bagi penyusun skala psikologi mengenai prosedur umum yang tentu saja tidak selalu dapat diikuti secara ketat disebabkan format dan sifat penskalaan masing- masing model alat ukur belum tentu sama dan karenanya menuntut keluwesan dalam pelaksanaannya. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |5 Awal kerja perancangan suatu skala psikologi dimulai dari identifikasi tujuan ukur, yaitu memilih suatu definisi dan mengenali teori yang mendasari konstrak psikologis atribut yang hendak diukur. Kemudian dilakukan pembatasan kawasan (domain) ukur berdasarkan konstrak yang didefinisikan oleh teori yang bersangkutan. Pembatasan ini harus diperjelas dengan menguraikan komponen atau dimensi-dimensi yang ada dalam atribut termaksud. Dengan mengenali batasan ukur dan adanya dimensi yang jelas maka skala akan mengukur secara komprehensif dan relevan, yang pada gilirannya akan menunjang validitas isi skala. Komponen atau dimensi atribut teoritik yang telah jelas batasannya tidak jarang masih perlu dioperasionalkan ke dalam bentuk yang lebih konkret sehingga penulis aitem akan memahami benar bentuk respon yang harus diungkap dari subjek. Operasionalisasi ini dirumuskan ke dalam bentuk indikator-indikator perilaku (behavioral indicators). Sebelum penulisan aitem dimulai, perancang skala perlu menetapkan bentuk atau format stimulus yang hendak digunakan. Format stimulus ini erat berkaitan dengan metode penskalaannya. Dalam bab mengenai penskalaan dan penentuan skor diuraikan beberapa cara penskalaan yang biasanya digunakan dalam penyusunan skala psikologi. Berbeda dari pengembangan tes-tes kemampuan kognitif yang dalam pemilihan format aitemnya memerlukan pertimbangan-pertimbangan menyangkut keadaan responden, materi uji, dan tujuan pengukuran, dalam penentuan format skala psikologi pertimbangannya tidak terlalu berkaitan dengan keadaaan responden maupun tujuan penggunaan skala. Biasanya pemilihan format skala lebih banyak tergantung pada kelebihan teoritis dan manfaat praktis format yang bersangkutan. Penulisan aitem dapat dilakukan apabila komponen-komponen atribut telah jelas identifikasinya atau bila indikator-indikator perilaku telah dirumuskan dengan benar. Biasanya komponen-komponen atribut dan indikator-indikator perilaku disajikan sebagai bagian dari blue-print skala. Di samping memberikan gambaran mengenai isi dan dimensi kawasan ukur, blue-print akan menjadi acuan dalam penulisan aitem. Penulisan aitem sendiri harus pula selalu memperhatikan kaidah-kaidah penulisan yang sudah ditentukan. Pada tahapan awal penulisan aitem, umumnya dibuat aitem yang jumlahnya jauh lebih banyak daripada jumlah yang dispesifikasikan oleh blue-printnya. Katakanlah sampai sekitar sekitar tiga kali lipat dari jumlah yang nanti akan digunakan dalam skala bentuk final. Hal ini dimaksudkan agar nanti penyusun skala tidak kehabisan aitem akibat ggurnya aitem-aitem yang tidak memenuhi persyaratan. Menurut pengalaman, bagi penulis-penulis aitem yang belum berada pada tahap kecakapan yang tinggi, angka mortalitas aitem sangat besar. Hanya sebagian kecil saja aitem yang ditulis oleh penulis yang belum terlatih yang akan selamat melewati proses seleksi psikometris. Harus diwaspadai dan terlebih dihindari poin-pon pada paragraf ini, mengenai penulisan item yang tidak mengikuti kaidah penulisan aitem yang benar. Poin-poin tersebut antara lain; (1) Item‐item yang maksudnya sukar dimengerti oleh responden karena terlalu panjang, ataupun (2) susunan tata bahasanya yang kurang tepat sehingga mendorong responden memilih jawaban tertentu saja, (3) yang memancing reaksi negatif dari responden, (4) yang mengandung muatan social desirability tinggi, dan (5) Untuk menghindari stereotipe jawaban, sebagian aitem dibuat favorabel dan sebagian lain tidak favorabel, (6) central tendencies, yaitu . Kesemuanya merupakan poin-poin dari karakteristik aitem yang dihasilkan dari proses penulisan item yang tidak sesuai dengan kaidah‐ kaidah standar. Item seperti itu tidak akan berfungsi sebagaimana yang diharapkan. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |6 Reviu (review) dilakukan pertama oleh penulis aitem sendiri, yaitu dengan selalu memeriksa ulang setiap aitem yang baru saja ditulis apakah telah sesuai dengan indikator perilaku yang hendak diungkap dan apakah juga tidak keluar dari pedoman penulisan aitem. Apabila semua aitem telah selesai ditulis, reviu dilakukan oleh beberapa orang yang berkompeten. Kompetensi yang diperlukan (dalam hal ini) meliputi penguasaan masalah kontruksi skala dan masalah atribut yang diukur. Selain itu penguasaan bahasa tulis standar sangat diperlukan. Semua aitem yang diperkirakan tidak sesuai dengan spesifikasi blue-print atau yang tidak sesuai dengan kaidah penulisan harus diperbaiki atau ditulis ulang. Hanya aitem-aitem yang diyakini akan berfungsi dengan baik yang boleh diloloskan untuk mengikuti uji-coba lapangan. Kumpulan aitem yang telah melewati proses reviu dan analisis kualitatif kemudian diujicobakan. Tujuan uji coba ini pertama adalah untuk mengetahui apakah kalimat dalam aitem mudah dan dapat dipahami oleh responden sebagaimana diinginkan oleh penulis aitem. Reaksi-reaksi responden berupa pertanyaan mengenai kata-kata atau kalimat yang digunakan dalam aitem merupakan pertanda kurang komunikatifnya kalimat yang ditulis dan itu memerlukan perbaikan. Tujuan kedua, uji-coba dijadikan salah satu cara praktis untuk memperoleh data jawaban dari responden yang akan digunakan untuk penskalaan. Analisis aitem merupakan proses pengujian parameter-parameter aiem guna mengetahui apakah aitem memenuhi persyaratan psikometris untuk disertakan sebagai bagian dari skala. Parameter aitem yang diuji paling tidak adalah daya beda atau daya diskriminasi aitem, yaitu kemampuan aitem dalam membedakan antara subjek yang memiliki atribut yang diukur dan yang tidak. Lebih tajam lagi, daya beda aitem memperlihatkan kemampuan aitem untuk membedakan individu ke dalam berbagai tingkatan kualitatif atribut yang diukur berdasar skor kuantitatif. Dalam analisis aitem yang lebih lengkap dilakukan juga analisis indeks validitas dan indeks reliabilitas aitem. Hasil analisis aitem menjadi dasar dalam seleksi aitem. Aitem-aitem yang tidak memenuhi persyaratan psikometris akan disingkirkan atau diperbaiki lebih dahulu sebelum dapat menjadi bagian dari skala. Sebaliknya, aitem-aitem yang memenuhi persyaratan pun tidak dengan sendirinya disertakan ke dalam skala. Proses kompilasi akan menentukan mana di antara aitem tersebut yang akhirnya terpilih. Di samping memperhatikan parameter aitem, kompilai skala harus pula mempertimbangkan proporsionalitas komonen-komponen skala sebagaimana dideskripsikan oleh blue-printnya. Pengujian reliabilitas skala dilakukan terhadap kumpulan aitem-aitem terpilih yang banyaknya disesuaikan dengan jumlah yang telah dispesifikasikan oleh blue-print. Apabila koefisien reliabilitas skala ternyata belum memuaskan, maka penyusun skala dapat kembali ke langkah kompilasi dan merakit ulang skala dengan lebih mengutamakan aitem-aitem yang memiliki daya beda tinggi sekalipun perlu sedikit mengubah proporsi aitem dalam setiap komponen atau bagian skala. Kumpulan aitem yang memiliki daya diskriminasi tinggi akan dapat meningkatkan koefisien reliabilitas skala. Jalan lain yang dapat ditempuh adalah menambah jumlah aitem pada setiap komponen secara proporsional, bila perlu dengan menurunkan sedikit kriteria seleksi aitem. Hal ini dilakukan terutama bila jumlah aitem akan meningkatkan koefisien reliabilitas skala. Proses validasi pada hakikatnya merupakan proses berkelanjutan. Pada skala-skala yang akan digunakan secara terbatas pada umumnya dilakukan pengujian validitas berdasar kriteria sdangkan pada skala yang dimaksudkan untuk digunakan secara luas biasanya diperlukan proses analisis faktor dan validasi silang (cross validation). Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |7 Format final skala harus dirakit dalam tampilan yang menarik namun tetap memudahkan bagi responden untuk membaca dan menjawabnya. Dalam bentuk akhir, skala dilengkapi dengan petunjuk pengerjaan dan mungkin pula lembar jawaban yang terpisah. Ukuran kertas yang digunakan perlu disesuaikan dengan panjangnya skala sehingga jangan sampai berkas skala tampak sangat tebal yang menyebabkan calon responden kehilangan motivasi, sedangkan pemilihan ukuran huruf perlu juga mempertimbangkan usia responden jangan sampai memakai huruf berukuran terlalu kecil sehingga responden agak lanjut usia kesulitan membacanya. Validitas. Pendefinisian validitas tes dapat diawali dengan melihat secara etimologi, validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Validitas suatu alat ukur merupakan sejauh mana alat ukur ini mampu mengukur apa yang seharusnya diukur (Nunnaly, 1978; Allen dan Yen, 1979; Kerlinger, 1986; Azwar, 2000). Sementara itu, Linn dan Gronlund (1995) menjelaskan validitas mengacu pada kecukupan dan kelayakan interprestasi yang dibuat dari penilaian, berkenaan dengan penggunaan khusus. Pendapat ini diperkuat oleh Messick (1998) bahwa validitas merupakan kebijakan evaluatif yang terintegrasi tentang sejauh mana fakta empiris dan dan alasan teoritis mendukung kecukupan dan kesesuaian inferensi dan tindakan berdasarkan skor tes atau skor suatu instrumen Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah (Azwar, 2000). Masih menurut Azwar (2000), dalam teori skor- murni klasikal, pengertian validitas dapat dinyatakan sebagai sejauh mana skor tampak atau skor perolehan mendekati besar skor murni. Skor tampak tidak akan sama dengan skor murni kecuali alat ukur yang bersangkutan mempunyai validitas yang sempurna. Semakin skor perolehan mendekati skor murni maka semakin tinggi validitasnya, dan sebaliknya semakin rendah validitas maka semakin besar perbedaan skor perolehan dan skor murni. Secara umum validitas tes terbagi kedalam tiga jenis yaitu validitas isi (content validity), validitas berdasar kriteria (criterion-related validity), dan validitas konstruk (construct validity) (Singh, 1986; Thorndike, 1997; Azwar, 2000; Suryabrata, 2000). Validitas konstruk merujuk kepada kualitas alat ukur yang dipergunakan apakah sudah benar-benar menggambarkan konstruk teoritis yang digunakan sebagai dasar operasionalisasi ataukah belum. Secara singkat, validitas konstruk adalah penilaian tentang seberapa baik seorang peneliti menerjemahkan teori yang dipergunakan ke dalam alat ukur Tipe-Tipe Dalam Validitas. Validitas itu dikelompokkan dalam tiga tipe yaitu: 1. Validitas kriteria Validitas kriteria dibagi menjadi dua yaitu validitas prediktif dan validitas konkuren. Fernandes (1984) mengatakan validitas berdasarkan kriteria dimaksudkan untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang (predictive validity) atau Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |8 mengestimasi kemampuan dengan alat ukur lain dengan tenggang waktu yang hampir bersamaan (conncurent validity). 2. Validitas isi Validitas isi adalah suatu instrumen sejauh mana butr-butir dalam instrumen itu mewakili komponen- komponen dalam keseluruhan kawasan isi objek yang hendak diukur dan sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur (Nunnaly, 1978;Fernandes, 1984). Sementara itu Lawrance (1994) menjleaskan bahwa validitas isi adalah keterwakilan pertanyaan terhadap kemampuan khusu yang harus diukur. Berdasarkan hal tersebut, dapat disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap domain yang hendak diukur untuk mengetahui keterwakilan dengan kemampuan yang hendak diukur. Validitas Isi menunjukkan sejauh mana seperangkat aitem mengukur apa yang hendak diukur. Sejauh mana aitem dalam suatu instrumen psikologi dapat menggambarkan apa yang hendak diukur (Azwar, 2016; Periantalo, 2016). Dalam hal ini, validitas didapat melalui penurunan konstrak ke dimensi, indikator perilaku sampai ke aitem, sehingga penulisan aitem merupakan esensi dari pencapaian validitas isi. 3. Validitas kontrak Validitas konstruk adalah sejauh mana instrumen mengungkapkan suatu kemampuan atau konstruk teoritis yan hendak diukurnya (Nunnaly, 1978;Fernandes, 1984). Prosedur validitas konstruk diawali dari sutau identikasi dan batasan mengenai variabel yang hendak diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan teori variabel tersebut. Dari teori ini ditarik suatu konsekuensi praktis mengenai hasil pengukuran pada kondisi tertentu dan konsekuensi inilah yang akan diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu dianggap memiliki validitas konstruk yang sesuai. Validitas konstrak menunjukkan sejauh mana skala psikologi mengukur trait (konstrak) teoritik yang hendak diukurnya. Validitas konstrak merupakan kelanjutan validitas isi. Aitem yang telah dibuat kemudian diuji kontrak teoritisnya. Pengujian dilakukan melalui pengambilan data di lapangan. Data pengujian skala dilihat konstrak yang membentuk melalui analisis statistik. Analisis statistik memberikan data pengukuran. Ada beberapa metode dalam mencapai validitas konstrak. Metode yang umum digunakan adalah multitrait-multimethod dan analisis faktor (Periantalo, 2016). Validitas Multitrait-Multimethod. Model ini diperkenalkan oleh Campbell dan Fiske. Asumsi dasar dari metode ini adalah, pertama, konstrak yang sama saat diukur dengan berbagai metode, menunjukkan korelasi positif. Kedua, konstrak yang berbeda jika diukur dengan cara yang sama atau pun berbeda, maka tidak berkorelasi atau berkorelasi rendah. Model multitrait multimethod harus memiliki dua konstrak yang diukur menggunakan dua model penskalaan yang berbeda. Validitas ini merupakan gabungan validitas konvergen dan diskriminan (Periantalo, 2016) Analisis Aitem. Ada beberapa tahapan yang dilakukan pada analisis aitem (Periantalo, 2015), yaitu: 1) Analisis Kualitatif Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Page |9 Aitem Analisis kualitatif aitem merupakan analisis dengan melihat deskripsi aitem tersebut. Analisis melihat kandungan yang ada di dalam aitem dan tidak melibatkan angka. Analisis dilakukan oleh berbagai pihak yang berhubungan dengan skala psikologi tersebut. Analisis dilakukan oleh (Periantalo, 2015): a) Ahli Konstrak Analisis ini bertujuan untuk memastikan aitem yang dibuat mengarah pada konstrak. Aitem tersebut harus sesuai dengan indikator perilaku yang mengarah pada komponen dan selaras dengan konstrak. Ahli yang melakukan ini adalah orang yang mengetahui banyak tentang konstrak tersebut, seperti pakar, peneliti yang pernah meneliti kontrak tersebut, pernah mengalami atau memiliki banyak pengetahuan mengenai konstrak. b) Ahli Psikometri Tujuan dari analisis ini adalah untuk meminta tanggapan tentang properti psikometri yang digunakan. Peneliti meminta tanggapan terhadap jenis validitas, reliabilitas, indeks diskriminasi aitem maupun norma. Orang yang dijadikan analasis ini adalah orang-orang yang menguasasi ilmu pengukuran psikologi. Ahli Psikometri pun diminta untuk melihat aitem-aitem yang telah disusun oleh peneliti. c) Ahli Tata Bahasa Tujuan dari analisis ini adalah untuk memastikan bahwa yang digunakan baik dan benar. Analisis ini disarankan menggunakan orang yang memiliki kemampuan tata bahasa yang bagus. d) Subjek Analisis ini bertujuan untuk memastikan subjek paham dengan aitem yang telah dibuat. Sebaik apapun aitem yang telah dibuat, tetapi menjadi tidak berguna ketika subjek tidak memahami makna dari aitem tersebut. Ketidakpahaman subjek terhadap aitem membuat validitas isi penelitian menjadi rendah, sehingga skala tersebut tidaklah valid. Analisis ini meminta subjek untuk menelaah makna atau kalimat atau kata dalam aitem tersebut dan memastikan bahwa kalimat tersebut tidak ambigu. Aitem harus dapat dimengerti oleh subjek dari skala yang ditargetkan. Kata-kata dalam aitem adalah kata-kata yang sesuai dengan kelompok subjek. Subjek diminta untuk memberikan tanggapan terhadap aitem 2). Ujicoba Skala Ujicoba skala ini bertujuan untuk melihat apakah aitem tersebut memang aitem yang baik secara kuantitatif (Periantalo, 2015; Azwar, 2016). Ujicoba harus dilakukan seperti dalam keadaan sebenarnya. Subjek yang dilibatkan adalah subjek yang setara dengan kelompok target dari skala tersebut, begitu pun dengan waktu. Waktu yang digunakan dalam ujicoba adalah waktu yang baik. Dalam artian, subjek mengerjakan pada waktu subjek memiliki semangat untuk mengerjakan. Sama halnya dengan tempat dan tampilan skala yang harus dibuat senyaman dan semenarik mungkin, agar dalam mengerjakan skala, subjek menjadi termotivasi untuk mengerjakan skala. 3) Analisis Kuantitatif Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 10 Analisis kuantitatif yang dilakukan berupa indeks diskriminasi aitem (daya beda aitem). Daya beda aitem bertujuan untuk memastikan aitem memiliki daya beda yang bagus. Aitem dapat membedakan individu yang memiliki atribut atau tidak. Aitem bisa membedakan individu yang berformasi tinggi maupun rendah (Azwar, 2016). Daya beda pun dapat berarti kemampuan aitem membedakan individu secara teori harus memilih aitem tersebut. Hasil analisis aitem kuantitatif bisa dijadikan batu pijakan dalam penyusunan skala final. Daya beda aitem dalam penelitian ini dilakukan dengan Korelasi Aitem dengan Skor Total. 4) Indeks Diskriminasi Aitem dengan Reliabilitas Fungsi indeks diskriminasi (beda) aitem adalah untuk melihat kemampuannya dalam membedakan individu memiliki atribut atau tidak. Aitem lolos seleksi dijadikan sebagai bahan dalam perakitan skala final. Salah satu fungsi indeks diskriminasi aitem adalah untuk reliabilitas. Skala dengan indeks diskriminasi aitem bagus mendukung reliabilitas. Semakin tinggi indeks diskriminasi aitem, maka semakin tinggi reliabilitasnya. Indeks diskriminasi aitem pun dipengaruhi oleh respon penskalaannya, sehingga semakin tinggi respon penskalaan, maka semakin tinggi pula indeks diskriminasi aitem Faktor-Faktor Yang Dapat Melemahkan Validitas - Validitas, dalam pengertiannya yang paling umum, adalah ketepatan dan kecermatan skala dalam menjalankan fungsi ukurnya. Artinya sejauhmana skala itu mampu mengukur atribut yang ia dirancang untuk mengukurnya. Skala yang hanya mampu mengungkap sebagian dari atribut yang seharusnya atau justru mengukur atribut lain, dikatakan sebagai skala yang tidak valid. Karena validitas sangat erat berkaitan dengan tujuan ukur, maka setiap skala hanya dapat menghasilkan data yang valid untuk satu tujuan ukur pula. Validitas adalah karakteristik utama yang harus dimiliki oleh setiap skala. Apakah suatu skala berguna atau tidak sangat ditentukan oleh tingkat validitasnya. Oleh karena itu, sejak tahap awal perancangan skala sampai dengan tahap administrasi dan pemberian skornya, usaha-usaha untuk menegakkan validitasharus selalu dilakukan. Dalam rangka itulah perancang skala perlu mengenali beberapa faktor yang dapat mengancam validitas skala psikologi. Faktor-faktor tersebut antara lain: 1. Identifikasi kawasan ukur yang tidak cukup jelas Untuk mengukur “sesuatu” maka sesuatu itu harus dikenali terlebih dahulu dengan baik. Apabila atribut psikologi sebagai tujuan ukur tidak diidentifikasikan dengan benar maka perancang skala hanya memiliki gambaran yang kabur mengenai apa yang sebenarnya hendak diukurnya dan, pada gilirannya, ia tak mungkin akan mampu menulis aitem-aitem yang tepat untuk mengungkap respons yang diinginkan. Kekaburan tujuan ukur ini disebabkan perancang skala tidak mengenali dengan baik batas-batas atau definisi yang tepat mengenai kawasan (domain) atribut yang hendak diukur. Akibatnya kawasan ukur yang diinginkan menjadi tumpang-tindih (overlap) dengan kawasan ukur atribut lain sehingga skala yang nantinya dihasilkan ternyata mengukur banyak hal yang tidak relevan dengan tujuan semula. Ketidaktepatan identifikasi kawasan ukur dapat pula menyebabkan skala menjadi tidak cukup komprehensif dalam mengungkap atribut yang dikehendaki. Hal itu terjadi dikarenakan sebagian dari komponen atau dimensi yang ikut membangun teori mengenai atribut yang bersangkutan tidak ikut teridentifikasikan. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 11 2. Operasionalisasi konsep yang tidak tepat Kejelasan konsep mengenai atribut yang hendak diukur memungkinkan perumusan indikator- indikator perilaku yang menunjukkan ada-tidaknya atribut yang bersangkutan. Rumusan indikator perilaku berangkat dari operasinalisasi konsep teoretik mengenai komponen-komponen atau dimensi-dimensi atribut yang bersangkutan menjadi rumusan yang terukur (measureable). Apabila perumusan ini tidak cukup operasional, atau masih menimbulkan penafsiran ganda mengenai bentuk perilaku yang diinginkan, atau sama sekali tidak mencerminkan konsep yang akan diukur, maka akan melahirkan aitem-aitem yang tidak valid. Pada gilirannya, aitem-aitem yang tidak valid tidak akan menjadi skala yang valid. 3. Penulisan aitem yang tidak mengikuti kaidah Aitem-aitem yang maksudnya sukar dimengerti oleh pihak responden karena terlalu panjang atau karena kalimatnya tidak benar secara tata bahasa, yang mendorong responden untuk memilih jawaban tertentu saja, yang memancing reaksi negatif dari responden, yang mengandung unsur muatan social desirability tinggi, dan yang memiliki cacat semacamnya dihasilkan dari proses penulisan aitem yang mengabaikan kaidah-kaidah standar. Aitem-aitem seperti itu tidak akan berfungsi sebagaimana diharapkan. 4. Administrasi skala yang tidak berhati-hati Skala yang isinya telah dirancang dengan baik dan aitem-aitemnya sudah ditulis dengan cara yang benar namun disajikan atau diadministrasikan pada responden dengan sembarangan tidak akan dapat menghasilkan data yang valid mengenai keadaan responden. Administrasi skala memerlukan persiapan dan antisipasi dari pihak penyaji. Beberapa di antara banyak hal yang berkaitan dengan kehati-hatian administrasi ini adalah: a. Kondisi penampilan skala (validitas tampang). Skala psikologi bukan sekadar kumpulan aitem-aitem yang diberkas menjadi satu. Dari segi penampilan, skala psikologi harus dikemas dalam bentuk yang berwibawa sehingga mampu menimbulkan respek dan apresiasi dari respondennya. Sekalipun harus tetap tampil sederhana, namun skala psikologi perlu dikemas indah, dikemas atau dicetak jelas dengan pilihan huruf yang tepat, dicetak dengan tata letak (lay-out) yang menarik, dan menggunakan desain lembar jawaban yang dapat memudahkan responden dalam memberikan jawaban. Penampilan skala yang anggun akan memotivasi responden untuk memberikan jawaban dengan serius sehingga diharapkan dapat diperoleh data yang valid. b. Kondisi subjek Skala psikologi harus disajikan hanya pada subjek yang kondisinya (secara fisik dan psikologis) memenuhi syarat. Jangan mengharapkan jawaban yang valid apabila responden harus membaca dan menjawab skala dalam keadaan sakit, lelah, tergesa-gesa, tidak berminat, merasa terpaksa, dan semacamnya. c. Kondisi testing Situasi tempat administrasi skala itu berpengaruh terhadap hasil yang didapat dari penyajian skala. Ruangan yang terlalu sempit, suasana sekitar yang bising, tempat duduk Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 12 yang tidak nyaman, penerangan yang kurang, atau kehadiran orang ketiga didekat responden akan berpengaruh besar terhadap perilaku responden. 5. Pemberian skor yang tidak tepat Sekalipun disediakan “kunci” skoring, kadang-kadang terjadi kesalahan dari ihak pemberi skor karena cara penggunaan kunci yang keliru atau karena salah dalam penjumlahan skor. Pada beberapa skala yang menggunakan konversi skor, dapat terjadi kesalahan sewaktu mengubah skor menjadi skor derivasi karena salah lihat pada tabel konversi. 6. Interpretasi yang keliru Penafsiran hasil ukur skala merupakan bagian dari proses diagnosis psikologi yang teramat penting. Bagaimana pun baiknya fungsi ukur suatu skala apabila diinterpretasikan secara tidak benar tentu akan sia-sia. Kesimpulan mengenai individu atau kelompok individu akan tidak tepat. Terdapat banyak faktor yang dapat menyebabkan rendahnya validitas hasil ukur skala psikologi yang harus diwaspadai. Jelaslah bahwa validitas hasil ukur skala psikologi tidak semata-mata tergantung pada pihak penyusun skala melainkan ikut ditentukann pula oleh pihak pemakainya. Atribut Tunggal vs Atribut Komposit Skala Pengukuran. Sekalipun suatu skala psikologi bertujuan untuk mengukur variable yang konstraknya merupakan atribut tunggal, namun dalam perancangannya atribut tersebut seringkali perlu di uraikan menjadi beberapa dimensi atau komponen guna memperluas cakupan afektifnya dan memperjelas operasionalisasinya. Pada skala yang dibuat untuk mengukur atribut tunggal seperti itu interkorelasi antar komponen atau dimensinya di harapkan tinggi karena memang komponen-komponen tersebut dirancang untuk mengukur hal yang sama. Dalam seleksi aitem aitemnya pun kita memilih daya beda aitem tertinggi yang ada dengan membandingkan indeksnya secara keseluruhan, bukan perkomponen. Adanya komponen yang ternyata berisi aitem aitem yang berkoefisien korelasi rix rendah menunjukkan antara lain bahwa komponen yang bersangkutan memang tidak relevan dengan tujuan pengukuran dan dapat dihapuskan. Lebih lanjut, untuk pengujian reliabilitasnya cukup dilakukan satu pengujian saja bagi seluruh aitem yang terpilih sehingga yanga ada adalah koefisien reliabilitas skala bukan koefisien-koefisien reliabilitas komponen. Di sisi lain, ada skala psikologi yang dirancang untuk mengukur satu atribut namun atribut tersebut dikonsepkan sebagai terdiri atas beberapa aspek atau dimensi yang mengungkap subdomain yang berbeda satu sama lain. Skor-skor dari setiap aspek tersebut akan dijadikan satu skor komposit yang mengindikasikan ada tidaknya atribut semula sebagai tujuan ukurnya. Misalnya WAIS, WAIS bertujuan untuk mengukur IQ. IQ sendiri disimpulkan dari intelegensi yang konsepsinya terdiri atas 11 aspek kecakapan yang berbeda beda. Tidak satupun di antara aspek kecakapan yanga da dalam WAIS itu yang dinamai intelegensi. Setelah skor dari setiap aspek diperoleh dan dikompositkan sedemikian rupa, barulah skor akhir tersebut dinamai IQ yang mencerminkan intelegensi sebagaimana tujuan ukur semula. Dalam hal pengukuran atribut komposit seperti ini, kita mengharapkan agar interkorelasi antar-aspek atau antar-dimensi itu rendah, karena hal itu berarti bahwa setiap aspek memiliki fungsi ukur yang unik dan tidak ada tumpang tindih. Dari segi pemilihan aitemnya, kita harus melakukan analisis aitem bagi setiap aspek ( menghitung korelasi aitem dengan skor aspek, bukan denga skor skala), Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 13 dengan membandingkan indeks daya deskrimminasinya dalam aspek masing-masing, bukan secara keseluruhan. Begitu juga dalam menguji reliabilitasnya, lebih dahulu dilakukan komputasi koefisien reliabilitas bagi masing masing aspek, baru kemudian dihitung reliabilitas secara keseluruhan yang dikenal dengan nama reliabilitas skor komposit ( Mosier, 1943 dalam Azwar , 1997) . Sebagaimana telah dijelaskan , seleksi aitem dengan menggunakan komputasi korelasi antara skor aitem dan skor total skala menghasilkan indeks daya diskriminasi aitem atau dikenal juga dengan indeks konsistensi aitem total. Peril di ingatkan bahwa indeks daya diskriminasi ini tidak sama dengan koefisien validitas aitem. Daya deskriminasi aitem dan validitas aitem merupakan dua hal berbeda dan pengertiannya tidak untuk dicampur-adukkan. Indeks diskriminasi aitem semata-mata menunjukkan sejauh mana aitem yang bersangkutan berfungsi seperti skala. Indeks daya diskriminasi aitem yang rendah berarti bahwa, fungsi aitem yang bersangkutan tidak selaras dengan tujuan ukur skala. Suatu skala yang seluruhnya berisi aitem dengan indeks diskriminasi tinggi berarti bahwa skala itu merupakan kumpulan aitem yang memiliki tujuan dan fungsi yang sama, tapi hal itu belum menunjukkan fungsi apa yang sebenarnya dimilikinya. Artinya suatu skala yang daya diskriminasi aitem-aitemnya tinggi, belum tentu valid untuk tujuan ukur yang direncanakan. Daya diskriminasi aitem tidak memiliki hubungan langsung dengan validitas skala. Dengan demikian, diharapkan para penyusun skala dan para peneliti yang menggunakan skala akan dapat melakukan evaluasi kualitas aitem dan kualitas skalanya dengan cara yang tepat dan menempatkan prosedur seleksi aitem pada proporsi yang selayaknya. Reliabilitas. Relaibilitas adalah indeks yang menunjukkan sejauh mana suatu sistem ukur dapat dipercaya atau dapat diandalkan (Singarimbun, 1989). Bila suatu instrumen ukur dipakai dua kali untuk mengukur konsep yang sama dan hasil pengukuran yang diperoleh relatif konsisten, maka instrumen ukur tersebut reliabel. Dengan kata lain, reliabilitas menunjukkan konsistensi suatu instrumen ukur di dalam mengukur konsep yang sama. Reliabilitas diartikan sebagai tingkat kepercayaan hasil suatu pengukuran (Azwar, 1992). Reliabilitas memberikan gambaran sejauh mana skor hasil pengukuran terbebas dari alat pengukuran (measurement error). Pengukuran yang memiliki realibilitas yang tinggi disebut sebagai pengukuran yang reliabel (reliable), yaitu dapat dipercaya. Secara empirik, tinggi rendahnya realibilitas ditunjukkan oleh suatu angka yang disebut koefisien reliabilitas. Pada awalnya, tinggi rendahnya reliabilitas suatu test dicerminkan oleh koefisien korelasi antara skor pada dua tes yang dikenakan pada sekelompok individu yang sama. Semakin tinggi koefisien korelasi berarti konsistensi antara hasil pengenaan dua tes tersebut semakin baik dan hasil ukur kedua test tersebut dikatakan semakin reliabel, begitu juga sebaliknya. Disamping itu, walaupun koefisien korelasi dapat saja bertanda negatif (-), koefisien reliabilitas selalu mengacu pada angka positif (+), karena angka negatif tidak ada artinya bagi interpretasi reliabilitas hasil ukur. Reliabilitas Konsistensi Internal. Pendekatan konsistensi internal dilakukan dengan menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada sekelompok subjek. Pendekatan reliabilitas konsistensi internal bertujuan melihat konsistensi antar aaitem atau antarbagian dalam tes itu sendiri(Azwar, 2010). Dalam hal ini reliabilitas konsistensi internal mengukur seberapa konsisten Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 14 aitem-aitem yang berbeda yang merefleksikan suatu konstruk yang sama memberikan hasil-hasil yang sama (Joguyanto, 2008). Ada beberapa cara yang dapat dilakukan untuk menghitung reliabilitas ini yaitu (Jogiyanto, 2008): 1) Rata-rata korelasi antar aitem Cara menghitung reliabilitas ini dilakukan untuk masing-masing konstruk. Aitem-aitem di suatu konstruk dikorelasikan satu dengan lainnya dan nilai-nilai hasil korelasinya dirata-rata. 2) Rata-rata korelasi total antar aitem Cara menghitung reliabilitas ini hampir sama dengan yang dilakukan di rata-rata korelasi antar- aitem. Bedanya adalah korelasi antar-aitem dirata-rata terlebih dahulu untuk masing-masing aitem dan kemudian dihitung rata-rata dari rata-rata tersebut. 3) Separuh dipecah (Split-half) Split-half dilakukan dengan melakukan sebuah tes pada satu kelompok subjek dan membagi aitem- aitem di tes menjadi dua separuhan. Pemecahan aitem-aitem menjadi dua separuhan dapat dilakukan secara acak atau secara atas bawah atau secara ganjil-genap. Skor-skor dari separuh pertama dibandingkan dengan skor-skor dari separuh kedua. Analisis korelasi juga digunakan untuk membandingkan dua kelompok skor tersebut. Koefisien korelasi ini menunjukkan koefisien konsistensi internal dari alat ukur. Koefisien korelasi yang tinggi menunjukkan konsistensi internal aitem-aitem di alat ukur Parameter Aitem Untuk Skala Pengukuran. Daya beda atau daya diskriminasi aitem merupakan parameter yang paling penting dalam seleksi aitem skala psikologi yang mengukur atribut afektif. Daya diskriminasi aitem adalah sejauh mana aitem mampu membedakan antara individu atau kelompok individu yang memiliki dan yang tidak memiliki atribut yang di ukur. Contohnya pada suatu skala yang disusun untuk mengungkap agresivitas, maka aitem yang berdaya beda tinggi adalah aitem yang mampu menunjukkan mana individu atau kelompok individu yang memiliki agresivitas tinggi dan mana yang tidak. Untuk skala sikap, aitem yang berdaya beda tinggi adalah aitem yang mampu membedakan mana subjek yang bersikap positif dan mana subjek yang bersikap negative. Indkes daya diskriminasi aitem merupakan pula indicator keselarasan atau konsistensi antara fungsi aitem dengan fungsi skala secara keseluruhan yang dikenal dengan istilah konsistensi aitem total. Prinsip kerja yang dijadikan dasar untuk melakukan seleksi aitem dalam hal ini adalah memilih aitem yang fungsi ukurnya selaras atau sesuai dengan fungsi ukur skala sebagaimana dikehendaki oleh penyusunnya. Atau dapat dikatakan memilih aitem yang mengukur hal sama dengan apa yang di ukur oleh skala sebagai keseluruhan. Pengujian daya diskriminasi aitem menghendaki dilakukannya komputasi koefisien korelasi antara distribusi skor aitem dengan suatu kriterian yang relevan, yaitu distribusi skor skala itu sendiri. Komputasi ini akan menghasilkan koefisien korelasi aitem-total yang dikenal pula dengan sebutan parameter daya beda aitem. Formula korelasi yang tepat untuk digunakan dalam komputasinya tergantung pada sifat penskalaan dan distribusi skor aitem dan skor skala itu sendiri. Bagi skala-skala yang setiap aitemnya Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 15 diberi skor pada level interval dapat digunakan formula koefisien korelasi positif antara skor aitemdengan skor skala berarti semakin tinggi konsistensi antara aitem tersebut dengan skala keseluruhan yang berarti semakin tinggi daya bedanya. Bila koefisien korelasinya rendah mendekati nol berarti fungsi aitem tersebut tidak cocok dengan fungsi ukur skala dan daya bedanya tidak baik. Bila koefisien korelasi yang dimaksud ternyata negative artinya terdapat cacat serius pada aitem yang bersangkutan. Memilih Aitem Berdasarkan Koefisien Korelasi Aitem Total. Parameter daya beda aitem yang berupa koefisien korelasi aitem total memperlihatkan kesesuaian fungsi aitem dengan fungsi skala dalam mengungkap perbedaan individual. Dengan demikian guna mengoptimalkan fungsi skala maka sangat logis apabila pemilihan aitem-aitemnya didasarkan pada besarnya koefisien korelasi termaksud. Besarnya koefisien korelasi aitem total bergerak dari 0 sampai dengan 1,00 dengan tanda positif atau negative. Semakin baik daya diskriminasi aitem maka koefisien korelasinya semakin mendekati angka 1,00. Koefisien yang mendekati angka 0 atau yang memiliki tanda negative mengindikasikan daya diskriminasi yang tidak baik. Sebagai kriteria pemilihan aitem berdasar korelasi aitem total biasanya digunakan batasan rix ≥ 0,30. Semua aitem yang mencapai koefisien korelasi minimal 0,30 daya pembedanya di anggap memuaskan. Aitem yang memiliki harga rix atau ri(X-i) kurang dari 0,30 dapat di interpretasikan sebagai aitem yang memiliki daya diskriminasi rendah. Batasan ini merupakan suatu konvensi. Penyusun tes boleh menentukan sendiri batasan daya diskriminasi aitemnya dengan mempertimbangkan isi dan tujuan skala yangs edang disusun. Apabila aitem yang memiliki indeks diskriminasi sama dengan atau lebih besar daripada 0,30 jumlahnya melebihi jumlah aitem yang direncanakan untuk dijadikan skala, maka kita dapat memilih aitem-aitem yang memiliki indeks daya diskriminasi tertinggi. Sebaliknya apabila jumlah aitem yang lolos ternyata masih tidak mencukupi jumlah yang di inginkan, kita dapat mempertimbangkan untuk menurunkan sedikit batas kriteria 0,30 – menjadi 0,25 misalnya sehingga jumlah aitem yang di inginkan dapat tercapai. Apabila hal ini tidak juga menolong, maka sangat mungkin kita harus merevisi seluruh aitem aitem baru sama sekali dan kemudian melakukan field testing kembali karena menurunkan batas kriteria rix dibawah 0,20 sangat tidak di sarankan. Harus pula diketahui bahwa tingginya korelasi skor aitem dengan skor skala, sekalipun berperanan dalam meningkatkan reliabilitas skala, namun tidak selalu akan meningkatkan validitas skala. Bahkan semata-mata memilih aitem-aitem yang berkorelasi tinggi dengan skor skala akan berakibat menurunkan validitas isi dan validitas yang didasarkan pada kriteria ( lemke & Wiersma, 1976; Azwar, 1997 ). Oleh karena itu, parameter daya diskriminasi aitem rixhendaknya tidak dijadikan patokan tunggal dalam menentukan aitem mana yang akhirnya diikutkan sebagai bagian skala dalam bentuk final dikarenakan di samping korelasi aitem total tersebut masih ada pertimbangan lain yang juga tidak kalah besar peranannya dalam menentukan kualitas skala. Pettimbangan itu antara lain adalah tujuan penggunaan hasil ukur skala dan komposisi aspek-aspek atau komponen-komponen yang dicakup oleh kawasan ukur yang harus diungkap oleh skala. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 16 Koreksi Terhadap Efek Spurios Overlap. Apabila koefisien korelasi aitem total itu dihitung pada suatu skala yang berisi hanya sedikit aitem maka sangat mungkin akan diperol;eh koefisien korelasi aitem-total yang over-estimated (lebih tinggi daripada sebenarnya) dikarenakan adanya overlap antara skor aitem dengan skor skala (Guilford,1965). Over-estimasi ini dapat terjadi dikarenakan pengaruh kontribusi skor masing-masing aitem dalam ikut menentukan besarnya skor skala. Sebagai contoh misalnya dalam sebuah skala skor di dapatkan dari penjumlahan skor-skor yang terdapat pada aitem-aitemnya, oleh karena itu dengan sendirinya skor setiap aitem menjadi bagian atau porsi dari skor skala tersebut. Porsi ini akan semakin besar apabila jumlah aitem dalam skala semakin sedikit. Dengan begitu, sewaktu kita menghitung koefisien korelasi suatu aitem dengan skor skala, sesungguhnya kita menghitung korelasi antara skor aitem yang bersangkutan. Dengan kata lain, kita menghitung korelasi skor dengan bagian dari dirinya sendiri dan hal ini tentu saja menyebabkan koefisien korelasinya cenderung menjadi lebih tinggi daripada kalau korelasi tersebut dihitung antara skor aitem dengan skor skala yang tidak mengandung aitem yang bersangkutan. Semakin sedikit aitem yang ada dalam skala akan semakin besar overlap yang terjadi. Sebaliknya, semakin banyak jumlah aitem dalam skala maka akibat yang ditimbulkan oleh spurious overlap semakin kecil dan tidak signifikan. Sebagai pegangan kasar, bila jumlah aitem dalam skala lebih dari 30 buah maka umumnya efek spurious overlap tidak begitu besar dan karenanya dapat di abaikan, sedangkan apabila jumlah aitem dalam skala kurang dari 30 buah maka pengaruhnya menjadi substansial sehingga perlu diperhitungkan. Untuk korelasi aitem total yang dihitung dengan formula product moment Spearman. Jenis Konstruk Aitem. Dalam penulisan aitem, perlu dilihat jenis konstruk aitem (Periantalo, 2015), yaitu: 1) Konstrak Linear Konstrak linear merupakan konstrak satu arah. Aitem akan mengungkap konstrak yang sama. Terdapat dua jenis aitem dalam konstrak ini, yaitu favorable dan unfavorable. Favorable aitem mengarah pada konstrak yang hendak diungkap, dan pemberian skornya “semakin tinggi jenjang, semakin tinggi skornya”. Unfavorable aitem merupakan negasi dari konstrak tersebut dan pemberian skornya adalah kebalikannya yaitu “semakin tinggi jenjang, maka semakin rendah skornya”. Konstrak tidak memiliki pembagian tertentu, sehingga skor akhir dari konstrak merupakan penjumlahan dari aitem tersebut. 2) Konstrak Bipolar Konstrak bipolar merupakan mengukur konstrak yang berlawanan. Besarnya suatu konstrak merupakan kecilnya konstrak yang lain. Sebagai contoh, nilai ekstrovert yang tinggi, maka secara otomatis nilai introvertnya rendah. Skor konstrak tertentu sekaligus skor konstruk yang lainnya. Salah satu skala psikologi yang menggunakan konstrak bipolar adalah Skala Myers Briggs Type Indicator (Periantalo, 2015). 3) Konstrak Ortogonal Konstrak ortogonal merupakan konstrak mengukur aspek yang berbeda satu sama lain. Konstrak ini memiliki jenis-jenis, sehingga memiliki skor pada masing-masing jenisnya. Konstrak ini tidak Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 17 memiliki skot total. Aitem mengungkapkan konstrak tertentu dan tidak mengungkapkan konstrak secara keseluruhan. Bentuk aitem yang disarankan dalam konstrak ini adalah pertanyaan dengan pilihan jawaban (Periantalo, 2015). Salah satu contoh skala dengan menggunakan konstrak ortogonal yaitu Skala Pola Asuh. Dalam skala pola asuh ada tiga pembagian pola asuh yaitu demokratis, otoriter dan permisif. Skor yang dibutuhkan sesuai dengan jenis pola asuhnya masing-masing Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 18 Tahap Penyusunan Skala yang Sering Diabaikan : Jumlah Butir di dalam Skala dan Proporsi Jumlah Butir dalam Komponen by Wahyu Widhiarso on MAY 11, 2011 in https://widhiarso.staff.ugm.ac.id/wp/tahap-penyusunan- skala-yang-sering-diabaikan-jumlah-butir-di-dalam-skala-dan-proporsi-jumlah-butir-dalam- komponen/ Penyusun harus menentukan jumlah butir di dalam skala yang dikembangkan. Demikian tulis beberapa referensi (Gorden, 1977; Hinkin, 2005). Proses ini sering dilewati oleh beberapa penyusun skala. Pada beberapa penelitian skripsi atau tesis jumlah butir tergantung dari berapa butir yang lolos dari uji coba. Kalau butir yang lolos banyak, maka semua butir itu akan dipakai. Penyusun harus menentukan jumlah butir di dalam skala yang dikembangkan. Demikian tulis beberapa referensi (Gorden, 1977; Hinkin, 2005). Proses ini sering dilewati oleh beberapa penyusun skala. Pada beberapa penelitian skripsi atau tesis jumlah butir tergantung dari berapa butir yang lolos dari uji coba. Kalau butir yang lolos banyak, maka semua butir itu akan dipakai. Proses penyusunan alat ukur tidak hanya menyeleksi butir saja, kemudian memakai butir yang lolos seleksi. Ada seni tersendiri di dalam penyusunan alat ukur, tidak hanya membuang butir tetapi juga menyesuaikan butir dengan desain awal yang dibuat. Tulisan ini mencoba mengupas sedikit permasalahan ini. Ketika sampai pada tahap penyusunan skala psikologi sampai penulisan butir, pertanyaan yang harus dijawab oleh penyusun skala adalah: Berapa butir yang direncanakan untuk dilibatkan dalam skala tersebut ? Untuk menjawab pertanyaan tersebut kita bisa mempertimbangan tujuan pengukuran, keluasan domain ukur, atau karakteristik sampel, dsb. Proporsi Butir dalam Komponen Jumlah butir di dalam komponen, mewakili unsur kepentingan ukurnya (Crocker & Algina, 2008). Komponen atau dominan yang dirasa lebih penting memiliki jumlah butir yang lebih banyak dibanding degan komponen lainnya. Jika tidak ada teori atau hasil penelitian yang menjelaskan mengenai komponen tersebut, maka lebih baik jumlah butir dalam komponen adalah seimbang. Contoh Tabel Blue Print Skala/Kisi-kisi Skala Blue Print Berbeda dengan Tabel Sebaran Butir Blueprint atau Table Spesifikasi (Crocker & Algina, 2008) adalah panduan yang dipakai oleh penyusun alat ukur. Dengan blueprint yang sama diharapkan alat ukur yang dibuat akan memiliki karakteristik yang sama. Misalnya untuk membuat dua tes yang paralel, maka kedua tes tersebut harus didapatkan dari blueprint yang sama. Sering saya jumpai beberapa penulis mengatakan Tabel Sebaran Butir sebagai blueprint. Tabel Sebaran Butir berbeda dengan blueprint karena lebih menekankan nomor-nomor butir pada masing- masing komponennya atau arah butir tersebut (favorabel atau non favorabel). Misalnya kita membuat Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 19 dua tes yang paralel. Dua tes tersebut bisa jadi Tabel Sebaran Butirnya berbeda, namun blueprintnya sama. Selain itu tabel sebaran butir lebih terkait dengan kegiatan setelah pengukuran dilakukan daripada penyusunan alat ukur. Misalnya untuk melakukan penyekoran, pertimbangan dalam menyeleksi butir, atau konfirmasi hasil analisis faktor. Contoh Tabel Sebaran Butir Tabel di bawah ini adalah contoh Tabel sebaran butir. Di dalamnya ada butir yang direncanakan untuk dipakai dalam skala jadi dan butir yang dipakai dalam skala uji coba. Nomor-nomor butir juga disertakan untuk mengetahui sebaran butir di dalam skala berdasarkan komponennya. Contoh Tabel Sebaran Butir Ada banyak versi tabel sebaran butir, ada yang hingga mendetail hingga favorabilitas butirnya, ada yang hingga dijabarkan sampai fasetnya dan ada juga yang dilengkapi dengan proses kognitif yang dilibatkan dalam butir. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 20 Jumlah Butir Diujicobakan Lebih Banyak dari yang Direncanakan Dari pertimbangan yang ada, misalnya saya merencanakan skala saya berisi 10 butir. Untuk diujicobakan, maka saya harus membuat jumlah butir yang akan saya ujicobakan (initial items) lebih banyak dari 10 butir. Misalnya 2 kali lipat dari butir yang direncanakan, sehingga jumlah butir yang diujicobakan adalah 20 butir. Hal ini untuk berjaga-jaga butir yang akan saya buat berguguran, setelah diujicoba. B. Hasil Uji Coba Alat Ukur Pada contoh kali ini hasil uji coba hanya saya arahkan pada seleksi butir dan estimasi reliabilitas pengukuran saja. Kita menggunakan korelasi butir total di bawah 0.3 sebagai kriteria penguguran butir. Butir yang memiliki korelasi di bawah 0.3 kita gugurkan. Kasus 1 : Masih Ada Persediaan Butir Pada kasus ini butir yang gugur tidak banyak sehingga jumlah butir yang lolos lebih dari yang direncanakan. Kita kelebihan butir, sehingga kita perlu mengugurkan butir lagi untuk menyesuaikan dengan desain awal kita. Lihat Tabel di bawah ini. Karena tidak ada yang gugur, pada aspek 1 masih menyisahkan 8 butir. Kita harus mengurangi 4 butir lagi agar menjadi 4 butir. Banyak cara yang bisa dipakai untuk mengugurkan. Bisa menggunakan korelasi butir-total lagi, berdasarkan konten butirnya, atau berdasarkan factor loading analisis faktor. Kasus 2 : Persediaan Butir Masih Kurang Pada kasus ini butir yang gugur cukup banyak sehingga jumlah butir yang lolos kurang dari yang direncanakan. Misalnya untuk Aspek 1 dan 2. Kita hanya memiliki 3 butir, padahal desain kita berisi 4 butir. Berarti kurang 1 butir lagi. Kekurangan satu butir ini kita carikan dari butir-butir yang telah digugurkan, akan tetapi yang korelasi butir totalnya mendekati 0.3. Atau setidaknya korelasi butir-totalnya masih di atas yang direkomendasikan oleh para ahli. Misalnya di atas 0.2. Jika semua butir yang gugur memiliki korelasi di bawah 0.2, maka menambahkannya ke dalam skala akan mendukung peningkatan validitas isi skala, akan tetapi tidak banyak membantu reliabilitas pengukuran oleh skala. Karena memasukkan butir dengan kualitas yang kurang bagus tidak akan banyak meningkatkan reliabilitas. So, dalam kasus seperti ini, butir-butir yang ditulis perlu direvisi dan diujicobakan lagi. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 21 Penutup Kesesuaian antara komposisi butir pada skala yang sudah jadi dan skala yang direncanakan sejak awal secara tidak langsung menunjukkan validitas isi skala. Validitas isi menunjukkan seberapa besar skala pengukuran merepresentasikan domain ukurnya. Sementara itu komponen dan proporsi butir-butirnya menunjukkan domain dan jangkauan ukurnya. Jadi, kalau skala yang dihasilkan memiliki komponen dan proporsi butir yang berbeda dengan desain awalnya maka dapat dikatakan skala tersebut validitas isinya kurang memuaskan. Daftar Pustaka Crocker, L., & Algina, J. (2008). Introduction to classical and modern test theory. Mason: Cengage Learning. Gorden, R. L. (1977). Unidimensional scaling of social variables: Concepts and procedures. New. York: Free Press. Hinkin, T. R. (2005). Scale development principles and practices. In R. A. Swanson & E. F. Holton (Eds.), Research in organizations : Foundations and methods of inquiry. San Francisco, California: Berrett-Koehler Publishers, Inc. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 22 Prosedur Adaptasi Alat Ukur. Salah satu kesalahan umum dalam proses adaptasi adalah bahwa adaptasi hanya dilakukan dengan menerjemahkan alat ukur dari bahasa asing ke bahasa Indonesia. Padahal jika dipelajari lebih dalam lagi, adaptasi bukan semata-mata menerjemahkan alat ukur, namun juga menyesuaikan apakah tes tersebut kontekstual dengan kondisi sosial budaya masyarakat tujuan. Adaptasi alat ukur meliputi aktivitas dari menentukan apakah alat ukur dapat mengukur konstruk yang sama dalam bahasa dan budaya yang berbeda, memilih penerjemah, memutuskan akomodasi yang sesuai, sampai mengecek kesetaraannya dalam bentuk yang diadaptasi (Hambleton, Merenda, & Spielberger 2005). Adaptasi tes verbal memang memiliki tingkat kesulitan yang lebih tinggi jika dibanding adaptasi tes numerik/figurall. Hal ini karena adanya perbedaan makna kata jika diterjemahkan begitu saja. Oleh karena itu adaptasi perlu dilakukan untuk melihat kesesuaian makna namun tetap kontekstual dengan kondisi budaya setempat. Beaton, Bombardier, Guillemin, dan Ferraz (2000) membuat panduan langkah-langkah untuk peneliti dalam melakukan proses adaptasi suatu skala ke dalam bahasa dan konteks budaya yang berbeda dengan skala asli. Secara garis besar ada lima tahap yang harus dilalui, yakni: 1. Tahap pertama adalah menerjemahkan tes asli ke bahasa sasaran. Terjemahan dilakukan oleh dua orang yang bekerja independen. Penerjenah haruslah memiliki kemampuan baik dalam dua bahasa, baik bahasa asal alat tes maupun bahasa sasaran alat tes. Salah satu penerjemah juga harus memiliki pemahaman kuat tentang konsep teori skala tes yang ingin diterjemahkan. Menerjemahkan bahasa item tidak sama dengan menerjemahkan kalimat per kalimat, apalagi kata demi kata. Penerjemahan tidak hanya sekedar mengganti bahasa yang digunakan, namun juga konteks kulturnya. 2. Tahap kedua adalah sintesis. Dari dua terjemahan tadi, kemudian dicari persamaan dan perbedaannya hingga akhirnya diperoleh satu terjemahan yang disepakati yang selanjutnya disebut sebagai draft skala terjemahan. 3. Tahap ketiga adalah terjemahan balik ke bahasa asal. Draft skala terjemahan yang sudah disusun kemudian diterjemahkan kembali ke bahasa asal skala itu dibuat. Terjemahan balik dilakukan oleh penerjemah profesional yang akan bekerja untuk menerjemahkan draft skala tersebut secara mandiri. Hasil terjemahan balik kemudian dibandingkan dengan skala aslinya, apakah ada perbedaan makna dalam hasil terjemahan tersebut. 4. Tahap keempat adalah diskusi dengan ahli, dalam hal ini bisa berupa pembuat tes asli, ahli bahasa, ahli pengukuran, atau siapapun yang menguasai konsep tes yang disusun. Diskusi tersebut dilakukan dengan tujuan memastikan adanya kesetaraan makna antara skala asli dengan skala yang sudah diterjemahkan. Jika dirasa tidak ada perbedaan makna dari kedua skala tersebut, maka dapat dilanjutkan ke tahap selanjutnya. 5. Tahap kelima adalah try out dengan mengijocobakan tes ke subjek dalam jumlah kecil. Uji coba ke subjek dalam jumlah kecil ini dilakukan untuk mengetahui apakah instruksi dan item dalam skala tersebut dapat dipahami dengan baik oleh responden atau belum. Jika secara kualitatif item dalam tes sudah bisa dipahami, baru dilakukan uji validitas dan reliabilitas dengan jumlah sampel yang lebih besar. 6. Tahap terakhir adalah pengumpulan tes yang diadaptasi ke pengembang tes asli agar data tes terdokumentasi. Dengan demikian penggunaan tes untuk studi lintas budaya dapat lebih maksimal. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 23 Adaptasi yang baik haruslah terdokumentasi. Dokumentasi ini penting bagi arsip pengembang tes, agar pengguna tes dari negara dan bahasa lain dapat menggunakannya secara terstandar. Jadi sepatutnya, sebelum melakukan adaptasi, peneliti menghubungi pengembang tes untuk izin dan meminta kerjasama selama proses adaptasi. Begitu juga setelah adaptasi telah selesai, peneliti juga harus melaporkan hasilnya kepada pengembang tes untuk dokumentasi. Sehingga peneliti lain bisa dengan mudah mendapatkan alat ukur tersebut tanpa perlu melakukan proses adaptasi ulang. Hal yang tidak boleh dilakukan dalam adaptasi adalah menambah atau mengurangi jumlah item serta mengubah struktur tes. Misalkan, dikarenakan ada beberapa item yang memiliki daya beda rendah kemudian peneliti menghapus item tersebut. Atau dikarenakan pilihan jawaban sampai lima pilihan cukup membingungkan subjek, maka peneliti mengganti dengan tiga pilihan jawaban. Pada dasarnya, salah satu tujuan dan prinsip mengapa adaptasi alat ukur perlu dilakukan adalah agar dapat dilakukan studi lintas budaya dengan alat ukur yang setara. Jika alat ukur sudah dimodifikasi baik itu jumlah item maupun struktur tesnya, tentu hasil yang diperoleh tidak dapat lagi diperbandingkan. Dengan kata lain, jika di Amerika variabel X dan Y korelasinya 0,5 dengan jumlah item 20; sedangkan di Indonesia nilai korelasinya 0,3 dengan jumlah item 15; maka nilai korelasi tersebut tidak komparable karena jumlah item yang sudah berbeda. Beberapa kesalahan umum terkait prosedur adaptasi yang ada di Indonesia diantaranya: 1. Adaptasi tes tanpa izin atau pemberitahuan ke pengembang tes asli. Untuk tes-test tertentu, izin itu mutlak diperlukan sebagai bagian dari penghargaan hak intelektualitas. Sementara bagi tes yang tidak memerlukan izin, pemberitahuan penting dilakukan untuk dokumentasi pengembang alat tes. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
P a g e | 24 2. Adaptasi semata-mata hanya menerjemahkan bahasa. Ini sering dilakukan peneliti ketika ingin mengadaptasi instrumen untuk penelitiannya. Peneliti mengatakan adaptasi, padahal dia hanya menerjemahkan tanpa melakukan memastikan apakah terjemahannya sudah setara atau belum. Apalagi jika terjemahan itu dilakukan oleh peneliti sendiri 3. Alat ukur adaptasi tidak perlu diujicobakan lagi. Ini juga kesalahan umum para peneliti kita. Ketika mereka melakukan adaptasi, banyak yang menganggap tidak perlu lagi menguji validitas dan reliabilitasnya karena sudah diuji sebelumnya oleh pengembang tes asli. Padahal kita tahu bahwa validitas dan reliabilitas itu kontekstual sesuai dengan subjeknya. Hal tersebut dengan alasan yang simpel, karena pada dasarnya untuk menentukan validitas dan reliabilitas terutama dengan jalan empirik-kuantitatif, kondisi kuantitatif sampel akan mempengaruhi hasil pengujian validitas dan reliabilitas tersebut. Jadi, tes yang sudah valid dan reliabel di luar, belum tentu valid dan reliabel jika digunakan di Indonesia. Pada titik inilah, Kita akan menjadi bijak jika kita melakukan uji coba alat ukur hasil adaptasi. 4. Kita bisa memakai norma dari tes asli untuk menginterpretasikan data kita. Norma dibuat untuk membandingkan skor individu dengan skor kelompoknya. Tes yang sudah diadaptasi ada baiknya dibuat juga normanya sesuai dengan kondisi masyarakat setempat. Hal ini dikarenakan ada perbedaan sosio-kultural yang juga berpengaruh pada interpretasi skor. Kasus yang paling sering adalah ketika kita menginterpretasikan skor EPPS dengan norma asli (dari Barat), maka heterosexualty orang Indonesia pasti akan cenderung rendah (ada kecenderungan homoseksual). Padahal itu karena item yang telalu vulgar bagi masyarakat kita dan norma yang diguanakan berasal dari Barat yang berbeda dengan budaya kita. 5. Menambah atau mengurangi item jika ternyata item tersebut tidak memuaskan. salah satu alasan kenapa adaptasi itu penting adalah untuk studi lintas budaya agar didapat hasil yang komparable. Penambahan atau pengurangan jumlah item tentu akan menghilangkan fungsi tersebut. Modul disusun hanya untuk kebutuhan pendukung kuliah PSP yang diampu Dosen R. Landung E.P., M.Psi., Psi. pada tahun ajaran 2019/2020. Dilarang menyebarluaskan tanpa seijin dari penyusun.
Search
Read the Text Version
- 1 - 24
Pages: