Abstrak
Siti Badriyah, Pendeteksian Differential Item Functioning (DIF) Dengan Pendekatan Item Respons Theory Soal Ujian Nasional SMP/MTs Provinsi Jawa Barat Tahun 2012. Tesis. Program Studi Penelitian dan Evaluasi Pendidikan. Sekolah Pascasarjana Universitas Muhammadiyah Prof. DR. HAMKA. September 2013.
Ujian Nasional merupakan salah satu bentuk penilaian pendidikan yang
dilakukan pemerintah secara nasional. Aspek mutu soal ujian perlu menjadi prioritas
utama dalam setiap kegiatan penilaian pendidikan. Ujian Nasional selain berfungsi
sebagai kontrol terhadap kualitas pendidikan, dan sertifikasi, juga memiliki fungsi
keputusan. Artinya Ujian Nasional merupakan salah satu faktor yang menentukan
keberhasilan siswa pada masa akhir pendidikan seperti penentuan kelulusan pada setiap
jenjang pendidikan. Oleh karena itu segala persyaratan menyangkut soal ujian harus
dipenuhi. Butir soal yang baik harus memiliki tingkat kesukaran yang memadai dan
daya beda yang baik. Selain tingkat kesukaran dan daya beda, soal yang baik harus
berkeadilan (fairness). Artinya, perilaku soal tersebut sama terhadap beberapa
kelompok yang berbeda. Dengan kata lain suatu butir soal harus berperilaku adil
terhadap dua atau lebih kelompok yang diasumsikan memiliki kemampuan sama.
Penelitian ini menggunakan data UN salah satu paket tingkat SMP/MTs
tahun 2012 Provinsi Jawa Barat sebanyak 9.434 peserta ujian untuk mata pelajaran
Bahasa Indonesia Paket D74, Bahasa Inggris Paket C34, Matematika Paket B47 dan
IPA Paket D21. Analisis utama dilakukan untuk memperoleh informasi tentang butirbutir
soal yang terdeteksi memuat DIF dengan metode perbedaan parameter ? b dengan
pendekatan teori modern.
Analisis secara klasik menghasilkan semua mata pelajaran yang diujikan
mempunyai kualitas yang baik. Hanya ada 1 butir (2 %) Bahasa Inggris, 1 butir (2,5 %)
Matematika, dan 4 butir (10 %) IPA yang ditolak atau perlu direvisi kembali.
Sedangkan hasil analisis dengan pendekatan model Rasch semua mata pelajaran memiliki fit statistik yang baik, baik fit statistik kemampuan dengan model maupun
butir soal dengan model. Hanya terdapat 1 butir (2,5 %) soal IPA yang tidak fit dengan
model. Kesesuaian antara tingkat kemampuan dengan tingkat kesukaran soal sangat
berbeda. Rata-rata tingkat kemampuan siswa secara keseluruhan lebih tinggi dari pada
tingkat kesukaran soal (0.00 skala logit). Kemampuan mata pelajaran Bahasa Indonesia
+1.54 logit, Bahasa Inggris +0.81 logit, Matematika +1.11 logit, dan IPA +0.92 logit.
Metode Rasch Model menggunakan kriteria untuk menentukan butir soal
terindikasi DIF ditinjau dari tingkat kesukaran soal, tingkat kesukaran soal kelompok
laki-laki (d1), tingkat kesukaran soal kelompok perempuan (d2) dari dua kelompok
peserta tes. Jika tingkat kesukaran (p) 0.05 atau 2
hitung 2
tabel atau jika 2
hitung
3.85 untuk = 0.05 dengan df = 1, maka butir soal tersebut terindikasi atau potensial
mengandung DIF. Hasil analisis pendeteksian DIF dengan metode uji perbedaan
parameter ? b didapatkan Bahasa Indonesia sebanyak 24 butir (48 %), Bahasa Inggris
sebanyak 16 butir (32 %), Matematika sebanyak 15 butir (37,5 %) dan IPA sebanyak 21 (52,5 %) memuat atau terindikasi DIF.