Abstrak
Siti Badriyah, Pendeteksian Differential Item Functioning (DIF) Dengan Pendekatan Item Respons Theory Soal Ujian Nasional SMP/MTs Provinsi Jawa Barat Tahun 2012. Tesis. Program Studi Penelitian dan Evaluasi Pendidikan. Sekolah Pascasarjana Universitas Muhammadiyah Prof. DR. HAMKA. September 2013. Ujian Nasional merupakan salah satu bentuk penilaian pendidikan yang dilakukan pemerintah secara nasional. Aspek mutu soal ujian perlu menjadi prioritas utama dalam setiap kegiatan penilaian pendidikan. Ujian Nasional selain berfungsi sebagai kontrol terhadap kualitas pendidikan, dan sertifikasi, juga memiliki fungsi keputusan. Artinya Ujian Nasional merupakan salah satu faktor yang menentukan keberhasilan siswa pada masa akhir pendidikan seperti penentuan kelulusan pada setiap jenjang pendidikan. Oleh karena itu segala persyaratan menyangkut soal ujian harus dipenuhi. Butir soal yang baik harus memiliki tingkat kesukaran yang memadai dan daya beda yang baik. Selain tingkat kesukaran dan daya beda, soal yang baik harus berkeadilan (fairness). Artinya, perilaku soal tersebut sama terhadap beberapa kelompok yang berbeda. Dengan kata lain suatu butir soal harus berperilaku adil terhadap dua atau lebih kelompok yang diasumsikan memiliki kemampuan sama. Penelitian ini menggunakan data UN salah satu paket tingkat SMP/MTs tahun 2012 Provinsi Jawa Barat sebanyak 9.434 peserta ujian untuk mata pelajaran Bahasa Indonesia Paket D74, Bahasa Inggris Paket C34, Matematika Paket B47 dan IPA Paket D21. Analisis utama dilakukan untuk memperoleh informasi tentang butirbutir soal yang terdeteksi memuat DIF dengan metode perbedaan parameter ? b dengan pendekatan teori modern. Analisis secara klasik menghasilkan semua mata pelajaran yang diujikan mempunyai kualitas yang baik. Hanya ada 1 butir (2 %) Bahasa Inggris, 1 butir (2,5 %) Matematika, dan 4 butir (10 %) IPA yang ditolak atau perlu direvisi kembali. Sedangkan hasil analisis dengan pendekatan model Rasch semua mata pelajaran memiliki fit statistik yang baik, baik fit statistik kemampuan dengan model maupun butir soal dengan model. Hanya terdapat 1 butir (2,5 %) soal IPA yang tidak fit dengan model. Kesesuaian antara tingkat kemampuan dengan tingkat kesukaran soal sangat berbeda. Rata-rata tingkat kemampuan siswa secara keseluruhan lebih tinggi dari pada tingkat kesukaran soal (0.00 skala logit). Kemampuan mata pelajaran Bahasa Indonesia +1.54 logit, Bahasa Inggris +0.81 logit, Matematika +1.11 logit, dan IPA +0.92 logit. Metode Rasch Model menggunakan kriteria untuk menentukan butir soal terindikasi DIF ditinjau dari tingkat kesukaran soal, tingkat kesukaran soal kelompok laki-laki (d1), tingkat kesukaran soal kelompok perempuan (d2) dari dua kelompok peserta tes. Jika tingkat kesukaran (p)  0.05 atau 2 hitung 2 tabel atau jika 2 hitung 3.85 untuk  = 0.05 dengan df = 1, maka butir soal tersebut terindikasi atau potensial mengandung DIF. Hasil analisis pendeteksian DIF dengan metode uji perbedaan parameter ? b didapatkan Bahasa Indonesia sebanyak 24 butir (48 %), Bahasa Inggris sebanyak 16 butir (32 %), Matematika sebanyak 15 butir (37,5 %) dan IPA sebanyak 21 (52,5 %) memuat atau terindikasi DIF.