reliabilitas


RELIABILITAS INSTRUMEN EVALUASI


BAB I
PENDAHULUAN
Evaluasi pendidikan adalah proses/kegiatan untuk menentukan kemajuan pendidikan dibandingkan dengan tujuan yang telah ditentukan, usaha untuk memperoleh informasi berupa umpan balik (feed back) bagi penyempurnaan pendidikan.
Evaluasi bagi guru memiliki makna untuk mengetahui apakah materi yang diajarkan sudah tepat bagi siswa sehingga guru dapat mengadakan perubahan yang lebih baik, efektif dan tepat. Di antara cara mengetahuinya adalah dengan adanya alat atau instrument evaluasi, yaitu dengan teknik tes dan nontes.
Adapun tes, menurut Arikunto (2011: 57) untuk dapat dikatakan baik sebagai alat pengukur memiliki persyaratan, yaitu validitas, reliabilitas, objektivitas, praktikabilitas dan ekonimis. Menurut Meredith Gall ( 2003: 190) menyebutkan sebagai karakteristik tes yang baik adalah “objectifity, standard conditions of administration and scoring, standars for interpretation, fairness, validity and reliability”.
Reliabilitas sebagai salah satu syarat tes yang baik akan dipaparkan pada makalah ini. Di antaranya akan menjelaskan tentang pengertian dari reliabilitas, persyaratannya, macam-macam reliabilitas dan cara menentukan reliabilitas instrument serta faktor yang memengaruhi reliabilitas.



BAB II
PEMBAHASAN
A.      Pengertian
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris, berasal dari kata reliable yang artinya dapat dipercaya. Reliable dalam Kamus Inggris-Indonesia (Echols, 2003: 475) merupakan kata sifat yang artinya dapat dipercaya/diandalkan dan reliability adalah kata benda yang artinya hal dapat dipercaya, hal tahan uji.
Pengertian reliabilitas menurut beberapa pendapat:
1.        Kenneth D. Moore (2005:172), Reliability is the consistency with which a measurement device gives the same result when the measurement is repeated. In the oder word, it is the measurement device’s trustworthiness or dependability. Reliabilitas adalah konsistennya/tetapnya sebuah alat ukur dengan hasil yang sama ketika diulang kembali. Dengan kata lain adalah alat ukur yang dapat dipercaya atau dipertanggungjawabkan.
2.        Zainal Arifin (2012: 258), reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrument.
3.        Purwanto (2011: 182), reliabilitas berhubungan dengan kemampuan alat ukur untuk melakukan pengukuran secara cermat.
4.        Suharsimi Arikunto (2011: 86), reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes berhubungan dengan masalah ketetapan hasil tes.
Reliabilitas dari beberapa pendapat di atas dapat disimpulkan sebagai ketetapan hasil tes yang dapat dipercaya. Karena keterpercayaan berhubungan dengan ketetapan dan konsistensi.Dari beberapa pendapat di atas juga dapat disimpulkan bahwa syarat reliabilitas adalah tes yang sama diulang kembali kepada siswa yang sama dan memiliki hasil yang tetap sama. Hasil yang tetap sama di sini bukan berarti nilainya tetap sama persis seperti sebelumnya akan tetapi hasilnya tetap sama derajatnya. misalnya si A mendapat nilai 8 dan si B mendapat nilai 7 kemudian setelah dites kembali  si A mendapat nilai 9 dan si B mendapat nilai 8, di sini juga disebut tetap/reliable karena si B tetap memiliki hasil tes yang sama seperti sebelumnya yaitu tetap di bawah nilai si A. Tes hasil belajar dikatakan dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap secara konsisten.

B.       Faktor yang Memengaruhi Reliabilitas
Hasil tes belajar setelah dites kembali dapat saja memberikan hasil yang berbeda. Hasil tes dapat saja berubah menjadi lebih baik atau lebih rendah dari nialai sebelumnya terkait dengan siswa. Misalnya siswa masih ingat jawabannya atau telah mempelajari sesuatu atau bahkan lupa karena rentang waktu antara tes pertama dengan tes kedua berjauhan. Tes yang diujikan dan pelaksanaan tes tersebut juga dapat memengaruhi hasil tes belajar selanjutnya juga memengaruhi reliabilitas tes tersebut.
Lodico dan kawan-kawan (2010: 94) menyatakan “ factor that influence reliability include:
1.        Test taker’s personal characteristic (for example, motivation, health, mood, fatigue). Karakter/sifat pribadi penerima tes (contohnya motivasi, kesehatan, suasana hati, kelelahan).
2.        Variations in test setting (for example, differences in the physical characteristics of the room). Perbedaan pada keadaan tes (contohnya, karakter fisik dari ruangan yang berbeda).
3.        Variations in the adminitration and scoring of the test. Perbedaan pada pelaksanaan dan skor tes.
4.        Variation in participant responses due to guessing. Perbedaan pada reaksi/respon peserta ketika menjawab tes.
Adapun Grolund (1985) dalam Arifin (2012: 258) mengemukakan ada empat faktor yang dapat memengaruhi reliabilitas, yaitu panjang tes (length of test), sebaran skor (spread of scores), tingkat kesukaran (difficulty indeks) dan objektifitas (objectivity). Sedangkan Arikunto (2011: 87) menyatakan banyak hal yang memengaruhi hasi tes. Namun secara garis besar dapat dikelompokkan menjadi tiga hal, yaitu: hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-buir soalnya; hal yang berhubungan dengan tercoba/testee (testee adalah responden yang sedang mengerjakan tes); dan hal yang berhubungan dengan penyelenggaraan tes.
Faktor yang memengaruhi reliabilitas dari ketiga pendapat di atas, pendapat dari Arikunto dapat dijadikan kesimpulan. Gronlund melihat dari sudut pandang tes dan Lodico & kawan-kawan melihat dari sudut pandang penerima tes dan  pelaksanaan tes. Untuk lebih rinci dapat diuraikan sebagai berikut:
1.        Panjang tes dan kualitas butir-butir soal. Panjang tes berarti banyaknya soal tes dan banyaknya soal lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Sebaran skor dan tingkat kesukaran tes.
2.         Hal yang berhubungan dengan tercoba (testee), seperti sifat penerima tes meliputi reaksinya ketika menjawab soal tes. Ada siswa yang gugup atau sakit ketika menjawab soal atau bahkan ada yang tenang dan semangat ketika menjawab soal akan memengaruhi hasil tes.
3.        Hal yang berhubungan dengan penyelanggaraan tes, seperti ruangan yang bersih, tenang, ramai atau panas, pengawas tes yang ramah atau galak, petunjuk tes yang jelas atau tidak rumit/berbelit akan memengaruhi hasil tes.

C.       Macam-macam Reliabilitas dan Cara Menentukan Reliabilitas  
Macam-macam reliabilitas berhubungan langsung dengan cara/teknik menentukan reliabilitas. Mengikuti pendapat Arifin, ada tiga macam, yaitu koefesiensi stabilitas, koefesien ekuifalen dan koefesien konsistensi internal. Arikunto membagi reliabilitas berdasarkan teknik menentukan reliabilitas yaitu menjadi tiga macam yaitu metode bentuk paralel (equivalent), metode tes ulang (tes-retest method) dan metode belah dua (split-half method). Adapun Sudijono menyebutnya sebagai pendekatan juga menjadi tiga macam, yaitu pendekatan single test-single trial (single test-single trial method), pendekatan test-retest (single test-double trial method) dan pendekatan alternate from (double test-double trial method). Dari ketiga pendapat yang disebutkan tadi dapat disimpulkan bahwa berdasarkan teknik menentukan reliabilitas dibagi menjadi tiga macam yang diuraikan sebagai berikut.
1.      Koefisien ekuivalen/paralel
Tes ekuivalen/paralel adalah dua buah tes yang diujikan dalam satu waktu. Syaratnya adalah tesnya harus sejenis, mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tesnya sama tetapi butir-butir soalnya berbeda. Kelebihan adalah karena butir-butir soal dibuat sejenis tetapi tidak sama, maka tes hasil belajar (yang akan diuji reliabilitasnya) dapat terhindar dari kemungkinan timbulnya pengaruh yang datang dari testee (umpamanya masih ingat rumusnya, perubahan situasi atau kondisi penyelenggaraan tes). Kelemahannya tester atau pembuat tes harus membuat dua buah instrument tes, kemungkinan derajat instrument tes yang berbeda, sarta kesediaan waktu dalam penyelenggaraan tes.
Pelaksanaan tes reliabilitasnya adalah dengan mencari korelasi dari kedua tes tadi. Teknik korelasi dapat dipilih antara korelasi produk moment dari Pearson atau teknik korelasi rank order dari Spearman (khusus untuk N, kurang dari 30). Rumusnya sebagai berikut:
2.      Koefisien stabilitas
Koefisien stabilitas adalah jenis reliabilitas dengan memberikan tes kepada sekelompok individu/siswa tengan tes yang sama dengan waktu yang berbeda. Syaratnya dalam jangka waktu antara pelaksanaan yang pertama dengan yang kedua, guru sama sekali tidak boleh menyinggung petunjuk tentang tes yang pertama dan testing dilaksanakan dalam situasi dan kondisi yang sama. Artinya, harus diusahakan agar situasi dan kondisi tidak jauh berbeda. Teknik yang digunakan adalah test and retest ( single test-double trial). Rumusnya menggunakan rumus Spearman berikut:
 (baca: Rho)  = koefesien korelasi antara hasil tes I dengan hasil tes II
D                     = Difference (beda antara rank variabel I dan II) atau D=
6 dan 1                        = bilangan konstan
N                     = banyaknya subyek (testee)
3.      Koefisien konsistensi internal
Penentuan reliabilitas tes ini adalah dengan jalan melakukan pengukuran terhadap satu kelompok subyek/testee, dimana pengukuran itu dilakukan dengan hanya menggunakan satu jenis alat pengukur dan pelaksanaannya hanya satu kali. Cara/teknik pengukurannya dapat ditentukan dengan lima rumus yaitu rumus Spearman-Brown, rumus Flanagan, rumus Rulon, rumus Kuder Richardson dan rumus C. Hoyt.
a.       Rumus Spearman-Brown
Penentuan reliabilitas dilakukan dengan jalan membelah dua tes berdasarkan pada korelasi, yaitu korelasi antara separuh belahan pertama dengan belahan kedua dari tes tersebut. Syaratnya adalah jumlah item tes berupa bilangan genap, mempunyai derajat kesukaran yang tinggi dan materi tes hendaknya bersifat komprehensif, sehingga memungkinkan bagi penyusun tes membuat dua butir item tes untuk satu permasalahan yang sama.
Teknik belah dua dapat dilakukan dengan cara belah dua gasal-genap yaitu mengelompokkan nomor gasal dan genap (misalnya tes berjumlah 10 item, maka kelompok gasal adalah item tes nomor  1, 3, 5, 7 & 9 dan kelompok genap 2, 4, 6, 8 & 10).  Dapat juga dengan cara belah dua atas-bawah atau kiri-kanan (kelompok atas/kiri adalah item tes nomor 1-5 dan kelompok bawah/kanan 6-10).
Rumusnya:
    = koefesien reliabilitas tes secara total (tt = total test)
   = koefesien korelasi product moment antara separoh (bagian pertama) tes
           dengan separoh (bagian kedua) dari tes tersebut (h = half-half)
1&2 = bilangan konstan
Rumus lain yang sejenis dengan yang di atas adalah:  
   = koefesien reliabilitas tes secara keseluruhan
  = koefesien korelasi product moment antara separoh (1/2) tes (belahan I)
           dengan separoh (1/2) tes (belahan II) dari tes tersebut
1&2= bilangan konstan
Contoh mencari reliabilitas dengan menggunakan teknik Spearman-Brown dengan cara belah dua gasal-genap. Dengan ketentuan bahwa untuk setiap jawaban betul diberikan skor 1 sedangkan untuk jawaban salah diberikan skor 0 sebagai berikut:
No.
Nama
Skor untuk item tes nomor:
Skor total
1
2
3
4
5
6
7
8
9
10
1
Amel
1
0
1
0
1
1
1
1
1
1
8
2
Ana
0
0
1
0
1
0
0
1
1
1
5
3
Dina
0
1
0
0
0
1
0
1
0
1
4
4
Nida
1
1
0
0
1
1
0
0
1
0
5
5
Ihsan
1
1
1
1
1
1
0
0
0
0
6
6
Reza
1
0
1
0
1
0
1
0
0
0
4
7
Robi
1
1
1
1
1
1
1
0
0
0
7
8
Subhan
0
1
0
1
1
1
1
1
1
1
8
Langkah pertama, menjumlahkan skor-skor yang dimiliki oleh item yang bernomor gasal (selanjutnya untuk kode X) yaitu item nomor 1,3,5,7 dan 9.
No.
Nama
Skor untuk item tes nomor:
Skor total
1
3
5
7
9
1
Amel
1
1
1
1
1
5
2
Ana
0
1
1
0
1
3
3
Dina
0
0
0
0
0
0
4
Nida
1
0
1
0
1
3
5
Ihsan
1
1
1
0
0
3
6
Reza
1
1
1
1
0
4
7
Robi
1
1
1
1
0
4
8
Subhan
0
0
1
1
1
3
Langkah kedua, menjumlahkan skor-skor yang dimiliki oleh item tes yang bernomor genap (selanjutnya untuk kode Y) yaitu item nomor 2, 4, 6, 8 &10.


No.
Nama
Skor untuk item tes nomor:
Skor total
2
4
6
8
10
1
Amel
0
0
1
1
1
3
2
Ana
0
0
0
1
1
2
3
Dina
1
0
1
1
1
4
4
Nida
1
0
1
0
0
2
5
Ihsan
1
1
1
0
0
3
6
Reza
0
0
0
0
0
0
7
Robi
1
1
1
0
0
3
8
Subhan
1
1
1
1
1
5
Langkah ketiga, mencari (menghitung) angka indek korelasi “r” product moment, antara variabel X (separoh belahan tes pertama) dengan variabel Y (separoh belahan tes kedua) yaitu  ,  atau
No.
Nama
Gasal ( )
Genap ( )
1
Amel
5
3
15
25
9
2
Ana
3
2
6
9
4
3
Dina
0
4
0
0
16
4
Nida
3
2
6
9
4
5
Ihsan
3
3
9
9
9
6
Reza
4
0
0
16
0
7
Robi
4
3
12
16
9
8
Subhan
3
5
15
9
25

Jumlah
S  25
S  22
S  63
S 93
S 76
Langkah keempat, subtansikan ke dalam rumus
=0,378 dibulatkan menjadi =0,4
Langkah kelima, mencari (menghitung) koefisien reliabilitas tes dengan menggunakan rumus:    . Telah diketahui  adalah =0,378 dibulatkan menjadi =0,4, subtansikan ke dalam rumus menjadi:    =  = 0,57.
Langkah keenam, memberikan interpretasi terhadap  . Berdasarkan hasil-hasil perhitungan di atas, telah diperoleh koefesien reliabilitas tes sebesar 0,57. Dengan demikian hasil tes belajar dinyatakan memiliki belum memiliki reliabilitas yang tinggi karena di  bawah angka 0,70.
b.      Rumus Flanagan
Penentuan reliabilitas dengan cara ini juga dengan jalan membelah dua tes tetapi berdasarkan pada deviasi. Rumusnya  = 2 (1- )
   = koefesien reliabilitas tes secara totalitas
2&1 = bilangan konstan
    = jumlah kuadrat deviasi (=varian) dari skor-skor hasil tes yang termasuk
           pada belahan I
   = jumlah kuadrat deviasi (=varian) dari skor-skor hasil tes yang termasuk
           pada belahan II
   = jumlah kuadrat total deviasi (=varian total) dari skor-skor hasil tes yang
           termasuk pada belahan I dan belahan II
Perlu dijelaskan terlebih dahulu bahwa:  dapat diperoleh dengan menggunakan rumus: =  (=jumlah kuadrat dari deviasi skor-skor X atau skor-skor item belahan I, dibagi dengan jumlah subyek atau testee). Sedangkan deviasi itu sendiri dapat diperoleh dengan menggunakan rumus: x=X-  (=selisih antara skor item belahan I dengan rata-rata hitung dari skor item belahan I).
   dapat diperoleh dengan menggunakan rumus: =  (=jumlah kuadrat dari deviasi skor-skor Y atau skor-skor item belahan II, dibagi dengan jumlah subyek atau testee). Sedangkan deviasi itu sendiri dapat diperoleh dengan menggunakan rumus: y=Y-  (=selisih antara skor item belahan II dengan rata-rata hitung dari skor item belahan II).  dapat diperoleh dengan menggunakan rumus:
=  (=kuadrat dari jumlah deviasi skor item belahan I dengan deviasi skor item belahan II, dibagi dengan jumlah subyek atau testee)
c.       Rumus Rulon
Rumus ini juga dengan jalan membelah dua tes berdasarkan selisih skor yang dimiliki oleh belahan pertama dengan belahan kedua tes tersebut. Rumusnya:  = 1 -
 = koefesien reliabilitas tes
1    = bilangan konstan
 = varian perbedaan antarskor yang dicapai oleh testee pada belahan I dengan
         skor yang dicapai oleh testee pada belahan II
 = varian total
d.      Rumus Kuder Richardson
Penentuan reliabilitas dengan rumus ini adalah melakukan penganalisisan secara langsung terhadap skor-skor item tes hasil belajar yang bersangkutan. Ada dua rumus yang diajukan oleh Kuder dan Richardson yang diberi kode  dan .
1.      Rumus :
 =
 = koefesien reliabilitas tes
n    = banyaknya butir item
1    = bilangan konstan
 = varian total
  = proporsi testee yang menjawab dengan betul butir item yang bersangkutan
  = proporsi testee yang jawabannya salah, atau :1-
= jumlah dari hasil perkalian antara .
2.      Rumus  
 =
 = koefesien reliabilitas tes
n    = banyaknya butir item
1    = bilangan konstan
 = mean total (rata-rata hitung dari skor total)
 = varian total
e.       Rumus C. Hoyt
Adapun rumus ini sasarannya adalah interaksi antara testee dengan item tes hasil belajar itu sendiri. Rumusnya:   = 1 -
   = koefesien reliabilitas tes
1      = bilangan konstan
= mean kuadrat interaksi antara testee dan item
= mean kuadrat antarsubyek
Beberapa teknik dan rumus yang disebutkan sebelumnya adalah untuk mencari reliabilitas untuk instrument tes yang bersifat objektif, yaitu soal yang terdiri dar butir-butir soal yagn dinilai hanya “benar” atau “salah” seperti pilihan ganda, soal benar-salah. Adapun menilai soal bentuk uraian tidak dapat dilakukan seperti itu. Menurut Arikunto (2011: 109) sesuatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5 dan butir soal nomor 3 sampai 10, dan sebagainya. Untuk mencari rreliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan pad kolom item menurut apa adanya. Rumus yang digunakan adalah rumus Alpha.
Rumusnya yaitu:  =
   = koefesien reliabilitas tes
N     = banyaknya butir item ysng dikeluarkan dalam tes
1      = bilangan konstan
= jumlah varian skor dari tiap-tiap butir item
   = varian total
Selesai menghitung relibilitas tes dengan beberapa teknik yang disebutkan sebelumnya, selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokan sebagai berikut:
1)      Apabila reliabilitas sama dengan atau lebih besar daripada 0,70 berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi.
2)      Apabila  lebih kecil daripada 0,70 dinyatakan belum memiliki reliabilitas yang tinggi.   
Interpretasi reliabilitas instrumen
Besarnya nilai r
interpretasi
0,80 – 1,00
tinggi
0,60 - 0,80
Cukup tinggi
0,40 – 0,60
Agak rendah
0,20 – 0,40
Rendah
0,00 – 0,20
Sangat rendah




BAB III
SIMPULAN
Reliabilitas adalah ketetapan hasil tes yang dapat dipercaya. Karena keterpercayaan berhubungan dengan ketetapan dan konsistensi. Syarat reliabilitas adalah tes yang sama diulang kembali kepada siswa yang sama dan memiliki hasil yang tetap sama.
Faktor yang memengaruhi reliabilitas dapat diuraikan sebagai berikut: panjang tes dan kualitas butir-butir soal; sebaran skor dan tingkat kesukaran tes; hal yang berhubungan dengan tercoba (testee), seperti sifat penerima tes meliputi reaksinya ketika menjawab soal tes; hal yang berhubungan dengan penyelanggaraan tes, seperti ruangan yang bersih, tenang, ramai atau panas, pengawas tes yang ramah atau galak, petunjuk tes yang jelas atau tidak rumit/berbelit.
Reliabilitas dibagi menjadi tiga macam, pertama koefisien ekuivalen/paralel. Teknik korelasi dapat dipilih antara korelasi produk moment dari Pearson atau teknik korelasi rang order dari Spearman (khusus untuk N, kurang dari 30). Kedua koefisien stabilitas. Teknik yang digunakan adalah test and retest ( single test-double trial). Rumusnya menggunakan rumus Spearman. Ketiga koefisien konsistensi internal. Cara/teknik pengukurannya dapat ditentukan dengan lima rumus yaitu rumus Spearman-Brown, rumus Flanagan, rumus Rulon, rumus Kuder Richardson dan rumus C. Hoyt.



DAFTAR PUSTAKA
Arifin, Zainal, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur, Bandung: PT Remaja Rosdakarya, 2012
Arikunto, Suharsimi, Dasar-dasar Evaluasi Pendidikan (Edisi Revisi) cetakan kedua belas, Jakarta: Bumi Aksara, 2011
Daryanto, Evaluasi Pendidikan, Jakarta: PT Rineka Cipta, 1999
Echols, John M. dan Hassan Shadily, Kamus Inggris-Indonesia, Jakarta: PT Gramedia Pustaka Utama, 2003
Gall, Meredith Gall Joyce P., Educational Research an Introduction, United States of America, 2003
Jihad, Asep dan Abdul Haris, Evaluasi Pembelajaran, Yogyakarta: Multi Pressindo, 2008
Lodico, Marguerite G., Dean T. Spaulding dan Katherine H. Voegtle, Methods in Educational Research: from Theory to Practice, San Francisco: Jossey-Bass, 2010
Moore, Kenneth D., Effective Instructional Strategies: from Theory to Pactice, California: Sage Publications, 2005
Purwanto, Evaluasi Hasil Belajar, cetakan ketiga, Yogyakarta: Pustaka Pelajar, 2011
Sudijono, Anas, Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada, 2001
Noor, Irfan, et al.,eds., Pedoman Penulisan Tesis, Banjarmasin: Pascasarjana IAIN Antasari, 2015

0 komentar:

Posting Komentar