RELIABILITAS INSTRUMEN EVALUASI
BAB I
PENDAHULUAN
Evaluasi pendidikan adalah proses/kegiatan untuk menentukan
kemajuan pendidikan dibandingkan dengan tujuan yang telah ditentukan, usaha
untuk memperoleh informasi berupa umpan balik (feed back) bagi penyempurnaan
pendidikan.
Evaluasi bagi guru memiliki makna untuk mengetahui apakah materi
yang diajarkan sudah tepat bagi siswa sehingga guru dapat mengadakan perubahan
yang lebih baik, efektif dan tepat. Di antara cara mengetahuinya adalah dengan
adanya alat atau instrument evaluasi, yaitu dengan teknik tes dan nontes.
Adapun tes, menurut Arikunto (2011: 57) untuk dapat dikatakan baik
sebagai alat pengukur memiliki persyaratan, yaitu validitas, reliabilitas,
objektivitas, praktikabilitas dan ekonimis. Menurut Meredith Gall ( 2003: 190)
menyebutkan sebagai karakteristik tes yang baik adalah “objectifity,
standard conditions of administration and scoring, standars for interpretation,
fairness, validity and reliability”.
Reliabilitas sebagai salah satu syarat tes yang baik akan
dipaparkan pada makalah ini. Di antaranya akan menjelaskan tentang pengertian
dari reliabilitas, persyaratannya, macam-macam reliabilitas dan cara menentukan
reliabilitas instrument serta faktor yang memengaruhi reliabilitas.
BAB II
PEMBAHASAN
A.
Pengertian
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability
dalam bahasa Inggris, berasal dari kata reliable yang artinya dapat
dipercaya. Reliable dalam Kamus Inggris-Indonesia (Echols, 2003: 475) merupakan
kata sifat yang artinya dapat dipercaya/diandalkan dan reliability
adalah kata benda yang artinya hal dapat dipercaya, hal tahan uji.
Pengertian reliabilitas menurut beberapa pendapat:
1.
Kenneth D.
Moore (2005:172), Reliability is the consistency with which a measurement
device gives the same result when the measurement is repeated. In the oder
word, it is the measurement device’s trustworthiness or dependability. Reliabilitas
adalah konsistennya/tetapnya sebuah alat ukur dengan hasil yang sama ketika
diulang kembali. Dengan kata lain adalah alat ukur yang dapat dipercaya atau
dipertanggungjawabkan.
2.
Zainal Arifin
(2012: 258), reliabilitas adalah tingkat atau derajat konsistensi dari suatu
instrument.
3.
Purwanto (2011:
182), reliabilitas berhubungan dengan kemampuan alat ukur untuk melakukan
pengukuran secara cermat.
4.
Suharsimi
Arikunto (2011: 86), reliabilitas berhubungan dengan masalah kepercayaan. Suatu
tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut
dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes berhubungan
dengan masalah ketetapan hasil tes.
Reliabilitas dari beberapa pendapat di atas dapat disimpulkan
sebagai ketetapan hasil tes yang dapat dipercaya. Karena keterpercayaan
berhubungan dengan ketetapan dan konsistensi.Dari beberapa pendapat di atas
juga dapat disimpulkan bahwa syarat reliabilitas adalah tes yang sama diulang
kembali kepada siswa yang sama dan memiliki hasil yang tetap sama. Hasil yang
tetap sama di sini bukan berarti nilainya tetap sama persis seperti sebelumnya
akan tetapi hasilnya tetap sama derajatnya. misalnya si A mendapat nilai 8 dan
si B mendapat nilai 7 kemudian setelah dites kembali si A mendapat nilai 9 dan si B mendapat nilai
8, di sini juga disebut tetap/reliable karena si B tetap memiliki hasil
tes yang sama seperti sebelumnya yaitu tetap di bawah nilai si A. Tes hasil
belajar dikatakan dapat dipercaya apabila memberikan hasil pengukuran hasil
belajar yang relatif tetap secara konsisten.
B.
Faktor yang Memengaruhi
Reliabilitas
Hasil tes belajar setelah dites kembali dapat saja memberikan hasil
yang berbeda. Hasil tes dapat saja berubah menjadi lebih baik atau lebih rendah
dari nialai sebelumnya terkait dengan siswa. Misalnya siswa masih ingat
jawabannya atau telah mempelajari sesuatu atau bahkan lupa karena rentang waktu
antara tes pertama dengan tes kedua berjauhan. Tes yang diujikan dan
pelaksanaan tes tersebut juga dapat memengaruhi hasil tes belajar selanjutnya
juga memengaruhi reliabilitas tes tersebut.
Lodico dan kawan-kawan (2010: 94) menyatakan “ factor that
influence reliability include:
1.
Test taker’s
personal characteristic (for example, motivation, health, mood, fatigue). Karakter/sifat pribadi penerima tes (contohnya motivasi, kesehatan,
suasana hati, kelelahan).
2.
Variations in
test setting (for example, differences in the physical characteristics of the
room). Perbedaan pada keadaan tes (contohnya,
karakter fisik dari ruangan yang berbeda).
3.
Variations in
the adminitration and scoring of the test. Perbedaan
pada pelaksanaan dan skor tes.
4.
Variation in
participant responses due to guessing.
Perbedaan pada reaksi/respon peserta ketika menjawab tes.
Adapun Grolund (1985) dalam Arifin (2012: 258) mengemukakan ada
empat faktor yang dapat memengaruhi reliabilitas, yaitu panjang tes (length
of test), sebaran skor (spread of scores), tingkat
kesukaran (difficulty indeks) dan objektifitas (objectivity).
Sedangkan Arikunto (2011: 87) menyatakan banyak hal yang memengaruhi hasi tes.
Namun secara garis besar dapat dikelompokkan menjadi tiga hal, yaitu: hal yang
berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-buir
soalnya; hal yang berhubungan dengan tercoba/testee (testee adalah responden
yang sedang mengerjakan tes); dan hal yang berhubungan dengan penyelenggaraan
tes.
Faktor yang memengaruhi reliabilitas dari ketiga pendapat di atas,
pendapat dari Arikunto dapat dijadikan kesimpulan. Gronlund melihat dari sudut
pandang tes dan Lodico & kawan-kawan melihat dari sudut pandang penerima
tes dan pelaksanaan tes. Untuk lebih
rinci dapat diuraikan sebagai berikut:
1.
Panjang tes dan
kualitas butir-butir soal. Panjang tes berarti banyaknya soal tes dan banyaknya
soal lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir
soal. Sebaran skor dan tingkat kesukaran tes.
2.
Hal yang berhubungan dengan tercoba (testee),
seperti sifat penerima tes meliputi reaksinya ketika menjawab soal tes. Ada
siswa yang gugup atau sakit ketika menjawab soal atau bahkan ada yang tenang
dan semangat ketika menjawab soal akan memengaruhi hasil tes.
3.
Hal yang berhubungan
dengan penyelanggaraan tes, seperti ruangan yang bersih, tenang, ramai atau
panas, pengawas tes yang ramah atau galak, petunjuk tes yang jelas atau tidak
rumit/berbelit akan memengaruhi hasil tes.
C.
Macam-macam
Reliabilitas dan Cara Menentukan Reliabilitas
Macam-macam reliabilitas berhubungan langsung dengan cara/teknik
menentukan reliabilitas. Mengikuti pendapat Arifin, ada tiga macam, yaitu
koefesiensi stabilitas, koefesien ekuifalen dan koefesien konsistensi internal.
Arikunto membagi reliabilitas berdasarkan teknik menentukan reliabilitas yaitu
menjadi tiga macam yaitu metode bentuk paralel (equivalent), metode tes
ulang (tes-retest method) dan metode belah dua (split-half method).
Adapun Sudijono menyebutnya sebagai pendekatan juga menjadi tiga macam, yaitu
pendekatan single test-single trial (single test-single trial method),
pendekatan test-retest (single test-double trial method) dan pendekatan
alternate from (double test-double trial method). Dari ketiga pendapat
yang disebutkan tadi dapat disimpulkan bahwa berdasarkan teknik menentukan reliabilitas
dibagi menjadi tiga macam yang diuraikan sebagai berikut.
1.
Koefisien
ekuivalen/paralel
Tes ekuivalen/paralel adalah dua buah tes yang diujikan dalam satu
waktu. Syaratnya adalah tesnya harus sejenis, mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan tesnya sama tetapi butir-butir soalnya berbeda. Kelebihan
adalah karena butir-butir soal dibuat sejenis tetapi tidak sama, maka tes hasil
belajar (yang akan diuji reliabilitasnya) dapat terhindar dari kemungkinan
timbulnya pengaruh yang datang dari testee (umpamanya masih ingat rumusnya,
perubahan situasi atau kondisi penyelenggaraan tes). Kelemahannya tester atau
pembuat tes harus membuat dua buah instrument tes, kemungkinan derajat instrument
tes yang berbeda, sarta kesediaan waktu dalam penyelenggaraan tes.
Pelaksanaan tes reliabilitasnya adalah dengan mencari korelasi dari
kedua tes tadi. Teknik korelasi dapat dipilih antara korelasi produk moment
dari Pearson atau teknik korelasi rank order dari Spearman (khusus untuk N,
kurang dari 30). Rumusnya sebagai berikut:
2.
Koefisien
stabilitas
Koefisien stabilitas adalah jenis reliabilitas dengan memberikan
tes kepada sekelompok individu/siswa tengan tes yang sama dengan waktu yang
berbeda. Syaratnya dalam jangka waktu antara pelaksanaan yang pertama dengan
yang kedua, guru sama sekali tidak boleh menyinggung petunjuk tentang tes yang
pertama dan testing dilaksanakan dalam situasi dan kondisi yang sama. Artinya,
harus diusahakan agar situasi dan kondisi tidak jauh berbeda. Teknik yang
digunakan adalah test and retest ( single test-double trial). Rumusnya menggunakan
rumus Spearman berikut:
D = Difference (beda antara
rank variabel I dan II) atau D=
6
dan 1 = bilangan
konstan
N = banyaknya subyek (testee)
3.
Koefisien konsistensi
internal
Penentuan
reliabilitas tes ini adalah dengan jalan melakukan pengukuran terhadap satu
kelompok subyek/testee, dimana pengukuran itu dilakukan dengan hanya
menggunakan satu jenis alat pengukur dan pelaksanaannya hanya satu kali.
Cara/teknik pengukurannya dapat ditentukan dengan lima rumus yaitu rumus
Spearman-Brown, rumus Flanagan, rumus Rulon, rumus Kuder Richardson dan rumus
C. Hoyt.
a.
Rumus
Spearman-Brown
Penentuan
reliabilitas dilakukan dengan jalan membelah dua tes berdasarkan pada korelasi,
yaitu korelasi antara separuh belahan pertama dengan belahan kedua dari tes
tersebut. Syaratnya adalah jumlah item tes berupa bilangan genap, mempunyai
derajat kesukaran yang tinggi dan materi tes hendaknya bersifat komprehensif,
sehingga memungkinkan bagi penyusun tes membuat dua butir item tes untuk satu
permasalahan yang sama.
Teknik
belah dua dapat dilakukan dengan cara belah dua gasal-genap yaitu
mengelompokkan nomor gasal dan genap (misalnya tes berjumlah 10 item, maka
kelompok gasal adalah item tes nomor 1,
3, 5, 7 & 9 dan kelompok genap 2, 4, 6, 8 & 10). Dapat juga dengan cara belah dua atas-bawah
atau kiri-kanan (kelompok atas/kiri adalah item tes nomor 1-5 dan kelompok
bawah/kanan 6-10).
Rumusnya:
dengan separoh
(bagian kedua) dari tes tersebut (h = half-half)
1&2 = bilangan konstan
Rumus
lain yang sejenis dengan yang di atas adalah:
dengan separoh
(1/2) tes (belahan II) dari tes tersebut
1&2= bilangan konstan
Contoh mencari reliabilitas dengan
menggunakan teknik Spearman-Brown
dengan cara belah dua gasal-genap. Dengan ketentuan bahwa untuk setiap jawaban
betul diberikan skor 1 sedangkan untuk jawaban salah diberikan skor 0 sebagai
berikut:
No.
|
Nama
|
Skor untuk item tes nomor:
|
Skor total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
1
|
Amel
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
2
|
Ana
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
5
|
3
|
Dina
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
4
|
4
|
Nida
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
5
|
5
|
Ihsan
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
6
|
6
|
Reza
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
0
|
0
|
4
|
7
|
Robi
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
7
|
8
|
Subhan
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
Langkah
pertama, menjumlahkan skor-skor yang dimiliki oleh item yang bernomor gasal
(selanjutnya untuk kode X) yaitu item nomor 1,3,5,7 dan 9.
No.
|
Nama
|
Skor untuk item tes nomor:
|
Skor total
|
||||
1
|
3
|
5
|
7
|
9
|
|||
1
|
Amel
|
1
|
1
|
1
|
1
|
1
|
5
|
2
|
Ana
|
0
|
1
|
1
|
0
|
1
|
3
|
3
|
Dina
|
0
|
0
|
0
|
0
|
0
|
0
|
4
|
Nida
|
1
|
0
|
1
|
0
|
1
|
3
|
5
|
Ihsan
|
1
|
1
|
1
|
0
|
0
|
3
|
6
|
Reza
|
1
|
1
|
1
|
1
|
0
|
4
|
7
|
Robi
|
1
|
1
|
1
|
1
|
0
|
4
|
8
|
Subhan
|
0
|
0
|
1
|
1
|
1
|
3
|
Langkah
kedua, menjumlahkan skor-skor yang dimiliki oleh item tes yang bernomor genap
(selanjutnya untuk kode Y) yaitu item nomor 2, 4, 6, 8 &10.
No.
|
Nama
|
Skor untuk item tes nomor:
|
Skor total
|
||||
2
|
4
|
6
|
8
|
10
|
|||
1
|
Amel
|
0
|
0
|
1
|
1
|
1
|
3
|
2
|
Ana
|
0
|
0
|
0
|
1
|
1
|
2
|
3
|
Dina
|
1
|
0
|
1
|
1
|
1
|
4
|
4
|
Nida
|
1
|
0
|
1
|
0
|
0
|
2
|
5
|
Ihsan
|
1
|
1
|
1
|
0
|
0
|
3
|
6
|
Reza
|
0
|
0
|
0
|
0
|
0
|
0
|
7
|
Robi
|
1
|
1
|
1
|
0
|
0
|
3
|
8
|
Subhan
|
1
|
1
|
1
|
1
|
1
|
5
|
Langkah ketiga, mencari (menghitung) angka indek korelasi “r”
product moment, antara variabel X (separoh belahan tes pertama) dengan variabel
Y (separoh belahan tes kedua) yaitu
,
atau
No.
|
Nama
|
Gasal (
|
Genap (
|
|||
1
|
Amel
|
5
|
3
|
15
|
25
|
9
|
2
|
Ana
|
3
|
2
|
6
|
9
|
4
|
3
|
Dina
|
0
|
4
|
0
|
0
|
16
|
4
|
Nida
|
3
|
2
|
6
|
9
|
4
|
5
|
Ihsan
|
3
|
3
|
9
|
9
|
9
|
6
|
Reza
|
4
|
0
|
0
|
16
|
0
|
7
|
Robi
|
4
|
3
|
12
|
16
|
9
|
8
|
Subhan
|
3
|
5
|
15
|
9
|
25
|
Jumlah
|
S
|
S
|
S
|
S
|
S
|
Langkah
keempat, subtansikan ke dalam rumus
=0,378 dibulatkan menjadi =0,4
Langkah
kelima, mencari (menghitung) koefisien reliabilitas tes dengan menggunakan
rumus:
. Telah diketahui
adalah =0,378 dibulatkan menjadi =0,4,
subtansikan ke dalam rumus menjadi:
=
= 0,57.
Langkah
keenam, memberikan interpretasi terhadap
. Berdasarkan
hasil-hasil perhitungan di atas, telah diperoleh koefesien reliabilitas tes
sebesar 0,57. Dengan demikian hasil tes belajar dinyatakan memiliki belum
memiliki reliabilitas yang tinggi karena di
bawah angka 0,70.
b.
Rumus Flanagan
Penentuan
reliabilitas dengan cara ini juga dengan jalan membelah dua tes tetapi
berdasarkan pada deviasi. Rumusnya
= 2 (1-
)
2&1 = bilangan konstan
pada
belahan I
pada belahan II
termasuk pada
belahan I dan belahan II
Perlu
dijelaskan terlebih dahulu bahwa:
dapat diperoleh dengan menggunakan rumus:
=
(=jumlah kuadrat dari deviasi skor-skor X atau
skor-skor item belahan I, dibagi dengan jumlah subyek atau testee). Sedangkan
deviasi itu sendiri dapat diperoleh dengan menggunakan rumus: x=X-
(=selisih antara skor item belahan I dengan
rata-rata hitung dari skor item belahan I).
c.
Rumus Rulon
Rumus
ini juga dengan jalan membelah dua tes berdasarkan selisih skor yang dimiliki
oleh belahan pertama dengan belahan kedua tes tersebut. Rumusnya:
= 1 -
1 = bilangan konstan
skor yang dicapai
oleh testee pada belahan II
d.
Rumus Kuder
Richardson
Penentuan
reliabilitas dengan rumus ini adalah melakukan penganalisisan secara langsung
terhadap skor-skor item tes hasil belajar yang bersangkutan. Ada dua rumus yang
diajukan oleh Kuder dan Richardson yang diberi kode
dan
.
1.
Rumus
:
n = banyaknya butir item
1 = bilangan konstan
2.
Rumus
n = banyaknya butir item
1 = bilangan konstan
e.
Rumus C. Hoyt
Adapun
rumus ini sasarannya adalah interaksi antara testee dengan item tes hasil
belajar itu sendiri. Rumusnya:
= 1 -
1 =
bilangan konstan
Beberapa
teknik dan rumus yang disebutkan sebelumnya adalah untuk mencari reliabilitas
untuk instrument tes yang bersifat objektif, yaitu soal yang terdiri dar
butir-butir soal yagn dinilai hanya “benar” atau “salah” seperti pilihan ganda,
soal benar-salah. Adapun menilai soal bentuk uraian tidak dapat dilakukan
seperti itu. Menurut Arikunto (2011: 109) sesuatu butir soal uraian menghendaki
gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah 0
tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5 dan butir soal
nomor 3 sampai 10, dan sebagainya. Untuk mencari rreliabilitas soal keseluruhan
perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif.
Skor untuk masing-masing butir soal dicantumkan pad kolom item menurut apa
adanya. Rumus yang digunakan adalah rumus Alpha.
Rumusnya
yaitu:
=
N = banyaknya butir item
ysng dikeluarkan dalam tes
1 = bilangan konstan
Selesai
menghitung relibilitas tes dengan beberapa teknik yang disebutkan sebelumnya, selanjutnya
dalam pemberian interpretasi terhadap koefisien reliabilitas tes pada umumnya
digunakan patokan sebagai berikut:
1)
Apabila
reliabilitas
sama dengan
atau lebih besar daripada 0,70 berarti tes hasil belajar yang sedang diuji
reliabilitasnya dinyatakan telah memiliki reliabilitas yang tinggi.
2)
Apabila
lebih kecil daripada 0,70 dinyatakan belum
memiliki reliabilitas yang tinggi.
Interpretasi
reliabilitas instrumen
Besarnya nilai r
|
interpretasi
|
0,80 – 1,00
|
tinggi
|
0,60 - 0,80
|
Cukup tinggi
|
0,40 – 0,60
|
Agak rendah
|
0,20 – 0,40
|
Rendah
|
0,00 – 0,20
|
Sangat rendah
|
BAB III
SIMPULAN
Reliabilitas adalah ketetapan hasil tes yang dapat dipercaya.
Karena keterpercayaan berhubungan dengan ketetapan dan konsistensi. Syarat
reliabilitas adalah tes yang sama diulang kembali kepada siswa yang sama dan memiliki
hasil yang tetap sama.
Faktor yang memengaruhi reliabilitas dapat diuraikan sebagai
berikut: panjang tes dan kualitas butir-butir soal; sebaran skor dan tingkat
kesukaran tes; hal yang berhubungan dengan tercoba (testee), seperti sifat
penerima tes meliputi reaksinya ketika menjawab soal tes; hal yang berhubungan
dengan penyelanggaraan tes, seperti ruangan yang bersih, tenang, ramai atau
panas, pengawas tes yang ramah atau galak, petunjuk tes yang jelas atau tidak
rumit/berbelit.
Reliabilitas dibagi menjadi tiga macam, pertama koefisien
ekuivalen/paralel. Teknik korelasi dapat dipilih antara korelasi produk moment
dari Pearson atau teknik korelasi rang order dari Spearman (khusus untuk N,
kurang dari 30). Kedua koefisien stabilitas. Teknik yang digunakan adalah test
and retest ( single test-double trial). Rumusnya menggunakan rumus Spearman. Ketiga
koefisien konsistensi internal. Cara/teknik pengukurannya dapat ditentukan
dengan lima rumus yaitu rumus Spearman-Brown, rumus Flanagan, rumus Rulon, rumus
Kuder Richardson dan rumus C. Hoyt.
DAFTAR PUSTAKA
Arifin,
Zainal, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur, Bandung: PT
Remaja Rosdakarya, 2012
Arikunto,
Suharsimi, Dasar-dasar Evaluasi Pendidikan (Edisi Revisi) cetakan kedua
belas, Jakarta: Bumi Aksara, 2011
Daryanto,
Evaluasi Pendidikan, Jakarta: PT Rineka Cipta, 1999
Echols,
John M. dan Hassan Shadily, Kamus Inggris-Indonesia, Jakarta: PT
Gramedia Pustaka Utama, 2003
Gall,
Meredith Gall Joyce P., Educational Research an Introduction, United
States of America, 2003
Jihad,
Asep dan Abdul Haris, Evaluasi Pembelajaran, Yogyakarta: Multi
Pressindo, 2008
Lodico,
Marguerite G., Dean T. Spaulding dan Katherine H. Voegtle, Methods in
Educational Research: from Theory to Practice, San Francisco: Jossey-Bass,
2010
Moore,
Kenneth D., Effective Instructional Strategies: from Theory to
Pactice, California: Sage Publications, 2005
Purwanto,
Evaluasi Hasil Belajar, cetakan ketiga, Yogyakarta: Pustaka Pelajar,
2011
Sudijono,
Anas, Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada,
2001
Noor,
Irfan, et al.,eds., Pedoman Penulisan Tesis, Banjarmasin:
Pascasarjana IAIN Antasari, 2015




0 komentar:
Posting Komentar