PENDAHULUAN
Secara harfiah kata
evaluasi berasal dari bahasa inggris evaluation yang dalam bahasa Indonesia
berarti penilaian. Akar katanya adalah value yang berarti nilai.Dengan demikian
secara harfiah, evaluasi pendidikan dapat di artikan sebagai penilaian dalam
(bidang) pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan
kegiatan pendidikan.
Adapun dari segi
istilah, evaluasi itu menunjuk kepada atau mengandung pengertian suatu tindakan
atau suatu proses untuk menentukan nilai dari sesuatu.Maka evaluasi pendidikan
itu dapat di artikan sebagai suatu tindakan atau kegiatan atau suatu proses
menentukan nilai dari segala sesuatu dalam dunia pendidikan (yaitu segala
sesuatu yang berhubungan dengan yang terjadi di lapangan pendidikan). Atau
singkatnya evaluasi pendidikan adalah kegiatan atau proses penentuan nilai
pendidikan, sehingga dapat di ketahui mutu atau hasil-hasilnya.
Sebelum melanjutkan
pembicaraan tentang evaluasi pendidikan secara lebih luas dan mendalam,
terlebih dahulu perlu di pahami bahwa dalam praktek sering kali terjadi
kerancuan atau tumpang tindih dalam penggunaan istilah evaluasi, penilaian dan
pengukuran.Kenyataan seperti itu memang dapat di pahami, mengigat bahwa di
antara ketiga istilah tersebut saling terkait sehingga sulit untuk di bedakan.
Dalam evaluasi terdapat
beberapa teknik pengujian tes hasil belajar di antaranya teknik pengujian reliabilitas
tes hasil belajar yang akan kami bahas dalam makalah ini.
BAB
II
PEMBAHASAN
A. Pengertian Reliabilitas
Kata reliabilitas dalam bahasa indonesia
diambil dari kata reliability dalam bahasa inggris, berasal dari kata
asal reliable yang artinya dapat dipercaya. Seorang dikatakan dapat
dipercaya jika orang tersebut selalu bicara ajeg (konsisten), tidak
berubah-ubah pembicaraannya dari waktu ke waktu. Demikian
juga halnya dengan sebuah tes. Tes tersebut dikatakan dapat dipercaya (reliable)
jika memberikan hasil yang tetap atau ajeg (consistent) apabila diteskan
berkali-kali. Jika kepada siswa diberikan tes yang sama yang pada waktu yang
berlainan, maka setiap siswa akan tetap berada dalam urutan (ranking) yang sama
atau ajeg dalam kelompoknya
Reliabilitas
adalah karakter lain dari hasil evaluasi. Reliabilitas juga dapat diartikan
sama dengan konsistensi atau keajegan. Suatu instrumen evaluasi, dikatakan
mempunyai nilai reliabilitas tinggi, apabila tes yang dibuat mempunyai hasil
yang konsisten dalam mengukur yang hendak diukur. Reliabilitas memberikan
konsistensi yang membuat terpenuhinya syarat utama, yaitu validnya suatu hasil
yang konsisten dalam mengukur yang hendak diukur.
Reliabilitas memberikan konsistensi yang membuat terpenuhinya syarat utama,
yaitu validnya suatu hasil skor instrumen. Di samping itu, reliabilitas juga
menunjukkan gambaran praktis yang dapat diklasifikasi berkaitan erat dengan
syarat ketiga, yaitu kebermanfaatan (usability), ini berarti semakin reliabel
suatu tes, semakin yakin kita dapat menyatakan bahwa dalam hasil suatu tes
mempunyai hasil yang sama dan bisa dipakai di suatu tempat sekolah, ketika
dilakukan tes kembali.
Sudah
diterangkan dalam persyaratan tes, bahwa reliabilitis berhubungan dengan masalah
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil
tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat
dikatakan tidak berarti.
Reliabiitas
menunjuk pada suatu pengertian bahwa suatu alat ukur cukup dapat dipercaya
untuk digunakan sebagai alat pengumpul data, karena alat ukur tersebut sudah
baik. alat ukur yang baik tidak akan bersifat tendesius atau mengarahkan
responden untuk memilih jawaban-jawaban tertentu. alat ukur yang reliabel
(dapat dipercaya) akan menghasilkan data yang juga dapat dipercaya. apabila
datanya memang benar sesuai dengan kenyataan, maka berapa kali pun diambil,
hasilnya tetap akan sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini
menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa
yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan matematikanya.
Minggu berikutnya siswa tersebut di tes kembali. Hasil dari ke dua tes relatif
sama. Sungguhpun demikian, masih mungkin terjadi ada perbedaan hasil untuk
hal-ha tertentu akibat faktor kebetulan, selang waktu, atau terjadinya
perubahan pandangan siswa terhadap soal yang sama. Jika itu terjadi, kelamahan
terletak pada tes itu, yang tidak memiliki kepastian jawaban atau meragukan
siswa. Dengan kata lain, derajat reliabilitasnya masih rendah.
Sementara itu, kerlinger (1986) mengemukakan, “reliabilitas dapat
diukur dari 3 kriteria, yaitu stability, dependability, dan predictability”. Stability
menunjukkan keajegan suatu tes dalam mengukur gejala yang sama pada waktu yang
berbeda. Dependability menunjukkan kemantapan suatu tes atau seberapa jauh tes
dapat diandalkan. Predictability menunjukkan suatu kemampuan tes untuk
meramalkan hasil pada pengukuran gejala selanjutya. Untuk meningkatkan
reliabilitas suatu tes, antara lain dapat dilakukan dengan memperbanyak butir
soal.
B. Cara-cara Mencari Besarnya Reliabilitas
(Metode)
Berikut ini tabel ringkasan yang menggambarkan
secara garis besar macam-macam reliabilitas dan prosedur pelaksanakan
pengukuran reliabilitas dan prosedur pelaksanaan pengukuran reliabilitas yang
sering ditemui dalam instrumen evaluasi maupun instrumen peneletian.
Metode
|
Tipe reliabilitas pengukuran
|
prosedur
|
Tes-retest
|
Mengukur stabilitas
|
Memberikan tes yang sama, dua kali pada grup
sama dengan jeda waktu diantara dua tes, misalnya 7 hari-1 bulan
|
Bentuk equivalent
|
Mengukur ekivalen mengukur stabilitas dan
ekivalen
|
Memberi dua bentuk tes pada grup yang dalam
waktu yang berdekatan. Dua bentuk tes diberikan pada dua grup siswa dengan
menambah interval antara bentuk.
|
Belah dua
|
Mengukur kesulitan internal
|
Diberikan tes sekali separuh skor tes;
diperoleh korelasi antara separuh untuk menempatkan semua tes dengan formula
spearman brown.
|
1. Metode Tes Ulang (test-retest method)
Metode
tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengeteshanya memiliki satu seri tes, tetapi
dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka
metode ini dapat disebut dengan single-test-double-trial method.
Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Untuk
tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang
mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena
itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi
permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak
ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor
atau kondisi tes sudah akan berbeda, dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula
terhadap reliabilitas.
Pada
umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama.
Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect
dan carry over effect. Yang penting adalah adanya kesejajaran hasil atau
ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
Siswa
|
Tes pertama
|
|
Skor
|
Ranking
|
Skor
|
Ranking
|
A
|
15
|
3
|
20
|
3
|
B
|
20
|
1
|
25
|
1
|
C
|
9
|
5
|
15
|
5
|
D
|
18
|
2
|
23
|
2
|
E
|
12
|
4
|
18
|
4
|
Walaupun tampak skornya naik, akan tetapi
kenaikannya dialami oleh semua siswa. Metode ini juga disebut korelasi diri
sendiri (self-correlation method) karena mengkorelasikan hasil dari tes yang
sama.
2. Metode bentuk paralel (equivalent)
Tes
paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam
istilah bahasa inggris disebut alternate forms method (parallel
forms).
Mengenai pertanyaan bagaimanakah proses
melaksanakan tes reliabilitas secara ekivalen? Berikut ini akan ditunjukkan
beberapa langkah yang perlu diambil oleh seorang peneliti. Langkah-langkah
tersebut diantaranya adalah seperti berikut.
a. Tentukan subjek sasaran yang hendak di tes
b. Lakukan tes yang dimaksud kepada subjek sasaran
tersebut.
c. Administrasi hasilnya secara baik.
d. Dalam waktu yang tidak terlalu lama, lakukan
pengetesan untuk yang kedua kalinya pada kelompok tersebut.
e. Korelasikan kedua hasil set skor.
Jika hasil koefisien ekivalen tinggi, berarti
tes memiliki reliabilitas ekivalen baik, sebaliknya, jika ternyata bahwa
koefisien rendah maka reliabilitas ekivalen tes adalah rendah. Reliabilitas
ekivalen merupakan salah satu bentuk yang dapat diterima dan umum dipakai
penelitian terutama penelitian pendidikan. Yang perlu diketahui juga bagi para
peneliti adalah bahwa tes ekivalen mempunyai kelemahan yaitu bahwa membuat dua
buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu
terjadi kesalahan pengukuran.
Kelemahan dari metode ini adalah bahwa pengetes
pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia
waktu yang lama untuk mencobakan dua kali tes.
3. Metode Belah Dua atau split-half method
Kelemahan penggunaan metode dua-tes dua
kali percobaan dan satu-tes dua kali percobaan diatasi dengna metode ketiga
ini, yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya
menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-tes-single-trial
method.
Berbeda dengan metode pertama dan kedua yang setelah ditemukannya koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga
ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua
belahan, baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas
seluruh tes harus digunakan rumus Spearman-Brown sebagai berikut :
Dimana:
:
= korelasi antara skor-skor setiap belahan tes
= koefisien reabilitas
yang sudah disesuaikan
Contoh :
Korelasi antara belahan tes = 0,60
Maka, reabilitas tes = 2x0,60
Banyak pemakai metode ini salah membela
hasil tes pada waktu menganalisis. Yang mereka lakukan adalah mengelompokkan
hasil separo subjek peserta tes dan separo yang lain kemudian hasil kedua
kelompok ini dikorelasikan. Yang benara adalah membelah item atau butir soal.
Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya
butir soal harus genap agar dapat dibelah.
Ada dua cara membalah butir soal ini, yaitu
:
1) Membelah atas item-item genap dan item-item ganjil
yang selanjutnya disebut belahan ganjil-genap.
2)
Membelah atas item-item awal dan item-item akhir yaitu
separo jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir yang
selanjutnya disebut belahan awal-akhir
.
C. Faktor-faktor Yang Mempengaruhi Reliabilitas
Koefesien reliabilitas dapat dipengaruhi di
antaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang
terlalu dekat atau terlalu jauh, akan memengaruhi koefisien reliabilitas.
Faktor-faktor lain yang juga mempengaruhi reliabilitas instrumen evaluasi di
antaranya sebagai berikut.
1. Panjang tes; semakin panjang suatu tes evaluasi, semakin
banyak jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan,
yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin
kecil siswa menebak. Berarti akan semakin tinggi nilai koefisien reliabilitas.
2. Penyebaran skor; koefisiensi reliabilitas secara langsung
dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin
tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas (Grounlund 1990:
94). Hal ini terjadi karena posisi skor siswa secara individual mempunyai
kedudukan sama pada tes-retes lain, sebagai acuan.
3. Kesulitan tes; tes normatif yang terlalu mudah atau terlalu
sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena
tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah
satu sisi
4. Objektivitas; yang dimaksud dengan objektif yaitu derajat
di mana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur tes
evaluasi memiliki objektivitas tinggi, maka reliabilitas hasil tes tidak
dipengaruhi oleh prosedur teknik perskoran.
D. Persyaratan Kegunaan Reliabilitas
Syarat lain yang juga perlu dipertimbangkan,
ketika seorang guru hendak menggunakan instrumen evaluasi, yaitu syarat
kegunaan atau sering disebut usability. Kegunaan merupakan syarat
instrumen evaluasi yang lebih berorientasi pada pertimbangan praktis. Di
samping itu, bagi para guru yang banyak menggunakan instrumen buatan sendiri
dari pada instrumen buatan lembaga pembuat tes, maka pertimbangan praktis yang
perlu diperhatikan itu di antaranya seperti berikut.
1. Tes atau instrumen yang hendak digunakan
sebaiknya memiliki kemudahan administrasi yang di dalamnya mengandung unsur:
mudah diatur, disimpan dan digunakan sewaktu-waktu secara mudah.
2. Waktu yang diperlukan untuk proses administrasi
sebaiknya singkat, cepat, dan tepat.
3. Instrumen sebaiknya juga mudah diinterpretasi
oleh guru ahli maupun guru yang kurang mendapat latihan di bidang instrumen
evaluasi.
4. Adanya beberapa macam jenis instrumen yang
memiliki ekivalensi sama sehingga bisa digunakan sebagai pengganti atau variasi
instrumen.
5.
Instrumen
evaluasi sebaiknya memiliki karakteristik biaya murah, dan dapat dijangkau oleh
guru atau sekolah yang hendak menggunakannya.
KESIMPULAN
Kata
reliabilitas dalam bahasa indonesia diambil dari kata reliability dalam
bahasa inggris, berasal dari kata asal reliable yang artinya dapat
dipercaya. Seorang dikatakan dapat dipercaya jika orang tersebut selalu bicara
ajeg (konsisten), tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Macam-macam
reliabilitas dan prosedur pelaksanakan pengukuran reliabilitas dan prosedur
pelaksanaan pengukuran reliabilitas yang sering ditemui dalam instrumen
evaluasi maupun instrumen peneletian, yaitu: metode ekuivalen, belah dua, tes
ulang.
Koefesien
reliabilitas dapat dipengaruhi di antaranya oleh waktu penyelenggaraan
tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan
memengaruhi koefisien reliabilitas.
Syarat
lain yang juga perlu dipertimbangkan, ketika seorang guru hendak menggunakan
instrumen evaluasi, yaitu syarat kegunaan atau sering disebut usability.
Kegunaan merupakan syarat instrumen evaluasi yang lebih berorientasi pada
pertimbangan praktis. Di samping itu, bagi para guru yang banyak menggunakan
instrumen buatan sendiri dari pada instrumen buatan lembaga pembuat tes.
DAFTAR PUSTAKA
Fuadi,
Athok. 2006. Sistem
pengembangan evaluasi. Ponorogo: Press
Nana
Sudjana. 1995. Penilaian Hasil Proses Belajar-Mengajar. Bandung: Remaja
Rosdakarya
Putro, Eko. 2009. Evaluasi
Program Pembelajaran. Yogyakarta: Pustaka Belajar.
Rangkuti, Freddy. 2002. The Power Of Brands:
Teknik Mengelola Brand Equity dan Strategi Pengembangan Merek+Analisis Kasus
Dengan Spss,
Jakarta: PT Gramedia Pustaka Utama.
Freddy Rangkuti, The Power Of Brands:
Teknik Mengelola Brand Equity dan Strategi Pengembangan Merek+Analisis Kasus
Dengan Spss ( Jakarta: PT Gramedia Pustaka Utama, 2002 ), h. 75-76