Syarat Pokok Tes Yang Baik
Syarat Pokok Tes Yang Baik
Syarat Pokok Tes Yang Baik
TENTANG
OLEH :
18 BKT 10
DOSEN PEMBIMBING :
b. Bentuk Validitas
Muri (2014:235-237) menjelaskan terdapat empat bentuk validitas yaitu
sebagai berikut
1) Validitas Isi
Validitas isi merupakan modal dasar dalam suatu instrument
penelitian, sebab kesahihan/validitas isi akan menyatakan keterwakilan
aspek yang diukur dalam instrument. Validitas isi dipandang dari segi
isi instrument yang diberikan. Dengan demikian, dapat dikatakan
bahwa validitas isi ini lebih menekankan pada keabsahan instrument
yang disusun dikaitkan dengan domain yang ingin diukur. Sehubungan
dengan itu, spesifikasi apa yang ingin diukur harus tergambar dengan
jelas dan tuntas.
Misalnya, guru ingin mengetahui tentang hubungan motivasi
berprestasi siswa hasil dalam belajar. Guru itu terlebih dahulu harus
memahami konsep atau konstruk motivasi berprestasi secara mendasar,
sehingga dapat membedakannya dari konsep lain, seperti motivasi
belajar, minat belajar, atau kebiasaan belajar.
Agar dalam menyusun instrument yang baik untuk penelitian dan
mempunyai validitas isi yang tinggi, maka guru hendaklah
memperhatikan hal-hal sebagai berikut:
a) Menyusun kisi-kisi perilaku, pengetahuan maupun sikap yang
mencakup keseluruhan isi yang akan diteliti
b) Mengambil sampel dari perilaku, pengetahuan maupun sikap
berdasarkan kisi-kisi yang telah disusun
c) Susun instrument dengan selalu memperhatikan cara-cara
penyusunan instrument yang baik dan benar
Timbang instrument yang telah siap itu kepada seorang ahli di
bidang yang diteliti untuk mendapatkan tanggapan dan komentar serta
saran-saran yang perbaikan. Selanjutnya analisis dengan statistic.
Jadi dapat disimpulkan, validitas isi merupakan ukuran yang
digunakan untuk mengetahui ketepatan dari suatu instrumen bila
ditinjau dari aspek isi (konten/materi). Pengecekan validitas isi dapat
dilakukan dengan cara membandingkan isi (konten/materi) tes dengan
komponen-komponen yang harusnya diukur.
2) Validitas Konstruksi (Susunan)
Konstruksi merupakan konsep atau rekaan yang disusun menurut
pandangan perorangan, seperti ketelitian, intelegensi, kreativitas, dan
sebagainya. Instrument mempunyai validitas yang tinggi dalam
kreativitas kalau instrument itu dapat membedakan orang yang rendah
atau dapat membedakan individu yang satu dan yang lainnya dalam
kreativitas. Dengan kata lain apakah bagian yang penting di dalan
suatu konsep, dinyatakan atau merupakan bagian dari suatu instrument
yang disusun.
Jadi dapat disimpulkan, sebuah tes dikatakan memenuhi validitas
konstruksi yang baik apabila susunan tes tersebut memenuhi syarat-
syarat penyusunan tes yang baik.
3) Validitas Prediktif
Validitas prediktif merupakan ketepatan suatu instrument dalam
meramalkan atau memprediksi sesuatu untuk masa datang, atau
merupakan derajat kesesuaian antara hasil pengukuran dan kinerjanya
dimasa datang dalam aspek yang diukur.
Jadi dapat disimpulkan, validitas prediktif digunakan untuk
mengetahui ketepatan dari tes dimasa mendatang (contohnya untuk tes
UAS).
4) Validitas Pengukuran Serentak
Validitas ini menggambarkan seberapa jauh hubungan suatu skor
instrument dengan instrument lain yang dipandang sebagai kriteria
yang dilaksanakan pada waktu yang sama hampir bersamaan. Tingkat
hubungan itu akan menunjukkan ketetapan instrument yang disusun
sebagai alat pengumpul data dalam penelitian.
Jadi dapat disimpulkan, suatu tes dilaksanakan secara bersamaan,
lalu dilihat hubungan antara tes-tes tersebut yang digunakan sebagai
alat pengumpulan data.
Keterangan :
Keterangan:
N = Jumlah responden
No. Subjek X Y X2 Y2 XY
1 8,70 90,00
2 7,90 74,00
3 6,50 70,00
4 5,60 40,00
5 6,20 50,00
6 7,50 74,00
7 6,30 60,00
8 6,50 60,00
9 7,50 76,00
10 8,30 80,00
11 6,50 90,00
12 8,70 80,00
13 7,90 72,00
14 7,70 70,00
15 5,60 50,00
Keterangan :
X = skor hasil belajar (pembanding)
Y = skor belajar hasil uji coba
Sesuai tuntunan rumus Korelasi Product Moment dengan
Angka Kasar, kita lengkapi pehitungannya pada tabel seperti
diperlihatkan pada gambar di bawah ini
15∑7582,40−(∑107,40)(∑1036)
Rxy = }{15 ∑74512¿ (1036)2¿
√ {15 ( 784,48 )−(107,40)2 ¿
2469,60 2469,60
Rxy =
√ (232,44−44384)
= 3211,95
Rxy = 0,77
Dengan demikian Koefisien korelasi diperoleh (rxy) = 0,77.
Nilai koefisien korelasi dikatakan baik atau tinggu atau sempurna
bila mendekati angka 1, jadi validitas 0,77 ditafsirkan validitas
tinggi.
b) Korelasi Biserial
Rumus yang digunakan yaitu:
mp −mt p
γ pbi =
SDt √ q
Keterangan:
B 0 5
C 0 5
D 1 8
E 1 7
F 1 7
G 1 6
H 1 6
I 1 7
J 1 6
= 0,76
2. Reliabilitas
a. Pengertian Reliabilitas
Ruseffendi (2006:16) mengemukakan bahwa “realiabilitas suatu tes ialah
ukuran ketetapan test itu mengukur apa yang semestinya harus diukur”.
Sedangkan menurut Muri ( 2014:242) reliabilitas merupakan “konsistensi
atau kestabilan skor suatu suatu instrument penelitian terhadap individu yang
sama, dan diberikan dalam waktu yang berbeda”.
Jadi dapat disimpulkan, reliabilitas adalah dapat diartikan sejauh mana
hasil suatu pengukuran dapat dipercaya, konsisten dan teliti.
1) Panjang Tes
Semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukkan dua kemungkinan yaitu
a) Tes semakin mendekati kebenaran.
b) Dalam mengikuti tes semakin kecil siswa menebak. Berarti akan
semakin tinggi nilai koefisien reliabilitasnya.
2) Penyebaran Skor
Koefisien reliabilitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi
sebaran, semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi
karena posisi skor siswa secara individual mempunyai kedudukan
sama pada tes-retes lain, sebagai acuan.
3) Kesulitan Tes
Tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut
akan menghasilkan sebaran skor yang cenderung terbatas pada salah
satu sisi. Untuk tes yang terlalu mudah skor jawaban siswa akan
mengumpul pada sisi atas, misalnya 9 atau 10. Untuk tes yang terlalu
sulit, skor jawaban siswa akan cenderung mengumpul pada ujung
sebaliknya, atau rendah. Dua gejala tersebut mempunyai kesamaan
yaitu bahwa perbedaan diantara individu adalah kecil dan cenderung
tidak relevan
4) Objektivitas
Yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi
memiliki objektifitas tinggi, maka reliabilitas hasil tes tidak
dipengaruhi oleh prosedur teknik penskoran. Item tes skor objektif
yang dihasilkan tidak dipengaruhi petimbangan atau opini dari seorang
evaluator.
Rho = 1 - 6∑ D2
N(N2-1)
Keterangan :
D = perbedaan R1-R2
rxx = 2r X1X2
1+ r X1X2
Keterangan :
Contoh :
Rho = 1- 6 x 66
11(121-1)
= 1- 396
1320
= 1 – 0,30
= 0,70
rxx = 2 x 0,70
1+ 0,70
= 1,40
1,70
= 0,82
Keterangan :
SD2 t
Keterangan :
n 1 – M (n-M)
n-1 n SD2t
KR21 =
Atau
KR21 = n σ2 t –npq
n-1 σ2 t
Contoh :
A B C D E F G H I J
Skor 2 1 0 2 3 3 3 2 1 2 ∑X
genap =
(X) 19
Skor 2 2 1 2 2 3 3 3 1 2 ∑Y
ganjil =
(Y) 21
X+Y 4 3 1 4 5 6 6 5 2 4
N = 10
M = ∑(X+Y) = 40 =4
N 10
184 ( 40 ) 2
Varians (SD2t) =
10
- 10
18,4 – 16 =2,4
6 2,4-1,26
KR20 =
6−1
2,4
1,14
1,2 x
2,4
6 1- 4(6-4)
KR21 =
5
x
6x
2,4
= 1,2 x 8
14,4
= 1,2 x (1-0,56)
= 1,2 x 0,44
= 0,528
r11= _2..r ½ ½_
[1+r ½ ½ ]
Keterangan:
3. Praktibilitas (practibility)
Sebuah tes disebut memiliki praktibilitas yang tinggi apabila tes tersebut
bersifat praktis, Tes yang praktis adalah tes yang :
a. Mudah dilaksanakan, tidak menuntut peralatan yang banyak dan
memberi kebebasan kepada siswa mengerjakan terlebih dahulu bagian
yang dianggap mudah. Karena bersifat sederhana dalam arti tidak
memerlukan peralatan yang sulit pengadaannya
b. Mudah pemeriksaannya artinya bahwa tes itu dilengkapi kunci jawaban
maupun pedoman skoringnya. Dilengkapi dengan petunjuk-petunjuk
yang jelas sehingga dapat diberikan atau diawali orang lain.
c. Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan atau diawasi oleh orang lain.
4. Objektivitas
a. Pengertian Objektivitas
Alice Crow, menguraikan masalah objektivitas sebagai
berikut :“The Administrator must follow exact procedure in administering
the test, scoring responces, and interpreting resuls. Otherwise, data
obtained through its administration by different persons, lack employing
his own method of procedure, are not comparable… …these direction
must be understood clearly and without any deviations”.
Uraian ini menunjukkan bahwa setiap test itu haruslah
dikonstruksikan dengan pertimbangan yang semasak-masaknya. Haruslah
jelas apa yang ditetapkan sebagai jawaban dari item-item test dengan
bentuk item mana item itu cocok. Harus pula ditetapkan lebih dahulu
procedure di dalam menilai jawaban-jawaban dan bagaimana pula
menganalisa hasil-hasil tersebut. Setelah itu dilakanakan/ditetapkan maka
seseorang pelaksana atau pembuat test harulah mengikuti proseure-
proedure yang telah ditetapkan itu dengan tidak mengikutsertakan
pertimbangan lain lagi yang sama sekali tidak berhubungan dengan test
yang dibuat.
Masalah yang disebutkan di atas itu terutama berlaku kepada
bentuk test yang informal, yaitu test yang belum distandard. Test yang
distandard umumnya telah mempunyai pedoman jawaban yang benar.
Cara scoring dan mempunyai norma untuk interpretasi. Namun demikian
perlu juga dijaga bahwatest yang distandard pun mungkin terjadi
penyimpangan dalam hal scoring. Petugas scoring yang kurang
memahami rumus scoring yang telah ditetapkan atau kurang bersiat jujur
karena satu dan lain hal akan mengurangi sifat objektivitas ini.
Sehingga dapat ditarik kesimpulan, objektif berarti tidak adanya
unsur pribadi yang mempengaruhinya bukan subjectif. Sebuah tes
dikatakan memiliki objectivitas apabila dalam melaksanakan tes tidak
ada faktor subjectif yang mempengaruhi terutama dalam sistem skornya.
Apabila dikaitkan dengan reliabilitas maka objectivitas menekankan
ketetapan (consistency) pada sistem skoring, sedangkan reliabilitas
menekankan ketetapan dalam hasil tes.
b. Faktor-faktor yang berhubungan dengan syarat objektivitas
Ada beberapa faktor atau masalah yang mempengaruhi objektivitas dari
sesuatu tes yaitu
1) Pengkonstruksian test
Test informal sering dikonstruksikan tidak memenuhi langkah-
langkah yang seharusnya dilaksanakan. Item-item adalah dibuat saja.
Dalam rangka achievemen test sering seseorang membuat test hanya
berdasarkan bahan pelajaran apa yang diingatnya saja, tidak memakai
buku sumber yang sekaligus merupakan buku wajib/pegangan dalam
mata pelajaran sebenarynya masih kurang baik, mengingat bahwa
yang akan di test itu meliputi skill dan attitude dari murid. Dengan
hanya mempedomani buku itu saja maka terungkaplah hanya masalah
penguasaan murid terhadap bahan pelajaran yang diberikan
(knowledge).
Oleh karena itu buku wajib/pegangan guru, serta tujuan
instruksional khusus dari setiap pelajaran, merupakan pedoman yang
harus digunakan dalam mengkonstruksi pelajaran, merupakan
pedoman yang harus digunakan dalam mengkonstruksikan item-item.
2) Penentuan jawaban
Masalah yang kedua ini penting ditekankan dalam bentuk test
essay. Guru harus lebih dahulu menetapkan jawaban-jaaban yang
dituntut dari setiap soal yang akan ditanyakan. Dalam penentuan
jawaban-jawaban yang dianggap benar ini, harus pula ditentukan
luasnya/dalamnya jawaban yang diminta. Mungkin saja jawaban yang
diminta lebih dari satu macam. Untuk itu harus ditentukan terlbih
dahulu, urutan pentingnya atau urutan tepatnya jawaban yang
bermacam-macam itu.
Karena masalah ini berhubungan erat dengan bentuk dan susunan
kalimat dari setiap soal. Salah satu hal yang perlu diingat ialah
menghindarkan kata-kata yang meragukan. Objektipun mungkin
sering terjadi apabila kalimat/ kemungkinan jawaban yang
dicantumkan kurang tepat/meragukan.
3) Penentuan nilai.
Masalah penentuan nilai sangat erat hubungannya dengan
penentuan jawaban. Yang pertama haruus ditentukan ialah bentuk
nilai yang diberikan, apakah nilai dalam bentuk angka atua nilai dalam
bentuk rating. Nilai bentuk angka sebaiknya diberi jarak 0 sampai
dengan 100 atau 0 sampai dengan 10.
Yang perlu mendapat perhatian dalam penentuan nilai ini adalah
tingkat kesukaran item - item. Maksudnya bahwa besarnya nilai
bergantung kepada tingkat kesukarannya setiap item. Bila hal ini telah
didistribusikan hendaknya direncanakan juga pendistribusian nilai
untuk setiap kemungkinan jawaban.
Benarnya jawaban dalam essay secara umum dapat dibagi tiga
macam yaitu : benar, mendekati benar dan salah – hal ini terutama
bagi soal yang menghendaki penguraian. Dalam soal bidang studi
ilmu pasti harus dipertimbangkan pendistribusian nilai untuk proses
perhitungan yang salah tetapi jawaban akhir benar dan proses
perhitungan yang benar tetapi jawaban akhir salah.
Dengan adanya penentuan nilai untuk jawaban –
jawaban yang telah ditentukan, hal ini menghindarkan terjadinya
pengaruh dari sipenilai. Dan perlu ditambahkan di sini, seorang
penilai jangan menggantungkan besarnya nilai dengan kebersihan/
baiknya tulisan, kecuali hal ini penting memang merupakan kriteria
test yang dilaksanakan misalnya dalam menulis indah atau dalam
menggambar.
Untuk menghindarkan suatu subjektivitas penilaian, hendaknya
para penilai harus lebih dahulu mengkoreksi diri sendiri apakah
memang pada saat ia memeriksa itu kondisi badan dan psikisnya baik.
Penelitian-penelitian yang dilaksanakan membuktikan bahwa
penilaian suatu hasil test (scoring) hendaknya dilaksanakan pada pagi
hari di mana keadaan kondisi fisik makin baik. gangguan terhadap
suasana waktu menilai hendaknya dihindarkan. Waktu menilai
menuntut suatu ketenangan, dan harus dilaksanakan pada waktu-
waktu khusus dan tertentu. Jangan sampai terjadi seseoranng menilai
pekerjaan murid sambil ia mengerjakan pekerjaan lain. Dengan
singkat dapat disimpulkan bahwa waktu, suasana, kondisi serta situasi
seaktu pemeriksaan pekerjaan murid harus diciptakan sebaik mungkin
sehingga pemeriksaan benar-benar memusatkan perhatian kepada
pekerjaan tersebut.
Bila test itu merupakan test yang dilaksanakan oleh suatu panitia
maka sebaiknya test penilaian harus diadakan.
Dengan melakukan cara : tiga orang memeriksa masing-masing
untuk satu kerja pekerjaan murid, adalah sangat baik. Nilai akhir
adalah nilai rata- rata untuk ketiga orang pemeriksa, dengan catatan
bahwa perbedaan ketiga nilai yang diberikan tidak terlalu besar (pada
EBTANAS SMTP/SMTA pada masa-masa yang lain, perbedaan itu
paling maksimum 2 point dalam jarak nilai 0 s/d 19). Bila terjadi
perbedaan nilai yang terlalu menyolok maka ketiga nilai itu dibatalkan
dan pekerjaan anak dinilai ulang.
4) Analisa Nilai
Dalam buku-buku evaluasi analisa nilai disebut juga interpretasi
score. Seperti yang disebutkan di atas bahwa interpretasi score ini
dalam test kemampuan yang distandard tidak mengalami kesulitan
lagi, karena normal interpretasi, dan kalaupun ada norma,
harusditinjau latar belakang dari tes itu. Untuk latar belakang yang
sangat berbeda perlu adanya peninjauan terhadap norma yang dibuat
dalam manual tes itu.
Dengan mempergunakan teknik-teknik interpretasi score akan
lebih baik dan tepat. Analisa nilai erat hubungannya dengan jenis test,
system analisa pendidikan yang dianut, ungsi test dan keadaan umum
dari yang di test. Penjelasan mengenai ini akan diuraikan pada bab
berikut ini.
c. Teknik analisis butir soal
Pemeriksaan, pemberian nilai dan penafsiran hasil tes berhubungan
dengan penilaian keberhasilan siswa dalam mengikuti pembelajaran yang
telah dilalui. Tinggi rendahnya nilai yang diperoleh murid dipengaruhi
oleh banyak faktor. Salah satu diantaranya adalah perangkat tes. Pada bab
terdahulu telah dibicarakan tentang analisis perangkat tes, mencakup
syarat validitas dan reliabilitas. Validitas dan reliabilitas korelasi
menunjuk kepada valid tidaknya tes atau reliable tidaknya tes yang
bersangkutan. Adanya variasi koeisien menunjuk pula adanya item
yangkurang baik dan ada item yang sudah memadai. Guru perlu
menganalisa butir soal yang kurang baik sehingga berangsur-angsur dapat
didokumentasikan sejumlah soal yang relative lebih bermutu, yang
selanjutnya dapat digunakn pada masa yang akan datang. Analisis objektif
dimaksudkan adalah pemeriksaan butir soal sehubungan dengan teknik
perhitungan tertentu secara eksak. Perhitungan dimaksud adalah
1) Daya pembeda (discrimining power)
Daya pembeda adalah angka yang menunjuk koefisien korelasi
jumlah yang menjawab benar dari kelompok murid yang pandai
dengan jumlah menjawab benar dari kelompok murid yang lemah.
Berikut ini salah satu contoh perhitungan daya pembeda. Contoh
perhitungan ini adalah salah satu teknik perhitungan dari semacam
teknik yang dapat digunakan.
Langkah-langkah untuk menghitung koeisien korelasi adalah
sebagai berikut
a) Susunlah lembar jawaban dimulai dri lembaran jawaban yang
memperoleh skor paling tinggi sampai kepada lembar jaaban yang
memperoleh skor paling rendah.
b) Tentukan kelompok murid yang pandai berdasarkan skor
kelompok murid yang lemah masing-masing 27 % dari seluruh
peserta, jadi 27 % dari atas susunan adalah kelompok pandai dari
27 % dari bawah susunan adalah kelompok lemah, sisa lembar
jawaban (40%) disisihkan dari perhitungan. Penentuan 27 %
menurut ahli Kelley (1393) adalah sampel yang cukup
representative.
c) Selanjutnya dibuat tabel distribusi jawaban masing-masing untuk
kelompok pandai (disingkat H) dan untuk kelompok lemah
(disingkat L), lihat contoh tabel dibawah ini
DISTRIBUSI JAWABAN OLEH KELOMPOK PANDAI
Contoh :
1
2
3
4
5
6
Dst
𝑁𝐻+ 𝑁𝐿
P = Tingkat kesukaran
𝑁𝐻+ 𝑁𝐿