Tes Standar
Tes
Standar adalah tes yang mengandung prosedur yang seragam
untuk menentukan nilai dan administrasinya. Tes standar bisa membandingkan
kemampuan murid dengan murid lain pada usia atau level yang sama, dan dalam
banyak kasus perbandingan ini dilakukan di tingkat nasional.
Tes standar memiliki
beberapa tujuan, diantaranya:
- Memberikan informasi tentang kemajuan murid
- Mendiagnosis kekuatan dan kelemahan murid
- Memberikan bukti untuk penempatan murid dalam program khusus
- Memberi informasi untuk merencanakan dan meningkatkan pengajaran atau instruksi
- Membantu administrator mengevaluasi program
- Memberikan akuntabilitas
Perhatian terhadap
akuntabilitas telah memunculkan tes berbasis standar dan tes berisiko tinggi. Tes berbasis standar adalah tes yang menilai kemampuan/keahlian
yang diharuskan dipunyai murid sebelum mereka naik ke kelas berikutnya atau
kelulusannya. Sedangkan tes berisiko
tinggi adalah menggunakan tes dengan cara sedemikian rupa yang mengandung
konsekuensi penting bagi murid, memengaruhi keputusan seperti apakah murid itu
akan naik kelas atau lulus.
Kriteria
untuk Mengevaluasi Tes Standar
Kriteria paling penting
untuk mengevaluasi tes standar adalah norma, validitas, reliabilitas, dan
keadilan.
Kelompok
norma adalah kelompok dari individu yang sama sebelumnya
telah diberi ujian oleh penguji.
Validitas
adalah sejauh mana sebuah tes mengukur apa-apa yang hendak diukur dan apakah
inferensi tentang nilai tes itu akurat atau tidak. Dari sefi karakteristik tes
itu sendiri, ada tiga tipe validitas, yaitu validitas isi, validitas kriteria
dan validitas konstruk. Validitas isi adalah
kemampuan tes untuk mencakup sampel (to sampel) isi yang hendak di ukur. Validitas kriteria adalah kemampuan tes
untuk memprediksi kinerja murid saat diukur dengan penilaian atau kriteria
lain. Validitas kriteria dapat bersifat concurrent dan predictive. Concurrent
validity adalah relasi antara nilai tes dengan kriteria lain yang ada
saat ini sedangkan predictive validity adalah
relasi antara nilai tes dengan kinerja masa depan murid. Validitas konstruk (construct
validity) adalah sejauh mana ada bukti bahwa sebuah tes mengukur konstruk
tertentu. Sebuah konstruk adalah ciri atau karakteristik yang tidak bisa di
lihat dari seseorang, seperti inteligensi, gaya belajar, personalitas, atau
kecemasan.
Reliabilitas
adalah sejauh mana sebuah prosedur tes bisa menghasilkan nilai yang konsisten
dan dapat direproduksi. Reliabilitas dapat diukur dengan berbagai cara, antara
lain test-retest reliability,
alternate-forms reliability, split-half reliability.
- Test-retest reliability adalah sejauh mana sebuah tes menghasilkan kinerja yang sama ketika seorang siswa di beri tes yang sama dalam dua kesempatan yang berbeda.
- Alternate-forms reliability, reliabilitas ditentukan dengan memberikan bentuk yang berbeda dari tes yang sama pada dua kesempatan yang berbeda untuk kelompok murid yang sama dan mengamati seberapa konsistenkah skornya.
- Split-half reliability adalah reliabilitas yang dinilai dengan membagi item tes menjadi dua bagian seperti item bernomor genap dan ganjil. Nilai pada dua set item itu dibandingkan guna menentukan seberapa konsistenkah kinerja murid di kedua situasi.
Keadilan.
Tes
yang adil adalah tes yang tidak bias (unbiased) dan tidak diskriminatif. Tes itu tidak dipengaruhi oleh faktor-faktor
seperti gender, etnis, atau faktor subjektif seperti bias penilai.
Tes
Kecakapan dan Prestasi
Ada dua tipe utama tes
standar: tes kecakapan (aptitude) dan
tes prestasi (achievement).
Tes
kecakapan adalah tipe
tes yang didesain guna memprediksi kemampuan murid untuk mempelajari suatu
keahlian atau menguasai sesuatu dengan pendidikan dan training tingkat lanjut.
Tes kecakapan ini mencakup tes kemampuan mental umum seperti tes kecerdasan
(Stanford-Binet, Wechsler Scales).
Tes
prestasi adalah tes yang dimaksudkan untuk mengukur apa yang
telah dipelajari atau keahlian apa yang telah dikuasai murid. Namun, perbedaan
antara kedua tersebut terkadang kabur. Scholastic Assesment Test (SAT) yang
akan dijalani saat masuk perguruan tinggi biasanya dideskripsikan sebagai tes
kecakapan, namun SAT dapat menjadi tes kecakapan atau tes prestasi tergantung
pada tujuan penggunaanya. Apabila tes ini dipakai untuk memprediksi kesuksesan
seseorang di universitas, maka ia berupa tes kecakapan. Jika dipakai untuk
menilai apa yang telah seseorang pelajari, maka ia adalah tes prestasi.
Jenis-jenis
Tes Prestasi Standar
Ada sejumlah tipe tes
prestasi standar. Salah satu cara umum untuk mengklasifikasikannya adalah
sebagai survey batteries, specific
subject tests, atau diagnostic tests.
- Survey Batteries adalah sekelompok tes pokok persoalan individual yang didesain untuk murid level tertentu. Survey batteries adalah tes standar yang banyak digunakan. Beberapa baterai yang umum adalah tes California Achievement, Terra Nova Comprehensive Test for Basic Skills, Iowa Tests of Basic Skills, Metropolititan Achievement Tests, dan Stanford Achievement Test Series.
- Tes untuk Subjek Spesifik. Beberapa tes prestasi standar dimaksudkan untuk menilai keahlian di bidang tertentu seperti membaca atau matematika. Tes ini biasanya menilai suatu keahlian secara lebih mendetail dan ekstensif ketimbang survey battery. Dua contoh tes area spesifik untuk bidang membaca adalah Woodcock Reading Mastery Test dan Gates-Mckillop-Horowitz Reading Diagnostic Test.
- Tes Diagnostik. Diagnosis adalah fungsi penting dari tes standar. Diagnostic testing terdiri dari evaluasi area pembelajaran spesifik secara relatif mendalam. Tujuannya adalah menentukan kebutuhan pembelajaran spesifik dari murid sehingga kebutuhan itu dapat dipenuhi melalui instruksi reguler atau remedial.
0 komentar:
Posting Komentar