Skor ujian atau skor tes merupakan suatu informasi, biasanya berupa angka, yang menggambarkan kinerja seorang peserta ujian terhadap suatu tes tertentu. Salah satu definisi formal menyatakan bahwa skor tes adalah “ringkasan bukti yang terkandung dalam respons peserta terhadap butir-butir tes yang berkaitan dengan konstruk atau sejumlah konstruk yang diukur.” Dengan demikian, skor tes berfungsi sebagai representasi kuantitatif dari kemampuan, pengetahuan, atau sifat psikologis yang menjadi fokus pengukuran.

Kertas ujian.

Dalam praktik pengukuran pendidikan maupun psikologi, skor tes dapat ditafsirkan melalui dua pendekatan utama, yakni penafsiran beracuan norma (norm-referenced interpretation) dan penafsiran beracuan kriteria (criterion-referenced interpretation).[1]

Pada penafsiran beracuan norma, skor memberikan makna tentang posisi atau kedudukan peserta tes dibandingkan dengan peserta lain dalam kelompok normatif. Misalnya, skor yang berada pada persentil ke-85 menunjukkan bahwa peserta tersebut memperoleh hasil lebih tinggi daripada 85% peserta lain dalam kelompok pembanding. Pendekatan ini lazim digunakan pada tes seleksi, tes bakat, atau tes standar yang bertujuan memetakan keterampilan relatif antarpeserta.[1]

Sebaliknya, penafsiran beracuan kriteria menekankan informasi mengenai sejauh mana peserta tes menguasai materi atau kompetensi tertentu tanpa membandingkannya dengan peserta lain. Dalam pendekatan ini, skor mencerminkan pencapaian terhadap standar atau tujuan pembelajaran, misalnya menunjukkan apakah peserta telah mencapai tingkat penguasaan minimal. Pendekatan ini umum digunakan dalam penilaian kelas, ujian sertifikasi, dan evaluasi kompetensi profesional.[2] Dalam beberapa konteks, kedua pendekatan tersebut dapat digunakan secara bersamaan untuk memberikan gambaran yang lebih komprehensif mengenai kinerja peserta. Melalui kerangka interpretasi yang tepat, skor tes menjadi alat penting untuk evaluasi pendidikan, diagnosis psikologis, seleksi, serta berbagai bentuk pengukuran lainnya.[2]

Jenis

sunting

Terdapat dua jenis utama skor tes, yaitu skor mentah dan skor baku (scaled scores). Skor mentah merupakan skor yang diperoleh tanpa penyesuaian atau transformasi apa pun; contohnya adalah jumlah soal yang dijawab dengan benar pada suatu tes. Skor ini menggambarkan performa dasar peserta sebelum dipertimbangkan aspek kesulitan tes atau variasi antarbentuk tes. Sebaliknya, skor baku adalah hasil dari suatu proses transformasi yang diterapkan pada skor mentah. Transformasi tersebut dapat berupa penyeragaman, penyesuaian distribusi nilai, atau prosedur lain seperti yang terjadi pada sistem penilaian relatif (relative grading). Tujuan utama dari skor baku adalah untuk melaporkan hasil peserta tes dalam suatu skala yang konsisten, meskipun mereka mengerjakan bentuk tes yang berbeda atau menghadapi tingkat kesulitan soal yang tidak sama.

Sebagai contoh, anggaplah suatu tes memiliki dua bentuk. Bentuk pertama lebih sulit dibandingkan bentuk kedua. Melalui prosedur penyetaraan (equating), diketahui bahwa skor 65% pada bentuk pertama setara dengan skor 68% pada bentuk kedua. Untuk memastikan bahwa kedua hasil yang setara tersebut dilaporkan secara konsisten, skor mentah dapat dikonversi ke dalam skala baku, misalnya skala 100 hingga 500, sehingga keduanya sama-sama dilaporkan sebagai skor 350. Dengan demikian, skor baku memungkinkan interpretasi yang adil dan setara antar bentuk tes.

Di Amerika Serikat, dua contoh tes terkenal yang menggunakan skor baku adalah ACT dan SAT. ACT menggunakan rentang skor 0 hingga 36, sedangkan SAT menggunakan rentang 200 hingga 800 untuk setiap bagian tes. Secara historis, skala tersebut dirancang agar mencerminkan nilai rata-rata dan standar deviasi tertentu: rata-rata 18 dan standar deviasi 6 untuk ACT, serta rata-rata 500 dan standar deviasi 100 untuk SAT. Batas atas dan bawah ditetapkan secara logis berdasarkan fakta bahwa interval ±3 standar deviasi mencakup lebih dari 99% populasi. Skor di luar rentang tersebut sulit diukur secara presisi dan memiliki nilai praktis yang rendah.

Perlu dicatat bahwa proses penskalaan tidak memengaruhi sifat psikometrik dari suatu tes. Penskalaan dilakukan setelah proses penilaian dan, bila diperlukan, proses penyetaraan selesai. Dengan demikian, penskalaan tidak berkaitan langsung dengan aspek psikometri, melainkan berhubungan dengan isu interpretabilitas, yaitu cara skor dilaporkan agar dapat dipahami dan digunakan secara konsisten oleh berbagai pemangku kepentingan.

Referensi

sunting
  1. ^ a b Meijer, Rob R. (2003-01). "Book Review: Test Scoring Edited by David Thissen and Howard Wainer Mahwah, NJ: Lawrence Erlbaum, 2001, 422 pp., $99.95 (hardcover) ISBN 0-8058-3766-3". Applied Psychological Measurement. 27 (1): 75–77. doi:10.1177/014662102237799. ISSN 0146-6216.
  2. ^ a b https://education.uiowa.edu/itp/itbs/itbs_interp_score.htm

📚 Artikel Terkait di Wikipedia

Hitung darah lengkap

(2015). "ICSH recommendations for the standardization of nomenclature and grading of peripheral blood cell morphological features". International Journal

Microsoft Teams

Inggris). Diakses tanggal March 19, 2020. "Microsoft Teams for Education adds assignments and grading features". On MSFT (dalam bahasa Inggris). May 11, 2018

In God We Trust

ISBN 978-0-275-99367-2. Giedroyc, Richard. "Two Cent". Professional Coin Grading Service (dalam bahasa American English). Diakses tanggal 2021-05-24. Pemeliharaan

Universitas Hindia Barat

Times Higher Education. Diakses tanggal 29 December 2019. "History of the UHWI - University Hospital of the West Indies". uhwi.gov.jm. "Grading Scale". https://www

Kebebasan akademik

1986) ("To accept plaintiff's contention that an untenured teacher's grading policy is constitutionally protected ... would be to constrict the university

Sirop mapel

University. Koelling, Melvin R; et al. (1996). "Chapter 8: Syrup Filtration, Grading, Packing, and Handling". Dalam Koelling, Melvin R; Heiligmann, Randall

Whitney Houston

Diakses tanggal 2009-11-12. "Pop & Hiss, 2009 American Music Awards: Grading The Performances". L.A. Times. 2009-11-22. Diakses tanggal 2009-11-23.

Kuma-kuma

", Tarvand Saffron Company[10 Januari 2006]. Tarvand Saffron (2005b), "Grading and Classification", Tarvand Saffron Company[10 Januari 2006]. Willard