Skor ujian atau skor tes merupakan suatu informasi, biasanya berupa angka, yang menggambarkan kinerja seorang peserta ujian terhadap suatu tes tertentu. Salah satu definisi formal menyatakan bahwa skor tes adalah “ringkasan bukti yang terkandung dalam respons peserta terhadap butir-butir tes yang berkaitan dengan konstruk atau sejumlah konstruk yang diukur.” Dengan demikian, skor tes berfungsi sebagai representasi kuantitatif dari kemampuan, pengetahuan, atau sifat psikologis yang menjadi fokus pengukuran.

Kertas ujian.

Dalam praktik pengukuran pendidikan maupun psikologi, skor tes dapat ditafsirkan melalui dua pendekatan utama, yakni penafsiran beracuan norma (norm-referenced interpretation) dan penafsiran beracuan kriteria (criterion-referenced interpretation).[1]

Pada penafsiran beracuan norma, skor memberikan makna tentang posisi atau kedudukan peserta tes dibandingkan dengan peserta lain dalam kelompok normatif. Misalnya, skor yang berada pada persentil ke-85 menunjukkan bahwa peserta tersebut memperoleh hasil lebih tinggi daripada 85% peserta lain dalam kelompok pembanding. Pendekatan ini lazim digunakan pada tes seleksi, tes bakat, atau tes standar yang bertujuan memetakan keterampilan relatif antarpeserta.[1]

Sebaliknya, penafsiran beracuan kriteria menekankan informasi mengenai sejauh mana peserta tes menguasai materi atau kompetensi tertentu tanpa membandingkannya dengan peserta lain. Dalam pendekatan ini, skor mencerminkan pencapaian terhadap standar atau tujuan pembelajaran, misalnya menunjukkan apakah peserta telah mencapai tingkat penguasaan minimal. Pendekatan ini umum digunakan dalam penilaian kelas, ujian sertifikasi, dan evaluasi kompetensi profesional.[2] Dalam beberapa konteks, kedua pendekatan tersebut dapat digunakan secara bersamaan untuk memberikan gambaran yang lebih komprehensif mengenai kinerja peserta. Melalui kerangka interpretasi yang tepat, skor tes menjadi alat penting untuk evaluasi pendidikan, diagnosis psikologis, seleksi, serta berbagai bentuk pengukuran lainnya.[2]

Jenis

sunting

Terdapat dua jenis utama skor tes, yaitu skor mentah dan skor baku (scaled scores). Skor mentah merupakan skor yang diperoleh tanpa penyesuaian atau transformasi apa pun; contohnya adalah jumlah soal yang dijawab dengan benar pada suatu tes. Skor ini menggambarkan performa dasar peserta sebelum dipertimbangkan aspek kesulitan tes atau variasi antarbentuk tes. Sebaliknya, skor baku adalah hasil dari suatu proses transformasi yang diterapkan pada skor mentah. Transformasi tersebut dapat berupa penyeragaman, penyesuaian distribusi nilai, atau prosedur lain seperti yang terjadi pada sistem penilaian relatif (relative grading). Tujuan utama dari skor baku adalah untuk melaporkan hasil peserta tes dalam suatu skala yang konsisten, meskipun mereka mengerjakan bentuk tes yang berbeda atau menghadapi tingkat kesulitan soal yang tidak sama.

Sebagai contoh, anggaplah suatu tes memiliki dua bentuk. Bentuk pertama lebih sulit dibandingkan bentuk kedua. Melalui prosedur penyetaraan (equating), diketahui bahwa skor 65% pada bentuk pertama setara dengan skor 68% pada bentuk kedua. Untuk memastikan bahwa kedua hasil yang setara tersebut dilaporkan secara konsisten, skor mentah dapat dikonversi ke dalam skala baku, misalnya skala 100 hingga 500, sehingga keduanya sama-sama dilaporkan sebagai skor 350. Dengan demikian, skor baku memungkinkan interpretasi yang adil dan setara antar bentuk tes.

Di Amerika Serikat, dua contoh tes terkenal yang menggunakan skor baku adalah ACT dan SAT. ACT menggunakan rentang skor 0 hingga 36, sedangkan SAT menggunakan rentang 200 hingga 800 untuk setiap bagian tes. Secara historis, skala tersebut dirancang agar mencerminkan nilai rata-rata dan standar deviasi tertentu: rata-rata 18 dan standar deviasi 6 untuk ACT, serta rata-rata 500 dan standar deviasi 100 untuk SAT. Batas atas dan bawah ditetapkan secara logis berdasarkan fakta bahwa interval ±3 standar deviasi mencakup lebih dari 99% populasi. Skor di luar rentang tersebut sulit diukur secara presisi dan memiliki nilai praktis yang rendah.

Perlu dicatat bahwa proses penskalaan tidak memengaruhi sifat psikometrik dari suatu tes. Penskalaan dilakukan setelah proses penilaian dan, bila diperlukan, proses penyetaraan selesai. Dengan demikian, penskalaan tidak berkaitan langsung dengan aspek psikometri, melainkan berhubungan dengan isu interpretabilitas, yaitu cara skor dilaporkan agar dapat dipahami dan digunakan secara konsisten oleh berbagai pemangku kepentingan.

Referensi

sunting
  1. ^ a b Meijer, Rob R. (2003-01). "Book Review: Test Scoring Edited by David Thissen and Howard Wainer Mahwah, NJ: Lawrence Erlbaum, 2001, 422 pp., $99.95 (hardcover) ISBN 0-8058-3766-3". Applied Psychological Measurement. 27 (1): 75–77. doi:10.1177/014662102237799. ISSN 0146-6216.
  2. ^ a b https://education.uiowa.edu/itp/itbs/itbs_interp_score.htm

📚 Artikel Terkait di Wikipedia

Ujian Nasional

Ujian Nasional (UN/UNAS), sebelumnya dikenal sebagai Evaluasi Belajar Tahap Nasional (Ebtanas) dan Ujian Akhir Nasional (UAN), adalah sistem evaluasi standar

IELTS

IDP Education Australia. IELTS sendiri digolongkan dalam dua macam modul ujian yaitu Modul Umum dan Modul Akademis. Sejak tahun 1989, IELTS dipercaya untuk

Distribusi normal

memodelkan fenomena kuantitatif pada ilmu alam maupun ilmu sosial. Beragam skor pengujian psikologi dan fenomena fisika seperti jumlah foton dapat dihitung melalui

Tes Kemampuan Akademik

SD/MI dan SMP/MTs direncanakan berlangsung pada tahun 2026. Materi yang diujikan disesuaikan dengan jenjang pendidikan. Untuk SD/MI dan SMP/MTs, mata pelajaran

Kejuaraan (Indonesia) 2025–2026

Mei 2025). "Daftar Peserta Liga 2 2025-2026, Lengkap dari Tiga 'Jalur'". Skor.id. Diakses tanggal 25 Mei 2025. Syamsuddin, Hasan (14 April 2025). "DPRD

Final Destination: Bloodlines

biasa." Metacritic, yang menggunakan rata-rata tertimbang, memberi film ini skor 74 dari 100, berdasarkan 32 kritikus, yang menunjukkan ulasan "umumnya menguntungkan"

Ujian Standar Bahasa Tionghoa

(Hanzi: 汉语水平考试), diterjemahkan sebagai Ujian Kemampuan Bahasa Tionghoa atau Ujian Standar Bahasa Tionghoa, adalah ujian standardisasi Republik Rakyat Tiongkok

Penyensoran internet di Indonesia

Indonesia memiliki skor 49 dalam hal kebebasan berinternet. Skor ini berada di tengah-tengah antara akhir rentang "bebas" pada skor 30 dan awal rentang