การวิเคราะห์คุณภาพข้อสอบแบบเลือกตอบตามทฤษฎีการทดสอบแบบดั้งเดิม

ผู้แต่ง

  • ปุริมปรัชญ์ คณิณพศุตย์ สำนักทะเบียนและวัดผล มหาวิทยาลัยสุโขทัยธรรมาธิราช https://orcid.org/0009-0000-0039-567X

คำสำคัญ:

การวิเคราะห์ข้อสอบ, ความยาก, อำนาจจำแนก, ข้อสอบแบบเลือกตอบ, ทฤษฎีการทดสอบแบบดั้งเดิม

บทคัดย่อ

บทความวิชาการนี้มีวัตถุประสงค์เพื่อนำเสนอหลักการและแนวปฏิบัติในการวิเคราะห์คุณภาพข้อสอบแบบเลือกตอบตามทฤษฎีการทดสอบแบบดั้งเดิม เนื่องจากคุณภาพของข้อสอบเป็นปัจจัยสำคัญต่อความตรงในการประเมินความสามารถที่แท้จริงของผู้เรียน การวิเคราะห์คุณภาพข้อสอบรายข้อจึงเป็นกระบวนการทางสถิติที่ช่วยตรวจสอบประสิทธิภาพของข้อสอบอย่างเป็นระบบ โดยครอบคลุมดัชนีสำคัญ 3 ประการ ได้แก่ 1. ค่าความยาก ซึ่งสะท้อนสัดส่วนของผู้ที่ตอบข้อสอบข้อนั้นถูก 2. ค่าอำนาจจำแนกที่แสดงความสามารถของข้อสอบในการแยกระหว่างกลุ่มผู้สอบที่มีความสามารถสูงและกลุ่มที่มีความสามารถต่ำ และ 3. ประสิทธิภาพของตัวลวง ซึ่งวิเคราะห์ความสามารถของตัวลวงในการดึงดูดผู้สอบกลุ่มต่ำที่ไม่มีความรู้จริงมาตอบ นอกจากนี้ บทความยังอธิบายสูตร ขั้นตอนการคำนวณ และการแปลความหมายของค่าดัชนีต่าง ๆ อย่างละเอียด รวมถึงการนำเสนอแนวทางที่ผู้สอนและนักวิจัยสามารถนำไปประยุกต์ใช้ได้จริงผ่านโปรแกรมพื้นฐาน โดยไม่จำเป็นต้องใช้ซอฟต์แวร์ทางสถิติที่ซับซ้อน การทำความเข้าใจหลักการวิเคราะห์ข้อสอบและการปรับปรุงข้อสอบให้เป็นไปตามเกณฑ์คุณภาพมาตรฐาน จะช่วยยกระดับความแม่นยำ ความเที่ยงตรง และความเป็นธรรมของการวัดผลสัมฤทธิ์ทางการเรียนให้ดียิ่งขึ้น

เอกสารอ้างอิง

ศิริชัย กาญจนวาสี. (2556). ทฤษฎีการทดสอบแบบดั้งเดิม (พิมพ์ครั้งที่ 7). กรุงเทพฯ: สำนักพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.

Allen, M. J. & Yen, W. M. (1979). Introduction to Measurement Theory. Monterey, CA.: Brooks/Cole.

Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. New York, NY: Holt, Rinehart and Winston.

Ebel, R. L. & Frisbie, D. A. (1991). Essentials of educational measurement (5th ed.). Englewood Cliffs, NJ: Prentice-Hall.

Gierl, M. J. & Bulut, O. (2017). Using distractor analysis to evaluate item quality. In M. J. Gierl & O. Bulut (Eds.), Handbook of diagnostic classification models. (pp. 81–108). Cham: Springer.

Gronlund, N. E. & Linn, R. L. (1990). Measurement and evaluation in teaching (6th ed.). New York, NY: Macmillan.

Haladyna, T. M. et al. (2002). A review of multiple-choice item-writing guidelines for classroom assessment. Applied Measurement in Education, 15(3), 309-333.

Kehoe, J. (1995). Basic item analysis for multiple-choice tests. Practical Assessment, Research & Evaluation, 4(10), 1-3.

Kelly, T. L. (1939). The Selection of Upper and Lower Groups for the Validation of Test Items. Journal of Educational Psychology, 30, 17-24.

Krishnan, D. R. (2013). Statistical estimation techniques requiring nearly normal sampling distributions. Retrieved February 1, 2026, from https://www.pure.ed.ac.uk/ws/files/29266196/frp0477_krishnan.pdf

Miller, M. D. et al. (2009). Measurement and assessment in teaching (10th ed.). Upper Saddle River, NJ: Pearson.

Rao, C. et al. (2016). Item analysis of multiple choice questions: Assessing an assessment tool in medical students. International Journal of Educational and Psychological Researches, 2(4), 201-204.

Rezigalla, A. A. et al. (2024). Item analysis: the impact of distractor efficiency on the difficulty index and discrimination power of multiple-choice items. BMC Med Educ, 24(445), 1-7.

Tarrant, M. et al. (2009) An assessment of functioning and non-functioning distractors in multiple-choice questions: a descriptive analysis. BMC Med Educ, 9(40), 1-8.

ดาวน์โหลด

เผยแพร่แล้ว

2026-02-26

รูปแบบการอ้างอิง

คณิณพศุตย์ ป. (2026). การวิเคราะห์คุณภาพข้อสอบแบบเลือกตอบตามทฤษฎีการทดสอบแบบดั้งเดิม. วารสารสหวิทยาการนวัตกรรมปริทรรศน์, 9(1), 373–384. สืบค้น จาก https://so04.tci-thaijo.org/index.php/jidir/article/view/286704