- 127 - บทที่ 8 การวิเคราะหค์ ณุ ภาพเครื่องมอื วดั และประเมินผลการเรียนรู้ เคร่ืองมือวัดและประเมินผลการเรียนรู้ที่ดีต้องเป็นเคร่ืองมือที่มีคุณภาพ จึงจะช่วยให้ การวัดและประเมินผลน้ันมีความถูกต้องเชื่อถือได้ และผลการประเมินที่ได้จะน่าเชื่อถือด้วย ดังน้ันเคร่ืองมือที่ครูผู้สอนสร้างขึ้น ก่อนที่จะนาไปใช้จริงในการวัดและประเมินผลการเรียนรู้ ครผู สู้ อนควรมีการตรวจสอบคุณภาพและวิเคราะหค์ ณุ ภาพของเครื่องมือก่อนทุกครั้ง ซึ่งถือว่า เป็นการตรวจสอบคุณสมบัติของเคร่ืองมือ (พิชิต ฤทธิ์จรูญ, 2553) ได้แก่ 1) ความเที่ยงตรง 2) ความเป็นปรนัย 3) ความเชื่อมั่น 4) ความยาก 5) อานาจจาแนก ซึ่งเคร่ืองมือวัดและ ประเมินผลการเรียนรู้บางชนิดจาเป็นต้องตรวจสอบคุณภาพให้ครบทั้ง 5 ประการ เครือ่ งมอื วัด พฤติกรรมด้านพุทธิพิสัย คือ แบบทดสอบ ควรมีการวิเคราะห์คุณภาพของข้อสอบท้ังรายข้อ และรายฉบับ แต่บางชนิดที่เป็นเคร่ืองมือวัดพฤติกรรมด้านจิตพิสัยและทักษะพิสัยอาจ ตรวจสอบเพียงบางประการ แล้วแต่ลักษณะของเคร่ืองมือ โดยมีรายละเอียดของการวิเคราะห์ คณุ ภาพเครื่องมือวดั และประเมินผลการเรียนรู้ ดงั แผนภาพต่อไปดังน้ี 1. ลกั ษณะของเครื่องมือวัดและประเมนิ ผลการเรียนรทู้ ี่ดี เคร่ืองมือวัดและประเมินผลการเรียนรู้ที่มีคุณภาพควร ควรมีลักษณะ (สุวิมล ติร กานนั ท์, 2550; พิชิต ฤทธิจ์ รญู , 2553; สมนึก ภัททิยธนี, 2558; อนวุ ัติ คูณแก้ว, 2558) ดังน้ี 1.1 ความเท่ยี งตรง (Validity) ซึ่งหมายถึง ความสามารถของเครื่องมือวดั ที่วัดได้ตรง ตามวัตถุประสงค์ที่ต้องการวัด และเป็นคุณสมบัติที่สาคัญที่สุดของเคร่ืองมือ ถือว่าเป็นหัวใจ สาคัญของเครื่องมือวดั และประเมินผลการเรียนรู้ 1.2 ความเป็นปรนัย (Objective) หมายถึง ความถูกต้อง ความชัดแจ้ง และความ เข้าใจที่ตรงกนั ของเครื่องมือโดยยึดถือความถูกต้องทางวิชาการเป็นเกณฑ์ มี 3 ประการ คือ 2.1) ความชัดเจนของคาถาม หมายถึง ข้อคาถามนั้นต้องมีความชัดเจน ไม่กากวม รดั กมุ และไม่วกวน ทุกคนอ่านแลว้ มีความเข้าใจตรงกนั 2.2) ความชัดเจนในการให้คะแนน หมายถึง การตรวจให้คะแนนได้ตรงกัน ไม่ว่าจะ เป็นผู้ออกข้อสอบเปน็ คนตรวจ หรอื ให้คนอื่นเป็นคนตรวจ กส็ ามารถใหค้ ะแนน ได้ตรงกัน 2.3) ความชัดเจนในการแปลความหมายของคะแนน หมายถึง การแปลความหมาย ของคะแนนได้ชดั เจน ไม่ว่าจะเปน็ ใครที่แปลความหมายของคะแนนก็ตาม
- 128 - 1.3 ความเชื่อม่ัน (Reliability) หมายถึง คุณภาพของเคร่ืองมือ ที่สามารถใช้วัด หลาย ๆ คร้ัง แล้วได้ผลของการวัดที่ความคล้ายคลึงกัน “ความคงเส้นคงวา” ซึ่งหากเป็น คุณสมบัติของแบบทดสอบก็จะใช้ในการทดสอบกับกลุ่มผู้เรียนกลุ่มเดิม ไม่ว่าทดสอบกี่ครั้งก็ ตาม ผลลัพธ์ของคะแนนทีไ่ ด้ จะเท่าเดิมหรอื มีคา่ คะแนนใกล้เคียงกนั 1.3.1 ความยาก (Power of Difficulty) เป็นการหาคุณภาพของแบบทดสอบที่มี คุณสมบัติที่บอกให้ทราบว่าข้อสอบข้อน้ันมีคนตอบถูกมากหรือน้อย ถ้ามีคนตอบถูกมาก ข้อสอบนั้นง่ายและถ้ามีคนตอบถูกน้อยข้อสอบยาก ถ้ามีคนตอบถูกบ้างตอบผิดบ้างหรือมีคน ตอบถูกปานกลางข้อสอบข้อนั้นก็มีความยากปานกลาง ข้อสอบที่ดีควรมีความยากพอเหมาะ ควรมีคนตอบถูกไม่ต่ากว่า 20 คนและไม่เกิน 80 คน จากผู้สอบ 100 คน หาได้โดยการนา จานวนคนทีต่ อบถูกหารดว้ ยจานวนคนทีต่ อบทั้งหมด 1.3.2 อานาจจาแนก (Discrimination) เป็นการหาคุณภาพของแบบทดสอบที่ มคี ณุ สมบตั ิของข้อสอบทีส่ ามารถจาแนกผู้เรียนได้ตามความแตกต่างของบุคคลว่าใครเก่ง ปาน กลาง อ่อน ใครรอบรู้ -ไม่รอบรู้ โดยยึดหลักการว่าคนเก่งจะต้องตอบข้อสอบข้อนั้นถูก คนไม่ เก่งจะต้องตอบผิด ข้อสอบที่ดีจะต้องแยกคนเก่งกับคนไม่เก่งออกจากกันได้ อานาจจาแนกมี ความสัมพันธ์กับความเที่ยงตรงเชิงสภาพในทางบวก คือ ถ้าเคร่ืองมือใดมีอานาจจาแนกสูง เครื่องมือนั้นกม็ ีความเทีย่ งตรงเชิงสภาพสงู ด้วย นอกจากนั้นเครอ่ื งมอื ประเภทแบบทดสอบที่ดมี ีลักษณะดงั น้ี 1) ความมีประสิทธิภาพ (Efficiency) หมายถึง แบบทดสอบที่สามารถให้ คะแนนได้เที่ยงตรงและเชื่อถือได้อย่างคุ้มค่า เช่น การสะกดคาให้ถูกต้อง จานวนหน้าให้ครบ รูปแบบเหมาะสม เป็นต้น 2) ความยุติธรรม (Fair) หมายถึง แบบทดสอบที่ไม่ก่อให้เกิดความเสียเปรียบ ของผู้เรียน เช่น ข้อสอบไม่ควรเน้นเฉพาะเร่ืองซึ่งตรงกับเร่ืองที่ผู้เรียนทารายงานบางกลุ่ม ข้อสอบทีใ่ ชค้ าถามแนะคาตอบ เปน็ ต้น 3) คาถามลึก (Searching) หมายถึง แบบทดสอบที่มีข้อคาถามมากกว่า ความรู้-จา หรือวัดให้ครบในระดับพฤติกรรม การนาความรู้ที่ได้เรียนมาวิเคราะห์ แก้ปัญหา และสร้างสรรคส์ ิง่ ใหม่ เน้นประสบการณ์ตา่ ง ๆ และเชอ่ื มโยงชีวติ จรงิ 4) คาถามยั่วยุ (Exemplary) หมายถึง ลักษณะข้อคาถามน่าสนใจ อาจมี ภาพประกอบ ท้าท้ายใหอ้ ยากทา และเรียงคาถามจากข้องา่ ยไปหายาก 5) จาเพาะเจาะจง (Definite) หมายถึง ลักษณะข้อคาถามต้องไม่คลุมเครือ อ่านแลว้ เข้าใจชดั เจน
- 129 - ภาพที่ 8.1 แสดงการวิเคราะหค์ ณุ ภาพเครอ่ื งมอื วดั และประเมินผลการเรียนรู้ 2. การวิเคราะห์และประเมินผลแบบองิ กลมุ่ และองิ เกณฑ์ การวิเคราะหแ์ ละประเมินผลแบบอิงกลุ่มและอิงเกณฑ์ มรี ายละเอียดดังน้ี 2.1 หลักการวเิ คราะห์และประเมินผลแบบอิงกลมุ่ และอิงเกณฑ์ 2.1.1 การประเมินผลแบบอิงกลุ่ม (Norm Reference) หมายถึง การประเมิน ที่มุ่งนาผลการเรียนจาแนกผู้เรียนออกตามความสามารถโดยพิจารณาจากการเปรียบเทียบ ผ ล ก า ร ป ร ะเมิ น ข อ ง ผู้ เรี ย น แ ต่ ล ะค น กั บ ก ลุ่ ม ผู้ เรี ย น ด้ ว ย กั น โด ย มี แ น ว คิ ด ว่ า ในการจัดการจัดการเรียนรู้ ผู้เรียนย่อมมีความแตกต่างเป็นรายบุคคล นั่นคือจะทราบว่า ผเู้ รียนแตล่ ะคน มีความสามารถมากหรอื น้อยกว่าผเู้ รียนคนอื่น ๆ ในกลุ่มเดียวกนั 2.1.2 การประเมินผลแบบอิงเกณฑ์ (Criterion Reference) หมายถึง การประเมิน ที่มุ่งนาผลการเรียนของผู้เรียนแต่ละคนมาเปรียบเทียบกับเกณฑ์ที่กาหนดขึ้น โดยไม่ได้ มุ่งเปรียบเทียบกับผู้เรียนคนอื่น ๆ หรือกล่าวได้ว่า เป็นการประเมินที่ต้องการทราบสถานภาพ ของบุคคล ซึ่งอาศัยเกณฑ์ที่กาหนดขึ้นเป็นหลัก โดยมีแนวความคิดว่า ในการจัดการเรียน การสอนควรจะให้ผเู้ รียนเรียนอย่างรอบรู้ (Master Learning)
- 130 - 2.2 ความแตกตา่ งของการวิเคราะห์และการประเมินผลแบบอิงกล่มุ และอิงเกณฑ์ ตารางที่ 8.1 แสดงความแตกต่างของการวิเคราะห์และการประเมินผลแบบอิงกลุ่มและอิงเกณฑ์ ท่ี การประเมินแบบองิ กลมุ่ การประเมินแบบองิ เกณฑ์ 1 เป็นการเปรียบเทียบความสามารถของผู้เรียน เป็นการเปรียบเทียบความสามารถของผู้เรียน แต่ละคนกับผู้เรียนคนอื่น ๆ ในกลุ่มที่เรียน แ ต่ ล ะ ค น กั บ เก ณ ฑ์ ซ่ึ ง เก ณ ฑ์ ใน ที่ นี้ ด้วยกนั ก็คือจดุ ประสงคข์ องการเรียนรู้ 2 โครงสร้างประกอบด้วย ผลของแนวความคิด โครงสร้างประกอบด้วย จุดประสงค์ของการ หรือจุดประสงค์ที่ครอบคลุมโดยเน้นการเป็น จดั การเรียนรู้ทั้งหมดที่กาหนดไว้อย่างจาเพาะ ตวั แทนของจกั รวาลความรู้ เจาะจงและทดสอบตามจดุ ประสงค์ 3 ใช้แบบทดสอบฉบบั เดียวกันกบั ผู้เรยี นในกลุ่ม อาจใช้แบบทดสอบต่างฉบับกับผู้เรียนแต่ละ คนในกลุ่ม 4 ข้อสอบสร้างขึ้นเพื่อใช้จาแนกผู้เรียนเป็นกลุ่ม ข้อสอบที่สร้างขึ้นเพื่อวัดระดับความรู้หรือ เก่งกลุ่มอ่อน จึงเหมาะสาหรับการสอบ ทั ก ษ ะความ ส าม ารถ จึงเห ม าะส าห รับ คดั เลือก หรอื สอบเพื่อความเป็นเลิศ การจัดการเรียนรู้หรอื การวนิ ิจฉัย 5 ข้อสอบมีความยากพอเหมาะ 50% คอื ไม่ยาก ข้อสอบไม่คานึงถึงความยาก สิ่งสาคัญคือเน้น หรือง่ายเกินไป โดยสุ่มและเน้นการวัดตาม การวดั ตามจดุ ประสงคก์ ารเรียนรู้ เนื้อหาสาระ 6 การวิเคราะห์ข้อสอบรายข้อใช้เกณฑ์ภายใน การวิเคราะห์ข้อสอบรายข้อใช้เกณฑ์ภายนอก คอื กลุ่มผู้ได้คะแนนสงู กับกลุ่มผู้ได้คะแนนต่า เช่น กลุ่มรอบรู้กับไม่รอบรู้ หรือเรียนแล้ว กบั ยังไม่เรยี น 7 ใช้คะแนนในรูปของคะแนนมาตรฐาน คือ คะแนนจะแปลความหมายออกมาในรูปของ ตาแหน่งเปอร์เซ็นไทล์ (Percentile Rank) ซ่ึง การรอบรู้หรือยงั ไม่รอบรู้ จะแปลความหมายในรปู ของลาดับที่ของกลุ่ม 3. การวิเคราะหค์ ุณภาพโดยการหาค่าความเทย่ี งตรง การหาค่าความเที่ยงตรง สามารถแบ่งออกได้เปน็ 3 ประเภท (พิชิต ฤทธิ์จรญู , 2553 ; อัจฉรีย์ (คาแถม) พิมพิมูล, 2550) ดังน้ี 3.1 การวเิ คราะหค์ ุณภาพโดยการหาค่าความเท่ยี งตรงแบบอิงกลุม่ 3.1.1 ความเท่ียงตรงเชิงเนื้อหา (Content Validity) หมายถึง เคร่ืองมือวัดและ ประเมินผลน้ันสามารถวัดได้ตรงตามเนื้อหาหรือตามหลักสูตรกาหนด และวัดได้ครบ ตามวัตถุประสงค์ที่กาหนด ซึ่งความเที่ยงตรงตามเน้ือหาถือว่าเป็นคุณสมบัติที่สาคัญที่สุด
- 131 - โดยเฉพาะอย่างยิ่งกับแบบทดสอบที่ใช้วัดผลสัมฤทธิ์ทางด้านการเรียน โดยให้ผู้เชี่ยวชาญ พิจารณาว่าข้อคาถามวัดได้ตรงกับวตั ถุประสงค์ที่ต้องการจะวดั หรือไม่ วิธีนี้เป็นการหาค่าดัชนี ความสอดคล้องระหว่างข้อคาถามกับจุดประสงค์ (Index of Item – Objective Congruence หรือ IOC) โดยใช้ผู้เชี่ยวชาญไม่น้อยกว่า 3 คน เป็นผู้พิจารณาและให้คะแนนแต่ละข้อ คือ +1, 0, -1 จากนั้นนาคะแนนผลการพิจารณาของผู้เชี่ยวชาญมาหาดัชนีความสอดคล้องระหว่าง ข้อคาถามกับจุดประสงค์โดยใช้สูตรของ ดังนี้ โรไวน์เนลลีและแฮมเบลตัน (Rowinelli and Hambleton, 1977 อ้างถึงใน พิชิต ฤทธิ์จรูญ, 2553) IOC R N เมื่อ IOC แทน ค่าดัชนคี วามสอดคล้องระหว่างขอ้ คาถามกบั จดุ ประสงค์ R แทน ผลรวมของคะแนนการพิจารณาของผเู้ ช่ยี วชาญ N แทน จานวนผเู้ ช่ยี วชาญ โดยใช้เกณฑ์การคดั เลือกข้อคาถามดงั น้ี 1) ข้อคาถามที่มีค่า IOC ต้ังแต่ 0.5 – 1.00 คัดเลือกไว้ใช้ได้ หมายถึง ข้อคาถาม มีความเหมาะสม สอดคล้องกับจดุ ประสงค์ เนือ้ หา หรอื คุณลักษณะทีต่ อ้ งการจะวัด 2) ข้อคาถามที่มีค่า IOC ต่ากว่า 0.5 ควรพิจารณาปรับปรุงหรือตัดทิ้ง หมายถึง ข้อคาถามไม่เหมาะสม และไม่สอดคล้องกับจุดประสงค์ เนื้อหา หรือคุณลักษณะที่ต้องการจะ วัด โดยมีตวั อย่างดงั นี้
- 132 - ตวั อยา่ ง การวิเคราะหค์ วามเทย่ี งตรงเชิงเนื้อหาของแบบทดสอบ แบบแสดงความคดิ เหน็ ของผเู้ ชี่ยวชาญ โดยพิจารณาความสอดคลอ้ งระหวา่ งจดุ ประสงคเ์ ชิงพฤตกิ รรมและขอ้ สอบ วิชา............................. กล่มุ สาระการเรียนรู้ ....................................................... สาหรับผเู้ รียนชนั้ …………………………. คาช้แี จง ขอความอนเุ คราะหท์ ่านผู้เชย่ี วชาญได้พจิ ารณาความสอดคล้องระหว่างจุดประสงคเ์ ชงิ พฤตกิ รรมและข้อสอบวชิ า..................... กลุ่มสาระการเรียนรู้ .................................. สาหรบั ผู้เรียนชน้ั …… โดยใส่เคร่อื งหมาย ( ✓) ลงในช่องคะแนนการพิจารณาพร้อมท้ังเขียนขอ้ เสนอแนะที่เป็นประโยชนใ์ นการ นาไปพจิ ารณาปรับปรุงตอ่ ไป โดยคะแนนการพจิ ารณามดี ังน้ี +1 หมายถงึ ข้อสอบมคี วามสอดคล้องกบั จุดประสงค์เชงิ พฤตกิ รรม 0 หมายถงึ ไมแ่ นใ่ จวา่ ข้อสอบมคี วามสอดคล้องกบั จุดประสงค์เชงิ พฤตกิ รรม - 1 หมายถงึ ข้อสอบไมม่ คี วามสอดคล้องกบั จุดประสงค์เชงิ พฤตกิ รรม เนื้อหา/ คะแนน จุดประสงคเ์ ชิงพฤติกรรม/ ขอ้ สอบ การพิจารณา ขอ้ เสนอแนะ ระดับพฤตกิ รรม +1 0 -1 สถานะของสาร 1. …………………………………………… ผู้เรียนสามารถอธิบายการ ก. ................... เปลีย่ นสถานะของสารโดยใช้ ข. ............................... แบบจาลองการเรียงอนภุ าค ค. ....................................... ของสารได้ถกู ตอ้ ง (ความ ง. ........................................ เข้าใจ) 2. …………………………………… ก. ................... ข. ............................... ค. ....................................... ง. ........................................ 3. ……… 30. ข้อเสนอแนะเพม่ิ เตมิ ..................................................................................................................................................... ……………………………………………………………………………………………………………………………………...............…………………….. ลงชือ่ ................................................................... () ผู้เช่ยี วชาญ
- 133 - หลังจากให้ผู้เชี่ยวชาญไม่น้อยกว่า 3 คน โดยพิจารณาแล้ว นาผลจากการพิจารณา มาหาค่า IOC โดยการหาค่าเฉลีย่ แล้วสรุปผลขอ้ สอบที่ใชไ้ ด้และใชไ้ ม่ได้ ดงั ตวั อย่างตอ่ ไปนี้ ตวั อย่าง การวิเคราะห์หาคา่ IOC จากแบบทดสอบ โดยผูเ้ ชีย่ วชาญจานวน 5 คน ขอ้ สอบ คะแนนการพิจารณาของผเู้ ชยี่ วชาญ จดุ ประสงค์ ขอ้ ที่ คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5 รวม คา่ เฉลี่ย สรุปผล ขอ้ ที่ 1 1 +1 +1 +1 +1 +1 5 1.00 ใชไ้ ด้ 2 +1 0 +1 0 +1 3 0.60 ใชไ้ ด้ 3 -1 0 -1 0 0 -2 -0.40 ใชไ้ มไ่ ด้ 2 4 +1 +1 +1 0 +1 4 0.80 ใชไ้ ด้ 5 0 0 0 0 0 0 0.00 ใชไ้ มไ่ ด้ กรณีการพิจารณาเคร่ืองมือวัดที่ไม่ใช่แบบทดสอบ โดยให้ผู้เชี่ยวชาญพิจารณาวิธี มาตราส่วนประมาณค่า (Rating Scale) ซึ่งนิยมทาเป็น 5 ระดับ แล้วนามาหาค่าเฉลี่ย (สมนึก ภทั ทิยธนี, 2558) โดยกาหนดเกณฑ์การพิจารณาว่าถ้าคา่ เฉลี่ยต้ังแต่ 3.51 – 5.00 ตัวอยา่ ง การวิเคราะห์ความเท่ยี งตรงเชิงเนือ้ หาของแบบวดั ดว้ ย Rating Scale แบบแสดงความคดิ เห็นของผเู้ ชี่ยวชาญ โดยพิจารณาความเหมาะสมของแบบวัดมวี นิ ยั คาช้ีแจง ขอความอนุเคราะห์ท่านผู้เช่ียวชาญได้พิจารณาความเหมาสมของข้อคาถามในแบบวัด โดยใส่ เครื่องหมาย ( ✓) ลงในช่องระดับความคิดเห็นพร้อมท้ังเขียนข้อเสนอแนะที่เป็นประโยชน์ในการนาไป พจิ ารณาปรับปรุงตอ่ ไป โดยคะแนนการพจิ ารณามีดงั นี้ 5 มากทส่ี ดุ 4 มาก 3 ปานกลาง 2 น้อย 1 นอ้ ยทีส่ ดุ นิยามของความมีวินัย ความมีวินัย หมายถึง คุณลักษณะที่แสดงออกถึงการยึดม่ันในข้อตกลง กฎเกณฑ์ และระเบียบ ข้อบงั คับของครอบครัว โรงเรียน และสงั คม ที่ ขอ้ คาถาม/รายการ ระดบั ความคิดเหน็ 54321 1 แตง่ กายถูกต้องตามระเบียบของโรงเรียน/เหมาะสมตาม กาลเทศะ 2 เข้าแถวซือ้ อาหารหรือห้องนา้ สาธารณะ 3 ทงิ้ ขยะในท่ที ีจ่ ดั เตรียมไว้ 4 ทางานเสร็จตามเวลาที่กาหนด 5 ทาตามกฎระเบียบของหอ้ งเรียน/ครอบครวั ลงชือ่ ................................................................... () ผู้เชย่ี วชาญ
- 134 - โดยกาหนดเกณฑ์การแปลผล ดงั น้ี แบบวดั มีความเหมาะสมในระดับดีเยีย่ ม 4.51 – 5.00 หมายถึง แบบวดั มีความเหมาะสมในระดบั ดีมาก 3.51 – 4.00 หมายถึง แบบวดั มีความเหมาะสมในระดบั พอใช้ 2.51 – 3.00 หมายถึง แบบวัดมีความเหมาะสมในระดับปรบั ปรุง 1.51 – 2.00 หมายถึง แบบวัดมีความเหมาะสมในระดับควรแก้ไข 1.00 – 1.50 หมายถึง 2.1.2 ความเท่ียงตรงเชิงโครงสร้าง (Construct Validity) หมายถึง การหาว่า แบบทดสอบน้ันสามารถวัดได้ตรงตามแนวคิดทฤษฎีหรอื โครงสร้างของส่งิ ทีต่ ้องการวดั เพียงใด (พิชิต ฤทธิ์จรญู , 2553; อนวุ ตั ิ คณู แก้ว, 2558) โดยมีรายละเอียดดังนี้ 1) การหาค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficients) เป็นการหาค่า สมั ประสิทธิ์สหสมั พันธ์ของคะแนน 2 ชุด เชน่ แบบทดสอบมาตรฐานกับแบบทดสอบที่สร้างขึ้น ที่วัดในเร่ืองเดียวกัน โดยสูตรการหาสัมประสิทธิ์สหสัมพันธ์ ถ้าสัมประสิทธิ์สหสัมพันธ์สูงและ มีทิศทางเดียวกัน แสดงวา่ แบบทดสอบที่สร้างข้ึน มีความเที่ยงตรงเชงิ โครงสร้าง 2) เปรียบเทียบกบั กลุ่มที่มลี ักษณะที่ต้องการวัดอย่างเด่นชดั (Known – group technique) โดยการนาเคร่ืองมือวัดที่สร้างขึ้นไปทดสอบกับกลุ่ม 2 กลุ่ม คือ กลุ่มที่มีลักษณะ ต้องการวัดอย่างเด่นชัด กับกลุ่มที่ไม่มีคุณลักษณะน้ัน ๆ แล้วนาผลที่ได้มาเปรียบเทียบกัน โดยใช้ t-test แบบ Independent ถ้าพบว่า แตกต่างกันอย่างมีนัยสาคัญทางสถิติที่ระดับ .01 หรือ .05 แสดงว่า แบบทดสอบวัดคุณลักษณะนั้นได้ น่ันคือ แบบทดสอบน้ันมีความเที่ยงตรง เชงิ โครงสร้าง 2.1.3 ความเท่ียงตรงเชิงเกณฑ์สัมพันธ์ (Criterion-Relate Validity) หมายถึง คุณสมบัติของแบบทดสอบที่สามารถวัดได้สอดคล้องสัมพันธ์ระหว่างคะแนนสอบกับคะแนน เกณฑ์ตัวหนึ่ง จาแนกได้เป็น 2 แบบ (พิชิต ฤทธิ์จรูญ, 2553 ; อัจฉรีย์ (คาแถม) พิมพิบูลย์, 2550) ดงั น้ี 1) ความเที่ยงตรงเชิงสภาพ (Concurrent Validity) หมายถึง คุณสมบัติของ แบบทดสอบที่สามารถวัดได้ตรงตามสภาพความเป็นจริงในปจั จุบัน เช่น นายกานต์ เป็นคนเก่ง คณิตศาสตร์ไม่ว่าผสู้ อนจะต้ังคาถามอย่างไร สามารถตอบคาถามผสู้ อนได้ เมื่อนาแบบทดสอบ วิชาคณิตศาสตร์มาทดสอบหลังจากเรียนจบบทเรียน ปรากฏว่าได้คะแนนสูงสุด แสดงว่า เป็นคนเก่งคณิตศาสตร์ ซึ่งตรงกับสภาพความเป็นจริงของผู้เรียนคนน้ัน แสดงว่าแบบทดสอบ ชุดน้ันมีความเทีย่ งตรงตามสภาพ
- 135 - 2) ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity) หมายถึง คุณสมบัติของ แบบทดสอบที่วัดได้ตรงกับสภาพที่เป็นจริงที่เกิดขึ้นในอนาคต เช่น แบบทดสอบวัดความถนัด ทางด้านการเรียน เม่ือนามาใช้วัดการสอบเข้าศึกษาต่อที่สถาบันการศึกษาแห่งหนึ่ง ปรากฏว่า นายกานต์ สอบคัดเลือกได้ และได้คะแนนความถนัดสูงมาก เมื่อเข้าไปศึกษาในสถาบันแห่งน้ัน ปรากฏว่าผลการเรียนอยู่ในเกณฑ์ดีเยีย่ ม แสดงวา่ แบบทดสอบมีความเทีย่ งตรงเชงิ พยากรณ์ วิธีการหาค่าความสัมพันธ์กับแบบทดสอบอื่นที่วัดเนื้อหาเดียวกันซึ่งส่วนใหญ่ ใช้เทียบกับแบบทดสอบมาตรฐานที่มีอยู่แล้ว ท้ังการหาความเที่ยงตรงเชิงโครงสร้างและความ เที่ยงตรงเชิงเกณฑ์น้ัน โดยใช้สูตรการหาค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (Pearson Product Moment) (อิทธิพนั ธ์ สวุ ทนั พรกลู , 2557; อนุวตั ิ คณู แก้ว, 2558) ดังน้ี N XY X Y r N x2 X 2 N Y 2 Y 2 เมื่อ r แทน ค่าสัมประสิทธิ์สหสัมพันธ์ N แทน จานวนผสู้ อบ X แทน คะแนนจากการสอบด้วยแบบทดสอบทีส่ รา้ งข้นึ Y แทน คะแนนจากการสอบด้วยแบบดทสอบฉบับอืน่ ที่สรา้ งไว้แลว้ ตวั อยา่ ง การหาความเที่ยงตรงเชิงเน้ือหาของแบบทดสอบวิชาภาษาอังกฤษทีค่ รูผสู้ อน สร้างข้ึนกับคะแนนทีไ่ ด้จากแบบทดสอบมาตรฐานที่นาไปทดสอบกบั ผเู้ รียนจานว 10 คน ดังน้ี คะแนนจาก คะแนนจาก คนที่ แบบทดสอบ แบบทดสอบ XY X2 Y2 ที่สรา้ งขึ้น (X) มาตรฐาน (Y) 1 25 28 700 625 784 2 32 30 960 1024 900 3 19 18 342 361 324 4 18 28 504 324 784 5 24 20 480 576 400 6 35 30 1050 1225 900 7 19 20 380 361 400 8 26 25 650 676 625 9 30 34 1020 900 1156 10 27 30 810 729 900 X = 255 Y = 263 XY =6896 X 2 =6801 Y 2 =7173
- 136 - r 106896 255263 106801 2552 107173 2632 68960 67065 68010 6502571730 69169 1895 1895 0.69 2764.88 29852561 แบบทดสอบทีค่ รูผู้สอนสร้างข้ึนและแบบทดสอบมาตรฐานมีค่าสัมประสิทธิ์สหสัมพันธ์ เท่ากับ 0.69 แสดงวา่ มีความสัมพันธ์ระดบั ค่อนขา้ งสูง และมีความเทีย่ งตรงค่อนขา้ งสงู ด้วย 3.2 การวเิ คราะห์คณุ ภาพโดยการหาค่าความเท่ยี งตรงแบบอิงเกณฑ์ 3.2.1 ความเท่ียงตรงเชิงเนื้อหา (Content Validity) แบบอิงเกณฑ์ใช้วิธีการ หาค่าความสอดล้องระหว่างข้อคาถามกับจุดประสงค์ (Index of Item – Objective Congruence หรอื IOC) เชน่ เดียวกบั การหาความเที่ยงตรงแบบอิงกลุ่ม 3.2.2 ความเท่ียงตรงเชิงโครงสร้าง (Construct Validity) แบบอิงเกณฑ์ เป็น การหาว่าผู้เรียนที่มีความรอบรู้จะทาข้อสอบข้อน้ันได้ ส่วนผู้เรียนที่ไม่มีความรอบรู้ จะทา ข้อสอบข้อน้ันไม่ได้ (อนวุ ัติ คูณแก้ว, 2558) มีวธิ ีการดังน้ี 1) วิธีของคาร์เวอร์ (Carver) วิธีการนี้จะนาแบบทดสอบไปทดสอบกับ ผู้เรียนกลุ่มที่เรียนแล้วกับกลุ่มที่ยังไม่ได้เรียน แล้วนามาหาอัตราส่วนระหว่างผลรวมของ จานวนผู้เรียนที่ยังไม่ได้เรียนที่สอบไม่ผ่านหรือไม่ผ่านเกณฑ์ กับจานวนผู้เรียนที่เรียนมาแล้ว หรอื สอบผา่ นเกณฑ์ ต่อผเู้ รียนทีส่ อบทั้งหมด มีวธิ ีการคานวณดังนี้ rcc a c N เมือ่ a แทน จานวนผเู้ รียนทีเ่ รยี นแล้วและสอบผ่านเกณฑ์ c แทน จานวนผเู้ รียนทีย่ งั ไม่ได้เรียนและสอบไม่ผา่ นเกณฑ์ N แทน จานวนผเู้ รียนทีส่ อบท้ังหมด ตวั อย่างการคานวณหาความเที่ยงตรงโดววิธีของคาร์เวอร์ โดยมีผเู้ รียนทั้งหมด 20 คน ผเู้ รียนกลุ่มที่เรียนแลว้ ผเู้ รียนกลุ่มที่ยังไม่ได้เรียน สอบผา่ นเกณฑ์ a (8) b (14) สอบไม่ผ่านเกณฑ์ d (12) c (7) rcc 87 = 0.75 20 สรุปได้วา่ แบบทดสอบฉบบั นีม้ ีความเที่ยงตรงเชงิ โครงสร้าง เท่ากับ 0.75
- 137 - 2) วิ ธี ก า ร ห า ค่ า ส ห สั ม พั น ธ์ แ บ บ ฟี (Phi-correlation) เป็ น ก า ร ห า ค่าความเที่ยงตรงเชิงโครงสร้างของความสัมพันธ์ของผู้เรียน 2 กลุ่ม คือ กลุ่มที่ยังไม่ได้รับการ สอนหรือการสอบก่อนเรียน กับกลุ่มที่ได้รับการสอนแล้วหรือการสอบหลังเรียน แล้วกาหนด เกณฑก์ ารผ่าน กบั เกณฑ์การผา่ น แล้วหาค่าสหสมั พันธ์แบบฟี มีวธิ ีการคานวณดงั นี้ ac bd a bc d a d b c เมื่อ a แทน จานวนผเู้ รียนที่สอบก่อนเรียนและ ไม่ผา่ นเกณฑ์ b แทน จานวนผเู้ รียนที่สอบหลงั เรียนและ ไม่ผา่ นเกณฑ์ c แทน จานวนผเู้ รียนที่สอบหลงั เรียนและ ผา่ นเกณฑ์ d แทน จานวนผเู้ รียนทีส่ อบก่อนเรียนและ ผา่ นเกณฑ์ ตวั อย่างการคานวณหาความเที่ยงตรงโดววิธีของฟี โดยมีผเู้ รียนท้ังหมด 20 คน ผเู้ รียนที่สอบก่อนเรยี น ผเู้ รียนทีส่ อบหลงั เรียน สอบไม่ผ่านเกณฑ์ a (18) b (5) สอบผา่ นเกณฑ์ d (2) c (15) 1815 52 18 515 218 25 15 270 10 23172020 280 395.47 0.71 สรุปได้วา่ แบบทดสอบฉบับนีม้ ีความเที่ยงตรงเชงิ โครงสร้าง เท่ากบั 0.71 3.3 ปัจจัยท่ีมีผลต่อความเท่ียงตรง ซึ่งความเที่ยงตรงของเคร่ืองมือวัดและ ประเมินผลการเรียนรู้อาจะมีการเปลี่ยนแปลงความคลาดเคลื่อนอันเน่ืองมาจากปัจจัย หลายประการ (อิทธิพทั ธ์ สุวทนั พรกูล, 2557) ดงั น้ี 1) การเขียนคาชี้แจงไม่ชัดเจน ทาให้ผู้เรียนเกิดความสับสนหรือเข้าใจผดิ ดังนั้น คะแนนทีไ่ ด้อาจะได้คะแนนไม่ดี ทั้ง ๆ ที่มคี วามรใู้ นเน้ือหาเพียงแต่ไมเ่ ข้าใจเรื่องคาชแี้ จงเท่านั้น 2) การใช้ภาษาที่ไม่เหมาะสม เช่น ภาษากากวม เข้าใจยาก ไม่เหมาะสมกับ ระดบั ของผู้เรยี น ทาให้ไม่เข้าข้อคาถามหรือสถานการณท์ ี่กาหนดให้ 3) ข้อสอบไม่สอดคล้องกับจุดประสงค์ เพราะไม่ได้วัดตามจุดมุ่งหมายของ การจัดการเรียนรู้อย่างแท้จริง เช่น ต้องการวัดการวิเคราะห์ แต่คาถามวัดความรู้ความเข้าใจ จะทาให้ความเทีย่ งตรงนอ้ ยลง
- 138 - 4. การวิเคราะหค์ ุณภาพโดยการหาคา่ ความเชือ่ ม่นั การหาค่าความเชื่อมั่น เป็นการวัดความคงเส้นคงวาของเคร่ืองมือ ดังการทดสอบ 3 คร้ัง ดังภาพที่ 8.2 การทดสอบคร้ังที่ 1 นาย B ได้ลาดับที่ 1 นาย A ได้ลาดับที่ 2 และนาย C ได้ ลาดับที่ 3 และในคร้ังที่ 2,3 ผลการทดสอบก็ยงั คงมีลาดบั ทีค่ ล้าย ๆ กนั ดงั ภาพต่อไปนี้ คร้ังที่ 1 ครั้งที่ 2 ครั้งที่ 3 ภาพที่ 8.2 แสดงผลการทดสอบจากการใชเ้ คร่อื งมอื ที่มีความเช่ือมัน่ ทีม่ า : สมชาย รัตนทองคา, 2554 4.1 การวเิ คราะห์คุณภาพโดยการหาค่าความเชื่อม่ันแบบอิงกลุ่ม การหาค่าความเชือ่ ม่นั มอี ยู่หลายวิธีดงั ต่อไปนี้ 1) วิธีการทดสอบซ้า (Test-Retest Method) วิธีนี้ทาได้โดยใช้แบบทดสอบชุดเดิม ทดสอบซ้ากับกลุ่มตัวอย่างเดิม 2 คร้ัง โดยเว้นระยะเวลาให้ห่างกันไม่น้อยกว่า 1 สัปดาห์ การปฏิบัติโดยท่ัวไปนิยมเว้นระยะประมาณ 2 สัปดาห์ และนาคะแนนการสอบท้ัง 2 ชุดมาหา ค่าสัมประสิทธิ์สหสัมพันธ์ ซึ่งค่าที่คานวณได้เรียกว่า สัมประสิทธิ์ ของความคงที่ (Coefficient of Stability) มีสูตรดงั น้ี (พิชิต ฤทธิ์จรญู , 2553) r N XY X Y N X 2 X 2 N Y 2 Y 2 เมือ่ r แทน สัมประสิทธิข์ องความคงที่ (ความเชื่อมั่นของแบบทดสอบ) N แทน จานวนผเู้ ข้าสอบ X แทน คะแนนจากการสอบคร้ังที่ 1 Y แทน คะแนนจากการสอบครั้งที่ 2 ข้อจากัดของวิธีนี้คือการสอบที่มากกว่า 1 ครั้ง ผู้เข้าสอบอาจมีโอกาสฝึกหัด หรือเรียนรู้เพิ่มขึ้น อาจมีผลให้เกิดความเคลื่อนในการสอบคร้ังที่ 2 ได้ และหากเว้นระยะเวลา ระหว่างครง้ั ที่ 1 กับคร้ังที่ 2 นานเกินไป จะทาให้ค่าสัมประสิทธิข์ องความคงทีล่ ดลง
- 139 - 2) วิธีใช้แบบทดสอบคู่ขนาน (Equivalent Form or Parallel Form) วิธีนีใ้ ช้กลุ่มผู้สอบ กลุ่มเดียวกันตอบแบบทดสอบ 2 ชุดในเวลาใกล้เคียงกัน โดยที่แบบทดสอบ 2 ชุดนี้ มีลักษณะเป็นคู่ขนานกัน วัดในเร่ืองเดียวกัน จานวนข้อเท่ากัน ความยากเท่ากัน คะแนนเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานเท่ากัน แล้วนาคะแนนทั้ง 2 ชุด มาหาค่าสัมประสิทธิ์สหสัมพนั ธ์ 3) วิธีทดสอบแบบแบ่งครึ่ง (Split-Half Method) วิธีนี้ยึดหลักการเช่นเดียวกันกับ การใช้แบบทดสอบคู่ขนาน แต่ที่จัดว่าเป็นความคงที่ภายใน เพราะทดสอบเพียงครั้งเดียวแล้ว แบ่งข้อสอบคู่ออกเป็น 2 ส่วนโดยถือว่าข้อสอบท้ัง 2 ส่วนนั้นวัดในสิ่งเดียวกัน โดยผู้สร้าง พยายามสร้างข้อสอบทั้ง 2 ส่วน ให้เป็นคู่ขนาน วิธีโดยท่ัว ๆ ไปอาจแบ่งเป็นข้อคู่กับข้อคี่หรือ แบ่งคะแนนเป็นชุดครึ่งแรก (50% แรก) กับชุดครึ่งหลัง (50% หลัง) หรือแบ่งคะแนนเป็น 4 ส่วนและนา 2 ส่วนมารวมเป็น 1 ชุด ได้ท้ังหมด 2 ชุด เม่ือได้คะแนน 2 ชุดแล้วจึงนาไปหาค่า สัมประสิทธิค์ วามเชอ่ื ม่นั โดยใช้เทคนิควิธีใดวิธีหนึ่งต่อไป 3.1) เทคนิควิธีของสเปียร์แมน บราวน์ (Spearman Brown) โดยใช้สูตร ดังนี้ (Guilford, 1965 อ้างถึงใน พิชิต ฤทธิ์จรญู , 2553) rxx 2rhh 1 rhh เมือ่ rxx แทน สัมประสิทธิค์ วามเชอ่ื ม่ันของแบบทดสอบทั้งฉบบั rhh แทน สมั ประสิทธิ์สหสัมพันธ์ระหว่างคะแนน 2 ชุด (สัมประสิทธิค์ วามเชอ่ื ม่ันของแบบทดสอบครึ่งฉบับ) เทคนิควิธีนี้ต้องหาสัมประสิทธิ์สหสัมพันธ์ของคะแนน 2 ชดุ ก่อน ซึ่งเป็นค่าสมั ประสิทธิ์ ความเช่ือมั่นของแบบทดสอบครึ่งฉบับแล้วจงึ นาไปขยายให้เปน็ ค่าสัมประสิทธิ์ความเช่อื มั่นของ แบบทดสอบท้ังฉบบั 3.2) เทคนิควิธีของกัตแมน (Guttman) โดยใช้สูตรดงั นี้ r S12 S22 21 St2 เมื่อ r แทน สมั ประสิทธิ์ความเชอ่ื มั่นของแบบทดสอบ S12 แทน ความแปรปรวนของคะแนนชุดแรก S22 แทน ความแปรปรวนของคะแนนชุดหลงั St2 แทน ความแปรปรวนของคะแนนรวมทั้ง 2 ชดุ 4) วิธีของครอนบาค (Cronbach) ใช้กับแบบทดสอบหรือเคร่ืองมือวัดให้คะแนน แบบเรียงอันดับ หรือมาตราส่วนประมาณค่า (Rating Scale) หรือเคร่ืองมือที่ตรวจให้คะแนน ไม่เปน็ แบบ 0-1 วิธีนเี้ รียกว่า การหาค่าสัมประสิทธิ์แอลฟา ( ) ดงั น้ี
- 140 - Si2 n 1 St2 n 1 เมือ่ แทนสัมประสิทธิค์ วามเช่อื ม่นั n แทนจานวนข้อสอบ Si2 แทน ผลรวมของความแปรปรวนของคะแนนในแต่ละข้อ St2 แทน ความแปรปรวนของคะแนนรวมท้ังฉบับ 5) วิธีของคูเดอร์-ริชาร์ดสัน (Kuder - Richardson) เป็นวิธีที่นิยมใช้กันมาก เนื่องจากทดสอบกับกลุ่มตัวอย่างเพียงครั้งเดียว โดยมีข้อตกลงว่าแบบทดสอบฉบับน้ันจะต้อง วัดลักษณะเดียวหรือวัดองค์ประกอบร่วมกัน มีความยากเท่ากัน และมีระบบการให้คะแนน เป็นสองค่า (Dichotomous) คือ ตอบถูกให้ 1 คะแนน ตอบผิดให้ 0 คะแนน มีวิธีการคานวณ จาก 2 สตู รคือ KR – 20 และ KR – 21 ดงั น้ี 4.1) สตู ร KR – 20 rtt n pq 1 n 1 S2 เมือ่ rtt แทน สมั ประสิทธิ์ความเช่อื มั่นของแบบทดสอบ n แทน จานวนข้อสอบ S2 แทน ความแปรปรวนของคะแนนรวมทั้งฉบับ p แทน สดั ส่วนของคนทาถกู ในแต่ละข้อ q แทน สดั ส่วนของคนทาผิดในแตล่ ะขอ้ ( ) 4.2) สตู ร KR – 21 rtt n x(n x) 1 n 1 nS 2 เมื่อ rtt แทน สมั ประสิทธิ์ความเชอ่ื มั่นของแบบทดสอบ n แทน จานวนข้อสอบ x แทน ค่าเฉลี่ยของคะแนนทั้งฉบบั S2 แทน ความแปรปรวนของคะแนนรวมทั้งฉบบั โดย S2 N x2 x2 N N 1
- 141 - โดยท่ัวไปนิยมใช้สูตร KR – 21 มากกว่าเพราะใช้ง่าย รวดเร็ว มีข้ันตอนการคานวณ ที่น้อยกว่า แต่ค่าที่ได้จะต่ากว่าคานวณจากสูตร KR – 20 เนื่องจากสูตร KR – 21 สมมติ ให้ข้อสอบทุกข้อมีระดับความยากเท่ากัน หรอื ค่า P คงที่ โดยเกณฑ์การพิจารณาค่าความเชื่อมั่นที่เหมาะสมอยู่ระหว่าง 0.50 – 1.00 ตัวอย่างการวิเคราะหค์ ่าความเชื่อมั่นของแบบทดสอบโดยใช้สูตร KR-20 โดยใช้ในกรณีที่สอบคร้ังเดียว (หลังเรียน) และจานวนผู้เรียนมีมากกว่า 20 คน ซึง่ แบบทดสอบมี 5 ข้อแบบปรนยั เลือกตอบที่ให้คะแนน 1,0 โดยมีผู้เข้าสอบจานวน 5 คน ดงั น้ี คนที่ 1 ข้อที่ 5 X 2 234 X 1 1 1 1 1 1 5 25 2 1 1 1 1 0 4 16 3101 1039 4100001 1 501 10139 Ʃ 4 3 4 3 2 16 60 p 0.80 0.60 0.80 0.60 0.40 q 0.20 0.40 0.20 0.40 0.60 pq 0.16 0.24 0.16 0.24 0.24 Ʃpq = 1.04 S2 560 162 300 256 2.20 55 1 20 rtt 5 5 1 1 1.04 2.20 5 1 0.47 4 1.25 0.53 0.66 สรปุ ได้วา่ แบบทดสอบมีความเช่อื มั่น เท่ากับ 0.66 หมายถึง แบบทดสอบนีม้ ีความเหมาะสม
- 142 - 4.2 การวเิ คราะห์คุณภาพโดยการหาค่าความเชื่อม่นั แบบอิงเกณฑ์ การหาค่าความเชอ่ื มนั่ แบบอิงเกณฑ์มีอยู่หลายวิธีดังต่อไปนี้ 1) ค วาม เชื่ อ ม่ั น แบ บ ห าค วาม ค งที่ ข อ งค วาม รู้ (Stability Reliability) โด ย นาแบบทดสอบมาสอบซ้า 2 คร้ัง แล้วนาคะแนนมาหาความคงที่ของการรอบรู้ และไม่รอบรู้ ที่ได้จากการกาหนดคะแนนจุดตัดที่เหมาะสม มีคานวณโดยใช้สูตรของชรอคและคอสแคร์ลี (Shrock and Cosarelli) (พิชิต ฤทธิจ์ รญู , 2553) AD BC A BC DA CB D เมือ่ แทน สัมประสิทธิ์ความเช่อื มั่นของแบบทดสอบ A แทน จานวนคนที่สอบผา่ น จากการทดสอบท้ัง 2 ครั้ง B แทน จานวนคนทีส่ อบไม่ผ่าน ครั้งที่ 1 แตส่ อบผา่ นในคร้ังที่ 2 C แทน จานวนคนทีส่ อบผา่ น ครั้งที่ 1 แตไ่ ม่ผ่านในคร้ังที่ 2 D แทน จานวนคนทีส่ อบไม่ผ่าน จากการทดสอบท้ัง 2 ครั้ง 2) ความเชื่อมั่นแบบ ความสอดคล้องของคะแนนแต่ละคนที่แปรป รวน ไปจากคะแนนจุดตัด โดยใช้แบบทดสอบ 1 ฉบับ ทดสอบกับผู้เรียน 1 กลุ่มคร้ังเดียว (สมนึก ภัททิยธนี, 2558) ดังน้ี 2.1 วิธีของลวิ ิงสตัน (Livingston Method) rcc rtt S 2 x C 2 S2 xC 2 เมื่อ rcc แทน ความเชื่อมั่นของแบบทดสอบอิงเกณฑ์ แทน ความเชือ่ ม่นั ของแบบทดสอบซึง่ คานวณโดยวิธี KR-20 rtt หรอื KR-21 S2 แทน ความแปรปรวนของคะแนนสอบ x แทน ค่าเฉลี่ยของคะแนนสอบ แทน คะแนนเกณฑ์ (ควรใหเ้ กณฑก์ ารผ่าน 60%-80%) C
- 143 - 2.2 วิธีของโลเวทท์ (Lovett Method) rcc1 n xi xi2 n 1 xi C2 เมือ่ rcc แทน ความเชือ่ มนั่ ของแบบทดสอบอิงเกณฑ์ n แทน จานวนข้อของแบบทดสอบท้ังฉบับ xi แทน คแนนสอบของผเู้ รียนแตล่ ะคน C แทน คะแนนจดุ ตัด 4.3 ปจั จยั ทม่ี ีผลตอ่ ความเชือ่ มัน่ ของแบบทดสอบ 1) ข้อสอบทีม่ จี านวนมากย่อมมีความเชอ่ื มน่ั สูง 2) ข้อสอบที่ยากหรือง่ายเกินไป จะมีคา่ ความเช่อื ม่นั ต่า 3) ถ้ากลุ่มผู้สอบมีความสามารถไม่แตกต่างกัน ค่าความเชื่อม่ันจะต่า ถ้ากลุ่ม ผสู้ อบมีความสามารถแตกต่างกัน (ความแปรปรวนภายในกลุ่มสูง) จะทาให้ความเชื่อม่ันสงู 4.4 ความสมั พนั ธร์ ะหวา่ งความเทย่ี งตรงกับความเชือ่ มัน่ ภาพที่ 1 ภาพที่ 2 ภาพที่ 3 ภาพที่ 4 ภาพที่ 5 ไมม่ คี วามเทีย่ งตรง ความเทีย่ งตรง ความเทีย่ งตรงตา่ ความเทีย่ งตรงต่า ความเทีย่ งตรงสงู ปานกลาง ไมม่ คี วามเช่อื ม่นั มคี วามเชอ่ื มน่ั มคี วามเชอ่ื มัน่ มคี วามเชอ่ื มนั่ สงู ความเชอ่ื มนั่ สูง ปานกลาง ภาพที่ 8.2 แสดงความสัมพนั ธ์ระหว่างความเที่ยงตรงกับความเชือ่ ม่นั ทีม่ า: Fraenkel and Wallen, 1993 จากแต่ละภาพสามเหลี่ยมแทนคะแนนในการทดสอบจุดดาแทนข้อมูลที่ต้องการจะวัด และประเมินผล จะเห็นได้ว่าสามเหลี่ยมที่อยู่เป็นกระจุกเดียวกัน นั่นหมายถึง คะแนนของ ผู้เรียนจากการทดสอบด้วยแบบสอบเดิม ซึ่งเม่ือสอบกี่ครั้งก็ตาม คะแนนที่ได้จะได้ใกล้เคียง หรอื เท่าเดิม จะทาให้ค่าความเชือ่ มัน่ สูง ดังรูปที่ 4 และรูปที่ 5 แตเ่ มื่อสังเกตความเทีย่ งตรง ให้พจิ ารณาว่าผลการสอบแต่ละคร้ังเข้าใกล้จุดดา (ข้อมูล ทีต่ อ้ งการหรอื ไม่) หากเข้าใกล้ นน่ั หมายถึง แบบทดสอบหรอื เครือ่ งมือมีความเทีย่ งตรงสูง
- 144 - 5. การวิเคราะหค์ ณุ ภาพโดยการหาคา่ ความยากและอานาจจาแนก ความยาก (Power of Difficulty) และอานาจจาแนก (Discrimination) เป็นการหา คุณภาพของแบบทดสอบ มีรายละเอียดดงั นี้ (พิชิต ฤทธิจ์ รูญ, 2553) 5.1 การวเิ คราะหค์ ุณภาพโดยการหาค่าความยากและอานาจจาแนกแบบอิงกลุ่ม 5.1.1 ความยากของข้อสอบ (p) หมายถึง จานวนร้อยละหรือสัดส่วนของ คนทีต่ อบถูกในแตล่ ะข้อนนั้ เมอ่ื เปรียบเทียบกบั จานวนคนทั้งหมดทีท่ าขอ้ สอบในแต่ละข้อ (พิชิต ฤทธิ์จรูญ, 2553) มีวธิ ีการคานวณดงั นี้ P PH PL 2n เมื่อ P แทน คา่ ความยาก PH แทน จานวนคนที่ตอบถูกในกลุ่มสูง PL แทน จานวนคนทีต่ อบถูกในกลุ่มตา่ n แทน จานวนคนในกลุ่มสูงหรือกลุ่มตา่ เกณฑใ์ นการพิจารณาค่าความยากมีค่าตั้งแต่ 0.00 ถึง 1.00 โดยทัว่ ไปข้อสอบ ที่มคี วามยากพอเหมาะควรมีค่าความยากต้ังแต่ 0.20 – 0.80 ซึง่ มีรายละเอียดดงั นี้ 0.80 P 1.00 แสดงว่า เปน็ ข้อสอบง่ายมากควรตดั ทิง้ หรอื ปรับปรงุ 0.60 P 0.80 แสดงว่า เปน็ ข้อสอบค่อนข้างง่าย (ดี) 0.40 P 0.60 แสดงว่า เปน็ ข้อสอบยากงา่ ย ปานกลาง (ดีมาก) 0.20 P 0.40 แสดงว่า เป็นข้อสอบค่อนข้างยาก (ดี) 0.00 P 0.20 แสดงว่า เปน็ ข้อสอบยากมาก ควรตัดทิ้งหรอื ปรบั ปรุง ถ้าข้อสอบข้อใดมีผู้ตอบถูกหมด แสดงว่า ข้อนั้นง่ายมาก มีค่า P = 1.00 แต่ถ้า ข้อสอบข้อใดมีผู้ตอบผิดหมด แสดงว่าข้อนั้นยากมาก มีค่า P = 0.00 ซึ่งในแบบทดสอบวัดผล สมั ฤทธิ์ Ebel (1965) เสนอให้ใช้ค่า P โดยเฉลีย่ ประมาณ 0.50 เพราะเปน็ ค่า P ที่ทาใหก้ ารแจก แจงความถี่ของคะแนนมีโอกาสสูงสุดที่จะเป็นการแจกแจงปกติ แต่การสร้างคาถามให้มีค่า P ใกล้เคียง 0.50 เป็นสิ่งที่ทาได้ยาก จึงนิยมกาหนดให้ค่า P ในแบบทดสอบอยู่ระหว่าง 0.30 – 0.70 ในกรณีที่เป็นแบบทดสอบที่ใช้คัดเลือกบุคคลเข้าทางานหรือเข้าศึกษาต่อ ค่า P หรือ ค่าความยากขอข้อสอบนี้จะต้องเพิ่มขึ้น เพื่อให้ได้บุคคลที่มีความสามารถสูงตามที่ต้องการ (สุวิมล ติรกานันท์, 2550) และในกรณีที่เป็นแบบทดสอบวัดความรู้ความเข้าใจทั่วไปที่ใช้วัด
- 145 - ความรู้ที่ประชาชนควรทราบ เช่น ความรู้ในการรักษาสุขภาพอนามัย อาจไม่จาเป็นต้อง คานึงถึงค่า P เพราะคุณภาพที่สาคัญของแบบทดสอบชนิดนี้ คือ ความตรงเชิงเน้ือหา เนื่องจากลักษณะของความรู้เหล่านี้เป็นความรู้ที่ประชาชนควรทราบแม้จะเป็นเร่ืองง่าย ๆ ก็ตาม 5.1.2 อานาจจาแนกของข้อสอบ (D,r) หมายถึง ประสิทธิภาพของขอ้ สอบ ในการ แบ่งผู้สอบออกเป็นสองกลุ่ม คือกลุ่มที่ได้คะแนนสูงหรือกลุ่มเก่งกับกลุ่มที่ได้คะแนนต่าหรือ กลุ่มออ่ น ค่าความยากและค่าอานาจจาแนกของข้อสอบ คานวณได้จากสูตรตอ่ ไปนี้ r PH PL n เมื่อ r แทน ค่าอานาจจาแนก PH แทน จานวนคนที่ตอบถกู ในกลุ่มสูง PL แทน จานวนคนที่ตอบถูกในกลุ่มตา่ n แทน จานวนคนในกลุ่มสูงหรือกลุ่มต่า เกณฑใ์ นการพิจารณาค่าอานาจจาแนก ค่าอานาจจาแนกมีค่าตั้งแต่ -1.00 ถึง +1.00 ข้อสอบที่ดีควรมีค่าอานาจ จาแนกต้ังแต่ 0.20 ขึน้ ไป สว่ นค่าอื่น ๆ มีความหมายดงั นี้ .40 r 1.00 แสดงวา่ จาแนกได้ดีเป็นข้อสอบที่ดี .30 r .39 แสดงวา่ จาแนกได้ทีด่ ีพอสมควรเป็นข้อสอบต้องปรบั ปรงุ บ้าง .20 r .29 แสดงวา่ จาแนกพอใช้ได้แต่ตอ้ งปรับปรงุ ถ้า r มีค่าเป็นลบหรือน้อยกว่า 0 แสดงว่า ข้อสอบข้อน้ันจาแนกกลับ คือ คนเก่งทาไม่ได้คนอ่อนทาได้ (กลุ่มเก่งตอบผิดมากกว่ากลุ่มอ่อน) ต้องปรับปรุงใหม่หรือตัดทิ้ง (พิชิต ฤทธิ์จรูญ, 2553) หรือค่าอานาจจาแนกเท่ากับ 0 หมายความว่า กลุ่มคนเก่งและ คนอ่อนตอบถูกเท่ากัน เทคนิคการวิเคราะห์ข้อสอบของผู้เรียนที่มีคะแนนในกลุ่มสูงและคะแนนในกลุ่มต่า โดยใช้เกณฑ์ 27% 33% 50% ของผเู้ รียนแต่ละกลุ่มตามความเหมาะสม หากเป็นกลุ่มใหญ่ที่มี จานวนมาก ควรใช้เทคนิค 27% หรอื 33% หากกลุ่มผู้เรียนจานวนน้อยควรใช้ 50% (อิทธิพทั ธ์ สุวทันพรกูล, 2557) ซึ่งการวิเคราะห์ค่าอานาจจาแนก โดยใช้เทคนิค 27% 33% และ 50% เปน็ การวิเคราะห์โดยเรียงคะแนนจากคะแนนสูงสุดไปยังคะแนนต่าสุด จากนั้นนาคะแนนกลุ่มที่ ได้คะแนนสูง 27% 33% 50% และกลุ่มที่ได้คะแนนต่า 27% 33% 50% มาคานวณค่าอานาจ
- 146 - จาแนก ทาไมถึงต้องเป็น 27% เนื่องจากนักสถิติได้พิจารณ าแล้วว่า ตัวเลข 27% นี้ เป็นจุดสมดุลที่เหมาะสมระหว่างความสามารถในการจาแนกกับความเชื่อม่ัน การใช้คะแนน กลุ่มคะแนนสูงและคะแนนต่าจานวนต่าว่า 27% ทาให้ความเช่ือมั่นต่า แต่ถ้าใช้กลุ่มคะแนนสูง และคะแนนต่าจานวนสูงกว่า ดังน้ัน จึงต้องใช้จานวนคนในแต่ละกลุ่มให้เกิดความสมดุล ระหว่างอานาจจาแนกกับความเช่ือม่ัน (Kelly, 1939) แต่ในกรณีที่ครูผู้สอนนาข้อสอบไปใช้กับ ผเู้ รียนจานวนน้อยกว่า 100 คน ก็สามารถใช้เทคนิคการวเิ คราะหค์ ่าอานาจจาแนก 50% ได้ เทคนิคการวิเคราะห์ข้อสอบเหมาะกับข้อสอบที่ทุกข้อให้คะแนน 0 เม่ือตอบผิดและ 1 เม่ือตอบถูก เช่น ข้อสอบวัดผลสัมฤทธิ์ทางการเรียน (สุวิมล ติรกานันท์, 2550) จะใช้กับ แบบทดสอบแบบจับคู่ไม่ได้ เพราะโอกาสในการตอบถูกของข้อสอบแต่ละข้อไม่เท่ากับ และ ข้อสอบทีม่ คี าตอบถูกมากกว่า 1 ข้อก็ใชว้ ิธีการน้ีไม่ได้เพราะลักษณะคาตอบไม่เหมาะกบั สูตร 5.1.3 การคัดเลือกข้อสอบ ข้อสอบที่สามารถนาไปใช้ได้ คือ ข้อสอบที่มี ค่าความยาก (p) อยู่ระหว่าง 0.20 – 0.80 และค่าอานาจจาแนก (r) อยู่ระหว่าง 0.20 – 1.00 โดยต้องพิจารณาท้ังสองค่านี้ควบคู่กัน นั่นคือ ข้อสอบที่ใช้ได้ต้องมีค่าความยากและอานาจ จาแนกเป็นไปตามเกณฑ์ที่กาหนดทั้งสองค่า หากข้อสอบข้อนั้นมีเพียงค่าใดค่าหนึ่งที่ไม่อยู่ ในเกณฑ์ที่กาหนด ถือว่าข้อสอบนั้นใชไ้ ม่ได้ 5.1.4 ข้นั ตอนการวิเคราะห์คา่ ความยากและอานาจจาแนก มีดังนี้ 1) นาข้อสอบมาตรวจให้คะแนน หากผู้เรียนตอบถูกได้ 1 คะแนน ตอบผิด หรอื ไม่ตอบได้ 0 คะแนน 2) เรียงลาดบั คะแนนจากคะแนนสูงสดุ ไปยงั คะแนนต่าสดุ 3) ระบุกลุ่มคะแนนสูงและกลุ่มคะแนนต่า โดยตัวอย่างนี้หากเป็นกรณี ที่ครูผู้สอนนาข้อสอบไปทดลองใช้กับผู้เรียนจานวนน้อยกว่า 100 คน จะใช้เทคนิค 50% โดย กลุ่มสูงนับจากคนที่คะแนนสูงสุดลงมาประมาณ 50% ของคนท้ังหมด เช่น ถ้ามีผู้เรียนจานวน 40 คน ดังน้ัน 50% ของ 40 คือ 20 คน ส่วนกลุ่มต่านับจากคนที่คะแนนต่าสุดขึ้นมาในจานวน ที่เท่ากับกลุ่มสูง ซึ่งเทคนิค 50% จะใช้ได้ดีในกรณีที่ผู้เรียนมีจานวนเป็นเลขคู่ จะสามารถ แบ่งกลุ่มที่มีคะแนนกลุ่มสูงและคะแนนกลุ่มต่าได้เท่า ๆ กัน แต่ในกรณีที่ผู้เรียนมีจานวนที่เป็น เลขคี่ เช่น 41 หากต้องการใช้เทคนิค 50% ใช้วธิ ีการเดียวกันคือนับจากคนทีค่ ะแนนสงู สุดลงมา 50% และกลุ่มคะแนนต่าก็นับจากคนที่คะแนนต่าสุดขึ้นมาในจานวนที่เท่ากับกลุ่มสูง จะสังเกต ได้ว่าจะมีอยู่ 1 คน ที่ไม่ได้อยู่ในกลุ่มคะแนนสูงหรือคะแนนต่าเลย ให้นาผลคะแนนของผู้เรียน คนนีอ้ อก เพื่อให้กลุ่มคะแนนสงู และคะแนนตา่ มีจานวนที่เท่ากัน อย่างละ 50% 4) ในกลุ่มสูงและกลุ่มตา่ ให้นบั จานวนผเู้ รียนทีต่ อบถูกในข้อนน้ั ๆ ดงั น้ี
- 147 - ผ้เู รียน คะแนน 1 ขอ้ สอบ 5 ผูเ้ รียน คะแนน 1 ข้อสอบ 5 กลุ่มสูง รวม 234 กลุม่ ต่า รวม 234 คนที่ คนที่ 1 5 1 1 1 1 1 1 2 10100 2 5 1 1 1 1 1 2 2 00101 3 4 1 1 1 1 0 3 2 10100 4 4 1 1 1 10 4 2 00101 5 4 1 1 01 1 5 2 10100 6 4 1 101 1 6 2 00101 7 4 1 1 01 1 7 2 10100 8 4 1 1 1 1 0 8 2 10100 9 4 1 1 1 10 9 2 001 10 10 4 1 1 1 1 0 10 2 0 0 1 1 0 11 4 1 1 1 0 1 11 2 1 0 1 0 0 12 4 1 1 1 1 0 12 2 0 0 1 1 0 13 3 1 1 1 0 1 13 2 1 0 1 0 0 14 3 1 1 0 0 1 14 2 0 0 1 0 1 15 3 1 1 0 0 1 15 2 1 0 0 0 1 16 3 1 1 0 0 1 16 2 1 0 0 0 1 17 3 1 1 0 0 1 17 2 0 0 1 0 1 18 2 1 1 0 0 0 18 2 0 0 1 0 1 19 2 1 1 0 0 0 19 2 1 0 1 0 0 20 2 1 1 0 0 0 20 2 0 0 0 1 1 รวม (PH) 20 20 9 11 11 รวม (PL) 10 0 17 4 9 5. คานวณสัดส่วนผู้เรียนที่ตอบถูกในกลุ่มคะแนนสูง ( PH ) และสัดส่วนผู้เรียนที่ตอบ ถูกในกลุ่มคะแนนต่า ( PL ) 6. คานวณค่าความยากงา่ ยด้วยสัดส่วนผู้เรียนกลุ่มคะแนนสูงที่ตอบถูกบวกกับผู้เรียน กลุ่มคะแนนต่าที่ตอบถูก แล้วนามาหารจานวนผู้เรียนทีอ่ ยู่ในกลุ่มคะแนนสูงและกลุ่มคะแนนต่า ที่เท่ากันคูณด้วยสอง
- 148 - 7. คานวณค่าอานาจจาแนกด้วยสัดส่วนผู้เรียนกลุ่มคะแนนสงู ที่ตอบลบบวกกับผู้เรียน กลุ่มคะแนนต่าที่ตอบถูก แล้วนามาหารจานวนผู้เรียนที่อยู่ในกลุ่มคะแนนสูงและกลุ่มคะแนนต่า ทีเ่ ท่ากัน ดงั ตัวอย่างต่อไปนี้ มีผู้เรยี นท้ังหมด 40 คน ใช้เทคนิค 50% ในการแบ่งกลุ่มคะแนนสูงและกลุ่มคะแนนต่า (โดยจา่ นวนในกลุ่มสงู และกลุ่มตา่ กลุ่มละ 20 คน) ขอ้ ที่ 1 2 3 4 5 จานวนคนในกลุม่ สูง 20 20 9 11 11 ท่ตี อบถูก (P ) H จานวนคนในกลมุ่ ต่า 10 0 17 4 9 ทต่ี อบถกู (P ) L P PH PL 20 10 20 0 9 17 11 4 11 9 2n 2(20) 2(20) 2(20) 2(20) 2(20) คา่ ความยาก (P) 0.75 0.50 0.65 0.38 0.50 แปลผล ค่อนขา้ ง ยากง่าย ค่อนขา้ ง ค่อนขา้ ง ยากง่าย งา่ ย ปานกลาง งา่ ย ยาก ปานกลาง r PH PL 20 10 20 0 9 17 11 4 11 9 n 20 20 20 20 20 ค่าอานาจจาแนก (r) 0.50 1.00 -0.40 0.35 0.10 แปลผล จาแนก จาแนก จาแนก จาแนก จาแนก ได้ดี ได้ดี กลบั พอใช้ได้ ไม่ได้ สรปุ ผล (ข้อสอบ) ใช้ได้ ใช้ได้ ใช้ได้ ใช้ได้ ใช้ไม่ได้ 3.2 การวเิ คราะห์คณุ ภาพโดยการหาค่าความยากและอานาจจาแนกแบบอิงเกณฑ์ 3.2.1 การหาดัชนคี วามไวและขอ้ สอบ (Sensitivity Index) ค่าความไว (S) หมายถึง ค่าที่บอกถึงความสามารถของข้อสอบในการ จาแนกความแตกต่างของผู้ที่รอบรู้หรือได้รับประสบการณ์ การจัดการเรียนรู้แล้ว กับผู้ที่ ไม่รอบรู้หรอื ก่อนได้รบั ประสบการณ์ (อิทธิพัทธ์ สุวทันพรกูล, 2557) มีวธิ ีคานวณดงั น้ี
- 149 - S Rpost Rpre N เมื่อ S แทน ดัชนคี วามไว Rpost แทน จานวนคนตอบถูกหลงั เรยี น (กลุ่มทีร่ อบรู้) Rpre แทน จานวนคนตอบถูกก่อนเรียน (กลุ่มทีไ่ ม่รอบรู้) N แทน จานวนคนสอบทั้งหมด เกณฑใ์ นการพิจารณาดัชนคี วามไว มีดังนี้ ค่าความไว (S) ความหมาย มากกว่า 0.50 ความไวสงู ผเู้ รียนทาข้อสอบได้เพิ่มข้ึนจากก่อนเรยี น 0.01 - 0.50 ความไวปานกลาง หลังเรยี นมีผู้ทาขอ้ สอบเพิ่มขนึ้ จากก่อนเรียนเปน็ จานวนไม่มาก น้อยกว่า ความไวต่า ก่อนเรียนมีผู้ทาขอ้ สอบมากกว่าหลังเรยี น หรอื เท่ากับ 0 ตัวอย่างการหาค่าความไว ข้อสอบข้อหนึ่งมีผู้สอบทาข้อสอบ 20 คน ก่อนเรียนมีผู้สอบทาถูก 12 คน หลังเรียน มีผู้สอบทาถกู 18 คน มีความไวเท่าใด S 18 12 = 0.30 20 สรปุ ได้วา่ ข้อสอบข้อนมี้ ีค่าความไวเท่ากบั 0.30 มีความไวปานกลาง ซึ่งค่าดัชนีความไวของข้อสอบเป็นบวก (+) แสดงว่าหลังเรียนตอบถูกมากกว่าก่อน เรียน แต่ในทางกลับกันค่าดัชนีความไวของข้อสอบเป็นลบ (-) แสดงว่าหลังกเรียนตอบถกู น้อย กว่าก่อนเรียน และหากดัชนีความไวมีค่าเท่ากับศูนย์ (0) แสดงว่าหลังเรียนและก่อนเรียนตอบ ถกู เท่ากัน โดยข้อสอบแบบอิงเกณฑ์ควรมีความไวของข้อสอบ ตั้งแต่ 0.40 ขึน้ ไป 3.2.2 วิธีของเบรนนอน (Brennan) เป็นวิธีการหาอานาจจาแนกจากผลการสอบ คร้ังเดียว (หลังเรียน) (สมนึก ภัททิยธนี, 2558) แบ่งผู้เรียนออกเป็น 2 กลุ่ม คือ กลุ่มผู้เรียน ที่สอบผ่านกับกลุ่มผู้เรียนที่สอบไม่ผ่าน โดยนาข้อสอบไปทดสอบหลังเรียนแล้วนามาเทียบกับ เกณฑ์การผา่ น หรือ คะแนนจดุ ตัดของแบบทดสอบ โดยใช้สตู รของเบรนนอน (อนุวตั ิ คูณแก้ว, 2558) มีวธิ ีการคานวณ ดังน้ี เมื่อ B BU L n1 n2 แทน ดชั นคี ่าอานาจจาแนกของแบบทดสอบอิงเกณฑ์ U แทน จานวนผสู้ อบทีต่ อบถกู ของกลุ่มผ่านเกณฑ์ L แทน จานวนผสู้ อบที่ตอบถกู ของกลุ่มไม่ผ่านเกณฑ์
- 150 - n1 แทน จานวนผสู้ อบทีผ่ ่านเกณฑ์ n2 แทน จานวนผสู้ อบทีไ่ ม่ผ่านเกณฑ์ เกณฑใ์ นการพิจารณาดชั นอี านาจจาแนก มีดงั นี้ 1.00 หมายถึง จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถูกต้องทกุ คน 0.50 – 0.90 หมายถึง จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถกู ต้องเป็นส่วนใหญ่ 0.20 – 0.49 หมายถึง จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถูกต้องเป็นบางสว่ น 0.00 – 0.19 หมายถึง จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถูกต้องนอ้ ยมากหรอื ไม่ถูกเลย ติดลบ หมายถึง จาแนกผรู้ อบรู้-ไม่รอบรู้ผิดพลาด ตรงขา้ มกบั ความจริง ตวั อย่างการหาค่าอานาจจาแนกโดยวิธีของเบรนนอน (Brennan) จากการทดสอบผู้เรียน 30 คน จานวนข้อสอบ 5 ข้อ ปรากฏว่า สอบผ่าน 20 คนและสอบไม่ผ่าน 10 โดยแทนข้อมูลได้ดังน้ี โดยที่ n1 =20 และ n2 =10 ข้อสอบ U L U L B 0.00 n1 n2 1 10 5 10/20=0.50 5/10=0.50 2 19 8 20/20=0.95 8/10=0.80 0.15 3 15 0 15/20=0.75 0/10=0.00 0.75 4 0 4 0/20=0.00 4/10=0.40 -0.40 5 17 2 17/20=0.85 2/10=0.20 0.65 สรุปได้วา่ ข้อสอบข้อที่ 1และ 2 จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถกู ต้องเปน็ บางสว่ น ข้อสอบข้อที่ 3และ 5 จาแนกผรู้ อบรู้-ไม่รอบรู้ได้ถูกต้องเป็นส่วนใหญ่ ข้อสอบข้อที่ 4 จาแนกผรู้ อบรู้-ไม่รอบรู้ผิดพลาด ตรงขา้ มกบั ความจริง 3.2.3 วิธีการหาค่าความยากและอานาจจาแนกของขอ้ สอบอตั นยั ข้อสอบอัตนัยที่ไม่ได้ให้คะแนนแบบ 0,1 แต่อาจจะให้คะแนนเต็มมากกว่า น้ัน ซึง่ การหาค่าความยากและอานาจจจาแนก (อนุวัติ คูณแก้ว, 2558) มีวธิ ีการคานวณดงั นี้ ความยาก คานวณได้จากสตู ร P Su SL 2NX min 2N X max X min อานาจจาแนก คานวณได้จากสูตร D Su SL N X max X min
- 151 - เมือ่ P แทน ค่าความยาก D แทน อานาจจาแนก Su แทน ผลรวมของคะแนนกลุ่มสงู SL แทน ผลรวมของคะแนนกลุ่มต่า N แทน จานวนคนกลุ่มสูงหรอื กลุ่มต่าที่เท่ากัน (กลุ่มเดียว) Xmax แทน คะแนนสงู สุด X min แทน คะแนนตา่ สดุ ขั้นตอนการหาค่าความยากและอานาจจาแนกของข้อสอบอตั นยั 1) ตรวจให้คะแนนและจัดเรียงลาดับคะแนนจากสงู ไปหาตา่ 2) แบ่งผสู้ อบออกเปน็ กลุ่มสงู และกลุ่มตา่ ๆ ละ 25% 3) นาคะแนน และความถี่ (จานวนคน) ในกลุ่มสูงและกลุ่มต่ามาเขียนในตาราง วิเคราะหข์ ้อสอบ 4) คานวณหาค่าความยากและอานาจจาแนกของข้อสอบอตั นยั จากสูตร 5) แปลความหมายตามหลกั เกณฑเ์ ดียวกนั กบั ข้อสอบแบบปรนัย ตัวอย่าง ข้อสอบวิชาการวัดและประเมินผลการเรียนรู้ จานวน 1 ข้อ คะแนนเต็ม 20 คะแนน มีนักศกึ ษาสอบ จานวน 30 คน นาผลการสอบมาแบ่งเป็นกลุ่มสงู และกลุ่มต่าด้วยเทคนิค 25% ดงั น้ี คะแนน (X) กล่มุ สงู กลมุ่ ตา่ f fx f fx 20 2 40 0 0 17 1 17 0 0 15 1 15 0 0 12 2 24 0 0 10 1 10 3 30 9 0 0 2 19 600 1 6 รวม 7 106 ( Su ) 7 55 ( SL )
- 152 - ความยาก คานวณได้ดงั น้ี P 106 55 2)(7)(6 161 84 77 =0.39 2(7)20 6 1414 196 อานาจจาแนก คานวณได้จากสูตร D 106 55 51 51 =0.52 720 6 714 98 สรุปได้วา่ ข้อสอบอัตนัยข้อนีม้ ีคา่ ความยาก เท่ากบั 0.39 หมายถึง เป็นข้อสอบค่อนข้างยาก และอานาจจาแนกเท่ากับ 0.52 หมายถึง จาแนกได้ดี 6. การนาเครื่องมือการวัดและประเมินผลไปใช้ เคร่อื งมอื ทีด่ จี ะต้องสามารถนาไปใช้ใน สถานการณท์ ี่ต้องการใช้ได้ดี มีดังนี้ 1) นาไปใช้ได้ง่าย สะดวก ไม่ยุ่งยาก ไม่ซับซ้อน สามารถนาไปปฏิบัติได้ง่ายทั้ง ผดู้ าเนินการและ ผใู้ ห้ข้อมลู 2) ใช้เวลาที่เหมาะสม ไม่น้อยหรือมากเกินไป เพราะถ้าเวลามากเกินไป อาจจะทาให้ เกิด ความเบื่อหน่าย ขาดแรงจูงใจในการสอบหรือตอบ แต่ถ้าเวลาน้อยเกินไปจะทาให้ ผใู้ ห้ข้อมลู เกิดความเครียด วิตกกงั วล หรอื ให้ข้อมลู แบบเร่งรีบ 3) ให้คะแนนงา่ ย สะดวก รวดเรว็ และยุติธรรม 4) คุ้มค่ากับเวลา แรงงานและงบประมาณ 5) แปลผลที่ได้ง่ายและสะดวกในการนาไปใช้ นอกจากนั้น ข้อมูลสารสนเทศที่ได้จากการประเมินผลที่มีประสิทธิภาพมาจาก กระบวนการวดั และเครือ่ งที่มคี ุณภาพ สามารถนาไปใช้ในการพัฒนาคณุ ภาพการศกึ ษา ดงั น้ี 1) ด้านผู้เรียน นาไปใช้ในการพัฒนาตนเอง และใช้ในการรายงานผลให้ผปู้ กครองทราบ และผลการประเมินยังบอกความรู้ความสามารถ ความถนัด และความสนใจของผู้เรียน ซึง่ สามารถนาไปใช้แนะแนวการศึกษาต่อและแนะแนวการเลือกอาชีพให้แก่ผเู้ รียนได้ 2) ด้านครูผู้สอน นาไปใช้ในการปรับปรุงการจัดการเรียนรู้ เพื่อตรวจสอบว่าผู้เรียนมี ความรู้ความสามารถตามจุดประสงค์ที่กาหนดไว้หรือไม่ มีจุดใดบกพร่องใด นาไปออกแบบ กิจกรรมการเรียนรู้ การสอนซ่อมเสริม เพื่อหาเทคนิคและวิธีการสอนที่เหมาะกับระดบั ความรู้ ความสามารถของผเู้ รียน 3) ด้านผู้บริหาร เพื่อวิเคราะห์และประเมินผลการปฏิบัติงานของครูผู้สอนสามารถ นาไปใช้ในการพฒั นาปรบั ปรงุ การบริหารจดั การศึกษาของสถานศกึ ษา โดยอาจจะประเมินด้วย ตนเอง เพื่อวางนโยบายพัฒนาบุคลากร การจัดครูผู้สอนเข้าสอน การจัดโครงการ การพัฒนา หลักสูตรสถานศึกษา จัดสรรทรัพยากร จัดทาแผนปฏิบัติการที่สอดคล้องกับสภาพปัญหา ความตอ้ งการและความจาเป็นของชุมชนในการจัดการเรียนรู้อย่างมปี ระสิทธิภาพ
- 153 - สรุป เคร่ืองมือวัดและประเมินผลการเรียนรู้ที่มีคุณภาพจะทาให้การวัดและประเมินผลของ ผเู้ รียนมีความถูกต้อง นา่ เช่อื ถือ เคร่อื งมอื ทีเ่ ป็นแบบทดสอบที่ครูผู้สอนสร้างขึน้ น้ัน จาเปน็ ต้อง วิเคราะห์คุณภาพข้อสอบโดยหาค่าความเที่ยงตรง ความยาก อานาจจาแนก และความเป็น ปรนัยเป็นรายข้อ และหาค่าความเชื่อม่ันเป็นรายฉบับ แต่เคร่ืองมือบางชนิดอาจตรวจสอบ คณุ ภาพเพียงบางประการ ข้ึนอยู่กบั ลักษณะเครอ่ื งมือและประเภทของการประเมินผลทีต่ ่างกัน เช่น การประเมินแบบอิงกลุ่ม หรือการประเมินแบบอิงเกณฑ์ หรือลักษณะของข้อสอบที่เป็น แบบปรนัย หรืออัตนัย เป็นต้น ซึ่งปัจจัยที่ส่งผลต่อความเที่ยงตรง คือ ผู้เรียนที่เข้ารับ การทดสอบ ส่วนปัจจัยที่ส่งผลต่อความเชื่อมั่น คือ จานวนข้อสอบ ระดับความยากง่ายของ ข้อสอบ ความสามารถของผู้เข้าสอบ และสภาพบรรยากาศของการสอบ ซึ่งผลการวัดและ ประเมินผลสามารถนาไปใช้พัฒนาผู้เรียน สามารถบอกความรู้ความสามารถของผู้เรียน รายงานผลต่อผู้ปกครอง และนาไปใช้แนะแนวการศึกษ าต่อได้ นอกจากนั้นครูผู้สอน ยังสามารถนาไปปรับกระบวนการจัดการเรียนรู้ และหาวิธีสอนในการออกแบบกิจกรรมการ จัดการเรียนรู้ให้เหมาะสมกับความสามารถของผู้เรียน อีกทั้งผู้บริหารยังสามารถนาไปใช้ใน การพฒั นาสถานศกึ ษาได้ แบบฝึกหดั 1. จงอธิบายความเทีย่ งตรงของเครือ่ งมือ (Validity) มาพอสงั เขป 2. มีปจั จัยใดบ้างทีม่ ีส่งต่อความเทีย่ งตรงของเครื่องมอื วัดและประเมินผลการเรียนรู้ 3. จงอธิบายความหมายของความเชื่อมั่น (Reliability) มาพอสงั เขป 4. มีปัจจยั ใดบ้างที่ส่งผลต่อความเชือ่ มัน่ ของเครอ่ื งมอื วัดและประเมินผลการเรียนรู้ 5. จากตารางแสดงรายละเอียดของการพิจารณาข้อสอบโดยผู้เชี่ยวชาญจานวน 5 คน จงคานวณหาค่าความเทีย่ งตรง (IOC) โดยมีข้อสอบจานวน 5 ข้อ ขอ้ ที่ 1 ผเู้ ชี่ยวชาญคนท่ี 5 234 1 +1 +1 0 0 +1 2 +1 +1 +1 +1 +1 3 0 +1 +1 0 +1 4 -1 +1 0 +1 0 5 0 0 0 -1 0
- 154 - 6. จากตารางแสดงรายละเอียดจานวนผเู้ รียนแบ่งกลุ่มสูงและกลุ่มต่า จงคานวณหา ความยากและอานาจจาแนกของข้อสอบจากตารางขอ้ มลู ทีก่ าหนดให้ คะแนนเตม็ 10 คะแนน ผเู้ รียน 40 คน ขอ้ ที่ กลมุ่ สงู (20) กลุ่มต่า (20) 1 20 10 2 17 8 3 14 11 4 10 5 5 16 19 6 15 12 7 18 9 8 12 11 9 10 7 10 11 15 7. จากตารางแสดงรายละเอียดการตอบข้อสอบ 5 ข้อของผู้เรียนจานวน 10 คน จงแสดงวธิ ีการคานวณหาความเชือ่ มนั่ ของแบบทดสอบชุดนโี้ ดยใช้สตู ร K-R 20 และ K-R21 คนท่ี ขอ้ ที่ 5 1 234 111101 2001 1 1 310110 41001 1 51 1001 601000 711101 81001 1 90 1 0 1 0 10 0 0 0 0 1
Search
Read the Text Version
- 1 - 28
Pages: