บทท่ี 5สถติ ิเชิงพรรณา
สถติ ิพรรณนา (Descriptive Statistics) วชิ าทวี่ ่าด้วยการเกบ็ รวบรวมข้อมูล การประมวลผลหรือนาเสนอด้วยการบรรยาย ตาราง แผนภูมิ แผนภาพ วธิ ีการทางสถติ ิ1. การแจกแจงข้อมูล ความถ่ี , ร้อยละ , อตั ราส่วน , สัดส่วน , ควอไทล์ ,2. การวดั แนวโน้มเข้าสู่ เดไซล์ , เปอร์เซ็นไทล์ส่ วนกลาง ค่าเฉลยี่ , มัธยฐาน , ฐานนิยม3. การวดั การกระจายของข้อมูล พสิ ัย , ส่วนเบ่ยี งเบนมาตรฐาน , ความแปรปรวน , สัมประสิทธ์ิการกระจาย , ส่วนเบย่ี งเบนควอไทล์ , ความเบ้ , ความโด่ง
สถติ เิ ชิงพรรณนา (Descriptive Statistics)เป็นวชิ าสถติ หิ รอื ศาสตรท์ ่วี า่ ดว้ ยการสรุปสาระสาคญัท่มี ีอยู่ในขอ้ มลู ชดุ หน่ึง และนาเสนอขอ้ สรปุ หรอื นาสาระสาคญั ในขอ้ มูลชดุ น้นั ออกมารายงานหรอื อธบิ ายวา่ มีลกั ษณะเป็นอยา่ งไร หรอื ใชป้ ระโยชนโ์ ดยไม่ทาการอา้ งองิ ไปยงั ขอ้ มูลชดุ อน่ื หรอื ขอ้ มูลชดุ ท่สี มบูรณ์
• สถติ เิ ชิงพรรณนาจะวา่ ดว้ ยวธิ กี ารในการสรุปและนาเสนอ ขอ้ มูลท่อี ธบิ ายลกั ษณะของขอ้ มูลชดุ น้นั ใหเ้ ป็นท่ีเขา้ ใจ โดยสงั เขป เช่น โดยการบอกวา่ ขอ้ มูลชดุ น้ีมศี ูนยก์ ลางอยู่ท่ใี ด โดยการใชค้ า่ เฉลย่ี หรอื ค่ามธั ยฐานเป็นคา่ แสดงวา่ ขอ้ มูลชดุ น้ี มคี า่ อยู่ตรงไหนหรอื บรเิ วณไหนและโดยการบอกว่าขอ้ มลู ชดุ น้ี มคี ่าต่างๆ ปรากฏอยู่ในช่วงใด ค่าต่างๆ เหลา่ น้ีเกาะกลมุ่ กนั มากนอ้ ยเพยี งไร หรอื มกี ารกระจายตวั มากนอ้ ยเพยี งไร ดว้ ย การบอกวา่ ค่าตา่ สดุ ค่าสูงสดุ เป็นเท่าไร มีพสิ ยั กวา้ งยาวแค่ ไหน มคี ่าแปรปรวนและค่าเบ่ยี งเบนมาตรฐานเท่ากบั เทา่ ไร
สถติ อิ นุมาน (Inferential Statistics) วชิ าทวี่ ่าด้วยการสรุปถงึ ข้อเทจ็ จริงของข้อมูลท้งั หมดในลกั ษณะของ - การประมาณค่า (Estimation) - การทดสอบสมมตฐิ าน (Testing Hypothesis)ซ่ึงแบ่งได้เป็ น 2 ประเภท คอื1. สถติ ทิ ใ่ี ช้พารามเิ ตอร์ (Parametric Statistics)2. สถติ ทิ ไ่ี ม่ใช้พารามเิ ตอร์ (Nonparametric Statistics)
สถติ เิ ชิงอนุมาน(Inferential Statistics)• เป็นวชิ าสถติ หิ รอื ศาสตรท์ ่วี ่าดว้ ยทฤษฎแี ละวธิ กี ารต่างๆ ในการ วเิ คราะหข์ อ้ มูลเพอ่ื ตอบคาถามหรอื ปญั หาท่สี นใจ โดยอาศยั ขอ้ มูลเพยี งสว่ นหน่ึงท่มี ีอยู่เพอ่ื อธบิ ายขอ้ มลู ชดุ ท่สี มบูรณ์หรอื ประชากร กลา่ วคอื จากขอ้ มูลท่มี อี ยู่ซ่ึงไม่ใช่ขอ้ มูลชดุ สมบูรณ์ (คอื มเี ฉพาะขอ้ มูลสว่ นเดียว ท่มี กั เรยี กว่าขอ้ มูลตวั อย่าง) เรา ตอ้ งการสรุปสาระสาคญั ในขอ้ มูลชดุ สมบูรณ์หรอื ลกั ษณะของ ปรากฏการณ์หน่ึงดว้ ยการใชข้ อ้ มูลตวั อย่างหรอื ขอ้ มูลเพยี งสว่ น หน่ึงจากชดุ ขอ้ มูลท่สี มบูรณ์น้นั แลว้ ทาการอนุมานจากขอ้ มูล ตวั อยา่ งไปสูข่ อ้ มลู ชดุ สมบูรณ์
• ความแตกต่างจากสถติ เิ ชิงพรรณนาอยูท่ ่ตี รงน้ี สถติ เิ ชิงพรรณนาทา การสรปุ สาระสาคญั ในขอ้ มลู ชดุ ท่มี อี ยูใ่ นมอื หรอื อธิบายลกั ษณะของ ขอ้ มูลชดุ น้ีเทา่ น้นั ไม่มกี ารอา้ งองิ ถงึ ขอ้ มูลชดุ อน่ื หรอื พยายามไปอธบิ าย ขอ้ มูลชดุ สมบูรณ์ เรยี กว่าไม่ทาการอนุมานไปสูข่ อ้ มูลชดุ ท่สี มบูรณ์ นนั่ เอง แตส่ ถติ เิ ชิงอนุมานน้นั ไม่ใช่เลย จุดหมายหลกั คือตอ้ งการ อธบิ ายขอ้ มลู ชดุ ท่สี มบูรณ์หรอื ประชากรวา่ มหี นา้ ตาเป็นอย่างไร แต่ใน ความเป็ นจรงิ น้นั เราไม่สามารถหาขอ้ มูลชดุ ท่สี มบูรณ์ไดเ้ สมอ ดว้ ย สาเหตหุ ลายประการ เช่น ไม่สามารถเกบ็ รวบรวมไดท้ ง้ั หมด ตวั อยา่ งเช่น ตอ้ งการทราบวา่ มคี นกรุงเทพฯ กเ่ี ปอรเ์ ซนตท์ ่เี หน็ ดว้ ยกบั นโยบายการเกบ็ ภาษีป้ องกนั น้าทว่ ม ขอ้ มูลชดุ สมบูรณ์หรอื ประชากรคอื ขอ้ มูลความคดิ เหน็ ของคนกรุงเทพฯ ทง้ั หมด
การแจกแจงความถ่ี (Frequency Distributions)• การแจกแจงความถ่ี เป็นการนาขอ้ มูลดิบท่ีรวบรวม ไดม้ าจดั ระเบยี บ โดยทวั่ ไปจะจดั ระเบยี บในรูป ตาราง ซ่ึงเรยี กวา่ ตารางความถ่ี
การแจกแจงเชิงปริมาณ เป็ นวธิ ีการนาเสนอข้อมูลเชิงปริมาณทเี่ กบ็ รวบรวมมาได้เป็ นจานวนมาก ซึ่งเรียกว่าข้อมูลดบิ สามารถทาได้2 วธิ ี คอื1. การแจกแจงความถด่ี ้วยตาราง2. การแจกแจงความถดี่ ้วยกราฟ
การแจกแจงความถด่ี ้วยตารางอยู่ในรูปของตารางแจกแจงความถ่ี1. การแจกแจงจัดเรียง - นาข้อมูลทุกค่าทมี่ ีความถีเ่ ท่ากบั 1 มาเรียงลาดับ โดยทว่ั ไปจะเรียงจากน้อยไปหามาก - ทาให้ทราบค่าของข้อมูลได้ดขี นึ้ ว่าค่าใดเป็ นค่าสูงสุด ค่าใดเป็ นค่าตา่ สุดเช่น 53 74 11 84 33 89 22 34คา่ ต่าสดุ เรียงลาดบั จากน้อยไปมากได้ดงั นี้ คา่ สงู สดุ 1111 22 33 34 53 74 84 8899
การแจกแจงความถด่ี ้วยตาราง (ต่อ)2. การแจกแจงความถชี่ นิดไม่จดั ข้อมูลเป็ นหมวดหมู่ - เป็ นการเรียงลาดบั คะแนนไว้เท่าน้ัน ซ่ึงในการเรียงคะแนนสามารถเรียงจากค่ามากไปหาค่าน้อย หรือจากค่าน้อยไปหาค่ามาก วธิ ีนีช้ ่วงห่างระหว่างแต่ละค่าคะแนนเป็ นหนึ่งหน่วยเท่ากนัตลอด
การแจกแจงความถี่ดว้ ยตาราง (ต่อ)ตัวอย่างที่ 1: สุ่มตัวเลข 1 หลกั จากตารางเลขสุ่มมาจานวน 20 ตัว โดยให้จุดเร่ิมต้นของการสุ่มเป็ นไปโดยสุ่ม ตัวเลขที่สุ่มได้ มดี งั นี้ 3411755344 6815538099 1. พจิ ารณาจากค่าคะแนนสูงสุดและคะแนนตา่ สุด คะแนนสูงสุดคอื 0คะแนนตา่ สุดคอื 9 2. สร้างตารางบรรจุค่าตา่ สุดไปหาค่าสูงสุด แล้วหาความถี่
การแจกแจงความถดี่ ้วยตาราง (ต่อ)สามารถสร้างตารางแจกแจงความถีไ่ ด้ดงั นี้ตัวเลข รอยขีด ความถ่ี0/ 11 /// 3203 /// 34 /// 35 //// 46/ 17/ 18 // 2 รวม 20 ตวั9 // 2
การแจกแจงความถดี่ ้วยตาราง (ต่อ)3. การแจกแจงความถี่ชนิดจดั ข้อมูลเป็ นหมวดหมู่ - คล้ายกบั การแจกแจงความถชี่ นิดไม่จดั ข้อมูลเป็ น หมวดหมู่ตรงทมี่ ีการเรียงคะแนนจากค่ามากไปหาค่า น้อย - แตกต่างกนั ทแี่ ต่ละช้ันของคะแนนจะ ประกอบด้วยกล่มุ ของคะแนน
การแจกแจงความถด่ี ้วยกราฟ1. ฮิสโทแกรม - เป็ นการนาเสนอข้อมูลในรูปของกราฟแท่งหลายรูป โดยกาหนดให้แกนนอนแทนระยะระหว่างขดี จากดั ช้ันที่แท้จริง แกนต้ังแทนจานวนความถ่ีของคะแนนแต่ละช้ัน
การแจกแจงความถด่ี ้วยกราฟ (ต่อ)จากตวั อย่างที่ 2 สามารถสร้างฮิสโทแกรมได้ ดังนี้
การแจกแจงความถด่ี ้วยกราฟ (ต่อ)2. รูปหลายเหลยี่ มความถ่ี - เป็ นแผนภูมเิ ส้นทแี่ สดงความถข่ี องคะแนนแต่ละช้ัน - โดยการลากเส้นเช่ือมต่อจุดระหว่างกงึ่ กลางของยอดกราฟแท่งแต่ละรูป และลากเช่ือมลงมาบนจุดกง่ึ กลางแกนนอนของปลายท้งั สองข้างของพนื้ ที่ท่ไี ม่มีความถี่
การแจกแจงความถดี่ ้วยกราฟ (ต่อ)จากตวั อย่างท่ี 2 สามารถสร้างรูปหลายเหลย่ี มความถไ่ี ด้ ดงั นี้
การแจกแจงความถด่ี ้วยกราฟ (ต่อ)3. โค้งความถ่ี - เป็ นโค้งทเี่ กดิ จากการปรับรูปหลายเหลยี่ ม ของความถีใ่ ห้มลี กั ษณะโค้งและเรียบเพอื่ ความ สวยงาม โดยพนื้ ทภี่ ายใต้โค้งแห่งความถ่ียงั คงมี พนื้ ทเ่ี ท่ากบั พนื้ ทข่ี องรูปหลายเหลยี่ มของความถ่ี
การแจกแจงความถด่ี ้วยกราฟ (ต่อ)จากตัวอย่างที่ 2 สามารถสร้างโค้งความถ่ไี ด้ ดังนี้
ประเภทของโค้งความถี่1. โค้งปกติ 3. โค้งเบ้ทางลบ (เบ้ซ้าย)2. โค้งเบ้ทางบวก (เบ้ขวา) 4. โค้งรูปตวั ยู
ประเภทของโค้งความถ่ี (ต่อ)5. โค้งรูปตวั เจ และตวั เจกลบั6. โค้งหลายยอด
7. การวดั แนวโน้มเข้าสู่ส่วนกลาง1. ค่าเฉลย่ี เลขคณติ (Arithematic Mean)2. มธั ยฐาน (Median)3. ฐานนิยม (Mode)4. ค่ากงึ่ พสิ ัย (Midrange)5. ค่าเฉลยี่ ถ่วงนา้ หนัก (Weighted Mean)
7. การวดั แนวโน้มเข้าสู่ส่วนกลาง (ต่อ) 1 การเลอื กใช้ ค่าเฉลยี่ เลขคณติ มัธยฐานและฐานนิยม 2. ความสัมพนั ธ์ระหว่างค่าเฉลย่ี เลขคณิตมัธยฐาน และฐานนิยม
การเลอื กใช้ Mean , Median และ Mode (พงษ์พชิ เพชรสกลุ วงศ์. 2547 : 35) - ค่าเฉลยี่ เลขคณติ เหมาะสาหรับข้อมูลทม่ี ลี กั ษณะสมมาตรหรือไม่เบ้ หรือข้อมูลทมี่ คี วามแตกต่างกนั น้อย - มัธยฐาน เหมาะสาหรับข้อมูลทมี่ ีความแตกต่างกนั มาก หรือเมื่อข้อมูลชุดน้ันมคี ่าสูงหรือตา่ มากผดิ ปกติ และเหมาะสาหรับข้อมูลในลกั ษณะปลายเปิ ด - ฐานนิยม เหมาะสาหรับข้อมูลทมี่ คี วามถแี่ ต่ละช้ันมาก หรือต้องการหาค่าของแนวโน้มเข้าสู่ส่วนกลางอย่างรวดเร็ว และเหมาะสาหรับข้อมูลในลกั ษณะปลายเปิ ด
ความสัมพนั ธ์ระหว่าง Mean , Median และ Mode(พงษ์พชิ เพชรสกลุ วงศ์. 2547 : 35)1. ข้อมูลมกี ารแจกแจงในลกั ษณะสมมาตร (Symmetry) จะได้ว่า Mean = Median = Mode
ความสัมพนั ธ์ระหว่าง Mean , Median และ Mode (ต่อ) 2. ข้อมูลมีการแจกแจงแบบเบ้ขวา (Skew to the right) จะได้ว่า Mode < Median < Mean
ความสัมพนั ธ์ระหว่าง Mean , Median และ Mode (ต่อ) 3 ถ้าข้อมูลมกี ารแจกแจงแบบเบ้ซ้าย (Skew to the left) จะได้ว่า Mean < Median < Mode
การวดั การกระจายข้อมูลมอี ยู่หลายวธิ ี ดงั นี้1. พสิ ัย (range)2. พสิ ัยระหว่างควอร์ไทล์ (IQR)3. ความแปรปรวนและค่าเบ่ียงเบนมาตรฐาน4. ดชั นีการกระจาย
พสิ ัย- ผลต่างระหว่างค่าสูงสุดและตา่ สุดของข้อมูล- ถ้าพสิ ัยมคี ่าน้อย แสดงว่าข้อมูลกระจุกตวั มาก- ถ้าพสิ ัยมคี ่ามาก แสดงว่าข้อมูลกระจุกตวั กนั น้อย- เป็ นการวดั การกระจายอย่างหยาบๆ และง่ายทสี่ ุด- เหมาะสาหรับใช้วดั การกระจายที่มจี านวนข้อมูลไม่มากนัก และใช้วดั อย่างคร่าวๆ
พสิ ัย (ต่อ) พสิ ยั = คา่ สูงสุด - ค่าต่าสุดตวั อย่างท่ี 3: จงหาพสิ ัยของคะแนนสอบของนักเรียน 7 คน ซ่ึงมีดงั นี้ 35 , 48 , 32 , 64 , 73 , 55 , 70 วธิ ีทา คะแนนสูงสุด = 73 คะแนนต่าสุด = 32 ดังน้ัน พสิ ัย = 73 – 32 = 41
พสิ ัยระหว่างควอร์ไทล์ - เป็ นวธิ ีการวดั การกระจายทป่ี รับปรุงจากพสิ ัย - โดยจะวดั พสิ ัยระหว่างคลอร์ไทล์ทม่ี ากท่ีสุดและน้อยท่ีสุด เพอื่ หลกี เลยี่ งผลกระทบกรณคี ่าปลายสุดค่าใดค่าหนึ่งหรือท้งั สองค่ามคี ่ามากหรือน้อยผดิ ปกติ IQR = Q3 – Q1
ความแปรปรวนและค่าเบ่ยี งเบนมาตรฐาน - ความแปรปรวน คอื ค่าเฉลย่ี ของผลรวมท้งั หมดของ คะแนนเบ่ยี งเบนยกกาลงั สอง - ความเบย่ี งเบนมาตรฐาน คอื รากทสี่ องของความ แปรปรวน เป็ นค่าวดั การกระจายในรูปเส้นตรง ทาให้ทราบว่า ข้อมูลแต่ละตวั อยู่ห่างจากค่าเฉลยี่ เท่าไร - ค่าเบ่ยี งเบนมาตรฐาน () = 0 หรือ ความแปรปรวน (2) = 0 หมายความว่า ข้อมูลชุดน้ันไม่มกี ารกระจาย (เป็ นไปไม่ได้)
ดชั นีการกระจาย(ทม่ี า: http://www.watpon.com/Elearning/stat30.htm) - สาหรับใช้วดั การกระจายของข้อมูลในมาตรนามบญั ญตั ิ หรือมาตรเรียงอนั ดบั - มคี ่าตา่ สุดเป็ น 0 กค็ อื ไม่มกี ารกระจาย และมีค่าสูงสุดเป็ น 1 - ค่าการกระจายท่ีมาก หมายถึง มกี ารกระจายมาก - ค่าการกระจายทนี่ ้อย หมายถึง มกี ารกระจายน้อย
ดชั นีการกระจาย (ต่อ)สูตรในการคานวณสถติ ิ D คอืเมอ่ื N คอื จานวนของความถท่ี ้งั หมด k คอื จานวนกล่มุ ของตวั แปร fi คอื ความถใี่ นกลุ่มที่ i
การวดั การกระจายสัมพทั ธ์ ใชค้ า่ สมั ประสิทธ์ิของการกระจาย (Coefficient of Variance : C.V.)ในการเปรียบเทียบการกระจายของขอ้ มลู ต้งั แต่ 2 ชุดข้ึนไป สาหรับวดั ในประชากร C.V. = (/µ)*100 สาหรับวดั ในตวั อยา่ ง C.V. = (S/X)*100
9. การวดั การกระจายสัมพทั ธ์ (ต่อ)ตัวอย่างที่ 7 : ถา้ คะแนนสอบไล่วชิ า A ซ่ึงมีคะแนนเตม็ 100 คะแนน มีค่าเฉล่ีย 60 คะแนน และส่วนเบ่ียงเบนมาตรฐานเท่ากบั 6 คะแนน ในขณะที่คะแนนสอบไล่วชิ า B ซ่ึงมีคะแนนเตม็ 1,000 คะแนน มีค่าเฉล่ีย 700 คะแนน และส่วนเบี่ยงเบน มาตรฐานเท่ากบั 7 คะแนน จงหาวา่ คะแนนสอบไล่วชิ าไหน มีการกระจายมากกวา่ กนั
การวดั การกระจายสัมพทั ธ์ (ต่อ)วิธีทา จาก C.V. = (/µ)*100 จะได้ C.V. ของวชิ า A = (6/60)*100 = 10 % และ C.V. ของวชิ า B = (7/700)*100 = 1% เนื่องจาก C.V. ของวิชา A มีคา่ มากกวา่ วชิ า B นนั่ คือ คะแนนสอบไล่วชิ า A มีการกระจายมากกวา่ วชิ า B
Search
Read the Text Version
- 1 - 38
Pages: