การวิเคราะห์และการนาเสนอขอ้ มลู แบบขน้ั ตน้ นนั ทวรรณ ประภักรางกูล 22 มีนาคม 2565
ข้อมูล เปน็ ข้อความจรงิ หรอื ส่งิ ทีบ่ ง่ บอกถงึ สภาพ สถานการณ์ หรือปรากฏการณ์ใดปรากฏการณ์หนง่ึ โดยที่ข้อมูลอาจเปน็ ตวั เลข หรอื ข้อความก็ได้ การดาเนนิ การใดๆทเ่ี กีย่ วขอ้ งกบั ข้อมลู ปริมาณมากต้องใช้สถิติเพอ่ื ใหเ้ ราสามารถสรุปขอ้ มูล และแสดงความสมั พนั ธ์ระหวา่ ง ขอ้ มลู ได้ กระบวนการท่ีไดม้ าซงึ่ ขอ้ มูลมาหลายวธิ ดี ้วยกนั ได้แก่ • การสร้าง (CREATE) • การการวัดผล (MEASURE) • การเกบ็ /รวบรวม (COLLECT) • การสังเกต (OBSERVE) ข้อมูลเชิงสถติ เิ ป็นขอ้ มูลท่ีสามารถนามาประมวลผลหรอื วเิ คราะห์ดว้ ยกระบวนการหรือวิธีการต่าง ๆ เพ่อื ตอบคาถามในประเดน็ ตา่ ง ๆ ได้ ข้อมลู แบ่งเปน็ 2 ประเภทใหญ่ ๆ ดังนี้ 1. ข้อมูลตามวิธกี ารเก็บรวบรวมข้อมลู 2. ขอ้ มลู ตามลกั ษณะของขอ้ มลู
◦ ขอ้ มลู ตามวธิ กี ารเก็บรวบรวมขอ้ มูล ▪ ขอ้ มูลปฐมภมู ิ (primary data) คอื ข้อมูลทีผ่ ูใ้ ชจ้ ะตอ้ งเกบ็ รวบรวมจากผใู้ หข้ อ้ มูลหรอื แหลง่ ท่ีมาของขอ้ มลู โดยตรง ซึ่งอาจทาไดโ้ ดย การสัมภาษณ์ วัด นับ หรอื สงั เกตจากแหล่งข้อมูลโดยตรง เนอื่ งจากข้อมลู เหลา่ นไี้ มเ่ คยมผี ูใ้ ดเก็บรวบรวมไว้กอ่ น ▪ ข้อมูลทตุ ิยภูมิ (secondary data) คือขอ้ มลู ทผ่ี ใู้ ชไ้ มต่ ้องเกบ็ รวบรวมจากผใู้ ห้ข้อมูลหรือแหลง่ ทม่ี าของขอ้ มูลโดยตรง แตไ่ ด้จาก ข้อมูลท่มี ผี ูอ้ น่ื เกบ็ รวบรวมไวแ้ ล้ว ข้อมูลประเภทน้ี ผูใ้ ช้ไมต่ อ้ งเสยี เวลาและค่าใชจ้ ่ายในการเก็บรวบรวมขอ้ มลู เอง สามารถนาข้อมลู ท่ีมีผู้อนื่ เกบ็ รวบรวมไวแ้ ลว้ มาใช้ไดเ้ ลย ◦ ข้อมูลตามลักษณะของขอ้ มลู ▪ ขอ้ มูลเชิงปริมาณ (quantitative data) คอื ขอ้ มูลทใี่ ชแ้ ทนขนาดหรอื ปรมิ าณซึ่งวัดออกมาเป็นจานวนที่สามารถนามาใช้ เปรียบเทยี บกนั ได้โดยตรง ▪ ข้อมูลเชงิ คณุ ภาพ (qualitative data) คือ ข้อมลู ที่ไม่สามารถวดั ออกมาเปน็ จานวนไดโ้ ดยตรงแต่อธบิ ายลักษณะหรอื คณุ สมบตั ใิ นเชงิ คณุ ภาพได้
ข้อมูลเชงิ ปรมิ าณ (quantitative data) ข้อมูลขนาดหรือปรมิ าณซง่ึ วดั ออกมาเปน็ จานวนทส่ี ามารถนามาใชเ้ ปรยี บเทยี บกันได้ เช่น จานวนรับเข้านสิ ิตรายคณะ รายปี อตั รา ดอกเบย้ี เงินก้ธู นาคารพาณิชย์ อัตราดอกเบยี้ เงนิ ฝากธนาคารพาณชิ ย์ เป็นต้น 1. ข้อมลู แบบไมต่ ่อเนอ่ื ง (Discrete Data) ขอ้ มูลทเ่ี ปน็ จานวนเท่านน้ั ไม่เพม่ิ หรอื ลดดว้ ยตวั เอง ลกั ษณะที่สาคญั คอื เปน็ ตัวเลขท่ีได้จากการนบั ค่าทศนิยมมีค่าได้จากดั หรอื ไม่มีความหมาย ดงั ตวั อย่างตอ่ ไปนี้ - จานวนครัง้ ทเี่ คร่ืองจักรหยุดทางาน วนั นี้ เทา่ กบั 12 ครั้ง - พบจดุ บกพรอ่ งในงานที่เพิ่งผลติ เสรจ็ 9 จดุ 2. ขอ้ มลู แบบต่อเนอ่ื ง (Continuous Data) ขอ้ มูลทเ่ี ป็นตวั เลขท่ีสามารถเปลี่ยนแปลงเพม่ิ หรอื ลดลงเองได้ โดยทไี่ มต่ อ้ งคานวณ ลกั ษณะท่ี สาคัญคอื ตอ้ งใช้เคร่ืองมอื มาวัด ค่าทศนยิ มมีความหมายและไมม่ ที สี่ น้ิ สุด ขึ้นอยูก่ บั ความละเอียดของเคร่อื งวดั ว่าจะแยกแยะออกเป็นทศนยิ มไดก้ ่ี ตาแหนง่ ดังตวั อยา่ งต่อไปน้ี - อุณหภูมหิ ้อง ขณะนี้ 27.5 องศาเซลเซียส - น้าหนักของวสั ดชุ ิ้นน้ี 23.45 กรัม
ข้อมูลเชงิ คณุ ภาพ (qualitative data) ข้อมูลท่ไี ม่สามารถวัดด้วยอปุ กรณ์การวัดใดๆ ได้ การวเิ คราะห์ขอ้ มูลประเภทนสี้ ่วนใหญ่ทาไดโ้ ดยการนบั จานวนจาแนกตามลักษณะเชงิ คณุ ภาพ และขอ้ มูลเชงิ คุณภาพบางลกั ษณะสามารถวดั ออกมาเป็นลาดับ หรือ ตาแหนง่ ท่ี เมื่อนาไปใช้ต้องแทนลาดบั ที่ดว้ ยตวั เลข เช่น ความพงึ พอใจในบรกิ าร วัด ตามระดบั ความพึงพอใจ ชอบมากท่ีสุด ชอบมาก ชอบปานกลาง ชอบน้อย ไมช่ อบเลย และมักจะใหต้ ัวเลขทมี่ ีคา่ มากแทนลักษณะหรอื ความรู้สกึ ท่ีดี 1. แบ่งโดยใชล้ กั ษณะนาม (Nominal Scale) ข้อมลู เชิงคณุ ภาพชนิดไมส่ ามารถจดั เรยี งไดต้ ามธรรมชาติ เช่น สี เพศ อาชีพ ต.ย. ขอ้ มลู ของผ้ทู ผี่ า่ นเขา้ ออกประเทศไทย ทางสนามบนิ ดอนเมอื งทแี่ สดงดังต่อไปน้เี ป็นตัวอยา่ งที่ดี (ตวั เลขสมมุติ) - สญั ชาติ : ไทย 13.4% อเมรกิ ัน 7.9% ญป่ี ุน่ 7.3% จีน 5.4% อนิ เดยี 3.4 % - ภารกิจ : ทอ่ งเท่ยี ว 56.5% ธุรกิจ 34.5% การศึกษา 4.5% - เพศ : ชาย 67.3% หญงิ 32.7% จากตวั อย่าง จะเห็นวา่ สัญชาติ ภารกิจ เพศ เปน็ ลักษณะของขอ้ มูลท่เี ราเกบ็ จากการศึกษาเป็นข้อมูลขั้นแรก หรอื ปฐมภูมิ (Primary) ในขณะท่ี ไทย อเมริกัน ญป่ี ุน่ จีน อินเดยี ท่องเท่ียว ธุรกจิ การศกึ ษา ชาย และ หญิง เป็นขอ้ มลู ขนั้ ทุติยภมู ิ (Secondary) สว่ นตวั เลขคอื คา่ ท่ไี ดจ้ ากการศึกษา ถ้าสงั เกตดๆี เราจะพบวา่ ข้อมูลบางชนดิ แยกยอ่ ยไดม้ ากกว่าสองลักษณะ (Category) เชน่ สัญชาติ หรือ อาการของปญั หา แตบ่ างชนิดแบ่งได้เพียงสองกลมุ่ เช่น เพศ ผลการทดสอบ เป็นต้น
2. แบ่งโดยอันดับ (Ordinal Scale) ข้อมลู เชิงคุณภาพที่สามารถจดั เรียงตามธรรมชาติได้ สามารถเปรียบเทยี บและจดั เรยี งหรอื ใหค้ ณุ คา่ ไดต้ าม ธรรมชาติ โดยขอ้ มลู ทั้งหมดจะเรียงลาดบั กันอย่างชดั เจน การสลับที่ของขอ้ มลู จะทาให้สาระท่ีได้ผิดปกตไิ ปทนั ที ในขณะที่ Nominal ไม่มีผล เชน่ ขนาดเสอ้ื ผา้ เกรด ต.ย. ผลการสารวจความคิดเหน็ ต่อนโยบายจดั ระเบียบสงั คมของรฐั บาล ออกมาเปน็ ลักษณะดังน้ี Ordinal - ความเหน็ : เหน็ ด้วย อย่างยิง่ 55.5% เห็นด้วย 30.% ไม่ออกความคดิ เห็น 5% ไม่เห็นดว้ ย 5% ไมเ่ หน็ ด้วยอย่างยงิ่ 4.5% Nominal - ระดับการศึกษา : มธั ยม 12% อนุปรญิ ญา 23% ปริญญาตรี 40 % ปริญญาโท 20% ปรญิ ญาเอก 5% จะเหน็ ว่าขอ้ มูลท่เี กบ็ มาน้ัน มอี นั ดับ อยา่ งชดั เจน น่คี อื ความแตกตา่ งของข้อมูล Nominal กับ Ordinal
เกบ็ รวบรวมข้อมูล แยกประเภทข้อมูล สงั เขปขอ้ มูล การหาขอ้ สรปุ วิธเี ก็บรวบรวมขอ้ มลู 1. การเกบ็ รวบรวมข้อมลู ดว้ ยการสังเกต เชน่ ผลการทดลองวทิ ยาศาสตร์ การนับจานวนรถท่ีเขา้ -ออกประตู 1 อายุการใช้งานของหลอด ไฟฟา้ เป็นต้น 2. การเก็บรวบรวมข้อมลู ดว้ ยการสอบถาม ประกอบด้วย 1. การสมั ภาษณ์ เช่น การทาสามะโนประชากร การทาสามะโนการเกษตร 2. แบบสอบถาม การเกบ็ รวบรวมขอ้ มูลด้วยวธิ ีนี้ มกั ไดร้ บั แบบสอบถามกลับคนื มาไม่ครบถว้ น 3. การลงทะเบียน ประชาชนเปน็ ผู้ใหข้ อ้ มูลตามกฎหมายด้วยการบนั ทกึ ข้อมูลลงในข้อมูลเกี่ยวกบั การเกดิ การตาย การสมรส การ หย่าร้าง ไดจ้ ากสานกั งานทะเบยี นส่วนท้องถน่ิ เปน็ ตน้
การแยกประเภทข้อมูล (Classification) ข้อมลู ทเี่ ก็บรวบรวมมาได้ อาจมีประเภทมากหรอื นอ้ ยแลว้ แต่เร่อื งทีต่ อ้ งการศึกษา และอาจจาแนกเปน็ ชนิดยอ่ ยลง ไปไดอ้ ีก ทงั้ น้ันอยกู่ ับการศึกษารายละเอียดปลีกย่อยต่าง ๆ เชน่ จานวนนิสิต จาแนกตามสาขาวชิ า เพศ และช้ันปี อาจจาแนก ตามภาคท่นี ิสติ อาศยั ซ่ึงการแยกประเภทนนั้ ตอ้ งเพียงพอสาหรับการวเิ คราะห์ ตามเร่ืองที่ต้องการศึกษา การสังเขปข้อมลู (Condensation) ข้อมูลที่เก็บรวบรวมมาไดใ้ นขั้นแรกจะอยใู่ นสภาพทไี่ ม่เป็นระเบียบ ยังไมส่ ามารถทาการหาขอ้ สรุปของลักษณะต่างๆ ของ ขอ้ มลู ได้ ข้อมูลเช่นน้เี รียกว่า \"ข้อมูลดิบ\" (Raw data) ดงั นน้ั เพอื่ ใหข้ อ้ มูลอยใู่ นสภาพพร้อม ท่ีจะสามารถหาข้อสรปุ หรือ ทาการ วเิ คราะหโ์ ดยวิธอี ่ืนๆ ได้ จาเปน็ ต้องดาเนนิ การสังเขปข้อมูลดิบ ด้วยการแจกแจงความถี่ (Frequency distribution) การวัด แนวโนม้ เขา้ สูศ่ นู ย์กลาง ทเี่ ป็นทีน่ ิยมมาก คือ การหาจุดกลาง (Middle point) ของขอ้ มูล เราเรยี กว่าการวดั แนวโน้มเขา้ สศู่ นู ย์กลาง ของข้อมลู มคี ่าทางสถิตอิ ยู่ 3 ค่าทใี่ ชใ้ นการอธิบายคอื ค่าฐานนยิ ม(Mode) คา่ มัธยฐาน (Median) และคา่ เฉลยี่ (Mean)
o คา่ ฐานนยิ ม(Mode) บง่ บอกว่าส่วนใหญ่เปน็ แบบนั้น ไดม้ าจาก การแจกแจงความถ่ี (Frequency distribution) โดยการนาข้อมลู เรยี งขอ้ มลู จากมากไป หานอ้ ยหรอื จากน้อยไปมาก เพื่อหาคะแนนท่ีเกดิ ซ้ากนั ในแตล่ ะกล่มุ หรือช่วงคะแนนวา่ มีจานวนเทา่ ไร ดังนั้นคะแนนทีเ่ กิดซา้ กันทม่ี คี วามถมี่ ากทส่ี ุดคือ คา่ ฐานนยิ ม(Mode) ต.ย. ชุดข้อมลู 4 8 7 7 5 4 7 7 8 7 7 7 9 4 เรียงขอ้ มลู จากนอ้ ยไปมากจะได้ 4 4 4 5 7 7 7 7 7 7 7 8 8 9 แลว้ แจกแจงความถแ่ี จกแจงความถีไ่ ด้ ดงั นี้ 4 = 3, 5 = 1, 7 = 7, 8 = 2, 9 = 1 o ค่ามธั ยฐาน (Median) ค่าขอ้ มลู ท่อี ยูต่ าแหนง่ ก่ึงกลางของชดุ ขอ้ มูลทีน่ ามาเรียงลาดบั จากมากไปหานอ้ ยหรือจากนอ้ ยไปมาก อาจเป็นค่าใดค่าหนง่ึ ของขอ้ มลู หรอื อาจเปน็ คา่ ที่คานวณขนึ้ มาใหม่ ซึง่ ไม่ตรงกับค่าของข้อมูลใดๆก็ได้ ใช้ในการเปรยี บเทียบความแตกตา่ งแต่ละกลมุ่ ข้อมลู สตู รในการหาตาแหน่ง = (������ + 1)/2 n คอื จานวนข้อมลู ทงั้ หมด ต.ย. ชดุ ขอ้ มลู 6, 5, 6, 8, 2, 2, 3, 2, 4, 2 ซึง่ มีข้อมลู 10 ตวั สามารถเรยี งลาดับจากน้อยไปมากได้ 2, 2, 2, 2, 3, 4, 5, 6, 6, 8 ค่ากงึ่ กลางมสี องคา่ คือ 3 และ 4 ดงั นนั้ จงึ ตอ้ งหามชั ฌิมของสองตัวนี้ ซงึ่ ในกรณนี ี้จะใชม้ ัชฌิมเลขคณิต ดังนน้ั มธั ยฐานของข้อมูลชุดน้ี เท่ากบั (3 + 4) / 2 = 3.5
o คา่ เฉลี่ย (Mean) ค่าเฉลีย่ ซึ่งเกดิ จากข้อมลู ของผลรวมทัง้ หมดหารด้วยจานวนรายการของขอ้ มูล สตู รค่าเฉลีย่ คือ ผลบวกของข้อมลู ทกุ คา่ , n คือ จานวนข้อมูลทัง้ หมด ต.ย. วดั ส่วนสูงของนกั เรยี นชั้นป.6 จานวน 10 คน วดั เป็นเซน็ ติเมตร มดี งั น้ี 155 154 153 152 157 158 160 156 153 152 ส่วนสงู โดยประมาณ คือ (155 + 154 + 153 + 152 + 157 + 158 + 160 + 156 + 153 + 152) / 10 = 155 เซ็นติเมตร o อัตราส่วน (Ratio) การเปรียบเทียบตัวเลขจานวน 2 จานวนวา่ จานวน x เปน็ กี่เทา่ ของจานวน y ต.ย. รร.ประถมศึกษาแหง่ หน่งึ มนี กั เรียนช้ันป.6 55 คน แบง่ เปน็ นักเรยี นชาย 20 คน และนกั เรยี นหญิง 35 คน อัตราส่วนนักเรียนชายต่อนักเรียนหญิง 1 คน = 20/35 = 0.57 คน อัตราสว่ นนกั เรียนหญงิ ตอ่ นกั เรยี นชาย 1 คน = 35/20 = 1.75 คน ในการหาค่าอัตราสว่ นควรให้ตวั ต้ังเป็นคา่ ท่มี ากกวา่ เลขจะไดอ้ อกมามากกวา่ 1
o การแจกแจงความถ่ี (Frequency distribution) ข้ันตอนการแจกแจงความถ่ี 1. นาข้อมูลเรยี งข้อมลู จากมากไปหานอ้ ยหรอื จากน้อยไปมาก เพอื่ หาคะแนนท่ีเกิดซ้ากนั ในแตล่ ะกลมุ่ หรือช่วงคะแนน 2. หาค่าพสิ ัยของคะแนน เพ่อื บอกขอบเขตข้อมูล ค่าพสิ ัย (Range of data) = คะแนนสูงสดุ – คะแนนต่าสุด ค่าพสิ ยั มาก หมายถึง ขอ้ มูลมีการกระจายตวั มาก ค่าพสิ ัยน้อย หมายถึง ข้อมลู มกี ารกระจายตวั นอ้ ย 3. จานวนช้ัน ถ้าพิสัยมากก็กาหนดจานวนชนั้ มาก ถ้าพสิ ยั นอ้ ยกก็ าหนดจานวนชนั้ นอ้ ย โดยปกตชิ ้ันจะอยรู่ ะหว่าง 7–15 ชั้นซึ่งควรไม่เกนิ 20 ชนั้ 4. หาชอ่ งกว้างของคะแนนในแตล่ ะชัน้ คอื หาอนั ตรภาคชัน้ ( Class Interval ) อันตรภาคชน้ั = พิสัย / จานวนช้นั 5. เขยี นขีดจากดั ชัน้ ของคะแนนแต่ละชั้นลงในช่องคะแนน โดยเร่มิ จากคะแนนต่าสดุ หรือสงู สุด จดั ทาตาราง 6. ขดี รอยคะแนน ( Tally ) ในแตล่ ะชั้น และหาความถ่ี f (frequency)
o การแจกแจงความถ่ี (Frequency distribution) (ต่อ) ต.ย. คะแนนผลการสอบวชิ าคณติ ศาสตร์ของนกั เรียนชน้ั ม.3 จานวน 50 คน ดงั นี้ 25 85 55 37 41 90 74 77 69 60 46 56 46 66 64 63 62 68 45 59 54 73 67 73 64 75 79 59 58 37 54 63 59 65 46 55 56 46 66 69 1. หาคะแนนสงู สุด และคะแนนต่าสดุ → คะแนนสงู สุด : 90, คะแนนต่าสุด : 25 2. ผลต่างของคะแนนสงู สดุ กบั คะแนนต่าสดุ (ค่าพิสยั ) → 90 – 25 = 65 3. กาหนดความกวา้ งของอันตรภาคชั้น → 65/7 = 9.2 ≈ 10 4. เขยี นช้ันคะแนนจะเริม่ จากช้ันของคะแนนต่าสุดไปหาชน้ั ของคะแนนสงู สดุ หรือ จากชน้ั ของคะแนนสงู สดุ ไปหาชัน้ ของคะแนนต่าสุดก็ได้ 5. นบั จานวนรอยคะแนนของแต่ละช้ันไดเ้ ท่าใดกจ็ ะเป็นความถี่ของคะแนนในชั้น
o ค่าความแปรปรวน (Variance) ความแปรปรวนกลุ่มตัวอย่าง ความแปรปรวนประชากร ความแปรปรวนมาก หมายถึง ขอ้ มลู มคี วามแตกตา่ งมาก ความแปรปรวนนอ้ ย หมายถงึ ข้อมูลมีความแตกตา่ งนอ้ ย ต.ย. ชุดข้อมลู 1 1 1 3 3 3 3 3 4 4 5 6 7 7 9 ค่าเฉลย่ี (Mean) = 60 / 15 = 4 ค่าสูงสดุ = 9 คา่ ตา่ สดุ = 1 ค่าพิสัย = 8 คา่ ความแปรปรวน (Variance) = ((1-4)2 + (1-4)2 + (1-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (4-4) 2 + (4-4) 2 + (5-4) 2 + (6-4) 2 + (7-4) 2 + (7-4) 2 + (9- 4) 2 ) / 14 = 80/14 = 5.71
o สว่ นเบยี่ งเบนมาตรฐาน (SD. Standard Deviation) เพอ่ื บอกการกระจายตัวของขอ้ มูล โดย ������ คอื คา่ เฉลย่ี ส่วนเบย่ี งเบนมาตรฐานกลุ่มตวั อย่าง ส่วนเบี่ยงเบนมาตรฐานประชากร ต.ย. ชดุ ขอ้ มูล 1 1 1 3 3 3 3 3 4 4 5 6 7 7 9 คา่ เฉล่ยี (Mean) = 60 / 15 = 4 คา่ สงู สดุ = 9 ค่าตา่ สุด = 1 คา่ พิสยั = 8 ค่าความแปรปรวน (Variance) = ((1-4)2 + (1-4)2 + (1-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (3-4) 2 + (4-4) 2 + (4-4) 2 + (5-4) 2 + (6-4) 2 + (7-4) 2 + (7-4) 2 + (9-4) 2 ) / 14 = 80/14 = 5.71 สว่ นเบ่ยี งเบนมาตรฐาน (SD.) = √5.71 = 2.38
ตวั อยา่ งการแจกแจงความถีด่ ้วย Google Sheet ต.ย. ชุดข้อมูลจานวน 40, 35, 24, 45, 22, 34, 22, 54, 49, 36 Function ใน Google Sheet 1. ฐานนิยม =mode( 2. มธั ยฐาน =median( 3. ค่าเฉล่ีย =average( 4. คา่ สูงสดุ =max( 5. คา่ ต่าสดุ =min( 6. คา่ ความแปรปรวนกลุ่มต.ย. = var.s( 7. สว่ นเบยี่ งเบนมาตรฐานกลุ่มต.ย. = stdev.s( 8. คา่ ความแปรปรวนประชากร = var.p( 9. ส่วนเบีย่ งเบนมาตรฐานประชากร = stdev.p(
การหาข้อสรุปขอ้ มูล (Summarization) เมอ่ื ไดแ้ จกแจงความถแ่ี ลว้ จึงนาข้อมลู ดาเนนิ การดงั นี้ 1. หาค่ากลางของข้อมลู ▪ มัชฌมิ เลขคณติ (Arithmetic Mean) /คา่ เฉลี่ย (Mean) = ผลบวกของทกุ ค่าของขอ้ มลู /จานวนขอ้ มลู ▪ มัธยฐาน (Median) คะแนนหรือคา่ ณ ตาแหนง่ กึ่งกลางของข้อมลู ชดุ นนั้ เมื่อไดเ้ รยี งข้อมูลตามลาดบั กรณีทีจ่ านวนขอ้ มูลเปน็ เลขคู่ ตวั ที่ อยู่ตรงกลางจริงๆ ไม่มี เราจาเป็นต้อง เอาสองตวั ทอ่ี ยู่ กลางท่สี ุดมาหาคา่ เฉล่ีย โดยเอาค่ากลาง 2 ตวั มาบวกกัน/2 ไม่จาเป็นว่าคา่ มัธยฐาน จะต้องเทา่ กบั ค่าเฉล่ยี ▪ ฐานนยิ ม (Mode) คะแนนหรอื คา่ ทมี่ คี วามถี่สงู สุด หรอื ซ้ากนั มากทสี่ ุดของข้อมลู ชุดน้นั นาข้อมลู แจกแจงความถม่ี าเขยี นกราฟ โดยให้ แกนนอน แทนอนั ตรภาคชั้น ขอ้ มูลต่อเนื่อง เชน่ เวลา อายุ คะแนนฯ แกนตง้ั แทนความถ่ี เชน่ จานวน ร้อยละ อตั ราฯ
การหาข้อสรปุ ขอ้ มูล (Summarization) (ตอ่ ) ส้นโค้งปกติหรือรปู ระฆงั การกระจายตวั ตา่ งกัน โค้งปกติ (Normal Curve) เป็นโคง้ ทมี่ ีลกั ษณะสมมาตร โดยมีคา่ เฉลย่ี (Mean) คา่ ฐานนยิ ม เสน้ โคง้ เบ้ทางขวาหรือทางบวก (Mode)และคา่ มัธยฐาน (Median)เทา่ กัน ข้อมลู ชดุ ใดมีการกระจายมาก : เส้นโคง้ ปกติจะมคี วามโด่ง เส้นโคง้ เบท้ างซา้ ยหรอื ทางลบ น้อยหรอื ค่อนขา้ งแบน ข้อมลู ใดมีการกระจายน้อย : เส้นโคง้ ปกติจะมคี วามโดง่ มาก โค้งเบ้ (Skews Curve) เส้นโค้งเบท้ างขวาหรอื ทางบวก โค้งท่ีมี ค่าฐานนิยม (Mode) < คา่ มัธยฐาน (Median) < คา่ เฉล่ยี (Mean) (คา่ เฉลี่ยมากทสี่ ุด) เสน้ โคง้ เบ้ทางซา้ ยหรือทางลบ โค้งท่มี ี ค่าฐานนยิ ม (Mode) > ค่ามธั ยฐาน (Median) > คา่ เฉลีย่ (Mean) (ฐานนิยมมากทสี่ ุด)
การหาขอ้ สรุปข้อมลู (Summarization) (ต่อ) 2. หาค่าการกระจายขอ้ มลู การท่ีขอ้ มลู ชดุ หน่ึงชุดใด มีลักษณะแผก่ ว้างออกไปตามแนวนอนของแกนพกิ ดั ฉากของกราฟ ค่าเบ่ยี งเบน มาตรฐานที่ตา่ หมายถึงข้อมูลมกี ารจับกลุม่ กัน ค่าเบ่ียงเบนมาตรฐานทส่ี ูงหมายถงึ ข้อมลู มกี ารกระจายตัวกนั มาก สว่ นเบีย่ งเบนมาตรฐาน SD (Standard Deviation) 1. คา่ เฉลีย่ ของขอ้ มลู = ผลบวกของทกุ ค่าของข้อมลู /จานวนข้อมลู 2. นาข้อมูลแต่ละตวั – ดว้ ยคา่ เฉลย่ี แลว้ นาคาตอบที่ไดย้ กกาลงั 2 3. นาคาตอบท่ีไดม้ าบวกกนั / (จานวนขอ้ มลู ตัวอยา่ ง – 1) 4. นาคาตอบทไี่ ดไ้ ปถอด square root ต.ย. ต้องการหาส่วนเบยี่ งเบนมาตรฐานกล่มุ ตวั อยา่ ง 5 คนมีอายดุ ังนี้ 16, 15, 20, 26, 17 Sol : ค่าเฉล่ียของข้อมลู = (16+15+20+26+17)/5 = 18.8 = (16-18.8)2 +(15-18.8)2 +(20-18.8)2 +(26-18.8)2 + (17-18.8)2 = 78.76 / (5-1) = 19.69 = √19.69 = 4.437
การหาข้อสรุปขอ้ มูล (Summarization) (ต่อ) ▪ การหาสดั สว่ น (proportion) เป็นตวั เลขสองตัวหารกนั A / B โดยที่ A เปน็ สว่ นหนง่ึ ของ B และมหี น่วยเดียวกนั มคี า่ ระหวา่ ง 0-1 ไม่ตอ้ งมีเลข ศนู ยน์ าข้างหนา้ เพราะมีคา่ ไม่เกนิ หนง่ึ เชน่ สดั ส่วนของเพศชายในประชากรท้งั หมด market share เป็นตัวอยา่ งหนึง่ ของค่าสัดส่วน และจะแปลง เป็นรอ้ ยละกไ็ ด้ ▪ การหารอ้ ยละ (percent) เป็นคา่ สถิตทิ กี่ าหนดให้ฐานหรือตวั หาร (Denominator) หรอื ใหส้ ่วนเปน็ 100 หรอื 100% เกนิ 100 กไ็ ด้ ▪ ดัชนี (Index) เพ่ือติดตาม การเปลี่ยนแปลงของสิง่ ทต่ี ้องการวดั หรอื เป็นเครอ่ื งมือในการบ่งชสี้ ถานการณต์ า่ ง ๆ ทีส่ นใจ มกั แสดงในรูปของร้อยละ และกาหนดใหป้ ีฐานเป็น 100 เชน่ ดชั นรี าคาผบู้ รโิ ภคของประเทศ ปี 2543 กับ ปี 2544 สมมติตัวเลข ปี 2543 : 197.7 และปี 2544 : 202.6 ดัชนีราคาผู้บริโภคปี 2544 เพิม่ จากปี 2543 = (202.6/197.7) x 100 = 102.5 ดังน้ันดชั นเี พิม่ ขึ้นรอ้ ยละ 102.5-100 = 2.5 ดัชนีราคาผบู้ ริโภค ในปี 2544 ทีเ่ พิ่มข้นึ นี้ อาจบ่งบอกไดถ้ งึ ภาวะเงินเฟอ้ ท่เี พม่ิ ขน้ึ แตก่ ารเพม่ิ ขึน้ เพียงรอ้ ยละ 2.5 ไมถ่ อื ว่าเกดิ ภาวะเงินเฟ้อข้นึ ▪ อัตรา (rate) เป็นการเปล่ียนแปลงของปรมิ าณหน่งึ เทียบกับอีกปริมาณหนึ่ง เช่น อตั ราความเร็ว เทา่ กบั 120 กโิ ลเมตรต่อช่ัวโมง ตวั ตัง้ มีหน่วยเป็น ระยะทาง (กิโลเมตร) ตัวหารมหี น่วยเป็นเวลา (ชวั่ โมง) ▪ อัตราส่วน (ratio) คือการเปรยี บเทียบตัวเลขจานวน 2 จานวนว่าจานวน x เป็นกเ่ี ทา่ ของจานวน y โดย การท่ีอตั ราหรือแต้มตอ่ สองตวั หารกนั
การนาเสนอขอ้ มลู (Presentation of Data) หัวใจในการนาเสนอขอ้ มูล 1. เขา้ ใจบรบิ ทข้อมูล ความเชือ่ มโยง ความสมั พนั ธร์ ะหวา่ งขอ้ มลู 2. เขา้ ใจวา่ ใครเป็นคนรับขอ้ มลู พน้ื หลังของคนฟัง เชน่ ผูบ้ รหิ ารควรมรี ปู แบบทีต่ ่างออกไปจากกลุ่มผู้ปฏิบตั กิ าร 3. จานวนของข้อมูลมีมากขนาดไหน ถา้ ข้อมลู มจี านวนมากต้องอาศัยการรวบแถวข้อมูลเพอื่ จดั กล่มุ เป็นหมวดหมกู่ ่อน 4. เลือกรปู แบบการนาเสนอทีส่ ่งเสรมิ สง่ิ ท่ตี ้องการให้รับรู้ เรอื่ งราวทีจ่ ะส่ือสารชดั เจน 1) วาง plot เรือ่ งท่ีจะเรา จะ organize เรอ่ื งราวอย่างไร ลาดับก่อนหลัง ความเป็นเหตเุ ปน็ ผล 2) หลักสาคัญคือ กราฟจะนาเสนอ message อะไร กราฟต้องการเปรียบเทียบอะไรกับอะไร 3) มุ่งเนน้ จดุ ท่ตี ้องการให้สนใจ 5. การนาเสนออยา่ งมีแบบแผน เปน็ การนาเสนอท่จี ะตอ้ งปฏิบตั ิตามหลกั เกณฑ์ ทีไ่ ด้กาหนดไวเ้ ป็นมาตรฐาน ไดแ้ ก่ 1) การนาเสนอในรูปตาราง (Tabular presentation) 2) การนาเสนอดว้ ยกราฟเส้น (Line Chart) 3) การนาเสนอดว้ ยแผนภมู แิ ทง่ (Bar chart) 4) การนาเสนอด้วยรปู แผนภมู วิ งกลม (Pie chart)
การนาเสนอในรปู ตาราง (Tabular presentation) ▪ แสดงจานวน สัดสว่ น หรอื ค่าสถิติ ของตวั แปร ▪ มกั จะแสดงคราวละ 1-3 ตวั แปร ▪ หัวตารางตอ้ งระบุส่งิ ท่ตี อ้ งการนาเสนอ เวลา สถานท่ี (what who where when) ▪ หวั คอลัมน์ หัวแถว ต้องชดั เจน ระบหุ นว่ ย หรือมีหมายเหตทุ ่ีครบถ้วน หลักทศนิยมต้องตรงกนั ▪ อธิบายตวั ย่อ หมายเหตุท้ายตาราง อ้างอิง หรอื ขอบคุณทา้ ยตาราง Group Metric A Metric B Metric C Group1 $X.X Y% Z.ZZZ Group2 $X.X Y% Z.ZZZ Group3 $X.X Y% Z.ZZZ Group4 $X.X Y% Z.ZZZ Group5 $X.X Y% Z.ZZZ
การนาเสนอดว้ ยกราฟเสน้ (Line Chart) • ตอ้ งการเห็นความสมั พนั ธร์ ะหวา่ งสองตัวแปร • เปน็ พลอตที่โชวค์ า่ เชงิ ปริมาณของค่าทีเ่ ป็นลาดบั หรอื ถกู เรยี งไวอ้ ยแู่ ล้ว • แสดงแนวโนม้ หรอื ความคืบหนา้ ของ variable ตามเวลา เหน็ การเปล่ยี นแปลงตามช่วงเวลา • แสดง data ไดห้ ลายกลมุ่ ในกราฟเดยี ว • ควรใชเ้ ม่ือมี data ทต่ี ่อเนื่อง
การนาเสนอด้วยแผนภมู แิ ท่ง (Bar chart) Bar Chart หรอื Column Chart • ตอ้ งการแสดงถงึ ขนาดท่ตี ่างกนั หรือ จัดลาดับ • เป็นพลอตท่งี ่ายต่อการอ่าน และการเปรยี บเทยี บให้เห็นภาพมาก • แสดงค่าเชงิ ปริมาณของกลมุ่ นน้ั ๆ • ไมค่ วรใช้เมื่อมไี อเทมในการเปรียบเทียบเยอะเกนิ ไป เพราะจะยากในการอา่ นช่ือ (Label) • สามารถแสดงค่าติดลบได้ • เป็นพลอตหนง่ึ ที่ใชด้ ูตามเวลาได้ โดยใหแ้ กน x เปน็ ช่วงเวลา แกน y เป็นคา่ ที่เราสนใจเชิงปรมิ าณ Multi-set Bar Chart • เรยี กอกี ชื่อว่า Grouped Bar Chart หรือ Clustered Bar Chart • เป็นพลอตแบบหน่งึ ของ Bar Chart ใช้เมื่อมี data สองชุดข้ึนไป • แสดงคา่ เชงิ ปริมาณของแตล่ ะกล่มุ สามารถเปรียบเทียบคา่ ของกลุ่มนน้ั ๆได้ และยังแยกกลมุ่ ไดโ้ ดยใช้สโี ทนตา่ งๆ
การนาเสนอด้วยรปู แผนภูมวิ งกลม (Pie chart) Pie Chart และ Doughnuts Chart ▪ เป็นพลอตทีเ่ ป็นที่นิยม ▪ ไมเ่ ปล่ยี นแปลงตามเวลา ▪ แสดงสดั สว่ นของแตล่ ะไอเทมในกลุ่ม โดยทแี่ ต่ละ slice แสดงสดั ส่วนเปน็ เปอร์เซนท์ (รวมเป็น 100%) ▪ มกั ถูกใช้แสดงหลายไอเทมในพลอตเดียว แตต่ าของคนเราปกติจะแยกขนาดของ slice ขนาดใกล้เคียงกนั ไดย้ าก ▪ ในกรณีทมี่ สี ่วนเลก็ ๆ จะยากตอ่ การจบั คู่ label
การใชส้ ีท่ีเหมาะสมในการทา Data Visualization 1. ควรหลกี เลีย่ งการใช้สเี ขยี วพร้อมกบั แดง ถา้ จาเป็นควรใช้สเี ขียวอ่อนคู่ กับแดงเข้ม 2. คสู่ ีทีเ่ หมาะสมกบั คนตาบอดสี 3. ใชก้ ารไล่เฉดสาหรับขอ้ มลู ตัวเลข เช่น นา้ เงินสาหรับคา่ บวก ส้มสาหรบั คา่ ลบ 4. ใช้ palette สีที่ color-blind friendly (กรณีทโ่ี ปรแกรมที่ใช้งานมี รองรับ เชน่ Tableau ) การเห็นสที ตี่ า่ งกันของคนปกติ และ คนตาบอดสีแบบต่าง ๆ ภาพจาก Johannes Ahlmann หลีกเล่ียงการพ่งึ พาสีสาหรับการสือ่ สารข้อมูล อาจใชเ้ ครือ่ งหมายหรอื การแรเงาแทนการใชส้ ี 5.
การสร้าง Visualiztion บน Web Site ดว้ ย Google Sheets ▪ ใช้ Google Account Log in ▪ สร้างตารางข้อมูล ▪ คลุมตารางขอ้ มลู คลิกปุ่มกราฟ ▪ คลิกที่ ▪ คลิกท่ี Publish the chart
สามารถนา เอา iframe ไปวางไวท้ ี่ html block ไดเ้ ลย
ขอ้ มูล Chart ของ Google Sheets ▪ https://support.google.com/docs/answer/190718?hl=en
Q&A
Reference https://www.trueplookpanya.com/blog/content/61351/ https://dltv-static.catcdn.cloud/utils/files/download/53314 https://blog.datath.com/data-visualization-mindmap/ https://businessanalyticsnida.wordpress.com/2019/11/11/quartile-quintile-quantile/ https://datarockie.com/2019/12/04/interactive-charts-google-sheets/ https://sites.google.com/site/mystatistics01/chapter2/data-type?tmpl=%2Fsystem%2Fapp%2Ftemplates%2Fprint%2F&showPrintDialog=1 https://1stcraft.com/what-is-data/ https://sites.google.com/site/bugon2553/kradan-snthna https://nockacademy.com/ https://th.wikipedia.org/wiki/%E0%B8%94%E0%B8%B1%E0%B8%8A%E0%B8%99%E0%B8%B5%E0%B8%A3%E0%B8%B2%E0%B8%84%E0%B8%B2%E0%B8%9C%E0 %B8%B9%E0%B9%89%E0%B8%9A%E0%B8%A3%E0%B8%B4%E0%B9%82%E0%B8%A0%E0%B8%84 https://bigdata.go.th/big-data-101/data-visualization-for-color-blind/
Search
Read the Text Version
- 1 - 31
Pages: