Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore คู่มือการใช้โปรแกรมR

คู่มือการใช้โปรแกรมR

Published by bunthom.s, 2020-02-18 02:28:48

Description: คู่มือการใช้โปรแกรมR

Keywords: โปรแกรม,R

Search

Read the Text Version

การวิเคราะห์ค่าสถิติ – 95 – ในกรณที ่ีไม่ทราบค่า 12 ,  2 จะใช้ S 2 X 2  S12 / n1  S22 / n2 แทน  2 X 2 2 X1  X1  และเม่ือตัวอย่างที่ส่มุ มามมี ากพอ คือ n1 > 30 และ n2 > 30 จะได้ช่วงความเช่ือม่นั (1–)100% สาํ หรับ 1  2 จะอยู่ในรปู ( X1  X 2 )  Z1 /2 S12  S22  1  2  ( X1  X 2 )  Z1 /2 S12  S22 n1 n2 n1 n2 ในกรณีตัวอย่างทีส่ ่มุ มามีขนาดเล็ก n1 < 30, n2 < 30 ประชากรท้ังสองกลมุ่ ต้องมีการแจกแจงแบบปกตหิ รือสมมาตร แยกพิจารณาเป็น 2 กรณีคือ 1. ความแปรปรวนท้งั สองประชากรไมแ่ ตกต่างกัน (เทา่ กัน) จะประมาณคา่ ความ แปรปรวนด้วยค่าความแปรปรวนร่วม (Pooled variance) ดงั นี้ n1 ( X1i  X1)2  n2 ( X 2i  X 2 )2  (n1  1)S12  (n2  1)S22 โดยจะได้ n1  n2  2   SP2  i1 i1 n1  n2  2 ว่า (X1  X2 )  (1  2 ) tn1n22 หมายถึงมีการแจกแจงแบบทที ีม่ ี df=n1+n2 – 2 11 SP n1 n2 ดังนนั้ ช่วงความเช่ือมนั่ (1–)100% สําหรบั 1  2 จะอยู่ในรปู เมือ่(X1  X2 )  t /2.SP 1 1  1  2  ( X1  X 2 )  t /2.SP 1 1 n1 n2 n1 n2 df=n1+ n2 – 2 2. ความแปรปรวนทง้ั สองประชากรไมเ่ ท่ากัน (ต่างกัน) จะได้ว่า X1  X2 มีการ  S12  S22 2  n1 n2  แจกแจงแบบที ทีม่ ี df =  โดยท่ี   จะได้ช่วงความเชือ่ มนั่  S12 2  S22 2  n1    n2  n1 1 n2 1 (1–)100% สําหรบั 1  2 จะอยู่ในรปู ( X1  X 2 )  t /2, S12  S22  1  2  ( X1  X 2 )  t /2, S12  S22 n1 n2 n1 n2 การทดสอบสมมติฐานผลตา่ งค่าเฉลยี่ 2 ประชากรทีอ่ สิ ระกัน เพอื่ เปน็ การทดสอบเปรยี บเทียบค่าเฉล่ียของ 2 ประชากร โดยจะพจิ ารณากรณีที่ ท้ังสองประชากรเปน็ อสิ ระจากกัน การเปรียบเทยี บทงั้ 2 ค่า โดยตั้งสมมตฐิ านหลกั วา่ ท้ัง สองกลมุ่ เท่ากนั คอื 1  2 หรอื 1  2  0 และสมมติฐานทางเลือกแยกไดเ้ ปน็ 3 อย่างคือ 1  2 หรือ 1  2 หรือ 1  2 ซง่ึ จะพจิ ารณาการทดสอบสมมติฐาน 2 กรณดี งั น้ี ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิติและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 96 – การวเิ คราะหข์ อ้ มลู ทางสถติ ิ โดยใชโ้ ปรแกรม R 1. การทดสอบทางเดียวหรอื หางเดียว (One-tail test) ตั้งสมมติฐานดงั นี้ Ho : 1  2  0 แย้งกับ Ha : 1  2  0 หรือ Ha : 1  2  0 ซ่งึ ส่วนใหญ่แล้ว 0 จะมีคา่ เป็นศูนย์ 2. การทดสอบสองทางหรือสองหาง (Two-tail test) ตงั้ สมมตฐิ านดังนี้ Ho : 1  2  0 แย้งกบั Ha : 1  2  0 หรือ Ha : 1  2  0 ในการทดสอบสมมตฐิ าน Ho : 1  2  0 จะแบ่งออกเปน็ 2 กรณคี ือ 1. กรณคี วามแปรปรวนทงั้ สองประชากรไมแ่ ตกต่างกนั (เท่ากัน) จะใช้สถติ ทิ ดสอบคือ t  x1  x2 โดยท่ี SP2  (n1  1)S12  (n2  1)S22 ท่มี ี df = n1+n2 – 2 1 1 n1  n2  2 SP n1 n2 2. กรณคี วามแปรปรวนทง้ั สองประชากรไมเ่ ท่ากัน (ต่างกัน) จะใชส้ ถิติทดสอบคือ t  x1  x2  S12  S22 2   โดยทม่ี ี df =   n1 n2 S12  S22  S12 2   S22 2     n1 n2 n1 n2 n1 1 n2 1 ตัวอย่าง 6.15 ข้อมูลมี 2 ชุด ซง่ึ ชุดแรกมีค่า 11, 13, 15, 14, 13, 11, 12, 14 ชดุ ที่ 2 มีคา่ 21, 22, 25, 24, 23, 25, 24, 22 ต้องการทดสอบสมมตฐิ าน Ho : 1  2 แย้งกบั Ho : 1  2 และจงหาช่วงความเชื่อมัน่ 95% สําหรบั 1  2 วิธีทาํ เพ่ือให้มั่นใจวา่ ความแปรปรวนทง้ั สองกล่มุ เท่ากนั หรอื ไม่ โดยทาํ การทดสอบ ดงั นี้ จากผลการทดสอบจะเหน็ วา่ ความแปรปรวนของประชากรท้ังสองกลุ่มไม่แตกต่างกนั จึงเลือกการทดสอบการเทา่ กันของค่าเฉลี่ยในกรณีท่ีความแปรปรวนทง้ั สองประชากร ไม่แตกต่างกัน โดยใช้ฟังก์ชัน t.test() ใน R ดังนี้ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

การวเิ คราะหค์ า่ สถติ ิ – 97 – หากตอ้ งการทดสอบสมมตฐิ านว่าค่าเฉลย่ี กลุม่ ท่ี 1 น้อยกว่ากลมุ่ ที่ 2 สามารถใช้ ฟังกช์ นั t.test() ใน R ไดด้ งั นี้ ในกรณที ่ีความแปรปรวนทง้ั สองกล่มุ มีคา่ แตกตา่ งกนั ในการทดสอบน้ันสามารถใช้ Rcmdr ก็ไดโ้ ดย Statistics > Means > Indepent… ทงั้ นกี้ ่อนใช้คําสัง่ ต้องแปลงข้อมลู ในรูป stack variable ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

– 98 – การวิเคราะหข์ ้อมูลทางสถติ ิ โดยใช้โปรแกรม R การทดสอบสมมติฐานของผลตา่ งค่าเฉลยี่ 2 ประชากรท่ีไมอ่ สิ ระกนั ในกรณที ปี่ ระชากรท้ังสองไม่เป็นอิสระกัน กลา่ วคือมีข้อมูลสองกลุ่ม แตข่ อ้ มลู ท้งั สองกลุม่ นนั้ ไดค้ ่ามาจากการวดั จากหน่วยข้อมูลเดียวกนั แตท่ าํ การวดั ค่า สองคร้ังเช่น การทดสอบก่อนเรยี นก็จะได้ข้อมลู ชดุ หนึ่ง และทดสอบหลังเรียนก็จะได้ ขอ้ มูลอกี หนึ่งชุด หรือทางการแพทยม์ วี ิธกี ารรักษาโรคโดยบําบัดด้วยวธิ กี ารทหี่ นึง่ วัด ผลออกมา บาํ บัดดว้ ยวธิ กี ารท่ีสองวัดผลออกมา จะเห็นว่ามีข้อมูล 2 ชุด แต่ขอ้ มลู น้ัน ไดม้ าจากหน่วยข้อมูลเดยี วกันคอื คนป่วยคนเดียวกัน เหตกุ ารณ์น้เี ปน็ ขอ้ มูลท่ีไม่อสิ ระ กนั จงึ มวี ิธกี ารประมาณหรือทดสอบด้วยวธิ กี ารอีกแบบหนึ่ง โดยการคาํ นวณผลตา่ ง เป็นคู่ๆ (Paired or matched) คทู่ ่ี กลุ่ม1 กลุม่ 2 ผลตา่ ง โดยท่ี Di จะมกี ารแจกแจง 1 X1 Y1 D1=X1 – Y1 2 X2 Y2 D2=X2 – Y2 แบบปกตทิ ี่มีคา่ เฉล่ยี เท่ากับ D และ :: : i Xi Yi : ความแปรปรวนเทา่ กับ  2 ซง่ึ :: : Di=Xi – Yi D n Xn Yn : ประมาณค่าดว้ ย SD2 จะได้ Dn=Xn – Yn t  D  D tn1 SD / n โดยที่ n n (Di  D)2 n Di2  ( n Di )2 / n ซ่ึงทําให้สามารถมี  Di    D  i1 , SD2  i1 n 1  i1 i 1 n n 1 การกําหนดสมมติฐานไดเ้ ปน็ Ho : D  0 แย้งกับ Ha : D  0 หรอื Ho : D  0 แย้งกับ Ha : D  0 หรอื Ha : D  0 และหาช่วงความเช่อื มั่น (1–)100% สาํ หรบั D อยใู่ นรปู D  SD   D + t /2,n1 SD t /2,n1 n D n ตัวอย่าง 6.16 จากคะแนนสอบวิชาคณิตศาสตร์เร่อื งการบวกเลขเศษส่วนของนกั เรียนก่อน (PRE) และคะแนนสอบหลัง(POST) การเรยี นรู้ด้วยเทคนิค STAD ได้คะแนนดงั นี้ คนท่ี 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 PRE 15 7 10 8 7 5 12 9 10 11 10 9 12 13 8 17 POST 48 30 40 35 28 25 41 40 26 45 38 30 35 44 30 47 ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

การวิเคราะห์ค่าสถติ ิ – 99 – การประมาณค่าและการทดสอบสมมติฐานของผลตา่ งสัดสว่ น 2 ประชากร การประมาณผลต่างของสัดส่วน 2 ประชากร จะใชว้ ิธปี ระมาณด้วยการแจก แจงปกตมิ าตรฐาน นนั่ คือ ( pˆ1  pˆ2)  (P1  P2) มกี ารแจกแจงปกตมิ าตรฐาน pˆ1qˆ1 / n1  pˆ2qˆ2 / n2 โดยประมาณ ดงั นนั้ ชว่ งความเชอื่ มนั่ (1–)100% สําหรบั P1  P2 จะอย่ใู นรปู pˆ1qˆ1 pˆ 2 qˆ2 pˆ1qˆ1  pˆ2qˆ2 n1 n2 n1 n2 . . และ( pˆ1  pˆ2 )  Z1/2  < P1  P2 < ( pˆ1  pˆ2 )  Z1 /2 ในการทดสอบสมมติฐาน Ho : P1  P2 แย้งกับ Ha : P1  P2 หรอื Ha : P1  P2 หรือ Ha : P1  P2 จะใชส้ ถิตทิ ดสอบคือ Z ( pˆ1  pˆ2 )  (P1  P2 ) pˆ1qˆ1 / n1  pˆ2qˆ2 / n2 ตวั อย่าง 6.17 เพ่ือทดสอบเก่ียวกับการตัดสินใจซ้ือโทรศัพทม์ อื ถอื ยหี่ ้อหน่งึ ของนักศึกษา ชายและหญงิ โดยสมุ่ ถามนักศึกษาชาย 100 คน และนักศกึ ษาหญิง จาํ นวน 140 คน ไดข้ ้อมลู ดังนี้ ผลการตัดสินใจ นักศกึ ษาชาย นกั ศึกษาหญงิ เลือกซื้อ 40 80 ไมเ่ ลอื กซื้อ 60 70 รวม 100 140 จงหาชว่ งความเชอื่ มัน่ 95% ของผลตา่ งระหว่างสดั ส่วนของการตดั สนิ ใจ เลอื กซื้อโทรศัพทย์ ่ีห้อดงั กล่าว พร้อมทั้งทดสอบสมมตฐิ านว่าผลต่างระหวา่ ง สัดสว่ นของการตัดสนิ ใจเลอื กซ้อื โทรศัพท์ย่หี ้อดังกลา่ วเท่ากับศนู ย์ วธิ ที าํ ชว่ งความเช่อื มน่ั (1–)100% สาํ หรบั P1  P2 ซง่ึ Z0.025 = 1.96 = .P1  P2 pˆ1qˆ1  pˆ2qˆ2 ( pˆ1  pˆ2 )  Z1 /2 n1 n2 P1  P2 = (0.40  0.57)  1.96 0.4x0.6  0.57x0.43 100 140 ดังนัน้ ช่วงความเชื่อมน่ั 95% คอื – 0.296 < P1  P2 < – 0.044 การทดสอบสมมตฐิ าน Ho : P1  P2 แย้งกับ Ha : P1  P2 ใช้สถติ ทิ ดสอบคือ Z  (0.40  0.57)  0 0.40x0.60 /100  0.57x0.43 /140 สรปุ ไว้ให้ผู้อ่านสรปุ โดย Z0.025 = 1.96 – –และ Z0.025 = 1.96 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

– 100 – การวเิ คราะหข์ อ้ มูลทางสถิติ โดยใชโ้ ปรแกรม R ตัวอย่าง 6.18 จากการศกึ ษาอตั ราการเสี่ยงชวี ิตของการใช้ยา 2 ชนดิ คอื Aspirin และ Placebo สําหรบั บุคคลที่ปว่ ยเป็นโรคหัวใจ ไดผ้ ลตามตารางดังนี้ ผลการรกั ษา นักศกึ ษาชาย นักศกึ ษาหญงิ ตาย 104 189 จาํ นวนผ้ปู ่วย 11037 11034 จงหาช่วงความเชอื่ มนั่ 99% ของผลต่างระหวา่ งสดั ส่วนของการเสย่ี งของ ผปู้ ่วยทเี่ ปน็ โรคหัวใจทใ่ี ชย้ า Aspirin และ Placebo พร้อมท้งั ทดสอบ สมมตฐิ านวา่ ผลต่างระหว่างสัดส่วนของการเสี่ยงของผ้ปู ว่ ยที่เป็นโรคหัวใจทใ่ี ช้ ยา Aspirin และ Placebo ที่ระดบั ความเชื่อม่ัน 0.01 วิธีทํา ประมาณค่าผลตา่ งของสดั ส่วน กาํ หนดให้ pˆ1 เป็นสัดสว่ นของการตายเนื่องจากใช้ยา Aspirin กําหนดให้ pˆ2 เป็นสัดสว่ นของการตายเน่อื งจากใชย้ า Placebo ช่วงความเชือ่ มั่น (1–)100% สําหรับ P1  P2 ซง่ึ Z0.005 = 2.579 P1  P2  ( pˆ1  pˆ2 )  2.579 pˆ1qˆ1  pˆ2qˆ2 n1 n2 P1  P2  ( 104  189 )  2.579 (104)(11037 104)  (189)(11034 189) 11037 11034 (11037)3 (11034)3 P1  P2  0.00771 2.579(0.0015165)  (0.01162,0.003799) ทดสอบสมมติฐานผลต่างของสดั สว่ น ตง้ั สมมติฐาน Ho : P1  P2  0 vs Ha : P1  P2  0 ระดับนยั สาํ คญั 0.01 คาํ นวณค่าสถิตจิ ากข้อมลู คือ p  104 189  0.01328 และเลอื กตวั สถิติทดสอบ คือ 11037 11034 Z  pˆ1  pˆ2  0.00942  0.01713  4.99 p(1 p)  p(1 p) 0.01328(0.98672)  0.01328(0.98672) n1 n2 11037 11034 สรุปผล จะเหน็ ว่าคา่ ท่ีคาํ นวณได้ – 4.99 ซง่ึ ตก – =Z0.01 – 2.326 บรเิ วณวกิ ฤตจิ งึ ปฏเิ สธ หรอื ยอมรบั Zcal = –4.99 กลา่ วคือสัดส่วนของการเสี่ยงของผูเ้ ป็นโรคหวั ใจ ท่ีใช้ยา Aspirin นอ้ ยกว่าใช้ยา Placebo จรงิ อย่างมีนัยสาํ คัญยิ่ง ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

การวิเคราะห์คา่ สถิติ – 101 – การประมาณอตั ราสว่ นคา่ ความแปรปรวน ในการประมาณคา่ ความแปรปรวนของประชากรสองกลุม่ น้นั ซ่ึงจะไม่สามารถหาผลบวก หรือผลต่างของความแปรปรวนได้ เนื่องจากไม่สามารถหาตัวสถิติเพื่อใช้ในการประมาณ ผลต่างหรือผลบวกของสองกลุ่มเหมือนค่าเฉล่ียได้ทราบเพียงว่าอัตราส่วนของไคสแควร์สอง ตัวจะมกี ารแจกแจงเป็นเอฟ เม่ือพิจารณาประชากรกล่มุ หนงึ่ มกี ารแจกแจงเป็นโค้งปกติ และรู้ ค่าความแปรปรวน (2) จากประชากรทําการสุ่มตัวอย่างมาจํานวน n ค่า จํานวนอนันต์คร้ัง และในการสุ่มแต่ละคร้ังคํานวณหาค่าความแปรปรวน (S2) และนําค่าความแปรปรวนแต่ละ ค่ามาแจกแจงเป็นการแจกแจงความแปรปรวนของตัวอย่าง การแจกแจงนี้มีความสัมพันธ์ ทางตรงกับการแจกแจงแบบไคสแควร์ (2) คือ 2  (n 1)S2 หรือเขียนใหม่ได้เป็น n1  2  22 ซ่ึงเม่ือพิจารณาประชากรสองกลุ่ม จะได้ว่า  (n1 1)S12 แ ล ะ S2  n1 2 (n 1) n 1 12 1  2  (n2 1)S22 เมือ่ นําเอาไคสแควร์ 2 ตวั มาหารกัน จะได้วา่ n2 1 Fn 1,n 1  1 n 1  2 12 2 n2 1 2 2  (n1 1)S12 .  2 ซงึ่ เมอ่ื พจิ ารณา กรณี 12   2 จะได้ว่า Fn  (n1 1)S12 2 2 1 (n2 1)S22 1,n 1 12 (n2 1)S22 2 จึงสามารถประมาณอัตราส่วนของความแปรปรวน 12 โดยใช้ S12 สามารถสร้างช่วงความ  2 S22 2 เชื่อม่ันของ 12 โดยใช้ตัวสถิติ Fn 1,n 1  (n1 1)S12 ซ่ึงลักษณะการแจกแจงเอฟ ที่มี 12 (n2 1)S22  2 2 ระดับองศาความเป็นอสิ ระคอื 1  n1 1, 2  n2 1 /2 1– /2 0 f1 - /2 f/2 จากรปู จะเห็นไดว้ ่า P f1/2  F  f/2  1 โดยท่ีค่า f1/2 , f/2 เป็นค่าท่ีได้จาก การเปิดตารางเอฟ ที่มีระดับองศาความเป็นอิสระคือ 1  n1 1, 2  n2 1 เมื่อแทนค่า F จะได้    2 (n1  1)S12   = P  (n1  1)S12 1   2  (n1  1)S12 1  P  f1 /2 2 f /2   (n2 f /2 1 f1  12 (n2 1)S22 1)S 2  2 (n2 1)S 2 /2 2 2 2  1 ดงั น้ันเมื่อพิจารณาช่วงความเชือ่ มน่ั (1 – )100% สําหรับ 12 คือ  2 2 โดยท่ี และ ได้มาจากความ(n1 1)S12 1  12  (n1 1)S12 1 S12 S22 (n2 1)S22 f /2(1,2 )  2 (n2 1)S22 f1 /2(1,2) 2 แปรปรวนของตวั อย่างสุ่มท่อี สิ ระกนั สองกลุม่ ท่ีมขี นาด n1 และ n2 ตามลาํ ดบั จากประชากร ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 102 – การวเิ คราะห์ขอ้ มูลทางสถิติ โดยใช้โปรแกรม R ปกติ ซ่งึ หากตอ้ งการหาช่วงความเช่ือมั่น(1– )100% สําหรับ 1 ทําได้โดยการถอดรากท่ี 2 สองของจุดปลายทงั้ สองของชว่ งความเชอ่ื มัน่ 12  2 2 ตัวอยา่ ง 6.19 สารประกอบทางเคมชี นดิ หน่ึงผลติ จากโรงงานสองแห่ง คอื โรงงาน ก. และ โรงงาน ข. เพอื่ ตรวจสอบดวู า่ จะมีความแตกตา่ งเก่ียวกบั ความแปรปรวนของ เปอรเ์ ซ็นตข์ องแมงกานีสท่ีผสมอยูใ่ นสารประกอบทางเคมีดังกล่าว ซึ่งผลิตโดย โรงงานทัง้ สองหรือไม่ ผูท้ ําการวเิ คราะห์จึงไดส้ ุ่มตัวอยา่ งของสารประกอบชนดิ นี้ ซึ่ง ผลติ โดยโรงงาน ก. มา 10 ตวั อย่างนาํ มาหาคา่ ความแปรปรวนของเปอรเ์ ซ็นตข์ อง แมงกานีสท่ผี สมอยู่ได้ S12 = 0.088 และส่มุ ตวั อย่างของสารประกอบดงั กล่าวจาก โรงงาน ข. มา 8 ตวั อย่าง หาค่าความแปรปรวนของเปอร์เซ็นตข์ องแมงกานีสทผ่ี สม อยู่ได้ S22 = 0.065 ถ้าสมมติวา่ เปอรเ์ ซน็ ต์ของแมงกานสี ที่ผสมอยทู่ ้ังโรงงาน ก. และ ข. มกี ารแจกแจงแบบปกติ จงหาชว่ งความเชือ่ ม่นั 98% ของ 12 และ 1  2 2 2 เม่ือ 12 และ  2 เป็นความแปรปรวนทแี่ ทจ้ ริงของเปอร์เซน็ ตข์ องแมงกานีสทผ่ี สม 2 อยู่ในสารประกอบชนิดนี้ ซงึ่ ผลิตโดยโรงงาน ก. และ ข. ตามลําดับ วิธที าํ ชว่ งความเชือ่ ม่ัน 98% ของ 12 คอื S12 1  12  S12 f 0.01(2,1) S22 f 0.01(1,2 )  2  2 S22 2 2 โดยที่ n1  10, S12  0.088, 1  9 และ n2  8, S22  0.065, 2  7 จาก ตาราง f0.01(9,7)  6.72 และ f0.01(7,9)  5.61 จะได้ชว่ งความเช่อื ม่ัน 98% ของ 12 คอื 0.088 1  12  0.088 (5.61) หรือ 0.2015  12  7.5951  2 0.065 6.72  2 0.065  2 2 2 2 แตห่ ากใชก้ ารประมาณโดยใช้จาํ นวนตัวอย่างในแต่ละกลุม่ ร่วมด้วย จะไดช้ ว่ ง 2  2 1S1S))2212f 0 . 0 12( 1 , การประมาณดงั น้ี เมอื่(n1  1 S) 1 1  1  n( 1 (n2  1 S) 2 f 0 . 0 11(2, ) 2 n( 2 ) 2 2 แทนคา่ (10 1)0.088 1  12  (10 1)0.088 (5.61) ซง่ึ จะได้ผลการคํานวณ (8 1)0.065 6.72  2 (8 1)0.065 2 คือ 0.2590  12  9.7701 จากผลของการใชก้ ารประมาณสองแบบทําให้เหน็  2 2 วา่ หากใช้จาํ นวนตวั อย่างเข้าร่วมในการประมาณ จะทําให้ชว่ งการประมาณ กวา้ งขึ้นคือจาก (0.2015,7.5951) เป็น (0.2590,9.7651) ซงึ่ ไมผ่ ลดีต่อการ ประมาณและชว่ งความเช่ือม่ัน 98% ของ 1 คือ 0.2015  1  7.5951 2 2 หรือ 0.4489  1  2.7559 จากข้อสงั เกตจะเหน็ ว่าช่วงความเชือ่ มัน่ ของ 12 2  2 2 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

การวิเคราะห์คา่ สถิติ – 103 – และ 1 ครอบคลุมคา่ 1 ด้วย จงึ สามารถสรปุ ได้วา่ ความแปรปรวนทง้ั สอง 2 ประชากรไม่มีความแตกตา่ งกันหรือเทา่ กันเพราะอัตราสว่ นทัง้ สองใกล้คา่ 1 คาสัง่ ในโปรแกรม R ตัวอย่าง 6.20 ในการวเิ คราะห์กระบวนการทางเคมสี ําหรับการการกดั กรดบนแผงวงจร ผู้ ทดลองต้องการทดสอบตวั เร่งปฏกิ ริ ยิ า 2 ชนดิ วา่ ช่วยลดเวลาสาํ หรับการกัดกรด เท่ากนั หรือไม่ ในการทดลองเริ่มจากการเติมตัวเรง่ แตล่ ะชนิดลงในกระบวนการทาง เคมแี ล้วจับเวลา (นาที) ผลการทดลองพบวา่ n1 12, S12  0.7225, X1  24.6 และ n2 15, S22  0.9604, X2  22.1 จงหาชว่ งความเชือ่ มั่น 90% ของอตั ราส่วนความ แปรปรวนของตวั เรง่ ปฏิกริ ิยาทง้ั สองชนิด โดยสมมติวา่ ผลของตวั เรง่ ทง้ั สองชนดิ มีการ แจกแจงแบบปกติ วิธีทาํ ชว่ งความเชอื่ มั่น 90% ของ 12 คือ S12 1  12  S12 f 0.05( 2,1) S22 f 0.05(1,2 ) S22  2  2 2 2 โดยที่ n1  12, และS12  0.7225, X1  24.6 n2  15, S22  0.9604, X2  22.1 จากตาราง f0.05(11,14)  2.57 และ f0.05(14,11)  2.74 จะได้ช่วงความเช่อื ม่นั 90% ของ 12 คอื 0.7225 1 หรือ 12  0.7225 (2.74) 0.2927  12  2.0613  2 0.9604 2.57  2 0.9604  2 2 2 2 ซง่ึ หากใช้ (n1 1)S12 1  12  (n1 1)S12 f 0.01(2 ,1) จะได้ว่า f 0.01(1,2 )  2 (n2 1)S22 (n2 1)S22 2  12 12 หรือ ดงั นี้(11)0.72251 2.57 (14)0.9604  2  (11)0.7225 (2.74) 0.2304   2  1.6188 2 (14)0.9604 2 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 104 – การวิเคราะหข์ ้อมลู ทางสถิติ โดยใชโ้ ปรแกรม R การทดสอบสมมติฐานอัตราส่วนคา่ ความแปรปรวน การทดสอบสมมติฐานเกย่ี วกับความแปรปรวนประชากรสองกล่มุ จะใชเ้ มื่อต้องการ ทดสอบสมมติฐานเกีย่ วกับผลบวกหรือผลตา่ งของค่าเฉล่ยี เลขคณิตจากประชากรสองกลมุ่ แต่ กรณไี ม่ทราบความแปรปรวนของประชากรทั้งสองกลุ่ม เพื่อที่จะใช้ตัดสนิ ใจว่าประชากรทงั้ สอง กลุ่มมคี วามแปรปรวนเท่ากนั หรอื ไม่ เพราะจะได้เลือกตัวสถติ ทิ ดสอบคา่ เฉลย่ี ทเ่ี หมาะสม ซงึ่ ตัว สถิติทดสอบคา่ เฉลีย่ เลขคณิตมีสองตัวใหเ้ ลือก คือกรณีทที่ ้งั สองกลุม่ มีความแปรปรวนเท่ากัน และกรณีทีม่ ีความแปรปรวนไมเ่ ท่ากนั โดยหากเลือกตัวสถิตทิ ดสอบที่ไม่เหมาะสมอาจทําให้ผล การทดสอบไม่เป็นจริงตามขอ้ เทจ็ จรงิ ที่ควรจะเปน็ ทาํ ให้การทดสอบตัดสินใจผดิ ไป ซง่ึ ข้ันตอน ของการทดสอบสมมติฐานได้กลา่ วมาบ้างแล้วในกรณีประชากรกล่มุ เดียว มีขั้นตอนดังนี้ ขนั้ ตอนที่ 1 : ตงั้ สมมตฐิ าน Ho: 12 =  2 และสมมติฐานทางเลือก ซ่งึ มีอยู่ 3 ลกั ษณะคือ 2 หรอื หรือHa:12 2 12  2 12  2  2 Ha:  2 Ha:  2 ขั้นตอนท่ี 2 : กาํ หนดระดบั นัยสําคัญ  ขั้นตอนท่ี 3 : เลือกตวั สถติ ทิ ดสอบทเี่ หมาะสม คือ F  (n1 1)S12 2 ซึ่งเม่ือสมมติ Ho เป็น 2 (n2 1)S2212 จริง นั่นคอื  2 =  2 จะได้ F (n1 1)S12 มกี ารแจกแจงแบบ 1 2 (n2 1)S22 เอฟ ที่มี 1  n1 1, 2  n2 1 โดยประชากรตอ้ งมีการแจกแจง ปกติหรอื การแจกแจงปกตโิ ดยประมาณ ข้ันตอนที่ 4 : พิจารณาคา่ วกิ ฤต/บริเวณวกิ ฤติ โดยพิจารณาจากตวั สถิตทิ ดสอบ สมมติฐานทาง เลือก และกําหนดระดับนัยสาํ คัญ  ขน้ั ตอนท่ี 5 : คํานวณค่าตัวสถิติทดสอบจากข้อมูลหรือผลการทดลอง ข้นั ตอนที่ 6 : สรปุ ผลการทดสอบ โดยจะปฏิเสธ Ho ถ้าค่า F ทค่ี าํ นวณไดต้ กอย่ใู นบริเวณวกิ ฤติ สรุปได้ดังน้ี Ho: Ha: สถติ ทิ ่ีใช้ทดสอบ บรเิ วณวกิ ฤติ 12 =  2  2 2 F  (n1 1)S12 < fF 1(1,2 ) 2 1 2 (n2 1)S22  2 2 > fF (1,2 ) 1 2  2 2 1  n1 1, 2  n2 1 หรือ< fF 1 /2(1,2) < fF  /2(1,2 ) 1 2 ยังมีประเดน็ ทผ่ี ู้เรยี บเรยี งยงั ต้องพิจารณาคือ คา่ ตวั สถติ ิทดสอบ ซงึ่ หนงั สอื ท่ัวไปจะใช้ตัวสถิติ ทดสอบ เปน็ F  S12 โดยในหวั ขอ้ การทดสอบสมมตฐิ านประชากรเดียว ทราบวา่ S22 2  (n 1)S2 มกี ารแจกแจงแบบไคสแควร์ที่มี df เทา่ กับ n – 1 แตห่ ากทําการส่มุ จาก 2 0 ตัวอย่างสองกลมุ่ ท่ีไมเ่ ท่ากัน 2 / (n1 1)S12 2  (n2 1)S22 ซงึ่ พิจารณาแล้วนา่ จะ n 1 2 n 1 2 1 2 1 2 ได้ F  (n1 1)S12 ในกรณีที่ 12 =  2 แตห่ ากผวู้ ิจัยส่มุ ตวั อย่างทัง้ สองกลมุ่ มาเทา่ กัน ตัว (n2 1)S22 2 สถิตทิ ดสอบจะเป็นตามหนงั สือทั่วไป ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

การวิเคราะหค์ ่าสถติ ิ – 105 – ตวั อย่าง 6.21 เหลก็ เส้น 5 ชนิ้ ไดร้ บั การผลิตจากเครอ่ื งจกั รเครื่องท่ี 1 และเหล็กเสน้ 6 ชนิ้ ไดร้ ับการผลิตจากเครื่องจกั รเครือ่ งที่ 2 โดยเหลก็ เส้นจากตัวอยา่ งท้งั สองชุด ได้ข้อมลู คอื S12  0.00045 และ S22  0.00039 ตามลําดับ จงทดสอบว่าความแปรปรวนความ ยาวเหล็กเส้นจากเคร่ืองจักรเคร่ืองที่ 1 มากกวา่ เครื่องจักรเครื่องท่ี 2 หรอื ไม่ท่รี ะดับ นัยสาํ คญั 0.05 วธิ ีทํา ให้ 12 และ  2 คือความแปรปรวนจากเคร่ืองจกั รที่ 1 และ 2 ตามลาํ ดับ 2 . และ1  2 =  2 Ha: 12  2 Ho: 1 2  2 2. ระดับนัยสาํ คัญ 0.05 3. สถติ ิทดสอบ คอื F  (n1 1)S12 ทมี่ ี 1  4, 2  5 และบริเวณวิกฤติ (n2 1)S22 คอื > fF 0.05(4,5) = 5.19 4. คาํ นวณค่าสถติ ิทดสอบ F  (n1 1)S12  (4)(0.00045)  0.923 (n2 1)S22 (5)(0.00039) 5. สรุปผล ยอมรับ Ho: 12 =  2 เพราะคา่ F ทค่ี ํานวณได้มีค่า 0.923 2 ไม่ตกอยูใ่ นบรเิ วณวกิ ฤติ กล่าวคือความแปรปรวนความยาวเหล็กเสน้ จากเครื่องจักรที่ 1 กับเคร่ืองจักรที่ 2 เทา่ กัน ท่รี ะดับนัยสาํ คัญ 0.05 ตัวอยา่ ง 6.22 ในการศึกษาจํานวนวันท่นี ักศึกษาใช้จ่ายจนเงนิ หมดของ 2 กลุม่ โดยสุ่มถาม นักศึกษากลุ่มแรกและกลุ่มท่ีสองมาจํานวน 10 และ 20 คน ตามลาํ ดับ แล้วบนั ทกึ ขอ้ มูล ไดข้ ้อมลู ดงั นี้ กลมุ่ ที่ 1 :212 198 158 209 187 168 179 196 208 197 กลมุ่ ที่ 2 :156 179 193 186 167 203 193 178 213 177 195 186 204 174 185 191 185 183 179 189 จงทดสอบวา่ นักศกึ ษาทงั้ สองกลุ่มมีความแปรปรวนของจาํ นวนวันทีใ่ ชจ้ ่ายจนเงนิ หมด แตกต่างกันหรือไม่ ท่ีระดับนยั สําคญั 0.05 วธิ ที ํา ให้  2 และ  2 คอื ความแปรปรวนจากกล่มุ ท่ี 1 และ 2 ตามลําดับ 1 2 . และ1  2 =  2 Ha: 12  2 Ho: 1 2  2 2. ระดบั นัยสําคัญ 0.05 3. สถิติทดสอบ คอื F  (n1 1)S12 ท่มี ี 1  9, 2 19 และ (n2 1)S22 บรเิ วณวิกฤติ คือ > fF 0.975(9,19) = 2.88 = 1 = 1 0.3472 f 0.025(19,9) หรือ < fF 0.025(9,19) = 0.2715 4. คาํ นวณค่าสถติ ิทดสอบ จากขอ้ มลู ได้ S12  326.8444 และ S22  169.1158 คา่ สถิติทดสอบ F  (n1 1)S12  (9)(326.8444)  0.915 (n2 1)S22 (19)(169.1158) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 106 – การวิเคราะหข์ ้อมูลทางสถิติ โดยใช้โปรแกรม R 5. สรุปผล ยอมรับ Ho: 12 =  2 เพราะคา่ F ทค่ี าํ นวณได้มีค่า 0.915 2 ไม่ตกอยู่ในบริเวณวิกฤติ กล่าวคอื ความแปรปรวนของจํานวนวนั ท่ใี ช้จ่ายจนเงนิ หมด ท้งั สองกลุ่ม เท่ากนั ท่ีระดบั นัยสําคัญ 0.05 คาสัง่ ในโปรแกรม R ตัวอย่าง 6.23 ฝา่ ยวิจยั ตลาด ตอ้ งการทดสอบคะแนนความนยิ มของการเลอื กใชค้ อมพวิ เตอร์ แตกต่างกนั หรือไม่ จึงสุม่ ตัวอย่างผูใ้ ชค้ อมพิวเตอรม์ าสองยี่หอ้ คือ IBM และ HP ได้ ข้อมูลดงั น้ี IBM :81 86 73 77 90 91 75 62 98 74 HP :89 55 59 64 37 58 35 57 65 68 42 71 69 49 67 จงทดสอบว่าผใู้ ช้คอมพวิ เตอร์ท้ังสองกลมุ่ มคี วามแปรปรวนของคะแนนความนิยม แตกต่างกนั หรอื ไม่ ท่รี ะดับนัยสําคญั 0.05 วิธที ํา ให้  2 และ  2 คือความแปรปรวนจากกลุม่ ท่ี 1 และ 2 ตามลาํ ดับ 1 2 . และ1 12 =  2 Ha: 12  2 Ho: 2  2 2. ระดับนัยสําคัญ 0.05 3. สถติ ิทดสอบ คือ F  (n1 1)S12 ทมี่ ี 1  9, 2 14 และ (n2 1)S22 บรเิ วณวิกฤติ คือ หรือ> f fF 0.975(9,14) = .......... = 1 =1 0.025(14,9) ............ < fF 0.025(9,14) = .................. 4. คาํ นวณคา่ สถิติทดสอบ จากขอ้ มูล ได้ S12 113.3444 และ S22  201.4286 ค่าสถติ ทิ ดสอบ F  (n1 1)S12  ..................  ........ (n2 1)S22 .................. การวเิ คราะหค์ า่ สถติ ิ – 107 – ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

6.2.3 การอนุมานสาหรับ 2 ประชากรขึ้นไป (At least Two population) การทดสอบความแตกตา่ งระหว่างค่าเฉลี่ยของประชากรต้ังแต่ 2 ชุดข้ึนไป ทํา การทดสอบได้โดยใช้การวิเคราะห์ความแปรปรวน หลายท่านอาจจะแปลกใจไม่น้อยว่า จะตรวจสอบค่าเฉลี่ยของหลายกลุ่มว่าเท่ากันหรือต่างกันนั้น ไหนเลยเรียกว่าการ วิเคราะห์ความแปรปรวน ไม่ใช่ค่าเฉล่ีย ผู้เขียนขอท้ิงประเด็นไว้ก่อน และในบทนี้จะ กล่าวเฉพาะการวิเคราะห์ข้อมูลจากแบบแผนการทดลอง (Experimental design) 2 แบบ คือ แบบการจาแนกทางเดียว (One–way classification หรือ Randomized Complete Designs :RCD) และ แบบการสุ่มอย่างสมบูรณ์ในแต่ละกลุ่ม (Randomized Complete Block Designs :RCBD) ข้อกาหนดเบือ้ งตน้ ของข้อมูลทีส่ ามารถนาํ มาวิเคราะห์ความแปรปรวน ได้คือ 1. ขอ้ มลู ทนี่ ํามาวเิ คราะห์ต้องเปน็ ข้อมลู ตัวอย่าง 2. ความแปรปรวนของประชากรแต่ละกลุ่มเทา่ กัน 3. ประชากรเปน็ อิสระกัน 4. ประชากรมีการแจกแจงปกติ แบบการจาแนกทางเดียว (One–way classification หรือ Randomized Complete Designs :RCD) ทําการสุ่มตัวอย่างขนาด n จากประชากรแต่ละชุดใน k ชุดต่างๆ กัน ซ่ึงจําแนกประชากร k ชุดน้ีออกตามวิธีการปฏิบัติ (treatments) โดย สมมติว่าประชากร k ชุด เป็นอิสระกัน และมีการแจกแจงปกติที่มีค่าเฉล่ีย 1, 2,..., k และความแปรปรวนเทา่ กันคือ  2 ลักษณะของข้อมลู (Layout of Data) วิธกี ารปฏบิ ตั ิ (Treatments) ลาํ ดบั ที่ 1 2 … j … k 1 X11 X12 ... X1j ... X1k 2 X21 X22 ... X2j ... X2k : : : ... : ... : i Xi1 Xi2 ... Xij ... Xik : : : ... : ... : n Xn1 Xn2 ... Xnj ... Xnk รวม T. 1 T. 2 T. j T.k T.. คา่ เฉล่ีย X.1 X .2 X.j X .k ขั้นตอนการวิเคราะหค์ วามแปรปรวนแบบจาแนกทางเดยี ว มีดงั ต่อไปน้ี ขน้ั ท่ี 1. กําหนดสมมติฐาน Ho : 1  2  ...  k Ha : มีคา่ เฉล่ียอยา่ งน้อย 1 ค่ตู ่างกัน ข้นั ที่ 2. กาํ หนดระดบั นัยสําคัญ  ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถิติและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 108 – การวเิ คราะหข์ อ้ มลู ทางสถิติ โดยใช้โปรแกรม R ขั้นที่ 3. คํานวณค่าสถิติเอฟโดยการสร้างตาราง ANOVA ซึ่งมีข้ันตอนการ คาํ นวณดังน้ี Xij = ค่าสังเกตตวั ท่ี i ซง่ึ เลือกจากวธิ กี ารปฏิบัตทิ ี่ j T.j = ผลรวมของคา่ สงั เกตท้งั หมดจากตวั อยา่ งท่มี ีวธิ ีการปฏิบตั ทิ ่ี j X.j = ค่าเฉล่ยี ของค่าสงั เกตจากตวั อยา่ งทม่ี วี ธิ ีการปฏบิ ัตทิ ่ี j T.. = ผลรวมของคา่ สงั เกตท้งั หมด nk ตวั ( N ) X..  T.. = ค่าเฉล่ียของคา่ สงั เกตท้ังหมด nk ตวั (N ) nk SST  k n X .. )2  k n X 2  T..2 คือผลบวกกาํ ลังสองของท้งั หมด   ( Xij   nk j 1 i1 ij j1 i1 (Sum of Square Total) = (Xij แต่ละตัวยกกาํ ลังสองแล้วบวกกนั ) – (((Xij ทกุ ตวั บวกกนั ) แลว้ ยก กําลังสอง) หารดว้ ยจํานวนค่าสังเกตทั้งหมด) SSTR  k  X..)2  k T. 2  T..2 คอื ผลบวกกาํ ลังสองของวธิ ีปฏบิ ตั ิ j nk n (X.j  nj1 j j 1 (Sum of Square Treatments) = ((ผลบวกในหลักท่ี 1) ยกกาํ ลังสอง) หารด้วยจํานวนสมาชิกในหลกั ท่ี 1 + ((ผลบวกในหลักท่ี 2) ยกกําลังสอง) หารด้วยจาํ นวนสมาชกิ ในหลกั ท่ี 2 +… + ((ผลบวกในหลกั ท่ี k) ยกกาํ ลงั สอง) หารด้วยจาํ นวน สมาชกิ ในหลักท่ี k – (((Xij ทุกตัวบวกกนั ) แล้วยกกําลงั สอง) หาร ด้วยจาํ นวนคา่ สังเกตทัง้ หมด) SSE = SST – SSTR = ผลบวกกําลังสองของความคลาดเคลื่อน (Sum of Square Error) ตาราง ANOVA ของการวิเคราะหค์ วามแปรปรวนแบบจําแนกทางเดียว แหลง่ ของการ ผลบวก ระดับข้นั ค่าเฉล่ียของผลบวก ค่าเอฟที่ แปรผนั กําลังสอง ความเสรี กําลังสอง (Mean คาํ นวณได้ (SOV) (SS) (df) Square) (MS) (F) วิธกี ารปฏบิ ัติ SSTR k–1 S12  SSTR  MSTR fcal  S12 (Treatment) k 1 S2 ความคลาด SSE k(n – 1) S2  SSE  MSE เคลื่อน k(n 1) (Error) ท้งั หมด SST nk – 1 (Total) ขน้ั ที่ 4. ระดบั ขั้นความเสรี 1 = k – 1 , 2 = k(n – 1) คา่ วกิ ฤตคอื f,(k1,k(n1)) บริเวณวิกฤตคือ >f f,(k1,k(n1)) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิติและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

การวิเคราะห์ค่าสถิติ – 109 – ขน้ั ท่ี 5. การสรปุ ผล ถ้าค่าสถิติ fcal มากกวา่ คา่ วิกฤต แลว้ ปฏิเสธ Ho หมายเหตุ การสรุปผลโดยใชค้ ่า P – value = Pr( f > )fcal หรือ Sig = Pr( f > )fcal ถา้ Sig <  ปฏเิ สธ Ho การทดสอบเพ่ือหาประชากรท่มี คี ่าเฉลีย่ ไมเ่ ทา่ กัน (MULTIPLE COMPARISONS) SCHEFFE’ Method (S Method) การทดสอบสมมตฐิ าน Ho : l  m  0 แยง้ กบั Ha : l  m  0 ทรี่ ะดบั นัยสําคัญ  สรุปวา่ ปฏิเสธ Ho ถา้ | Xl  Xm |  MSE( 1  1 ) (k 1) f ,(1,2 ) nl nm MSE หมายถึง MSE จากตารางวเิ คราะห์ความแปรปรวน nl หมายถึง ขนาดตวั อยา่ งชดุ ท่ี l และ nm ขนาดตวั อย่างชุดท่ี m f,(1,2) หมายถึงค่าเอฟทอี่ ่านจากตาราง มพี ้ืนที่ปลายทางขวาเท่ากบั ระดบั นัยสําคัญ  1 = k – 1 , 2 = k(n – 1) คือระดบั ขัน้ ความเสรี (degree of freedom) ของคา่ f ตัวอย่าง 6.24 เพื่อเปรียบเทียบกําลังต้านทานการดึงของยางท่ีผลิตโดยเครื่องจักร 6 เคร่ือง จึงสุ่มตัวอย่างขนาด 4 จากแต่ละเครื่องจักร ได้กําลังต้านทานการดึงเฉลี่ยหน่วยเป็น ปอนดต์ อ่ ตารางน้ิว x 10– 2 ดงั น้ี เครื่องจักร 123 456 17.5 16.4 20.3 14.6 17.5 18.3 16.9 19.2 15.7 16.7 19.2 16.2 15.8 17.7 17.8 20.8 16.5 17.5 18.6 15.4 18.9 18.9 20.5 20.1 จงวเิ คราะหค์ วามแปรปรวนท่ีระดับนัยสาํ คัญ 0.05 และตรวจสอบว่าคา่ เฉล่ยี ของการปฏบิ ตั แิ ตกต่างกนั อย่างมนี ัยสําคัญหรือไม่ วธิ ที าํ ขั้นที่ 1. กาํ หนดสมมติฐาน Ho : 1  2  ...  6 Ha : มีค่าเฉลี่ยอยา่ งน้อย 1 คู่ต่างกนั ขั้นที่ 2. กาํ หนดระดับนัยสาํ คญั  = 0.05 ข้ันที่ 3. คาํ นวณค่าสถติ เิ อฟโดยการสร้างตาราง ANOVA ซึง่ มขี ้นั ตอนการคาํ นวณดังน้ี Xij  คา่ สังเกตตวั ท่ี i ซ่งึ เลือกจากวธิ กี ารปฏิบตั ทิ ี่ j ; i = 1,2,…,4 ; j = 1,2,…,6 T.j  ผลรวมของคา่ สงั เกตทง้ั หมดจากตวั อย่างทม่ี วี ิธกี ารปฏิบัตทิ ี่ j X.j  ค่าเฉลีย่ ของคา่ สังเกตจากตัวอย่างที่มีวิธีการปฏิบัติที่ j เครื่องจกั ร 1 2 3 4 5 6 68.8 68.7 72.7 71.0 73.7 72.1 17.20 17.18 18.18 17.75 18.43 18.03 1.) คาํ นวณ CT =  kn X ij 2 T..2  (427)2 = 7597.04     j1 i1 nk nk 24 ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 110 – การวเิ คราะหข์ อ้ มูลทางสถิติ โดยใช้โปรแกรม R 2.) Total SS = SST  k n X 2 – CT = 7665.02 – 7597.04 = 67.98   j 1 i1 ij 3.) Treatment SS = SSTR  k  X.. )2  k T. 2  CT j n (X.j  nj1 j j 1  = (68.8)2  (68.7)2  ...  (72.1)2 – 7597.04 4 = 30409.52  7597.04 = 7602.38 – 7597.04 = 5.34 4 4.) ความคลาดเคลอื่ น SS = SSE  SST  SSTR = 67.98 – 5.34 = 62.64 ผลการวเิ คราะห์วาเรยี นซ์แสดงไว้ตามตาราง ANOVA ตาราง ANOVA ของการวิเคราะห์ความแปรปรวนแบบจาํ แนกทางเดียว Source of Variation Sum of Sq df Mean Square F 0.3068 Treatment 5.34 5 1.068 Error 62.64 18 3.480 Total 67.98 23 ข้ันท่ี 4. ระดับข้ันความเสรี 1 = k – 1 = 5 , 2 = k(n – 1) = 18 คา่ วกิ ฤตคอื f = f,(k1,k(n1)) 0.05,(5,18) = 2.77 บริเวณวิกฤตคือ f > f,(k1,k(n1)) ขั้นท่ี 5. การสรุปผล คา่ สถิติ fcal = 0.3068 มคี า่ น้อยกวา่ คา่ วิกฤต จงึ ยอมรับ Ho กลา่ วคือ เมื่อทาํ การเปรียบเทยี บกําลังต้านทานการดึงของยางที่ผลิตโดยเครือ่ งจักร 6 เครื่อง มคี ่าเฉลีย่ ไมแ่ ตกตา่ งกนั ที่ระดบั การตรวจสอบ 0.05 หรอื บางทีเรียกไมม่ ีนัยสาํ คัญทางสถติ ิที่ ระดับ 0.05 จงึ สรุปไดว้ ่ายางทผี่ ลติ โดยเครื่องจกั รใดกม็ คี วามทนทานท่เี ท่ากนั หากสรุปว่ายอมรับ Ho แล้วจบการทดสอบ แต่หากสรุปว่าปฏิเสธ Ho หรือยอมรับ Ha หมายถึงมีค่าเฉลี่ยอย่างน้อย 1 คู่ต่างกัน จะยังไม่จบการทดสอบ ต้องทดสอบต่อไปว่าแล้วค่าเฉลี่ยคู่ ไหนแตกต่างกัน ซง่ึ ได้แสดงตามตัวอยา่ งตอ่ ไป การคานวณโดยใชค้ าสง่ั oneway.test ในโปรแกรม R ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

การวิเคราะหค์ า่ สถิติ – 111 – ตัวอย่าง 6.25 ข้อมลู อทิ ธิพลของพิทูทารีฮอรโ์ มนตอ่ การขยายตัวของรงั ไข่ (gonad) ของปลาไหล1 ทรที เมนต์ ( j ) รวม ลําดบั ( i ) ต่อม 5 ตอ่ ม2 10 ตอ่ ม Anteron 10 IU. 20 IU. 1 1.74 4.37 0.94 6.02 2 1.50 2.40 1.25 3.78 3 2.08 3.67 2.15 5.71 4 2.48 1.84 1.64 6.01 5 0.57 3.70 1.25 7.64 6 2.29 3.98 3.67 7.28 7 2.01 6.44 4.11 10.20 n 12.67 26.40 14.10 46.64 99.81  Xij =X. j i1 n X 2 25.36 112.72 35.34 334.66 508.08 ij i1 X 2 .j n 22.93 99.57 28.40 310.76 461.66 n X 2  X 2 / n 2.43 13.15 6.94 23.90 46.42 ij .j i1 X. j 1.81 3.77 2.01 6.66 3.56 1 วดั เปน็ ค่า fixation of P32 in percent of the dose per gram of the gonads of the eel ผลงานของ กฤษณ์ มงคลปญั ญา และคณะ (พ.ศ.2512) 2 ตอ่ ม hypophysis ของปลาดุก วธิ ที าํ ขั้นท่ี 1. กาํ หนดสมมตฐิ าน Ho : 1  2  ...  4 Ha : มคี า่ เฉล่ยี อย่างน้อย 1 คตู่ า่ งกนั ขน้ั ที่ 2. กําหนดระดบั นยั สาํ คัญ  = 0.01 ขั้นที่ 3. คาํ นวณค่าสถติ เิ อฟโดยการสรา้ งตาราง ANOVA ซึ่งมีข้ันตอนการคาํ นวณดังน้ี Xij  ค่าสังเกตตัวท่ี i ซง่ึ เลอื กจากวธิ กี ารปฏบิ ัติท่ี j ; i = 1,2,…,7 ; j = 1,2,…,4 T.j  ผลรวมของคา่ สงั เกตทัง้ หมดจากตวั อย่างทีม่ วี ิธีการปฏบิ ัติที่ j X.j  ค่าเฉลีย่ ของค่าสงั เกตจากตัวอย่างทม่ี วี ธิ ีการปฏบิ ตั ทิ ี่ j 1.) คาํ นวณ CT =  kn X ij 2 T..2  (99.81)2 = 355.79     j1 i1 nk nk 28 2.) Total SS = SST  k n X 2 – CT = 507.91 – 355.79 = 152.12   j 1 i1 ij 3.) Treatment SS = SSTR  k  X.. )2  k T. 2  CT j n (X.j  nj1 j j 1  = (12.67)2  (26.40)2  (14.10)2  (46.64)2 – 355.79 7 = 103.14 ซ่ึงบางทีเรียกวา่ among group SS 4.) ความคลาดเคล่ือน SS = SSE  SST  SSTR = 152.12 – 103.14 = 48.98 ซง่ึ บางทเี รียกวา่ within group SS หรอื residual SS ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 112 – การวเิ คราะหข์ อ้ มลู ทางสถติ ิ โดยใช้โปรแกรม R ผลการวเิ คราะหว์ าเรยี นซ์แสดงไว้ตามตาราง ANOVA ตาราง ANOVA ของการวิเคราะห์ความแปรปรวนแบบจาํ แนกทางเดียว SOV SS df MS F 16.853*** Treatment 103.14 3 34.38 Error 48.98 24 2.04 Total 152.12 27 ข้ันที่ 4. ระดบั ขน้ั ความเสรี 1 = k – 1 = 3 , 2 = k(n – 1) = 24 > f ,(k 1,k (n1)) คา่ วกิ ฤตคือ f = f ,(k 1,k (n1)) = 4.72 บริเวณวกิ ฤตคือ 0.01,(3,24) f ขั้นท่ี 5. การสรปุ ผล ค่าสถติ ิ fcal = 16.853 มีคา่ มากกว่าค่าวิกฤต จงึ ปฏิเสธ Ho กลา่ วคือ เมอื่ ทาํ การเปรียบเทยี บอิทธิพลของพทิ ทู ารีฮอรโ์ มนตอ่ การขยายตวั ของรงั ไขท่ ั้ง 4 ทรที เมนต์ มีค่าเฉลยี่ ที่แตกตา่ งกันท่ีระดบั การตรวจสอบ 0.01 หรือบางทีเรียกค่าเฉลยี่ แตกตา่ ง กนั อยา่ งมนี ัยสําคญั ทางสถิติทรี่ ะดบั 0.01 เพ่ือจะทดสอบวา่ คูไ่ หนทีม่ ีค่าเฉลยี่ ต่างกัน จะทดสอบที ละค่โู ดยใชว้ ิธขี อง SCHEFFE’ Method (S’ Method) การทดสอบสมมตฐิ าน Ho : l  m  0 แย้งกับ Ha : l  m  0 ท่ีระดบั นยั สําคญั  เราสรุปว่า ปฏเิ สธ Ho ถา้ | Xl  X m | MSE( 1  1 ) (k 1) f ,(1,2 )  1.93(1  1) 3(4.72)  0.55 14.16 nl nm 77 = 2.794 ซงึ่ เปน็ คา่ วิกฤตของแต่ละคู่ แล้วทําการเรยี งค่าเฉลยี่ จากตาํ่ ไปหาสงู เพอ่ื ความสะดวก ในการนบั ระยะการเปรยี บเทยี บระหว่างค่าเฉลยี่ 2 ค่า | Xl  Xm | แสดงดังตาราง 5 ต่อม 10 IU 10 ตอ่ ม 20 IU 5 ต่อม 1.81 2.01 3.77 6.66 10 IU - 0.20 1.96 4.85** 10 ต่อม - 1.76 4.65** - 2.89 จะเห็นได้ว่าค่าผลต่างของกลุ่ม 5 ต่อม และกลุ่ม 20 IU (| Xl  Xm | ) มีค่า 4.85 มากกว่า 2.794 จงึ สรุปได้ว่าค่าเฉลยี่ กลุ่ม 5 ต่อม และกลุ่ม 20 IU แตกต่างกัน เช่นเดียวกับผลต่างของกลุ่ม 10 IU และกลุม่ 20 IU (| Xl  Xm |) มคี า่ 4.65 มากกวา่ 2.794 จึงสรุปได้ว่าค่าเฉล่ียกลุ่ม 10IU และกลุ่ม 20 IU แตกตา่ งกนั การเปรยี บเทียบค่าเฉล่ียโดย Least Significant Difference (LSD) มีหลักเกณฑ์สําหรับการ test เปรยี บเทยี บระหว่างค่เู ฉล่ยี โดยการคํานวณ LSD() = t Sd LSD(0.05) = t0.05Sd = 2.064(0.743) = 1.534 LSD(0.01) = t0.01Sd = 2.797(0.743) = 2.078 ความแตกต่างท่ีสงั เกตได้ = | X1  X2 | = 1.81 – 3.77 = 1.96* significance at 0.05 | X3  X4 | = 2.01 – 6.66 = 4.65** significance at 0.01 (Highly Sig) ในการทดสอบความแตกต่างของค่าเฉล่ียเป็นคู่ๆ มีได้หลายวิธี ซ่ึงไม่ได้กล่าวไว้ในที่นี้ สามารถหาศึกษาได้ตามหนังสือสถิติทั่วไปได้ เช่น Duncan’s New Multiple Range Test วิธีของ Tukey’s W–Procedure หรือวิธี Student–Newman–Keul’s Test และจะเลือก การทดสอบดว้ ยวิธีใดข้นึ กบั นกั วิจยั ชื่นชอบหรือเข้าใจ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

การวิเคราะหค์ า่ สถิติ – 113 – การคานวณโดยใชค้ าสั่ง oneway.test ในโปรแกรม R แบบที่มีการสุ่มอย่างสมบรู ณใ์ นแตล่ ะกล่มุ (Randomized Complete Block Designs :RCBD) ทําการสุ่มตัวอย่างขนาด b จากประชากรแต่ละชุดใน k ชุดต่างๆ กัน ซึ่งจําแนกประชากร k ชุดนี้ออกตามวิธีการปฏิบัติ (treatments) ซึ่งสมมติว่าประชากร k ชุด เป็นอิสระกัน และมีการแจก แจงปกติที่มี .j = คา่ เฉลีย่ ของประชากร Treatment ที่ j โดยที่ j = 1, 2, 3, …, k i. = คา่ เฉลี่ยของประชากร Block ท่ี i โดยที่ i = 1, 2, 3, …, b ลักษณะของข้อมูล (Layout of Data) วิธีการปฏบิ ัติ (Treatments) กลมุ่ ท่ี 1 2…j… k รวม ค่าเฉลีย่ X12 ... X1j ... กลุ่มท่ี1 X11 X22 ... X2j ... X1k T1. X1. กล่มุ ท่ี2 X21 : ... : ... X2k T2. Xi2 ... Xij ... :X 2. : : : ... : ... : : :X i. กลุ่มที่ i Xb2 ... Xbj ... Xi1 Xik Ti. X b. : T. 2 T.j กลุ่มท่ี b : X.2 X . j : : X .. รวม ค่าเฉลยี่ Xb1 Xbk Tb. T. 1 T.k T.. X .1 X .k ขน้ั ตอนการวิเคราะห์ความแปรปรวนแบบ RCBD มดี ังต่อไปนี้ ข้นั ท่ี 1. กาํ หนดสมมติฐานของการทดสอบว่าค่าเฉล่ียประชากรของทุก Treatment เท่ากนั H0' : .1  .2  ...  .k   H ' : . j มีค่าอย่างนอ้ ย 1 ค่ตู ่างกัน a ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 114 – การวิเคราะหข์ ้อมลู ทางสถิติ โดยใชโ้ ปรแกรม R กาํ หนดสมมตฐิ านของการทดสอบว่าค่าเฉลีย่ ประชากรของทุก Block เท่ากัน H0\" : 1.  2.  ...  b.   H \" : i. มคี า่ อยา่ งน้อย 1 คู่ต่างกัน a ขั้นท่ี 2. กาํ หนดระดบั นยั สาํ คัญ  ขั้นท่ี 3. คาํ นวณค่าสถิติเอฟโดยการสร้างตาราง ANOVA ซ่ึงมีขน้ั ตอนการคํานวณดังนี้ Xij = คา่ สงั เกตของวิธกี ารปฏบิ ตั ิที่ j ในกลุ่มท่ี i โดยท่ี j = 1,2,3,…,k และ i = 1,2,3,…,b =Xij เปน็ ตัวแปรสมุ่ ปกตแิ ละเป็นอิสระตอ่ กัน มคี า่ เฉลีย่  และความแปรปรวนเท่ากันคอื  2 X.j = คา่ เฉลีย่ ของค่าสังเกตจากตัวอย่างที่มวี ธิ ีการปฏิบัติที่ j Xi. = ค่าเฉลย่ี ของค่าสงั เกตจากตวั อย่างท่ีมาจากกลมุ่ ที่ i T.j = ผลรวมของค่าสงั เกตทั้งหมดจากตวั อยา่ งท่ีมวี ิธีการปฏิบัติที่ j Ti.  ผลรวมของคา่ สังเกตทั้งหมดจากตวั อย่างท่ีมาจากกลุ่มท่ี i T..  ผลรวมของคา่ สังเกตทัง้ หมด bk ตวั ( N ) X ..  T.. = คา่ เฉลี่ยของค่าสังเกตทง้ั หมด bk ตวั ( N ) bk SST  k b X.. )2  k b X 2  T..2 คอื ผลบวกกําลงั สองของท้ังหมด(Sum of SquareTotal)   ( Xij   bk j 1 i1 ij j1 i1 หมายเหตุ : SST = (Xij แต่ละตวั ยกกําลังสองแล้วบวกกัน) – (((Xij ทกุ ตวั บวกกนั ) แล้วยกกําลังสอง) หารดว้ ยจาํ นวนค่าสังเกตทั้งหมด) SSTR  k  X.. )2  k T. 2  T..2 คือผลบวกกาํ ลังสองของวิธปี ฏิบตั ิ (Sum of j bk b (X.j  j1 b j 1 Square Treaments) = ((ผลบวกในหลักที่ 1) ยกกาํ ลังสอง) หารด้วยจาํ นวนสมาชกิ ในหลกั ที่ 1 + ((ผลบวกในหลกั ท่ี 2) ยกกาํ ลังสอง) หารดว้ ยจาํ นวนสมาชิกในหลกั ที่ 2 +…+ ((ผลบวกในหลักท่ี k) ยกกาํ ลงั สอง) หารดว้ ยจาํ นวนสมาชกิ ในหลักที่ k – (((Xij ทุกตัวบวกกนั ) แล้วยกกาํ ลังสอง) หารด้วยจาํ นวนคา่ สังเกตท้งั หมด) SSBL  b  X.. )2  b Ti.2  T..2 คอื ผลบวกกําลังสองของวธิ ีปฏบิ ัติ (Sum of bk k  ( X i.  i1 k i 1 Square Blocks) = ((ผลบวกในแถวที่ 1) ยกกําลงั สอง) หารด้วยจาํ นวนสมาชกิ ในแถวที่ 1 + ((ผลบวกในแถวที่ 2) ยกกําลงั สอง) หารด้วยจํานวนสมาชิกในแถวท่ี 2 +…+ ((ผลบวกในแถวที่ b) ยกกําลงั สอง) หารดว้ ยจาํ นวนสมาชิกในแถวที่ b – (((Xij ทกุ ตัวบวกกนั ) แลว้ ยกกําลังสอง) หารด้วยจํานวนค่าสงั เกตทั้งหมด) SSE = SST – SSTR – SSBL = ผลบวกกําลังสองของความคลาดเคลื่อน (Sum of Square Error) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

การวเิ คราะหค์ ่าสถิติ – 115 – ตาราง ANOVA ของการวิเคราะหค์ วามแปรปรวนแบบทมี่ ีการสุ่มอยา่ งสมบรู ณ์ในแตล่ ะกล่มุ แหลง่ ของการ ผลบวก ระดับขัน้ ค่าเฉลยี่ ของผลบวกกาํ ลังสอง คา่ เอฟท่ี แปรผนั กําลงั สอง ความเสรี (Mean Square) คํานวณได้ (SOV) (SS) (df) (MS) (F) วิธีการปฏิบตั ิ SSTR k – 1 S12  SSTR  MSTR f1  S12 k 1 S2 กลุ่ม SSBL b–1 S22  SSBL  MSBL f2  S22 ความคลาดเคล่ือน b 1 S2 SSE (k –1)(b –1) S 2  SSE  MSE (k 1)(n 1) ทั้งหมด (Total) SST bk – 1 สรปุ ขนั้ ตอนการทดสอบสมมตฐิ านของคา่ เฉลีย่ ของวิธีการปฏบิ ัติ ขนั้ ที่ 4. ระดบั ขัน้ ความเสรี 1 = k – 1 , 2 = ( k – 1)(n – 1) ค่าวกิ ฤตคอื f,(1,2) บรเิ วณวิกฤตคอื บริเวณ f > f,(1,2) ขน้ั ที่ 5. การสรปุ ผล ถา้ f1 อย่ใู นบรเิ วณวกิ ฤต แลว้ ปฏเิ สธ H ' 0 สรุปขน้ั ตอนการทดสอบสมมตฐิ านของค่าเฉลีย่ ของกลุ่ม ขน้ั ที่ 4. ระดับขั้นความเสรี 1 = b – 1 , 2 = ( k – 1)(n – 1) คา่ วิกฤตคือ f,(1,2) บรเิ วณวกิ ฤตคอื บรเิ วณ f > f,(1,2) ข้ันท่ี 5. การสรปุ ผล ถ้า f2 อย่ใู นบรเิ วณวกิ ฤต แล้ว ปฏิเสธ H \" 0 การทดสอบเพ่ือหาประชากรท่มี ีคา่ เฉล่ยี ไมเ่ ทา่ กัน (MULTIPLE COMPARISIONS) ภายหลงั การสรุปผล หากต้องปฏิเสธ H0 การหาค่าเฉลี่ยของวิธีการปฏิบัติ (Treatment) ท่ี ต่างกัน หรอื คา่ เฉลีย่ ของกล่มุ (Block) ทต่ี า่ งกนั โดยวิธี Fisher’s LSD (Least Significant Difference) การทดสอบหาวิธกี ารปฏบิ ตั ทิ ี่มคี า่ เฉล่ียแตกตา่ งกัน กาํ หนดสมมติฐาน  H0' : .l  .m แย้งกบั 'H: .l  .m กาํ หนดระดับนยั สาํ คญั  a ปฏิเสธ H ' ถา้ | X.l  X.m |  t ,df (b1)(k 1) MSE( 2 ) โดยที่ MSE ได้มาจากตาราง ANOVA 0 2 b การทดสอบหากลุ่มทมี่ คี ่าเฉลย่ี แตกตา่ งกัน กําหนดสมมติฐาน  H0\" : l.  m. แยง้ กบั  H1\" : l.  m. กําหนดระดบั นยั สําคญั  ปฏิเสธ H \" ถ้า | Xl.  X m. |  t ,df (b1)(k 1) 2 โดยท่ี MSE ไดม้ าจากตาราง ANOVA 0 2 MSE( ) k ตัวอย่าง 6.26 ในการศึกษาผลผลิตของหอมหัวแดง โดยนักวิจัย ซ่ึงใช้หอมหัวแดง 1 พันธ์ุ ปลูกเพื่อ เปรยี บเทยี บผลผลิตโดยใช้วิธีการรดน้ํา 4 วิธี คือ วิธีที่ 1 รดน้ําทุกวัน วิธีที่ 2 รดนํ้าทุกๆ 3 วัน วิธีท่ี 3 รดน้ําทุกๆ 5 วัน และวิธีท่ี 4 รดน้ําทุกๆ 7 วัน แล้ววัดนํ้าหนักหัวหอมสด (ช่ังเป็นกิโลกรัม) ได้รายงานผลการทดลอง เปน็ ดงั นี้ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 116 – การวเิ คราะห์ขอ้ มลู ทางสถติ ิ โดยใช้โปรแกรม R ทรที เมนต์ ( j ) แปลง ( i ) 1234 รวม 1 30.7 27.1 15.0 16.0 88.8 2 37.5 28.1 15.3 13.3 94.2 3 25.5 26.0 17.4 12.1 81.0 4 31.4 27.6 16.6 13.7 89.3 รวม 125.1 108.8 64.3 55.1 วิธคี ำนวณ 1. Total SS = (30.72 + 37.52 +…+13.72) – (30.7+37.5+…+13.7)2 / 16 = 8751.13 – 7801.30 = 949.83 2. Treatment SS =  (125.1)2  (108.8)2  (64.3)2  (55.1)2 – CT 4 = 8664.49 – 7801.30 = 863.19 3. Block SS =  (88.8)2  (94.2)2  (81.0)2  (89.3)2 – CT 4 = 7823.64 – 7801.30 = 22.34 4. Error SS = Total SS – Treatment SS – Block SS = 949.83 – 863.19 – 22.34 = 64.30 ตาราง ANOVA ของการวเิ คราะห์ความแปรปรวนแบบสองทาง SOV SS df MS F 287.73 40.29** Treatment 863.19 3 1.04 Block 22.34 3 7.45 64.30 9 7.14 Error Total 949.83 15 ขนั้ ที่ 4. ระดบั ขน้ั ความเสรี 1 = k – 1 = 3 , 2 = k(n – 1) = 9 ค่าวิกฤตคอื f,(k1,k(n1)) = f0.01,(3,9) = 6.99 บริเวณวิกฤตคอื f > f,(k1,k(n1)) ขน้ั ที่ 5. การสรุปผล ค่าสถิติ fcal = 40.29 มีคา่ มากกวา่ คา่ วกิ ฤต จงึ ปฏเิ สธ Ho กล่าวคือ เม่ือทําการเปรียบเทียบผลผลิตโดยใช้วิธีการรดน้ํา 4 วิธี น้ันได้ผลผลิตเฉลี่ย แตกต่างกันอย่างมีนัยสําคัญท่ีระดับ 0.01 แต่เมื่อเปรียบเทียบค่าเฉล่ียของแต่ละแปลงไม่มีความ แตกตา่ งกัน จากท่ปี ฏิเสธ Ho การทดสอบยังไม่เสร็จสน้ิ เพราะต้องทดสอบว่าค่าเฉล่ียของทรีท เมนตค์ ู่ใดแตกต่างกนั การทดสอบหาวธิ ีการปฏิบัติทม่ี ีค่าเฉลยี่ แตกตา่ งกัน กาํ หนดสมมตฐิ าน  H0' : .l  .m แยง้ กบั Ha' : .l  .m กาํ หนดระดับนัยสาํ คัญ  ปฏิเสธ H ' ถ้า | X.l  X.m |  t ,df (b1)(k 1) MSE(2) โดยที่ MSE ได้มาจากตาราง ANOVA 0 2 b t ,df (b1)(k 1) MSE( 2 )  t0.025,9 40.29( 2 ) = 2.262 x 4.49 = 10.16 2 b 4 t ,df (b1)(k 1) 2  t0.005,9 40.29( 2 ) = 3.25 x 4.49 = 14.59 2 MSE( ) 4 b 16.1 13.8 คา่ เฉลีย่ Treatments 31.3 27.2 Treatment 1 - 4.1 15.2** 17.5** Treatment 2 Treatment 3 - 11.1* 13.4* - 2.3 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวิเคราะหค์ า่ สถิติ – 117 – กําหนดสมมตฐิ าน H0' : 1  3 แยง้ กับ Ha' : 1  3 กาํ หนดระดบั นัยสําคัญ 0.01 คาํ นวณ X.1  X.3 = 15.2 มากกวา่ ค่าวิกฤต จงึ ปฏิเสธ H ' หรอื ยอมรบั H ' : 1  3 0 a คํานวณ X.1  X.4 = 17.5 มากกว่าค่าวิกฤต จึงปฏเิ สธ H ' หรอื ยอมรับ H ' : 1  4 0 a กําหนดสมมติฐาน H0' : 2  3 แยง้ กบั H1' : 2  3 กาํ หนดระดับนัยสาํ คญั 0.05 คาํ นวณ X.2  X.3 = 11.1 มากกวา่ คา่ วิกฤต จงึ ปฏเิ สธ H ' หรอื ยอมรบั Ha' : 2  3 0 คาํ นวณ X.2  X.4 = 13.4 มากกวา่ คา่ วกิ ฤต จงึ ปฏิเสธ H ' หรือยอมรบั Ha' : 2  4 0 ทํานองเดียวกัน หากต้องการดูการทดสอบความต่างของค่าเฉลี่ยระหว่าง Block ซึ่งได้ ทดสอบโดยตาราง ANOVA แล้วไม่มีคู่ไหนต่างกัน เพื่อแสดงให้เห็นชัดขึ้นว่า หากอยากทดสอบคร้ัง ละคู่ โดยใช้ t-test ก็จะได้ผลสรปุ เดียวกัน แสดงได้ดังนี้ คา่ เฉลยี่ Blocks 23.6 22.3 22.2 20.3 Block 1 - 1.3 1.4 3.3 Block 2 - 0.1 2.0 Block 3 - 1.9 ซ่ึงจากผลต่างของค่าเฉล่ียในแต่ละคู่ของ Block ไม่มีคู่ใดเลยที่มีค่ามากกว่าค่าวิกฤต 10.16 จงึ สรปุ ไดว้ ่าค่าเฉล่ยี ในแตล่ ะ Block ไม่มคี วามแตกตา่ งกนั การคานวณโดยใชค้ าส่งั Multi-Way Analysis of Variance ในโปรแกรม R การทดสอบสมมตฐิ านเกยี่ วกับความแปรปรวนของประชากร k ชุด ในการวิเคราะห์ความแปรปรวน ประชากรที่สุ่มตัวอย่างมาน้ันต้องมีความแปรปรวนเท่ากัน ซึ่ง เป็นข้อตกลงเบ้ืองต้นก่อนท่ีจะทําการวิเคราะห์หรือทดสอบเกี่ยวกับค่าเฉลี่ยของหลายกลุ่มข้อมูลได้ ดงั น้ันหากไมม่ ั่นใจควรทาํ การทดสอบความเทา่ กนั ของความแปรปรวนก่อน โดยมวี ิธที ดสอบดังนี้ ขั้นที่ 1. กําหนดสมมติฐาน H0 : 12   2  ...   2 2 k Ha : มอี ยา่ งน้อยหน่งึ คู่ต่างกัน ขัน้ ท่ี 2. กาํ หนดระดบั นยั สาํ คญั  ขนั้ ที่ 3. เลือกตวั สถติ ทิ ดสอบไคสแควร์ 2  M ระดับขั้นความเสรี  = k – 1 C ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 118 – การวิเคราะหข์ ้อมลู ทางสถติ ิ โดยใชโ้ ปรแกรม R เม่ือ =  M  และ =C 1 k  2.3026  k log S 2  k fi log Si2 )  1   1  1  p 3(k  1)  fi   fi ( i 1 k i 1 i 1  fi i 1 โดยที่ ni คือขนาดของตวั อยา่ งชุดท่ี i , i = 1, 2, 3, …, k fi  ni 1, i = 1, 2, 3, …, k Si2 คือความแปรปรวนของตัวอยา่ งชดุ ที่ i , i = 1, 2, 3, …, k S 2 คอื ความแปรปรวนรวมของค่าสงั เกต p ขั้นท่ี 4. ค่าวิกฤตคือ 2 และบรเิ วณวกิ ฤตคือ 2  2  ,k 1  ,k 1 ข้นั ท่ี 5. การสรุปผล ถา้ คา่ สถิติไคสแควรท์ ่ีคํานวณได้จากตัวอยา่ ง ตกในบริเวณวกิ ฤต แลว้ ปฏเิ สธ H0 หมายเหตุ ค่าความแปรปรวนของตวั อยา่ ง ni ( X ij  Xi )2 ni X 2  ni (Xi )2 , i = 1,2,3,…, k ij   Si2  j1 ni 1  j1 ni 1 k 1)Si2  (ni  และค่าความแปรปรวนร่วม 2 i 1 S p  k  ni  k i 1  ค่า 2.3026 ในสูตร M = 2.3026  k log S 2  k fi log Si2 )  p  fi ( i 1 i 1 มาจาก ln(10) = 2.3026 ตัวอยา่ ง 6.27 จากข้อมูลตวั อย่างท่ี 6.26 ในการศึกษาผลผลิตของหอมหัวแดง ทําเปรยี บเทยี บ ผลผลติ โดยใช้วธิ กี ารรดนา้ํ 4 วิธี ไดข้ ้อมลู ดงั น้ี = 12, 30.70 27.10 15.00 16.00 37.50 28.10 15.30 13.30 = 7.22, = 5.45 25.50 26.00 17.40 12.10 31.40 27.60 16.60 13.70 M = 2.3026x12xlog(7.22) – 5.45 24.15 0.81 1.26 = 73.5348 2.66 C = 1+1/9*(4/3 – 1/12) = 1.138889 ซึ่งเมื่อเทียบกับค่า 2 = 7.815 ซง่ึ คา่ ท่ีคํานวณได้ 64.5671 มากกวา่ คา่ วิกฤติ 0.05,3 จงึ ปฏิเสธ H0 : 12   2  ...   2 หรอื ยอมรบั Ha กลา่ วคอื มีอยา่ งน้อย 1 กลมุ่ ท่ีมี 2 k ความแปรปรวนไม่เท่ากลุ่มอื่น ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิติและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวิเคราะหค์ า่ สถิติ – 119– 6.3 การวเิ คราะหส์ มั ประสิทธิส์ หสมั พนั ธ์ (Analysis of Correlation) สหสมั พนั ธ์ คือความสมั พนั ธ์ระหวา่ งตวั แปรตั้งแต่ 2 ตัวขึ้นไป เพ่ือศึกษาดูว่าตัวแปรหรือ ข้อมูลมีความสัมพันธ์ซ่ึงกันและกันหรือไม่หรือมากน้อยเพียงใด เช่นความสูงกับนํ้าหนักและอายุ ความฉลาดทางสมอง(I.Q) ของบิดาและของลูก รายจ่ายกับรายรับ การตรวจสอบความสัมพันธ์ ของตัวแปร 2 ตัว อาจใช้แผนภาพการกระจายระหว่าง 2 ตัวแปรเพ่ือใช้พิจารณาเบ้ืองต้นว่าตัว แปรมีความสัมพันธ์กันหรือไม่และเป็นไปในทิศทางใด แต่ไม่สามารถบอกถึงขนาดของ ความสัมพนั ธ์มากน้อยเพียงใด จึงใช้คา่ สมั ประสิทธิ์สหสัมพนั ธ์ ซง่ึ แทนด้วยสัญลักษณ์  หรือ xy โดยค่าสัมประสิทธ์ิสหสัมพันธ์จะมีค่าอยู่ระหว่าง – 1 ถึง 1 หากค่าสัมประสิทธ์ิสหสัมพันธ์มีค่า บวก แสดงว่าตัวแปรท้ัง 2 ตัวมีความสัมพันธ์ไปในทิศทางเดียวกันถ้าเพ่ิมก็เพ่ิมด้วยกันลดก็ลด ด้วยกนั ตรงกันข้ามถ้าเป็นค่าลบแสดงว่าตัวแปร 2 ตัวมีความสัมพันธ์เชิงตรงกันข้ามตัวแปรหน่ึง ลดอีกตวั แปรจะเพิ่มข้นึ และหากค่าสัมประสิทธิส์ หสมั พันธม์ คี า่ เป็นศูนย์แสดงว่าทั้งสองตัวแปรไม่ มีความสัมพันธก์ ันน่ันเอง ในการวเิ คราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว บางคร้ังเรียกตัวแปรหน่ึงว่าตัวแปร อิสระ (Independent variable) และอีกตัวแปรเรียกตัวแปรตาม (Dependent variable) หรือตัวแปรทํานาย (Predictor variable) ในการกําหนดว่าตัวแปรใดเป็นตัวแปรอิสระหรือตัว แปรใดเป็นตัวแปรตามนั้นข้ึนอยู่กับงานวิจัยนั้นๆ โดยส่วนมากแล้วตัวแปรท่ีสามารถวัดค่าได้ง่าย จะให้เป็นตัวแปรอิสระ ในการวิเคราะห์ค่าความสัมพันธ์หากตัวแปรท้ังสองมีระดับมาตรการวัด อันตรภาค (Interval scale) หรืออัตราส่วน (Ratio scale) จะเรียกว่าการวิเคราะห์โดยใช้ พาราเมทริก (Parametric procedure) แต่ถ้าหากการวัดค่าอยู่ระดับมาตรการวัดนามบัญญัติ (Nominal scale) หรือมาตรวัดเรียงอันดับ (Ordinal scale) จะเรียกว่าการวิเคราะห์แบบไม่ ใช้พาราเมทรกิ (Non-parametric procedure) คา่ สัมประสิทธิส์ หสัมพนั ธเ์ พียรส์ ัน (Pearson correlation coefficient) การหาค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน หรือบางคร้ังเรียกว่าสหสัมพันธ์อย่างง่าย (Simple correlation) โดยใช้สัญลักษณ์ rxy เม่ือมีการเก็บข้อมูล (X,Y) มาจํานวน n คู่ลําดับ จะประมาณค่าสมั ประสทิ ธสิ์ หสัมพนั ธ์ xy ด้วย rxy จากสมการดงั นี้ nn n nn  (Xi  X )(Yi Y )  XiYi  nXY n  XiYi   Xi  Yi i1  i1  i1 i1 i1 rXY  n n n  in1Yi2  nin1 n  nin1Yi2 n   (Xi  X )2  (Yi Y )2 i1 X 2  nX 2   nY 2  X 2  X i )2   )2  i i ( (  Yi i1 i1 i1 i1 การหาคา่ สมั ประสิทธ์ิสหสัมพนั ธ์ในโปรแกรม R ใชฟ้ งั กช์ ันดังน้ี ฟังก์ชนั cor() สาํ หรบั หาค่าสมั ประสทิ ธ์สิ หสัมพันธ์ของตัวแปรทัง้ สอง ฟังกช์ ัน cov() สาํ หรับหาคา่ ความแปรปรวนร่วมของตัวแปรท้งั สอง รปู แบบของฟังกช์ นั cor() cov(x, y = NULL, use = \"everything\", method = c(\"pearson\", \"kendall\", \"spearman\")) cov2cor(V) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิติและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

– 120 – การวเิ คราะหข์ อ้ มูลทางสถิติ โดยใชโ้ ปรแกรม R Arguments x a numeric vector, matrix or data frame. y NULL (default) or a vector, matrix or data frame with compatible dimensions to x. The default is equivalent to y = x (but more efficient). na.rm logical. Should missing values be removed? use an optional character string giving a method for computing covariances in the presence of missing values. This must be (an abbreviation of) one of the strings \"everything\", \"all.obs\", \"complete.obs\", \"na.or.complete\", or \"pairwise.complete.obs\". method a character string indicating which correlation coefficient (or covariance) is to be computed. One of \"pearson\" (default), \"kendall\", or \"spearman\": can be abbreviated. V symmetric numeric matrix, usually positive definite such as a covariance matrix. Value For r <- cor(*, use = \"all.obs\"), it is now guaranteed that all(r <= 1). Note Some people have noted that the code for Kendall's tau is slow for very large datasets (many more than 1000 cases). It rarely makes sense to do such a computation, but see function cor.fk in package pcaPP. References Becker, R. A., Chambers, J. M. and Wilks, A. R. (1988) The New S Language. Wadsworth & Brooks/Cole. See Also cor.test for confidence intervals (and tests). cov.wt for weighted covariance computation. sd for standard deviation (vectors). สัมประสทิ ธส์ิ หสัมพนั ธข์ องวิธี Pearson เปน็ ค่าแสดงความสมั พนั ธ์ของ 2 ตัวแปรที่ทั้ง สองตัวแปรน้นั อยู่ในมาตรวัดระดับ Interval หรือ Ratio scale ซง่ึ ต้องให้ความสาํ คญั ของระดับ มาตรวัดของข้อมูล ตวั อย่าง 6.28 จากข้อมลู งบลงทุนในการโฆษณาสินคา้ กบั กาํ ไรท่ีได้จากการขายสนิ ค้าของบรษิ ทั แหง่ หนงึ่ ในช่วง 8 ปีท่ผี า่ นมา ปรากฏขอ้ มูลดังน้ี งบลงทนุ โฆษณา (ล้านบาท) :X 2 3 1 4 2 5 6 3 กาํ ไร (ลา้ นบาท) :Y 5 8 3 10 5 12 13 7 วิธที ํา เตรยี มข้อมลู 3 14 256 3 26 9 1 16 4 25 36 9 104 X2 8 3 10 5 12 13 7 X2 4 64 9 100 25 144 169 49 63 Y5 24 3 40 10 60 78 21 585 246 Y 2 25 XY 10 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะห์คา่ สถติ ิ – 121– แทนคา่ ในสูตร n nn  8(246)  (26)(63) [8(104  262 )][8(585  632 )] n  XiYi   Xi  Yi i1 i1 i1 nin1 X 2  n Xi )2  nin1Yi2  n )2  i   ( (  Yi i1 i1  330  0.9908704 333.04054 ใช้โปรแกรม R ชว่ ยคาํ นวณไดด้ ังนี้ จะเห็นว่าค่าของสมั ประสทิ ธ์สิ หสัมพนั ธ์มีค่าเปน็ บวก แสดงวา่ งบลงทุนโฆษณากับกาํ ไรมี ความสัมพนั ธก์ นั เชิงบวก มีคา่ 0.9908704 หรือ 99% เขยี นแผนภาพการกระจายของ X และ Y ดว้ ยฟังกช์ ัน plot( ) > plot(X,Y) ตัวอย่าง 6.29 จากการศึกษาข้อมูลการไดย้ นิ ของผู้สูงอายโุ ดยสุม่ ผสู้ งู วยั มีจํานวน 10 คน วดั ความสามารถในการได้ยิน ปรากฏขอ้ มูลดังนี้ อายุ (ปี) :X 45 48 54 50 62 71 55 60 83 74 การไดย้ ิน :Y 25 23 20 21 15 12 19 17 9 10 วิธที าํ เตรยี มขอ้ มลู X 45 48 54 50 62 71 55 60 83 74 602 X 2 2025 2304 2916 2500 3844 5041 3025 3600 6889 5476 37620 Y 25 23 20 21 15 12 19 17 9 10 171 Y 2 625 529 400 441 225 144 361 289 81 100 3195 XY 1125 1104 1080 1050 930 852 1045 1020 747 740 9693 ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 122 – การวิเคราะห์ขอ้ มลู ทางสถติ ิ โดยใชโ้ ปรแกรม R แทนค่าในสตู ร n nn  10(9693)  (602)(171) [10(37620  6022)][10(3195 1712)] n  XiYi   Xi  Yi i1 i1 i1 nin1 X 2  n Xi )2  nin1Yi2  n )2  i   ( (  Yi i1 i1   6012   0.9834174 6113.3758 ใช้โปรแกรม R ช่วยคาํ นวณไดด้ ังนี้ จะเห็นว่าค่าของสมั ประสทิ ธ์สิ หสัมพนั ธ์มีคา่ เปน็ ลบ แสดงว่าจํานวนอายกุ บั การได้ยนิ มีความสมั พันธ์กนั เชงิ ลบ มีค่า – 0.9834174 หรอื 98.34% เขยี นแผนภาพการกระจายของ X และ Y ดว้ ยฟงั ก์ชัน plot( ) > plot(X,Y) การทดสอบสมมติฐานสาหรับคา่ สมั ประสิทธส์ิ หสัมพนั ธ์ ในการทดสอบสมมตฐิ านของคา่ สัมประสิทธสิ์ หสัมพันธ์ สามารถตัง้ สมมตฐิ านไดด้ ังน้ี H0 : = 0 ขัดแยง้ กบั Ha :  0 เมอ่ื  แทนค่าสมั ประสทิ ธส์ิ หสัมพันธ์ ซึ่งการทดสอบโดยใช้โปรแกรม R ใชฟ้ ังกช์ ัน cor.test( ) cor.test(x, ...) ## Default S3 method: cor.test(x, y, alternative = c(\"two.sided\", \"less\", \"greater\"), ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวิเคราะหค์ ่าสถิติ – 123– method = c(\"pearson\", \"kendall\", \"spearman\"), exact = NULL, conf.level = 0.95, continuity = FALSE, ...) ## S3 method for class 'formula' cor.test(formula, data, subset, na.action, ...) Arguments x, y numeric vectors of data values. x and y must have the same length. alternative indicates the alternative hypothesis and must be one of \"two.sided\", \"greater\" or \"less\". You can specify just the initial letter. \"greater\" corresponds to positive association, \"less\" to negative association. method a character string indicating which correlation coefficient is to be used for the test. One of \"pearson\", \"kendall\", or\"spearman\", can be abbreviated. exact a logical indicating whether an exact p-value should be computed. Used for Kendall's tau and Spearman's rho. See ‘Details’ for the meaning of NULL (the default). conf.level confidence level for the returned confidence interval. Currently only used for the Pearson product moment correlation coefficient if there are at least 4 complete pairs of observations. continuity logical: if true, a continuity correction is used for Kendall's tau and Spearman's rho when not computed exactly. formula a formula of the form ~ u + v, where each of u and v are numeric variables giving the data values for one sample. The samples must be of the same length. data an optional matrix or data frame (or similar: see model.frame) containing the variables in the formula formula. By default the variables are taken from environment(formula). subset an optional vector specifying a subset of observations to be used. na.action a function which indicates what should happen when the data contain NAs. Defaults to getOption(\"na.action\"). ... further arguments to be passed to or from methods. Karl Pearson at work, 1910. Portrait of Karl Pearson, by Elliott & Fry, 1890. ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 124 – การวเิ คราะห์ขอ้ มูลทางสถิติ โดยใช้โปรแกรม R การทดสอบนยั สําคญั ทางสถติ ิ โดยคาํ นวณคา่ t  r n  2 แล้วนาํ ไปเปรียบเทยี บกบั 1 r2 ค่าวกิ ฤติที่ไดจ้ ากตารางตามระดับนยั สําคญั  จากตัวอยา่ ง 6.28 ขอ้ มลู งบลงทนุ ในการโฆษณาสินค้ากับกําไรที่ไดจ้ ากการขายสนิ คา้ เม่อื นําไปคาํ นวณคา่ ทีทดสอบ tr n2  0.9908704* 82  18.00301 และ 1 r2 1 (0.9908704)2 ทาํ การทดสอบสัมประสทิ ธ์ิสหสัมพนั ธ์ โดยใชโ้ ปรแกรม R ไดผ้ ลดงั นี้ จากตวั อย่าง 6.29 ขอ้ มูลอายุกับการไดย้ นิ ของผสู้ ูงวัย ไดผ้ ลดังนี้ ค่าสมั ประสทิ ธ์ิสหสัมพนั ธ์สเปียรแ์ มน (Spearman correlation coefficient) เปน็ การหาความสมั พันธข์ องตัวแปรสองตวั โดยค่าข้อมลู ทว่ี ัดอยใู่ นมาตรวดั เรียงลําดบั โดยใช้ค่าลาํ ดับ R(x) และ R(y) แล้วคํานวณดว้ ยวิธสี ัมประสิทธส์ิ หสัมพันธแ์ บบ Pearson 6 n di2  หรือคาํ นวณจากสูตร –rs  1  i1 เมอ่ื d = R(x) R(y) n(n2 1) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะห์คา่ สถติ ิ – 125– Example 6.30 In this example, the raw data in the table below is used to calculate the correlation between the IQ of a person with the number of hours spent in front of TV per week. IQ, Xi 106 86 100 101 99 103 97 113 112 110 Hours of TV per 7 0 27 50 28 29 20 12 6 17 week, Yi Firstly, evaluate di2 . To do so use the following steps, reflected in the table below. 1. Sort the data by the first row (Xi). Create a new row Xi and assign it the ranked values 1,2,3,...n. 2. Next, sort the data by the second row (Yi). Create a fourth row Yi and similarly assign it the ranked values 1,2,3,...n. 3. Create a fifth row di to hold the differences between the two rank row (Xi and Yi). 4. Create one final row di2 to hold the value of row di squared. ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 126 – การวิเคราะห์ขอ้ มลู ทางสถติ ิ โดยใชโ้ ปรแกรม R IQ, Xi 86 97 99 100 101 103 106 110 112 113 Hours of TV per 0 20 28 27 50 29 7 17 6 12 week, Yi 1 2 3 4 5 6 7 8 9 10 rank Xi rank Yi 1 6 8 7 10 9 3 5 2 4 di 0 -4 -5 -3 -5 -3 4 3 7 6 di2 0 16 25 9 25 9 16 9 49 36 With di2 found, add them to find 10 di2  194 . The value of n is 10. These values  i1 can now be substituted back into the equation : 6 n di2 6 x 194  10(102 1) rs  1  i1   1 n(n2 1) to give which evaluates to ρ = − 29/165 = −0.175757575... with a P-value = 0.627188 เมอ่ื ทําการทดสอบสมั ประสทิ ธ์สิ หสัมพันธ์ โดยใช้โปรแกรม R ได้ผลดังนี้ ตัวอย่าง 6.31 ต้องการหาความสมั พนั ธ์ระหวา่ งคะแนนสอบวิชาคณติ ศาสตร์กบั วชิ าสถติ ขิ องนกั ศึกษา จํานวน 10 คน ไดค้ ะแนนดงั นี้ Mathematics Xi 72 68 58 49 81 73 42 53 62 55 Statistics Yi 63 57 45 39 72 65 34 46 51 43 เมอื่ ใหล้ าํ ดับของข้อมูลจากการเรียงลาํ ดับจากน้อยไปหามาก Mathematics Xi 72 68 58 49 81 73 42 53 62 55 Statistics Yi 63 57 45 39 72 65 34 46 51 43 rank Xi 8 7 5 2 10 9 1 3 6 4 rank Yi 8 7 4 2 10 9 1 5 6 3 di 0 0 1 0 0 0 0 -2 0 1 di2 0 0 1 0 0 0 0 4 0 1 และคํานวณคา่ 10 และแทนค่า rs 6 n di2 = 1 6 x 6 0.964   10(102 1) di2  6  1 i1 n(n2 1) i1 เมื่อทําการทดสอบสัมประสทิ ธ์ิสหสมั พนั ธ์ โดยใชโ้ ปรแกรม R ได้ผลดังนี้ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะหค์ ่าสถิติ – 127– การคาํ นวณคา่ สัมประสิทธ์สิ หสัมพันธ์ Spearman สามารถคาํ นวณจากสูตรของ Pearson ดงั นี้ การทดสอบสมมติฐาน ทาได้ดังนี้ เป็นกรณีการคาํ นวณจากค่าทแี่ ทจ้ ริง เป็นกรณกี ารคาํ นวณจากการประมาณด้วยตวั อย่างขนาดใหญ่ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 128 – การวเิ คราะหข์ ้อมูลทางสถติ ิ โดยใช้โปรแกรม R ค่าสัมประสทิ ธิส์ หสัมพนั ธ์เคนดอลล์ (Kendall correlation coefficient) เปน็ การหาความสมั พนั ธ์ของตัวแปรสองตัว โดยการจัดลําดบั คา่ ข้อมูลสองชดุ ซง่ึ ค่าทวี่ ัด อยใู่ นมาตรวัดเรียงลําดับ ตัวอยา่ ง 6.32 ตอ้ งการหาความสมั พนั ธ์ระหว่างอายุ (Age) กบั เปอร์เซ็นต์ของความอว้ น (percentage body fat) ซ่ึงมลี าํ ดบั ข้อมูล ดังนี้ rank Xi 1 2 3 4 5 6 7 8 9 10 11 12 Rank Yi 2 1 4 3 6 5 8 7 10 9 12 11 C 10 10 8 8 6 6 4 4 2 2 0 D 10101010 1 0 1 คา่ C คอื คา่ ท่ีลาํ ดับมากกว่าคา่ นัน้ เชน่ 2 มีค่าทม่ี ากกว่าอยู่ 10 คา่ Kendall’s tau = n1 n1  60  6  54  0.8181818182 60  6 66  Ci   Di i1 i1 n1 n1  Ci   Di i1 i1 ในการคาํ นวณค่าสัมประสทิ ธ์ิสหสมั พันธ์ โดยใช้โปรแกรม R ไดผ้ ลดงั น้ี ตัวอย่าง 6.33 ตอ้ งการหาความสมั พันธร์ ะหวา่ ง Master กบั Students ซ่ึงมลี าํ ดับข้อมูล ดังน้ี rank Xi 1 2 3 4 5 6 7 8 9 10 11 12 Rank Yi 12 2 3 4 5 6 7 8 9 10 11 1 C 09 876543 2 1 0 D 11 1 1 1 1 1 1 1 1 1 1 ค่า C คือค่าที่ลําดบั มากกวา่ ค่าน้นั เชน่ 2 มีคา่ ทมี่ ากกว่าอยู่ 10 คา่ n1 n1 Kendall’s tau =  Ci   Di i1 i1  45  21  24  0.3636363636 n1 n1 45  21 66  Ci   Di i1 i1 ในการคาํ นวณคา่ สัมประสทิ ธิส์ หสัมพันธ์ โดยใช้โปรแกรม R ได้ผลดังนี้ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะหค์ า่ สถติ ิ – 129– การทดสอบสมมตฐิ าน ทาได้ดงั นี้ เป็นกรณีการคาํ นวณจากค่าท่แี ทจ้ รงิ เป็นกรณีการคํานวณจากการประมาณดว้ ยตวั อยา่ งขนาดใหญ่ ตวั อย่าง 6.34 การประกวดผลงานประดษิ ฐเ์ กา้ อีจ้ ากเศษวัสดขุ องนักศึกษาคณะสถาปตั ยกรรม จาํ นวน 5 ผลงาน โดยมกี รรมการ 2 คน ไดใ้ ห้อันดับผลงานดีเดน่ เปน็ 1 และรองลงมา เป็น 2 และ 3,4,5 ตามลําดับ ได้ข้อมูล ดังน้ี กรรมการ อนั ดับท่ีกรรมการใหค้ ะแนนแก่ผลงาน ผลงาน#1 ผลงาน#2 ผลงาน#3 ผลงาน#4 ผลงาน#5 คนท่ี 1 2 3 5 14 คนที่ 2 2 3 4 15 ในการคาํ นวณคา่ สมั ประสทิ ธสิ์ หสมั พนั ธ์ โดยใชโ้ ปรแกรม R ได้ผลดังนี้ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 130 – การวิเคราะห์ข้อมูลทางสถิติ โดยใชโ้ ปรแกรม R การทดสอบสมมตฐิ าน ทาไดด้ งั น้ี เป็นกรณกี ารคํานวณจากการประมาณดว้ ยตวั อย่างขนาดใหญ่ เป็นกรณีการคํานวณจากค่าทแ่ี ท้จริง ตัวอย่าง 6.35 นักวิจัยต้องการทราบว่าความพึงพอใจในการทํางานมีความสัมพันธ์กับผลการ ปฏบิ ัตงิ านหรือไม่ จงึ ได้ทําการเกบ็ รวบรวมข้อมูลพนกั งานมา 13 คน ได้ข้อมลู ดงั นี้ คนที่ 1 2 3 4 5 6 7 8 9 10 11 12 13 ความพึง พอใจ (X) 3 2 2 5 3 4 2 3 4 1 5 2 3 ผลการ ปฏิบัติงาน 3 2 3 4 3 4 1 3 4 2 4 2 3 (Y) จากข้อมูลเดียวกันน้ี เม่ือหาความสัมพันธ์โดยวิธีท้ังสามจะเห็นว่าค่าความสัมพันธ์ของวิธี kendall มคี า่ ต่าํ สุดและสงู สดุ คอื ค่าความสมั พันธ์วิธี spearman ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

การวิเคราะห์คา่ สถิติ – 131– 6.4 การวเิ คราะห์การถดถอย (Regression Analysis) การวิเคราะห์การถดถอยอย่างง่าย (Simple regression analysis) เป็นเทคนิคทาง สถิติท่ีอาศัยความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรมาสร้างสมการทํานาย โดยจะแบ่งกลุ่มตัว แปรออกเป็น 2 กลุ่มคือกลุ่มตัวแปรหรือกลุ่มข้อมูลที่ทราบค่าได้ง่ายเรียกกลุ่มตัวแปรอิสระ (Independent variables) และอีกกลุ่มหนึ่งเรียกกลุ่มตัวแปรตาม (Dependent variable) ซ่ึงในการวิเคราะห์การถดถอยอย่างง่ายคือกรณีท่ีแต่ละกลุ่มมีจํานวน 1 ตัวแปรเท่าน้ัน แต่ใน การวิจยั โดยสว่ นใหญ่ พบวา่ ตวั แปรตามไม่ได้เปน็ ผลมาจากตวั แปรอิสระเพียงตัวเดียว แต่กลับมี ความสัมพันธ์กับตัวแปรอิสระหลายตัว ดังน้ันในการทํานายหากตัวแปรอิสระหลายๆ ตัวแปร หรือกลุ่มของตัวแปรอิสระท่ีมีความสัมพันธ์ต่อตัวแปรตามมาร่วมกันสร้างสมการทํานายแล้ว ก็ น่าจะได้สมการทํานายท่ีมีความแม่นยํามากกว่าสมการทํานายที่ใช้ตัวแปรอิสระเพียงตัวแปร เดียว จึงทําให้เกิดเทคนิคทางสถิติท่ีเรียกว่าการวิเคราะห์การถดถอยพหุคูณ (Multiple regression analysis) การวิเคราะหก์ ารถดถอยอย่างง่าย (Simple regression analysis) ตวั แบบการถดถอยอยา่ งงา่ ย จะอย่ใู นรปู Yi  0  1X i สาํ หรับ i = 1,2,…,n โดยที่ 0 เปน็ ระยะตดั แกน y (y – intercept) 1 เป็นความชนั (slope) ของเสน้ ตรง ซ่ึงแสดงถึงการเปล่ียนแปลงของ y เมื่อ x มีค่าเปลี่ยนไป 1 หน่วย และเรียก 1 ว่าสัมประสิทธ์ิการ ถดถอย (regression coefficient) i เปน็ ความคลาดเคลอื่ นส่มุ ซง่ึ i NID(0, 2) ตัวอยา่ ง 6.36 การศกึ ษาข้อมลู จํานวนชั่วโมงในการอ่านหนังสือกับคะแนนท่ีสอบได้ โดยสุ่มเก็บ ขอ้ มลู ตัวอย่างมาจาํ นวน 10 คน ได้ข้อมูลดังน้ี คนที่ 1 2 3 4 5 6 7 8 9 10 จํ า น ว น ช่ัวโมงอ่าน 2 1 2 3 4 5 1 3 2 1 หนงั สือ(X) ค ะ แ นน ที่ สอบได้ (Y) 17 15 18 25 25 28 18 19 20 14 นักวจิ ัยมแี นวคดิ สนับสนุนที่ว่านักเรียนท่ีอ่านหนังสือมากจะทําคะแนนได้มาก จึงได้นําข้อมูลมาพล็อตกราฟที่เรียกว่า แผนภูมิกระจาย (scatter diagram) ซ่ึงเป็นวิธีการ พิจารณาถึงความสัมพันธ์ท่ีเกิดข้ึนอย่างคร่าวๆ โดยพิจารณาจากการที่ข้อมูลดังกล่าวมีลักษณะ เกาะกลุ่มเปน็ ทางใกล้เคียงกับเส้นตรงในแนวทะแยง ซึ่งจากแผนภมู กิ ระจาย ส่ิงท่ีน่าสนใจคือจุด ทัง้ หมดรวมกล่มุ ในแนวเส้นตรง จึงทําให้เกิดแนวคิดท่ีว่าหากสามารถลากเส้นตรงผ่านจุดข้อมูล เหล่าน้ี โดยให้เส้นตรงท่ีลากผ่านห่างจากจุดแต่ละจุดน้อยที่สุด จึงจะได้เส้นตรงที่เป็นตัวแทน ของข้อมูลชุดนี้ วิธีการลากเส้นตรงน้ีเรียกว่า วิธีกําลังสองน้อยท่ีสุด (least square methods) เมอ่ื ได้เสน้ ตรงแทนขอ้ มูลท้ังหมดแล้ว หากตอ้ งการทาํ นาย สามารถแทนค่าตวั แปรอิสระ (X) ใน ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 132 – การวิเคราะห์ขอ้ มูลทางสถิติ โดยใชโ้ ปรแกรม R สมการ และจะไดค้ า่ Y เปน็ คา่ ทํานายทไ่ี ดจ้ ากสมการ โดยระยะห่างของจุดข้อมูลกับค่าท่ีได้จาก เส้นตรง เรยี กระยะหา่ งนั้นวา่ ความคลาดเคลื่อนในการทาํ นาย เรียกค่าน้วี า่ residual จากสมการตัวแบบการถดถอย Yi    X i สาํ หรับ i = 1,2,…,n จงึ มกี ารประมาณสมการถดถอย โดย Yˆ  a bX โดยท่ี a เป็นระยะตดั แกน y (y – intercept) b เป็นความชนั (slope) ของเส้นตรง วิธีการหาตัวประมาณโดยหาผลบวกของกําลังสองของระยะจากจุดทั้งหลายไปยังเส้น ถดถอยซ่ึงวัดขนานกับแกน y หรือเรียกว่าผลบวกกําลังสองของความคลาดเคล่ือน (Sum square of error) เขยี นย่อว่า SSE Y   en   (x2 , y2 )   (xn , yn )   e2   ei e1 (xi , yi ) (x1, y1) X จากรูป เป็นการนําข้อมูลจากตัวอย่าง (x1,y1),(x2,y2),…(xn,yn) มาลงจุดจะได้กราฟ แสดงให้เห็นว่าแนวโน้มของรูปแบบความสัมพันธ์ระหว่างตัวแปรทั้งสองอยู่ในรูปเส้นตรง จาก รปู ได้ว่า i  Yi Yˆi สําหรับ i = 1,2,…,n เพื่อใหค้ วามผดิ พลาด n i2 มีคา่ ตาํ่ ที่สุด โดยท่ี  i1 SSE = n i2  n (Yi  Yˆ )2  n (Yi  a  bXi )2 ในการคา่ a และ b ทท่ี ําให้ SSE มีค่าน้อย    i1 i1 i1 ที่สุด โดยใช้ความรู้แคลคูลัส โดยการหาอนุพันธ์ย่อย (partial differentiation) ของ SSE เทียบกับ a และ b ดังนี้ SSE n =0  n n a   2  (Yi  a  bXi )  Yi  na  b  Xi i1 i1 i1 SSE  n  n  n  n X i2 b  2  (Yi  a  bXi )( Xi ) = 0  XiYi a  Xi b i1 i1 i1 i1 ทําให้สามารถคํานวณหาคา่ a และ b ได้จากสูตรดังนี้ n nn n nn n  XiYi  (  Xi  Yi ) / n n  XiYi  (  Xi  Yi )  XiYi  nXY b  i1 i1 i1  i1 i1 i1  i1 n X 2  n Xi )2 / n n n X 2  ( n Xi )2 n X 2  nX 2  i  i   i ( i1 i1 i1 i1 i1 n n  Y  bX  Yi  Xi a  i1  b i1 n n จึงไดส้ มการพยากรณห์ รอื สมการทาํ นายคือ Yˆ  a bX ตามทีต่ อ้ งการ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะห์ค่าสถติ ิ – 133– จาก ตวั อย่าง 6.36 เตรยี มขอ้ มลู เพอ่ื ใช้ในการคํานวณ ดังนี้ คนท่ี 1 2 3 4 5 6 7 8 9 10 รวม X 2123 4 5 1 3 2 1 24 Y 17 15 18 25 25 28 18 19 20 14 199 XY 34 15 36 57 100 140 18 57 40 14 529 X2 4 1 4 9 16 25 1 9 4 1 74 n nn n  XiYi  (  Xi  Yi ) b  10(529)  (24)(199)  3.134 i1 i1 i1 10(74)  (24)2 n X i2  ( n Xi )2  n i1 i1 n n  Y  bX  199  (3.134) 24  12.378 10 10  Yi  Xi a  i1  b i1 n n จึงได้สมการพยากรณห์ รือสมการทํานายคือ Yˆ  12.378 + 3.134X ตามทตี่ ้องการ สามารถคาํ นวณหาคา่ a และ b ได้จากการใช้โปรแกรม R ไดผ้ ลดังนี้ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 134 – การวิเคราะหข์ ้อมูลทางสถติ ิ โดยใช้โปรแกรม R ตัวอย่าง 6.37 การศึกษาข้อมูลความสัมพันธ์ระหว่างอัตราการเต้นของหัวใจกับอายุ ได้ค่า สงั เกตดังน้ี คนที่ 1 2 3 4 5 6 7 8 9 อาย(ุ Age):X 18 23 25 35 65 54 34 56 72 Max Rate:Y 202 186 187 180 156 169 174 172 153 XY 3636 4278 4675 6300 10140 9126 5916 9632 11016 X2 324 529 625 1225 4225 2916 1156 3136 5184 คนที่ 10 11 12 13 14 15 รวม อาย(ุ Age):X 19 23 42 18 39 37 560 Max Rate:Y 199 193 174 198 183 178 2704 XY 3781 4439 7308 3564 7137 6586 97534 X 2 361 529 1764 324 1521 1369 25188 n nn n  XiYi  (  Xi  Yi ) b  15(97534)  (560)(2704)   0.79773 i1 i1 i1 n n X i2  n Xi )2 15(25188)  (560)2  ( i1 i1 n n  Y  bX  2704  (  0.79773) 560  210.04846 15 15  Yi  Xi a  i1  b i1 n n จึงได้สมการพยากรณ์หรอื สมการทาํ นายคือ Yˆ  210.048  0.79773X ตามที่ต้องการ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

การวิเคราะห์ค่าสถิติ – 135– การทดสอบเก่ยี วกบั ข้อตกลงของตวั แบบ (Testing of model assumptions) สําหรบั การทดสอบ  : H0:  = 0 vs. Ha:   0 n xi2 1  x2  SE(a)  i1 =s n n ( xi  x )2 n n ( xi  x )2   i1 i1 n yi2 n yi n xi yi  a  b  s2  i1 i1 i1 n2 t  a 0 SE(a) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

– 136 – การวเิ คราะหข์ อ้ มลู ทางสถิติ โดยใช้โปรแกรม R สาํ หรับการทดสอบ  : H0:  = – 1 vs. Ha:   – 1 SE(b) s 1 n xi2  nx 2  i1 n yi2 n yi n xi yi  a  b  s2  i1 i1 i1 n2 t b SE(b) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวเิ คราะห์คา่ สถติ ิ – 137– ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 138 – การวเิ คราะหข์ อ้ มูลทางสถติ ิ โดยใชโ้ ปรแกรม R ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

การวิเคราะหค์ ่าสถิติ – 139 – 6.5 การทดสอบโดยใช้ไคสแควร์ (Chi-square test) การแจกแจงไคสแควร์ มีการนําไปใช้ในการหาความน่าจะเป็นจากการนําข้อมูลท่ีมีการ แจกแจงแบบปกติมาตรฐาน (Z) นาํ ไปยกกาํ ลังสอง กล่าวคือ Z2  2   x   2 ซึ่งหาก X มี    การแจกแจงแบบไคสแควร์ มีฟังก์ชนั การแจกแจงดังนี้ f (x; )  ( 1 x /21ex/2 ;  x   ซ่ึงฟังก์ชันน้ีมีค่าเฉล่ียหรือค่าคาดหวังคือ  / 2)2 /2 และมคี ่าความแปรปรวนคือ 2 df = 5 df = 10 0 สมมติวา่ มปี ระชากรทม่ี ีการแจกแจงเป็นแบบปกติมีคา่ เฉล่ียคอื  และความแปรปรวนคือ 2 แลว้ ส่มุ ตัวอย่างมี 1 คน นาํ ค่าทีไ่ ด้มาคํานวณ Z2   x 2  (21) ซ่งึ หากเก็บข้อมลู มา n    คน จาํ นวน 1 คร้ัง แล้วนําคะแนนที่สังเกตไดแ้ ต่ละคนมาคํานวณค่า Z2 และคํานวณผลรวมทัง้ n คน ซึง่ จะไดว้ ่า n Zi2  n xi   2  (2n) หากทําการสุ่มแต่ละคร้งั แลว้ คํานวณค่าความ  i1   i1 แปรปรวนของตวั อยา่ ง (S2) จะไดว้ า่ 2  (n 1)S 2 หรอื เขยี นใหม่ได้เปน็ S2   2 (2n1) ( n 1) 2 n 1 ซึง่ เศษสว่ น 2/(n – 1) คือคา่ คงท่ีสําหรับความแปรปรวนของประชากรและขนาดของตวั อย่าง โดยการแจกแจงของ S2 จะแตกตา่ งกันไปข้ึนอยู่กบั ค่าของ 2 ( n 1) การทดสอบไคสแควร์ มีวัตถปุ ระสงคส์ ําคญั 3 ประการคอื 6.5.1 การทดสอบภาวสารูปสนิทดี (Test of goodness of fit) โดยมีวัตถุประสงค์เพื่อทดสอบ เกยี่ วกบั ลกั ษณะตา่ งๆ ของประชากรว่าเปน็ ไปตามที่คาดไว้หรอื ไม่ 6.5.2 การทดสอบความเป็นอิสระ (Test of independence) โดยมีวัตถุประสงค์เพื่อทดสอบ ความเป็นอิสระหรือความสัมพันธ์ระหว่างตัวแปร 2 ตัว และตัวแปรมีสเกลการวัดแบบแบ่ง ประเภทหรือนามบัญญตั ิ ซ่ึงมขี ้อมลู เป็นจํานวนนับ 6.5.3 การทดสอบความเป็นเอกพันธ์ (Test of homogeneity) ซึ่งมีวัตถุประสงค์จะใช้ทดสอบ ความเหมือนกนั หรือความไมแ่ ตกตา่ งกนั เช่นทดสอบว่าข้อมูลนั้นมาจากประชากรท่ีมีการแจกแจง เดยี วกันหรอื ไม่ ในกรณีตัวอย่างกลุ่มเดียว มักทดสอบภาวสารูปสนิทดี ระหว่างการแจกแจงของ ตัวอย่างกับการแจกแจงที่กําหนด ส่วนกรณีท่ีมีตัวอย่าง 2 กลุ่มที่เป็นอิสระกัน เม่ือสุ่มตัวอย่าง มาแล้วจัดข้อมูลของตัวแปรตามท่ีเป็นแบบจําแนกประเภทให้อยู่ในช้ันต่างๆ (Categories) ข้อมูล จะอยู่ในตาราง 2 ทาง เมื่อตัวแปรในทางหนึ่งของตารางอ้างถึงกลุ่มประชากรและตัวแปรอีกทาง หนง่ึ ของตารางเปน็ ตวั แปรตามท่ีสนใจศกึ ษา มีสเกลการวดั แบบจําแนกประเภท มวี ัตถุประสงค์ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิติและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี

– 140 – การวิเคราะหข์ ้อมลู ทางสถติ ิ โดยใช้โปรแกรม R เพื่อทดสอบเกี่ยวกับตัวแปรท่ีสนใจศึกษาของประชากรกลุ่มต่างๆ ว่ามาจากประชากรเดียวกัน หรอื ไม่ หรือมาจากประชากรที่มกี ารแจกแจงเดียวกนั หรือไม่ 6.5.1 การทดสอบภาวสารปู สนิทดี (Test of goodness of fit) การทดสอบภาวสารูปสนิทดี ทดสอบเกี่ยวกับการแจกแจงของตัวแปร 1 ตัวว่าเป็นไป ตามสัดส่วนท่ีกําหนดไว้หรือไม่ ตัวแปรมีสเกลการวัดเป็นแบบนามบัญญัติ (Nominal scale) หรือ แบบแบ่งประเภท (Categories) ข้อมูลมาจากประชากรกลุ่มเดียว สมมติว่าตัวอย่างกลุ่มหน่ึง ขนาด n ถูกแบ่งออกเป็น k ชั้น กําหนดให้ n1,n2,...,nk แทนจํานวนความถี่ในแต่ละช้ัน ถ้าให้ สัดส่วนของประชากรหรือความน่าจะเป็นในแต่ละชั้นแทนด้วย p1, p2,..., pk ตามลําดับ สมมติฐานท่ตี ้องการทดสอบคอื H0 : p1  p2  ...  pk  p โดยท่ี p1  p2 ... pk 1 ตัวอย่าง 6.38 ต้องการตรวจสอบว่าอัตราส่วนของผู้นิยมพรรคการเมืองประชานิยมและพรรค การเมอื งเสรนี ยิ มเทา่ กับ 4:1 โดยสมมติฐานทางสถติ ทิ ีต่ อ้ งการทดสอบคอื H0 :อตั ราสว่ นของผู้นิยมพรรคการเมืองประชานยิ มและพรรคการเมืองเสรนี ิยมเท่ากับ 4:1 Ha :อตั ราสว่ นของผูน้ ิยมพรรคการเมืองประชานยิ มและพรรคการเมอื งเสรนี ิยมไมเ่ ท่ากับ 4:1 ข้อตกลงเบื้องต้นคือความถ่ีคาดหวังในแต่ละระดับของตัวแปรท่ีสนใจศึกษา ต้องมี จาํ นวนนับอย่างน้อยเท่ากับ 1 และจะมีจํานวนความถ่ีคาดหวังในแต่ละระดับของตัวแปรที่สนใจ ศกึ ษาท่ีมจี ํานวนนบั น้อยกว่า 5 ได้ไม่เกนิ 20% ของจํานวนระดับทงั้ หมดของตวั แปรท่ีสนใจศกึ ษา ตัวสถติ ทิ ดสอบ คือ Chi – Square ทม่ี ีสตู รดงั น้ี 2  k (Oi  Ei )2 ; i  1, 2,..., k ท่ีมีจํานวนช้ันอิสระ (df) = k – 1 โดยมี k คือจํานวนระดับ  i1 Ei ของตัวแปรที่สนใจศึกษา เม่ือ Oi คือความถ่ีของค่าสังเกต (Observation) ของตัวแปรท่ีระดับ i และ Ei คือความถี่คาดหวัง (Expectation) ของตัวแปรที่ระดับ i จากตัวอย่างความนิยมพรรค การเมอื งประชานยิ มและพรรคการเมืองเสรีนิยม ซ่ึงจะทดสอบว่ามีอัตราส่วนเป็น 4:1 จริงหรือไม่ จึงได้ทําการสุ่มตัวอย่างมาจํานวน 360 คน แล้วสอบถามว่าชอบพรรคใดใน 2 พรรคน้ี มีจํานวน ผู้ตอบว่าชอบพรรคประชานิยม จํานวน 273 คน และผู้ตอบว่าชอบพรรคเสรีนิยมจํานวน 87 คน จงึ ทาํ การทดสอบทร่ี ะดบั นยั สาํ คญั  = 0.05 ดังแสดงขอ้ มลู ตามตาราง ขอ้ มูลจํานวนนบั ความนยิ มพรรคการเมือง 2 พรรค Party พรรคการเมอื ง จํานวน (Score) 1 ประชานิยม 279 2 เสรนี ิยม 81 การคํานวณค่าความน่าจะเป็นของตัวอย่างที่จะเป็นสมาชิกในเซลน้ันท่ีมีอัตราส่วนคือ 4:1 จึงมที ้งั หมด 5 สว่ น ดงั นนั้ ความนา่ จะเปน็ ที่ตวั อย่างจะตกในเซลพรรคการเมืองประชานิยมคือ 4/5 และพรรคการเมืองเสรีนิยมคือ 1/5 ค่าความคาดหวังที่จะเลือกพรรคประชานิยมคือ 4 x360  288 คน และค่าคาดหวงั ทจี่ ะเลอื กพรรคเสรนี ยิ มคอื 1 x360  72 คน 55 ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

การวิเคราะห์คา่ สถติ ิ – 141 – สามารถแสดงข้อมูลไดต้ ามตาราง ความถ่ที ี่สงั เกตได้ (Oi) ความถท่ี ี่คาดหวัง (Ei) Party พรรคการเมือง 279 288 1 ประชานิยม 81 72 2 เสรนี ยิ ม ดงั นน้ั สามารถหาค่าตวั สถติ ิทดสอบ คอื 2  k (Oi  Ei )2  (279  288)2  (81 72)2  i1 Ei 288 72 1.406 เมื่อกําหนดระดับนัยสําคัญ 0.05 ได้ค่าวิกฤติคือ 3.841 และได้ค่าไคสแควร์คํานวณจาก ข้อมูลคือ 1.406 ซ่ึงตกนอกบริเวณวิกฤติ จึงยอมรับ H0 :อัตราส่วนของผู้นิยมพรรคการเมือง ประชานิยมและพรรคการเมืองเสรีนิยมเท่ากับ 4:1 เป็นจริง ซึ่งสามารถใช้โปรแกรม R เพื่อ คํานวณข้อมูลจากตวั อย่าง ไดด้ ังน้ี = 1.406 0 = 3.841 หรืออาจใช้การทดสอบไคสแควร์ ดงั น้ี ตัวอย่าง 6.39 ต้องการตรวจสอบว่าสัดส่วนของจํานวนผู้ท่ีมีเลือดกรุ๊ปต่างๆ คือ A B AB และ O ของประชาชนชาวไทย เป็น 22:33:8:37 โดยสมมตฐิ านทางสถติ ทิ ีต่ อ้ งการทดสอบคือ H0 :สดั ส่วนของจํานวนผทู้ ่ีมเี ลือดกรปุ๊ ต่างๆ คือ A B AB และ O ของประชาชนชาวไทย เปน็ 22 : 33 : 8 : 37 Ha : สัดสว่ นของจาํ นวนผทู้ ีม่ เี ลอื ดกรปุ๊ ต่างๆ คือ A B AB และ O ของประชาชนชาวไทย ไมเ่ ป็น 22 : 33 : 8 : 37 ซึ่งได้สาํ รวจขอ้ มลู ประชาชนชาวไทยจํานวน 460 คน ไดข้ ้อมลู สดั สว่ นดงั น้ี เลอื ดกรุ๊ป นิสยั ค่าสดั สว่ น ค่าสงั เกตได้ ค่าคาดหวงั A ละเอียดอ่อน จริงจงั 0.22 98 101.20 B มองโลกในแง่ดี มเี อกลักษณ์ 0.33 155 151.80 AB ไมม่ ีอารมณร์ ่วม สองบคุ ลิก 0.08 35 36.80 O นสิ ยั สบาย เชอื่ มั่น 0.37 172 170.20 ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิติและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี

– 142 – การวเิ คราะห์ข้อมูลทางสถติ ิ โดยใชโ้ ปรแกรม R ดั ง น้ั น ส า ม า ร ถ ห า ค่ า ตั ว ส ถิ ติ ท ด ส อ บ คื อ 2  k (Oi  Ei )2  (98 101.2)2  (155 151.8)2   i1 Ei 101.2 151.8 (35  36.8)2  (172 170.2)2 = 0.2757 36.8 170.2 เม่ือกําหนดระดับนัยสําคัญ 0.05 ได้ค่าวิกฤติคือ 7.8147 และได้ค่าไคสแควร์คํานวณ จากข้อมูลคือ 0.2757 ซึ่งตกนอกบริเวณวิกฤติ จึงยอมรับ H0 :สัดส่วนของจํานวนผู้ท่ีมีเลือด กรุ๊ปต่างๆ คือ A B AB และ O ของประชาชนชาวไทย คือ 22 : 33 : 8 : 37 เป็นจริง ซ่ึง สามารถใช้โปรแกรม R เพอ่ื คาํ นวณข้อมูลจากตัวอยา่ ง ไดด้ ังน้ี หรืออาจใช้การทดสอบไคสแควร์ ดังนี้ 6.5.2 การทดสอบความเปน็ อิสระ (Test of independence) การทดสอบความเปน็ อสิ ระ เปน็ การทดสอบสาํ หรบั ตัวอยา่ ง 1 กลุ่ม โดยทดสอบ ความเป็นอิสระของตัวแปร 2 ตัว ท่ีมีมาตรวัดแบบแบ่งประเภทหรือแบบอันดับ เช่นเพศ กับทัศนคติต่อการทําแท้งอย่างถูกกฎหมาย ซ่ึงสมมติฐานทางสถิติที่ต้องการทดสอบคือ H0 : เพศกับทัศนคติต่อการทําแท้งอย่างถูกกฎหมายเป็นอิสระกันหรือไม่มี ความสัมพันธ์กัน คู่กับ Ha : เพศกับทัศนคติต่อการทําแท้งอย่างถูกกฎหมายไม่เป็น อิสระกนั หรอื มคี วามสัมพันธก์ นั ข้อตกลงเบื้องต้นคือจํานวนตัวอย่าง (n) ต้องมากพอ ในกรณีที่เป็นตาราง 2x2 ควรมีจํานวนตวั อย่างมากกว่า 20 ถ้ามีความถ่ีคาดหวังบางเซลของตารางน้อยกว่า 5 ควร ทาํ การทดสอบด้วย Fisher’s exact test และความถี่คาดหวังในแต่ละเซลของตาราง ควรมี จํานวนความถี่มากกว่าหรือเท่ากับ 5 หรือถ้ามีจํานวนความถี่น้อยกว่า 5 ก็มีได้ไม่เกิน 20% ของจํานวนเซลทัง้ หมดในตาราง สถิติทดสอบคอื Pearson chi-square ซ่งึ มาสตู รดังน้ี 2  r c (Oij  Eij )2 ท่ีมีจํานวนองศาอิสระ (df) = (r – 1)(c – 1) ซ่ึง r คือจํานวน   i1 j1 Eij แถว และ c คือจาํ นวนสดมส์ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี

การวิเคราะหค์ ่าสถิติ – 143 – ตัวอย่าง 6.40 การศึกษาเรื่องความเชื่อเกี่ยวกับชีวิตหลังความตาย แยกตามเพศและความ เชอื่ ตวั อย่างเปน็ ผู้หญิงตอบวา่ เชือ่ จํานวน 435 คน ตอบไม่เชื่อจํานวน 147 คน เป็นผู้ชาย ตอบวา่ เชือ่ จํานวน 375 คน ตอบไมเ่ ชื่อจํานวน 134 คน โดยแสดงข้อมลู ในรปู ตารางดังนี้ ความเชอ่ื เกยี่ วกบั ชวี ิตหลงั ความตาย เพศ เช่ือ ไม่เช่ือ รวม ชาย 375 134 509 หญิง 435 147 582 รวม 810 281 1091 วิธีทํา การคํานวณความถี่ท่ีคาดหวังในแต่ละเซล ถ้าตัวแปรที่ศึกษาเป็นอิสระกัน ความ นา่ จะเป็นของตวั อยา่ งจะเป็นสมาชิกในเซล 11 (นกั เรียนชาย,เช่ือ) จะเท่ากับความ น่าจะเป็นของสมาชิกในแถวท่ี 1 คือ 509/1091 คูณกับความน่าจะเป็นของสมาชิก ในสดมส์ที่ 1 คือ 810/1091 ดังน้ันความน่าจะเป็นของตัวอย่างในแถวท่ี 1 สดมส์ที่ 1 (เซล 11) คือ P11 = (509/1091)(810/1091) โดยทีค่ ่าคาดหวังท่ีต้องการในเซล 11 คือ nP11 = (1091)(509/1091)(810/1091) = (509)(810/1091) = 377.9 ดังนั้นการ หาค่าคาดหวังในเซลอื่นๆ ก็สามารถคาํ นวณหาได้ในทํานองเดียวกัน ถ้าให้ RT, CT และ n แทนผลรวมตามแนวแถว ผลรวมตามแนวสดมส์ และผลรวมตัวอย่าง ทั้งหมด สามารถหาความถี่ที่คาดหวังได้โดย Eij  nPij  (RTi )(CTj ) ดังน้ัน n ความถี่ทค่ี าดหวงั และความถีท่ สี่ งั เกตได้ นําเสนอในรูปตารางดงั นี้ ความเชอื่ เกยี่ วกับชีวติ หลังความตาย เพศ เชือ่ ไมเ่ ชอื่ รวม ชาย 375 / 377.9 134 / 131.1 509 หญิง 435 / 432.1 147 / 149.9 582 รวม 810 281 1091 การคํานวณค่าไคสแควร์ สามารถคํานวณไดด้ ังนี้ 2  r c (Oij  Eij )2  (375  377.9)2  (134 131.1)2  (435  432.1)2    i1 j1 Eij 377.9 131.1 432.1 (147 149.9)2  0.022  0.064 0.019 0.056  0.161 149.9 จากผลลัพธ์ได้คา่ สถติ ิทดสอบ 2 = 0.161 และไม่มเี ซลใดท่ีมีความถี่คาดหวังน้อย กว่า 5 เมื่อเทียบกับเกณฑ์ของค่า 2 จากตารางที่ระดับนัยสําคัญ 0.05 และองศา อิสระเป็น 1 ได้ค่า 3.841 แต่ค่าท่ีคํานวณ 2 ได้คือ 0.161 ซ่ึงน้อยกว่าเกณฑ์ จึง ยอมรบั H0 นั่นคอื ความเช่ือเกย่ี วกับชวี ิตหลงั ความตายไมข่ น้ึ กบั เพศ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี

– 144 – การวิเคราะห์ขอ้ มลู ทางสถติ ิ โดยใชโ้ ปรแกรม R สตู รปรับแก้ของเยสต์ (Yates’ Correction for Continuity) เน่ืองจากว่าการแจกแจงแบบไคสแควร์เป็นการแจกแจงแบบต่อเน่ือง และค่าสถิติ ทดสอบสมมตฐิ านนีม้ กี ารแจกแจงโดยประมาณ ดังน้ันจึงมีการใช้ค่า continuity correction factor คือ 0.5 ช่วยในการปรับค่าการแจกแจงน้ี ในกรณีท่ีเป็นตาราง 2x2 เราอาจใช้สูตรท่ีง่ายต่อการ คาํ นวณคอื ตาราง 2x2 ขา้ งลา่ งนี้ A B A+B สามารถเขียนเปน็ สตู ร ไดด้ ังน้ี C D C+D A+C B+D n ตัวอย่าง 6.41 การทดลองหน่ึง สุ่มตัวอย่างนักเรียนห้อง ก มา 12 คน และห้อง ข มา 12 คน ให้มาปฏบิ ัตงิ านช้นิ หนง่ึ เพอ่ื ดสู มรรถภาพการทาํ งาน ภายในระยะเวลาที่จํากัด ข้อมูลถูก นําเสนอดังตารางข้างล่าง เม่อื เซลแต่ละเซลบรรจุจํานวนของตัวอย่างแต่ละกลุ่มท่ีทํางาน เสร็จและไม่เสร็จ ดังน้ันสําหรับตัวอย่างนี้ในกลุ่มห้อง ก มี 10 คนที่ทํางานเสร็จ ที่เหลือ ทาํ งานไม่เสร็จ ในขณะทกี่ ลุ่มห้อง ข ทํางานไมเ่ สรจ็ 11 คน ทเ่ี หลือทํางานเสร็จ หอ้ ง/งาน งานเสรจ็ งานไมเ่ สรจ็ รวม ห้อง ก 10 2 12 ห้อง ข 1 11 12 รวม 11 13 24 การคาํ นวณคา่ คาดหวังในแตล่ ะเซล สามารถใชส้ ูตร Eij  nPij  (RTi )(CTj ) เช่น E11 n หาได้จาก E11  nP11  ( RT1 )(CT1 )  12x11 = 5.5 ในเซลอ่ืนๆ สามารถคํานวณได้ 24 n ทํานองเดยี วกัน จงึ เขียนค่าความถที่ สี่ ังเกตได้ และความถท่ี ่คี าดหวังดงั ตารางข้างล่างนี้ ความถ่ที ่ีสังเกตได้ ความถ่ที ี่คาดหวงั หอ้ ง/งาน งานเสร็จ งานไมเ่ สร็จ ห้อง/งาน งานเสรจ็ งานไมเ่ สร็จ หอ้ ง ก 10 2 ห้อง ก 5.5 6.5 หอ้ ง ข 1 11 หอ้ ง ข 5.5 6.5 รวม 11 13 รวม 11 13 สามารถคาํ นวณคา่ ไคสแควร์ได้ดังนี้ 2  r c (Oij  Eij )2  (10  5.5)2  (2  6.5)2  (1 5.5)2  (11 6.5)2 = 13.594   i1 j1 Eij 5.5 6.5 5.5 6.5 คาํ นวณจาก 2  n(AD  BC)2  24(110  2)2  13.59441 (A  B)(C  D)(A  C)(B  D) (12)(12)(11)(13) ซ่ึงค่าท่ีได้จะเท่ากับการหาไคสแควร์โดยตรง แต่ปัญหาของนักวิจัยเกี่ยวกับการใช้สูตรนี้ อาจเกิดจากการจัดกระทํากับอักษรต่างๆ ท่ีอยู่ในแต่ละเซล ดังน้ันจะต้องสังเกตว่า คูณเซล 2 เซลในแนวทแยงและบวกเซล 2 เซลตามแนวดิ่งและแนวราบ แล้วนําผลจากการคูณ 2 เซลใน แนวทแยงมาหักลบกันแล้วยกกําลังสองคูณด้วย n และหารด้วยผลคูณของผลบวกจากเซล 2 เซลตามแนวดง่ิ และแนวราบ ถา้ ผลลพั ธท์ ไ่ี ดผ้ ิดแปลกเชน่ ตดิ ลบแสดงว่ามบี างสิง่ บางอย่างผดิ แน่ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook