ชวี สถิติสำหรับสำธำรณสุข: หน่วยท่ี 7 กำรแจกแจงค่ำสถิติ ดงั นน้ั 1.69 X i 120 10 X i (1.69 10) 120 136.9 จะไดว้ ่ำ ค่ำท่ีครอบคลมุ ร้อยละ 95.45 ของพน้ื ท่ใี ต้โค้งปกติ ของค่ำ systolic blood pressure มีค่ำน้อย กวำ่ 136.9 mmHg ตอบ 0.9545 0.0455 1.69 136.9 mmHg 4. ถ้ำระดับน้ำตำลในเลือดมีกำรแจกแจงแบบปกติ โดยมีค่ำเฉลี่ย เท่ำกับ 130 mg% และส่วนเบ่ียงเบน มำตรฐำน เทำ่ กับ 12 mg% ถำ้ สุ่มตัวอยำ่ งจำนวน 36 คน จงหำว่ำ 4.1 ค่ำควำมน่ำจะเป็นท่ตี วั อยำ่ งจำนวน 36 คน ทส่ี มุ่ มำจำกประชำกรดงั กลำ่ ว จะมีค่ำเฉลี่ยของระดับ นำ้ ตำลในเลือด อยู่ระหวำ่ ง 123 – 125 mg% 4.2 คำ่ ควำมน่ำจะเปน็ ที่ตัวอย่ำงจำนวน 25 คน ที่สุ่มมำจำกประชำกรดงั กล่ำว จะมคี ่ำเฉล่ียของระดับ นำ้ ตำลในเลอื ด น้อยกวำ่ 125 mg% 4.1 ค่ำควำมน่ำจะเป็นท่ีตัวอย่ำงจำนวน 36 คน ท่ีสุ่มมำจำกประชำกรดังกล่ำว จะมีค่ำเฉล่ียของระดับ นำ้ ตำลในเลือด อยรู่ ะหว่ำง 123 – 125 mg% วิธที า จำกโจทย์ = 130 mg%, = 12 mg%, n = 36 ดังนัน้ P(123 < X < 125) = P 123 130 Z 11225/ 130 12 / 36 36 = P(-3.5 < Z < -2.5) = 0.0062-0.0002 = 0.0060 ดังน้ัน ควำมน่ำจะเป็นท่ีตัวอย่ำงจำนวน 36 คน ที่สุ่มมำจำกประชำกรดังกล่ำว จะมีค่ำเฉล่ียของระดับ น้ำตำลในเลอื ด อยู่ระหว่ำง 123 – 125 mg% เทำ่ กบั 0.006 ตอบ ~ 89 ~
ชวี สถิตสิ ำหรบั สำธำรณสุข: หน่วยที่ 7 กำรแจกแจงคำ่ สถิติ 0.006 -3.5 -2.5 0 4.2 ค่ำควำมน่ำจะเป็นที่ตัวอย่ำงจำนวน 25 คน ท่ีสุ่มมำจำกประชำกรดังกล่ำว จะมีค่ำเฉลี่ยของระดับ นำ้ ตำลในเลือด นอ้ ยกว่ำ 125 mg% วิธที า จำกโจทย์ = 130 mg%, = 12 mg%, n = 25 ดังนนั้ P( X < 125) = 125 130 PZ 12 / 25 = P(Z < -2.08) = 0.0188 ดังนั้น ค่ำควำมน่ำจะเป็นท่ีตัวอย่ำงจำนวน 25 คน ที่สุ่มมำจำกประชำกรดังกล่ำว จะมีค่ำเฉล่ียของระดับ น้ำตำลในเลอื ด นอ้ ยกว่ำ 125 mg% เทำ่ กบั 0.0188 ตอบ 0.0188 -2.08 0 ~ 90 ~
ชวี สถิติสําหรับสาธารณสุข: หนว่ ยท่ี 8 การประมาณคา่ หนว่ ยท่ี 8 การประมาณคา่ วตั ถปุ ระสงค:์ หลังจากจบการเรียนในหัวขอ้ นีแ้ ล้วนสิ ิตสามารถ 1. ทราบหลักการประมาณค่า 2. ทราบขนั้ ตอนการประมาณค่าและสามารถวิเคราะห์หาช่วงเช่ือมัน่ ของคา่ เฉลย่ี ประชากรเดยี ว ได้ 3. ทราบปัจจยั ท่ีมีผลต่อช่วงเชอ่ื มั่น เนอ้ื หา: การประมาณคา่ 1. การประมาณคา่ แบบจดุ 2. การประมาณค่าแบบชว่ งเชื่อมัน่ 3. การประมาณคา่ เฉลี่ยของประชากรเดยี ว เม่ือทราบความแปรปรวนของประชากร 4. การประมาณค่าเฉลย่ี ของประชากรเดยี ว เมอ่ื ไมท่ ราบความแปรปรวนของประชากร รูปแบบการเรยี นการสอน: การเรยี นรูแ้ บบร่วมมอื 1. ผเู้ รียนแต่ละคนศึกษาเนอ้ื หาตามหวั ขอ้ บรรยายจากเอกสารประกอบการสอนและสรุปเป็น แผนผงั ความคดิ (Mind map) ก่อนเขา้ ชั้นเรยี น 2. แบง่ กล่มุ การเรยี น เชค็ ชื่อสมาชิกภายในกลมุ่ และอภิปรายเนื้อหาตามทไ่ี ด้รบั มอบหมาย ภายในกลมุ่ และภายในช้ันเรยี น 3. สรปุ เน้ือหาโดยอาจารยผ์ ้สู อน 4. ผู้เรียนแต่ละกลุ่มคดิ โจทยแ์ บบฝึกหัดพร้อมเฉลยหลงั จากจบบทเรียน และส่งภายในสปั ดาห์ ถดั ไป ~ 91 ~
ชีวสถิตสิ ําหรับสาธารณสขุ : หน่วยที่ 8 การประมาณค่า การประมาณค่า (Estimation) เป็นสถิติอนุมานอย่างหน่ึงซึ่งใช้ในการประมาณค่าพารามิเตอร์ ของประชากรดว้ ยค่าสถติ ิหรอื ข้อมลู จากตัวอยา่ ง เช่น ต้องการทราบว่า ระดับน้ําตาลในเลือดของผปู้ ว่ ยเบาหวานในจงั หวดั พิษณุโลกมคี ่าเทา่ ไร เม่ือ มีการเก็บข้อมูลระดับน้ําตาลในเลือดจากตัวอย่างท่ีสุ่มจากประชากรผู้ป่วยเบาหวานในจังหวัดพิษณุโลก แล้วนํามาหาค่าเฉล่ียของระดับนํ้าตาลในเลือด จะเป็นการประมาณค่าเฉล่ียระดับนํ้าตาลในเลือดของ ประชากร () ดว้ ยคา่ เฉลีย่ ระดบั น้าํ ตาลในเลอื ดของตวั อย่าง (x)̅ หรือ การเกิดโรคหอบหืดของประชาชนในจังหวัดพิษณุโลกมีค่าเท่าไร เมื่อมีการสุ่มตัวอย่างเพื่อ สํารวจการเป็นโรคหอบหืดของประชาชนในจังหวัดพิษณุโลก แล้วนํามาหาค่าสัดส่วน (หรือร้อยละ) ของ การเป็นโรคหอบหืด จะเป็นการประมาณค่าสัดส่วนการเกิดโรคหอบหืดของประชากร () ด้วยค่าสัดส่วน การเกิดโรคหอบหืดของตัวอย่าง (p) การประมาณคา่ มี 2 วธิ ีคือ การประมาณค่าแบบจุดและการประมาณ คา่ แบบช่วงเช่อื มนั่ 1. การประมาณคา่ แบบจดุ (Point estimation) การประมาณค่าแบบจุด เป็นการประมาณค่าพารามิเตอร์ของประชากรด้วยค่าสถิติของตัวอย่าง เพียงค่าเดียว โดยไม่ได้คํานึงถึงความคลาดเคล่ือนจากการสุ่มตัวอย่าง (Sampling error) ดังนั้นข้อสรุปท่ี ได้จึงไม่น่าเชือ่ ถอื เช่น การสุ่มตัวอย่างจากประชากรผู้ป่วยเบาหวานในจังหวัดพิษณุโลกเพื่อประมาณค่าระดับ นา้ํ ตาลในเลือดแบบจดุ ส่มุ ครง้ั ที่ 1 ตวั อยา่ ง 10 ราย ได้ค่าเฉลย่ี เทา่ กับ 110 mg/dl (x1̅ =110) สุ่มครงั้ ท่ี 2 ตวั อยา่ ง 10 ราย ได้คา่ เฉล่ียเทา่ กับ 120 mg/dl (x1̅ =120) สมุ่ ครั้งที่ 3 ตวั อย่าง 10 ราย ไดค้ ่าเฉล่ยี เทา่ กับ 130 mg/dl (x1̅ =130) จะเห็นได้ว่าเม่ือมีการสุ่มตวั อย่างหลายๆ ครงั้ ค่าเฉลยี่ ของระดบั นาํ้ ตาลในเลอื ดที่ได้จากการสมุ่ ตวั อย่างแต่ละครัง้ ไมเ่ ท่ากนั โดยท่ัวไปเราประมาณคา่ พารามิเตอรใ์ นประชากรทไ่ี ม่ทราบค่า ด้วยคา่ สถิติดงั ตารางท่ี 8.1 2. การประมาณคา่ แบบช่วงเชอื่ ม่ัน (Interval estimation) การประมาณค่าแบบช่วงเช่ือมั่น เป็นเป็นการประมาณค่าพารามิเตอร์ของประชากรด้วยค่าสถิติ ของตัวอย่างในลักษณะเป็นช่วง โดยอาศัยความน่าจะเป็นของค่าสถิติน้ัน ซึ่งเรียกว่า ระดับความเช่ือมั่น (Confidence level) และคาํ นงึ ถึงความคลาดเคล่ือนจากการสุ่มตัวอย่าง (Sampling error) ซ่งึ แสดงด้วย ค่าความคลาดเคลื่อนมาตรฐาน (Standard error; SE) ค่าที่ได้จากการประมาณแบบช่วงน้ีจะเรียกว่า ค่า ชว่ งเชื่อม่นั (Confidence interval; CI) เช่น การสุ่มตัวอย่างจากประชากรผู้ป่วยเบาหวานในจังหวัดพิษณุโลกเพ่ือประมาณค่าระดับ นํา้ ตาลในเลือดแบบช่วงเชื่อมั่น จะได้ค่า 95% ช่วงเชื่อม่ัน (Confidence interval; CI) ของค่าเฉล่ียระดับ น้ําตาลในเลอื ดของผปู้ ่วยเบาหวานจงั หวดั พิษณโุ ลก เท่ากับ 100 ถงึ 140 mg% ~ 92 ~
ชีวสถิตสิ าํ หรับสาธารณสุข: หน่วยท่ี 8 การประมาณค่า ตารางท่ี 8.1 สูตรการคาํ นวณคา่ สถติ ิและคา่ พารามเิ ตอร์ คา่ พารามเิ ตอร์ คา่ สถติ ิ 1 ค่าเฉลย่ี ของประชากร (μ) ค่าเฉลีย่ ของตัวอย่าง (x)̅ N n xi i 1 xi x i 1 N n 2 ความแปรปรวนของประชากร (σ2) ความแปรปรวนของตัวอย่าง (s2) n N S 2 i1 2 i1 Xi 2 Xi X 2 N n 1 3 คา่ สดั ส่วนของประชากร (P, ) ค่าสดั ส่วนของตวั อยา่ ง (p) P A p a N n 2.1 แนวคิดการประมาณคา่ แบบช่วงเชื่อมนั่ ในท่ีน้ีจะกล่าวถึงการประมาณค่าเฉล่ียของประชากร () กลุ่มเดียว โดยใช้ค่าเฉลี่ยของ ตัวอย่าง x̅ เป็นตัวประมาณ (Estimator) เช่น ต้องการประมาณค่าเฉลี่ยระดับนํ้าตาลในเลือดของ ผู้ป่วยเบาหวานจังหวัดพิษณุโลก การประมาณค่าเฉลี่ยของประชากรด้วยค่าเฉลี่ยของตัวอย่างจะอาศัยคุณสมบัติการแจก แจงค่าสถิติ (ค่าเฉล่ียของตัวอย่าง) ดังกล่าวไว้ในหน่วยที่ 7 คือ ค่าเฉล่ียของค่าเฉล่ียของตัวอย่างเท่ากับ ค่าเฉลี่ยของประชากร μx̅ = μ และความแปรปรวนของค่าเฉลี่ยของตัวอย่างเท่ากับความแปรปรวน σ2 ของประชากรหารดว้ ยขนาดตัวอย่าง n ดังน้ัน การประมาณค่า จะกระทําบนการแจกแจงค่าเฉลี่ย ของตัวอย่าง ซ่ึงมีการแจกแจงแบบปกติ (Normal distribution) โดยเมื่อประชากรมีการแจกแจงแบบ ปกติหรือมีขนาดตวั อยา่ งใหญพ่ อดงั ทฤษฎี Central limit theorem การประมาณค่าช่วงเชื่อม่ันของ ท่ี ระดบั ความเชือ่ มนั่ ทก่ี ําหนดจะอาศยั การแจกแจงแบบปกติมาตรฐาน (Standard normal distribution) กําหนดช่วงเชื่อมั่นของการประมาณค่า เท่ากับ 1 - บนการแจกแจงแบบปกติ มาตรฐาน ความนา่ จะเปน็ ของคา่ Z จะเป็นดังนี้ (ภาพท่ี 8.1 และ 8.2) P -Zα⁄2<Z<Zα⁄2 = 1- α จาก Z= x-μ σ⁄√n ดังนั้นจะได้ว่า P(Zα/ 2 Z Zα/ 2 ) P(Zα/ 2 X μ Z ) σ α/ 2 n P( X Zα/ 2 σ ~9μ3 ~ X Zα/ 2 σ) n n
ชวี สถิติสาํ หรบั สาธารณสุข: หนว่ ยท่ี 8 การประมาณคา่ นนั่ คอื ทช่ี ว่ งเชือ่ มนั่ 1 - ค่า จะอยใู่ นชว่ ง X Z /2[ / n] ...........................................................................................................(1) เมื่อ x̅ = คา่ เฉล่ียของตัวอย่างซง่ึ เปน็ ตวั ประมาณ Zσα⁄2 = ค่าสมั ประสทิ ธ์บิ นการแจกแจงปกตมิ าตรฐานท่ีชว่ งเชื่อมั่น 1 - = ค่าความคลาดเคลอื่ นมาตรฐาน (SE) ของตวั ประมาณ √n ดงั นั้น การประมาณคา่ พารามเิ ตอรใ์ ดๆ จะได้ว่า ตวั ประมาณ ค่าสมั ประสทิ ธ์คิ วามเชอ่ื มั่น x คา่ ความคลาดเคลอ่ื นมาตรฐาน Estimator Reliability coefficient x Standard error (SE) …………………..(2) ภาพที่ 8.1 คา่ Z บนการแจกแจงแบบปกตมิ าตรฐานที่ช่วงเชอื่ มน่ั 1 - ภาพท่ี 8.2 การประมาณค่าแบบชว่ งเช่ือมนั่ ~ 94 ~
ชวี สถติ สิ าํ หรบั สาธารณสขุ : หนว่ ยท่ี 8 การประมาณค่า 2.2 การแปลความหมายช่วงเช่ือม่ัน ช่วงเชื่อม่ันของค่าพารามิเตอร์ใดๆ ที่ระดับความเชื่อมั่น 1 - ซ่ึงนิยมแปลงให้เป็น เปอร์เซน็ ต์ คอื (1-)100% ความหมายของ “ช่วงความเชื่อมั่นที่ (1-)100%” คือ เม่ือมีการสุ่มตัวอย่าง n จาก ประชากรเดยี วกนั 100 ครงั้ สรา้ งช่วงเชื่อม่ันได้ 100 ชว่ ง โอกาสที่จะพบวา่ ช่วงเชอื่ ม่ันอยใู่ นช่วงทก่ี ําหนด (1-)100 ช่วง (ไมอ่ ยู่ในชว่ งทีก่ าํ หนด 100 ชว่ ง) แต่ความเป็นจริงมีการศึกษา 1 ครั้ง ดังน้ัน ในทางปฏิบัติอธิบายได้ว่า “มีความเชื่อมั่น (1-)100% ว่าจะมคี ่าพารามเิ ตอรอ์ ยใู่ นช่วงทีค่ าํ นวณไดจ้ ากตวั อยา่ ง” ดงั ภาพที่ 8.3 เช่น ด้วยความเช่ือมั่น 95% ค่าเฉล่ียของระดับนํ้าตาลในเลือดของผู้ป่วยเบาหวานจังหวัด พิษณโุ ลก จะมคี ่าอยู่ในชว่ ง 100 ถึง 140 mg% ภาพท่ี 8.3 การแปลความหมายชว่ งเชื่อมั่น 2.3 ปัจจยั ท่มี ผี ลตอ่ ช่วงเช่อื มน่ั การประมาณค่าแบบช่วงเช่ือม่ัน ค่าประมาณท่ีไดจ้ ะกว้างหรือแคบ ข้ึนอยู่กับปัจจัยต่างๆ เหลา่ น้ี 1) ความผิดพลาดของการประมาณค่า () การกําหนดความผิดพลาดของการประมาณค่าแบบช่วงเชื่อม่ันไม่มีเกณฑ์ กําหนดไว้ว่าจะต้องเป็นเท่าไร แต่ในทางปฏิบัตินิยมใช้ 0.01, 0.05, 0.1 โดยข้อมูลทางด้านสาธารณสุข โดยท่วั ไป จะกาํ หนดที่ = 0.05 น่ันคือ ชว่ งเชือ่ ม่ัน (1-) จะเท่ากับ (1-0.05) = 0.95 หรือ 95%ดังน้ัน จะได้ว่า การกําหนดความผิดพลาดของการประมาณค่าให้มีค่าน้อยจะทําให้ค่าสัมประสิทธ์ิของการ ~ 95 ~
ชวี สถิตสิ าํ หรับสาธารณสขุ : หน่วยท่ี 8 การประมาณค่า ประมาณค่าที่ชาวงเชื่อมั่น 1- มีค่าสูง ดังน้ันจะทําให้ได้ค่าช่วงเชื่อม่ันที่กว้าง ในทางตรงกันข้ามถ้า กําหนดความผิดพลาดของการประมาณคา่ ใหม้ คี า่ มาก จะไดช้ ว่ งเชอื่ มนั่ แคบ (ภาพที่ 8.4) ภาพที่ 8.4 ความสัมพันธ์ระหว่างความผิดพลาดในการประมาณคา่ กบั ชว่ งเชอ่ื มน่ั 2) ความแปรปรวนของลกั ษณะทสี่ นใจศกึ ษาในประชากร จากค่าความคลาดเคลื่อนของตัวประมาณ SE = σ⁄√n ซึ่งเป็นตัวกําหนดค่า ของช่วงเชื่อมั่น ดังน้ันความแปรปรวนของประชากรหรือส่วนเบี่ยงเบนมาตรฐานของประชากร () จึงมี ผลต่อความกวา้ งหรอื แคบของช่วงเชอื่ มน่ั ดงั นี้ - ถ้าประชากรมีความแตกต่างของลักษณะท่ีสนใจศึกษาน้อย นั่นคือ ค่า จะน้อย สง่ ผลให้ช่วงเชอ่ื มัน่ แคบ - ถ้าประชากรมีความแตกต่างของลักษณะท่ีสนใจศึกษามาก น่ันคือ ค่า จะมาก สง่ ผลใหช้ ่วงเช่ือมั่นกวา้ ง 3) ขนาดตวั อย่าง จากสูตรคํานวณค่าความคลาดเคล่ือนมาตรฐาน SE = σ⁄√n เม่ือความ แปรปรวนและค่าเฉลี่ยเท่ากันการเปล่ียนแปลงค่า n มีผลต่อค่าความคลาดเคลื่อนมาตรฐาน จึงมีผลต่อ ความกว้างหรือแคบของชว่ งเชอ่ื ม่ัน ดังน้ี - ถา้ ขนาดตัวอยา่ งใหญ่ (n มาก) ส่งผลให้ช่วงเชื่อมั่นแคบ - ถา้ ขนาดตวั อย่างเล็ก (n น้อย) สง่ ผลให้ช่วงเชื่อมั่นกวา้ ง จากปัจจัยตา่ งๆ ท่ีมีผลต่อความกว้างหรือแคบของช่วงเชื่อม่ัน ทําให้เราสามารถพิจารณา ความแม่นยําของการประมาณค่าได้ กล่าวคือ ช่วงเชื่อม่ันของการประมาณค่าพารามิเตอร์ที่ดีควรจะมีช่วง แคบๆ ซึ่งแสดงถึงความแม่นยํา (Precision) ในการประมาณค่า ดังน้ันวิธีการท่ีเป็นไปได้ในทางปฏิบัติคือ การใช้ขนาดตัวอย่างท่ีใหญ่พอที่จะทําให้ช่วงเช่ือมั่นแคบเพื่อแสดงถึงความแม่นยําในการประมาณค่า ~ 96 ~
ชวี สถติ สิ าํ หรับสาธารณสขุ : หน่วยท่ี 8 การประมาณค่า เนื่องจาก ปัจจัยอื่นๆ คือ ความผิดพลาดของการประมาณค่าจะกําหนดแน่นอน ส่วนความแปรปรวนของ ลกั ษณะที่สนใจศกึ ษาในประชากรเป็นปจั จยั ท่ีไมส่ ามารถกําหนดได้ 3. การประมาณค่าเฉลี่ยของประชากรเดยี ว เมื่อทราบความแปรปรวนของประชากร เมือ่ ทราบค่าความแปรปรวนของประชากร (2) จะใชก้ ารแจกแจงแบบปกตมิ าตรฐาน (Z) ใน การประมาณคา่ ดงั สูตรที่ 1 คือ X Z n 2 ตัวอย่างท่ี 1 นักวิจัยต้องการประมาณช่วงเชื่อม่ันค่าเฉล่ียท่ีระดับช่วงเชื่อม่ันท่ี 95% ของ Systolic Blood Pressure ข้อมูลประกอบด้วย 100 110 120 130 140 มิลลิเมตรปรอท (ถ้าทราบความ แปรปรวนของประชากร เท่ากับ 225 mmHg2) วิธีทาํ ขนั้ ท่ี 1 หาตวั ประมาณ (ค่าเฉลีย่ = 120) ขนั้ ที่ 2 หา SE = / n 15 / 5 ขัน้ ที่ 3 กําหนดความผิดพลาด 0.05 หาสัมประสิทธคิ์ วามเชื่อมน่ั ������ / ������ . / ������ . จาก X Z จะได้ 120 1.96 15 = 106.85, 133.15 n 5 2 ดังนน้ั ชว่ งเช่ือมนั่ ท่ี 95% ของค่าเฉลี่ย Systolic Blood Pressure มีค่าอยู่ระหว่าง 106.85 ถึง 133.15 มิลลิเมตรปรอท ตอบ ----------------------------------------------------------------------------------------------------------------------- 4. การประมาณคา่ เฉล่ยี ของประชากรเดยี ว เมอ่ื ไม่ทราบความแปรปรวนของประชากร ในทางปฏิบัติ เม่ือออกแบบการศึกษาโดยการสุ่มตัวอยา่ งจํานวน n จากประชากรที่มีการแจกแจง แบบปกติ ดังนั้นจึงไม่ทราบค่าความแปรปรวนในประชากร (2) จึงไม่สามารถประมาณค่าเฉล่ียของ ประชากร () โดยใช้การแจกแจงแบบ Z ได้ เน่ืองจากการเก็บข้อมูลเฉพาะตัวอย่างจึงไม่ทราบค่า SE ของตัวประมาณซึ่งคํานวณจาก σ⁄√n ซ่ึงในกรณีน้ีจะใช้ส่วนเบ่ียงเบนมาตรฐานของตัวอย่าง (S หรือ ̅ sd) แทน จงึ ทําให้ ⁄√ เข้าสลู่ ักษณะการแจกแจงแบบที (t distribution) t X …………………………………………………………………………………………………………..(3) s n และจะได้ว่าชว่ งเช่ือมั่น (1-)100% ของ อยู่ระหว่าง x t ,df s ………………………………………………………………….……………………………………….(4) n 2 เมือ่ df = n-1 ~ 97 ~
ชวี สถิติสําหรบั สาธารณสุข: หนว่ ยท่ี 8 การประมาณคา่ ลักษณะการแจกแจงแบบ t เป็นโค้งระฆังคว่ําที่สมมาตรเช่นเดียวกับ Z แต่มีความแปรปรวน มากกว่า 1 ดังน้ันค้างการแจกแจงแบบ t จึงมีฐานกว้างหรือมีลักษณะแบบมากกว่าการแจกแจงแบบ Z พารามเิ ตอรท์ ่ีเป็นตัวกําหนดโค้งการแจกแจงแบบ t คือ ระดับชั้นความเป็นอิสระ (Degree of Freedom: df) มีค่าเท่ากับ n-1 ดังน้ัน ลักษณะการแจกแจงแบบ t จึงขึ้นอยู่กับขนาดตัวอย่าง (n) โดยเมื่อขนาด ตัวอย่างใหญ่ขึ้น การแจกแจงแบบ t จะเขา้ ใกล้การแจกแจงแบบ Z (ภาพที่ 8.5 และ 8.6) การอา่ นผลจาก ตาราง t จงึ ต้องพิจารณาจากคา่ df ดว้ ย ภาพที่ 8.5 การแจกแจงแบบ t เปรียบเทียบกับการแจกแจงแบบ Z เมอ่ื n มากขึน้ ภาพท่ี 8.6 t-distribution ที่ degree of freedom แตกต่างกนั ตัวอย่างที่ 2 นักวิจัยต้องการประมาณช่วงเช่ือมั่นค่าเฉล่ียท่ีระดับช่วงเช่ือมั่น 95% ของ Systolic Blood Pressure ขอ้ มลู ประกอบด้วย 100 110 120 130 140 วธิ ีทํา ขน้ั ท่ี 1 หาตัวประมาณ (ค่าเฉลยี่ = 120) ขน้ั ท่ี 2 หา SE = s / n 15.81/ 5 ขั้นท่ี 3 กาํ หนดความผดิ พลาด 0.05 สามารถหาสัมประสิทธคิ์ วามเช่ือม่ัน จากตารางการแจกแจงแบบ t (ตาราง ส 5) จะได้ t / 2,51 t0.025,4 2.776 ~ 98 ~
ชวี สถติ ิสําหรบั สาธารณสขุ : หน่วยท่ี 8 การประมาณค่า (1-)100% ช่วงเช่อื มนั่ ได้แก่ x t ,df s 120 2.776 15.81 100.38, 139.63 n 5 2 ดังน้ัน ชว่ งเชื่อมน่ั ท่ี 95% ของคา่ เฉล่ีย Systolic Blood Pressure มคี ่าระหว่าง 100.38 ถงึ 139.63 mmHg ตอบ ----------------------------------------------------------------------------------------------------------------------- ~ 99 ~
ชวี สถติ สิ าํ หรับสาธารณสขุ : หนว่ ยที่ 8 การประมาณค่า เฉลยแบบฝึกหัด 1. ต้องการประมาณเวลาเฉล่ีย ( ) ท่ีเด็กไทยดูทีวีตอ่ สัปดาห์ จงึ สุม่ ตัวอยา่ งเด็กจากครอบครวั คน ไทยมา 121 คน ถามถึงระยะเวลาที่เด็กดูทีวีตอ่ สัปดาหแ์ ละคํานวณหาเวลาเฉล่ียได้ 32.6 ชั่วโมง และ เวลา เบี่ยงเบนมาตรฐานเท่ากับ 9.9 ช่ัวโมง จงประมาณเวลาเฉลี่ยท่ีเด็กไทยดูทีวีตอ่ สัปดาห์ที่ระดับ ความ เชอ่ื ม่ัน 95% วิธีทาํ ให้ เปน็ เวลาเฉลย่ี ที่เด็กไทยดูทวี ตี ่อสัปดาห์ เนื่องจากสุ่มตวั อยา่ งขนาด 121 ครอบครัว และไม่ทราบคา่ 2 จึงประมาณค่า 2 ด้วย S2 โดยที่ S = 9.9 ชว่ั โมง, x = 32.6 ชั่วโมง จะได้ ข้นั ท่ี 1 หาตวั ประมาณ (คา่ เฉลี่ย = 32.6) ข้นั ที่ 2 หา SE s / n 9.9 / 121 0.9 ขั้นท่ี 3 กําหนดความผิดพลาด 0.05 เม่ือไม่ทราบความแปรปรวนของประชากรสามารถหา สัมประสิทธคิ์ วามเชื่อม่นั จากตารางการแจกแจงแบบ t (ส 5) จะได้ t 2,n1 t0.05 / 2,41211 t0.025,120 1.98 s 32.6 (1.98)(0.9) n (1-)100% ชว่ งเช่อื มน่ั ไดแ้ ก่ x t 2,df = 32.6 1.78 ตอบ =30.82 ถึง 34.38 นน่ั คอื ดว้ ยชว่ งความเชือ่ มัน่ 95% เวลาเฉลี่ยทีค่ รอบครวั ไทยใช้ดูทีวีอยู่ในช่วง 30.82 – 34.38 ชั่วโมงตอ่ สัปดาห์ 2. หมู่บ้านแหง่ หนึ่งมี 768 ครัวเรือน ผู้วิจัยไดส้ ุ่มตัวอย่างมา 30 ครัวเรือน ถามรายจา่ ยค่าอาหารกลางวัน ไดเ้ ฉลี่ยครัวเรือนละ 155 บาท ส่วนเบี่ยงเบนมาตรฐาน 6 บาท จงประมาณรายจ่ายเฉล่ีย คา่ อาหาร กลางวันของครัวเรือนทง้ั หมดในหมบู่ ้านแห่งนี้ ทร่ี ะดับความเช่อื มน่ั 2.1) 90% 2.2) 95% 2.2 ทรี่ ะดับความเชื่อมน่ั 90% จะได้ α = 0.1 วิธีทาํ ให้ μ คอื ค่าอาหารกลางวันเฉล่ยี ของครวั เรือนในหม่บู ้านแห่งน้ี (บาท) จากโจทย์ กําหนดให้ n = 30, X = 155, s = 6 2.1 ทรี่ ะดบั ความเช่ือมั่น 90% จะได้ α = 0.10 ขนั้ ที่ 1 หาตัวประมาณ (คา่ เฉล่ีย = 155) ข้ันที่ 2 หา SE s / n 6 / 30 1.0954 ข้ันท่ี 3 กําหนดความผดิ พลาด 0.10 เมื่อไมท่ ราบความแปรปรวนของประชากรสามารถหา สัมประสทิ ธค์ิ วามเชื่อมัน่ จากตารางการแจกแจงแบบ t (ส 5) จะได้ t 2,n1 t0.1/ 2,301 t0.05,29 1.699 x t 2,df s 155 (1.699)(1.0954) n (1-)100% ช่วงเชื่อมั่นไดแ้ ก่ ~ 100 ~
ชีวสถติ สิ าํ หรับสาธารณสขุ : หนว่ ยท่ี 8 การประมาณค่า = 155 1.86 = 153.14 ถงึ 156.86 ดังนนั้ ทร่ี ะดับความเชอื่ มน่ั 90% คา่ อาหารกลางวนั ของครัวเรือนในหม่บู ้านนี้ ตอบ อยูร่ ะหวา่ ง 153.14 ถงึ 156.86 บาท 2.2 ท่รี ะดับความเชื่อมัน่ 95% จะได้ α = 0.05 ขั้นท่ี 1 หาตัวประมาณ (ค่าเฉลีย่ = 155) ขั้นท่ี 2 หา SE s / n 6 / 30 1.0954 ขนั้ ท่ี 3 กาํ หนดความผดิ พลาด 0.05 เมอ่ื ไมท่ ราบความแปรปรวนของประชากรสามารถหา สัมประสทิ ธ์ิความเชอื่ มนั่ จากตารางการแจกแจงแบบ t (ส 5) จะได้ t 2,n1 t0.05 2,301 t0.025,29 2.045 (1-)100% ช่วงเชือ่ มัน่ ไดแ้ ก่ x t 2,df s 155 (2.045)(1.0954) n = 155 2.24 = 152.76 ถึง 157.24 ดังนัน้ ทีร่ ะดบั ความเช่อื มน่ั 95% ค่าอาหารกลางวันของครวั เรอื นในหมบู่ า้ นน้ี ตอบ อย่รู ะหว่าง 152.76 ถึง 157.24 บาท 3. สุ่มตัวอย่าง จํานวน 25 คน จากผู้ป่วยที่มารับบริการใน 1 วัน เพ่ือสอบถามความพึงพอใจตอ่ การ บริการของเจ้าหน้าที่ พบวา่ มีคะแนนความพึงพอใจเฉล่ีย 22 คะแนน สว่ นเบ่ียงเบนมาตรฐาน เทา่ กับ 5 คะแนน จงประมาณคะแนนความพึงพอใจของผ้ปู ่วยทงั้ หมด ที่ระดบั ความเช่อื ม่ัน 95% วิธที ํา ให้ μ คือ คะแนนความพงึ พอใจเฉล่ยี ของผ้ปู ่วยทัง้ หมดท่มี ารับบริการใน 1 วัน (คะแนน) จากโจทย์ กาํ หนดให้ n = 25, X = 22, s = 5 ข้ันท่ี 1 หาตัวประมาณ (ค่าเฉลีย่ = 22) ขน้ั ท่ี 2 หา SE s / n 5 / 25 1 ขน้ั ท่ี 3 กําหนดความผิดพลาด 0.05 เมือ่ ไมท่ ราบความแปรปรวนของประชากรสามารถหา สัมประสิทธ์คิ วามเช่อื มนั่ จากตารางการแจกแจงแบบ t (ส 5) จะได้ t 2,n1 t0.05 2,251 t0.025,24 2.064 (1-)100% ชว่ งเชื่อมน่ั ไดแ้ ก่ x t 2,df s 22 (2.064)(1) n = 22 2.064 ตอบ = 19.94 ถงึ 24.06 ดงั นัน้ คะแนนความพงึ พอใจของผู้ป่วยทง้ั หมด ที่ระดับความเชื่อม่ัน 95% อย่รู ะหว่าง 19.94 ถงึ 24.06 คะแนน ~ 101 ~
ชวี สถิติสําหรับสาธารณสขุ : หน่วยที่ 8 การประมาณคา่ 4. สุ่มตัวอย่างมาจากประชากรผู้ป่วยโรคเบาหวานมาจํานวน 150 คน พบวา่ มีคา่ เฉลี่ยของนํ้าหนักตัว เทา่ กับ 60 กิโลกรมั ถ้านํา้ หนกั ตวั ของประชากรผู้ป่วยโรคเบาหวานมกี ารแจกแจงแบบปกติ โดยมีคา่ เท่ากับ 7 กิโลกรัม อยากทราบว่าคา่ เฉลี่ยน้ําหนักตัวของประชากรผูป้ ว่ ยเบาหวานมีคา่ เทา่ ไร ที่ระดับ ความเช่ือมนั่ 95% วธิ ีทํา ให้ μ คือ คา่ เฉล่ียน้ําหนกั ตัวของประชากรผ้ปู ่วยเบาหวาน (กโิ ลกรมั ) จากโจทย์ กําหนดให้ n = 150, X = 60 กโิ ลกรัม, = 7 กิโลกรมั ข้นั ที่ 1 หาตัวประมาณ (คา่ เฉลย่ี = 60) ขน้ั ที่ 2 หา SE / n 7 / 150 0.57 ข้นั ที่ 3 กําหนดความผดิ พลาด 0.05 เมื่อทราบความแปรปรวนของประชากรสามารถหาสัมประสิทธ์ิ ความเช่อื มั่น จากตารางการแจกแจงแบบ Z (ส 4) จะได้ Z / 2 Z 0.05 / 2 Z 0.025 1.96 x Z 2 60 (1.96)(0.57) n (1-)100% ช่วงเช่ือมน่ั ไดแ้ ก่ = 60 1.12 ตอบ = 58.88 ถึง 61.12 ดงั น้นั ค่าเฉลี่ยน้ําหนักตัวของประชากรผ้ปู ่วยเบาหวาน ที่ระดบั ความเชอ่ื ม่ัน 95% อยรู่ ะหว่าง 58.88 ถงึ 61.12 กโิ ลกรมั ~ 102 ~
ชวี สถิติสําหรับสาธารณสุข: หน่วยที่ 9 การทดสอบสมมติฐาน หน่วยท่ี 9 การทดสอบสมมตฐิ าน วตั ถุประสงค์: หลังจากจบการเรยี นในหัวข้อน้แี ล้วนิสิตสามารถ 1. เข้าใจแนวคิดของการทดสอบสมมติฐาน 2. ทราบขนั้ ตอนการทดสอบสมมตฐิ านทางสถิติ 3. สามารถทดสอบสมมติฐานของคา่ เฉล่ียประชากรหน่งึ กลุ่มได้ 4. สามารถอธบิ ายความสมั พนั ธร์ ะหวา่ งการทดสอบสมมติฐานและการประมาณชว่ งเชอื่ ม่นั ได้ เน้อื หา: การทดสอบสมมตฐิ าน 1. แนวคิดของการทดสอบสมมติฐาน 2. รายละเอียดของการทดสอบสมมตฐิ าน 3. ขนั้ ตอนการทดสอบสมมติฐานทางสถิติ 4. การทดสอบคา่ เฉลีย่ ประชากรเดยี ว 5. ความสัมพนั ธร์ ะหว่างการทดสอบสมมตฐิ านและการประมาณชว่ งเช่ือมนั่ รูปแบบการเรยี นการสอน: การเรียนรแู้ บบร่วมมอื 1. ผู้เรียนแต่ละคนศึกษาเน้ือหาตามหัวข้อบรรยายจากเอกสารประกอบการสอนและสรุปเป็น แผนผังความคดิ (Mind map) กอ่ นเขา้ ช้นั เรียน 2. แบ่งกลุ่มการเรียน เช็คช่ือสมาชิกภายในกลุ่ม และอภิปรายเนื้อหาตามท่ีได้รับมอบหมาย ภายในกลมุ่ และภายในชัน้ เรียน 3. สรุปเน้ือหาโดยอาจารยผ์ สู้ อน 4. ผู้เรียนแต่ละกลุ่มคิดโจทย์แบบฝึกหัดพร้อมเฉลยหลังจากจบบทเรียน และส่งภายในสัปดาห์ ถดั ไป ~ 103 ~
ชีวสถติ สิ ําหรบั สาธารณสขุ : หน่วยท่ี 9 การทดสอบสมมติฐาน ลักษณะคําถามวิจัยบางอย่าง จําเป็นต้องใช้การทดสอบสมมติฐาน (Hypothesis testing) เพื่อ อนมุ านผลการศึกษาจากตัวอยา่ งไปยังประชากร ตวั อยา่ งเช่น 1) นิสิตคณะสาธารณสุขศาสตร์มีค่าเฉลี่ยดัชนีมวลกาย (BMI) เกินเกณฑ์หรือไม่ (น้ําหนักเกินคือ BMI > 23 kg/m2) 2) นสิ ิตคณะสาธารณสุขศาสตร์ชน้ั ปที ี่ 4 และช้นั ปีที่ 1 มคี ่าเฉลย่ี ดชั นีมวลกายต่างกันหรอื ไม่ 3) ปจั จยั อะไรบา้ งท่มี ีผลต่อการเพม่ิ ดชั นมี วลกายของนิสติ คณะสาธารณสุขศาสตร์ชั้นปที ่ี 4 1. แนวคดิ ของการทดสอบสมมติฐาน สมมติฐาน คือ ข้อความท่ีคาดคะเนคําตอบเกี่ยวกับประชากร โดยการคาดคะเนจะอาศัย หลักการ ทฤษฏีท่ีเกี่ยวข้อง หรือประสบการณ์ที่เก่ียวกับประชากรนั้นๆ สมมติฐานจําแนกเป็น 2 ประเภท ได้แก่ สมมติฐานการวิจัย (Research Hypothesis) และสมมติฐานทางสถิติ (Statistical Hypothesis) ในที่น้ีการทดสอบสมมติฐานจะหมายถึง การทดสอบสมมติฐานทางสถิติ ซึ่งเป็นการนํา สมมตฐิ านการวจิ ยั มากําหนดเปน็ สมมตฐิ านทางสถิติ 2. รายละเอียดของการทดสอบสมมติฐาน 2.1 สมมติฐานทางสถติ ิ ประกอบด้วย 1) สมมตฐิ านวา่ ง (Null Hypothesis; H0) เปน็ สมมติฐานทต่ี ้งั ขึน้ สาํ หรับการทดสอบ โดย กําหนดในรูปของความไม่แตกต่าง หรือความเท่ากัน (=) ใช้สัญลักษณ์ H0 บางครั้งอาจเรียกว่า สมมตฐิ านหลกั สมมตฐิ านความไม่แตกต่าง หรือสมมติฐาน H0 2) สมมติฐานทางเลือก (Alternative Hypothesis; HA or H1) เป็นสมมติฐานที่ตั้งข้ึน เพ่ือเป็นทางเลือกสําหรับการปฏิเสธสมมติฐานว่าง โดยกําหนดในรูปแบบของความแตกต่าง หรือความ ไมเ่ ท่ากนั (, >, <) ใช้สัญลกั ษณ์ HA หรือ H1 ซ่งึ ในทีน่ ี้จะใช้ HA แทนสมมติฐานทางเลือก บางครัง้ อาจ เรียกว่า สมมตฐิ านรอง สมมตฐิ านความแตกตา่ ง หรอื สมมตฐิ าน HA กาํ หนดได้ 2 ลกั ษณะ คือ 2.1) สมมติฐานแบบสองทาง (Two tail hypothesis) เป็นการกําหนดสมมติฐาน ทางเลือกแบบไม่มีทิศทาง คือ ไม่เท่ากับ () จะใช้การต้ังสมมติฐานลักษณะนี้กรณีท่ี คําถามงานวิจัย ต้องการทราบวา่ ค่าพารามิเตอรท์ ่ีต้องการทดสอบมคี วามแตกต่างกันหรือไม่ โดยไม่ได้กําหนดทิศทางใน ลักษณะมากกว่าหรือน้อยกว่า เช่น คะแนนสอบวิชาชีวสถิติประยุกต์ในงานสาธารณสุขระหว่างนิสิต ชายและนิสิตหญิงแตกตา่ งกนั หรอื ไม่ ความเครยี ดมผี ลต่อน้ําหนักหรือไม่ เปน็ ตน้ 2.2) สมมติฐานแบบทางเดียว (One tail hypothesis) เป็นการกําหนดสมมติฐาน ทางเลือกแบบมีทิศทาง คือ มากกว่า (>) หรือ น้อยกว่า (<) จะใช้การตั้งสมมติฐานลักษณะนี้กรณีท่ี คําถามงานวิจัยต้องการทราบว่าค่าพารามิเตอร์ที่ต้องการทดสอบมีค่ามากกว่าหรือน้อยกว่ากัน เช่น คะแนนสอบวิชาชีวสถิติประยุกต์ในงานสาธารณสุขของนิสิตช้ันปีที่ 4 มากกว่า ช้ันปีท่ี 3 หรือไม่ โปรแกรมการออกกําลงั กายทาํ ให้นาํ้ หนกั ของนิสิตลดลงหรือไม่ เป็นตน้ สรุปการทดสอบสมมติฐานทางสถติ ิ ดังภาพที่ 9.1 ~ 104 ~
ชีวสถติ ิสาํ หรับสาธารณสุข: หนว่ ยที่ 9 การทดสอบสมมติฐาน ภาพที่ 9.1 สมมติฐานทางสถิติ ตวั อยา่ งการต้งั สมมติฐานทางสถิติ ตัวอย่างที่ 1 สมมติฐานการวจิ ัย: นิสติ คณะสาธารณสุขศาสตรม์ คี ่าเฉล่ยี ดชั นมี วลกาย (BMI) เกนิ เกณฑ์ มาตรฐาน (นํา้ หนักเกินคอื BMI > 23 km/m2) สมมตฐิ านทางสถติ ิ: H0: คา่ เฉล่ียดชั นมี วลกายของนสิ ิตคณะสาธารณสขุ ศาสตรเ์ ท่ากบั 23 kg/m2 ( = 23 kg/m2) HA: ค่าเฉลยี่ ดัชนมี วลกายของนสิ ติ คณะสาธารณสขุ ศาสตรม์ ากกว่า 23 kg/m2 ( > 23 kg/m2) ------------------------------------------------------------------------------------------------------------------------- ตวั อย่างท่ี 2 สมมติฐานการวิจัย: นิสิตคณะสาธารณสุขศาสตร์ช้ันปีที่ 4 และชั้นปีที่ 1 มีค่าเฉล่ียดัชนี มวลกายแตกต่างกนั สมมติฐานทางสถติ :ิ H0: ค่าเฉลี่ยดัชนีมวลกายของนิสิตคณะสาธารณสุขศาสตร์ช้ันปีที่ 4 และช้ันปีท่ี 1 ไม่ แตกตา่ งกนั (4 = 1 หรือ 4 - 1 = 0) HA: ค่าเฉล่ียดัชนีมวลกายของนิสิตคณะสาธารณสุขศาสตร์ชั้นปีท่ี 4 และช้ันปีที่ 1 แตกต่างกัน (4 1 หรือ 4 - 1 0) ------------------------------------------------------------------------------------------------------------------------- ตัวอย่างท่ี 3 สมมติฐานการวิจัย: ค่าเฉลี่ยคะแนนวิชาชีวสถิติประยุกต์ในงานสาธารณสุขของนิสิตน้อย กวา่ 50 คะแนน สมมติฐานทางสถิติ: H0: = 50 คะแนน HA: < 50 คะแนน เม่ือ = คา่ เฉล่ยี คะแนนวิชาชีวสถติ ปิ ระยุกต์ในงานสาธารณสุขของนสิ ติ ------------------------------------------------------------------------------------------------------------------------- ตัวอย่างท่ี 4 สมมติฐานการวิจัย: ค่าเฉลี่ยคะแนนวิชาชีวสถิติประยุกต์ในงานสาธารณสุขของนิสิตชั้นปี ท่ี 4 มากกวา่ นิสิตชั้นปีท่ี 3 สมมติฐานทางสถิติ: H0: 4 = 3 HA: 4 > 3 ~ 105 ~
ชวี สถิตสิ ําหรบั สาธารณสขุ : หนว่ ยที่ 9 การทดสอบสมมติฐาน เมื่อ 4 = คา่ เฉล่ยี คะแนนวิชาชวี สถิติประยกุ ตใ์ นงานสาธารณสขุ ของนิสติ ชนั้ ปที ่ี 4 3 = ค่าเฉลีย่ คะแนนวชิ าชีวสถติ ปิ ระยุกต์ในงานสาธารณสขุ ของนิสติ ช้ันปที ่ี 3 ------------------------------------------------------------------------------------------------------------------------- 2.2 การประเมนิ หลักฐานข้อมูลจากตวั อย่าง ข้อมูลท่ีได้จากการศึกษาในตัวอย่างจะนํามาใช้เป็นหลักฐานในการหักล้างสมมติฐาน H0 ในการทดสอบสมมติฐานทางสถิติ โดยหลักฐานท่ีนํามาใช้หักล้างนี้วัดออกมาเป็นค่าความน่าจะเป็น เรียกว่า p-value ดังนั้น ค่า p-value จึงหมายถึง ค่าความน่าจะเป็นของหลักฐานข้อมูลจากตัวอย่าง นํามาใช้หักล้างสมมติฐาน H0 โดยในท่ีน้ีหาได้จากการเปิดตารางสถิติหลังการคํานวณค่าสถิติทดสอบ ดงั นี้ คา่ สถติ ทิ ดสอบ= คา่ สถติ ิ-คา่ พารามิเตอร์ ........................................................................................(1) ความคลาดเคลื่อนของค่าสถติ ิ เช่น นําค่าสถิติทดสอบ Z ไปเปิดตารางสถิติ จะได้ค่าความน่าจะเป็น ซึ่งก็คือค่า p- value ในการทดสอบสมมติฐาน บางคร้ังการเปิดตารางสถิติอาจได้เป็นค่าประมาณ (เช่น p-value < 0.025) แต่ถ้าใช้โปรแกรมทางสถิติวิเคราะห์ด้วยเครื่องคอมพิวเตอร์ จะได้ค่า p-value ที่แท้จริง (เช่น p-value = 0.002) การประเมนิ หลกั ฐานจากตัวอย่างด้วยคา่ p-value มคี วามเปน็ ไปได้ 2 กรณี คือ กรณี ที่ 1 p-value มีค่าตํ่า อธิบายดังสูตรท่ี (1) เน่ืองจาก ค่าสถิติต่างจาก ค่าพารามิเตอร์มาก ทําให้ค่าสถิติทดสอบมีค่าสูง เม่ือเปิดตารางสถิติจะได้ค่า p-value มีค่าต่ํา ซึ่งกรณี น้ีจะเรียกว่า Strong evidence คือหลักฐานข้อมูลจากตัวอย่างมีนํ้าหนักมากเพียงพอหรือมีความ ชดั เจน ที่จะปฏเิ สธสมมตฐิ าน H0 (สมมตฐิ าน H0 มีความเปน็ ไปได้ตํา่ ) สรปุ ดังภาพท่ี 9.2 กรณี ท่ี 2 p-value มีค่าสูง อธิบายดังสูตรที่ (1) เนื่องจาก ค่าสถิติต่างจาก ค่าพารามิเตอร์น้อย ทําให้ค่าสถิติทดสอบมีค่าตํ่า เม่ือเปิดตารางสถิติจะได้ค่า p-value มีค่าสูง ซึ่งกรณี น้ีจะเรียกว่า Weak evidence คือหลักฐานข้อมูลจากตัวอย่างมีนํ้าหนักน้อยไม่เพียงพอหรือไม่มีความ ชัดเจน ทีจ่ ะปฏเิ สธสมมติฐาน H0 (ข้อมลู จากตวั อยา่ งไม่เพียงพอทจ่ี ะหักล้างสมมติฐาน H0) สรปุ ดังภาพ ที่ 9.2 คา่ สถิติต่างจาก คา่ สถิติ p-value Strong หลักฐานข้อมลู จาก ค่าพารามิเตอร์ ทดสอบมีคา่ มีคา่ ต่ํา evidence ตวั อยา่ งเพยี งพอทจ่ี ะ ปฏิเสธสมมตฐิ าน H0 มาก สงู คา่ สถติ ิต่างจาก คา่ สถติ ิ p-value Weak หลกั ฐานขอ้ มลู จาก คา่ พารามเิ ตอร์ ทดสอบมีค่า มีค่าสงู evidence ตัวอยา่ งไมเ่ พยี งพอที่จะ ปฏิเสธสมมตฐิ าน H0 น้อย ตํ่า ภาพท่ี 9.2 การประเมินหลกั ฐานขอ้ มูลจากตวั อย่างในการทดสอบสมมตฐิ าน ~ 106 ~
ชีวสถติ ิสาํ หรบั สาธารณสขุ : หน่วยท่ี 9 การทดสอบสมมติฐาน 2.3 เกณฑ์ในการทดสอบสมมตฐิ าน การทดสอบสมมติฐานทางสถิติ จะต้องมีการตัดสินใจปฏิเสธหรือยอมรับสมมติฐาน H0 ภายใต้ข้อมูลจากตัวอย่างท่ีศึกษา ดังน้ันจําเป็นต้องมีการกําหนดเกณฑ์ในการตัดสินใจไว้ล่วงหน้า เพ่ือ นํามาใช้เปรียบเทยี บกับหลักฐานข้อมูลจากตวั อย่าง คือ คา่ p-value เกณฑ์ในการทดสอบสมมติฐานนี้ เรียกว่า ระดับนัยสําคัญ (Level of significance) ซึ่ง เขียนในรูปสัญลักษณ์คือ (Alpha) ซึ่งก็คือ ความน่าจะเป็นสูงสุดของความผิดพลาดในการสรุป ผิดพลาดบนพื้นฐานของข้อมูลที่มีอยู่ โดยสรุปว่า สมมุติฐาน H0 ไม่ถูกต้อง (ปฏิเสธ H0 เมื่อ H0 เป็น จริง) โดยทวั่ ไปกําหนด เท่ากับ 0.01, 0.05, 0.1 ซ่งึ ทางดา้ นสาธารณสขุ ส่วนใหญก่ ําหนด = 0.05 2.4 การตัดสินใจและการสรุปผลการทดสอบ การตัดสินใจในการทดสอบสมมติฐานมี 2 แบบ คือ ปฏิเสธสมมติฐาน H0 (Reject H0) และไม่ปฏิเสธ H0 (Not reject H0) หรือเรียกได้ว่ายอมรับ H0 โดยการใช้ค่าความน่าจะเป็นของ หลักฐานข้อมูลจากตัวอย่าง (p-value) มาเทียบกับเกณฑ์ในการทดสอบสมมติฐาน () โดยคํานึงถึง ลกั ษณะของสมมตฐิ าน HA ด้วย ดังน้นั การตัดสินใจจึงเป็นไปได้ 2 กรณีดงั น้ี (ภาพที่ 9.3) กรณีที่ 1 ปฏิเสธสมมติฐาน H0 เมื่อ p-value (กรณีทดสอบทางเดียว) หรือ p- value /2 (กรณีทดสอบสองทาง) ซง่ึ เรียกวา่ มีนัยสาํ คญั ทางสถติ ิ (Statistical significance) กรณีท่ี 2 ไม่ปฏิเสธสมมติฐาน H0 เมื่อ p-value > (กรณีทดสอบทางเดียว) หรือ p- value > /2 (กรณี ทดสอบสองทาง) ซ่ึงเรียกว่า ไม่มีนัยสําคัญ ทางสถิติ (Non-statistical significance) เขตปฏิเสธ H0 เขตยอมรบั H0 เขตปฏเิ สธ H0 /2 1- /2 เขตยอมรับ H0 เขตปฏิเสธ H0 1- เขตปฏเิ สธ H0 เขตยอมรบั H0 1- ภาพที่ 9.3 เขตปฏเิ สธสมมตฐิ าน H0 ~ 107 ~
ชวี สถติ ิสําหรับสาธารณสขุ : หนว่ ยท่ี 9 การทดสอบสมมตฐิ าน 2.5 ความผดิ พลาดของการตดั สนิ ใจ เนือ่ งจากสมมติฐาน H0 ที่ต้องการทดสอบ ใช้การเก็บรวบรวมหลกั ฐานข้อมูลจากตวั อย่าง เพ่ือมาตัดสินใจอนุมานไปยังประชากร ดังน้ันจึงยังไม่สามารถบอกได้ว่าข้อสรุปท่ีได้เป็นจริงหรือเท็จ จนกว่าจะทําการพิสูจน์โดยเก็บรวบรวมข้อมูลทั้งหมด มาวิเคราะห์ตามลักษณะของประชากรที่ตอ้ งการ พสิ ูจน์ ซึ่งเป็นสิ่งที่ทําไดย้ ากเพราะตอ้ งเสยี ค่าใชจ้ ่ายและเวลามาก จึงทําได้เพียงการสํารวจจากตวั อย่าง เพ่อื ทาํ การทดสอบ ดังน้ันผลการทดสอบไม่ว่าจะยอมรบั หรือปฏิเสธสมมติฐานย่อมมีความผิดพลาดเกิดขึ้นได้ 2 กรณี (ตารางท่ี 9.1) คอื 1) ความผิดพลาดประเภทที่ 1 (Type I Error) เปน็ ความผดิ พลาดเน่ืองจากการปฏิเสธ H0 (หรือ ไม่ยอมรับ H0) เม่ือ H0 เป็นจริง และมักจะเรียกความผิดพลาดชนิดนี้ว่า “ระดับนัยสําคัญ” (Level of significance) และใชส้ ญั ลกั ษณ์ โดยที่ = P(ปฏิเสธ H0 โดยที่ H0 เป็นจรงิ ) 2) ความผิดพลาดประเภทท่ี 2 (Type II Error) เป็นความผิดพลาดเน่ืองจากการไม่ ปฏิเสธ H0 (ยอมรับ H0) เมื่อ H0 ไม่เป็นจริง และใช้สัญลักษณ์ แทนความผิดพลาดประเภทน้ี โดยที่ = P(ยอมรับ H0 โดยที่ H0 ไม่เป็นจรงิ ) ตารางที่ 9.1 ความผิดพลาดของการตัดสินใจในการทดสอบสมมติฐาน การตดั สนิ ใจ สถานการณ์จริง ยอมรับ H0 ปฏเิ สธ H0 H0 ถกู ต้อง H0 ผิด (HA ถูกตอ้ ง) ตดั สินใจถกู ต้อง Type II Error (1 - ) Type I Error ตดั สินใจถูกตอ้ ง (1 - ) ในการทดสอบสมมุติฐานแต่ละครั้ง ผู้ทดสอบย่อมต้องการที่จะให้มีความผิดพลาด ท้ัง 2 ประเภท ( และ ) น้อยที่สุด แต่ถ้าลด จะทาํ ให้ เพ่ิมขนึ้ ในทํานองเดียวกันถ้าลด จะ ทาํ ให้ เพมิ่ ขึ้น ดังน้นั ทางเดียวของการลดค่าทั้ง และ คอื จะตอ้ งเพ่ิมขนาดกลุ่มตัวอยา่ ง (ภาพท่ี 9.4) ภาพที่ 9.4 ความสมั พนั ธร์ ะหว่างคา่ และ ~ 108 ~
ชีวสถติ ิสําหรบั สาธารณสุข: หนว่ ยที่ 9 การทดสอบสมมตฐิ าน 3. ขน้ั ตอนการทดสอบสมมติฐานทางสถิติ การทดสอบสมมติฐานทางสถติ มิ ีขัน้ ตอน ดังน้ี ขัน้ ที่ 1: ตงั้ สมมตฐิ าน ขน้ั ที่ 2: กาํ หนดระดับนัยสาํ คัญ () ขั้นท่ี 3: คํานวณคา่ สถิตทิ ดสอบและหาคา่ p-value ข้ันที่ 4: เปรยี บเทียบคา่ p-value กบั ระดบั นยั สําคญั (โดยคํานงึ ถึงสมมตฐิ าน HA) ขัน้ ที่ 5: ตัดสินใจและสรปุ ผล 4. การทดสอบค่าเฉลย่ี ประชากรเดยี ว กรณีการทดสอบค่าเฉลี่ยประชากรเดียวโดยเปรียบเทียบกับค่ามาตรฐาน เช่น ต้องการทดสอบว่า นิสิตท่ีลงทะเบียนวิชาชีวสถิติประยุกต์ในงานสาธารณสุขมีค่าเฉล่ียคะแนนสอบย่อยคร้ังที่ 1 ผ่านเกณฑ์ หรือไม่ (> 30 คะแนน) ในประชากรท่ีมีการแจกแจงแบบปกติและไม่ทราบค่าความแปรปรวนของ ประชากร จะใช้สถิตทิ ดสอบ t กรณปี ระชากรเดียว (One sample t-test) ดังน้ี ������ ̅ , df = n-1 ……………………………………………………………………………(2) ⁄√ ตวั อย่างท่ี 5 จากการสุ่มนิสิตท่ีเรียนวิชาชีวสถิติฯ จํานวน 36 คน พบว่ามีค่าเฉลี่ยคะแนนสอบยอ่ ยคร้ัง ที่ 1 เท่ากับ 35.5 คะแนน ส่วนเบี่ยงเบนมาตรฐาน เท่ากับ 10.5 คะแนน อาจารย์ต้องการทราบว่า ประชากรนิสิตที่เรียนวิชาชีวสถิติฯ จะมีค่าเฉล่ียคะแนนสอบผ่านเกณฑ์หรือไม่ (เม่ือเกณฑ์คือ มากกว่า 30 คะแนน) โดยท่ีคะแนนสอบของนิสิตมีการแจกแจงปกติ โดยอาจารย์ต้องการสรุปผลที่ระดับ นัยสาํ คัญ 0.05 วิธที ํา สมมตฐิ านการวิจยั : นิสิตท่ีเรียนวชิ าชวี สถิติฯ มีค่าเฉล่ียคะแนนสอบมากกวา่ 30 คะแนน ขนั้ ท่ี 1: ตง้ั สมมติฐาน H0: = 30 คะแนน HA: > 30 คะแนน ขั้นที่ 2: กาํ หนดระดบั นยั สาํ คญั = 0.05 ขัน้ ท่ี 3: คาํ นวณคา่ สถติ ทิ ใ่ี ช้ในการทดสอบและหาค่า p-value จาก t X , df n 1 n s/ จะได้ t 35.5 30 3.14 ที่ df 35 10.5 / 36 นําค่า t = 3.14, df = 35 เปิดตารางการแจกแจงแบบ t (ตาราง ส 5) ได้ค่า p-value < 0.005 ~ 109 ~
ชวี สถติ สิ าํ หรบั สาธารณสุข: หน่วยที่ 9 การทดสอบสมมติฐาน ขน้ั ท่ี 4: เปรียบเทียบค่า p-value กบั ระดับนัยสําคัญ เน่ืองจากสมมติฐาน HA เป็นแบบทางเดียว เพราะฉะน้ันความน่าจะเป็นสูงสุดของการ ปฏิเสธ H0 มีค่าได้ไม่เกิน = 0.05 ดังน้ัน จะได้ว่าค่า p-value < 0.005 มีค่าน้อยกว่าเกณฑ์ที่กําหนด ไว้ (0.05) ข้ันที่ 5: ตดั สนิ ใจและสรุปผล ปฏิเสธสมมติฐาน H0 ท่ีระดับนัยสําคัญ 0.05 ดังน้ัน จึงสรุปได้ว่าประชากรนิสิตที่เรียน วิชาชีวสถิติฯ มีค่าเฉล่ียคะแนนสอบผ่านเกณฑ์ (> 30 คะแนน) อย่างมีนัยสําคัญทางสถิติ (p-value < 0.005) ------------------------------------------------------------------------------------------------------------------------ 5. ความสมั พันธ์ระหว่างการทดสอบสมมตฐิ านและการประมาณชว่ งเช่อื มน่ั การทดสอบสมมติฐานและการประมาณช่วงเช่ือมั่นของค่าพารามิเตอร์เดียวกันมีความสัมพันธ์กัน เน่ืองจากการอนุมานค่าพารามิเตอร์ทั้ง 2 วิธี ดังกล่าว กระทําอยู่บนการแจกแจงของทฤษฎีเดียวกัน โดยลกั ษณะความสัมพันธ์อธบิ ายได้เป็น 2 กรณี ดังนี้ กรณที ่ี 1 ผลการทดสอบสมมตฐิ านปฏเิ สธสมมตฐิ าน H0 จะได้คา่ ชว่ งเชอ่ื มั่นไมค่ ลุมคา่ ท่ี กําหนดใน H0 กรณีท่ี 2 ผลการทดสอบสมมตฐิ านยอมรับสมมตฐิ าน H0 จะได้คา่ ชว่ งเช่ือมน่ั คลุมค่าทีก่ าํ หนด ใน H0 ตัวอย่างท่ี 6 จาก ตัวอย่างท่ี 5 จะได้ว่าช่วงเช่ือมั่นที่ 95% ของค่าเฉล่ียคะแนนสอบย่อยคร้ังท่ี 1 ของ ประชากรนิสติ ที่เรยี นชวี สถิติประยกุ ตใ์ นงานสาธารณสขุ อยูร่ ะหวา่ ง X t0.025,35 s n 35.5 2.03 10.5 36 35.5 3.55 31.95 39.05 31.95 39.05 ซง่ึ ผลการทดสอบสมมตฐิ านในตัวอยา่ งที่ 5 ใหผ้ ลปฏเิ สธสมมติฐาน H0 ทร่ี ะดับนัยสําคญั 0.05 ดังนน้ั ผลการคํานวณชว่ งเชื่อมัน่ ให้ผลสมั พันธก์ ับการทดสอบสมมตฐิ าน -------------------------------------------------------------------------------------------------------------------- ~ 110 ~
ชีวสถิตสิ ําหรับสาธารณสขุ : หนว่ ยที่ 9 การทดสอบสมมติฐาน เฉลยแบบฝกึ หัด 1. จงเขียนสมมตฐิ านการวิจยั ต่อไปนใี้ ห้อยใู่ นรูปสมมตฐิ านทางสถติ ิทั้งในรูปขอ้ ความและสัญลกั ษณ์ 1.1 สุ่มตรวจนํ้าจากแหล่งน้ําแห่งหนึ่งต้องการทราบว่าน้ําจากแหล่งน้ีจะมีแบคทีเรียเกินเกณฑ์ กําหนดหรอื ไม่ เมอ่ื นํ้าสะอาดควรมีแบคทีเรยี ไม่เกิน 70 หน่วย/ลบ.ซม. H0: นํ้าจากแหล่งน้จี ะมคี ่าเฉลย่ี แบคทีเรียเท่ากับ 70 หน่วย/ลบ.ซม. ( = 70 หนว่ ย/ลบ.ซม.) HA: นาํ้ จากแหล่งนี้จะมีคา่ เฉลยี่ แบคทเี รียมากกวา่ 70 หน่วย/ลบ.ซม. ( > 70 หนว่ ย/ลบ.ซม.) 1.2 สุ่มตัวอย่างมาจากประชากรกลุ่มหน่ึงเพื่อตรวจสุขภาพ อยากทราบว่าประชากรกลุ่มนี้จะมี สุขภาพสมบูรณ์หรือไม่ (ผ้ทู ีม่ ีสขุ ภาพสมบูรณ์ จะมีคา่ เฉลย่ี total blood protein = 7.25 g/dL) H0: ค่าเฉลยี่ total blood protein เทา่ กับ 7.25 g/dL ( = 7.25 g/dL) HA: ค่าเฉลี่ย total blood protein เทา่ กับ 7.25 g/dL ( 7.25 g/dL) 1.3 ต้องการศึกษาว่าการให้สุขศึกษาด้วยวิธีเข้าร่วมกิจกรรมจะดีกว่าวิธีบรรยายหรือไม่ โดยวัด ความรู้ของตวั อย่าง 2 กลุ่มซ่งึ ได้รบั วธิ ีการใหส้ ขุ ศึกษาท่ีต่างกัน H0: ค่าเฉลี่ยคะแนนความรู้การให้สุขศึกษาด้วยวิธีเข้าร่วมกิจกรรม ไม่แตกต่างจากการให้สุขศึกษา ดว้ ยวธิ บี รรยาย (1 = 2) HA: ค่าเฉลี่ยคะแนนความรู้การให้สุขศึกษาด้วยวิธีเข้าร่วมกิจกรรม ดีกว่า การให้สุขศึกษาด้วยวิธี บรรยาย (1 > 2) 1.4 ต้องการทราบวา่ นาํ้ หนกั เฉลี่ยของทารกแรกเกดิ ทค่ี ลอดก่อนกําหนดน้อยกวา่ 2,500 กรมั หรือไม่ H0: คา่ เฉลย่ี นํ้าหนักทารกแรกเกดิ ที่คลอดกอ่ นกาํ หนดเทา่ กบั 2,500 กรมั ( = 2,500 g) HA: ค่าเฉล่ยี นํา้ หนักทารกแรกเกิดท่คี ลอดกอ่ นกาํ หนดน้อยกวา่ 2,500 กรัม ( < 2,500 g) 1.5 ต้องการศกึ ษาวา่ ความดันโลหิตของผู้ท่ีสูบบหุ รก่ี บั ผูท้ ีไ่ ม่สูบบุหร่ีแตกต่างกันหรอื ไม่ H0: ค่าเฉลีย่ ความดนั โลหติ ของผู้ที่สูบบหุ ร่ไี ม่แตกตา่ งจากผทู้ ไ่ี มส่ บู บุหรี่ (1 = 2) HA: ค่าเฉลยี่ ความดันโลหติ ของผู้ทีส่ ูบบหุ รีแ่ ตกต่างจากผูท้ ไ่ี ม่สบู บหุ ร่ี (1 2) 2. จากการศึกษานิสิตคณะสาธารณสุขศาสตร์ จํานวน 49 คน พบว่ามีค่าเฉลี่ยดัชนีมวลกาย เท่ากับ 24.25 kg/m2 ส่วนเบ่ียงเบนมาตรฐาน เท่ากับ 8.85 kg/m2 ต้องการทราบว่าประชากรนิสิตคณะ สาธารณสุขศาสตร์จะมีน้ําหนักเกินเกณฑ์มาตรฐานหรือไม่ เม่ือค่าดัชนีมวลกายระดับปกติของคนไทย ไม่เกิน 23 kg/m2 และดัชนีมวลกายของนิสิตคณะสาธารณสุขศาสตร์มีการแจกแจงปกติ โดยต้องการ สรุปผลท่ีระดับนัยสําคัญ 0.05 พร้อมทั้งประมาณค่าชว่ งเชื่อม่ันของค่าเฉล่ียดัชนีมวลกายของนิสิตคณะ สาธารณสุขศาสตร์ วธิ ที าํ การทดสอบสมมติฐาน ข้นั ท่ี 1: ต้ังสมมติฐาน ~ 111 ~
ชีวสถิติสาํ หรับสาธารณสขุ : หนว่ ยที่ 9 การทดสอบสมมตฐิ าน H0: คา่ เฉลีย่ ดชั นมี วลกายนิสิตคณะสาธารณสขุ ศาสตร์ เทา่ กับ 23 kg/m2 ( = 23 kg/m2) HA: ค่าเฉลี่ยดัชนีมวลกายนสิ ติ คณะสาธารณสขุ ศาสตร์ มากกว่า 23 kg/m2 ( > 23 kg/m2) ขนั้ ที่ 2: กาํ หนดระดบั นยั สําคัญ = 0.05 ขนั้ ที่ 3: คํานวณค่าสถติ ิทใ่ี ช้ในการทดสอบและหาคา่ p-value ต้องการทดสอบค่าเฉล่ยี ประชากรเดียว เม่ือไม่ทราบคา่ ความแปรปรวนของประชากร (2) ดงั นนั้ จงึ ใชก้ ารแจกแจง t คอื สถิติ independent t-test ดังนี้ t X , df n 1 n s/ t 24.25 23 1.25 ที่ df 49 1 48 8.85 / 49 1.29 t = 0.992 df = 48 เปิดตารางการแจกแจงแบบ t (ส5) ได้ค่า p-value > 0.1 ขั้นที่ 4: เปรยี บเทียบคา่ p-value กบั ระดับนัยสําคัญ เนอื่ งจากสมมติฐาน HA เปน็ แบบทางเดียว เพราะฉะนน้ั ความน่าจะเปน็ สูงสุดของการ ปฏิเสธ H0 มคี า่ ไดไ้ ม่เกนิ = 0.05 ดงั น้ัน จะไดว้ า่ ค่า p-value (> 0.1) มคี า่ มากกวา่ เกณฑท์ ี่กําหนดไว้ ( = 0.05) ขน้ั ที่ 5: ตดั สนิ ใจและสรปุ ผล ยอมรับสมมตฐิ าน H0 ท่ีระดบั นัยสําคญั 0.05 ดงั น้นั จึงสรุปไดว้ ่าประชากรนสิ ิตคณะ สาธารณสขุ ศาสตร์มนี ้าํ หนักเกนิ เกณฑ์มาตรฐานอยา่ งไม่มีนยั สําคญั ทางสถิติ (p-value > 0.1) การประมาณคา่ จากโจทย์ กําหนดให้ n = 49, X = 24.25 kg/m2, = 8.85 kg/m2 ขนั้ ที่ 1 หาตัวประมาณ (คา่ เฉล่ีย = 24.25) ขั้นท่ี 2 หา SE s / n 8.85 / 49 1.26 ข้นั ท่ี 3 กาํ หนดความผิดพลาด 0.05 เมื่อไม่ทราบความแปรปรวนของประชากรสามารถหา สัมประสทิ ธ์ิความเชอ่ื มนั่ จากตารางการแจกแจงแบบ t (ส 5) จะได้ t 2,n1 t0.05 2,491 t0.025,48 2.01 (1-)100% ช่วงเชอื่ มน่ั ไดแ้ ก่ x t 2,df s 24.25 (2.01)(1.26) n 24.25 2.53 21.72 26.78 ดงั น้ัน ทร่ี ะดบั ความเช่ือมัน่ 95% คา่ เฉลย่ี ดัชนมี วลกายของนิสติ คณะสาธารณสุขศาสตร์ ตอบ อยรู่ ะหวา่ ง 21.72 ถึง 26.78 kg/m2 ~ 112 ~
ชวี สถติ สิ าํ หรบั สาธารณสขุ : หนว่ ยท่ี 10 การเปรยี บเทยี บคา่ เฉลี่ยประชากรสองกล่มุ หน่วยท่ี 10 การเปรยี บเทียบคา่ เฉล่ีย ประชากรสองกลุ่ม วัตถปุ ระสงค:์ หลังจากจบการเรยี นในหวั ข้อนีแ้ ล้วนิสิตสามารถ 1. แยกความแตกต่างระหวา่ งประชากรสองกลุ่ม ที่เปน็ อสิ ระและไมเ่ ปน็ อสิ ระตอ่ กนั ได้ 2. ประมาณคา่ ความแตกต่างของคา่ เฉลย่ี ประชากรสองกลุม่ ทเ่ี ป็นอิสระและไม่เปน็ อิสระตอ่ กนั ได้ 3. ทดสอบสมมติฐานความแตกต่างของค่าเฉลี่ยประชากรสองกลุ่มท่ีเป็นอิสระและไม่เป็นอิสระต่อ กันได้ 4. ทดสอบสมมติฐานความเท่ากันของความแปรปรวนระหวา่ งประชากรสองกลมุ่ ได้ เนื้อหา: การเปรียบเทยี บค่าเฉลีย่ ประชากรสองกลุ่ม 1. การทดสอบความเทา่ กันของความแปรปรวน • ลกั ษณะการแจกแจงแบบ F • การทดสอบสมมติฐาน 2. การเปรียบเทยี บค่าเฉล่ยี ประชากรสองกลุม่ ทเ่ี ปน็ อสิ ระตอ่ กัน • กรณีความแปรปรวนเท่ากนั (การทดสอบสมมตฐิ าน, การประมาณค่า • กรณีความแปรปรวนไมเ่ ท่ากัน (การทดสอบสมมติฐาน, การประมาณค่า 3. การเปรียบเทียบคา่ เฉล่ียประชากรสองกลมุ่ ทไี่ ม่เปน็ อสิ ระต่อกัน • กรณคี วามแปรปรวนเทา่ กนั (การทดสอบสมมติฐาน, การประมาณค่า • กรณีความแปรปรวนไม่เท่ากัน (การทดสอบสมมตฐิ าน, การประมาณค่า รปู แบบการเรยี นการสอน: การเรยี นรู้แบบรว่ มมอื 1. ผเู้ รียนแต่ละคนศึกษาเน้ือหาตามหวั ขอ้ บรรยายจากเอกสารประกอบการสอนและสรุปเปน็ แผนผัง ความคิด (Mind map) ก่อนเขา้ ชั้นเรียน 2. แบ่งกลุ่มการเรียน เช็คช่ือสมาชิกภายในกลุ่ม และอภิปรายเนื้อหาตามที่ได้รับมอบหมายภายใน กลุ่มและภายในชนั้ เรียน 3. สรปุ เน้ือหาโดยอาจารย์ผู้สอน 4. ผเู้ รียนแต่ละกลุม่ คิดโจทย์แบบฝกึ หดั พร้อมเฉลยหลงั จากจบบทเรียน และส่งภายในสัปดาหถ์ ดั ไป ~ 113 ~
ชีวสถติ สิ าํ หรบั สาธารณสขุ : หนว่ ยที่ 10 การเปรียบเทียบคา่ เฉลีย่ ประชากรสองกลุม่ การเปรียบเทียบความแตกต่างระหว่างกลุ่มของข้อมูลต่อเนื่องจะนําค่าเฉล่ียระหว่างกลุ่มมา เปรียบเทียบกัน ซ่ึงในกระบวนการเก็บรวบรวมข้อมูลโดยท่ัวไปมักไม่ทราบความแปรปรวนของประชากร จึงใช้การแจกแจงแบบ t แทน Z ซง่ึ การเปรียบเทียบค่าเฉลี่ยระหวา่ งประชากรสองโดยใชก้ ารแจกแจงแบบ t จะเรียกว่า สถิติ Two sample t-test จําแนกเป็น 2 รูปแบบ คือ การเปรียบเทียบค่าเฉล่ียประชากร สองกลุ่มที่เป็นอิสระต่อกัน (Independent t-test) และการเปรียบเทียบค่าเฉล่ียประชากรสองกลุ่มที่ไม่ อิสระตอ่ กนั (Paired t-test) ซงึ่ จะตอ้ งมีการทดสอบความเทา่ กนั ของความแปรปรวนก่อน ดังน้ี 1. การทดสอบความเท่ากนั ของความแปรปรวน (F-test) 1.1 ลกั ษณะการแจกแจงแบบ F การแจกแจงแบบ F มีลักษณะเบ้ขวา โดยจะมีลักษณะแตกต่างกันไปตามค่าระดับช้ัน ความเป็นอิสระ (Degree of freedom; df) คือ df1 และ df2 กล่าวคือ เมื่อ df มากข้ึนลักษณะการแจก แจงจะสมมาตรมากขน้ึ ดงั ภาพที่ 10.1 ทีม่ า: Wikipedia (https://en.wikipedia.org/wiki/F-distribution) ภาพที่ 10.1 การแจกแจงแบบ F 1.2 การทดสอบสมมติฐาน การทดสอบสมมติฐานจะใช้สถติ ิ F ตามลกั ษณะการแจกแจงของความแปรปรวนดังน้ี s12 F s22 ........................................................................................................................(1) เมื่อ s12 s 2 และ df1 n1 1 2 df2 n2 1 จะทําให้ได้ค่า F > 1 เพื่อง่ายต่อการเปรียบเทียบและแปลผล นําค่า F ไปเปิดตารางหาค่า p- value เปรยี บเทยี บกบั ระดบั นยั สาํ คัญ () จากน้ันตัดสินใจและแปลผลตอ่ ไป ~ 114 ~
ชีวสถิติสาํ หรับสาธารณสขุ : หน่วยที่ 10 การเปรยี บเทยี บค่าเฉลี่ยประชากรสองกลุ่ม ตวั อยา่ งท่ี 1 การศกึ ษาเก่ียวกบั คะแนนสอบย่อยวิชาชีวสถิตปิ ระยุกต์ในงานสาธารณสุข ครง้ั ท่ี 1 ของนสิ ิต ช้ันปีท่ี 3 และ 4 ผู้วิจัยต้องการทราบว่าความแปรปรวนของคะแนนสอบระหว่างนิสิตท้ัง 2 ชั้นปีต่างกัน หรือไม่ จึงสุ่มตวั อย่างจากนิสิตชั้นปี 3 มา 21 คน พบว่า s12= 81 และสุ่มนิสติ ปี 4 มา 16 คน พบวา่ s22= 64 ตอ้ งการทดสอบสมมติฐานความเทา่ กันของความแปรปรวนทีร่ ะดับนัยสําคญั 0.05 วธิ ที ํา ขัน้ ที่ 1 ตัง้ สมมตฐิ าน H0 : 2 2 1 2 σ21 HA : 2 2 1 2 เมือ่ = ความแปรปรวนของคะแนนสอบยอ่ ยวชิ าชวี สถติ ิฯ ครงั้ ท่ี 1 ของนสิ ิตชน้ั ปที ่ี 3 σ22 = ความแปรปรวนของคะแนนสอบยอ่ ยวชิ าชวี สถิตฯิ ครง้ั ท่ี 1 ของนสิ ติ ช้ันปีท่ี 4 ข้ันท่ี 2 กาํ หนดระดับนยั สาํ คญั = 0.05 ขัน้ ที่ 3 คํานวณคา่ สถิติทดสอบและหาค่า p-value จาก F s12 เมอื่ s12= 81, s22= 64 = 20, df2 = 16-1 = 15 จะได้ 8s122/64 = 1.27 โดยท่ี df1 = 21-1 F = เปิดตารางการแจกแจงแบบ F (ตาราง ส 7) ไดค้ ่า p-value > 0.1 ข้นั ที่ 4 เปรียบเทียบคา่ p-value กบั ระดบั นยั สําคญั ความน่าจะเป็นสูงสุดของการปฏิเสธ H0 สําหรับการแจกแจงแบบ F มีค่าได้ไม่เกิน 0.05 พบว่า p-value > 0.1 มคี า่ มากกว่า (0.05) ขนั้ ที่ 5 ตดั สนิ ใจและสรุปผล ยอมรบั สมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังน้ัน จึงสรุปผลได้ว่า ความแปรปรวนของคะแนน สอบระหวา่ งนิสติ ท้งั 2 ชน้ั ปี แตกตา่ งกนั อยา่ งไม่มีนยั สําคญั ทางสถติ ิ (p-value > 0.1) ----------------------------------------------------------------------------------------------------------------------------- 2. การเปรียบเทียบค่าเฉลีย่ ประชากรสองกลุ่ม ทีเ่ ปน็ อิสระตอ่ กนั (Independent sample t-test) นอกจากการศึกษาค่าเฉลี่ยในประชากรกลุ่มเดียวแล้ว บางครั้งงานวิจัยอาจมีวัตถุประสงค์เพ่ือ ต้องการเปรียบเทียบค่าเฉลี่ยระหว่างประชากรสองกลุ่มท่ีเป็นอิสระกัน เช่น ต้องการเปรียบเทียบคะแนน สอบย่อยวิชาชีวสถิติประยุกต์ในงานสาธารณสุขคร้ังที่ 1 ระหว่างนิสิตช้ันปีที่ 3 และ 4 หรือต้องการ เปรียบเทียบคะแนนสอบย่อยวิชาชีวสถิติประยุกต์ในงานสาธารณสุขครั้งที่ 1 ระหว่างนิสิตชายและนิสิต หญิง เป็นต้น จากตัวอย่างจะเห็นว่าประชากรมี 2 กลุ่ม คือ นิสิตชั้นปีท่ี 3 และ 4 หรือ นิสิตชายและนิสิต หญิง ซึ่งลักษณะของประชากร 2 กลุ่มดังกล่าวเรียกว่า “เป็นอิสระต่อกัน” กล่าวคือ ประชากรท้ัง 2 กลุ่ม ไม่ได้มีความสัมพันธ์กันหรือไม่ได้เป็นกลุ่มคนเดียวกันนั่นเอง สามารถเขียนสมมติฐานการทดสอบและ สมมติฐานทางเลอื ก กรณีการเปรยี บเทียบคา่ เฉล่ยี ประชากร 2 กล่มุ ทเี่ ป็นอสิ ระตอ่ กัน ไดด้ ังนี้ สมมติฐานการทดสอบ (Null hypothesis) H0: 1 = 2 หรือ 1 - 2 = 0 สมมตฐิ านทางเลอื ก (Alternative hypothesis) HA: 1 2 หรือ 1 - 2 0 (two tails test) HA: 1 < 2 หรือ 1 - 2 < 0 (one tail test) HA: 1 > 2 หรอื 1 - 2 > 0 (one tail test) ~ 115 ~
ชีวสถติ ิสําหรับสาธารณสขุ : หนว่ ยที่ 10 การเปรียบเทยี บคา่ เฉลย่ี ประชากรสองกลุ่ม 2.1 กรณีความแปรปรวนเทา่ กนั 2 2 1 2 2.1.1 การทดสอบสมมตฐิ าน ภายใต้ข้อตกลงเบื้องต้น (Assumption) ของการใช้สถิติ Independent sample t-test คือ ตัวอย่างแต่ละกลุ่มสุ่มมาจากประชากรท่ีมีการแจกแจงแบบปกติ (Normal distribution) และคา่ ความแปรปรวนเท่ากัน 2 2 ข้อมูลจากตัวอย่างนํามาคํานวณค่าสถิติ t ได้ดัง 1 2 สูตรต่อไปน้ี t X1 X 2 1 2 , df n1 n2 2 ...................................................(2) s 2 s 2 p p n1 n2 เมอ่ื s 2 n1 1s12 n2 1s22 p n1 n2 2 2.2.2 การประมาณค่า การประมาณค่าช่วงเชื่อม่ันเม่ือต้องการเปรียบเทียบค่าเฉล่ียระหว่างประชากร สองกลุ่มท่ีเป็นอิสระกัน น่ันคือ การประมาณค่าของ 1 - 2 กรณีความแปรปรวนเท่ากัน คํานวณได้จาก สูตรดังน้ี x1 x2 s 2 s 2 .................................................................(3) t p p 2,df n1 n2 2.2 กรณีความแปรปรวนไมเ่ ท่ากนั 2 2 1 2 2.2.1 การทดสอบสมมติฐาน ภายใต้ข้อตกลงเบ้ืองต้น (Assumption) ของการใช้สถิติ Independent sample t-test) คือ ตัวอย่างแต่ละกลุ่มสุ่มมาจากประชากรท่ีมีการแจกแจงแบบปกติ (Normal distribution) และค่าความแปรปรวนเท่ากนั 2 2 ข้อมูลจากตัวอย่างนํามาคํานวณคาสถิติ t ได้ดัง 1 2 สตู รตอ่ ไปน้ี t X1 X2 1 2 ...............................................................................(4) s12 s22 n1 n2 2 โดยที่ s12 s22 n1 n2 df s12 2 s22 2 n1 n2 n1 n2 2.3.2 การประมาณคา่ การประมาณค่าช่วงเช่ือม่ันเมื่อต้องการเปรียบเทียบค่าเฉลี่ยระหว่างประชากร สองกลุ่มท่ีเป็นอิสระกัน คือ การประมาณค่าของ 1 - 2 เช่นเดียวกัน ซึ่งกรณีความแปรปรวนไม่เท่ากัน คาํ นวณไดจ้ ากสตู รดังนี้ ~ 116 ~
ชวี สถิติสาํ หรบั สาธารณสุข: หนว่ ยที่ 10 การเปรยี บเทยี บค่าเฉลยี่ ประชากรสองกลุ่ม x1 x2 2,df s12 s22 .........................................................................(5) t n1 n2 ตัวอย่างท่ี 2 ในการศึกษาคะแนนสอบย่อยวิชาชีวสถิติประยุกต์ในงานสาธารณสุข ครั้งท่ี 1 ของนิสิตชั้นปี ที่ 3 และ 4 ได้สุ่มตัวอย่างกลุ่มละ 10 คน หาค่าเฉล่ียคะแนนสอบของนิสิตปี 3 เท่ากับ 35.6 คะแนน (sd = 8.6 คะแนน) ค่าเฉลี่ยคะแนนสอบของนิสิตปี 4 เท่ากับ 38.5 คะแนน (sd = 7.5 คะแนน) อยากทราบ วา่ คะแนนสอบย่อยครงั้ ที่ 1 ระหว่างนิสิตทั้งสองกลุ่มแตกต่างกันหรือไม่ ที่ระดับนยั สําคัญ 0.05 เมื่อข้อมูล ทั้งสองกลุม่ มีการแจกแจงปกติ วธิ ที าํ 1. การทดสอบสมมตฐิ าน สมมตฐิ านงานวจิ ยั : คะแนนสอบยอ่ ยวชิ าชวี สถิตฯิ ครั้งท่ี 1 ของนสิ ติ ชน้ั ปที ่ี 3 และ 4 แตกตา่ งกัน ขนั้ ท่ี 1 ตั้งสมมตฐิ านทางสถติ ิ H0 : 3 4 H A : 3 4 เมื่อ 1 = ค่าเฉลย่ี คะแนนสอบของนิสติ ปี 3 2 = คา่ เฉล่ียคะแนนสอบของนสิ ิตปี 4 ข้นั ที่ 2 กาํ หนดระดับนัยสําคัญ = 0.05 ขนั้ ที่ 3 คาํ นวณค่าสถิตทิ ดสอบและหาค่า p-value ต้องการทดสอบสมมติฐานความแตกตา่ งระหว่างคา่ เฉล่ยี ของประชากร 2 กลุ่ม ที่เป็นอิสระตอ่ กัน และไม่ทราบความแปรปรวนของประชากร เม่ือข้อมูลแต่ละกลุ่มมีการแจกแจงแบบปกติ สถิติที่เลือกใช้ คือ Independent t-test ซึ่งจะต้องทดสอบก่อนว่าความแปรปรวนของข้อมูลในประชากร 2 กลุ่ม แตกต่างกนั หรือไม่ ดังน้ี การทดสอบความเท่ากันของความแปรปรวน 1. ตงั้ สมมตฐิ าน H0 : 12 2 2 HA : 2 2 1 2 2. กําหนดระดับนยั สาํ คญั = 0.05 3. คาํ นวณคา่ สถติ ทิ ดสอบและหาคา่ p-value จาก F s12 เม่อื s12= (8.6)2, s22= (7.5)2 s22 จะได้ F = 73.96/56.25 = 1.31 โดยท่ี df1 = 10-1 = 9, df2 = 10-1 = 9 เปดิ ตารางการแจกแจงแบบ F (ตาราง ส 7) ได้คา่ p-value > 0.1 4. เปรียบเทียบค่า p-value กับระดบั นยั สําคัญ ความน่าจะเป็นสูงสุดของการปฏิเสธ H0 สําหรับการแจกแจงแบบ F มีค่าได้ไม่เกิน 0.05 พบว่า p-value > 0.1 มีคา่ มากกวา่ (0.05) 5. ตัดสินใจและสรปุ ผล ไม่ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังนั้น จึงสรุปผลได้ว่า คะแนนสอบของ ท้ัง 2 กลมุ่ มีความแปรปรวนไม่แตกต่างกนั (เท่ากัน) ทรี่ ะดบั นยั สาํ คัญ 0.05 (p-value > 0.1) ~ 117 ~
ชีวสถิตสิ าํ หรับสาธารณสุข: หน่วยท่ี 10 การเปรยี บเทยี บค่าเฉลยี่ ประชากรสองกลุ่ม เม่ือพบว่าความแปรปรวนเท่ากัน ดังน้ันเลือกใช้ Independent t-test กรณีความแปรปรวน เท่ากัน ดังนี้ t n1 1s12 n2 1s22 X1 X 2 1 2 , df n1 n2 2 เมอื่ s 2 p n1 n2 2 s 2 s 2 p p n1 n2 จะได้ s 2 10 1(8.6)2 10 1(7.5)2 665.64 506.25 65.11 p 18 10 10 2 t 35.6 38.5 0 , df 10 10 2 65.11 65.11 10 10 t 2.9 / 3.61, df 18 t 0.80, df 18 เปดิ ตารางการแจกแจงแบบ t (ตาราง ส 5) ไดค้ า่ p-value > 0.1 ข้ันที่ 4 เปรยี บเทียบค่า p-value กับระดับนัยสาํ คญั เน่ืองจากสมมติฐาน HA เป็นแบบสองทาง ดังน้ันความน่าจะเป็นสูงสุดของการปฏิเสธ H0 มีค่าได้ ไม่เกิน 0.05/2 = 0.025 พบวา่ p-value > 0.1 มคี ่ามากกวา่ /2 (0.025) ขั้นที่ 5 ตัดสินใจและสรุปผล ยอมรับสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังน้ัน จึงสรุปผลได้ว่า คะแนนสอบระหว่างนิสิตท้ัง สองชนั้ ปีแตกตา่ งกันอย่างไม่มีนยั สาํ คญั ทางสถิติ (p-value > 0.1) 2. การประมาณคา่ 95% ชว่ งเชื่อมั่นของ 1 - 2 มีคา่ อยรู่ ะหวา่ ง x1 x2 s 2 s 2 t p p 2,df n1 n2 35.6 38.5 2,df 18 65.11 65.11 t0.05 10 10 2.9 2.101 3.61 2.9 7.58 10.48 4.68 ดังนั้น ท่ีระดับความเชื่อมั่น 95% ความแตกต่างระหว่างค่าเฉลี่ยคะแนนสอบของนิสิตสองกลุ่มอยู่ ระหว่าง -10.48 ถงึ 4.68 คะแนน 3. ความสัมพันธ์ระหวา่ ง การประมาณคา่ ช่วงเชอื่ มน่ั กับการทดสอบสมมตุ ิฐาน ค่าท่ีกาํ หนดในสมมตฐิ าน คอื H0 : 1 2 H 0 : ~1 2~ 0 118
ชีวสถิตสิ าํ หรับสาธารณสุข: หนว่ ยท่ี 10 การเปรยี บเทยี บคา่ เฉล่ยี ประชากรสองกลมุ่ 95% CI มคี ่าเท่ากับ -10.48 ถึง 4.68 คะแนน ดังนั้น ค่า H0 = 0 อยู่ในช่วงเช่ือมั่น นั่นคือ ผลการทดสอบสมมติฐาน ไม่มีนัยสําคัญทางสถิติ (Non-significant) ----------------------------------------------------------------------------------------------------------------------------- 3. การเปรียบเทยี บค่าเฉลย่ี ประชากรสองกลุ่ม ท่ีไม่เปน็ อิสระตอ่ กนั (Paired t-test) บางคร้ังการออกแบบงานวิจัยทําให้ลักษณะของประชากร 2 กลุ่มไม่เป็นอิสระต่อกัน กล่าวลือ ประชากร 2 กลุ่มเป็นกลุ่มเดียวกันแต่มีการวัดข้อมูลซ้ําแล้วนํามาเปรียบเทียบกัน เช่น การเปรียบเทียบ คะแนนความรู้ก่อนและหลังให้สุขศึกษา หรืออาจมีการออกแบบงานวิจัยในลักษณะท่ีมีการจับคู่ (Matched pair) ทําให้ประชากร 2 กลุ่มไม่เป็นอิสระต่อกัน เช่น การเปรียบเทียบประสิทธิผลของ โปรแกรมออกกําลังกายระหว่างพนักงานธนาคารกับพนักงานมหาวิทยาลัย โดยจับคู่ เพศ และอายุ การ วิเคราะห์ข้อมูลที่ไม่เป็นอิสระกันน้ี จะหาความแตกต่างกันเป็นรายคู่ (x1 – x2 เป็นคู่ๆ) แล้วจึงนําความ แตกตา่ ง (d) ของแต่ละค่มู าหาค่าเฉลีย่ (d̅) ดงั นั้นเขียนสมมติฐานไดด้ ังน้ี สมมติฐานการทดสอบ (Null hypothesis) H0: d = 0 สมมติฐานทางเลอื ก (Alternative hypothesis) HA: d 0 (two tails test) HA: d < 0 (one tail test) HA: d > 0 (one tail test) 3.1 การทดสอบสมมตฐิ าน ภายใต้ข้อตกลงเบ้ืองต้น (Assumption) ของการใช้สถิติ Paired sample t-test คือ ตัวอย่างแต่ละกลุ่มสุ่มมาจากประชากรที่มีการแจกแจงแบบปกติ (Normal distribution) และอาศัย ลกั ษณะการแจกแจงแบบ t การทดสอบสมมตฐิ านอาศัยสูตรดังน้ี t d d ,df n 1 ...........................................................................................................(6) sd n เมอ่ื d = คา่ เฉลี่ยของผลต่างในตวั อยา่ ง d= ค่าเฉล่ยี ของผลต่างในประชากร sd2 = ความแปรปรวนของผลตา่ งในตวั อย่าง 3.2 การประมาณคา่ การประมาณค่าช่วงเช่ือม่ันเม่ือตอ้ งการเปรียบเทียบคา่ เฉลี่ยระหว่างประชากรสองกลุ่มท่ี ไมเ่ ป็นอสิ ระกนั คอื การประมาณค่าของ d คํานวณได้จากสตู รดงั น้ี d 2,df sd2 ………………………………………………………………………………………………(7) t n ~ 119 ~
ชวี สถติ สิ ําหรบั สาธารณสุข: หนว่ ยที่ 10 การเปรียบเทยี บค่าเฉลีย่ ประชากรสองกล่มุ ตัวอย่างที่ 3 ในการศึกษาดัชนีมวลกายของนิสิตขณะเรียนอยู่ปี 1 จํานวน 25 คน เปรียบเทียบกับเมื่อ เรียนอยู่ปี 4 ได้ค่าเฉล่ียของความต่าง เท่ากับ 2.3 kg/m2และส่วนเบ่ียงเบนมาตรฐานของผลต่างใน ตวั อย่าง เท่ากับ 1.5 kg/m2 อยากทราบวา่ ค่าดัชนีมวลกายของนิสิตเพิ่มขึ้นหรือไม่ ท่ีระดบั นัยสําคัญ 0.05 เมอื่ ขอ้ มลู ดัชนมี วลกายมีการแจกแจงปกติ วธิ ที าํ 1. การทดสอบสมมติฐาน สมมตฐิ านงานวจิ ัย: คา่ ดัชนีมวลกายของนิสิตเมอ่ื เรียนช้นั ปีท่ี 4 เพ่ิมขึ้นจากชน้ั ปีท่ี 1 ขน้ั ที่ 1 ตงั้ สมมตฐิ านทางสถิติ H0 : d 0 H A : d 0 เม่อื d = ค่าเฉลีย่ ของผลต่างดชั นมี วลกายของนสิ ติ ขณะเรยี นอยูป่ ี 1 และ ปี 4 ข้นั ที่ 2 กําหนดระดับนยั สาํ คญั = 0.05 ข้นั ท่ี 3 คํานวณคา่ สถติ ิทดสอบและหาคา่ p-value t d d , df n 1 sd n t 2.3 0 , df 25 1 1.5 25 t 7.67, df 24 เปดิ ตารางการแจกแจงแบบ t (ตาราง ส 5) ไดค้ ่า p-value < 0.0005 ข้นั ที่ 4 เปรยี บเทียบคา่ p-value กบั ระดบั นยั สําคัญ เน่ืองจากสมมติฐาน HA เป็นแบบทางเดียว ดังน้ันความน่าจะเป็นสูงสุดของการปฏิเสธ H0 มีค่าได้ ไม่เกิน 0.05 พบวา่ p-value < 0.0005 มีค่าน้อยกว่า 0.05 ขัน้ ท่ี 5 ตัดสนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังน้ัน จึงสรุปผลได้ว่าค่าดัชนีมวลกายของนิสิต เพิ่มขน้ึ อยา่ งมีนยั สําคัญทางสถติ ิ (p-value < 0.0005) 2. การประมาณคา่ ช่วงเชอ่ื มน่ั d 2,df sd2 95% ช่วงเชื่อมั่นของ d มีค่าอยรู่ ะหว่าง t n 2.3 2,df 24 1.52 t0.05 25 2.3 2.064 0.3 2.3 0.62 1.68 2.92 ดังน้ัน ท่ีระดับความเชื่อม่ัน 95% ค่าเฉล่ียความแตกต่างของดัชนีมวลกายเมื่อปี 1 และปี 4 อยู่ ระหว่าง 1.68 ถงึ 2.92 kg/m2 ~ 120 ~
ชีวสถติ ิสาํ หรับสาธารณสุข: หน่วยที่ 10 การเปรียบเทยี บค่าเฉลี่ยประชากรสองกล่มุ 3. ความสัมพันธ์ระหว่าง %CI กบั การทดสอบสมมตุ ฐิ าน คา่ ท่ีกําหนดในสมมตุ ิฐาน H0 : d 0 95% CI มคี า่ เท่ากับ 1.68 ถึง 2.92 kg/m2 ดังนั้น ค่า H0 = 0 อยู่นอกช่วงเชื่อมั่น นั่นคือ ผลการทดสอบสมมติฐาน มีนัยสําคัญทางสถิติ (significant) ---------------------------------------------------------------------------------------------------------------------- ~ 121 ~
ชวี สถิตสิ าํ หรบั สาธารณสขุ : หนว่ ยที่ 10 การเปรยี บเทียบคา่ เฉล่ยี ประชากรสองกลุ่ม เฉลยแบบฝกึ หัด 1. จากการศึกษาทดลองยา 2 ชนิด กับหนูผ่าตัดเปล่ียนหัวใจ 2 กลุ่ม โดยเก็บข้อมูลจํานวนวันท่ีหนูมีอายุ รอด ได้ขอ้ มลู ดังนี้ กลุ่ม 1 n1 = 9 x1 16 วัน S1 = 10.1 วนั กลมุ่ 2 n2 = 9 x2 15 วนั S2 = 10 วนั นกั วจิ ยั ตอ้ งการทราบว่าทร่ี ะดบั ความเชื่อม่ัน 99% จาํ นวนวันทหี่ นมู ีอายรุ อดแตกตา่ งกันหรือไม่ วธิ ีทาํ 1.1 การทดสอบสมมตฐิ าน 1. ตัง้ สมมตฐิ าน H0: ค่าเฉลยี่ จํานวนวนั ที่หนูกลุ่มท่ี 1 มอี ายรุ อดไม่ต่างจากกลุ่มท่ี 2 (1 = 2) HA: คา่ เฉล่ยี จํานวนวันท่ีหนกู ลมุ่ ท่ี 1 มีอายุรอดตา่ งจากกลุ่มท่ี 2 (1 2) 2. กําหนดระดับนยั สาํ คัญ = 0.01 3. คํานวณคา่ สถิติทดสอบและหาค่า p-value จากโจทย์ต้องการเปรียบเทียบจํานวนวันที่หนูมีอายุรอดซ่งึ เป็นขอ้ มูลเชิงปริมาณระหวา่ งกลมุ่ ท่ี 1 และกลุ่มที่ 2 ซ่ึงประชากรเป็นอิสระต่อกนั ดังนั้นสถติ ทิ ่ีเลอื กใชค้ อื Independent t-test โดยจะตอ้ ง ทดสอบความเท่ากันของความแปรปรวนกอ่ น ดงั น้ี 1. ตัง้ สมมติฐาน H0 : 2 2 1 2 HA : 2 2 1 2 2. กําหนดระดับนยั สําคญั = 0.05 3. คาํ นวณค่าสถติ ิทดสอบและหาคา่ p-value F s12 s22 F 10.12 /102 102.01/100 1.02 โดยที่ df1 9 1 8, df2 9 1 8 เปิดตารางการแจกแจงแบบ F ได้ค่า p-value > 0.1 4. เปรียบเทียบคา่ p-value กับระดับนัยสาํ คญั ความนา่ จะเป็นสูงสดุ ของการปฏเิ สธ H0 สาํ หรับการแจกแจงแบบ F มคี า่ ได้ไม่เกิน (0.01) พบวา่ p-value > 0.1 มีค่ามากกว่า (0.01) 5. ตดั สินใจและสรปุ ผล ยอมรบั สมมตฐิ าน H0 ทรี่ ะดบั นยั สาํ คัญ 0.01 ดงั นนั้ จึงสรปุ ผลไดว้ ่า ขอ้ มลู จํานวนวันที่ หนมู ีอายรุ อดของหนูทั้ง 2 กลมุ่ มีความแปรปรวนเท่ากัน (p-value > 0.1) ~ 122 ~
ชวี สถิติสําหรับสาธารณสขุ : หนว่ ยที่ 10 การเปรยี บเทียบคา่ เฉล่ียประชากรสองกลุ่ม คํานวณคา่ สถติ ิทดสอบ Independent t-test กรณีความแปรปรวนเทา่ กนั s 2 9 110.12 9 1102 816.08 800 1,616.08 101.005 p 16 16 992 t 16 15 0 , df 9 9 2 101.005 101.005 9 9 t 1 , df 16 4.74 t 0.21, df 16 เปดิ ตารางการแจกแจงแบบ t ไดค้ า่ p-value > 0.1 4. เปรยี บเทยี บค่า p-value กบั ระดบั นัยสาํ คัญ เนือ่ งจากสมมติฐาน HA เป็นแบบสองทาง ดงั น้ันความนา่ จะเป็นสงู สุดของการปฏเิ สธ H0 มีค่าได้ ไมเ่ กิน 0.01/2 = 0.005 ดังนน้ั p-value > 0.1 มคี ่ามากกว่า /2 (0.005) 5. ตัดสินใจและสรปุ ผล ยอมรับสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.01 ดังน้ัน จึงสรุปผลได้ว่า จํานวนวันที่หนูกลุ่มท่ี 1 มี อายุรอดกับกล่มุ ท่ี 2 แตกตา่ งกันอยา่ งไมม่ นี ยั สาํ คญั ทางสถติ ิ (p-value > 0.1) นนั่ คอื จํานวนวันท่ีหนูกลุ่ม ท่ี และกลมุ่ ท่ี 2 มีอายุรอดไม่แตกต่างกนั ท่รี ะดับนยั สาํ คญั 0.01 1.2 การประมาณค่าช่วงเช่อื ม่นั 99% ช่วงเช่ือมั่นของ 1 - 2 มคี ่าอยรู่ ะหวา่ ง x1 x2 s 2 s 2 t p p 2,df n1 n2 16 15 2,df 16 101.005 101.005 t 0.01 9 9 1 2.921 4.74 1 13.85 12.85 ถึง 14.85 ดงั นั้น ท่ีระดับความเช่ือม่นั 99% ความแตกต่างของค่าเฉลี่ยจํานวนวนั ที่หนูมีอายุรอดระหว่างหนู กล่มุ 1 และกลุม่ 2 อยู่ระหว่าง -12.85 ถงึ 14.85 วัน ~ 123 ~
ชีวสถติ สิ ําหรับสาธารณสขุ : หน่วยท่ี 10 การเปรียบเทียบคา่ เฉลย่ี ประชากรสองกลมุ่ 2. จากการศึกษาอายุท่ีฟันแท้งอกระหว่างด้านซ้ายและด้านขวา โดยศึกษาจากตัวอย่างซึ่งเป็นชายจํานวน 17 คน บันทึกอายุท่ีฟันแท้ดา้ นซ้ายและด้านขวางอก จับคู่กันแล้วหาผลต่างระหว่างซ้ายและขวา ได้ข้อมูล ดังน้ี n = 17, d = 1.5 ปี, sd = 4.7 ปี ต้องการทราบวา่ อายุทฟี่ นั แทง้ อกระหวา่ งดา้ นซ้ายและด้านขวาแตกต่างกันหรอื ไม่ ท่ีระดบั นัยสาํ คัญ 0.05 วธิ ที ํา 2.1 การทดสอบสมมตฐิ าน 1. ตง้ั สมมตฐิ าน H0: คา่ เฉล่ยี อายุทฟ่ี นั แทง้ อกระหวา่ งดา้ นซ้ายและดา้ นขวาไม่แตกต่างกัน (d = 0) HA: คา่ เฉล่ียอายุที่ฟันแท้งอกระหวา่ งด้านซ้ายและดา้ นขวาแตกต่างกัน (d 0) 2. กําหนดระดบั นัยสาํ คญั = 0.05 3. คํานวณคา่ สถติ ทิ ดสอบและหาคา่ p-value t 1.5 0 , df 17 1 4.7 17 t 1.5 /1.14, df 16 t 1.316, df 16 เปดิ ตารางการแจกแจงแบบ t (ส 5) ได้คา่ p-value > 0.1 4. เปรียบเทียบค่า p-value กบั ระดบั นยั สาํ คัญ เนอ่ื งจากสมมตฐิ าน HA เปน็ แบบสองทาง ดงั นัน้ ความนา่ จะเป็นสูงสุดของการปฏเิ สธ H0 มคี ่าได้ ไม่เกนิ 0.05/2 = 0.025 ดังนน้ั p-value > 0.1 มคี า่ มากกวา่ /2 (0.025) 5. ตดั สนิ ใจและสรุปผล ยอมรบั สมมตฐิ าน H0 ท่รี ะดบั นยั สาํ คัญ 0.05 ดงั นนั้ จงึ สรปุ ผลได้ว่า อายุทฟี่ ันแท้งอกระหว่าง ด้านซา้ ยและดา้ นขวาแตกตา่ งกันแตกตา่ งกันอย่างไมม่ ีนยั สําคัญทางสถติ ิ (p-value > 0.1) น่นั คอื อายทุ ี่ ฟนั แทง้ อกระหว่างด้านซ้ายและด้านขวาไมแ่ ตกต่างกนั ทร่ี ะดับนัยสําคัญ 0.05 2.2 การประมาณค่าช่วงเช่อื ม่ัน 95% ช่วงเชื่อมัน่ ของ d มคี ่าอยรู่ ะหว่าง d s 2 t d 2,df n 1.5 4.72 t 0.05 2,df 16 17 1.5 2.12 1.14 1.5 2.42 0.92 ถึง 3.92 ดังน้ัน ท่ีระดับความเช่ือม่ัน 95% ความแตกต่างของค่าเฉลี่ยอายุท่ีฟันแท้งอกระหว่างด้านซ้าย และดา้ นขวา อย่รู ะหว่าง -0.92 ถงึ 3.92 ปี ~ 124 ~
ชีวสถติ สิ าํ หรบั สาธารณสุข: หน่วยท่ี 11 การเปรียบเทยี บคา่ เฉล่ียประชากรมากกวา่ สองกลมุ่ หนว่ ยท่ี 11 การเปรยี บเทียบคา่ เฉลีย่ ประชากรมากกวา่ สองกลุ่ม วตั ถุประสงค:์ หลงั จากจบการเรยี นในหัวขอ้ น้แี ลว้ นสิ ิตสามารถ 1. ทราบประเภทของการวเิ คราะห์ความแปรปรวน 2. เขา้ ใจหลกั การวเิ คราะห์ความแปรปรวน 3. ทราบและตระหนกั ถึงข้อตกลงเบื้องต้นของการวิเคราะหค์ วามแปรปรวน 4. สามารถคํานวณค่าสถิติทดสอบ F และวิเคราะห์ข้อมูลตามขั้นตอนการวิเคราะห์ความแปรปรวน ทางเดียวได้ 5. สามารถสรปุ ผลจากการวิเคราะหค์ วามแปรปรวนทางเดียวได้ 6. สามารถคาํ นวณคา่ และเปรยี บเทียบความแตกตา่ งระหว่างคู่ได้ เน้ือหา: การเปรยี บเทียบคา่ เฉล่ยี ประชากรมากกวา่ สองกล่มุ 1. ประเภทของการวิเคราะห์ความแปรปรวน 2. หลักการวเิ คราะห์ความแปรปรวนทางเดยี ว 3. ข้อตกลงเบอ้ื งต้นของการวเิ คราะหค์ วามแปรปรวนทางเดยี ว 4. ขั้นตอนการวิเคราะหค์ วามแปรปรวนทางเดยี ว 5. สัญลักษณ์และสูตรทใ่ี ชใ้ นการคาํ นวณ 6. การเปรยี บเทยี บความแตกตา่ งระหวา่ งคู่ รูปแบบการเรยี นการสอน: การเรยี นรแู้ บบรว่ มมอื 1. ผ้เู รยี นแตล่ ะคนศึกษาเน้อื หาตามหวั ขอ้ บรรยายจากเอกสารประกอบการสอนและสรปุ เป็นแผนผัง ความคดิ (Mind map) กอ่ นเข้าชั้นเรยี น 2. แบ่งกลุ่มการเรียน เช็คชื่อสมาชิกภายในกลุ่ม และอภิปรายเน้ือหาตามท่ีได้รับมอบหมายภายใน กลุม่ และภายในชน้ั เรยี น 3. สรุปเนอ้ื หาโดยอาจารยผ์ ู้สอน 4. ผูเ้ รียนแต่ละกลมุ่ คดิ โจทย์แบบฝกึ หดั พรอ้ มเฉลยหลังจากจบบทเรยี น และสง่ ภายในสปั ดาหถ์ ดั ไป ~ 125 ~
ชีวสถติ ิสําหรับสาธารณสขุ : หนว่ ยที่ 11 การเปรยี บเทยี บคา่ เฉล่ยี ประชากรมากกวา่ สองกลมุ่ 1. ประเภทของการวิเคราะห์ความแปรปรวน การวิเคราะห์ความแปรปรวน (Analysis of Variance; ANOVA) ใช้สําหรับเปรียบเทียบค่าเฉลี่ย ระหว่างประชากรตั้งแต่ 3 กลุ่มขึ้นไป ซึ่งจําแนกได้หลายประเภท เช่น การวิเคราะห์ความแปรปรวนทาง เดียว (One Way ANOVA) การวิเคราะห์ความแปรปรวนทางเดียวแบบวัดซ้ํา (One-way ANOVA for repeated measures) การวิเคราะห์ความแปรปรวนสองทาง (Two-way ANOVA) การวิเคราะห์ความ แปรปรวนสองทางแบบวัดซ้ํา (Two-way ANOVA for repeated measures) การวิเคราะห์ความ แปรปรวนแบบแฟคทอเรียล (Factorial ANOVA) เป็นต้น ซึ่งในหน่วยการศึกษานี้จะกล่าวถึงเฉพาะการ วิเคราะห์ความแปรปรวนทางเดยี ว การวิเคราะห์ความแปรปรวนทางเดียว ใช้ทดสอบสมมติฐานความแตกต่างระหว่างค่าเฉลี่ยของ ประชากรตั้งแต่ 3 กลุ่มข้ึนไป โดยที่ตัวแปรต้นหรือลักษณะที่สนใจศึกษาในประชากรมี 1 ตัวแปร เป็นตัว แปรเชิงคุณภาพ จําแนกได้ 3 กลุ่มขึ้นไป ส่วนตัวแปรตามเป็นข้อมูลเชิงปริมาณ เช่น ลักษณะของคําถาม วิจยั ดังน้ี - อายุของผู้มารับบริการที่โรงพยาบาลชุมชน โรงพยาบาลจังหวัด และโรงพยาบาลศูนย์ แตกตา่ งกันหรือไม่ - นา้ํ หนกั ของนสิ ิตชั้นปีที่ 1, 2, 3 และ 4 แตกต่างกนั หรอื ไม่ - ค่าสมรรถภาพปอดในกลุ่มคนที่ไม่สูบบุหรี่ สูบบุหร่ี และเคยสูบแต่เลิกสูบแล้ว แตกต่าง กันหรือไม่ จากตัวอย่างคําถามวิจัยจะเห็นได้ว่าตัวแปรตาม ได้แก่ อายุ น้ําหนัก และ ค่าสมรรถภาพปอด (FEV1) เปน็ ขอ้ มูลเชิงปริมาณ และตัวแปรต้น ได้แก่ ประเภทโรงพยาบาล ช้นั ปี สถานการณ์สูบบหุ ร่ี เป็นข้อมูลเชิง คณุ ภาพจําแนกได้ต้งั แต่ 3 กลุ่มขน้ึ ไป ในหน่วยการศึกษาท่ีผ่านมา สถิติท่ีใช้สําหรับการเปรียบเทียบค่าเฉล่ีย 1 กลุ่ม และ 2 กลุ่ม คือ t-test แตก่ ารเปรยี บเทียบค่าเฉล่ียระหว่างประชากรตงั้ แต่ 3 กลมุ่ ข้ึนไป (1 , 2 , 3) หากตอ้ งการทดสอบดว้ ย t-test ทําได้เพียงการเปรียบเทียบทีละคู่ คือ ระหว่าง (1 กับ 2), (1 กับ 3) และ (2 กับ 3) ซึ่ง จะต้องทดสอบสมมติฐานด้วย Independent t-test ถึง 3 ครั้ง หากการทดสอบแต่ละครั้งกําหนด = 0.05 การทดสอบ 3 คร้ังจะทําให้ค่า เพ่ิมข้ึนเป็น 0.14 (1 - 0.953) ดังนั้นกรณีท่ีต้องการเปรียบเทียบ คา่ เฉลีย่ ระหวา่ งประชากรตงั้ แต่ 3 กลุ่มขน้ึ ไปจงึ ไมเ่ หมาะสมสําหรับการใช้สถติ ิ Independent t-test การ วิเคราะห์ความแปรปรวนทางเดียว หรือ One-way ANOVA สามารถทดสอบสมมติฐานโดยเปรียบเทียบ ค่าเฉลยี่ คอื 1 , 2 , 3 ได้ในการทดสอบครั้งเดยี ว ดังน้นั ค่า จึงยังคงเท่ากับ 0.05 2. หลกั การวิเคราะห์ความแปรปรวนทางเดยี ว การทดสอบสมมติฐานในการวิเคราะห์ความแปรปรวนซ่ึงมีการแจกแจงแบบ F คํานวณได้โดยใช้ สถติ ทิ ดสอบ F ดงั น้ี BMS F= WMS …………………………………………………………………………………………………………..….(1) เมอ่ื BMS = ความแปรปรวนระหว่างกล่มุ WMS = ความแปรปรวนภายในกลุ่ม ~ 126 ~
ชวี สถิตสิ ําหรับสาธารณสุข: หน่วยที่ 11 การเปรยี บเทยี บค่าเฉล่ียประชากรมากกว่าสองกล่มุ เช่น การศึกษาประสิทธิผลของการสอนสุขศึกษา 3 วิธี โดยเปรียบเทียบคะแนนความรู้ มีการ ออกแบบโดยแบ่งประชากรเป็น 3 กลุ่มตามห้องเรียน ห้องที่ 1 ได้รับการสอนสุขศึกษาวิธีที่ 1 คือการใช้ เกม ห้องที่ 2 ได้รับการสอนสุขศึกษาวิธีท่ี 2 คือ การเล่าประสบการณ์ และห้องที่ 3 ได้รับการสอนสุข ศึกษาวิธีที่ 3 คือการบรรยาย หลังจากน้ันทดสอบความรู้หลังการสอนแต่ละห้องเพื่อเปรียบเทียบ ประสิทธิผลของวธิ ีการสอน ซึ่งเปน็ ปจั จัยเดียวมี 3 ระดับ ดงั นั้นการทดสอบสมมติฐานจึงสามารถวเิ คราะห์ ไดด้ ้วยการวเิ คราะห์ความแปรปรวนทางเดียว 3. ข้อตกลงเบ้ืองตน้ ของการวเิ คราะห์ความแปรปรวนทางเดยี ว ในการวิเคราะหค์ วามแปรปรวนมขี ้อตกลงเบอ้ื งต้นที่จะต้องพิจารณากอ่ นการวิเคราะห์ ได้แก่ 1. ตวั อยา่ งตอ้ งเลือกมาจากประชากรอย่างสุ่ม 2. ตัวอยา่ งภายในกล่มุ และระหวา่ งกลมุ่ มคี วามเปน็ อิสระต่อกนั 3. ขอ้ มูลแต่ละกลุ่มมกี ารแจกแจงเปน็ แบบปกติ 4. ข้อมลู มคี วามแปรปรวนในแตล่ ะกลุ่มเท่ากัน กรณีข้อตกลงเบ้ืองต้นเก่ียวกับตัวอย่างข้อ 1 และ 2 สามารถพิจารณาได้จากการออกแบบการ วิจัย สําหรับข้อตกลงเบื้องต้นเก่ียวกับข้อมูล คือ การแจกแจงแบบปกติในข้อ 3 และ ความแปรปรวน เท่ากัน ในข้อ 4 จะต้องทดสอบก่อนการวเิ คราะห์ความแปรปรวน ซ่ึงในที่น้ีจะไม่ได้กล่าวถึงวิธีการทดสอบ นสิ ิตจะได้ศกึ ษาวิธกี ารทดสอบดงั กลา่ วโดยการใช้โปรแกรมสําเรจ็ รปู ในการวิเคราะห์ 4. ขั้นตอนการวเิ คราะห์ความแปรปรวนทางเดียว ขน้ั ตอนการวิเคราะหเ์ ชน่ เดยี วกับการทดสอบสมมติฐานอืน่ ๆ ดังน้ี 1. ตั้งสมมติฐาน 2. กาํ หนดระดับนยั สาํ คัญ 3. คํานวณค่าสถติ ิทดสอบและหาคา่ p-value 3.1 คาํ นวณค่า 3.2 นาํ คา่ ทไี่ ดใ้ น 3.1 มาคาํ นวณค่า TSS, BSS และ WSS 3.3 นาํ ค่าใส่ในตาราง ANOVA 4. เปรยี บเทยี บค่า p-value กบั ระดับนัยสําคัญ 5. ตัดสนิ ใจและสรุปผล การตง้ั สมมติฐาน สมมตฐิ าน H0 ต้งั ว่า ไม่มีความแตกตา่ งระหว่างค่าเฉลยี่ ของประชากรแตล่ ะกลุม่ สมมตฐิ าน HA ตัง้ วา่ มคี ่าเฉลีย่ ของประชากรอย่างนอ้ ย 1 คู่ แตกต่างกนั เขยี นสัญลักษณแ์ ทนได้ดังนี้ 0 : 1 2 ... k A : i j อย่างนอ้ ยหนง่ึ คู่ โดยที่ i j หรือ HA : มี อย่างน้อยหนึ่งคู่ท่ีแตกตา่ งกัน ~ 127 ~
ชีวสถิตสิ ําหรบั สาธารณสุข: หน่วยท่ี 11 การเปรียบเทียบค่าเฉลี่ยประชากรมากกวา่ สองกลมุ่ 5. สัญลักษณแ์ ละสตู รทใี่ ช้ในการคาํ นวณ การวิเคราะห์ความแปรปรวนมีการคํานวณที่ซับซ้อน ดังน้ันเพ่ือง่ายต่อการทําความเข้าใจในการ คํานวณค่าสถิติทดสอบ F จึงสรุปแนวทางการคํานวณซึ่งเป็นบางส่วนในการวิเคราะห์ความแปรปรวนทาง เดยี วดังตารางที่ 11.1 เมือ่ N คือ จาํ นวนตัวอยา่ ง k คอื จํานวนกลุ่มท่ีนาํ มาทดสอบ ni คือ จาํ นวนตัวอยา่ งกลุม่ ท่ี i Yij คือ ขอ้ มูลของตัวอย่างที่ j กลุ่มที่ i i คือ ลําดบั ของกลุม่ มคี ่า 1 ถงึ k กลุ่ม j คอื ลําดบั ท่ีของตัวอยา่ ง มคี ่า 1 ถงึ ni Yi. คือ ผลรวมของคา่ ข้อมูลจากตวั อย่างกลุ่มที่ i Y.. คือ ผลรวมของคา่ ข้อมลู จากตัวอยา่ งทุกกลุ่ม Yi คอื คา่ เฉลย่ี ของกลมุ่ ที่ i Y.. คอื ค่าเฉลีย่ รวมของทกุ กลุ่ม n X i X 2 Si2 คอื ค่าความแปรปรวนของกลุ่มท่ี i , s2 i1 n 1 ตารางที่ 11.1 แนวทางการคาํ นวณสาํ หรับการวิเคราะหค์ วามแปรปรวนทางเดียว กลุม่ 1 กลมุ่ 2 ... กลุ่ม k Y11 Y21 ... Yk1 Y12 Y22 ... Yk2 . . ... . . . ... . . . ... . Y1n1 Y2n1 ... Ykn1 Yi j Yij Y.. i Yi Y2 Y2 j ij j i ij ni N i ni si2 ค่าต่างๆ ดังตารางท่ี 11.1 นํามาใส่ในรูปแบบของตารางวิเคราะห์ความแปรปรวนได้ดัง ตารางท่ี 11.2 ~ 128 ~
ชีวสถติ สิ ําหรับสาธารณสุข: หน่วยที่ 11 การเปรยี บเทียบคา่ เฉลี่ยประชากรมากกว่าสองกลุ่ม ตารางท่ี 11.2 ตารางวิเคราะห์ความแปรปรวนทางเดียว แหล่งความ ช้นั ความ ผลรวมของสว่ นเบี่ยงเบน สว่ นเบย่ี งเบน สถิติ แปรปรวน เปน็ อสิ ระ กําลังสอง (SS) กาํ ลังสองเฉลยี่ ทดสอบ ระหวา่ งกลุ่ม (df) (MS) F (B) k-1 BSS Yi.2 Y..2 BMS BSS F BMS ภายในกลุ่ม N-k ni N k 1 WMS (W) i รวม N-1 (T) WSS TSS BSS WMS WSS nk TSS Yij2 Y..2 N การสรุปผลการทดสอบทําได้โดยนาํ คา่ F ท่คี าํ นวณได้ เปดิ ตาราง F (ตาราง ส 7) หาค่า p-value แล้ว นําไปเทียบกบั ระดบั นัยสาํ คัญที่ต้งั ไว้ ซ่ึงจาํ แนกเปน็ 2 กรณี ดังนี้ กรณีท่ี 1 p-value ให้ผล ปฏิเสธสมมติฐาน H0 ดังนั้นสรุปได้ว่า มี อย่างน้อยหนึ่งคู่ท่ี ต่างกัน ข้ันต่อไปจะต้องหาความแตกต่างระหว่างคู่ด้วย โดยวิธีการคํานวณมือจะใช้ Bonferroni t-test (สําหรับวิธีการหาความแตกต่างระหว่างคู่ยังมีอีกหลายวิธี ซ่ึงนิสิตจะได้เรียนรู้เมื่อใช้โปรแกรมสําเร็จรูป เช่น Tukey’s HSD, Scheffe, Newman-Keuls, Dunnett เป็นตน้ ) กรณีท่ี 2 p-value > ให้ผล ยอมรับสมมติฐาน H0 ดังนั้นสรุปได้ว่า ไม่ต่างกัน ส้ินสุดการ วเิ คราะห์ความแปรปรวนทางเดียว 6. การเปรียบเทียบความแตกต่างระหว่างคู่ ในที่นี้จะใช้วิธี Bonferroni t-test สําหรับการคํานวณมือ ซ่ึงเป็นวิธีท่ีใช้สําหรับการทดสอบค่า t ในกรณีที่จํานวนท่ีต้องการทดสอบมีไม่มากนักและจํานวนขนาดแต่ละกลุ่มไม่จําเป็นต้องเท่ากัน โดย คํานวณผลต่างระหว่างค่าเฉลี่ยแต่ละคู่ และหาค่า Pooled variance ของทุกกลุ่ม (คือค่าความแปรปรวน ภายในกลุ่ม WMS) คา่ t น้ี มี df = N-k คาํ นวณจากสตู ร ดงั นี้ tNk x1 x2 .............................................................................................(2) WMS WMS n1 n2 ค่า t ที่คํานวณได้ จะนําไปเปิดตารางสถิติ t-Distribution (ตาราง ส 5) เพ่ือหาค่า p-value ต่อไป ค่า p-value ที่ได้นําไปเปรียบเทียบกับ /จํานวนคู่ เป็นการปรับระดับนัยสําคัญ เรียกว่า วิธีบอน เฟอร์โรนี (Bonferroni method) สาํ หรับการเปรียบเทยี บรายคู่ด้วยวธิ อี ื่นๆ ดังกล่าวขา้ งตน้ นสิ ิตจะไดเ้ รียนรจู้ ากภาคปฏิบัติ ~ 129 ~
ชวี สถติ สิ าํ หรบั สาธารณสุข: หนว่ ยท่ี 11 การเปรยี บเทียบคา่ เฉล่ียประชากรมากกวา่ สองกลุ่ม ตัวอย่างที่ 1 ต้องการเปรียบเทียบประสิทธิผลของวิธีการสอนสุขศึกษา 3 วิธี โดยจําแนกตามห้องเรียน ห้อง 1 สอนวิธีที่ 1 มีตัวอย่าง 5 คน ห้อง 2 สอนวิธีที่ 2 มีตัวอย่าง 5 คน และ ห้อง 3 สอนวิธีที่ 3 มี ตัวอยา่ ง 6 คน โดยวดั ความรู้หลังการสอน วิเคราะห์โจทย์ จากโจทย์ต้องการเปรียบเทียบค่าเฉลี่ยของคะแนนความรู้หลังการสอนสุขศึกษา 3 วิธี สามารถวเิ คราะห์ด้วยการวเิ คราะห์ความแปรปรวนทางเดียว (One way ANOVA) เนอื่ งจากประชากรมี 3 กลุ่ม และใช้ Bonferroni t-test ในการทดสอบความแตกต่างระหว่างคู่ เม่ือพบว่ามีอย่างน้อย 1 คู่ท่ี ตา่ งกัน แสดงวิธกี ารวเิ คราะหข์ ้อมูล ได้ดังน้ี คํานวณคา่ ตา่ งๆ ไดต้ ามตาราง กลุ่ม 1 กลมุ่ 2 กลมุ่ ท่ี 3 13.0 9.0 10.5 17.0 12.0 11.0 16.75 13.0 9.0 15.5 8.75 12.5 14.0 11.5 8.25 Yi . 76.25 54.25 12.0 Y.. 193.75 1174.8 602.81 63.25 Y2 680.56 i Y2 2458.19 j ij 5 5 15.25 10.85 6 j ij ni 3.55 10.54 Yi. 3 2.76 N 16 si2 1. ต้ังสมมติฐาน 0 : 1 2 3 4 HA : มี อยา่ งน้อยหนง่ึ คทู่ ่แี ตกตา่ งกนั 2. กําหนดระดบั นยั สาํ คัญ = 0.05 3. คํานวณค่าสถติ ิทดสอบและหาค่า p-value TSS Yij2 Y..2 N TSS 2458.19 193.752 16 TSS 112 ~ 130 ~
ชีวสถิติสําหรับสาธารณสขุ : หน่วยที่ 11 การเปรียบเทยี บคา่ เฉลีย่ ประชากรมากกว่าสองกลมุ่ BSS Yi.2 Y..2 ni N i BSS 76.252 54.252 63.252 193.752 5 5 6 16 BSS 71.99 นําคา่ ใสใ่ นตารางการวิเคราะหค์ วามแปรปรวนทางเดยี วไดด้ ังนี้ แหลง่ ความ ช้นั ความ ผลรวมของส่วน สว่ นเบย่ี งเบนกําลงั สองเฉลี่ย สถิตทิ ดสอบ แปรปรวน เปน็ อสิ ระ เบีย่ งเบนกําลังสอง (MS) F ระหว่างกลุ่ม (df) (SS) BMS BSS 71.99 36 F BMS (B) k-1 71.99 k 1 2 WMS 3-1=2 ภ าย ใน ก ลุ่ ม 40.01 40.01 36 (W) N-k 13 3.08 รวม (T) 16-3=13 112 WMS WSS 3.08 nk 11.7 N-1 16-1=15 นาํ ค่า F = 11.7 (df1=2, df2=13) เปิดตาราง F-distribution (ตาราง ส 7) ได้คา่ p-value < 0.005 4. เปรยี บเทยี บค่า p-value กบั ระดบั นยั สําคัญ p-value < 0.005 ซึ่งมีคา่ น้อยกวา่ ระดับนยั สาํ คัญ (=0.05) 5. ตดั สนิ ใจและสรุปผล ปฎิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังน้ัน สรุปได้ว่า ค่าเฉลี่ยของคะแนนความรู้ภายหลัง การสอน 3 วธิ ี มอี ยา่ งนอ้ ย 1 คู่ ทีแ่ ตกต่างกนั อย่างมีนัยสาํ คัญทางสถิติ (p-value < 0.05) เมื่อพบวา่ มอี ยา่ งน้อย 1 คทู่ ่ตี ่างกันอย่างมนี ัยสําคญั ทางสถิติ จะต้องหาตอ่ วา่ มคี ไู่ หนที่ตา่ งกนั บา้ ง ดังน้ี เปรียบเทยี บความแตกตา่ งระหวา่ งคู่ ดว้ ย Bonferroni t-test จากสูตร tNk x1 x2 WMS WMS n1 n2 คาํ นวณค่าความแตกตา่ งระหวา่ งกลุ่ม ไดด้ งั น้ี กลุม่ 1 กับ 2 t13 15.25 10.85 5 3.96 เปิดตาราง ส 5 ได้ค่า p-value < 0.005 3.08 / 5 3.08 / กลุ่ม 1 กับ 3 t13 15.25 10.54 6 4.43 เปดิ ตาราง ส 5 ไดค้ า่ p-value < 0.0005 3.08 / 5 3.08 / ~ 131 ~
ชีวสถิติสาํ หรับสาธารณสขุ : หน่วยที่ 11 การเปรยี บเทียบคา่ เฉล่ียประชากรมากกวา่ สองกลมุ่ กลมุ่ 2 กับ 3 t13 10.85 10.54 6 0.29 เปดิ ตาราง ส 5 ได้คา่ p-value > 0.1 3.08 / 5 3.08 / จากการเปรียบเทียบความแตกต่างทีละคู่ รวม 3 คู่ ถา้ กําหนดให้ = 0.05 ในการพิจารณาว่าแต่ละ คูม่ ีความแตกตา่ งอยา่ งมีนยั สาํ คญั ทางสถิตหิ รือไมน่ นั้ ตอ้ งเทียบกับ /จาํ นวนคู่ เทา่ กบั 0.05/3 = 0.017 ดังน้ันจะได้ว่า มี 2 คู่ ที่มีความแตกต่างกันอย่างมีนัยสําคัญทางสถิติ นั่นคือ ประสิทธิผลของการสอน สุขศึกษาวิธีที่ 1 กับ 2 และวิธีที่ 1 กับ 3 แตกต่างกันอย่างมีนัยสําคัญทางสถิติ ท่ีระดับนัยสําคัญรวมของ การทดสอบรวมไม่เกนิ 0.05 (p-value < 0.005) ---------------------------------------------------------------------------------------------------------------------- เฉลยแบบฝกึ หดั 1. นกั วิจัยทําการทดลองเพ่ือเปรยี บเทยี บวธิ รี ักษาสวิ 3 วธิ ี ไดแ้ ก่ วิธที ่ี 1 ล้างหนา้ วันละ 2 ครัง้ ด้วย Polyethylene กบั สบู่ ก และกนิ ยาปฏชิ ีวนะวนั ละ 250 mg วิธีที่ 2 ทาครีมกันสิว หลีกเลี่ยงแสงแดด ล้างหน้าวันละ 2 คร้ัง ด้วยสบู่ ข และทางยาปฏิชีวนะ วนั ละ 250 mg วิธที ่ี 3 ไม่ใหโ้ ดนน้ํา ล้างหน้าด้วยครีมลา้ งหนา้ ทาครมี กันสิว และใช้ benzoyl peroxide ทําการทดลองกับผู้ท่ีเป็นสิวค่อนข้างมาก จํานวน 35 คน โดยแบ่งเป็น 3 กลุ่ม จํานวน 10, 12 และ 13 คน เพื่อรับวิธีรักษาสิวที่ 1, 2 และ 3 ตามลําดับ เมื่อครบ 16 สัปดาห์ บันทึกผลการรักษา โดยคิดเป็น เปอร์เซ็นตป์ ริมาณสิวทล่ี ดลง ผลการทดลองปรากฏดงั ตาราง ตาราง แสดงเปอร์เซ็นต์ปริมาณสิวท่ีลดลงจากการทดลองวิธีการรักษาสิวท่ีแตกต่างกัน 3 วิธี ในตัวอย่าง จํานวน 35 คน วธิ ีท่ี 1 วธิ ที ่ี 2 วธิ ที ี่ 3 48.6 50.8 68.0 71.9 67.5 61.4 49.4 47.1 67.0 71.5 62.5 67.4 50.1 52.5 70.1 69.9 64.2 65.4 49.8 49.0 64.5 68.9 62.5 63.2 50.6 46.7 68.0 67.8 63.9 61.2 68.3 68.9 64.8 60.5 62.3 กําหนดให้ข้อมูลแต่ละกลุ่มมีการแจกแจงแบบปกติ และมีความแปรปรวนระหว่างกลุ่มเท่ากัน จง เปรียบเทียบเปอร์เซ็นต์ปริมาณสิวที่ลดลงจากการทดลองรักษาสิว 3 วิธี กําหนดระดับนัยสําคัญท่ีระดับ 0.05 ~ 132 ~
ชีวสถิติสําหรับสาธารณสุข: หนว่ ยท่ี 11 การเปรียบเทยี บคา่ เฉลย่ี ประชากรมากกว่าสองกล่มุ Yi. วธิ ีท่ี 1 วิธที ่ี 2 วธิ ที ่ี 3 Y.. 2,146.2 48.6 50.8 68.0 71.9 67.5 61.4 Y2 49.4 47.1 67.0 71.5 62.5 67.4 i Y2 133,868.9 j ij 50.1 52.5 70.1 69.9 64.2 65.4 49.8 49.0 64.5 68.9 62.5 63.2 j ij 50.6 46.7 68.0 67.8 63.9 61.2 ni 68.3 68.9 64.8 60.5 N = 35 494.6 62.3 Yi 24,489.92 824.8 56,735.3 826.8 S 2 10 52,643.7 i 49.46 12 68.73 13 3 4 63.6 4.94 วธิ ที ํา 1. ต้งั สมมตฐิ าน H0: คา่ เฉลย่ี ของเปอร์เซ็นต์ปรมิ าณสวิ ท่ีลดลงเมื่อได้รับการรักษาวธิ ีท่ี 1, 2 และ 3 ไมต่ ่างกนั (1 = 2 = 3) HA: คา่ เฉลีย่ ของเปอร์เซน็ ต์ปรมิ าณสวิ ทล่ี ดลงเมือ่ ได้รับการรักษาทั้ง 3 วิธี แตกตา่ งกันอย่าง นอ้ ย 1 คู่ (i = j อย่างนอ้ ย 1 ค่)ู 2. กําหนดระดบั นยั สําคัญ = 0.05 3. คาํ นวณคา่ สถิติทดสอบและหาคา่ p-value TSS Yij2 Y..2 N TSS 133,868.9 2,146.2 2 35 TSS 2,263.96 BSS Yi.2 Y..2 ni N i 494.6 2 824.82 826.82 2,146.2 2 10 12 13 35 BSS BSS 2,133.67 WSS = TSS – BSS WSS = 2,263.96 – 2,133.67 WSS = 130.29 ~ 133 ~
ชวี สถิติสําหรบั สาธารณสขุ : หน่วยที่ 11 การเปรียบเทยี บคา่ เฉลย่ี ประชากรมากกว่าสองกลมุ่ นําคา่ TSS, BSS และ WSS ใส่ในตาราง One-Way ANOVA แหล่งความ ช้ันความเปน็ อสิ ระ ผลรวมของสว่ น สว่ นเบ่ียงเบน สถิติทดสอบ แปรปรวน (df) เบ่ยี งเบนกําลงั สอง กําลังสองเฉลยี่ F (SS) (MS) ระหวา่ งกล่มุ 2 2,133.67 1,066.84 262. 12 ภายในกลุ่ม 32 130.29 4.07 รวม 34 2,263.96 นาํ ค่า F = 262.12 (df1=2, df2=32) เปดิ ตาราง F distribution (ส 7) ได้คา่ p-value < 0.005 4. เปรยี บเทียบค่า p-value กบั ระดับนัยสําคญั p-value < 0.005 ซึ่งมีคา่ นอ้ ยกว่าระดบั นัยสาํ คัญ (=0.05) 5. ตัดสนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 ดังนั้น สรุปได้ว่า ค่าเฉล่ียของเปอร์เซ็นต์ปริมาณสิว ท่ีลดลงเมื่อได้รับการรักษาท้ัง 3 วิธี มีอย่างน้อย 1 คู่ ที่แตกต่างกันอย่างมีนัยสําคัญทางสถิติ (p-value < 0.005) เมื่อพบว่า ค่าเฉลี่ยของเปอร์เซ็นต์ปริมาณสิวที่ลดลงเม่ือได้รับการรักษาท้ัง 3 วิธี มีอย่างน้อย 1 คู่ ท่ี แตกต่างกนั ดังนนั้ จึงเปรยี บเทยี บความแตกต่างระหวา่ งคู่ ด้วย Bonferroni t-test ดังน้ี x1 x2 tNk WMS WMS n1 n2 ค่ทู ี่ ระหว่างกลุม่ t P-value 1 1 กบั 2 t32 49.46 68.73 22.31 < 0.0005 4.07 /10 4.07 /12 2 1 กบั 3 t32 49.46 63.6 /13 16.66 < 0.0005 4.07 4.07 /10 3 2 กบั 3 t32 68.73 63.6 6.35 < 0.0005 4.07 4.07 /12 /13 จากการเปรียบเทียบความแตกต่างทีละคู่ รวม 3 คู่ กําหนดให้ = 0.05 ดังน้ันในการพิจารณา วา่ แตล่ ะคมู่ คี วามแตกต่างอยา่ งมีนัยสําคญั ทางสถติ ิหรือไมจ่ ะตอ้ งเทยี บกับ 0.05/3 = 0.0166 p-value ของคู่ท่ี 1, 2 และ 3 นอ้ ยกว่า 0.0005 ซึง่ น้อยกว่า 0.0166 ทกุ คู่ ดังนน้ั จะไดว้ ่า ทัง้ 3 คู่ มีความแตกต่างกันอย่างมีนัยสําคัญทางสถิติ สรุปได้ว่า ค่าเฉล่ียของเปอร์เซ็นต์ปริมาณสิวท่ีลดลงเม่ือได้รับ การรักษาระหว่างวิธีต่างๆ (ระหว่างวิธีที่ 1 และ 2, ระหว่างวิธีที่ 1 และ 3, ระหว่างวิธีท่ี 2 และ 3) แตกต่างกันอย่างมีนัยสําคัญทางสถิติ ที่ระดับนัยสําคัญรวมของการทดสอบรวมไม่เกิน 0.05 (p-value < 0.0005) ~ 134 ~
ชวี สถติ ิสาํ หรับสาธารณสขุ : หน่วยท่ี 12 สหสัมพันธ์และสมการถดถอยเชิงเสน้ อย่างง่าย หน่วยท่ี 12 สหสัมพนั ธแ์ ละสมการถดถอย เชิงเสน้ อย่างง่าย วัตถุประสงค:์ หลังจากจบการเรียนในหวั ข้อนแ้ี ลว้ นิสิตสามารถ 1. ทราบแนวคิดของสมั ประสิทธ์สิ หสมั พนั ธ์ และสมการถดถอยเชิงเสน้ อย่างง่าย 2. ทราบข้อตกลงเบ้ืองตน้ ของสมั ประสิทธิ์สหสัมพันธ์ และสมการถดถอยเชิงเสน้ อย่างง่าย 3. คํานวณค่าสัมประสิทธิ์สหสัมพันธ์ ช่วงเชื่อมั่น และทดสอบสมมติฐานเกี่ยวกับค่าสัมประสิทธิ์ สหสมั พันธ์ได้ 4. คํานวณค่าสัมประสิทธ์ิการถดถอย ค่า Coefficient of determination และกําหนดตัวแบบ (model) สมการถดถอยเชงิ เสน้ ได้ เนื้อหา: สหสัมพนั ธ์และสมการถดถอยเชิงเสน้ อยา่ งง่าย 1. สัมประสิทธสิ์ หสัมพนั ธ์ 1.1 ข้อตกลงเบอื้ งตน้ 1.2 การคํานวณค่าสัมประสิทธส์ิ หสัมพนั ธ์ 1.3 การประมาณค่าสมั ประสิทธสิ์ หสมั พันธ์ 1.4 การทดสอบสมมติฐาน 2. สมการถดถอยเชงิ เส้นอย่างงา่ ย 2.1 ขอ้ ตกลงเบือ้ งตน้ 2.2 ตัวแบบการถดถอยเชิงเส้นอยา่ งงา่ ย 2.3 การประมาณค่าของตวั แบบการถดถอยเชงิ เสน้ อย่างงา่ ย 2.4 การประเมินสมการถดถอยดว้ ย Coefficient of determination (r2) 2.5 การทดสอบความสมั พนั ธ์เชงิ เส้นระหว่างสองตัวแปร 2.6 การนาํ สมการถดถอยไปใช้ รูปแบบการเรยี นการสอน: การเรยี นรแู้ บบรว่ มมอื 1. ผเู้ รยี นแต่ละคนศึกษาเนอ้ื หาตามหวั ขอ้ บรรยายจากเอกสารประกอบการสอนและสรุปเปน็ แผนผัง ความคิด (Mind map) ก่อนเข้าชนั้ เรยี น 2. แบ่งกลุ่มการเรียน เช็คช่ือสมาชิกภายในกลุ่ม และอภิปรายเน้ือหาตามที่ได้รับมอบหมายภายใน กลมุ่ และภายในชน้ั เรยี น 3. สรปุ เน้อื หาโดยอาจารยผ์ ้สู อน 4. ผ้เู รียนแต่ละกลุ่มคดิ โจทย์แบบฝึกหดั พรอ้ มเฉลยหลงั จากจบบทเรยี น และส่งภายในสัปดาหถ์ ดั ไป ~ 135 ~
ชีวสถิตสิ าํ หรับสาธารณสขุ : หนว่ ยที่ 12 สหสัมพันธ์และสมการถดถอยเชิงเสน้ อย่างง่าย เนื้อหาในหน่วยท่ีผ่านมาเป็นการเปรียบเทียบค่าเฉลี่ยระหว่างประชากร ไม่ว่าจะเป็น 1 กลุ่ม 2 กลุ่ม หรือมากกว่า 2 กลุ่ม ซึ่งบางกรณีสมมติฐานของงานวิจัยไม่ได้ต้องการเปรียบเทียบค่าเฉลี่ย แต่เป็นใน ลักษณะทต่ี ้องการทราบความสัมพนั ธ์ระหว่างข้อมูลเชงิ ปรมิ าณ การอธิบายความสัมพันธร์ ะหวา่ งขอ้ มูลเชิง ปริมาณดังกล่าวสามารถสามารถแสดงความสัมพันธ์ในรูปแบบค่าสัมประสิทธ์ิ (Coefficient) เรียกว่าการ วิเคราะห์สหสัมพันธ์อย่างง่าย (Simple Correlation Analysis) ซ่ึงเป็นการศึกษาความสัมพันธ์เชิงเส้น ระหว่างสองตัวแปร ในรูปของค่าสัมประสิทธ์ิสหสัมพันธ์ โดยในทางทฤษฎียังจําแนกไม่ได้ว่าตัวใดเป็นตัว แปรตามหรือตัวแปรอิสระ เช่น ความสัมพันธ์ระหว่างคะแนนสุขภาพกายกับสุขภาพจิต (กายส่งผลต่อจิต และจิตส่งผลตอ่ กาย) หรือหากในทางทฤษฎีสามารถจําแนกได้วา่ ตัวแปรใดเป็นตัวแปรอิสระซึ่งส่งผลต่อตัว แปรตามชัดเจน อาจแสดงด้วยสมการทางคณิ ตศาสตร์เชิงเส้นตรงอย่างง่าย (Simple Linear Regression) ซึ่งเป็นการหาความสัมพันธ์ในรูปสมการเชิงเส้นระหว่างตัวแปรตาม (Y) และตัวแปรอิสระ (X) อยา่ งละ 1 ตัวแปร เชน่ ความสมั พนั ธร์ ะหวา่ งอายุกบั ความดันโลหติ สรปุ ดังภาพที่ 12.1 ภาพที่ 12.1 แนวทางการวเิ คราะห์ขอ้ มูลเชงิ ปริมาณ 1. สมั ประสทิ ธส์ิ หสัมพนั ธ์ เป็นการแสดงความสัมพันธ์เชิงเส้นระหว่างตัวแปรเชิงปริมาณ 2 ตัวแปร โดยแสดงด้วยค่า สัมประสิทธิ์สหสัมพันธ์ (Coefficient Correlation) สัมประสิทธิ์สหสัมพันธ์ในประชากร แทนด้วย (โรห์) สัมประสิทธ์ิสหสัมพันธ์ในตัวอย่าง แทนด้วย r ซ่ึงเสนอขึ้นโดยเพียร์สัน (Pearson) ดังนั้นบางครั้ง อาจเรยี กว่า สหสมั พนั ธข์ องเพยี รส์ นั (Pearson Correlation) มีค่าตัง้ แต่ -1 ถึง +1 ดังนี้ โดยท่ี > 0 (+) หมายถงึ ตวั แปรสองตวั มีความสมั พันธ์ในทิศทางเดียวกนั < 0 (-) หมายถึง ตัวแปรสองตวั มคี วามสัมพนั ธใ์ นทศิ ทางตรงข้ามกนั = 0 หมายถึง ตัวแปรสองตัวไม่มีความสัมพันธ์เชิงเส้นตอ่ กนั เข้าใกล้ +1 หรือ -1 แสดงวา่ มีความสมั พันธก์ ันอยา่ งมาก เข้าใกล้ 0 แสดงว่ามีความสัมพนั ธ์กนั นอ้ ย แสดงตวั อย่างดว้ ย Scatter plot ซ่ึงเป็นกราฟแสดงความสมั พนั ธ์ระหว่างตัวแปรเชงิ ปริมาณ 2 ตัวแปร ท่ีค่า ตา่ งๆ ได้ดงั ภาพท่ี 12.2 ~ 136 ~
ชวี สถติ สิ ําหรับสาธารณสุข: หน่วยท่ี 12 สหสมั พันธแ์ ละสมการถดถอยเชงิ เสน้ อย่างง่าย ภาพที่ 12.2 ตวั อย่าง Scatter plot ที่คา่ ตา่ งๆ 1.1 ข้อตกลงเบื้องตน้ ข้อมูลท่จี ะนํามาวเิ คราะห์สหสมั พนั ธค์ วรมีลกั ษณะดงั นี้ 1) ท่แี ต่ละคา่ ของตวั แปร X ตัวแปร Y มีการแจกแจงแบบปกติ 2) ท่แี ตล่ ะคา่ ของตัวแปร Y ตัวแปร X มีการแจกแจงแบบปกติ 3) ความแปรปรวนของตวั แปร Y ที่แต่ละคา่ ของตวั แปร X มคี วามแปรปรวนเท่ากนั คือ 2 4) ความแปรปรวนของตวั แปร X ที่แต่ละค่าของตวั แปร Y มคี วามแปรปรวนเทา่ กัน คอื 2 5) การแจกแจงรว่ มของตัวแปร X และ Y เป็น Bivariate normal distribution (ภาพที่ 12.3) Bivariate normal distribution Univariate normal distribution ท่มี า: http://personal.kenyon.edu/hartlaub/MellonProject/Bivariate2.html ภาพท่ี 12.3 Bivariate normal distribution และ Univariate normal distribution ~ 137 ~
ชีวสถติ สิ ําหรับสาธารณสุข: หน่วยที่ 12 สหสัมพันธแ์ ละสมการถดถอยเชิงเสน้ อย่างง่าย 1.2 การคํานวณคา่ สัมประสทิ ธ์ิสหสมั พนั ธ์ ค่าสัมประสิทธ์สิ หสมั พันธ์ของตวั อย่างคาํ นวณได้จากสตู ร r SXY ........................................................................................................................(1) S XX SYY โดยที่ S XY XY X Y n SXX X2 X2 n SYY 2 Y2 Y n ตัวอย่าง ข้อมูลอายุและความดัน Systolic ของตัวอย่างผู้ป่วยท่ีมารับบริการท่ีโรงพยาบาลแห่งหนึ่ง จาํ นวน 10 ราย เป็นดังนี้ อายุ 15 17 25 30 37 49 52 56 58 67 Systolic 115 118 118 120 127 142 145 148 149 158 วิธที าํ คํานวณค่าสมั ประสทิ ธส์ิ หสมั พนั ธ์ได้ดังนี้ อายุ (X) ความดันโลหิต (Y) XY X2 Y2 13225 15 115 1725 225 13924 289 13924 17 118 2006 625 14400 16129 25 118 2950 20164 30 120 3600 900 21025 1369 21904 37 127 4699 22201 49 142 6958 2401 24964 52 145 7540 2704 Yi2 181860 56 148 8288 3136 58 149 8642 3364 67 158 10586 4489 X i 406 Yi 1340 X iYi 56994 X 2 19502 Xi 2 164836 Yi 2 1795600 i จะได้ ~ 138 ~
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214