ชวี สถติ ิสําหรับสาธารณสุข: หนว่ ยที่ 12 สหสัมพันธแ์ ละสมการถดถอยเชิงเส้นอย่างง่าย S XY X iYi Xi Yi SXX X 2 Xi 2 i n n S XY 56994 4061340 S XX 19502 164836 10 10 S XY 2590 S XX 3018 SYY Yi 2 r S XY Yi2 n S XX SYY SYY 181860 1795600 r 2590 10 3018 2300 SYY 2300 r 0.98 r = 0.98 นั่นคือข้อมูลอายุและความดันโลหิตมีค่าสัมประสิทธ์ิสหสัมพันธ์ เท่ากับ 0.98 แสดงว่าอายุ และความดนั Systolic มีความสมั พันธก์ ันในทิศทางบวกอยา่ งมาก ----------------------------------------------------------------------------------------------------------------------- 1.3 การประมาณคา่ สมั ประสทิ ธส์ิ หสัมพันธ์ การประมาณค่าช่วงเช่ือม่ัน (1-)100% ของ ต้องแปลงให้อยู่ในรูปของค่า Z(r) เน่ืองจากค่า r มี ขีดจาํ กัด (-1 , +1) การแปลงนเ้ี รยี กว่า Fisher’s Z transformation ดงั น้ี 95%CIของ Z Zr Z 2 1 .............................................................................................(2) n3 เม่อื Zr 1 ln 11 r 2 r r คอื คา่ สมั ประสิทธิส์ หสัมพนั ธ์ของตวั อยา่ ง, ln คอื loge (ลอกการทิ ึมฐานธรรมชาติ) แปลงกลับเป็นค่า r โดย r e2Zr 1 e2Zr 1 เมือ่ e คือ Exponential หรอื anti (loge) = 2.71828 1.4 การทดสอบสมมติฐาน สมมติฐานทางสถติ สิ ําหรบั การวิเคราะห์สมั ประสทิ ธิส์ หสมั พนั ธต์ ัง้ วา่ H0: ตวั แปร X1 และตวั แปร X2 ไม่มีความสมั พนั ธเ์ ชิงเส้นต่อกนั ( = 0) HA: ตัวแปร X1 และตวั แปร X2 มีความสัมพนั ธเ์ ชิงเสน้ ตอ่ กัน ( 0) การทดสมสมมตฐิ านใชส้ ถติ ิ t ดงั นี้ t r 1nr22;df n 2 ....................................................................................................(3) ข้อควรระวัง: กรณีทดสอบแล้วได้ = 0 ไม่ได้หมายความว่าตัวแปร 2 ตัวไม่มีความสัมพันธ์ต่อกัน แต่อาจมีความสัมพันธ์กันแบบอ่ืนท่ีไม่ใช่เชิงเส้นตรง ดังนั้นจึงควรพิจารณาความสัมพันธ์ด้วย Scatter plot กอ่ นเสมอ ~ 139 ~
ชวี สถิตสิ ําหรับสาธารณสขุ : หน่วยท่ี 12 สหสัมพันธแ์ ละสมการถดถอยเชงิ เส้นอย่างง่าย ตัวอย่าง ข้อมูลอายุและความดัน Systolic ของตัวอย่างผู้ป่วยท่ีมารับบริการที่โรงพยาบาลแห่งหน่ึง จาํ นวน 10 ราย ต้องการทดสอบความสมั พนั ธร์ ะหว่างอายแุ ละความดัน Systolic ทีร่ ะดับนัยสําคัญ 0.05 วิธที าํ 1. ตง้ั สมมตฐิ าน H0: อายกุ บั ความดันโลหิตไมม่ ีความสัมพันธ์เชิงเสน้ ตอ่ กนั ( = 0) HA: อายกุ บั ความดนั โลหิตมีความสัมพันธเ์ ชิงเส้นตอ่ กนั ( 0) 2. กาํ หนดระดับนยั สาํ คัญ = 0.05 3. คํานวณคา่ สถิติทดสอบและหาค่า p-value (เปดิ ตาราง ส 5) t r 1nr22; df n 2 t 0.98 10 2 ; df 10 2 1 0.982 t 13.93; df 8 4. เปรยี บเทยี บคา่ p-value กบั ระดับนัยสําคัญ p-value < 0.0005 นอ้ ยกวา่ ระดับนยั สาํ คัญ /2 = 0.025 5. ตัดสนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ท่ีระดับนัยสําคญั 0.05 ดงั น้ัน สรุปได้ว่าอายุกับความดันโลหิตมีความสัมพันธ์ เชงิ เส้นตอ่ กันอยา่ งมนี ยั สาํ คญั ทางสถติ ิ (p-value < 0.0005) ---------------------------------------------------------------------------------------------------------------------- 2. สมการถดถอยเชงิ เส้นอย่างง่าย เป็นการแสดงความสัมพันธ์เชิงเส้นระหว่างตัวแปรเชิงปริมาณ 2 ตัวแปร โดยแสดงด้วยสมการถดถอย เชิงเส้นตรง (Linear regression) ซ่งึ สามารถจาํ แนกไดอ้ ะไรคือตวั แปรอสิ ระ (X) อะไรคอื ตัวแปรตาม (Y) จากข้อมูลอายุและความดัน Systolic ของตัวอย่างผู้ป่วยท่ีมารับบริการที่โรงพยาบาลแห่งหนึ่ง จํานวน 10 ราย นาํ มาสร้างเสน้ สมการถดถอยไดด้ งั ภาพท่ี 12.4 age ภาพท่ี 12.4 เสน้ สมการถดถอยของข้อมูลอายแุ ละความดัน Systolic ของตวั อย่างจํานวน 10 ราย ~ 140 ~
ชีวสถติ สิ าํ หรับสาธารณสขุ : หน่วยที่ 12 สหสัมพันธ์และสมการถดถอยเชงิ เส้นอย่างงา่ ย 2.1 ข้อตกลงเบอ้ื งตน้ 1) ตัวแปรอสิ ระ X เปน็ ค่าคงท่ี กําหนดคา่ ได้ (X ไม่เปน็ ตัวแปรส่มุ ) 2) ทีแ่ ต่ละค่าของตัวแปรอิสระ X มกี ารแจกแจงของตวั แปรตาม Y เป็นแบบปกติ 3) ความแปรปรวนของตวั แปรตาม Y มคี า่ เท่ากนั ท่ีแต่ละค่าของตัวแปรอิสระ X 4) คา่ เฉล่ียของตัวแปรตาม Y ทแี่ ต่ละค่าของตวั แปรอิสระ X อยู่บนเส้นตรงเดยี วกัน 5) ตัวแปรตาม Y เป็นอสิ ระต่อกัน 2.2 ตวั แบบการถดถอยเชงิ เส้นอย่างง่าย Yi = A+BXi+Ei หรอื Yi = a+bXi+ei ………………………………………………………………………………………………..(4) เมื่อ A (a) และ B (b) คอื สมั ประสิทธิ์สมการถดถอย E (e) ความคลาดเคล่อื นของเสน้ สมการถดถอย สามารถบอกทิศทางความสัมพนั ธจ์ ากคา่ B ซึง่ มคี ่า ตง้ั แต่ - ถงึ + ไดด้ ังนี้ 1) B (b) > 0 (+) หมายถึง X และ Y มคี วามสมั พนั ธ์ในทศิ ทางเดยี วกัน (ภาพที่ 12.5 ก) 2) B (b) < 0 (-) หมายถงึ X และ Y มีความสมั พันธใ์ นทศิ ทางตรงขา้ มกัน (ภาพที่ 12.5 ข) 3) B (b) = 0 หมายถงึ X และ Y ไมม่ คี วามสัมพันธ์เชงิ เสน้ ตอ่ กนั (ภาพที่ 12.5 ค) (ก) (ข) (ค) ภาพที่ 12.5 การแสดงความสมั พนั ธด์ ้วยสัมประสทิ ธ์ิสมการถดถอยเชงิ เสน้ ตรง 2.3 การประมาณค่าของตัวแบบการถดถอยเชิงเส้นอยา่ งง่าย จากสมการถดถอยเชิงเสน้ ตรง Yi = a+bXi+ei มวี ธิ กี ารหาค่า a และ b ที่ทาํ ให้ e มีคา่ น้อยทสี่ ดุ ดังน้ี a Y bx …………………………………………………………………………………………………………..(5) b S XY ………………………………………………………………………………………………………….(6) S XX เม่ือ S XY X iYi Xi Yi n SXX X 2 Xi 2 i n ~ 141 ~
ชวี สถติ ิสําหรับสาธารณสุข: หน่วยท่ี 12 สหสัมพันธแ์ ละสมการถดถอยเชงิ เสน้ อย่างงา่ ย ตัวอย่าง จากข้อมูลอายุและความดัน Systolic ของตัวอย่างผู้ป่วยที่มารับบริการท่ีโรงพยาบาลแห่งหน่ึง จํานวน 10 ราย ต้องการสรา้ งสมการถดถอย SXX Xi Yi 2 วิธที าํ S XY X iYi X 2 n i Xi n S XY 56994 4061340 S XX 19502 164836 10 10 จะได้ S XY 259S0XY , a Y bx SXX 3018 b S XX a 134 (0.86 40.6) 2590 b 3018 a 99.08 b 0.86 จากสมการถดถอยเชิงเส้นตรง Yi = a+bXi+ei ดงั นนั้ จะได้สมการถดถอยของขอ้ มลู อายแุ ละความดันโลหิตของตัวอย่างจํานวน 10 คน ดังน้ี Yi = 99.08 + 0.86Xi + ei ตอบ ----------------------------------------------------------------------------------------------------------------------- 2.4 การประเมนิ สมการถดถอยดว้ ย Coefficient of determination (r2 / R2) เม่ือหาสมการถดถอยได้แล้วก่อนที่จะนําสมการถดถอยไปประมาณค่าตัวแปรตาม Y นั้น จะต้อง ประเมินว่าสมการถดถอยอธิบายการเปลี่ยนแปลงของตัวแปรตาม Y ได้ดีแค่ไหน วิธีการหนึ่ง คือ ดูจากค่า Coefficient of determination (r2/ R2) ซง่ึ คํานวณไดจ้ ากสูตร ดงั น้ี r2 b2 S XX ......................................................................................................................(7) SYY เม่ือ SXX X 2 2 i Xi n SYY 2 Yi2 Yi n การแปลความหมายของค่า r2 r2 เข้าใกล้ 1 แสดงว่าสมการถดถอยใชไ้ ดด้ ี r2 เข้าใกล้ 0 แสดงวา่ สมการถดถอยใช้ไดไ้ มด่ ี ตัวอย่าง จากสมการถดถอย Yi = 99.08 + 0.86Xi + ei ของข้อมูลอายุและความดัน Systolic ของ ตวั อย่างผปู้ ่วยท่มี ารับบรกิ ารทีโ่ รงพยาบาลแห่งหนึ่ง จาํ นวน 10 ราย ต้องการประเมินสมการถดถอย วธิ ีทํา SXX 2 SYY 2 b S XY 2 Yi2 S XX X i Xi , Yi , n n S XX 19502 164836 SYY 181860 1795600 b 2590 10 10 3018 S XX 3018 SYY 2300 b 0.86 ~ 142 ~
ชีวสถติ สิ าํ หรบั สาธารณสุข: หนว่ ยท่ี 12 สหสมั พันธ์และสมการถดถอยเชิงเส้นอย่างงา่ ย จาก r2 b2 S XX จะได้ r2 b2 S XX SYY SYY r2 0.862 3018 2300 r 2 0.97 จากการประเมินสมการถดถอยด้วย r2 ได้ค่า r2 = 0.97 หมายความว่า สมการถดถอยซ่ึงสร้างจาก ข้อมูลอายุมีความสามารถในการทํานายตัวแปรตามคือความดันโลหิตได้เท่ากับ 97% ซึ่งแสดงว่าสมการ ถดถอยนม้ี ีความสามารถในการทาํ นายความดันโลหติ ไดด้ ี ตอบ ----------------------------------------------------------------------------------------------------------------------- 2.5 การทดสอบความสัมพันธ์เชิงเส้นระหวา่ งสองตวั แปร เป็นการทดสอบค่า Regression coefficient (B หรือ) หรือความชัน (slope) ของสมการ ถดถอยในประชากรวา่ มีคา่ เทา่ กบั ศูนย์หรอื ไม่ สมมติฐานทางสถิติสําหรับการทดสอบความสัมพันธ์ด้วยสมการถดถอยตั้งได้เช่นเดียวกับการ ทดสอบค่าสัมประสทิ ธิส์ หสมั พนั ธ์ น่ันคือ ต้ังว่า H0: ตัวแปร X และตวั แปร Y ไม่มคี วามสัมพนั ธ์เชิงเส้นตอ่ กัน ( = 0) HA: ตัวแปร X และตัวแปร Y มคี วามสัมพันธ์เชงิ เสน้ ตอ่ กนั ( 0) สถติ ิทใี่ ชท้ ดสอบ คอื สถิติ t ซึ่งคาํ นวณได้จากสูตร t b B ;df n 2 ...........................................................................................................(8) Sb โดยท่ี Sb SY2 X S XX SY2 X SYY b2 S XX n2 SYY 2 Yi2 Yi n SXX X 2 2 i Xi n ตัวอย่าง จากสมการถดถอย Yi = 99.08 + 0.86Xi + ei ของข้อมูลอายุและความดัน Systolic ของ ตัวอย่างผู้ป่วยที่มารับบริการท่ีโรงพยาบาลแห่งหนึ่ง จํานวน 10 ราย ต้องการทดสอบความสัมพันธ์ ระหวา่ งอายแุ ละความดันโลหติ ในประชากร (ค่า B ในประชากรวา่ มีค่าเทา่ กบั ศูนย์หรอื ไม)่ วิธีทํา 1. ตง้ั สมมตฐิ าน H0: อายุกบั ความดันโลหติ ไม่มีความสมั พันธ์เชิงเส้นตอ่ กัน ( = 0) HA: อายุกับความดันโลหิตมคี วามสัมพนั ธเ์ ชิงเสน้ ต่อกัน ( 0) 2. กําหนดระดบั นัยสําคญั = 0.05 3. คํานวณคา่ สถติ ทิ ดสอบและหาคา่ p-value ~ 143 ~
ชีวสถติ ิสาํ หรับสาธารณสขุ : หน่วยท่ี 12 สหสัมพันธแ์ ละสมการถดถอยเชงิ เส้นอย่างงา่ ย SY2 X SY2 X SYY b2 S XX Sb S XX n2 SY2 X 2300 (0.862 3018) 8.49 10 2 Sb 3018 SY2 X 8.49 Sb 0.05 จะได้ t b B ; df n 2 Sb t 0.86 ; df 10 2 0.05 t 17.2; df 8 นําคา่ t=17.2, df=8 เปิดตารางการแจกแจงแบบ t (ตาราง ส 5) ได้คา่ p-value < 0.0005 4. เปรียบเทียบค่า p-value กับระดับนยั สาํ คญั p-value < 0.0005 น้อยกว่าระดับนยั สาํ คัญ /2 = 0.025 5. ตดั สินใจและสรุปผล ปฏิเสธสมมติฐาน H0 ท่ีระดบั นัยสําคัญ 0.05 ดังนั้น สรุปได้ว่าอายุกับความดันโลหิตมีความสัมพันธ์ เชงิ เสน้ ตอ่ กันอยา่ งมนี ยั สาํ คัญทางสถิติ (p-value < 0.0005) -------------------------------------------------------------------------------------------------------------------- 2.6 การนาํ สมการถดถอยไปใช้ เม่ือผลการทดสอบสมการถดถอย พบว่า มีความสัมพันธ์ระหว่างตัวแปรอิสระ X และตัวแปรตาม Y สามารถใช้สมการถดถอยในการประมาณค่าตัวแปรตาม Y ได้ โดยแทนค่าตัวแปรอิสระ X ลงในสมการ ถดถอย ข้อควรระวัง: ไม่นําสมการถดถอยมาใช้ประมาณค่าตัวแปรตาม Y ในกรณีที่ตัวแปรอิสระ X อยู่ นอกชว่ งของข้อมูลทีน่ ํามาสร้างสมการ ตัวอย่าง จากสมการถดถอย Yi = 99.08 + 0.86Xi + ei ของข้อมูลอายุและความดัน Systolic ของ ตัวอย่างผู้ป่วยท่ีมารับบริการที่โรงพยาบาลแห่งหน่ึง จํานวน 10 ราย ซ่ึงพบว่าอายุและความดันโลหิตมี ความสัมพันธ์เชิงเส้นตรงต่อกันอย่างมีนัยสําคัญทางสถิติที่ระดับ 0.05 ดังนั้นสามารถใช้สมการถดถอยใน การประมาณคา่ ความดนั โลหิตได้ ดงั นี้ ตอ้ งการทราบวา่ คนทีม่ อี ายุ 35 ปี (อยู่ในช่วงของ Xi คอื 15-67 ปี) จะมคี วามดันโลหิตเท่าไหร่ จากสมการถดถอย Yi = 99.08 + 0.86Xi Yi = 99.08 + (0.86 X 35) Yi = 129.18 ดงั นัน้ จะไดว้ ่า คนท่มี ีอายุ 35 ปี จะมีความดนั โลหติ เท่ากับ 129.18 mmHg ตอบ ----------------------------------------------------------------------------------------------------------------------- ~ 144 ~
ชีวสถติ สิ าํ หรับสาธารณสขุ : หน่วยที่ 12 สหสมั พันธแ์ ละสมการถดถอยเชิงเส้นอย่างงา่ ย เฉลยแบบฝกึ หดั พยาบาลเกบ็ ขอ้ มูลอายุครรภ์ของมารดา (สัปดาห์) และนํ้าหนักทารกแรกคลอด (กรมั ) ของตวั อย่างจาํ นวน 9 ราย ได้ผลดงั ตาราง อายคุ รรภ์ นํ้าหนกั ทารกแรกคลอด XiYi Xi2 Yi2 (สปั ดาห์) = Xi (กิโลกรัม) = Yi 3.0 108 1296 9 36 2.7 91.8 7.29 34 3.2 118.4 1156 10.24 37 2.3 73.6 5.29 32 3.6 140.4 1369 12.96 39 3.3 115.5 10.89 35 2.5 67.5 1024 6.25 27 2.2 55 4.84 25 2.7 89.1 1521 7.29 33 X iYi 1225 Yi2 =74.05 =859.3 729 625 1089 X i = 298 Yi = 25.5 X 2 i =10034 ใชข้ ้อมลู อายุครรภ์และนํ้าหนกั ทารกแรกคลอดในการวิเคราะหส์ หสมั พันธ์และการถดถอยเชิงเสน้ อย่างงา่ ย ดงั ต่อไปน้ี 1. จงสรา้ งสมการถดถอย 2. จงทดสอบสมมตฐิ านว่า = 0 หรอื ไมท่ ร่ี ะดับนยั สําคญั 0.05 3. จงคํานวณน้ําหนกั ทารกแรกคลอด เมื่ออายคุ รรภข์ องแม่เทา่ กบั 28, 30 และ38 สปั ดาห์ 4. จงคาํ นวณค่าสัมประสิทธสิ์ หสัมพันธ์ 5. จงทดสอบสมมติฐานว่า = 0 หรือไมท่ รี่ ะดบั นยั สําคญั 0.05 ~ 145 ~
ชวี สถิติสําหรับสาธารณสุข: หนว่ ยที่ 12 สหสัมพันธ์และสมการถดถอยเชงิ เส้นอย่างง่าย 1. จงสรา้ งสมการการถดถอย S XY X iYi X i Yi S XX X 2 Xi 2 n i n S XY 859.3 29825.5 S XX 10034 2982 9 9 S XY 14.97 S XX 166.89 b S XY a Y bx S XX a 2.83 (0.09 33.11) a 0.15 b 14.97 166.89 b 0.09 ดงั นั้นจะไดส้ มการถดถอย คอื Yi = -0.15 + 0.09Xi 2. จงทดสอบสมมตฐิ านว่า = 0 หรอื ไมท่ ่ีระดบั นัยสาํ คญั 0.05 1. ต้งั สมมติฐาน H0: อายคุ รรภ์กบั นาํ้ หนักทารกแรกคลอดไม่มคี วามสัมพนั ธ์เชงิ เสน้ ต่อกัน ( = 0) HA: อายุครรภ์กับนํ้าหนกั ทารกแรกคลอดมคี วามสัมพนั ธเ์ ชงิ เสน้ ต่อกนั ( 0) 2. กําหนดระดบั นัยสาํ คัญ = 0.05 3. คาํ นวณคา่ สถติ ทิ ดสอบและหาคา่ p-value S SYY Yi 2 2 SYY b 2 S XX Yi2 n Y n2 X 74.05 (25.5) 2 S 2 1.8 (0.09 2 166.89) 9 Y 9 2 SYY X SYY 1.8 S 2 X 0.06 Y Sb SY2 X t b B ; df n 2 S XX Sb 0.06 t 0.09 ; df 92 Sb 166.89 0.02 Sb 0.02 t 4.5; df 7 นาํ คา่ t = 4.5, df = 7 เปิดตารางการแจกแจงแบบ t (ส 5) ไดค้ า่ p-value < 0.005 4. เปรยี บเทียบคา่ p-value กบั ระดับนยั สาํ คญั p-value < 0.005 นอ้ ยกวา่ ระดับนยั สําคัญ /2 (0.025) ~ 146 ~
ชีวสถติ สิ าํ หรับสาธารณสุข: หนว่ ยท่ี 12 สหสัมพันธ์และสมการถดถอยเชิงเสน้ อย่างงา่ ย 5. ตดั สนิ ใจและสรุปผล ปฏิเสธสมมตฐิ าน H0 ทีร่ ะดับนัยสําคญั 0.05 ดังนนั้ สรปุ ได้วา่ อายุครรภ์กับนาํ้ หนักทารกแรก คลอดมคี วามสมั พันธ์เชิงเสน้ ตอ่ กนั อยา่ งมนี ัยสําคัญทางสถติ ิ (p-value < 0.005) 3. จงประมาณนาํ้ หนกั ทารกแรกคลอด เมอ่ื อายคุ รรภ์ของแม่เท่ากับ 28, 30 และ38 สัปดาห์ จากสมการถดถอย คือ Yi = -0.15 + 0.09Xi - ประมาณน้ําหนกั ทารกแรกคลอด เมอื่ อายุครรภ์ของแมเ่ ท่ากับ 28 ไดด้ งั น้ี Yi = -0.15 + (0.09)(28) = 2.37 - ประมาณนํ้าหนักทารกแรกคลอด เมือ่ อายุครรภ์ของแม่เทา่ กับ 30 ไดด้ ังน้ี Yi = -0.15 + (0.09)(30) = 2.55 - ประมาณนาํ้ หนักทารกแรกคลอด เม่อื อายุครรภข์ องแม่เทา่ กบั 38 ไดด้ งั น้ี Yi = -0.15 + (0.09)(38) = 3.27 ดงั น้นั จะไดว้ า่ เมื่ออายุครรภข์ องแมเ่ ท่ากบั 28, 30 และ38 สปั ดาห์ ทารกทีค่ ลอดออกมาจะมนี าํ้ หนัก เทา่ กบั 2.37, 2.55 และ 3.27 กิโลกรมั ตามลาํ ดบั 4. จงประมาณค่าสัมประสทิ ธิส์ หสมั พนั ธ์ r S XY S XX SYY r 14.97 166.89 1.8 r 0.86 ดง้ั นัน้ จะได้คา่ สัมประสทิ ธิ์สหสมั พันธ์ เท่ากบั 0.86 5. จงทดสอบสมมตฐิ านว่า = 0 หรอื ไม่ท่ีระดับนยั สาํ คัญ 0.05 1. ตั้งสมมตฐิ าน H0: อายคุ รรภ์กับนาํ้ หนักทารกแรกคลอดไมม่ ีความสมั พันธเ์ ชงิ เส้นตอ่ กนั ( = 0) HA: อายคุ รรภ์กับนํ้าหนกั ทารกแรกคลอดมีความสมั พันธ์เชิงเสน้ ต่อกนั ( 0) 2. กําหนดระดบั นยั สําคญั = 0.05 3. คาํ นวณคา่ สถิติทดสอบและหาค่า p-value tr n 2 ; df n2 1 r 2 t 0.86 92 ; df 92 1 0.862 t 4.46; df 7 นาํ คา่ t = 4.46, df = 7 เปดิ ตารางการแจกแจงแบบ t (ส 5) ได้คา่ p-value < 0.005 ~ 147 ~
ชวี สถติ สิ ําหรับสาธารณสขุ : หน่วยที่ 12 สหสมั พันธแ์ ละสมการถดถอยเชงิ เสน้ อย่างง่าย 4. เปรยี บเทยี บค่า p-value กบั ระดบั นัยสาํ คญั p-value < 0.005 น้อยกวา่ ระดับนัยสําคญั /2 (0.025) 5. ตัดสนิ ใจและสรุปผล ปฏิเสธสมมติฐาน H0 ท่รี ะดับนัยสําคญั 0.05 ดงั นั้น สรุปได้ว่าอายคุ รรภ์กบั นํ้าหนกั ทารกแรก คลอดมีความสมั พันธเ์ ชิงเสน้ ต่อกนั อย่างมีนัยสาํ คญั ทางสถติ ิ (p-value < 0.005) ~ 148 ~
ชวี สถติ สิ ําหรับสาธารณสขุ : หน่วยที่ 13 การวเิ คราะหข์ อ้ มูลแจงนับ หน่วยที่ 13 การวิเคราะห์ขอ้ มูลแจงนับ วตั ถปุ ระสงค์: หลังจากจบการเรียนในหวั ขอ้ น้แี ล้วนิสติ สามารถ 1. ประมาณค่าช่วงเชอ่ื ม่ันและทดสอบสมมตฐิ านของค่าสัดส่วนประชากรกลมุ่ เดียวได้ 2. ประมาณค่าช่วงเชื่อมั่นและทดสอบสมมติฐานความแตกต่างของค่าสัดส่วนประชากรสองกลุ่มที่ไม่ เป็นอิสระตอ่ กนั ได้ 3. ประมาณค่าชว่ งเชอื่ ม่ันและทดสอบสมมติฐานความแตกตา่ งของค่าสัดสว่ นประชากรสองกลุม่ ทเ่ี ป็น อิสระตอ่ กันได้ 4. ทดสอบสมมติฐานความแตกต่างของคา่ สดั สว่ นประชากรมากกวา่ สองกลุ่มท่เี ป็นอิสระตอ่ กันได้ เนือ้ หา: การวิเคราะหข์ อ้ มูลแจงนับ 1. การอนมุ านคา่ สดั สว่ นประชากรกลุ่มเดียว 1.1 การประมาณคา่ 1.2 การทดสอบสมมติฐาน โดย Z test 2. การอนมุ านค่าสดั ส่วนประชากรสองกลุ่มทไี่ ม่เปน็ อิสระต่อกัน 2.1 การประมาณค่า 2.2 การทดสอบสมมตฐิ าน โดย Z test และ McNemar Chi-Square test 3. การอนมุ านคา่ สดั ส่วนประชากรสองกล่มุ ทเี่ ป็นอสิ ระตอ่ กนั 3.1 การประมาณค่า 3.2 การทดสอบสมมตฐิ าน โดย Z test และ Chi-Square test 4. การทดสอบความสมั พันธร์ ะหว่างประชากรมากกวา่ สองกลมุ่ ทีเ่ ป็นอิสระตอ่ กัน รูปแบบการเรยี นการสอน: การเรียนรแู้ บบร่วมมือ 1. ผเู้ รยี นแต่ละคนศึกษาเนอ้ื หาตามหัวข้อบรรยายจากเอกสารประกอบการสอนและสรปุ เปน็ แผนผัง ความคิด (Mind map) กอ่ นเขา้ ชนั้ เรยี น 2. แบ่งกลุ่มการเรียน เช็คช่ือสมาชิกภายในกลุ่ม และอภิปรายเนื้อหาตามที่ได้รับมอบหมายภายใน กลุ่มและภายในชน้ั เรยี น 3. สรปุ เนือ้ หาโดยอาจารยผ์ ู้สอน 4. ผู้เรียนแต่ละกลุ่มคิดโจทยแ์ บบฝึกหดั พรอ้ มเฉลยหลังจากจบบทเรียน และส่งภายในสปั ดาหถ์ ัดไป ~ 149 ~
ชีวสถิติสาํ หรบั สาธารณสุข: หน่วยที่ 13 การวเิ คราะห์ขอ้ มูลแจงนับ ข้อมูลทางด้านสาธารณสุขจํานวนมากที่มีลักษณะเป็นข้อมูลเชิงคุณภาพ (Qualitative data) หรืออาจเรียกได้ว่าเป็นข้อมูลกลุ่มหรือข้อมูลแจงนับ (Categorical data) ซ่ึงเป็นข้อมูลท่ีมีมาตรวัดอยู่ใน ระดับนามสเกลหรืออันดับสเกลนั่นเอง เช่น ระดับความพึงพอใจ (มาก/ปานกลาง/น้อย) ผลการตรวจ สารเคมีในเลือด (เสย่ี ง/ไมเ่ ส่ยี ง) เป็นตน้ ค่าสถิติที่ใช้ในการสรุปผลของข้อมูลลักษณะนี้ เรียกว่า ค่าสัดส่วน หาได้จากจํานวนข้อมูลในกลุ่ม ท่ีสนใจหารด้วยจํานวนข้อมูลทั้งหมด เขียนสัญลักษณ์แทนค่าสัดส่วนในประชากรด้วย ส่วนค่าสัดส่วน ในตัวอยา่ งเขยี นแทนด้วย p ดงั นี้ คา่ สัดส่วนในประชากร X คา่ สดั ส่วนในตัวอย่าง N p x n เชน่ จากการตรวจสารเคมีในเลือดเกษตรกรของตําบลหนง่ึ ทั้งหมดจํานวน 200 คน พบว่ามี 100 คน ทม่ี ีเลอื ดเส่ยี ง จะได้สัดส่วนเกษตรกรทมี่ เี ลอื ดเสี่ยง เทา่ กบั ������ 0.5 50% ถ้าสุ่มตัวอย่างเกษตรกรจากตําบลดังกล่าวมา 100 คน พบวา่ มี 45 คน ท่ีมีเลือดเส่ียง ดังน้ันจะได้ สัดส่วนเกษตรกรที่มเี ลอื ดเสีย่ ง เทา่ กบั p 45 0.45 45% 100 1. การอนมุ านคา่ สดั สว่ นประชากรกลมุ่ เดียว ลักษณะของคําถามวิจัยที่ต้องการทราบค่าสัดส่วนหรือร้อยละของประชากรกลุ่มเดียว เช่น สัดส่วนของผู้สูงอายุตําบลท่าโพธิ์ที่เคยหกล้ม สัดส่วนของการสูบบุหร่ีในนิสิตมหาวิทยาลัยนเรศวร และ สดั ส่วนผปู้ ่วยมะเร็งปอดของประชาชนในจังหวัดพิษณุโลก เปน็ ต้น ในการอนุมานค่าสัดส่วนของประชากร กลุ่มเดียวซ่ึงมีการแจกแจงแบบทวินาม จากตัวอย่าง ล้ม/ไม่ล้ม สูบ/ไม่สูบ และป่วย/ไม่ป่วย เป็นต้น โดย ถ้าพบว่า np และ n(1-p) > 5 แล้วการแจกแจงแบบทวินามจะประมาณเข้าสู่การแจกแจงแบบปกติ ที่มี ค่าเฉลี่ย เท่ากับ และความแปรปรวน เท่ากับ (1-)/n ซึ่งสามารถเปลี่ยน p ให้อยู่ในรูปของ Z ได้ p เมื่อไมท่ ราบค่า ดงั น้ี Z p1 p/ n 1.1 การประมาณค่า การประมาณค่าช่วงเช่ือม่ันของค่าสัดส่วนในประชากรกลุ่มเดียว มีลักษณะเช่นเดียวกับการ ประมาณค่าช่วงเช่ือมั่นของค่าเฉล่ีย โดยในท่ีน้ีจะเป็นการประมาณค่าสัดส่วนของประชากร () ด้วยค่า สัดส่วนของตัวอย่าง (p) เป็นตัวประมาณ และมีค่าความคลาดเคล่ือนมาตรฐาน (SE) ของ p คือ p 1 p ⁄n ดังนัน้ จะได้ (1-)100% ช่วงเช่ือม่นั ของ อยู่ระหว่าง ~ 150 ~
ชีวสถติ ิสําหรบั สาธารณสุข: หน่วยที่ 13 การวเิ คราะหข์ อ้ มลู แจงนับ ตัวอย่างทpี่ 1ใZนก2ารศpึกษ1nาสpัดส่วนข...อ..ง..ผ..ู้.ส..ูง..อ..า..ย...ุท..ี่.เ.ค..ย...ห...ก..ล..้.ม..ข...อ..ง..จ..ัง..ห...ว..ัด...พ..ิษ...ณ....ุโ.ล...ก....โ.ด...ย..ส..ุ่ม...ต..ั.ว..อ..ย..่.า..ง.จ...ํา..น..(ว1น) 200 คน พบว่า มีจํานวน 120คน เคยหกล้มในรอบ 1 เดือนท่ีผ่านมา จงประมาณค่าสัดส่วนของผู้สูงอายุ ในจังหวดั พิษณโุ ลกทเ่ี คยหกลม้ ทร่ี ะดับความเชื่อมนั่ 95% วิธที าํ จากโจทย์จะได้ n=200, p=120/200=0.6, np=200x0.6=120, n(1-p)=200(1-0.6)=80 โดยที่ np และ n(1-p) มีค่ามากกวา่ 5 ดงั นัน้ การแจกแจง p เข้าสู่การแจกแจงแบบปกติ p1 p จะได้ 95%CI ของ อยรู่ ะหวา่ ง p Z0.05 2 n 0.6 1.96 0.61 0.6 200 0.6 0.07 0.53, 0.67 ดังน้นั ท่ีระดบั ความเชอ่ื มั่น 95% ผู้สงู อายุในจังหวัดพิษณโุ ลกทเ่ี คยหกลม้ มจี าํ นวน 53 ถึง 67% ตอบ ---------------------------------------------------------------------------------------------------------------------- 1.2 การทดสอบสมมตฐิ าน โดย Z test การทดสอบสมมติฐานของค่าสัดส่วนประชากรกลุ่มเดียวเพื่อทราบว่าสัดส่วนของตัวอย่างจะ เท่ากับสัดส่วนที่คาดหวังหรือเกณฑ์ท่ีกําหนดหรือไม่ โดยหลักการและข้ันตอนเช่นเดียวกับการทดสอบ ค่าเฉลี่ยประชากรหน่ึงกลมุ่ สูตรในการทดสอบสมมตฐิ านดว้ ย Z test คอื Z p ...........................................................................................................(2) p1 p/ n ตัวอย่างที่ 2 จากตัวอยา่ งที่ 1 ต้องการทราบว่าที่ระดับนัยสาํ คัญ 0.05 สัดส่วนของผู้สงู อายุท่ีเคยหกล้มใน รอบ 1 เดอื นที่ผ่านมาของประชากรผ้สู ูงอายุจังหวดั พษิ ณุโลก มากกว่าครึ่งหน่ึง คอื 50% หรอื ไม่ วธิ ีทาํ 1. ตงั้ สมมติฐาน H0: =0.5, HA: > 0.5 2. กําหนดระดบั นัยสาํ คญั =0.05 3. คํานวณค่าสถิตทิ ดสอบและหาคา่ p-value เลอื กใชส้ ถติ ิ Z test เนอื่ งจากตัวอย่างขนาดใหญ่พอโดยมีคา่ np และ n(1-p) มากกวา่ 5 0.6 0.5 คํานวณคา่ สถิติทดสอบ Z ไดด้ งั นี้ Z 0.61 0.6/ 200 2.88 Z = 2.88 เปิดตารางการแจกแจงแบบปกติ (ตาราง ส 4) ไดค้ า่ p-value = 0.002 4. เปรยี บเทียบค่า p-value กับระดบั นยั สําคญั p-value = 0.002 มีค่านอ้ ยกว่าเกณฑท์ ่กี ําหนดไว้ ( = 0.05) 5. ตดั สนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ท่ีระดับนัยสําคัญ 0.05 สรุปว่า สัดส่วนของผู้สูงอายุท่ีเคยหกล้มของ จงั หวดั พิษณุโลกมากกวา่ 50% อยา่ งมนี ยั สําคัญทางสถติ ิ (p-value=0.002) ----------------------------------------------------------------------------------------------------------------------- ~ 151 ~
ชีวสถติ ิสาํ หรับสาธารณสุข: หน่วยที่ 13 การวิเคราะห์ขอ้ มูลแจงนับ 2. การอนมุ านค่าสดั สว่ นประชากรสองกลุ่มท่ีไมเ่ ป็นอิสระตอ่ กนั ลักษณะของค่าสัดส่วนประชากรสองกลุ่มที่ไม่อิสระต่อกัน ข้อมูลจะไม่อิสระต่อกันเน่ืองจากมีการ วัดซ้ําในคนๆ เดิม หรือมีการจับคู่ เช่นเดียวกับกรณีการวิเคราะห์ด้วย Paired t-test ตัวอย่างเช่น การ เปรียบเทียบความรู้ (รู้มาก/รู้น้อย) เก่ียวกับสารเคมีของเกษตรกรก่อนและหลังให้สุขศึกษา การ เปรียบเทยี บประสิทธผิ ล (ลด/ไมล่ ด) ของโปรแกรมลดนาํ้ หนัก 2 วิธี ซึ่งจบั ค่กู นั ดว้ ย อายุ และเพศ ลกั ษณะของขอ้ มลู แบง่ ได้เปน็ 4 กลุ่ม ดังน้ี กลมุ่ ท่ี ผล 1 ผล 2 จาํ นวนคู่ 1 ++A 2 +- B 3 - +C 4 --D N นาํ ข้อมลู มาเขยี นเปน็ ตาราง 2 x 2 ไดด้ ังน้ี ผล 2 รวม +- ผล + A B A+B 1- C D C+D รวม A+C B+D N 2.1 การประมาณค่า การประมาณค่าช่วงเชื่อมั่นของ 1 - 2 ซึ่งไม่อิสระกันจะพิจารณาจากค่า p1 – p2 ซึ่งมีค่า เ ท่ า กั บ ( B-C)/N แ ล ะ มี ค่ า ค ว า ม ค ล า ด เ ค ล่ื อ น ม า ต ร ฐ า น ข อ ง p1 – p2 เ ท่ า กั บ B C B C /N / N โดยเมื่อ B+C 20 ความแตกต่างของค่า p1 – p2 จะเข้าสู่การ แจกแจงแบบปกติ ดังนนั้ (1-)100% ช่วงเช่ือมน่ั ของ 1 - 2 อยรู่ ะหวา่ ง B B C 2 N B C C Z .................................................................(3) N 2 N เมอ่ื B+C 20 ~ 152 ~
ชวี สถติ สิ าํ หรบั สาธารณสขุ : หนว่ ยท่ี 13 การวิเคราะหข์ ้อมลู แจงนับ ตัวอย่างที่ 3 ผลการการสอนสุขศึกษาเกี่ยวกับสารเคมีในเกษตรกร จํานวน 80 ราย ปรากฏดังตาราง ต้องการประมาณช่วงเช่ือมั่นความแตกต่างของความรู้ระหว่างก่อนและหลังให้สุขศึกษา ท่ีระดับความ เช่ือมนั่ 95% หลัง รวม รนู้ ้อย รู้มาก ก่อน รู้น้อย 10 40 50 รมู้ าก 15 15 30 รวม 25 55 80 วธิ ที ํา จากข้อมูลในตาราง จะได้ B+C = 40+15 = 55 ดงั นนั้ B+C > 20 ทร่ี ะดับความเชอ่ื ม่นั 95% ความแตกตา่ งของความรูร้ ะหวา่ งกอ่ นและหลังให้สุขศกึ ษา อยู่ระหว่าง B B C 2 N B C 2 C Z N N 40 15 40 152 40 15 1.96 80 80 80 0.31 1.96(0.09) 0.31 0.18 0.13,0.49 ดังน้นั ทีร่ ะดับความเช่ือมัน่ 95% ความแตกต่างของ ความรู้ระหวา่ งก่อนและหลังให้สุขศกึ ษา อยรู่ ะหวา่ ง 13% ถงึ 49% หรอื หลงั การใหส้ ขุ ศึกษามีผทู้ ร่ี มู้ ากเพม่ิ ข้ึน 13% ถึง 49% ตอบ ------------------------------------------------------------------------------------------------------------------ 2.2 การทดสอบสมมตฐิ าน โดย Z test และ McNemar Chi-Square test 1) การทดสอบสมมตฐิ านดว้ ย Z test เมื่อ B+C 20 ความแตกต่างของค่า p1 – p2 จะเข้าสู่การแจกแจงแบบปกติ ดังนั้นสามารถ ทดสอบสมมตฐิ านความแตกต่างระหวา่ ง 1 – 2 ทั้งการทดสอบทางเดยี วหรอื สองทางด้วย Z test ดังนี้ กรณีท่ี 1 Z B C1 เมื่อ B C ...............................................................................(4) BC กรณีท่ี 2 Z B C1 เม่ือ B C ...............................................................................(5) BC ~ 153 ~
ชวี สถิตสิ ําหรบั สาธารณสุข: หน่วยที่ 13 การวเิ คราะห์ขอ้ มลู แจงนับ ตวั อยา่ งที่ 4 จากตัวอยา่ งที่ 3 ต้องการทราบว่า สดั ส่วนผู้ที่มีความรู้มากหลงั การให้สขุ ศึกษาเพม่ิ ข้นึ หรอื ไม่ ทีร่ ะดบั นยั สําคญั 0.05 วธิ ีทํา 1. ตั้งสมมติฐาน H0: 1-2=0, HA: 1-2>0 2. กาํ หนดระดบั นัยสําคัญ =0.05 3. คาํ นวณคา่ สถิตทิ ดสอบและหาคา่ p-value เนอื่ งจาก B+C>20 (B=40, C=15) ดังนนั้ p1- p2 จงึ ประมาณเข้าสกู่ ารแจกแจงแบบปกติ เลอื กใชส้ ตู ร Z B C1 เมื่อ B C BC แทนคา่ Z 40 151 3.24 40 15 นําคา่ Z=3.24 เปิดตารางการแจกแจงแบบปกติ (ตาราง ส 4) ไดค้ ่า p-value=0.0006 4. เปรียบเทยี บคา่ p-value กับระดับนัยสาํ คัญ p-value = 0.0006 มคี า่ น้อยกว่าเกณฑท์ ่กี าํ หนดไว้ ( = 0.05) 5. ตัดสนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 สรุปว่า สัดสว่ นผู้ท่ีมีความรู้มากหลังการให้สุขศึกษา เพมิ่ ขึ้นอยา่ งมนี ยั สาํ คญั ทางสถติ ิ (p-value=0.0006) ----------------------------------------------------------------------------------------------------------------------------- 2) การทดสอบสมมตฐิ านดว้ ย McNemar Chi-Square test การทดสอบสมมตฐิ านความแตกต่างระหว่างค่าสัดสว่ นประชากรสองกลุ่ม สามารถทดสอบไดโ้ ดย ใช้สถิติในกลุ่ม ไคสแควร์ (Chi-square test; 2 test) สําหรับกรณีน้ีซ่ึงประชากรสองกลุ่มไม่อิสระต่อ กันสถิติท่ีใช้ในการวิเคราะห์เรียกว่า McNemar Chi-Square test ซ่ึงจะใช้ข้อมูลจากตาราง 2 x 2 เฉพาะช่องทม่ี คี ่าผลลัพธ์ต่างกนั คอื B และ C มาวเิ คราะห์ เช่นเดียวกับ Z test ดังสตู ร 2 B C 1 2 , df 1 .............................................................................................(6) B C ดงั น้นั เม่อื พจิ ารณาจากสตู รจะได้วา่ ค่า 2 มีคา่ เทา่ กับ ค่า Z2 ตวั อย่างท่ี 5 จากตวั อย่างท่ี 3 ตอ้ งการทราบว่า สัดส่วนผู้ทีม่ คี วามรู้มากหลังการให้สุขศึกษาเพมิ่ ขึ้นหรอื ไม่ ทีร่ ะดับนยั สําคญั 0.05 วิธีทํา 1. ตั้งสมมตฐิ าน H0: 1-2=0, HA: 1-2>0 2. กาํ หนดระดบั นัยสาํ คัญ =0.05 3. คํานวณคา่ สถิติทดสอบและหาค่า p-value จากสูตรการทดสอบความแตกต่างค่าสัดส่วนประชากรสองกลุ่มไม่อิสระต่อกัน McNemar Chi-Square test 2 B C 1 2 , df 1 B C ~ 154 ~
ชวี สถติ สิ ําหรับสาธารณสขุ : หน่วยท่ี 13 การวเิ คราะห์ข้อมูลแจงนับ แทนค่า 2 40 15 1 2 , df 1 ข้อสังเกต: ค่า 2 มีค่า เทา่ กับ Z2 (3.242) 40 15 2 10.47 นาํ คา่ 2=10.47 เปดิ ตารางการแจกแจงแบบ 2 (ตาราง ส 6) ได้คา่ p-value < 0.005 4. เปรียบเทยี บคา่ p-value กบั ระดบั นยั สําคญั p-value < 0.005 มีคา่ นอ้ ยกว่าเกณฑท์ ีก่ าํ หนดไว้ ( = 0.05) 5. ตัดสินใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ท่ีระดับนัยสําคัญ 0.05 สรุปว่าสดั ส่วนผู้ท่ีมีความรู้มากหลังการให้สุขศึกษา เพม่ิ ข้นึ อย่างมนี ยั สําคัญทางสถติ ิ (p-value < 0.005) ------------------------------------------------------------------------------------------------------------------------- 3. การอนมุ านคา่ สดั สว่ นประชากรสองกลุ่มที่เปน็ อิสระตอ่ กัน ลกั ษณะของค่าสัดส่วนประชากรสองกลุ่มที่เป็นอิสระต่อกัน ข้อมูลท่ีนํามาวิเคราะห์จะต้องมาจาก การสุ่มประชากรสองกลุ่มซึ่งไม่เกี่ยวข้องกันหรือเป็นคนละกลุ่มกัน ตัวอย่างเช่น การเปรียบเทียบความชุก ของผู้ป่วยเบาหวานระหว่างประชาชนตําบลท่าโพธ์ิกับตําบลท่าทอง การเปรียบเทียบอัตราการล้มระหว่าง ผู้สูงอายเุ พศชายกบั เพศหญิง เป็นต้น p1 = สดั สว่ นของตัวอยา่ งกลมุ่ ท่ี 1 จากตวั อยา่ งคอื - สัดสว่ นการเกิดโรคเบาหวานในประชาชนตาํ บลท่าโพธิ์ - สดั สว่ นการลม้ ในผสู้ งู อายเุ พศชาย p2 = สดั ส่วนของตัวอยา่ งกลุม่ ที่ 2 จากตัวอย่างคือ - สัดส่วนการเกดิ โรคเบาหวานในประชาชนตาํ บลท่าทอง - สดั สว่ นการลม้ ในผู้สงู อายุเพศหญงิ 3.1 การประมาณค่า การประมาณค่าช่วงเชื่อมั่นของ 1 - 2 วิเคราะห์ได้เช่นเดียวกับการประมาณค่าช่วงเชอื่ ม่ันของ 1 - 2 โดยที่ p1 มีการแจกแจงแบบปกติทม่ี ีคา่ เฉล่ยี เท่ากับ 1 ความแปรปรวนเท่ากับ 1(1-1)/n1 p2 มกี ารแจกแจงแบบปกตทิ มี่ คี า่ เฉล่ยี เท่ากบั 2 ความแปรปรวนเท่ากับ 2(1-2)/n2 ดังน้ันจะไดว้ ่า p1 – p2 มกี ารแจกแจงแบบปกติท่ีมีค่าเฉลย่ี เท่ากบั 1 - 2 และความแปรปรวนเท่ากับ [1(1-1)/n1] + [2(1-2)/n2] p 1 p /n ความคลาดเคลือ่ นมาตรฐานของ p1 – p2 เทา่ กบั p 1 p /n ดงั นนั้ (1-)100% ช่วงเชอ่ื มัน่ ของ 1 - 2 อยู่ระหว่าง p1 p2 Z 2 p1 1 p1 p2 1 p2 …………………………………………………………(7) n1 n2 ~ 155 ~
ชีวสถิติสําหรบั สาธารณสขุ : หนว่ ยท่ี 13 การวิเคราะหข์ อ้ มลู แจงนับ ตัวอย่างท่ี 6 การศึกษาเปรียบเทียบอัตราการล้มระหว่างผู้สูงอายุเพศชายและหญิง นักวิจัยได้สุ่มผู้สูงอายุ จาํ นวน 200 คน เป็นเพศชาย 100 พบวา่ เคยล้มในรอบ 1 เดือนท่ผี ่านมา 50 คน ผสู้ ูงอายุเพศหญงิ จาํ นวน 100 คน เคยล้มในรอบ 1 เดือนที่ผ่านมา 70 คน นักวิจัยต้องการประมาณความแตกต่างของอัตราการล้ม ระหว่างผู้สูงอายเุ พศชายและหญงิ ทร่ี ะดบั ความเช่ือมน่ั 95% วิธีทํา กาํ หนดให้ p1 เท่ากบั สดั สว่ นการล้มในผูส้ ูงอายชุ าย = 50/100 = 0.5 P2 เท่ากับสดั สว่ นการลม้ ในผูส้ ูงอายหุ ญงิ = 70/100 = 0.7 ประมาณคา่ สัดส่วนการล้มระหว่างผูส้ งู อายุชายและหญิงได้จาก p1 p2 Z0.05 2 p1 1 p1 p2 1 p2 n1 n2 0.5 0.7 1.96 0.5(1 0.5) 0.7(1 0.7) 100 100 0.2 (1.96 0.07) 0.2 0.14 0.34 0.06 ดังนน้ั ทีร่ ะดับความเช่ือมน่ั 95% อัตราการลม้ ของผู้สูงอายเุ พศชายนอ้ ยกว่าหญงิ 6% ถงึ 34% ตอบ ----------------------------------------------------------------------------------------------------------------------- 3.2 การทดสอบสมมติฐาน โดย Z test และ Chi-Square test 1) การทดสอบสมมติฐานด้วย Z test เม่ือ n1p, n1(1-p), n2p และ n2(1-p) มีค่ามากกว่า 5 ความแตกต่างของค่า p1 – p2 จะ เข้าสู่การแจกแจงแบบปกติ ดังนั้นสามารถทดสอบสมมติฐานความแตกต่างระหว่าง 1 – 2 ท้ังการ ทดสอบทางเดยี วหรอื สองทางดว้ ย Z test ดังนี้ Z p1 p2 .............................................................................................(8) 1 1 p(1 p) n1 n2 เม่ือ p x1 x2 n1 n2 ตัวอย่างท่ี 7 จากตัวอย่างที่ 6 ต้องการทดสอบว่าอัตราการล้มระหว่างผู้สูงอายุชายและหญิงแตกต่างกัน หรอื ไม่ ท่รี ะดับนัยสาํ คญั 0.05 วธิ ที าํ 1. ตงั้ สมมตฐิ าน H0: 1-2=0, HA: 1-20 2. กาํ หนดระดับนัยสําคญั =0.05 3. คํานวณค่าสถิตทิ ดสอบและหาค่า p-value ตรวจสอบวา่ การแจกแจงแบบทวนิ ามมีขนาดใหญ่พอทจ่ี ะมกี ารแจกแจงแบบปกตหิ รือไม่ ดงั น้ี p x1 x2 50 70 0.6 n1 n2 100 100 ~ 156 ~
ชีวสถิตสิ ําหรับสาธารณสขุ : หนว่ ยท่ี 13 การวิเคราะหข์ อ้ มูลแจงนับ n1p = 100 x 0.6 = 60, n1(1-p) = 100(1-0.6) = 40 n2p = 100 x 0.6 = 60, n2(1-p) = 100(1-0.6) = 40 ดังน้ัน n1p, n1(1-p), n2p และ n2(1-p) มีค่ามากกว่า 5 สามารถทดสอบสมมติฐานของ 1 – 2 ด้วย Z test ดังน้ี p1 p2 Z 1 1 n1 n2 p(1 p) Z 0.5 0.7 2.88 1 1 0.6(1 0.6) 100 100 นําคา่ Z = -2.88 เปิดตารางการแจกแจงแบบปกติ (ตาราง ส 4) ไดค้ ่า p-value = 0.002 4. เปรยี บเทียบค่า p-value กับระดับนยั สาํ คัญ p-value=0.002 มีคา่ นอ้ ยกว่าเกณฑ์ที่กําหนดไว้ (/2 = 0.025) 5. ตดั สินใจและสรุปผล ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 สรุปว่า อัตราการล้มระหว่างผู้สูงอายุชายและหญิง แตกตา่ งกันอยา่ งมนี ยั สําคญั ทางสถติ ิ (p-value = 0.002) ------------------------------------------------------------------------------------------------------------------- 2) การทดสอบสมมตฐิ านด้วย Chi-square test การทดสอบสมมติฐานความแตกต่างระหว่างค่าสัดส่วนประชากรสองกลุ่มท่ีเป็นอิสระต่อ กันแบบสองทางด้วย Z test ดังตัวอย่างท่ี 7 (อัตราการล้มระหว่างผู้สูงอายุชายและหญิงแตกต่างกัน หรือไม่ HA: 1-20) สามารถพิจารณาในรูปแบบของความสัมพันธ์ระหว่างสองตัวแปรได้ เช่น การ ทดสอบความแตกต่างดังกล่าวจะเป็นการทดสอบความสัมพันธ์ระหว่างตัวแปรการล้ม (ล้ม/ไม่ล้ม) กับ ตัวแปรเพศ (ชาย/หญิง) กรณีการทดสอบความสัมพันธ์ลักษณะนี้ใช้สถิติทดสอบเรียกว่า Chi-square test (2 test) ซึ่งมีลักษณะการแจกแจงแบบ Chi-square โดยที่ค่าสถิติทดสอบ 2 มีค่าเท่ากับ Z2 เช่นเดียวกับกรณีทปี่ ระชากรสองกลุ่มไม่อิสระกันดังกล่าวไปแล้วข้างต้น ค่าสถิติทดสอบ 2 คํานวณได้ จากสตู ร ดังน้ี 2 Oi Ei 2 .............................................................................................(9) Ei เมือ่ ขอ้ มูลจําแนกอยูใ่ นลกั ษณะตารางจําแนกสองทาง Oi = ค่าความถ่ีชอ่ งที่ i (Observed count) Ei = ค่าคาดหวังชอ่ งที่ i (Expected count) df = (r-1)(c-1), r = จาํ นวนแถว (row) , c = จาํ นวนสดมภ์ (column) หมายเหตุ: ค่า Ei คือค่า n1p, n1(1-p), n2p และ n2(1-p) น่ันเอง ดังนั้นจึงควรมีค่ามากกว่า 5 หรือในทางปฏบิ ตั มิ คี า่ นอ้ ยกวา่ 5 ไม่เกิน 20% ของจาํ นวนท้งั หมด หากเกิน 20% ~ 157 ~
ชีวสถติ สิ าํ หรบั สาธารณสขุ : หน่วยที่ 13 การวเิ คราะห์ขอ้ มูลแจงนับ ตวั อย่างที่ 8 จากตัวอย่างท่ี 6 และ 7 ต้องการทดสอบว่าการล้มมีความสัมพันธ์กับเพศหรือไม่ ท่ีระดับ นัยสาํ คัญ 0.05 วธิ ีทาํ 1. ต้ังสมมติฐาน H0: การล้มไม่มคี วามสมั พนั ธก์ บั เพศ (1-2=0) HA: การล้มมีความสมั พนั ธ์กับเพศ (1-20) 2. กาํ หนดระดบั นยั สําคัญ =0.05 3. คํานวณคา่ สถิตทิ ดสอบและหาคา่ p-value ใช้ Chi-square test เมือ่ ความถี่คาดหวงั ในแตล่ ะช่องมากกว่า 5 หาไดด้ งั น้ี การล้ม รวม ล้ม ไม่ล้ม 100 E1 100 120 60 200 เพศ ชาย 50 50 หญงิ (E1=60) (E2=40) E2 100 80 40 200 รวม 70 30 (E3=60) (E4=40) 100 E3 100 120 60 200 120 80 200 E4 100 80 40 200 หาค่า 2 ได้จาก 2 Oi Ei 2 Ei i Oi Ei (Oi-Ei)2 (Oi-Ei)2/Ei 100 1.67 1 50 60 2 50 40 100 2.5 3 70 60 100 1.67 4 30 40 100 2.5 รวม 200 200 8.34 นําค่า 2 ท่ี df = (2-1)(2-1) = 1 ไปเปดิ ตาราง ส 6 ไดค้ ่า p-value < 0.005 4. เปรยี บเทียบค่า p-value กับระดับนัยสําคัญ p-value < 0.005 มีค่านอ้ ยกวา่ ระดับนัยสาํ คญั (0.05) 5. ตดั สนิ ใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ที่ระดับนัยสําคัญ 0.05 สรุปว่า การลม้ มีความสัมพันธก์ ับเพศอย่าง มีนัยสําคัญทางสถิติ (p-value < 0.005) หรืออีกนัยหน่ึงสามารถกล่าวได้ว่า อัตราการล้มของผู้สูงอายุเพศชายแตกต่างจากเพศ หญิง (ดังผลการทดสอบด้วย Z test) ------------------------------------------------------------------------------------------------------------------ ~ 158 ~
ชวี สถติ สิ าํ หรับสาธารณสุข: หนว่ ยที่ 13 การวิเคราะหข์ อ้ มลู แจงนับ 4. การทดสอบความสัมพนั ธ์ระหวา่ งประชากรมากกวา่ สองกลุ่มทเ่ี ป็นอสิ ระต่อกนั การทดสอบความสัมพันธ์ระหวา่ ง 2 ตัวแปรด้วย Chi-square test นอกกจากจะใช้ทดสอบกับตัว แปรทีม่ ลี ักษณะเป็นแบบทวินามแล้ว ยังสามารถใช้ทดสอบความสมั พนั ธ์ระหว่าง 2 ตัวแปร โดยที่แต่ละตัว แปรมีมากกว่า 2 กลุ่มได้เช่นกัน ซ่ึงมีหลักการทดสอบและการคํานวณค่าสถิติ 2 เช่นเดียวกับกรณีตาราง 2 x 2 คอื ตอ้ งพิจารณาค่าคาดหวงั (Ei) ข้อมลู สามารถมีคา่ นอ้ ยกวา่ 5 ได้ แตไ่ มเ่ กนิ 20% ของ r x c ชอ่ ง ตัวอย่างเช่น การหาความสัมพันธ์ระหว่างความรู้ (มาก/ปานกลาง/น้อย) กับทัศนคติ (มาก/ปาน กลาง/น้อย) ด้วย Chi-square test จะต้องพิจารณาค่าคาดหวัง ข้อมูลมีค่าน้อยกว่า 5 ได้ไม่เกิน 20% ของ 3 x 3 (9 ชอ่ ง) น่ันคอื มคี ่าคาดหวังน้อยกว่า 5 ได้เพียง 1 ค่า จึงจะถือว่าตวั อยา่ งมขี นาดใหญ่พอทจ่ี ะ มีการแจกแจงแบบไคสแควร์ หรือการหาความสัมพันธ์ระหว่างระดับการศึกษา (ไม่ได้เรียน/ประถม/ มัธยม/ปรญิ ญา) กบั พฤตกิ รรมการออกกําลังกาย (บอ่ ยครั้ง/บางคร้งั /นานๆ คร้งั ) ตอ้ งพจิ ารณาคา่ คาดหวัง ด้วยเช่นกัน โดยมีค่าน้อยกว่า 5 ได้ไม่เกิน 20% ของ 4 x 3 (12 ช่อง) นั่นคือข้อมูลสามารถมีค่าคาดหวัง นอ้ ยกว่า 5 ได้ 2 คา่ ซงึ่ นสิ ิตจะได้คํานวณในส่วนของภาคปฏิบัติการใช้โปรแกรมสําเรจ็ รูป -------------------------------------------------------------------------------------------------------------------- ~ 159 ~
ชีวสถติ ิสาํ หรับสาธารณสุข: หน่วยที่ 13 การวิเคราะห์ขอ้ มูลแจงนับ เฉลยแบบฝึกหดั 1. จากการทดลองใช้ยารกั ษาโรคไตกบั คนไขจ้ าํ นวน 72 คน โดยแบง่ เปน็ 2 กลุ่ม กลุ่มแรกเปน็ กลุ่มทดลอง จํานวน 34 คน ให้ใช้ยารักษาโรคไตดังกล่าว พบว่ามี 1 คนท่ีเกิดอาการไตวายตาย และอีกหน่ึงกลุ่มเป็น กลุ่มควบคุม จํานวน 38 คน ให้ได้รับยาหลอก พบว่ามี 10 คน ท่ีมีอาการไตวายตาย จงประมาณค่าช่วง เช่อื มั่นและทดสอบสมมติฐานวา่ อตั ราผ้เู สียชีวิตจากอาการไตวายตายระหว่างกลมุ่ ทดลองและกลุ่มควบคุม แตกตา่ งกนั หรอื ไม่ ที่ระดับนยั สําคัญ 0.01 วิธีทาํ 1.1 การประมาณคา่ ช่วงเชอ่ื มั่น สดั สว่ นการเสียชีวิตจากอาการไตวายในกล่มุ ทดลอง เท่ากับ P1= 1/34 = 0.0294 สดั สว่ นการเสยี ชวี ิตจากอาการไตวายในกลมุ่ ควบคมุ เท่ากับ P2= 10/38 = 0.2631 จะได้ 95%CI ของ 1- 2 อยู่ระหวา่ ง p1 p2 Z 0.01 2 p11 p1 p2 1 p2 n1 n2 0.0294 0.2631 2.58 0.0294(1 0.0294) 0.2631(1 0.2631) 34 38 0.2337 (2.58 0.0768) 0.2337 0.1981 0.4318 ถึง 0.0356 ดังนน้ั อตั ราความแตกต่างระหว่างผู้เสยี ชวี ติ จากอาการไตวายตายกลมุ่ ทดลองและกลุ่มควบคุม อยรู่ ะหว่าง – 43.18% ถึง -3.56% ตอบ 1.2 การทดสอบสมมติฐาน 1. ตง้ั สมมตฐิ าน H0: 1-2=0 HA: 1-20 2. กําหนดระดับนัยสําคัญ =0.01 3. คํานวณคา่ สถติ ิทดสอบและหาคา่ p-value p x1 x2 1 10 0.1527 n1 n2 34 38 n1 p 34 0.1527 5.19 มคี ่ามากกว่า 5 ทุกตวั ดงั นนั้ สามารถใช้ Z test n1 (1 p) 34(1 0.1527) 28.81 ในการทดสอบสมมตฐิ านได้ n2 p 38 0.1527 5.80 n2 (1 p) 38(1 0.1527) 32.20 ~ 160 ~
ชีวสถิติสําหรบั สาธารณสุข: หนว่ ยที่ 13 การวเิ คราะห์ขอ้ มลู แจงนับ Z p1 p2 1 1 p(1 p) n1 n2 Z 0.0294 0.2631 1 1 38 0.15271 0.1527 34 Z 0.2337 0.0849 Z 2.75 นาํ คา่ Z = -2.75 เปิดตารางการแจกแจงแบบปกติ (ส 4) ไดค้ ่า p-value = 0.0030 4. เปรียบเทียบค่า p-value กบั ระดับนัยสาํ คญั p-value = 0.003 มคี า่ น้อยกวา่ เกณฑ์ที่กําหนดไว้ (/2 = 0.005) 5. ตดั สินใจและสรปุ ผล ปฏิเสธสมมติฐาน H0 ทีร่ ะดับนัยสําคัญ 0.01 สรปุ วา่ อัตราผูเ้ สียชีวติ จากอาการไตวายตาย ระหวา่ งกล่มุ ทดลองและกลุ่มควบคุมแตกต่างกันอยา่ งมีนัยสําคัญทางสถิติ (p-value = 0.003) 2. นักวิจัยทําการศึกษาเรื่องการแพ้วัสดุที่ใช้อุดฟัน 2 ชนิด โดยให้ผู้รับการทดลองแต่ละคนได้รับสารท้ัง 2 ชนดิ คือสาร A และ B วดั ผลเปน็ การตอบสนอง (+) และไมต่ อบสนอง (-) โดยศึกษาจากการอุดฟนั ในคนๆ เดียวกนั ด้านซ้ายและขวา ผลการศกึ ษาปรากฏดงั ตาราง + คือ ตอบสนอง/ แพ,้ - คอื ไม่ตอบสนอง/ ไมแ่ พ้ ผลของสาร B รวม +- ผลของสาร A + 20 25 45 - 10 5 15 รวม 30 30 60 จงประมาณค่าช่วงเช่ือม่ันและทดสอบสมมติฐานว่าอตั ราการแพ้วัสดุที่ใช้อุดฟนั ของสารท้ัง 2 ชนิดแตกต่าง กันหรอื ไม่ วิธีทาํ 1.1 การประมาณคา่ ช่วงเช่อื มัน่ เนอื่ งจาก B+C = 25+10 = 35 ซึ่งมากกวา่ 20 ดังน้ัน ที่ระดับความเช่ือมั่น 95% ความแตกต่างของอัตราการแพ้วัสดุที่ใช้อุดฟันของสารทั้ง 2 ชนิด อยู่ระหว่าง ~ 161 ~
ชวี สถติ ิสาํ หรับสาธารณสขุ : หนว่ ยท่ี 13 การวิเคราะห์ข้อมูลแจงนับ B B C 2 N B C C Z 2 N N 25 10 25 102 25 10 1.96 60 60 60 15 1.96(0.0946) 60 0.25 0.1855 0.0645 ถึง 0.4355 ดงั น้นั อตั ราความแตกตา่ งระหวา่ งการแพ้วสั ดุท่ใี ชอ้ ุดฟนั ของสารทั้ง 2 ชนดิ อย่รู ะหว่าง 6.45% ถงึ 43.55% ตอบ 1.2 การทดสอบสมมติฐาน 1. ตง้ั สมมติฐาน H0: 1-2=0 HA: 1-20 2. กําหนดระดับนยั สําคัญ =0.05 3. คาํ นวณคา่ สถิตทิ ดสอบและหาคา่ p-value เน่อื งจาก B+C>20 (B=25, C=10) ดงั น้ัน p1- p2 จงึ ประมาณเขา้ สู่การแจกแจงแบบปกติ Z B C 1 เมื่อ B C BC Z 25-10 1 25 10 Z 2.366 นําค่า Z=2.366 เปดิ ตารางการแจกแจงแบบปกติ (ส 4) ไดค้ า่ p-value=0.0089 4. เปรียบเทยี บคา่ p-value กบั ระดับนยั สาํ คญั p-value=0.0089 มีค่าน้อยกว่าเกณฑ์ทกี่ าํ หนดไว้ (/2 = 0.025) 5. ตัดสินใจและสรปุ ผล ปฏิเสธสมมตฐิ าน H0 ทรี่ ะดบั นยั สาํ คญั 0.05 สรุปว่า อัตราการแพ้วสั ดุที่ใชอ้ ดุ ฟันของสารทัง้ 2 ชนิดแตกตา่ งกันอยา่ งมนี ยั สาํ คัญทางสถติ ิ (p-value=0.0089) ~ 162 ~
ชวี สถิติสําหรับสาธารณสขุ : หน่วยที่ 13 การวิเคราะหข์ ้อมูลแจงนับ 3. จากข้อมูลในตารางจงหาว่าการสูบบุหรีร่ ะหวา่ งตั้งครรภข์ องแมม่ คี วามสัมพันธ์กับนา้ํ หนักทารกหรอื ไม่ นาํ้ หนกั ทารก รวม นอ้ ยกว่าปกติ ปกติ การสบู บหุ ร่ีระหว่างตงั้ ครรภ์ สูบ 110 50 160 ไมส่ บู 10 130 140 รวม 120 180 300 1. ต้ังสมมติฐาน H0: การสบู บุหรีไ่ มม่ คี วามสมั พนั ธ์กับนาํ้ หนกั ทารก (1-2=0) HA: การสูบบหุ รี่มีความสมั พนั ธ์กบั น้ําหนกั ทารก (1-20) 2. กําหนดระดับนัยสาํ คัญ =0.05 3. คาํ นวณคา่ สถติ ทิ ดสอบและหาคา่ p-value ใช้ Chi-square test เมอ่ื ความถี่คาดหวังในแตล่ ะช่องมากกว่า 5 หาไดด้ ังนี้ E1 160 120 64 300 E2 160 180 96 คา่ คาดหวังมีค่ามากกวา่ 5 ทกุ ตัว 300 ดงั นน้ั สามารถใช้ 2 - test E3 140 120 56 ในการทดสอบสมมตฐิ านได้ 300 E4 140 180 84 300 หาคา่ 2 ไดด้ งั น้ี 2 Oi Ei 2 i Oi Ei Ei (Oi-Ei)2 (Oi-Ei)2/Ei 1 110 64 2116 33.063 2 50 96 2116 22.042 3 10 56 2116 37.786 4 130 84 2116 25.19 รวม 300 300 118.08 นาํ ค่า 2 = 118.08 ที่ df = 1 ไปเปดิ ตาราง ส6 ไดค้ ่า p-value < 0.005 ~ 163 ~
ชวี สถิตสิ าํ หรับสาธารณสุข: หน่วยท่ี 13 การวเิ คราะหข์ อ้ มูลแจงนับ 4. เปรียบเทยี บค่า p-value กับระดบั นัยสาํ คัญ p-value < 0.005 มคี ่านอ้ ยกวา่ ระดบั นยั สําคัญ (0.05) 5. ตดั สนิ ใจและสรปุ ผล ปฏเิ สธสมมติฐาน H0 ทรี่ ะดับนัยสําคญั 0.05 สรุปวา่ การสูบบหุ ร่ีระหว่างตง้ั ครรภ์ของแมม่ ี ความสัมพันธก์ บั นํา้ หนักทารกอย่างมนี ยั สําคญั ทางสถติ ิ (p-value < 0.005) ~ 164 ~
ชีวสถติ สิ ําหรับสาธารณสขุ : หน่วยที่ 14 บทสรปุ หน่วยที่ 14 บทสรปุ เน้ือหาในภาคบรรยายท้ังหมดเน้นไปท่ีทฤษฎีและหลักการพื้นฐานที่เกี่ยวข้องกับการวิเคราะห์ ข้อมูลเพื่อให้ผู้เรียนสามารถ เข้าใจ คิดวิเคราะห์ ได้ทบทวนเนื้อหาจากการทําแบบฝึกหัด จนกระท่ัง สามารถเชื่อมโยงไปสู่การวิเคราะห์ข้อมูลจริงด้วยโปรแกรมสําเร็จรูปทางสถิติในภาคปฏิบัติต่อไปได้ โดยใน แตล่ ะหนว่ ยไดก้ ล่าวถึงเนื้อหาที่สําคญั ดงั น้ี ~ 165 ~
ชวี สถติ สิ ําหรบั สาธารณสุข: หนว่ ยที่ 14 บทสรปุ หน่วยท่ี 1 ความสําคัญและขอบข่ายของชีวสถิติในงานสาธารณสุข กล่าวถึงความหมายและ ขอบข่ายของสถิติ บทบาทของสถิติในงานด้านสาธารณสุข ระเบียบวิธีการต่างๆ ทางสถิติ ตัวแปรและ มาตรวดั ตวั แปร รวมถึงสัญลกั ษณ์และเคร่ืองหมายท่ีใช้บ่อยในทางสถติ ิ โดยเนน้ ทีก่ ารใชส้ ถติ ิเพ่ือการวิจยั หนว่ ยท่ี 2 การเกบ็ รวบรวมข้อมลู กล่าวถึงความรู้พื้นฐานทีเ่ กยี่ วขอ้ งกับข้อมลู ลกั ษณะของขอ้ มลู คุณสมบัตขิ องข้อมูลที่ดี ข้นั ตอนการเก็บรวบรวมข้อมูล วิธีการเก็บรวบรวมข้อมูล แนวทางการเลือกวิธีการ เก็บรวบรวมข้อมูล เคร่ืองมือที่ใช้ในการเก็บรวบรวมข้อมูล โดยอธิบายเบ้ืองต้นเพื่อให้ทราบถึงวิธีการได้ ขอ้ มลู มาเพ่ือจะนําไปวิเคราะห์ต่อไป หน่วยท่ี 3 การนําเสนอข้อมูล กล่าวถึงการนําเสนอข้อมูลในรูปของตารางและแผนภูมิต่างๆ ซึ่ง เปน็ สว่ นหน่ึงของสถิติพรรณนา รวมถงึ ลักษณะของกราฟในทางสถิตเิ พมิ่ เตมิ เช่น ฮิสโตแกรม แผนภาพลํา ตน้ และใบ แผนภาพกลอ่ ง เปน็ ตน้ เพื่อการทําความเข้าใจเบ้ืองต้นก่อนการวิเคราะห์ขอ้ มลู จรงิ หน่วยท่ี 4 การวัดแนวโน้มเข้าสู่ส่วนกลางและการกระจาย กล่าวถึงสถิติพรรณนาในการเลือกใช้ ค่ากลางและคา่ การกระจายในรูปแบบตา่ งๆ ที่เหมาะสมกับลกั ษณะของข้อมูล หน่วยท่ี 5 ความน่าจะเป็น หน่วยท่ี 6 การแจกแจงความน่าจะเป็น และหน่วยที่ 7 การแจกแจง ค่าสถิติ เป็นทฤษฎีหรือแนวคิดที่เกี่ยวข้องกับความน่าจะเป็นท้ังหมด เพ่ือขยายผลจากสถิติพรรณนา สําหรับตัวอย่างไปสู่สถิติอนุมานสําหรับประชากร โดยมีทฤษฎีท่ีถือเป็นหัวใจสําคัญของการอนุมานทาง สถติ คิ อื ทฤษฎกี ารลเู่ ข้าสสู่ ่วนกลาง (Central limit theorem) หน่วยท่ี 8 การประมาณค่า และหน่วยที่ 9 การทดสอบสมมติฐาน กล่าวถึงหลักการประมาณค่า แบบช่วงเชื่อม่ัน และการทดสอบสมมติฐานทางสถิติ ซึ่งเป็นวิธีการอนุมานค่าสถิติจากตัวอย่างไปเป็น ค่าพารามิเตอร์ของประชากร หน่วยที่ 10 การทดสอบค่าเฉลี่ยประชากรสองกลุ่ม กล่าวถึงการใช้สถิติ t-test ในการ เปรียบเทียบค่าเฉล่ียประชากรสองกลุ่มกรณีท่ีเป็นอิสระต่อกันด้วย Independent t-test และกรณีท่ี ประชากรสองกลุ่มไม่อสิ ระตอ่ กนั ด้วย Paired t-test รวมทงั้ การประมาณคา่ ชว่ งเชื่อมน่ั ของความแตกต่าง หน่วยที่ 11 การเปรียบเทียบคา่ เฉลี่ยประชากรมากกวา่ สองกล่มุ กล่าวถงึ หลกั การวเิ คราะหค์ วาม แปรปรวนเพอื่ เปรียบเทียบคา่ เฉล่ยี ประชากรมากกวา่ สองกลุม่ กรณกี ารวิเคราะหค์ วามแปรปรวนทางเดียว (One way ANOVA) รวมทง้ั วธิ กี ารเปรียบเทียบความแตกต่างระหว่างคู่ หน่วยท่ี 12 สหสัมพันธ์และสมการถดถอยเชิงเส้นอย่างง่าย กล่าวถึงวิธีการและแนวคิดของการ วิเคราะห์ความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ รวมถึงการประมาณค่าและการทดสอบสมมติฐาน ความสมั พันธ์เชิงเส้นอย่างง่าย หน่วยท่ี 13 การวิเคราะห์ข้อมูลแจงนับ กล่าวถึงการวิเคราะห์ข้อมูลเชิงคุณภาพเบ้ืองต้น ท้ังการ เปรียบเทียบความแตกต่างระหว่างค่าสัดส่วนด้วย Z test และการทดสอบความสัมพันธ์ด้วย Chi-square test สถิติวิเคราะห์ท้ังหมดท่ีกล่าวถึง ได้แก่ Z test, Independent t-test, Paired t-test, One way ANOVA และ Chi-square test เป็นสถิติท่ีเรียกว่าสถิติอิงพารามิเตอร์ (Parametric statistics) กล่าวคือ การอนุมานด้วยสถิติดังกล่าวอยู่ภายใต้ลักษณะการแจกแจงของสถิติแต่ละตัว ดังน้ันการเลือกใช้สถิติอิง พารามิเตอรจ์ ึงมเี ง่อื นไขหรอื ขอ้ ตกลงเบอ้ื งต้น (Assumption) ของการใช้สถิติ เช่น ข้อมลู จะตอ้ งมีการแจก แจงแบบปกติสําหรับการใช้ t-test เป็นต้น ดังนั้น ก่อนการวิเคราะห์ข้อมูลจึงจําเป็นต้องตรวจสอบ ข้อตกลงเบื้องต้นของการใช้สถิติแต่ละตัว ซ่ึงในเนื้อหาภาคทฤษฎีน้ีจะไม่ไดก้ ลา่ วถึงวิธีการตรวจสอบ แตจ่ ะ ~ 166 ~
ชวี สถิตสิ ําหรับสาธารณสขุ : หน่วยท่ี 14 บทสรปุ กล่าวถึงในภาคปฏิบตั ิการใช้โปรแกรมสําเร็จรูป ซ่ึงหากข้อมูลท่ีนํามาวิเคราะห์ไม่ผ่านขอ้ ตกลงเบ้ืองตน้ ของ การใชส้ ถติ ิอิงพารามเิ ตอร์ ในทางปฏิบตั จิ ะต้องมวี ิธจี ดั การกับข้อมูลเพ่ือใหผ้ ่านข้อตกลงเบ้อื งต้นของการใช้ สถิติอิงพารามิเตอร์ หรืออาจเลือกใช้สถิติไม่อิงพารามิเตอร์ (Non-parametric statistics) ได้แก่ Wilcoxon signed rank test, Man - Whitney test, Wilcoxon matched pairs signed Ranks test, Kruskall-wallis test, Spearman rank correlation แ ล ะ Fisher’s exact test แ ท น ส ถิ ติ อิ ง พารามิเตอร์ ซึ่งไม่ได้กล่าวถึงการคํานวณในท่ีน้ี นิสิตจะได้ศึกษาในภาคปฏิบัติต่อไป จากสถิติที่ใช้ในการ ทดสอบสมมติฐานท้ังหมดซึ่งได้กล่าวถึงในบทเรียน สามารถสรุปแนวทางการเลือกใช้สถิติอิงพารามิเตอร์ และสถิติไม่อิงพารามิเตอร์ได้ดังภาพที่ 14.1 และ 14.2 สําหรับข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ ตามลําดับ ข้อมลู เชงิ ปริมาณ เปรยี บเทียบ วิเคราะห์ คา่ เฉล่ีย ความสัมพนั ธ์ 1 กลมุ่ 2 กลมุ่ > 2 กล่มุ ทาํ นาย หา (X, Y) ความสมั พนั ธ์ One sample อิสระ ไมอ่ ิสระ อสิ ระ t-test Simple (X, X) linear Pearson regression correlation Independent Paired t-test One way t-test ANOVA Wilcoxon Wilcoxon Non-parametric Spearman signed rank matched rank Man - pairs signed Kruskall- statistics test whitney test ranks test correlation wallis test ภาพท่ี 14.1 แนวทางการเลือกใชส้ ถิตพิ นื้ ฐานสําหรบั วเิ คราะห์ข้อมูลเชงิ ปรมิ าณ ~ 167 ~
ชวี สถิติสาํ หรบั สาธารณสุข: หน่วยท่ี 14 บทสรปุ ข้อมลู เชงิ คุณภาพ เปรยี บเทยี บคา่ วิเคราะห์ สัดสว่ น ความสมั พันธ์ 1 กลุม่ 2 กลุ่ม > 2 กล่มุ อสิ ระ ไม่อิสระ) Z test อสิ ระ ไมอ่ ิสระ อสิ ระ 2 test McNemar test Z test, Z test, 2 test 2 test McNemar test Binomial Fisher’s Binomial Freman exact exact test exact Halton conditional probability probability exact test test test Non-parametric statistics ภาพที่ 14.2 แนวทางการเลอื กใช้สถิตพิ นื้ ฐานสาํ หรับวเิ คราะหข์ อ้ มลู เชงิ คุณภาพ ~ 168 ~
บรรณานกุ รม ~ 169 ~
กัลยา วานิชย์บญั ชา. สถติ ิสาํ หรับงานวิจัย. พมิ พ์ครงั้ ท่ี 5. กรงุ เทพฯ: บรษิ ทั ธรรมสารจาํ กัด; 2553. อรุณ จิรวฒั นก์ ุล. สถิติทางวทิ ยาศาสตร์สขุ ภาพเพือ่ การวจิ ัย. พมิ พค์ รง้ั ท่ี 1. กรงุ เทพฯ: บริษทั วิทยพฒั น์ จํากดั ; 2552. อรุณ จริ วฒั นก์ ลุ และคณะ. ชวี สถิต.ิ พิมพ์ครงั้ ที่ 4. ขอนแก่น: โรงพมิ พค์ ลังนานาวิทยา; 2550. Altman DG. Practical Statistics for Medical Research. London: Chapman & Hall; 1991. Altman DG, Machin D, Bryant TN, Gardner MJ. Statistics with Confidence: Confidence Intervals and Statistical Guidelines. 2nd ed. Oxford: Wiley; 2013. Armitage P, Berry G, Matthews JNS. Statistical Methods in Medical Research. 4th ed. Oxford: Wiley; 2013. Daniel WW, Cross CL. Biostatistics: A Foundation for Analysis in the Health Sciences. 10th ed. New Jersey: John Wiley & Sons, Inc.; 2013. Dawson B, Trapp R. Basic & Clinical Biostatistics. 4th ed. United States of America: McGraw-Hill Education; 2004. Freund JE. Mathematical Statistics. 7th ed. Englewood Cliffs, NJ: Prentice Hall; 2004. Freund JE, Perles BM. Modern Elementary Statistics. 12th ed. Englewood Cliffs, NJ: Prentice Hall; 2007. Gupta CB, Gupta V. Introduction to Statistical Methods. 23th ed. New Delhi: Vikas Publishing House Pvt Limited; 2009. Kirkwood B, Sterne J. Essential Medical Statistics. 2nd ed. Oxford: Wiley; 2003. MacDonald TH. Basic Concepts in Statistics and Epidemiology. Oxford: Radcliffe Pub.; 2007. Wassertheil-Smoller S, Smoller J. Biostatistics and Epidemiology: A Primer for Health and Biomedical Professionals. 4th ed. New York: Springer; 2015. Zar JH. Biostatistical Analysis. 5th ed. London: Pearson Education Limited; 2014. ~ 170 ~
ตารางสถติ ิ ~ 171 ~
สารบัญตารางสถิติ หน้า 1 ตาราง ส 1 Random Number 4 ตาราง ส 2 Individual Terms, Binomial Distribution 10 ตาราง ส 3 Individual Terms, Poisson Distribution 14 ตาราง ส 4 Normal Distribution 17 ตาราง ส 5 t - Distribution 18 ตาราง ส 6 2 - Distribution ตาราง ส 7 Percentage Points of the F Distribution 19
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214