การจาลอง (simulation) – 195 – ตวั อย่างเกี่ยวกบั ฟงั ก์ชันการสรา้ งคา่ ของตัวแปรสุ่มที ฟังกช์ ัน rt( ) 7.2.3 การแจกแจงไคสแควร์ (Chi –square distribution) ตัวแปรสุ่ม X มาจากประชากรที่มีการแจกแจงแบบปกติ มีคา่ เฉลีย่ และความ แปร ปรวน 2 ถา้ เลือกสุม่ ตัวอยา่ งมาจากประชากร 1 ค่า แลว้ ยกกําลังสองของคา่ คะแนน มาตรฐาน Z2 X2 2 จะได้การแจกแจงของ 2 ท่ีมีองศาอิสระเท่ากับ 1 (1) 2 ดงั น้นั หากเลอื กสุม่ ข้อมูลมา n ค่า จากตวั อย่างทเี่ ป็นอิสระกัน ผลบวกกาํ ลังสองของ คะแนนมาตรฐานทงั้ หมดจะมีการแจกแจงแบบ 2 ที่มีองศาอสิ ระเท่ากับ n กลา่ วคอื สามารถแสดงได้ว่า 2 Z12 Z22 ... Zn2 โดยฟงั ก์ชันการแจกแจงความนา่ จะเป็น ดังนี้ (n) f (x) 1n 1 X /2 ;X 0 เม่อื n คอื องศาแหง่ อสิ ระ(df) X2 2n / 2 e (n / 2) กราฟของการแจกแจงแบบ 2 จะมีลักษณะเบ้ขวา df = 5 df = 10 0 ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี
– 196 – การวิเคราะห์ข้อมลู ทางสถติ ิ โดยใชโ้ ปรแกรม R ฟังกช์ ันต่างๆ ท่ีใช้ในการแจกแจงไคสแควร์ dchisq(x, df, ncp = 0 , log = FALSE) pchisq(q, df, ncp = 0 , lower.tail = TRUE, log.p = FALSE) qchisq(p, df, ncp = 0 , lower.tail = TRUE, log.p = FALSE) rchisq(n, df, ncp = 0) โดยที่ x, q vector of quantiles p vector of probabilities n number of observations, If length(n) > 1, the length is taken to be the number required df degree of freedom (non-negative, but can be non-integer) ncp non-centrality parameter (non-negative) log, log.p logical; if TRUE, probabilities p are given as log(p) lower.tail logical; if TRUE (default), probabilities are P[X<=x], otherwise, P[X>x] ตัวอยา่ งการใชค้ ําสง่ั ฟงั ก์ชัน dchisq( ) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี
การจาลอง (simulation) – 197 – ฟงั ก์ชนั pchisq( ) ฟังกช์ ันการหา inverse cumulative probability ฟังกช์ นั qchisq( ) ฟังก์ชันการสรา้ งค่าของตัวแปรสุม่ ไคสแควร์ ฟงั กช์ นั rchisq( ) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
– 198 – การวิเคราะห์ขอ้ มูลทางสถติ ิ โดยใชโ้ ปรแกรม R 7.2.4 การแจกแจงเอฟ (F – distribution) ตวั แปรสุม่ แบบต่อเน่ือง X จะมกี ารแจกแจงแบบเอฟ เมื่อ X มคี า่ ต้ังแต่ 0 ขน้ึ ไป โดยการแจกแจงน้ีมาจากขอ้ มูลแบบไคสแคว์ 2 ตัวหารกัน ซงึ่ องศาแห่งอิสระของการแจก แจงนี้จะมีอยู่ 2 ค่าเสมอ ฟังก์ชันการแจกแจงความน่าจะเป็นน้คี อื f (x) n1 n1 1 ;X 0 [(n1 n1) / 2] n1 2 X2 (n1 / 2) (n2 / 2) n2 n1 n2 1 n1 X 2 n2 เมื่อ n1, n2 คอื องศาแห่งอิสระ(df) โดยกราฟของการแจกแจงแบบเอฟจะมีลักษณะเบ้ ขวา คลา้ ยกบั 2 df = 3, 5 df = 10, 26 0 ฟงั ก์ชนั ตา่ งๆ ท่ใี ช้ในการแจกแจงเอฟ df(x, df1, df2, ncp, log = FALSE) pf(q, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE) qf(p, df1, df2, ncp, lower.tail = TRUE, log.p = FALSE) rf(n, df1, df2, ncp) โดยท่ี x, q vector of quantiles p vector of probabilities n number of observations, If length(n) > 1, the length is taken to be the number required df1,df2 degree of freedom Inf is allowed ncp non-centrality parameter. If omitted the central F is assumed log, log.p logical; if TRUE, probabilities p are given as log(p) lower.tail logical; if TRUE (default), probabilities are P[X<=x], otherwise, P[X>x] ตวั อย่างการใชค้ าํ สง่ั ฟังก์ชนั df( ) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี
การจาลอง (simulation) – 199 – ฟงั ก์ชัน pf( ) ฟังกช์ ัน qf( ) ฟังก์ชันการสร้างคา่ ของตวั แปรสมุ่ เอฟ ฟงั ก์ชนั rf( ) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
– 200 – การวเิ คราะหข์ ้อมลู ทางสถติ ิ โดยใชโ้ ปรแกรม R สรุปชอ่ื การแจกแจงและ argument สําหรับฟังกช์ นั เกยี่ วกับความน่าจะเปน็ ดังนี้ การแจกแจงความน่าจะ ชื่อทเ่ี รียก สว่ นเตมิ เตม็ ในฟังกช์ นั หมายเหตุ เป็น (Distribution) (R name) (Additional argument) (Remarks) beta beta shape1, shape2, ncp binomial binom size, prob Cauchy cauchy location, scale chi-square chisq df, ncp exponential exp rate F f df1, df2, ncp gamma gamma shape, scale geometric geom prob hypergeometric hyper m, n, k log-normal lnorm meanlog, sdlog logistic Logis location, scale negative binomial nbinom size, prob normal norm mean, sd Poisson Pois lambda Student t t df, ncp uniform unif min, max Weibull weibull shape, scale Wilcoxon wilcox m, n ตวั อย่างการหาความน่าจะเป็น คล้ายกบั การเปิดตารางสถิติ (Z, t, chi-square, f) การแจกแจงแบบปกติ > require(BSDA) > normarea(70, 130, 100, 15) # Finds and P(70 < X < 130) given X is N(100,15) ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
> normarea(–1, 1, 0, 1) การจาลอง (simulation) – 201 – > normarea(–2, 2, 0, 1) ตวั อย่างการหาคา่ p-value สําหรับการทดสอบดว้ ยสถิติทดสอบที ## 2 – tailed p – value for t distribution > 2*pt(–2.87, df = 15) [1] 0.01168382 ## upper 5% point for an F(3, 5) distribution > qf (0.05, 3, 5, lower.tail = FALSE) [1] 5.409451 การวาดภาพกราฟฟังกช์ ันตา่ งๆ > curve(sin, -2*pi, 2*pi, xname = \"t\") ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
– 202 – การวเิ คราะหข์ อ้ มูลทางสถติ ิ โดยใช้โปรแกรม R ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิติและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี
8 การทดสอบการแจกแจง (Distribution testing) ลกั ษณะของข้อมูลที่นํามาศึกษาหรือนํามาทาํ การวจิ ัยนน้ั หากข้อมลู ไม่เปน็ ไปตามลักษณะที่ กําหนดหรอื ตามข้อตกลงเบอ้ื งตน้ อาจจะส่งผลตอ่ การหาความน่าจะเปน็ หรือตดั สนิ ใจทผ่ี ิดได้ เช่นขอ้ มูล นัน้ จะต้องมีการแจกแจงแบบปกติ มีความสมมาตร ดงั นน้ั หากนกั วิจัยไม่ม่นั ใจว่าข้อมลู เปน็ ไปตาม ข้อตกลงเบอื้ งต้น (assumptions) นกั วิจัยจาํ เปน็ ตอ้ งการมกี ารทดสอบสมมติฐานก่อน ในโปรแกรม R มีฟงั ก์ชนั เกี่ยวกบั การทดสอบการแจกแจงความนา่ จะเป็นท่ีสําคญั โดยจะอาศยั ความรจู้ ากบทท่ี 7 ใน การสรา้ งหรอื จาํ ลอง (simulation) ข้อมลู ขึ้นมาเพ่ือทําการศกึ ษา และจะสรา้ งฟังกช์ นั R จําลองข้อมูล ให้มีการแจกแจงแบบปัวสซ์ งนยั ทว่ั ไป (Generalized Poisson distribution) ซึง่ พึง่ มีใช้ในโปรแกรม R การแจกแจงน้ผี เู้ รยี บเรียงเคยเขยี นโปรแกรมจาํ ลองขอ้ มูลโดยใช้โปรแกรม FORTRAN90 เมื่อปี คศ. 2006 มานาํ เสนออัลกอลทิ ึมในบทนี้ด้วยเพ่ือเปรยี บเทยี บกับการเขยี นฟงั กช์ ันโดยโปรแกรม R ในการ ทดสอบการแจกแจงความน่าจะเป็นจะแบง่ ตามประเภทของตัวแปรสุม่ แบ่งได้ 2 ประเภทคอื ตัวแปรสมุ่ แบบต่อเนือ่ ง(Continuous random variables) 1. การแจกแจงปกติ 2. การแจกแจงที 3. การแจกแจงไคสแควร์ 4. การแจกแจงเอฟ ตวั แปรสุ่มแบบไมต่ ่อเนือ่ ง (Discrete random variables) 1. การแจกแจงทวินาม 2. การแจกแจงปัวสซ์ ง 3. การแจกแจงปวั ส์ซงนัยทัว่ ไป 8.1 การทดสอบความเป็นการกระจายแบบปกติ (Normality Test) หากข้อมูลมีการสมุ่ ตัวอย่างออกมาจากประชากรท่ีการกระจาย หรอื มกี ารแจกแจงแบบปกติ (Normal distribution) โดยปกตแิ ล้วกลุ่มตวั อยา่ งดังกลา่ วจะมีการกระจายแบบปกตติ าม ประชากรดว้ ยเช่นกัน แตก่ ็ไม่แน่เสมอไป เปน็ ไปไดท้ ่ีกลุ่มตวั อย่างทส่ี ุ่มมานนั้ จะมกี ารกระจายตัว หรอื แจกแจงไมเ่ ปน็ ลักษณะปกติ (Non-normal distribution) แต่นั่นก็ไมใ่ ช่ประเดน็ ปัญหาหาก วา่ ไม่ได้นาํ เอาค่าสถติ ิทไี่ ดจ้ ากกลมุ่ ตัวอยา่ งนั้นไปทําการอนุมานกลับไปยังประชากร เพยี งแตอ่ ธบิ าย โดยสถิติเชงิ พรรณนา แตเ่ มื่อใดก็ตามท่ีต้องการนําค่าสถติ ิท่ีได้จากกลุ่มตัวอย่างไปทาํ การอนมุ านถึง พารามเิ ตอรข์ องประชากร ตอ้ งแน่ใจวา่ ข้อมลู ดงั กล่าวหรอื กล่มุ ตัวอยา่ งน้ันตอ้ งมกี ารกระจายตวั เปน็ แบบปกติเสมอ หากไม่เช่นน้ันการอนุมาน เช่นการประมาณคา่ การทดสอบสมมตฐิ าน หรือ การอนมุ านด้วยเครื่องมือทางสถติ ิอนื่ ๆ ซึง่ ก็จะทาํ ให้ผลคลาดเคล่อื นขึ้นอยู่กับลักษณะความไมเ่ ปน็ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิตแิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี
– 204 – การวเิ คราะห์ข้อมูลทางสถิติ โดยใช้โปรแกรม R การกระจายตวั แบบปกติ เม่ือเป็นเชน่ น้ันแล้วการทดสอบวา่ ค่าสถิตทิ ี่ไดจ้ ากตวั อยา่ งมานนั้ มกี าร กระจายแบบปกตหิ รือไม่ จงึ เป็นสิง่ ทตี่ ้องทํา การทดสอบการแจกแจงแบบปกติสามารถทาํ ไดห้ ลาย วิธี อาจจะดลู กั ษณะทว่ั ไป summary แต่การทดสอบท่ีไดร้ ับความนิยมมากคือ Shapiro-Wilk test หรือเรียกสั้นวา่ W test โดยการทดสอบดว้ ยวิธีน้ตี ัวอยา่ งสุ่มมีขนาดไม่มาก (n 50) Shapiro-Wilk test สมมติฐานของการทดสอบ คือ Ho:...ระบุข้อมูลทสี่ ุม่ มา มกี ารแจกแจงแบบปกติ Ha:...ระบุขอ้ มลู ทีส่ ุ่มมา ไม่มีการแจกแจงแบบปกติ คาํ นวณหาตวั สถิตทิ ดสอบโดยเรียงลําดบั ค่าสังเกต n ค่าจากนอ้ ยไปหามาก X1 < X2 < …< Xn ตวั สถติ ิทดสอบ คือ n ; when n even ; when n odd W= b2 เมอื่ k โดยท่ี k = 2 n n (Xi X )2 b = ani1( X ni1 Xi ) 1 i1 i1 2 และ ani1 คือสัมประสิทธ์ขิ อง W-test ในการทดสอบการแจกแจงปกติซึง่ ได้จากเปดิ ตาราง ท้งั น้ี W มคี า่ มากกว่าศนู ย์เสมอและ W มคี า่ มากจะสนบั สนนุ Ho ดังนนั้ p – value = P(W < w) โดยไดจ้ ากตาราง Percentage point of the W test ตัวอยา่ ง 8.1 อาจารย์ตอ้ งการทดสอบวา่ คะแนนท่ีนักศึกษาจาํ นวน 10 คนสอบได้ มกี ารแจกแจง แบบปกตหิ รือไม่ มคี ะแนนดงั นี้ 18.2 17.9 18.3 18.5 19.2 19.5 20.6 19.6 20.3 20.5 วิธีทาํ 1. Ho: คะแนนของนกั ศึกษามกี ารแจกแจงแบบปกติ Ha: คะแนนของนักศึกษาไม่มกี ารแจกแจงแบบปกติ 2. เรยี งลาํ ดับข้อมูลจากน้อยไปหามาก 17.9 18.2 18.3 18.5 19.2 19.5 19.6 20.3 20.5 20.6 จาก k b = ani1(Xni1 Xi ) = 0.5739(20.6 – 17.9) + 0.3291(20.5 – 18.2) + i1 0.2141(20.3 – 18.3) + 0.1224(19.6 – 18.5) + 0.0399(19.5 – 19.2) = 2.88127 จาก n n n )2 = 3718.54 (192.6)2 10 (Xi X )2 = X 2 ( Xi = 9.064 i i1 i1 i1 n จาก W = b2 = (2.88127)2 = 0.916 n 9.064 ( Xi X )2 i1 3. เมือ่ n = 10 ได้วา่ P(W < 0.869) = 0.1 และ P(W < 0.938) = 0.5 ดังนน้ั 0.1 < p – value = P(W < 0.916) < 0.5 นน่ั คอื คะแนนทนี่ ักศึกษาสอบไดม้ ีการแจกแจงแบบปกติที่ระดบั นยั สําคญั 0.05 (p > 0.05) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี
การทดสอบการแจกแจง – 205 – จากตัวอยา่ งข้อมูลคะแนนสอบนักศึกษา เราจะมาใชโ้ ปรแกรม R ในการชว่ ยวเิ คราะห์ได้ดังน้ี การวเิ คราะห์เกีย่ วกับการแจกแจง จากข้อมูลน้าํ พุร้อน Old Faithful ถา้ ตอ้ งการวเิ คราะห์เก่ียวกบั การแจกแจง อนั ดบั แรกจะใช้ สถติ เิ ชิงพรรณนาเบ้ืองต้น เพ่อื ดูลกั ษณะทวั่ ไปก่อนแลว้ ค่อยดคู า่ การทดสอบทีล่ ะเอยี ดขึ้น เช่น summary และ fivenum หรอื stem หรือ ฮิสโตแกรม ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถิติและคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลัยอบุ ลราชธานี
– 206 – การวเิ คราะห์ข้อมูลทางสถติ ิ โดยใช้โปรแกรม R > hist(eruptions) ## make the bins smaller, make a plot of density > hist(eruptions, seq(1.6, 5.2, 0.2), prob = TRUE) > lines(density(eruptions, bw = 0.1)) > rug(eruptions) # show the actual data points ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
การทดสอบการแจกแจง – 207 – นอกจากน้ีการพจิ ารณา empirical cumulative distribution (ecdf) ก็เปน็ อีกวิธหี นึง่ ในการศึกษา เก่ยี วกับการวิเคราะห์การแจกแจง > plot(ecdf(eruptions), do.points=FALSE, verticals=TRUE) > long <- eruptions[eruptions > 3] > plot(ecdf(long), do.points=FALSE, verticals=TRUE) > x <- seq(3, 5.4, 0.01) > lines(x, pnorm(x, mean = mean(long), sd = sqrt(var(long))), lty =3) ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี
– 208 – การวิเคราะห์ขอ้ มลู ทางสถิติ โดยใชโ้ ปรแกรม R การทดสอบการแจกแจงว่าเป็นการแจกแจงปกติหรือไม่ ซ่ึงจะใช้การทดสอบ Shapiro-Wilk test และการทดสอบดว้ ยสถติ ิทดสอบ Kolmogorov-Smirnov test ในการศึกษาเร่ืองการทดสอบการแจกแจงต่างๆ น้ันจะวางการทดสอบ โดยมีขน้ั ตอนการ ดําเนนิ การดังน้ี 1. สร้างขอ้ มลู (generate data) ใหม้ ีการแจกแจงแบบต่างๆ จํานวนขอ้ มูล 100 ค่า 2. ทําการทดสอบการแจกแจงน้ันว่ามีการแจกแจงตามท่ีสร้างขอ้ มลู มา จริงหรือไม่ โดยใช้การทดสอบ ดว้ ยสถติ ิทดสอบ Kolmogorov-Smirnov test 3. สรุปผลการทดสอบ ตัวแปรสมุ่ แบบต่อเน่ือง(Continuous random variables) 1. การแจกแจงปกตมิ าตรฐาน (Standard Normal distribution) 1.1 สร้างขอ้ มลู จํานวน 100 คา่ ใหม้ ีการแจกแจงแบบปกตมิ าตรฐาน ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี
การทดสอบการแจกแจง – 209 – 1.2 ทําการทดสอบการแจกแจงน้นั ว่ามกี ารแจกแจงตามที่สรา้ งข้อมลู มา จรงิ หรือไม่ โดยใช้การทดสอบ ด้วยสถติ ทิ ดสอบ Kolmogorov-Smirnov test 1.3 สรุปผลการทดสอบ เม่ือทดสอบการแจกแจงเป็นแบบปกติมาตรฐานหรือไม่ ได้ค่า w = 0.98463 และเมื่อดทู ี่คา่ p (p-value = 0.2987) ซ่ึงมคี า่ มากกว่า 0.05 จึงยอมรับ Ho หรือเมอื่ ใช้ Kolmogorov-Smirnov test ได้คา่ D = 0.072593 หรอื ดูที่ p-value = 0.6677 ซึง่ มคี า่ มากกวา่ 0.05 จึงยอมรบั Ho กลา่ วคือมกี ารแจกแจงปกติมาตรฐานจรงิ 2. การแจกแจงปกติ (Normal distribution) 2.1 สร้างขอ้ มลู จํานวน 100 คา่ ใหม้ ีการแจกแจงแบบปกติท่ีมีคา่ เฉลย่ี 15 และสว่ นเบย่ี งเบน มาตรฐาน 1.28 2.2 ทาํ การทดสอบการแจกแจงน้ันว่ามกี ารแจกแจงตามทสี่ รา้ งข้อมลู มา จรงิ หรอื ไม่ โดยใชก้ ารทดสอบ ดว้ ยสถติ ทิ ดสอบ Kolmogorov-Smirnov test 2.3 สรปุ ผลการทดสอบ เม่ือทดสอบการแจกแจงเปน็ แบบปกตหิ รอื ไม่ ได้คา่ w = 0.99293 และเม่อื ดู ท่ีค่า p (p-value = 0.8837) ซ่งึ มีคา่ มากกว่า 0.05 จึงยอมรับ Ho หรือเม่ือใช้ Kolmogorov-Smirnov test ไดค้ า่ D = 0.15874 หรอื ดูท่ี p-value = 0.01295 ซึง่ มีค่ามากกวา่ 0.01 จงึ ยอมรบั Ho กล่าวคือมกี ารแจกแจงปกตจิ ริง ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถิตแิ ละคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี
– 210 – การวิเคราะหข์ ้อมลู ทางสถติ ิ โดยใชโ้ ปรแกรม R 3. การแจกแจงที (t distribution) 3.1 สรา้ งขอ้ มูล จํานวน 100 คา่ ให้มกี ารแจกแจงแบบที 3.2 ทาํ การทดสอบการแจกแจงนัน้ ว่ามีการแจกแจงตามท่สี รา้ งข้อมูลมา จริงหรือไม่ โดยใช้การทดสอบ ดว้ ยสถติ ิทดสอบ Kolmogorov-Smirnov test 3.3 สรุปผลการทดสอบ เมอื่ ทดสอบการแจกแจงเป็นแบบปกติหรอื ไม่ ได้คา่ w = 0.96345 และเม่ือดทู ่ีคา่ p (p-value = 0.007143) ซ่งึ มีค่าน้อยกว่า 0.05 จึงปฏเิ สธ Ho หรือเมื่อใช้ Kolmogorov- Smirnov test ได้คา่ D = 0.10925 หรอื ดทู ี่ p-value = 0.1837 ซึง่ มคี ่ามากกวา่ 0.05 จึงยอมรับ Ho กล่าวคอื มีการแจกแจงแบบทจี รงิ ลองพิจารณา ผลการทดสอบนแ้ี ลว้ สรปุ ได้วา่ ..... ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถิติและคอมพวิ เตอร์ คณะวิทยาศาสตร์ มหาวทิ ยาลัยอบุ ลราชธานี
การทดสอบการแจกแจง – 211 – 4. การแจกแจงไคสแควร์ (Chi – square distribution) 4.1 สรา้ งข้อมูล จาํ นวน 100 ค่า ให้มีการแจกแจงแบบไคสแควร์ 4.2 ทาํ การทดสอบการแจกแจงนั้นว่ามกี ารแจกแจงตามทสี่ ร้างข้อมูลมา จริงหรือไม่ โดยใช้การทดสอบ ดว้ ยสถิตทิ ดสอบ Kolmogorov-Smirnov test 4.3 สรปุ ผลการทดสอบ เมื่อทดสอบการแจกแจงเปน็ แบบปกตหิ รือไม่ ไดค้ า่ w = 0.98932 และเม่ือดูทีค่ ่า p (p-value = 0.6096) ซงึ่ มคี ่ามากกวา่ 0.05 จงึ ยอมรับ Ho หรอื เม่ือใช้ Kolmogorov- Smirnov test ได้คา่ D = 0.061133 หรือดูที่ p-value = 0.8489 ซ่งึ มีค่ามากกวา่ 0.05 จงึ ยอมรบั Ho กล่าวคอื ขอ้ มูลมีการแจกแจงแบบไคสแควร์ ทีม่ ี df = 20 จรงิ 5. การแจกแจงเอฟ (F distribution) 5.1 สร้างข้อมลู จํานวน 100 คา่ ให้มีการแจกแจงแบบเอฟ ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณติ ศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
– 212 – การวิเคราะหข์ ้อมูลทางสถิติ โดยใช้โปรแกรม R 5.2 ทําการทดสอบการแจกแจงนน้ั วา่ มกี ารแจกแจงตามที่สรา้ งข้อมูลมา จรงิ หรือไม่ โดยใช้การทดสอบ ดว้ ยสถติ ทิ ดสอบ Kolmogorov-Smirnov test 5.3 สรปุ ผลการทดสอบ เมอ่ื ทดสอบการแจกแจงเป็นแบบปกตหิ รือไม่ ไดค้ า่ w = 0.8816 และเม่ือดูท่ีคา่ p (p-value = 2.122e-07) ซ่งึ มีค่าน้อยกว่า 0.05 จึงปฏเิ สธ Ho ข้อมูลน้ันมีการแจกแจง หรือเมื่อใช้ Kolmogorov-Smirnov test ได้ค่า D = 0.082431 หรือดทู ่ี p-value = 0.5052 ซ่ึงมคี ่ามากกวา่ 0.05 จงึ ยอมรับ Ho กลา่ วคือข้อมลู มีการแจกแจงแบบเอฟ ท่ีมี df1= 10 และ df2 = 20 จริง ตวั แปรสมุ่ แบบไมต่ อ่ เนื่อง (Discrete random variables) 6. การแจกแจงทวินาม (Binomial distribution) 6.1 สรา้ งข้อมลู จาํ นวน 100 ค่า ให้มีการแจกแจงแบบทวนิ าม 6.2 ทําการทดสอบการแจกแจงนั้นว่ามกี ารแจกแจงตามที่สรา้ งข้อมูลมา จรงิ หรือไม่ โดยใชก้ ารทดสอบ ด้วยสถิตทิ ดสอบ Kolmogorov-Smirnov test ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณติ ศาสตร์ สถติ ิและคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวิทยาลยั อบุ ลราชธานี
การทดสอบการแจกแจง – 213 – 7. การแจกแจงปวั สซ์ ง (Poisson distribution) 7.1 สรา้ งขอ้ มลู จํานวน 100 ค่า ให้มีการแจกแจงแบปัวสซ์ ง 7.2 ทําการทดสอบการแจกแจงนั้นว่ามีการแจกแจงตามท่ีสรา้ งข้อมูลมา จริงหรือไม่ โดยใชก้ ารทดสอบ ด้วยสถิตทิ ดสอบ Kolmogorov-Smirnov test 8. การแจกแจงปวั ส์ซงนยั ท่ัวไป (Generalized Poisson distribution) อย่ใู นขัน้ ตอนการพฒั นายังไม่แลว้ เสรจ็ ❑❑❑❑❑❑❑ ผศ.ดร.บรรทม สรุ ะพร ภาควชิ าคณิตศาสตร์ สถติ แิ ละคอมพิวเตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี
บรรณานกุ รม Becker, R.A., Chambers, J. M. and Wilks, A. R. (1988). The New S Language. Wadsworth & Brooks/Cole. Braum, W. J. and Murdoch, D. J. (2007). A First Course in Statistical Programming with R, Cambridge University Press. Cambers, J. M. and Hastie, T. J. (eds.) (1992). Statistical Models in S. Chapman & Hill, New York. Cambers, J. M. (1998). Programming with Data. Springer, New York. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Lawrence Eribaum Associates, publishers. Ugarte, M.D., Militino, A. F., and Arnholt, A. T. (2008). Probability and Statistics With R. CRC Press. R Development Core Team (2012), R: A Language and Environment for Statistical Computing, Vienna, Austria, http://www.R-project.org. ผชู้ ่วยศาสตราจารย์ ดร.บรรทม สุระพร, เอกสารประกอบการสอน สถิติเบือ้ งต้น, (2556). คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี ผชู้ ่วยศาสตราจารย์ ดร.วนิ ยั โพธ์ิสุวรรณ์, เอกสารประกอบการอบรมเรื่อง การประมวลผลและการวิเคราะห์ ข้อมลู ทางสถิติโดยใช้โปรแกรม R รุ่นท่ี ๕ วนั ท่ี ๑๘ – ๑๙ ตุลาคม ๒๕๕๕, คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั เกษตรศาสตร์. ผศ.ดร.บรรทม สรุ ะพร ภาควิชาคณิตศาสตร์ สถติ แิ ละคอมพวิ เตอร์ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั อบุ ลราชธานี
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220