Sección 11. 3: La estim ación de diferencias entre m edias 369 Use este resultado para encontrar c de m anera que R < 6 < cR es un intervalo de confianza del (1 — a ) 10 0 % p ara 6. 1 1 .4 M uestre q u e el intervalo de confianza del (1 — o)100% es más corto que el intervalo de confianza del (1 — a ) 100% * ~ ^ <* + 1 1 .5 M uestre que de todos los intervalos de confianza del (1 — a ) 100% d e la form a 1 “ M< x + el que tiene k = 0.5 es el m ás corto. 11 .6 M uestre q u e si x se usa com o una estim ación p u n tu al d e ¿i y a es conocida, la p ro b a b ilid a d e s 1 — a de q u e | x — ¡x | , el valo r a b so lu to d e n u e stro e rro r, no excederá una cantidad especificada e cuando (T 2 n = z»n *T (Si resulta que n < 30, esta fórm ula no se puede usar, a m enos que sea razo nable suponer que estam os m uestreando a partir de una población norm al.) 1 1 .7 M o d ifiq u e e l te o re m a 11.1 de m an e ra q u e se p u e d a u sa r p a ra e v a lu a r el e rro r máximo cuando a 2 sea desconocida. (A dvierta que este m étodo se puede usar sólo después de haber obtenido los datos.) 1 1 .8 E n u n cie u n teo re m a an álo g o al teo re m a 11.1, lo que nos p e rm ite ev alu ar el error m áxim o al usar x , — x 2 com o una estim ación de — fi2 en las condi ciones del teo re m a 11.4. 11.9 M uestre que es un estim ador insesgado de a 2 y encuentre su varianza en las co n d icio n es del te o re m a 11.5. 1 1 .1 0 V erifique el resultado de la página 367, el cual expresa T en térm inos de A ',, X 2 y s p. APLICACIONES 11.11 U n a funcionaría de distrito in ten ta usar la m edia de una m uestra aleatoria de 150 alum nos de sexto añ o de un distrito escolar muy grande para estim ar la m e dia de la puntuación que todos los alum nos de sexto año en el distrito o b ten d rían si to m aran cierta p ru eb a de ren d im ien to aritm ético. Si, b asad a en la experiencia, la funcionaría sabe que a = 9.4 para tales datos, ¿qué se puede afirm ar con probabilidad de 0.95 acerca del e rro r m áxim o?
370 Capítulo 11: Estimación: aplicaciones 11.12 C o n re sp e c to al ejercicio 11.11, su p o n g a q u e la fu n cio n aría d e d istrito to m a su m uestra y obtiene x = 61.8. U se toda la inform ación dada para construir un intervalo de confianza del 99% para la m edia de la puntuación de todos los alum nos de sexto año en el distrito. 11.13 U n investigador m édico p re te n d e usar la m edia d e u n a m u estra a le a to ria d e ta m año n = 1 2 0 para estim ar la m edia de la presión arterial de m ujeres de cin c u e n ta años. Si, con base en su experiencia, sabe q u e cr = 10.5 m m de m ercurio, ¿qué puede afirm ar con probabilidad de 0.99 acerca del erro r m áxim o? 11.14 C on re sp e c to al ejercicio 11.13, suponga q u e el in v estig ad o r to m a su m u e stra y obtiene x = 141.8 m m de m ercurio. C onstruya un intervalo de confianza del 98% p ara la m edia de la presión arterial de m ujeres de cincuenta años. 11.15 U n estudio del crecim iento anual d e ciertos cactus m ostró que 64 de ellos, seleccio nados aleatoriam ente en una región desértica, crecieron en prom edio 52.80 m m con una desviación estándar de 4.5 mm. Construya un intervalo de confianza del 99% para el verdadero prom edio de crecim iento anual de la clase dada de cactus. 11.16 Para estim ar el tiem po prom edio req u erid o p a ra ciertas reparaciones, un fabrican te de autom óviles pidió que se tom ara el tiem po a 40 m ecánicos, una m uestra aleatoria, en la ejecución de esta tarea. Si tard aro n un prom edio d e 24.05 m i nutos con una desviación estándar de 2 .6 8 m inutos, ¿qué puede afirm ar el fa b ricante con 95% de confianza sobre el m áxim o e rro r si usa x = 24.05 m inutos com o una estim ación de la m edia del tiem po real requerido para ejecutar las re paraciones dadas? 11.17 Si una m u estra constituye una prop o rció n sensible, esto es, m ás del 5 p o r ciento de la población d e acuerdo a la regla em pírica de la página 275, las fórm ulas de los teorem as 11.1 y 11.2 deben m odificarse al usar la fórm ula d e la varianza del teo re m a 8 .6 en vez de la del teo rem a 8.1. P o r ejem plo, el e rro r m áxim o en el teorem a 11.1 se vuelve cr ¡ N — n Zo/2' V ^ V N - 1 U se esta m odificación p ara reh acer el ejercicio 11.11, d ad o que hay 900 alum nos de sexto año en el distrito escolar. 11.18 U se la m odificación sugerida e n el ejercicio 11.17 p a ra reh a c e r el ejercicio 11.12, dado que hay 900 alum nos de sexto año en el distrito escolar. 11.19 U n e x p e rto e n eficiencia q u iere d e te rm in a r la c a n tid ad p ro m e d io d e tie m p o que tarda la cuadrilla de un foso en cam biar un juego de cuatro neum áticos a un au to d e carreras. U se la fórm ula p a ra n del ejercicio 11.6 p ara d e te rm in a r el ta m año de la m uestra que se necesita para que el experto en eficiencia pueda afirm ar con 95% de probabilidad que la m edia de la m uestra diferirá de /x, la cantidad a ser estim ada, en m enos de 2.5 segundos. Se sabe p o r estudios p re vios q u e cr = 1 2 .2 segundos. 11.20 E n un e stu d io so b re h á b ito s d e v e r televisión, se d e se a e stim a r el p ro m e d io del núm ero de horas a la sem ana que los adolescentes dedican a verla. Si es razo n a b le s u p o n e r q u e cr = 3.2 h o ras, ¿ q u é ta n g ran d e necesita se r la m u e stra de m anera qu e sea posible afirm ar con 95% de confianza que la m edia de la m ues tra e stá e rra d a en m enos de 2 0 m in u to s? (Sugerencia: refiérase al ejercicio 1 1 .6 .)
Sección 11. 4: La estim ación d e proporciones 373 X. d on d e 0 = — . E ntonces, si sustituim os 0 por 0 d e n tro de los radicales, lo q u e es una aproximación adicional, obtenem os TEOREMA 11.6 Si X es una variable aleato ria binom ial con los p a rá m etro s n y AX 0, n e s g ra n d e y 0 = —, e n to n c e s es un intervalo de confianza aproxim ado del (1 — a ) 1 0 0 % p ara 6. EJEM PLO 11.7 E n una m uestra aleato ria, 136 personas de 400, a quienes se les aplicó una vacuna contra la influenza, experim entaron cierta incom odidad. Construya un intervalo de confianza del 95% para la verdadera proporción que experim entará alguna incom odidad por la vacuna. Solución Sustituim os n = 400, 0 = ^ = 0.34 y z0023 = 1.96 en la fórm ula del intervalo d e co n fian za d el teo re m a 1 1 .6 , y o b te n e m o s “ - “ - •*-I¡s¥ s 0.294 < 0 < 0.386 o, al red o n d e a r a dos decim ales, 0.29 < 0 < 0.39. ▲ U sam os las m ism as aproxim aciones q u e nos llevaron al teo re m a 11.6, y tam bién p o d e m os escribir t e o r e m a 11.7 Si 6 = se usa com o un estim ad o r de 9, podem os afirm ar con (1 — a ) 1 0 0 % de confianza que el error es m enor que ‘,•0/2 . VÍ * ( *n- * ) EJEM PLO 11.8 Se hace un estudio para determ inar la proporción de votantes en una com unidad bas tante grande que están a favor de la construcción de una planta nuclear. Si 140 de 400
Sección 11. 5: La estim ación de diferencias entre pro po rcio nes 375 es una variable aleatoria que tiene aproxim adam ente la distribución norm al estándar. S ustituim os e sta ex p resió n p o r Z en P ( ~ z a/2 < Z < z o/2) = 1 — a , y llegam os al si guiente resultado TEOREMA 11.8 Si A\", es u n a v ariab le a le a to ria binom ial con los p a rá m e tro s n , y 0 ,. X 2 es una variable aleatoria binom ial con los parám etros n 2 y 02, n , y n 2 son grandes, Jy 6, = —r?| Jy 0-, *= n2 entonces 0 1 (8 , - 82) - ^ + e : i \\ „ \" :> < 8 . - 8 2 'fí n\\l «.(I - « . ) , 8 2 ( 1 - 8 2 ) < (8, - 8,) + ñ ,---- + -------ñ .j------- es un in terv alo d e confianza ap ro x im ad o d e ( 1 — a ) 1 0 0 % p ara 0 , — 62. EJEM PLO 11.9 Si 132 d e 200 v o tan tes ho m b res y 90 d e 159 v o tan tes m u jeres e stán a favor de cierto candidato que hace cam paña para gobernador de Illinois, encuentre un intervalo de confianza del 99% para la diferencia entre las proporciones reales de votantes hom bres y votantes m ujeres que están a favor del candidato. Solución S u stitu im o s 0 | ~ 5¡í¡ = 0.66, 0 2 = Tso = 0 .60 y z0.oo5 = 2.575 e n la fó rm u la del in te rv alo d e co n fian za del te o re m a 1 1 .8 , y o b ten e m o s (0 .6 6 - 0.60) - 2, 75^ M +M M < (0. 66 - 0.60) + + la que se reduce a -0 .0 7 4 < 0 , - 02 < 0.194 Así, estam os 99% seguros de que el intervalo de -0.074 a 0.194 contiene la dife rencia entre las proporciones reales de votantes hom bres y m ujeres que favore cen al candidato. O bserve que esto incluye la posibilidad de una diferencia cero entre las dos proporciones. A
Capítulo 11: Estimación: aplicaciones EJERCICIOS 11.29 Al despejar x — nO x - nd Z\" ' ~ V n « ( l - « ) V V nB (1 - 6) “ para 0. m uestre que X + -1- Z 2aa ±. z a,7 y j!x [n n~ jf) +. -1- V ar,n \" + lia son los lím ites con ( 1 — a ) 1 0 0 % de co n fian za p a ra 0. 1 130 U se la fó rm u la del teo re m a 11.7 p ara m o strar q u e podem os e s ta r al m enos (1 — a ) 1 00% seguros de que el error que com etem os es m enor que e cuando usamos una proporción m uestral 0 = —con com o u n a estim ación d e 0. 1131 E n cu en tre una fórm ula p ara n análoga a la del ejercicio 11.30 cuando se sabe que 0 debe estar en el intervalo entre 0' y 6\". 11.32 C o m p lete los d etalles q u e llev aro n d e la estad ística Z e n la p ág in a 374, su stitu i d a e n P ( —Z„fi < Z < z ap ) = 1 — a , a la fórm ula del in te rv alo d e confianza del te o re m a 1 1 .8 . 1133 E n c u e n tre u n a fó rm u la p a ra el e r r o r m áx im o a n á lo g a a la d e l te o re m a 11.7 c u a n d o u sam o s 0 X — 0 2 co m o u n a estim ación d e — 92. 1 1 3 4 U se el resu ltad o del ejercicio 11.33 p a ra m o strar q u e cuando n, = n 2 — n , p o dem os estar al m enos ( 1 — a ) 1 00% seguros de que el e rro r que com etem os al aa u sa r 6\\ — 0 2 c o m o u n a estim ación de Bx — $2 es m e n o r q u e e c u a n d o APLICACIONES 1135 U na encuesta m uestral en un superm ercado m ostró que 204 de 300 com prado res usan regularm ente cupones de descuento. U se la fórm ula de m uestra gran de para el intervalo de confianza del teorem a 11.6 para construir un intervalo con 95% de confianza para la verdadera proporción correspondiente. 1 1 3 6 C on resp ecto al ejercicio 11.35, ¿qué podem os decir con 99% de confianza so bre el e rro r m áxim o si usam os la proporción m uestral observada com o una es tim ación d e la proporción de todos los com pradores en la población m uestreada que usan cupones de descuento?
Sección 11. 5: La estim ación de diferencias entre pro po rcio nes 377 1 1 3 7 E n u n a m u e stra a le a to ria de 250 tele sp ec tad o re s en u n a ciudad g ra n d e , 190 h a bían visto cierto program a polémico. Construya un intervalo de confianza del 99% para la verdadera proporción correspondiente, use (a ) la fórm ula de m uestras grandes para el intervalo de confianza del teorem a 1 1 .6 ; (b ) los lím ites d e confianza del ejercicio 11.29. 1 1 3 8 C on respecto al ejercicio 11.37, ¿qué podem os decir con 95% de confianza acer ca del e rro r m áxim o si usam os la proporción observada de la m uestra com o una estim ación de la verdadera proporción correspondiente? 1 1 3 9 E n tre 100 p eces c a p tu ra d o s e n c ie rto lago. 18 no e ra n com estibles c o m o resu l tado de la contam inación quím ica del am biente. C onstruya un intervalo de con fianza del 99% para la verdadera proporción correspondiente. 11.40 E n una m u estra aleato ria de 120 an im adoras, 54 habían sufrido d añ o s, de m o d e rados a severos, en sus voces. Con 90% de confianza, ¿qué podem os decir sobre el e rro r m áxim o si usam os la proporción m uestral ^ = 0.45 com o una estim a ción de la v erd ad era proporción d e anim adoras que padecen d e esta m anera? 11.41 E n u n a m u e stra a le a to ria de 300 p e rso n a s q u e co m en e n la c a fe te ría de una tienda dep artam en tal, sólo 102 pidieron postre. Si usam os = 0.34 com o una es timación de la verdadera proporción correspondiente, ¿con qué confianza po dem os afirm ar que nuestro e rro r es m enor que 0.05? 11.42 U n a política solicita una encuesta de opinión privada para estim ar q u é proporción de sus electores están a favor de que ciertas violaciones m enores de narcóticos ya no constituyan un delito. U se la fórm ula del ejercicio 11.30 para determ inar qué tan grande d eb erá ser la m uestra de la encuesta para ten er al m enos 95% de con fianza d e q u e la pro p o rció n m uestral tiene un e rro r m en o r q u e 0 .0 2 . 11.43 U se el re su lta d o del ejercicio 11.31 p a ra re h a c e r el ejercicio 11.42, d a d o q u e la encuesta tiene razones para cre e r que la verdadera proporción no excede 0.30. 11.44 S uponga q u e q u erem o s estim ar qué pro p o rció n de to d o s los autom ovilistas exce den el lím ite legal de la velocidad en cierto tram o de la carretera en tre Los Á n geles y B akersfield. U se la fórm ula del ejercicio 11.30 p ara determ inar de qué tam año se necesitará la m uestra a fin de estar al m enos 99% seguro de que la es tim ación resultante, la proporción m uestral, tiene un e rro r de m enos de 0.04. 11.45 U se el re su lta d o del ejercicio 11.31 p a ra re h a c e r el ejercicio 11.44, d a d o q u e te nemos buenas razones para creer que la proporción que estam os tratando de estim ar es al m enos 0.65. 11.46 En una m uestra aleatoria de visitantes a un sitio turístico fam oso, 84 de 250 hom bres y 156 de 250 m ujeres com praron recuerdos. C onstruya un intervalo de confianza del 95% para la verdadera proporción de hom bres y m ujeres que com pran recuerdos en este sitio turístico. 11.47 E n tre 500 solicitudes de licencias de m atrim o n io escogidas aleato riam en te en un año dado, hubieron 48 en que la m ujer era al m enos un año m ayor que el hom bre, y en tre 400 solicitudes de licencias de m atrim onio escogidas aleatoria m ente seis años después, hubieron 6 8 en los cuales la m ujer era al m enos un
378 Capítulo 11: Estimación: aplicaciones año m ayor que el hom bre. Construya un intervalo de confianza del 99% para la diferencia entre las verdaderas proporciones correspondientes de solicitudes de licencias de m atrim onio en que la m ujer es al m enos un año m ayor que el hombre. 11.48 C o n re sp e c to al ejercicio 11.47, ¿q u é p o d e m o s d e c ir con 98% d e co n fian za a c er ca del erro r m áxim o si usam os la diferencia entre las proporciones m uéstrales observadas com o una estim ación de la diferencia entre las verdaderas propor ciones correspondientes? (Sugerencia: use el resultado del ejercicio 11.33.) 11.49 S u ponga q u e q u e re m o s d e te rm in a r la d iferen cia e n tre las p ro p o rc io n es d e clien tes de una cadena de donas en C arolina del N orte y V erm ont que prefieren las donas de la cadena a las de todos sus com petidores. Use la fórm ula del ejerci cio 11.34 para determ inar el tam año de las m uestras que se necesitan p ara e s tar 95% seguros de que la diferencia entre las dos proporciones m uéstrales está en e rro r p o r m enos de 0.05. 11.6 LA E S TIM A C IÓ N D E V A R IA N Z A S D ada una m uestra aleatoria de tam año n de una población normal, podem os obtener un intervalo de confianza del (1 — a ) 1 0 0 % para tr2 al hacer uso del teorem a 8 .1 1 , de acuerdo al cual (« ~ I )* 2 es una variable aleatoria que tiene la distribución ji cuadrada con n — 1 grados de li bertad. Así (n - 1)5 2 X \\-a/2,n-\\ *o/2,n-l = 1 — a (<■ ~ i ) * * < a ' < (» - i ) * 2 = 1 — a Xafí, n—1 X 1—a/2,n—1 . d o n d e x l / 2.n - i y * 1- 0/2,11-1 5 0 0 c o m o se d e fin e n e n la p á g in a 282, y o b ten e m o s T E O R E M A 11.9 Si s2 es el valor de la varianza de una m uestra aleatoria de ta m año n de una población norm al, entonces (” ~ i )*2 ^ 3 ^ (” ~ i )*2 2 ^“ 2 Xa/2.n-l X \\ —a/\"2,n-\\ e s un in te rv a lo de co n fian za d el ( 1 — a ) 1 0 0 % p a ra a 2.
Sección 11. 7: La estim ación de la razón o cocientre entre dos varianzas 379 L os lím ites c o rre sp o n d ie n te s con (1 — a ) 100% de confianza p a ra cr se p u e d e n o b te n er al sacar la raíz cuadrada de los lím ites de confianza p ara c r. EJEM PLO 11.10 E n 16 co rrid as d e p ru e b a el c o n su m o de gasolina d e un m o to r e x p e rim e n tal tuv o una desviación están d ar de 2.2 galones. C onstruya un intervalo de confianza del 99% para cr2, q u e m ide la v e rd a d e ra v ariab ilid ad d el c o n su m o de gasolina d el m otor. Solución A l suponer que los datos observados se pueden considerar com o una m uestra aleato ria d e una población norm al, sustituim os n = 16 y s = 2 .2 , ju n to con * 0005. u = 32.801 y 15 = 4.601, o b ten id a s d e la tab la V , e n la fó rm u la del in te rv alo d e confianza d el te o re m a 11.9, y o b ten e m o s 15(2.2)2 , 15(2.2)2 32.801 4.601 o 2.21 < a 2 < 15.78 ▲ P ara o b te n e r el in terv alo co rresp o n d ien te con 99% d e confianza p a ra cr, sacam os la raíz c u a d ra d a y o b ten e m o s 1.49 < cr < 3.97. 11.7 LA E S TIM A C IÓ N D E LA R A ZÓ N O CO C IEN TE ENTRE D O S V A R IA N Z A S Si S2 y son las varianzas de m uestras aleatorias independientes de tam año « | y n 2 de poblaciones norm ales, entonces, de acuerdo al teorem a 8.15, 2 c2 F = r<rJ1\\ ¿C2l es u n a variab le a le a to ria q u e tien e u n a d istrib u ció n F con n , — 1 y rt2 — 1 g rad o s de libertad. Así, podem os escribir ( CTj -S| \\ • - l . / i j - l ^ ^ 2 ^ 2 < Jto/Z.», - 1 . nj- 1 J ~ 1 — donde y Á - a /2.n, - i , n 2- i son com o ^ d e fin e e n la p ág in a 287. P u e sto que
380 Capítulo 11: Estimación: aplicaciones A —a'2.n¡ —l.nj —1 1 (véase el ejercicio 8.57), se sigue que fa/2,H2~ 1.Mi —1 TEOREMA 11.10 Si sf y si son los v a lo re s d e las v arian zas d e m u estra s a le a to rias independientes de tam año n x y n 2 de poblaciones norm ales, entonces s2 , _ 2 „2 í í 1 € £? < £i f s l ' U nt-U n2- i « l ,- . - a2 es un in te rv alo d e co n fian za d el ( 1 — a ) 1 0 0 % p a ra —j - *2 Los límites correspondientes con (1 — a ) 100% de confianza para — se pueden o b te n e r al sacar la raíz c u a d ra d a d e los lím ites d e confianza p a ra —f . <*2 EJEM PLO 11.11 C o n resp ecto al ejem p lo 11.6, e n c u e n tre el in te rv alo d e co n fian za d el 98% p a ra —5-. Solución = 0.5, s2 = 0.7 y X.m.o.? = ó .7 2 y X 0i.7.9 = 5.61 Sustituim os n , = 10, n 2 = 8, de la tabla VI, y obtenem os -5.61 0.49 6.72 a \\ 0.49 o 2 0.076 < -4- < 2.862 az P uesto q ue el intervalo aquí obtenido incluye la posibilidad de que la razón sea 1, no hay evidencia real contra la suposición de varianzas de población iguales en el e je m p lo 1 1 .6 . ▲ EIERCICIOS 11.50 Si se p u e d e su p o n er q u e el p a rá m e tro binom ial 6 asum e un v alo r cercan o a ce ro, a m enudo son útiles los límites de confianza superiores de la form a 0 < C. Para una m uestra aleatoria de tam año n, el intervalo en un sentido
382 Capítulo 11: Estimación: aplicaciones EJEM PLO 11.12 Para estudiar la durabilidad de una nueva pintura para las líneas blancas centrales, un departam ento de obras públicas pintó franjas de prueba de un lado a otro de carrete ras con m ucho tránsito en ocho lugares diferentes, y los contadores electrónicos m os traro n que se d e te rio ra b an después de q u e (al ciento m ás cercano) 142,600, 167,800, 136,500,108,300, 126,400,133,700,162,000 y 149,400 autos cruzaron p or encim a de ellas. C onstruya un intervalo de confianza del 95% para la cantidad prom edio de tránsito (cruces de autos) que esta pintura puede soportar antes de deteriorarse. Solución La im p re sió n d e c o m p u ta d o ra de la figura 11.1 m u e stra q u e el in te rv alo d e c o n fianza deseado es 124,758 < /x < 156,917 cruces de autos. Tam bién m uestra el tam año de la m uestra, la m edia de los d a tos, su desviación estándar y el erro r estándar estim ado de la m edia, SE M EA N , que está dado por . ▲ MTB > SET C1 136500 108300 126400 133700 162000 149400 DATA > 142600 167800 MTB > TINT 95 C1 N MEAN STDEV SE MEAN 95.0 PERCENT C.I. (1.24V581jgi 56917 y C1 8 140837 19228 6798 F ig u ra 11.1 Impresión de com putadora para el ejem plo 11.12. Así como se usaron en este ejem plo, las com putadoras nos perm iten hacer en for m a m ás eficiente (m ás rápida, m ás barata y casi autom ática) lo que antes se hacía por m edio de calculadoras de escritorio, calculadoras m anuales o aun a m ano. Sin em bar go, al tratar con una m uestra de tam año n = 8 , el ejem plo no puede hacer m ucha jus ticia al poder de las com putadoras para m anejar conjuntos enorm es de datos y ejecutar cálculos que ni siquiera se consideraban posibles hasta años recientes. Tam bién, nues tro ejem plo no m uestra cóm o las com putadoras p ueden resum ir tan to la salida com o la entrada y los resultados, así com o los datos originales, en varias clases de gráficas y cua dros, lo que perm ite m étodos de análisis que no estaban disponibles en el pasado. T odo esto es im portante, pero no hace justicia al efecto fenom enal que las com pu tadoras han tenido en la estadística. E ntre otras cosas, las com putadoras se pueden usar p a ra ta b u la r o g rafica r fun cio n es (digam os, las d istribuciones, t, F o \\ 2) y así d a rle al in vestigador un entendim iento claro de los m odelos sustentantes y hacerle posible estu diar los efectos de las violaciones de las suposiciones. Tam bién es im portante el uso de las com putadoras para sim ular los valores de variables aleatorias (esto es, m uestreo de toda clase de poblaciones) cuando no es factible un enfoque m atem ático form al. Es to provee una herram ienta im portante cuando estudiam os lo apropiado de los m ode los estadísticos.
C apítulo 11: Referencias 383 A P L IC A C IO N E S 11 .60 Se exam inaron 20 pilotos en un sim ulador de vuelo y el tiem po que cada uno tardó en concluir cierta acción correctiva se m idió en segundos, con los resul tados siguientes: 5.2 5.6 7.6 6 .8 4.8 5.7 9.0 6.0 4.9 7.4 6.5 7.9 6 .8 4.3 8.5 3.6 6.1 5.8 6.4 4.0 Use un program a de com putadora para encontrar un intervalo de confianza del 95% para la m edia del tiem po que se lleva la acción correctiva. 1 1 .6 1 Las sig u ien tes son las resistencias a la co m presión (d ad as a las 10 psi m ás c e r canas) de 30 m uestras de concreto 4890 4830 5490 4820 5230 4960 5040 5060 4500 5260 4600 4630 5330 5160 4950 4480 5310 4730 4710 4390 4820 4550 4970 4740 4840 4910 4880 5200 5150 4890 Use un program a de com putadora para encontrar un intervalo de confianza del 90% para la desviación estándar de estas resistencias a la com presión. R E F E R E N C IA S Se da un m étodo general para obtener intervalos de confianza en M o o d . A. M.. G r a y b il l . F. A., and BOES, D. C , Introduction to the Theory o f Statistics, 3rd ed. N ueva York: M cGraw -H ill Book Com pany. 1974, y se pueden encontrar criterios adicionales para juzgar los m éritos relativos de los interva los de confianza en L e h m a n n , E. L., Testing Statistical Hypothescs. N ueva York: John Wiley & Sons. Inc., 1959. y en otros textos sobre estadística matemática. En Biumetrika Tables, a la que hacemos re ferencia en la página 298. se dan tablas especiales para construir intervalos de confianza del 95% y 98% para proporciones. Para una prueba de la independencia de las variables alea torias Z y Y en la página 367. véase B ru n k , H. D., A n Introduction to Mathematical Statistics, 3rd ed. Lexington, Mass.: Xerox Publishing Co., 1975.
CAPITULO 12 Prueba de hipótesis: teoría 12.1 IN TR O D U CCIÓ N 12.2 PRUEBA DE U N A HIPÓTESIS ESTADÍSTICA 12.3 PÉRDIDAS Y RIESGOS 12.4 EL LEM A DE N E Y M A N -P E A R S O N 12.5 LA F U N C IÓ N DE P O TE N C IA DE U N A PRUEBA 12.6 PRUEBAS DE R A Z Ó N DE VEROSIM ILITUD 12.1 INTRODUCCIÓN Problem as co m o cuando un ingeniero tiene que decidir con base en datos m uéstrales si el verdadero prom edio de vida de cierta clase de neum ático es, p or lo m enos, 2 2 ,0 0 0 millas, cuando un agrónom o tiene que decidir con base en experim entos si una clase de fertili zante produce un rendim iento m ás alto de frijol de soya que otro, y cuando un fabricante de productos farm acéuticos tiene que decidir con base en m uestras si 90 p o r ciento de to dos los pacientes que reciben un nuevo m edicam ento se recuperarán de cierta enferm e d ad , se p u ed en traducir al lenguaje d e las pruebas estadísticas de hipótesis. E n el prim er caso podríam os decir que el ingeniero tiene que probar la hipótesis de que 6, el parám e tro d e una población exponencial, es p o r lo m enos 2 2 ,0 0 0 ; e n el segundo caso podríam os decir que el a g ró n o m o tiene q u e decidir si > ¿i2, d o n d e ¿i, y /x2 so n las m ed ias d e dos poblaciones normales; y en el tercer caso podríam os decir que el fabricante tiene que de cidir si 0, el parám etro de una población binom ial, es igual a 0.90. E n cada caso se debe suponer, por supuesto, que la distribución escogida describe correctam ente las condicio n es experim entales; esto es la distribución proporciona el modelo estadístico correcto. C om o en los ejem plos anteriores, la m ayoría de las pruebas estadísticas de hipótesis tienen que ver con los parám etros de las distribuciones, pero algunas veces tam bién tienen que ver con el tipo, o naturaleza, de las distribuciones mismas. Por ejem plo, en el prim ero de nuestros tres ejem plos el ingeniero tal vez tam bién tendría que decidir si realm ente es tá tratando con la m uestra de una población exponencial o si sus datos son valores de va riables aleatorias q u e tienen, digam os, la distribución de W eibull del ejercicio 6.23. d e f i n i c i ó n 12.1 U n a hipótesis estadística es u n a afirm ació n o c o n je tu ra acerca de la distribución de una o m ás variables aleatorias. Si una hipótesis estadística 384
Sección 12.1: Introducción 385 esp ecifica c o m p le ta m en te la d istrib u ció n , se co n o ce com o hipótesis simple; si no, se co n o ce c o m o hipótesis compuesta. U na hipótesis sim ple debe, por consiguiente, especificar no sólo la form a funcio nal de la distribución subyacente, sino tam bién los valores de todos los parám etros. Así, en el tercero de los ejem plos anteriores, el que trata de la efectividad del nuevo m edi cam ento, la hipótesis 0 = 0.90 es sim ple, suponiendo, claro está, que especificam os el tam año de la m uestra y que la población es binom ial. Sin em bargo, en el prim ero de los ejem plos anteriores la hipótesis es com puesta ya que 0 ^ 2 2 ,0 0 0 no asigna un va lor específico al p a rá m etro 0. Para poder construir un criterio apropiado para probar hipótesis estadísticas, es n ecesario q u e ta m b ié n fo rm u lem o s hipótesis alternativas. P a ra ilu strar e sto co n sid ere el ejem plo que tra ta de la vida de los neum áticos, podríam os form ular la hipótesis al tern a tiv a d e q u e el p a rá m e tro 0 de la p o b lació n ex p o n en cial es m en o s d e 2 2 ,0 0 0 ; e n el ejem plo que trata con las dos clases de fertilizantes, podríam os form ular la hipótesis al ternativa /i, = ft2; y en el ejem plo que trata del nuevo m edicam ento, podríam os form u lar la hipótesis alternativa de que el parám etro 0 de la población binom ial dada es sólo 0.60, que es la tasa de recuperación de la enferm edad sin el nuevo m edicam ento. El concepto de hipótesis simples y com puestas tam bién se aplica a las hipótesis al ternativas, y en el prim er ejem plo podem os decir ahora que estam os probando la hipó tesis co m p u esta 0 S 22,0(30 c o n tra la a lte rn a tiv a co m p u esta 0 < 2 2 ,0 0 0 , d o n d e 0 e s el parám etro de una población exponencial. De la m isma m anera, en el segundo ejem plo e sta m o s p ro b a n d o la h ip ó tesis co m p u e sta /x, > /x2 c o n tra la a lte rn a tiv a c o m p u esta /i, = /x2, d o n d e /xt y /x2 son las m ed ias d e d o s p o b lacio n es n o rm a les, y e n e l te rc e r ejem p lo estam o s p ro b a n d o la hipótesis sim ple 0 = 0.90 co n tra la alternativa simple 0 = 0.60, donde 0 es el parám etro de una población binom ial para la cual n está dada. F recuentem ente, los estadísticos form ulan com o sus hipótesis exactam ente lo con tra rio de lo que q u ieren dem o strar. P or ejem plo, si q uerem os dem o strar que los e stu diantes de una escuela tienen un prom edio de IO m ás alto que los de o tra escuela, p o d ría m o s fo rm u la r la h ipótesis de que n o hay diferencia: la hipótesis /x, = /x2. C on esta hipótesis sabem os qué esp erar, p e ro éste n o sería el caso si form ulam os la h ip ó te sis ¿n > /x2 . a m en o s q u e esp ecifiq u em o s la diferen cia real e n tre ¿x, y /x2. D e igual form a, si q u erem o s dem o strar que una clase de m ineral tiene un p o rcen taje m ás alto de contenido de uranio q ue otra, podríam os form ular la hipótesis de que los dos porcentajes son iguales; y si querem os dem ostrar que hay una m ayor variabili dad en la calidad d e un producto de la que hay en la calidad de otro, podríam os form u lar la hipótesis de q u e n o hay diferen cia; e sto es, <r, = <r2. E n vista de las suposiciones d e “ n o hay d ife re n c ia ’’, h ip ó tesis c o m o é stas nos llevan al térm in o hipótesis nula, p e ro hoy en día este térm ino sí es válido para cualquier hipótesis que quisiéram os probar. D e fo rm a sim bólica, u sarem o s H„ p a ra la h ipótesis n u la q u e q u e re m o s p ro b a r y /y, o H a p a ra la h ip ó tesis a lte rn a tiv a . L os p ro b le m as con m ás d e d o s hip ó tesis, e sto es.
386 C apítulo 12: Prueba de hipótesis: teoría problem as que incluyen varias hipótesis alternativas, tienden a ser bastante complica dos y no los estudiarem os en este libro. 12.2 PRUEBA DE UNA HIPÓTESIS ESTADÍSTICA La prueba de una hipótesis estadística es la aplicación de un conjunto explícito de re glas p a ra decidir si aceptam os la hipótesis nula o la rechazam os en favor de la h ip ó te sis alternativa. Suponga, por ejem plo, que un estadístico desea p ro b ar la hipótesis nula 0 = 60 co n tra la hipótesis altern ativ a 0 = 0,. P ara to m ar u n a decisión, g en erará datos m u éstrales p o r m ed io d e u n e x p e rim e n to y d esp u és calcu lará el v a lo r de u n a estadísti ca de prueba, q u e le d irá q u é acción to m a r p a ra c a d a re s u lta d o p o sib le d e l e sp ac io m uestral. El procedim iento de prueba, por consiguiente, divide los valores posibles de la estadística d e p ru e b a en d o s subconjuntos: una región de aceptación p a ra / / 0 y una región de rechazo p ara //„. El procedim iento recién descrito puede llevar a dos clases de errores. Por ejem plo, si el v erd ad ero valor del p arám etro 6 es 0 Oy el estadístico incorrectam ente conclu ye q u e 0 = 0 , . e stá c o m e tie n d o un e r r o r q u e se con o ce c o m o u n error de tipo 1. P o r o tra p a rte , si e l v erd ad ero valor del p a rá m etro 0 es 0 , y el estadístico concluye en for m a in co rrecta q u e 0 = 0 O, e stá c o m e tie n d o u n a seg u n d a ciase de e rro r q u e se con o ce c o m o u n error de tipo II. DEFINICIÓN 12.2 1. E l rec h a z o d e la h ipótesis n u la c u a n d o es v e rd a d e ra se llam a un error de tipo I; la probabilidad de com eter un e rro r de tipo I se denota con a. 2. La acep tació n d e la h ip ó tesis n u la c u a n d o es falsa se llam a un error de tipo I I : la p ro b ab ilid a d d e c o m e te r un e rro r d e tip o II se d e n o ta con /3. E s costum bre referirse a la región de rechazo p a ra H0 com o la región crítica de la prueba y a la probabilidad de obtener un valor de la estadística de prueba dentro de la región crítica cuando H0 es verdad com o el tamaño de la región crítica. Así, el ta m año de una región crítica es justam ente la probabilidad a de com eter un erro r de ti p o I. E sta p ro b a b ilid a d tam b ié n se llam a el nivel de significancia de la p ru e b a (véase el análisis de la página 400). EJEM P LO 12.1 C on respecto a la tercera ilustración en la página 384, suponga que el fabricante del nuevo m edicam ento quiere probar la hipótesis nula 0 = 0.90 contra la hipótesis alter nativa 0 = 0.60. Su estadística de prueba es X , el núm ero de éxitos observados (recu p eraciones) e n 20 intentos, y acep tará la hipótesis nula si x > 14; de o tra m an era la rechazará. E ncuentre a y fi.
Sección 12.2: Prueba de una hipótesis estadística 387 Solución La región d e aceptación para la hipótesis nula es x = 15. 16, 17, 18,19 y 20 y, co rre s p o n d ie n te m e n te , la región d e rech azo (o región crítica) es x = 0, 1, 2, ..., 14. P or co n sig u ien te, de la tab la I: a = P ( X á 14; 0 = 0.90) = 0.0114 y /3 = P ( X > 14; 6 = 0 .6 0 ) = 0.1255 ▲ U n b u en p ro ce d im ie n to d e p ru e b a es a q u e l d o n d e am bas a y /3 son p e q u e ñ as, de ese m odo nos d a una buena oportunidad de tom ar la decisión correcta. L a probabili d a d de u n e rro r d e tip o II e n el e je m p lo 12.1 es m ás b ien a lta , p e ro é sta se p u e d e re ducir al cam biar en form a apro p iad a la región crítica. Por ejem plo, si usam os la región de aceptación x > 15 en este ejem p lo d e m an era q u e la región crítica sea x S 15, se p u e d e c o m p ro b a r con facilidad q u e e sto h a ría a = 0.0433 y /3 = 0.0509. A sí, a u n q u e se ha reducido la probabilidad de un erro r de tipo II, se ha vuelto m ás grande la p ro babilidad de un e rro r de tipo I. La única form a en que podem os reducir las probabili dades de am bos tipos de errores es aum entar el tam año de la m uestra, pero m ientras n se m antenga fija, esta relación inversa en tre las probabilidades de errores de tipo I y de tipo II es típica de los procedim ientos de decisión estadísticos. E n o tra s palabras, si la probabilidad de un tipo de error se reduce, la del otro tipo de erro r aum enta. EJEM P LO 12.2 Suponga que querem os probar la hipótesis nula de que la m edia de una población nor m al con cr2 = 1 e s /a„ c o n tra la h ip ó tesis a lte rn a tiv a d e q u e e s /x ,, d o n d e ¿i, > /¿0. E n cuentre el valor d e K tal que x > K provea una región crítica de tam año a = 0.05 para una m uestra aleatoria de tam año n. Solución A l re fe rim o s a la figura 12.1 y la tab la III, e n c o n tra m o s q u e z = 1.645 c o rre s ponde al elem ento 0.4500 y p o r tanto que 1.645 = 1/V n F ig u ra 12.1 Diagrama para los ejemplos 12.2 y 12.3.
388 Capítulo 12: Prueba de hipótesis: teoría Se sigue que 1.645 EJEM PLO 12.3 C on respecto al ejem plo 12.2, determ ine el tam añ o m ínim o de la m uestra necesaria p a ra p ro b a r la h ip ó te sis n u la /x0 = 1 0 c o n tra la h ip ó te sis a lte rn a tiv a /*, = 1 1 con P á 0.06. Solución P uesto q u e p está d ad a p o r el área som breada en la figura 12.1, obtenem os 1.645 = 11 p = p (^x < 10 + Vñ =P z< ( l/V ñ = P ( Z < - Vix + 1.645) y puesto q ue z — 1.555 corresponde a un elem ento de 0.5000 — 0.06 = 0.4400 en la tabla III, hacem os —V ñ + 1.645 igual a —1.555. Se sigue q u e V n = 1.645 + 1.555 = 3.200 y n = 810.24, u 11 re d o n d e a d o al e n te ro m ás cercan o . ▲ 12.3 PER D ID AS Y R IESG O S! Los conceptos de funciones de pérdida y de riesgo que se introdujeron en el capítulo 9 tam bién juegan u na parte im portante en la teoría de la prueba de hipótesis. D esde el enfoque de la teoría de decisiones a la prueba de la hipótesis nula de que un p arám e tro poblacional 6 es igual a 0 Ocontra la alternativa de que es igual a 0 ,, el estadístico bien tom a la acción a 0 y acepta la hipótesis nula, o bien tom a la acción a ; y acepta la hipótesis alternativa. D ependiendo del verdadero “estado de la N aturaleza” y de la ac ción que éste tom e, sus pérdidas se m uestran en la siguiente tabla: Estadístico a0 a¡ Naturaleza 0 o) C (a ,,0 o) ex L (a o .0 ,) L (a ¡,S t) Estas pérdidas pueden ser positivas o negativas (que reflejan castigos o recom pensas), y la única condición que im pondrem os es que: t O m ita esta sección si se om itió el capítulo 9.
390 C apítulo 12: Prueba d e hipótesis: teoría A l p ro b a r la h ip ó tesis nula 0 = 0O c o n tra la h ipótesis a lte rn a tiv a 0 = 0 ^ \\a can tid ad 1 — 0 se conoce com o la potencia de la p ru eb a en 0 = 0 ,. U na región crítica p ara p ro b ar u n a hipótesis nula sim ple 0 = 0Qcontra una h ip ó tesis a lte rn a tiv a sim p le 0 = 0¡ se dice q u e es m ejor o más potente, si la p o ten c ia d e la p ru e b a e n 0 = 0¡ e stá e n u n m áxim o. P a ra c o n stru ir u n a reg ió n crítica m ás p o te n te en esta clase de situación, hacem os referencia a las verosim ilitudes (véase la página 346) de una m uestra aleatoria de tam año n de la población en consideración cuando 0 = 0O y 0 = 0 ,. D enotem os estas verosim ilitudes con L 0 y L lt tenem os así nn ¿ o = n A * - ; 0 o) y í-i = í“ ] ¡= 1 H ablando intuitivam ente, es evidente que debe ser pequeña para puntos de la \"i m uestra d e n tro d e la región crítica, lo que lleva a erro res de tipo I cu an d o 0 = 0Qy a de- L0 cisiones correctas cuando 0 = 0 ,; de la misma m anera, es evidente que — debe ser gran el de para puntos de la m uestra fuera de la región crítica, lo que lleva a decisiones correctas cuando 0 = 0Oy a errores de tipo II cuando 0 = 0 ,. El siguiente teorem a dem uestra el hecho que este argum ento, ciertam ente, garantice una región crítica más potente. TEOREMA 12.1 ( L em a d e N eym an-P earson) Si C e s u n a región crítica d e ta m a ñ o a y A: e s u n a c o n sta n te tal q u e dentro de C ^1 y fuera de C entonces C es una región crítica más potente de tam año a para probar 0 = 0O contra 0 = 0 ,. D em ostración. Suponga que C es una región crítica que satisface las con diciones del teorem a y que D es alguna otra región crítica de tam año a. A sí J \" f L0 dx = J \" J L0 dx = a D donde dx representa a d xi ,d x 2, . . . . dx„, y las dos integrales m últiples se tom an sobre las respectivas regiones C y D de n dim ensiones. A hora, al hacer uso del h e c h o q u e C es la u nión d e los co n ju n to s ajen o s C C\\ D y C C\\ D ', m ie n tra s que D e s la u n ió n d e los co n ju n to s ajen o s C C\\ D y C ' C\\ D , p o d e m o s escribir í ••• í L 0 dx + í • • í L 0 d x = í í L 0 d x 4- í ••• f L {)d x = a cno cn/r cno cno
Sección 12. 4: El lem a de N e y m a n -P e a rs o n 391 y por tanto í •• í L 0 d.x = í ••• J L 0 d x cno cno E n to n c es, p u e sto q u e L j ^ L 0/ k d e n tro de C y L , ^ L 0/A: fu era de C , se sigue que / - I 1-'\"1'* i - I ‘f ,h=I ' / r * * J \" I L'dx cno' cno- cno cno y por tanto que Finalm ente, í- í ••• í L xdx cno' crio JJ =J J L ¡ d x + J ••• J L x dx c cno cno1 £ J ••• Í L x d x + J — J L¡ <Lx = J J L¡ dx cno cno o de m anera que J - J L, dx B I ■J L ,d x co y e sto c o m p le ta la d e m o stra c ió n del te o re m a 12.1. La d esig u ald ad final en u n cia que p ara la región crítica C la probabilidad de no com eter un e rro r de tip o II es m ayor que, o igual a, la probabilidad correspondiente para cualquier o tra región crítica de tam añ o a. (P ara el caso discreto ladem ostración es lam ism a, donde las sumas tom an el lugar de las integrales.) T EJEM P LO 12.4 U n a m u estra a le a to ria d e tam a ñ o n d e u n a población norm al con <r2 = 1 se va a usar p a ra p ro b a r la hipótesis nula n = p,0 co n tra la hipótesis alternativa ¿i = f i x, donde > f i fí. U se el lem a d e N ey m a n -P e a rso n p a ra e n c o n tra r la región crítica m ás p o te n te de tam año a. Solución Las dos verosim ilitudes son donde las sum as se extienden de i = 1 y i = n , y después de algunas sim plifica ciones su razón se vuelve
392 C apítulo 12: Prueba d e hipótesis: teoría L0 L\\ ~ e Así, debem os encontrar una constante k y una región C del espacio m uestral tai que 2 0 *í “ <4)+ 0*o ~ * * i )' 2 > , dentro de C e Sk fuera de C mi )-2 j 4 e =k y después de sacar logaritm os, restar y — n i ) , y dividir por la cantidad ne gativa — ¿i,), estas dos desigualdades se vuelven x S k dentro de C x S A- fu e ra d e C donde K es una expresión en k. n. y ¿i,. En la práctica real, las constantes com o K se determ inan al hacer uso del tam año de la región crítica y de la teoría estadística apropiada. E n nuestro caso (véase el e je m p lo 12.2) o b ten e m o s K = ¡ia + z a • donde za es com o se de fine en la página 227. Así, la región crítica m ás potente de tam año a para probar la h ip ó tesis nula n = /t0 c o n tra la a lte rn a tiv a n = n \\ (co n > /x0) p a ra la p o blación norm al dada es x £ fi0 + z 1 Vn y se debe observar que no d ep en d e de f i x. E sto es una p ropiedad im portante, a la cual nos v o lv erem o s a re fe rir e n la sección 12.5. ▲ A dvierta q ue en este caso derivam os la región crítica sin m encionar prim ero que la estadística de p ru eb a va a ser X . Puesto que la especificación de una región crítica define así la estadística de prueba correspondiente, y viceversa, estos dos térm inos “re gión crítica” y “estadística de prueba”, a m enudo se usan indistintam ente en el lengua je de la estadística. EJERCICIOS 12.1 D ecid a e n cada caso si la h ip ó tesis es sim ple o co m p u esta: (a) la hipótesis de que una variable aleatoria tiene una distribución gamm a con a = 3 y /3 = 2; (b) la hipótesis de que una variable aleatoria tiene una distribución gamm a con a = 3 y /3 ^ 2; (c) la hipótesis de que una variable aleatoria tiene una densidad exponencial; (d) la hipótesis de que una variable aleatoria tiene una distribución beta con la m edia n = 0.50.
Sección 12.4: El lema de N e y m a n -P e a rs o n 393 12.2 D ecida en cad a caso si la hipótesis es sim ple o com puesta: (a) la hipótesis de que una variable aleatoria tiene una distribución de Pois son con A = 1.25; (b) la hipótesis de que una variable aleatoria tiene una distribución de Pois son con A > 1.25; (c) la hipótesis de que una variable aleatoria tiene una distribución norm al c o n la m ed ia /¿ = 1 0 0 : (d) la hipótesis de que una variable aleatoria tiene una distribución binomial n eg ativ a con k = 3 y ti < 0.60. 12.3 U na sola observación de una variable aleatoria q u e tiene una distribución hi- pergeom étrica con N = 7 y n = 2 se usa para p ro b ar la hipótesis nula k = 2 c o n tra la h ip ó tesis a lte rn a tiv a k = 4. Si la h ipótesis nula se rech aza si y sólo si el valor de la variable aleatoria es 2 . encuentre las probabilidades de erro res ti po I y de tip o II. 12.4 C on respecto al ejem plo 12.1. ¿cuáles hubieran sido las probabilidades de e rro res d e tip o I y de tip o II si la región de acep tació n hu b iera sid o x > 16 y la r e gión de rechazo correspondiente hubiera sido x ^ 16? 12.5 U na observación única de una variable aleatoria que tiene una distribución geo m étrica se usa para p ro b ar la hipótesis nula 9 = 0Ocontra la hipótesis altern a tiva 9 = 0, > 90. Si la hipótesis nula se rechaza si y sólo si el v alo r de la variable aleatoria es m ayor que. o igual a, el en tero positivo k, en cu en tre las expresiones p ara las probabilidades de erro res de tipo 1 y de tipo II. 12.6 Una observación única de una variable aleatoria que tiene una distribución ex ponencial se usa para p ro b ar la hipótesis nula que la m edia de la distribución es 9 = 2 co n tra la hipótesis alternativa que es 9 = 5. Si la hipótesis nula se re chaza si y sólo si el valor de la variable aleatoria es m enor que 3. en cu en tre las probabilidades de errores de tipo I y de tipo II. 12.7 Sea que X t y X 2 constituyan una m uestra aleatoria de una población norm al con a ' = 1. Si la h ipótesis nula ¿i = / i (l va a se r rec h a z ad a en favor d e la h i p ótesis a lte rn a tiv a = ¿i, > c u a n d o x > /¿ 0 + 1 . ¿cuál es el ta m a ñ o de la región crítica? 12.8 U na observación única de una variable aleatoria que tiene una densidad unifor m e con a = 0 se usa p a ra p ro b a r la h ip ó tesis nula /3 = /30 c o n tra la hipótesis alternativa fi = fin + 2. Si la hipótesis nula se rechaza si y sólo si el valor de la variab le a le a to ria asu m e u n v a lo r m ay o r q u e /30 + 1 , e n c u e n tre las p ro b a b i lidades de erro res de tipo I y de tipo II. 1 2 .9 Sea q u e A', y X2 co n stitu y an una m u estra a le a to ria d e tam a ñ o 2 d e la población dada por f[ r 9) ~ 1 9x61 p3ra 0 < x < 1 I 0 en cualquier otra parte Si la re g ió n crítica ^ J se usa para p ro b ar la hipótesis nula 9 = 1 contra la hipótesis alternativa 9 = 2. ¿cuál es la potencia de esta prueba en 9 = 2 ?
C apítulo 12: Prueba d e hipótesis: teoría 12.10 D e m u e stre q u e si < /¿o e n e l e je m p lo 12.4, e l lem a d e N e y m an -P earso n nos da la región crítica 12.11 U n a m u e stra a le a to ria d e ta m a ñ o n d e u n a p o b lació n ex p o n en cial se u sa p a ra p r o b a r la h ip ó te sis n u la 9 = 0O c o n tra la h ip ó te sis a lte rn a tiv a 0 = 9 X > 0O. U se el lem a de N eym an-Pearson para en co n trar la región crítica m ás potente de tam año a , y use el resultado del ejem plo 7.16 para indicar cóm o evaluar la constante. 12.12 U se el lem a d e N e y m an -P earso n p a ra in d ic a r c ó m o co n stru ir la reg ió n crítica m ás p o te n te de ta m a ñ o a p a ra p ro b a r la h ipótesis n u la 0 = 0O, d o n d e 6 e s el parám etro de la distribución binom ial con un valor dado de n, contra la hipó tesis alternativa 6 = 0 , < 90. 12.13 C o n re sp e c to al ejercicio 12.12, si n = 100, 0O = 0.40, 0 l = 0.30 y a e s tan grande com o sea posible sin exceder de 0.05, use la aproxim ación norm al a la dis tribución binom ial para encontrar la probabilidad de com eter un error de tipo II. 12.14 U n a o b serv ació n única d e u n a m u estra a le a to ria q u e tien e u n a d istrib u ció n g e o m étrica se va a usar para probar la hipótesis nula que su parám etro es igual a 60 c o n tra la h ipótesis a lte rn a tiv a q u e e s igual a 0, > 0O. U se el lem a d e N e y m an-Pearson para encontrar la m ejor región crítica de tam año a. 12.15 D a d a u n a m u e stra a le a to ria d e tam a ñ o n d e una p o b lació n n o rm a l c o n f i = 0 use el lem a de N eym an-Pearson para construir la región crítica m ás potente d e ta m a ñ o a p a ra p ro b a r la h ip ó te sis nula tr = «r0 c o n tra la a lte rn a tiv a a = o-i > o-„. 12.16 S u p o n g a q u e e n el e je m p lo 12.1 el fab rica n te d el n u ev o m ed ic am e n to c re e q u e la ventaja es 4 a 1 que con su m edicam ento la tasa de recuperación de la enfer m edad es 0.90 en vez de 0.60. C on esta ventaja, ¿cuáles son las probabilidades que tom ará la decisión equivocada si usa la función de decisión p a r a x > 14 (a) p a ra x S 14 p a r a x > 15 parax ^ 1 5 p a r a x > 16 (c) p a r a x á 16? APLICACIONES 12.17 U n a a e ro lín e a q u ie re p r o b a r la h ip ó te sis n u la d e q u e 60 p o r c ie n to d e su s p a sajeros objetan a que se fum e dentro el avión. Explique en qué condiciones com eterían un error de tipo I y en qué condiciones com eterían un error de ti po II.
Sección 12. 4: El lem a de N e y m a n -P e a rs o n 395 12.18 Se le p id e a un d o c to r q u e h ag a un ex am en físico g en eral m uy c o m p le to a un ejecutivo para probar la hipótesis nula de que él podrá encargarse de respon sabilidades adicionales. Explique en qué condiciones el doctor com etería un e rro r de tipo I y en qué condiciones el doctor com etería un error de tipo II. 12.19 E l tie m p o p ro m e d io de secad o de la p in tu ra d e u n a fab rica n te e s 20 m inutos. Investigue la efectividad de una m odificación en la com posición quím ica de su pintura, la fabricante quiere probar la hipótesis nula n = 2 0 m inutos contra u n a a lte rn a tiv a a p ro p ia d a , d o n d e /x es el tie m p o p ro m e d io de secad o d e la p in tura m odificada. (a) ¿Q ué hipótesis alternativa debe usar la fabricante si no quiere hacer la m o dificación en la com posición quím ica de la pintura a m enos que reduzca el tiem po de secado? (b) ¿Q ué hipótesis alternativa d ebe usar la fabricante si el nuevo proceso es realm ente m ás barato y ella quiere hacer la m odificación a m enos que au m ente el tiem po de secado de la pintura? 12J0 El departam ento de policía de una ciudad está considerando reem plazar los neu m áticos en sus au to s con neum áticos radiales. Si /x, es el núm ero prom edio d e m i llas que duran los neum áticos anteriores y /x2 es el núm ero prom edio de millas que durarán los nuevos neum áticos, la hipótesis nula que debe probarse es /x, = ¿x2. (a) ¿Q ue hipótesis alternativa debe usar el d ep artam ento si no quiere usar los neum áticos radiales a m enos que se pruebe definitivam ente que dan un m ejor m illaje? E n otras palabras, se pone el peso de la prueba en los n e u m áticos radiales, y se retendrán los neum áticos anteriores a m enos que se rechace la hipótesis nula. (b) ¿Q u e hipótesis altern ativ a debe usar el d e p artam en to si está ansioso en o b ten er los neum áticos radiales a m enos que realm ente den un millaje más p o b re que los neum áticos anteriores? A dvierta q ue el nuevo peso de la prueba está en los neum áticos anteriores, los cuales se retendrán sólo si se puede rechazar la hipótesis nula. (c) ¿Q ue hipótesis alternativa debe usar el departam ento de m anera que el rechazo de la hipótesis nula pueda llevar a m antener los neum áticos an te riores o a com prar los nuevos? 12¿1 U n b o tánico desea p ro b ar la hipótesis nula de que el d iám etro prom edio de las flores de una planta en particular es 9.6 cm. D ecide tom ar una m uestra aleato ria de tam año n = 80 y aceptar la hipótesis nula si la m edia de la m uestra cae en tre 9.3 cm y 9.9 cm; si la m edia de esta m uestra cae fuera de este intervalo, él rec h a z ará la h ipótesis nula. ¿ Q u é decisión to m a rá y e sta rá e n e rro r si (a ) o b tie n e unam edia delam uestrade 10.2 cm y n = 9.6 cm; (b) obtiene unamedia delam u e stra de 10.2 cm y ¿x = 9.8 cm; (c) obtiene unamedia delam uestrade 9.2 c m y /x = 9.6 cm; (d ) o b tie n e u n a m ed ia delam u estrade 9.2 cm y /x = 9.8 cm ? 12J2 U n especialista en educación está considerando el uso de m aterial de instruc ción en audio casetes para una clase especial de estudiantes de tercer año con deficiencias en lectura. A los estudiantes en esta clase se les da una prueba es-
C apítulo 12: Prueba d e hipótesis: teoría tandarizada en m ayo del añ o escolar, y ¿i, es la puntuación prom edio obtenida e n e stas p ru e b a s d esp u és de m uchos años d e ex p eriencia. Sea p 2 Ia p u n tu ac ió n prom edio de ios estudiantes que usan los audio casetes, y suponga que las pun tuaciones altas son deseables. (a) ¿Q ué hipótesis nula debe usar el especialista en educación? (b) ¿Q ué hipótesis alternativa debe usarse si el especialista no desea adoptar los nuevos casetes a m enos que m ejoren las puntuaciones de la prueba es tandarizada? (c) ¿Q u é hipótesis alternativa d ebe usarse si el especialista desea ad o p ta r los nuevos casetes a m enos que em peoren las puntuaciones de la prueba es tandarizada? 12.23 Suponga que querem os p ro b ar la hipótesis nula de que un dispositivo anticon- tam inante para los autos es efectivo. (a) Explique en qué condiciones com eteríam os un error de tipo I y bajo que condiciones com eteríam os un erro r de tipo II. (b) El que un error sea un error de tipo I o un erro r de tipo II depende de có mo form ulem os la hipótesis nula. R cexprese la hipótesis nula de m anera que un error de tipo I se vuelva un erro r de tipo II, y viceversa. 1234 U na bióloga quiere p ro b ar la hipótesis nula de que la envergadura m edia de cierta clase de insectos es 12.3 m m c o n tra la hipótesis altern ativ a de que n o es 12.3 m m . Si to m a u n a m u estra a le a to ria y decid e a c e p ta r la h ipótesis n u la si y sólo si la m edia de la m uestra cae en tre 12.0 mm y 12 .6 mm, ¿qué decisión to m ará si o b tie n e x = 12.9 m m y e s ta rá e q u iv o c a d a si (a) p = 12.5m m ; (b ) p = 12.3 m m ? 1235 Un em pleado bancario quiere probar la hipótesis nula de que en prom edio el banco paga 10 cheques m alos p or día contra la alternativa de que esta cifra es dem asiado pequeña. Si tom a una m uestra aleatoria y decide rechazar la hipó tesis nula si y sólo si la m edia de la m uestra excede 12.5. ¿qué decisión tom ará si o b tie n e x = 11 .2 , y e sta rá eq u iv o c a d o si (a) A = 11.5; (b ) A = 10.0? En este caso A es la media de la población de Poisson que se está m uestreando. 1 2 3 6 R ehaga el ejem plo 12.3 con (a ) (3 = 0.03; (b) p = 0.01. 1237 Suponga que querem os probar la hipótesis nula de que cierta clase de neum á tico durará, en prom edio. 35,000 millas contra la hipótesis alterna de que du ra rá, en prom edio, 45,000 millas. Suponga que estam os tratando con una variable aleatoria q ue tiene una distribución exponencial, especificam os el tam año de la m uestra y la probabilidad de un erro r de tipo I y use el lem a N eym an-Pearson para construir una región crítica. ¿O btendríam os la misma región crítica si cam biam os la hipótesis alternativa a (a ) 0¡ = 50,000 m iles; (b ) 0, > 35,000 m iles?
Sección 12.5: La función de potencia d e una prueba 397 12.5 L A FU N C IÓ N D E P O TE N C IA D E U N A PRUEBA En el e je m p lo 12.1 p u d im o s d a r v alo res únicos a las p ro b ab ilid a d e s de c o m e te r e rro re s de tipo I y tipo de II porque estábam os probando una hipótesis sim ple contra una al ternativa sim ple. E n la práctica real, es relativam ente raro, sin em bargo, que las hipó tesis sim ples se p ru eb en contra alternativas simples; usualm ente una o la o tra, o am bas, son com puestas. P o r ejem plo, en el e je m p lo 12.1. b ien p o d ría m o s h a b e r sido m as r e a listas al p ro b ar la hipótesis nula q ue la tasa de recuperación de la en ferm ed ad es 8 S 0.90 contra la hipótesis alternativa 8 < 0.90. esto es, la hipótesis alternativa de que el nuevo m edicam ento no es tan efectivo com o se afirma. C uando tratam os con hipótesis com puestas, el problem a de evaluar los m éritos de un criterio de prueba, o región crítica, se vuelve más complejo. En ese caso tenem os que considerar las probabilidades a (9 ) de com eter un error de tipo I para todos los va lores de 9 d en tro del dom inio especificado bajo la hipótesis nula H0 y las probabilida des ()(d) de co m eter un e rro r de tipo II d entro de 8 del dom inio especificado bajo la hipótesis alternativa //,. Se acostum bra com binar los dos conjuntos de probabilidades de la siguiente m anera DEFINICIÓN 1 2 3 La f u n d ó n d e p o te n c ia de una p ru eb a de u na hipótesis e sta dística H0 contra una hipótesis alternativa H\\ está dada por 7T a(6) para los valores de 9 asum idos bajo H 0 1 — 0 (8 ) para los valores de 8 asum idos bajo H { Así, los valores de la función de potencia son las probabilidades de rechazar la hipóte sis n u la H(, p a ra d iv erso s v alo res del p a rá m e tro 8. O b se rv e tam b ié n q u e p a ra los v alo res de 8 asum idos bajo H0, la función de potencia da la probabilidad de com eter un e rro r d e tip o I, y p a ra los valores d e 8 asum idos b ajo H ] , d a la p ro b ab ilid ad de no co m eter un erro r de tipo II. EJEM PLO 12.5 C on respecto al ejem p lo 12.1, suponga que hubiésem os q uerido p ro b ar la hipótesis n u la 8 ^ 0.90 contra la hipótesis alternativa 8 < 0.90. Investigue la función de potencia correspondiente al m ism o criterio de prueba com o en la página 386, donde aceptam os la h ip ó tesis n u la si x > 14 y la rec h a z am o s si x 14. C o m o a n te s, x e s el n ú m e ro o b servado de éxitos (recuperaciones) en n = 2 0 intentos. Solución Al escoger valores de 8 para los cuales las probabilidades respectivas. a (0 ) o /3(0), están disponibles de la tabla I, en co n tram o s las probabilidades a { 8 ) de o b ten er c u a n d o m u ch o 14 éx ito s p ara 8 = 0.90 y 0.95. y las p ro b ab ilid a d e s fl(9 ) de o b te-
Sección 12. 5: La funció n d e potencia de una p rue b a 399 podrían usarse para probar un hipótesis nula dada contra una alternativa dada. Inci- d entalm ente, si hubiésem os graficado en la figura 1 2 .2 las probabilidades de aceptar H0 (en vez d e las de re c h a z a r H0), h u b iésem o s o b te n id o la curva característica de opera ción, o sim plem ente la curva O C , de la región crítica dada. E n o tras palabras, los valo res de la función característica de operación, usados principalm ente en aplicaciones industríales, están dados por 1 — tt(8 ). E n la página 390 indicam os que en la teoría de N eym an-Pearson de prueba de hi pótesis m antenem os fija a , la probabilidad de un e rro r de tipo I, y esto requiere q ue la h ipótesis nula H0 se a u n a h ipótesis sim ple, digam os. 0 = 0O. C o m o re su lta d o , la fu n ción d e p o ten c ia de c u a lq u ie r p ru e b a d e e sta h ipótesis nula p a sa rá p o r el p u n to ( 0O, a ) , el único pun to en el cual el valor de una función de potencia es la probabilidad de com eter un error. E sto facilita la com paración de las funciones de potencia de varias re giones críticas, todas las cuales están diseñadas para p ro b ar la hipótesis nula sim ple 0 = 0O c o n tra u n a a lte rn a tiv a co m p u esta, digam os, la h ipótesis a lte rn a tiv a 8 & d0. P a ra ilus tra r, considere la figura 12.3, que da las funciones de potencia de tres regiones críticas diferentes, o criterios de prueba, diseñadas para este propósito. Puesto que para cada valor de 6 , excepto 80, los valores de las funciones de potencia son las probabilidades de tom ar las decisiones correctas, es deseable tenerlas tan cercanas a 1 como sea posi ble. Así, se puede ver por inspección que la región crítica cuya función de potencia es tá d a d a p o r la cu rv a p u n tead a de la figura 12.3 es preferible a la región crítica cuya función de potencia está d ada por la curva p u nteada. La probabilidad de no com eter un e rro r de tipo II con la prim era de estas regiones críticas siem pre excede al de la se g u n d a . y decim o s q u e la p rim e ra reg ió n crítica e s uniformemente mas potente q u e la segunda; tam b ién se dice que la segunda región crítica es inadmisible. La m ism a distinción clara no es posible si intentam os com parar las regiones crí ticas cuyas funciones d e potencia estén dadas por las curvas punteadas y sólidas de la figura 12.3; en este caso es preferible la prim era p ara 8 < 80, m ientras que la o tra es preferible para 6 > 80. En situaciones com o ésta necesitam os criterios adicionales tr ( 0 ) F ig u ra 1 2 .3 Funciones de potencia.
Sección 12. 6: Pruebas de razón de verosim ilitud 401 y a poblaciones continuas, pero todos nuestros argum entos se pueden extender fácil m ente al caso m ultiparam étrico y a poblaciones discretas. Para ilustrar la técnica de la razón de verosimilitud, supongam os que X ¡ , X 2 X n constituyen una m uestra aleatoria de tam año n de una población cuya densidad en x es f {x \\ 8 ) y que í! es el conjunto de valores que el parám etro 0 puede asumir. A m enu d o nos referim os a f l com o el espado de parámetro p ara 0. La hipótesis nula q u e q u e re mos probar es H 0: 0 e & y la hipótesis alternativa es H \\ : 0 e oj' d o n d e oj es un su b co n ju n to de A y oj' es el co m p lem en to d e oj con resp ecto a A . A sí el espacio d e p a rá m e tro p ara 0 se divide en d o s co njuntos ajenos oj y oj'\\ d e acu erd o a la hipótesis nula. 0 es un elem ento del prim er conjunto, y de acuerdo a la hipótesis alterna tiva es un elem ento del segundo conjunto. En la m ayoría de los problem as fl es cualquie ra de: el conjunto de todos los núm eros reales, el conjunto de todos los núm eros reales positivos, algún intervalo de núm eros reales, o un conjunto discreto de núm eros reales. C u a n d o H ü y / / ( son am b o s h ip ó tesis sim ples, oj y oj' tien en cad a u n o sólo un e le m en to , y en la sección 12.4 con stru im o s p ru eb as p ara c o m p a rar las verosim ilitudes L 0 y L ,. E n el caso general, donde al m enos una de las dos hipótesis es com puesta, com param os en vez de ello las dos cantidades máx L 0 y máx L , donde máx L 0 es el valor m áxim o de la función de verosim ilitud (véase página 346) para todos los valores de 0 en oj, y m áx L es e l v a lo r m áxim o d e la función de v ero sim ilitu d p a ra to d o s los valores de 0 en í l . E n o tra s palabras, si tenem os una m uestra aleatoria de tam año n de una p o blación cuya densidad en x es f { x ; 0 ) , 0 es la estim ación de m áxim a verosim ilitud de 0 a sujeta a la restricció n q u e 0 d e b e se r un e le m en to d e oj. y 0 es la estim ació n d e m áxi m a verosim ilitud de 0 para todos los valores de 0 en fl. entonces n máx L0 = U f i x . ' J ) i=i y máx L = f l f [ x ¡ ; 8 ) i-1 A m bas cantidades son valores de variables aleatorias, puesto que dependen de los va lores observados x , , x 2 x n, y su razón ^ _ máx L 0 máx L se c o n o ce com o u n v alo r de la estadística de la razón de verosimilitud A (griega m a yúscula lambda). Puesto que m áx L 0 y máx L son am bas valores de una función de verosimilitud y p o r consiguiente nunca son negativas, se sigue que A ^ 0; tam bién, p uesto oj es un su b conjunto del espacio de parám etro í l , se sigue que A S I . C uando la hipótesis nula es fal-
402 C apítulo 12: Prueba de hipótesis: teoría sa, esperaríam os que máx L 0sea pequeña com parada con máx L, en cuyo caso A sería cer cana a cero. Por otra parte, cuando la hipótesis nula es verdadera y 6 e w, esperaríamos q u e m áx L 0 sea cercana a m áx L , e n cuyo caso A sería cercana a 1. U n a p ru eb a de la ra zón de verosim ilitud afirm a, p o r consiguiente, que la hipótesis nula H0 se rechace si y só lo si A cae e n la región crítica de la fo rm a A % k , d o n d e 0 < k < 1. P ara re su m ir d e f i n i c i ó n 12.4 Si u) y a)' son su b c o n ju n to s c o m p le m e n ta rio s d el e sp ac io de p arám etro f t y si ^ _ máx L 0 máx L donde m áx L„ y m áx L son los valores m áxim os de la función de verosim ilitud p a ra to d o s lo s v a lo re s d e 0 e n cu y í l , resp e c tiv a m e n te, e n to n c e s la reg ió n crítica Aá k donde 0 < k < 1 , define una p ru e b a d e razó n d e verosim ilitud de la hipótesis n u la 0 g ai c o n tra la h ipótesis a lte rn a tiv a 0 e <o'. Si H0 es una hipótesis sim ple, se escoge k de m anera que el tam año de la región crítica sea igual a a ; si H0 es com puesta, k se escoge de m anera que la probabilidad de un error de tipo I sea m enor que, o igual a a para toda 0 en w, e igual a a , si es posi b le , p a ra a l m e n o s un v alo r d e 0 e n a>. A sí, si H 0 es u n a h ipótesis sim ple y g(A ) e s la densidad de A en A cuando H0 es verdad, entonces k debe ser tal que P (A S k ) = g (\\)d \\ = a E n el caso discreto, la integral se reem plaza con una suma, y A se tom a com o el valor m ás grande p ara el cual la sum a es m enor que, o igual a a. EJEM PLO 12.6 E ncuentre la región crítica de la prueba de razón de verosim ilitud para probar la hipó tesis nula H 0: f i = /i-o contra la alternativa com puesta H\\\\ fi ^ fi0 sobre la base de una m uestra aleatoria de tam año n de una población norm al con la va rian za c o n o c id a cr2. Solución P u e sto q u e « só lo co n tie n e se sigue q u e /z = p-o» Y p u e sto q u e f i e s el c o n ju n to d e to d o s los nú m eros reales, se sigue p o r el m éto d o de la sección 10.7 que 4 = x . Así:
404 C apítulo 12: Prueba d e hipótesis: teoría En el ejem plo anterior fue fácil en co n trar la constante que hizo el tam año de la región crítica igual a a , p o rq u e pudim os referirnos a la distribución conocida de A' y n o tuvim os q ue derivar la distribución de la estadística de la razón de verosim ilitud A misma. Puesto que la distribución de A es usualm ente muy com plicada, lo cual hace di fícil evaluar k, a m enudo es preferible usar la siguiente aproxim ación, al final del capí tulo hacemos referencia a su prueba. t e o r e m a 12.2 P a ra n g ra n d e , la d istrib u ció n d e —2 - l n A se a p ro x im a, bajo condiciones m uy generales, a la distribución ji cuadrada con 1 grado de libertad. D ebem os añadir q u e este teorem a se aplica sólo al caso de un parám etro: si la población tiene más de un parám etro desconocido sobre los cuales la hipótesis nula im pone r restric ciones, el núm ero de grados de libertad en la aproximación ji cuadrada a la distribución de —2 • ln A es igual a r. P o r ejem plo, si querem os p ro b ar la hipótesis nula de que la m edia y la varianza desconocidas de una población norm al son /¿o y a l co n tra la hipótesis alter nativa que (á & y a 1 ^ a l . el n úm ero d e grados d e libertad en la aproxim ación ji cua d rad a a la distribución de - 2 - l n A sería 2; las dos restricciones son fj. = /z 0 y a 2 = a \\ . P uesto que los valores pequeños de A corresponden a valores grandes de —2 • ln A, podem os usar el teorem a 12.2 para escribir la región crítica de esta prueba aproxim a da de la razón de verosim ilitud com o - 2 - ln A S xl, i d o n d e x l . \\ se defin e com o en la página 282. E n relación con el ejem plo 12.6 e n c o n tra mos que que realm ente es un valor de u na variable aleatoria que tiene la distribución ji cuad ra da con 1 grado de libertad. Com o indicam os en la página 400, la técnica de la razón de verosim ilitud gene ralm ente producirá resultados satisfactorios. Q ue éste no es siem pre el caso se ilustra con el siguiente ejem plo, el cual es algo fuera de la común. EJEM PLO 12.7 Sobre la base de una observación única, querem os p ro b ar la hipótesis nula sim ple que la distribución d e probabilidad de X es x 12 34 5 6 7 12 12 12 4 1 11 6 66 contra la alternativa com puesta que la distribución de probabilidad es
Sección 12.6: Pruebas de razón de verosimilitud 405 12 3 4 56 7 abe 2 K( x) 3333 donde a + b + c = l. D em uestre que la región crítica obtenida por m edio de la téc nica de la razón d e verosim ilitud es inadm isible. Solución La hipótesis alternativa com puesta incluye todas las distribuciones de probabilidad q ue o b te n e m o s al asignar valores d iferen tes d e 0 a 1 a a, b y c, su jeto sólo a la res tricción que a + b + c = 1. P ara d e te rm in a r A p a ra cada valor de x, p rim e ro h a cem os x = 1. P a ra este v a lo r o b te n e m o s m áx L 0 = máx L = \\ (que corresponde a a = 1). y por tanto A = ¡ . Al determ inar de la misma m anera A pa ra los otros valores de x, obtenem os los resultados m ostrados en la siguiente tabla: x 1 2 3456 7 1 1 13 A - 11 1 4 4 48 Si el tam año de la región crítica va a ser a = 0.25, encontram os que la técnica de la razón de verosimilitud nos da una región crítica para la cual la hipótesis nula se re chaza cuando A = esto es, cuando x = 1, x = 2 o x = 3; claram ente, / ( l ) + / ( 2 ) + / ( 3 ) = jy + ji + i2 = 0.25. L a probabilidad correspondiente d e un e rro r de tipo II está dada p o r g ( 4 ) + g ( 5 ) + g ( 6 ) 4- g ( 7 ), y p o r tan to es igual a | . A hora considerem os la región crítica para la cual la hipótesis nula se recha za sólo cuando x = 4. Su tam año tam bién es a = 0.25 puesto que /(4) = p e ro la probabilidad correspondiente de un e rro r de tipo II es *(1) + g(2) + *(3) + *(5) + *(6 ) + g(7) = J + J + f + ° + ° + 0 = 3 Puesto que esto es m enos que la región critica o b tenida p o r m edio de la técni ca de la razón de verosim ilitud es inadm isible. ▲ EJERCICIOS 12.28 C o n re s p e c to al ejercicio 12.3, su p o n g a q u e h u b iésem o s q u e rid o p ro b a r la hi pótesis nula k á 2 contra la hipótesis alternativa k > 2. E ncuentre las proba bilidades de (a) errores del tipo I para k = 0 , 1 y 2; (b ) e rro re s d el tip o II p a ra k = 4. 5, 6 y 7. D ibuje tam bién la gráfica de la función de potencia correspondiente. 12.29 C o n re s p e c to al e je m p lo 12.5, su p o n g a q u e re c h a z a m o s la h ip ó te sis n u la si x S 15 y la a c ep ta m o s si x > 15. C alcule t t ( 0 ) p a ra los m ism os v alo res de 9
C apítulo 12: Prueba d e hipótesis: teoría com o en la tabla en la página 398 y dibuje la gráfica de la función de potencia de este criterio de prueba. 1230 E n la solución del ejem plo 12.6. verifique el paso que lleva a A= 12.31 E l n ú m ero d e éxitos en n in ten to s se va a usar p a ra p ro b a r la hipótesis nula de que el p arám etro 0 de una población binom ial es igual a ' contra la alternativa que no es igual a (a) E n cu en tre la expresión p ara la estadística de la razón de verosim ilitud. (b) U se el resultado del inciso (a) p ara dem ostrar que la región crítica de la prueba de razón de verosimilitud se puede escribir como x*ln x + (n — x)-ln(n — x) g K donde x es el núm ero observado de éxitos. (c) E studie la gráfica de f ( x ) = x • In x + (n — x ) • In (n — x) , en particular su m ínim o y su sim etría, p ara dem ostrar que la región crítica de esta p ru e ba de razón de verosimilitud tam bién se puede escribir como n £K X~2 donde K es una constante que depende del tam año de la región crítica. 1232 U na m uestra aleatoria de tam año n se va a usar para probar la hipótesis nula que el p arám etro 0 de una población exponencial es igual a 0 „ contra la alter n ativ a de q u e no es igual a 0O. (a) E n cu en tre una expresión p ara la estadística de la razón de verosim ilitud. (b) U se el resultado del inciso (a) para dem ostrar que la región crítica de la prueba de razón de verosim ilitud se puede escribir como x - e ~ il$0 á K 1233 Una m uestra aleatoria de tam año n de una población normal con m edia y va rianza desconocidas se va a usar para p ro b ar la hipótesis nula n = contra la alternativa ^ * n ^. U se las estim aciones sim ultáneas de máxima verosimilitud de fi y a 2 obtenidas en el ejem plo 10.17, dem uestre que los valores de la esta dística de la razón de verosim ilitud se puede escribir en la form a X — Uq ... . d o n d e t = - j\\ J ~ ' ^ o te 9 u e *a P™ 6 *53 ríe razó n d e v ero sim ilitu d p u e d e así basarse e n la d istrib u ció n t. 123 4 Para la estadística de la razón de verosim ilitud del ejercicio 12.33, m uestre que —2 • ln A se ap ro x im a a t2 c o n fo rm e n oo. [Sugerencia: use la serie in finita p ara l n (1 + x) d a d a en la página 223.]
Sección 12.6: Pruebas de razón de verosim ilitud 407 12.35 D ada una m uestra aleatoria de tam año n de una población norm al con m edia y varianza desconocidas, encuentre una expresión para la estadística de la ra zó n de v erosim ilitud p a ra p ro b a r la hipótesis nula a = <r0 c o n tra la hipótesis a lte rn a tiv a cr # <r0. (Sugerencia: véase el ejem p lo 10.17.) 1 2 3 6 M u estras a le a to ria s in d e p e n d ie n te s d e tam a ñ o n , , n 2, . . . , y «* d e k pob lacio n es norm ales con m edias y varianzas desconocidas se van a usar para probar la hi p ó tesis n u la a \\ = a \\ = ••• = <t \\ c o n tra la a lte rn a tiv a que e stas v arianzas no son todas iguales (a) D em uestre que bajo la hipótesis nula las estim aciones de m áxim a verosi m ilitu d de las m edias ¿i, y las varianzas cr* son M, = x , y K ~ i )s¡ ? = (2=i donde n = ^ n¡, m ientras que sin restricciones las estim aciones de má- xim a vero sim ilitu d de las m edias n , y las varianzas cr* son = í ¿ i = 1” . ~ E sto se sigue d ire c ta m e n te d e los resu ltad o s o b ten id o s e n la sección 10.8. (b) Use los resultados del inciso (a), dem uestre que la estadística d e la razón de verosim ilitud se puede escribir como n ' ( n¡ ~ 1 )* ? ' »./2 n¡ A = -1= 1- m2 123 7 M uestre q ue para k = 2 la estadística de razón de verosim ilitud del ejercicio 12.36 se p u ed e expresar en térm inos de la razón de dos varianzas de m uestra y que la prueba de razón de verosim ilitud puede, p or consiguiente, basarse en la d istrib u ció n F. 1238 C uando probam os una hipótesis nula simple contra una alternativa com puesta, se dice q u e una región crítica es insesgada si la función de potencia co rresp o n diente asum e su valor m ínim o en el valor del parám etro supuesto bajo la hipó tesis nula. E n otras palabras, una región crítica es insesgada si la probabilidad de rechazar la hipótesis nula es m ínim a cuando la hipótesis nula es verdadera. D ad a una observación única de la variable aleatoria X que tiene la densidad ñx) = 1 -0 para 0 < x < 1 o en cualquier otra parte D onde —1 ^ d S 1, m uestre que la región crítica x S a provee una región crítica insesgada de tam año a para p ro b ar la hipótesis nula 0 = 0 contra la hi pótesis alternativa 0 ^ 0 .
408 C a p ítu lo 12: Prueba d e hipótesis: teoría APLICACIONES 1 2^9 Se va a usar una observación única para p ro b ar la hipótesis nula de que la m e dia del tiem po de espera entre tem blores registrados en una estación sismoló gica (la m edia de u na población exponencial) es 6 = 1 0 h o ras co n tra la alternativa que 0 ^ 1 0 horas. Si la hipótesis nula será rechazada si y sólo si los valores observados son m enos que 8 o m ayores que 12 . encuentre (a) la p ro b a b ilid a d de un e rro r de tip o I; (b) las p ro b ab ilid ad es de erro res de tipo II cuando 6 = 2, 4, ó, 8 , 12. 16 y 20. G rafique tam bién la función de potencia de este criterio de prueba. 12.40 U na m uestra aleatoria de tam año 64 se va a usar para probar la hipótesis nula de que p ara cierto grupo de edad la m edia de la puntuación en una prueba de ren d im ie n to (la m edia d e una población n o rm al con cr2 = 256) es m e n o r q u e, o igual a, 40.0 contra la alternativa que es m ayor que 40.0. Si la hipótesis nula se rechazará si y sólo si la m edia de la m uestra aleatoria excede 43.5, encuentre (a) las p ro b ab ilid a d e s d e e rro re s detip o I c u a n d o fx = 37.0, 38.0, 39.0 y 40.0; (b) las p ro b a b ilid a d e s d e e rro re s d e tip o II c u a n d o /x = 41.0, 42.0, 43.0, 44.0, 45.0. 46.0, 47.0 y 48.0. G rafique tam bién la función de potencia de este criterio. 12.41 La sum a de los valores obtenidos en una m uestra aleatoria de tam año n = 5 se va a usar para probar la hipótesis nula de que en prom edio hay más de dos accidentes por sem ana en cierta intersección (que A > 2 para esta población Poisson) contra la hipótesis alternativa de que en prom edio el núm ero de acci d e n te s es d e dos o m enos. Si la h ipótesis n u la se rec h a z ará si y sólo si la sum a de las observaciones es cinco o m enos, encuentre (a) las p ro b ab ilidades deerro res detipo I cu an d o A = 2.2, 2.4, 2.6, 2.8 y 3.0; (b) las p ro b abilidades deerro res detipo II cuando A = 2.0, 1.5. 1.0 y 0.5. (Sugerencia: use los resultados del ejem plo 7.15.) T am bién, dibuje la gráfica de la función de potencia de este criterio de prueba. 1 2.42 V erifique la afirm ación de la página 400 de que 57 caras y 43 cruces en 100 lan zam ientos de una m oneda no nos perm iten rechazar la hipótesis nula de q ue la m oneda está perfectam ente balanceada (contra la alternativa de que no está p erfectam en te balanceada) al nivel 0.05 de significancia. (Sugerencia: use la aproxim ación norm al a la distribución binomial.) 12^3 Al com parar las variaciones en peso de cuatro razas de perros, los investigado res tom aron m uestras aleatorias independientes de tam año /i, = 8 , n 2 = 1 0 , n 3 = 6 y / i 4 = 8 , y o b tu v ie ro n Sj = 16, s j = 25, s% = 12 y s4 = 24. S u p o n g a que las poblaciones m uestreadas son norm ales, use la fórm ula del inciso (b) del e je rcic io 12.36 p a ra c a lc u la r —2 • In A y p ru e b e la h ip ó te sis n u la <r\\ = a l = ct\\ = cr\\ al nivel 0.05 de significancia. E x p liq u e p o r q u é e l n ú m e ro d e g rad o s d e lib e rta d p a ra e sta p ru e b a a p ro x im ad a de ji c u a d ra d a e s 3. 1 2 .4 4 Los tiem pos de avería de ciertos com ponentes electrónicos son 15, 28, 3 .1 2 .4 2 , 19, 20, 2, 25, 30, 62, 12, 18, 16, 44, 65, 33, 51, 4 y 28 m inutos. Si co n sid eram o s
C a p ítu lo 12: Referencias 409 estos datos com o una m uestra aleatoria de una población exponencial, use los resu ltad o s d e los ejercicios 12.32 y del teo re m a 12.2 p a ra p ro b a r la hipótesis n u la 0 — 15 m in u to s c o n tra la h ipótesis a lte rn a tiv a 0 ^ 1 5 m in u to s al nivel 0.05 d e significancia. (U se ln 1.763 = 0.570.) REFERENCIAS Los exám enes de diversas propiedades de las pruebas de razón de verosimilitud, particu larm ente sus propiedades de m uestra grande, y una prueba del teorem a 12.2 se pueden en contrar en la m ayoría de los libros de texto avanzados sobre la teoría estadística, por ejemplo, en L eh m a n n . E. L.. Testing Statistical Hypotheses. 2nd ed. Nueva York: John Wiley & Sons, Inc., 1986. W ilk s. S. S., M aihematical Statistics. Nueva York: John Wiley & Sons. Inc., 1962. Mucho de la investigación original hecha en esta área se reproduce en Selected Papers in Statistics and Prohahility bv Abraham Wald. Stanford, Calif.: Stanford University Press, 1957.
CAPÍTULO 13 Prueba de hipótesis: aplicaciones 13.1 IN TR O D U CCIÓ N 13.2 PRUEBAS C O N C ER N IEN TES A MEDIAS 13.3 PRUEBAS C O N C ER N IEN TES A DIFERENCIAS ENTRE MEDIAS 13.4 PRUEBAS C O N C E R N IE N TE S A VARIANZAS 13.5 PRUEBAS C O N C ER N IEN TES A PROPORCIONES 13.6 PRUEBAS C O N C E R N IE N TE S A DIFERENCIAS ENTRE k PROPORCIONES 13.7 EL ANÁLISIS DE U N A TA B LA r X c 13.8 B O N D A D DEL AJUSTE 13.9 USO DE COM PUTADORAS 13.1 IN TR ODUCCIÓ N E n el capítulo 12 exam inam os una p arte de la teoría que sustenta las pruebas estadís ticas. y en este capítulo presentarem os algunas de las pruebas estándar que se usan m ás am pliam ente en las aplicaciones. La m ayoría de estas pruebas, al m enos las que se ba san en distribuciones conocidas de poblaciones, se puede obtener m ediante la técnica de la razón de verosimilitud. Para explicar la term inología que usarem os, considerem os una situación donde q u e re m o s p ro b a r la h ip ó tesis n u la H 0: 8 = 80 c o n tra la h ip ó tesis alternativa bilateral H x: 8 * 9q . P u e sto q u e p a re c e razo n ab le a c e p ta r la h ip ó tesis n u la c u a n d o n u e s tra e s tim ación puntual 8 de 9 es cercana a 90 y rechazarla cuando 8 es m ucho más grande, o m u ch o m ás p e q u e ñ a q u e 0O, sería lógico d e ja r q u e la reg ió n crítica co n sista e n am bas colas de la distribución m uestral de nuestra estadística 0 . U na prueba así se conoce c o m o prueba de dos colas. Por o tra p a rte , si estam os p ro b an d o la hipótesis nula H 0: 9 = 80 c o n tra la a lte r nativa unilateral H x: 8 < 90, parecería razonable rechazar H 0 sólo cuando 9 es m ucho m ás p e q u e ñ a q u e 0„- P ° r co n sig u ien te, e n e ste caso sería lógico d e ja r q u e la reg ió n c rí tica consista sólo en la cola del lado izquierdo de la distribución m uestral de 0 . De igual m an era, al p ro b a r H 0: 8 = 90 c o n tra la alternativa unilateral H x: 8 > 90, re c h a zam os H 0 sólo p ara valores grandes de 6, y la región crítica consiste solam ente en la cola derecha de la distribución m uestral de 0 . C ualquier prueba donde la región críti ca consiste sólo en una cola de la distribución m uestral de la estadística de prueba se llam a prueba de una cola. 410
Sección 13.1: Introducción 411 P o r ejem p lo , p a ra la a lte rn a tiv a b ilateral ¿c /x« e n e l e je m p lo 12.6. la técn ica de la razón de verosim ilitud lleva a una prueba de dos colas con la región crítica I* - /*„l e O xs ^ y x a + z„¡7 ■- j - C o m o se dib u ja en la figura 13.1, la h ip ó te sis nula /z = ¿t0 se rech aza si X asum e un valor que caiga en cualquiera de las colas de su distribución m uestral. En form a sim bólica. e s ta reg ió n c rític a se p u e d e escrib ir c o m o z á —Zo/2 o z S zo/2, d o n d e = * ~ Mo tr/Vn Rechace H Rechace H„ Mo Za/2 ^ ’ ' Mo + Za/2 ^ F ig u ra 1 3 .1 Región crítica para la prueba de dos colas. Si h u b iésem o s u sad o la a lte rn a tiv a u n ilateral /x > /x0, la técnica de la razó n de verosim ilitud nos hubiese llevado a la prueba de una cola cuya región crítica se dibuja en la figura 13.2, y si h u b iésem o s u sad o la a lte rn a tiv a u n ila te ra l jj, < f i 0, la técn ica de la razón de verosim ilitud nos hubiese llevado a la prueba de una cola cuya región crí tica se dibuja en la figura 13.3. E s lógico q u e en el prim er caso rechazaríam os la hipó tesis nula sólo p ara valores de X que caigan en la cola del lado derecho de su distribución m uestral, y en el segundo caso rechazaríam os la hipótesis nula sólo para valores de X que caigan en la cola del lado izquierdo de su distribución m uestral. De m anera sim bólica, las regiones críticas correspondientes se pueden escribir com o z S z„ y c o m o z S —z a , d o n d e z se defin e com o an tes. A u n q u e hay excepciones a esta regla (véase el ejercicio 13.1), las alternativas bilaterales suelen llevar a pruebas de dos colas y las alternativas unilaterales suelen conducir hacia pruebas de una cola. T radicionalm ente, ha sido costum bre bosquejar las pruebas de hipótesis m edian te los siguientes pasos:
412 Capítulo 13: Prueba de hipótesis: aplicaciones Rechace H 0 Acepte H 0 1. Form ule //, y H l , y especifique a . 2. Use la distribución muestral de una estadística de prueba apropiada, determine una región crítica de tamaño a . 3. Determine el valor de la estadística de prueba a partir de los datos de la muestra. 4. Com pruebe si el valor de la estadística de prueba cae en la región crítica y, con base en ello, rechace la hipótesis nula, o acéptela, o bien reserve el juicio. E n las figuras 13.1,13.2 y 13.3, las líneas divisorias del criterio de p ru eb a (esto es. ios límites d e las regiones críticas, o los valores críticos) req u ie re n el co n o cim ien to de
414 Capítulo 13: Prueba de hipótesis: aplicaciones en la cola del lado derecho o en la cola del lado izquierdo de la distribución m uestral de X . En este caso se supone o tra vez que la hipótesis nula es verdadera. M ás generalm ente, definim os los valores P com o sigue d e fin ic ió n I 3 .I El valor P es el m enor nivel de significancia, que corresponde a un valor observado de la estadística de p rueba, en el cual la hipótesis nula po dría haberse rechazado. C on respecto a este enfoque alternativo a probar hipótesis, el prim ero de los cua tro pasos en la página 412 perm anece sin cam bio, el segundo paso se convierte en 2'. Especifique la estadística de prueba. y el tercer paso se convierte en 3'. Determ ine el valor de la estadística de prueba y el valor P correspondiente a par tir de los datos de la muestra. Y el cuarto paso se convierte en 4'. Com pruebe si el valor P es m enor que, o igual a a y, de acuerdo a esto, rechace la hipótesis nula, o acéptela, o bien reserve el juicio. C om o señalam os en la página 413, esto nos da m ás libertad en la selección del ni vel de significancia, p ero es difícil concebir situaciones donde podríam os justificar el uso de, digam os, a = 0.04 en vez de a = 0.05 o a = 0.015 en vez de a = 0.01. E n la práctica, es prácticam ente imposible evitar algún elem ento de arbitrariedad, y en la ma yoría d e los casos hacem os juicios subjetivos, al m enos en p arte, si a = 0.05 o a = 0.01 refleja riesgos aceptables. Por supuesto, cuando hay m ucho en juego y es práctico, po d ría m o s u s a r u n n iv el d e significancia m u ch o m ás p e q u e ñ o q u e a = 0 .0 1 . E n m uchos casos, se debe entender que los dos m étodos para probar hipótesis, los cuatro pasos q u e se dieron en la página 412, y los cuatro pasos aquí descritos, son equivalentes. E sto significa que sin im portar el m étodo que usem os, la decisión final (rechazar la hipótesis nula, aceptarla, o bien reservar el juicio) será la misma. E n la práctica, usamos cualquier m étodo que sea más conveniente, y esto puede depender de la distribución m uestral de la estadística de prueba, la disponibilidad de tablas estadís ticas o del softw are de com putadora, y la naturaleza del problem a (véase, por ejem plo, el ejem plo 13.8 y el ejercicio 13.52). H ay estadísticos que prefieren evitar los problem as relacionados con la elección del nivel de significancia. Lim itan su papel al análisis de datos, no especifican a y om i ten el paso 4'. P or supuesto, siem pre es deseable tener el punto de vista de otros (in vestigadores o gerentes) al form ular la hipótesis y especificar a , pero difícilm ente sería razonable dejar caer los valores P en m anos de personas sin capacitación adecuada en estadística y dejar que ellos sigan a partir de ese punto. Para com plicar las dificultades, considere la tentación a que uno podría estar expuesto al escoger a después de haber
416 Capítulo 13: Prueba de hipótesis: aplicaciones p a ste le ría p ie rd e d in e ro c u a n d o ¿i > 8 y el c lie n te p ie rd e c u a n d o /x < 8 , p ru e b e la h i pótesis nula ¡i = 8 contra la hipótesis alternativa n # 8 al nivel 0.01 de significancia. Solución 1 . H 0: n = 8 / / , : /x * 8 a = 0.01 2. R e c h a ce la h ipótesis nula si z = —2.575 o z ^ 2.575, d o n d e 3. A l s u s titu ir * = 8 .091, 7= ^ (r/y/n = 8 , cr = 0 . 1 6 y n = 2 5 , o b t e n e m o s Z = ----------- 7 = = 2 .8 4 0.16/V 25 4. Puesto que z = 2.84 excede a 2.575, se debe rechazar la hipótesis nula y se deben hacer ajustes apropiados en el proceso de producción. ▲ Si hubiésem os usado el enfoque alternativo descrito en la página 414, hubiése m os obtenido un valor P de 0.0046 (véase el ejercicio 13.8), y puesto que 0.0046 es m e n o s q u e 0 .0 1 , la conclusión h u b ie ra sido la m ism a. Se debe observar que la región crítica z ^ z a tam bién se puede usar p ara probar la h ip ó tesis n u la /x = ^ c o n tra la a lte rn a tiv a sim ple /x = /x, > /xq o la h ip ó tesis n u la co m p u e sta f i % /x0 c o n tra la a lte rn a tiv a co m p u e sta ( i > ¡xq. E n el p rim e r c a so e s ta ría m os probando una hipótesis simple contra una alternativa sim ple com o en la sección 12.4 (véase el e je m p lo 12.4, d o n d e estu d ia m o s e s ta p ru e b a p a ra cr = 1), y e n el seg u n do caso a sería la probabilidad m áxim a de com eter un erro r de tipo 1 para cualquier valor de ¿i asum ido bajo la hipótesis nula. Por supuesto, se aplicarían argum entos sim i lares a la región crítica z ^ ~ z a . Cuando estam os tratando con una m uestra grande de tam año n ^ 30 de una po blación que no necesita ser norm al pero que tiene una varianza finita, podem os usar el teorem a del lím ite central para justificar el uso de la prueba para poblaciones norm a les, y a u n c u a n d o cr2 e s d esco n o cid a p o d e m o s a p ro x im ar su v alo r c o n s 2 e n el cálculo d e la estad ística d e p ru eb a. P a ra ilu strar el uso d e u n a prueba ap ro x im ad a de muestra grande, considere el siguiente ejem plo. EJEM PLO 13.2 Suponga que 100 neum áticos que cierto fabricante produce d u raron en prom edio 21.819 m illas co n una desviación e stá n d a r de 1,295 m illas. P ru e b e la hipótesis nula = 22,000 m illas contra la hipótesis alternativa fi < 22,000 m illas en el nivel 0.05 de significancia.
Sección 13.2: Pruebas concernientes a medias 417 Solución 1. H 0: fi = 22,000 / / , : /x < 2 2 ,0 0 0 a = 0.05 2. R e c h a ce la h ipótesis nula si z = —1.645. d o n d e = X ~ flQ a /V ñ 3. A l su stitu ir x = 21,819, /x() = 22,000. s = 12 9 5 p o r o y n = 100, o b te n e mos 21,819 - 22,000 Z = --------------- 7 = — = - 1 .4 0 1,295/V 100 4. P uesto q u e z = —1.40 es m ayor que—1.645, no se p u ed erechazar la h ip ó tesis nula; no hayevidencia real deque losneum áticos no son tan buenos com o se supone bajo la hipótesis nula. ▲ Si hubiésem os usado el enfoque alternativo descrito en la página 414, habríam os obtenido un valor P de 0.0808 (véase el ejercicio 13.9), que excede a 0.05. C om o debie ra haberse esperado, la conclusión es la m ism a: no se puede rechazar la hipótesis nula. C uando n < 30 y a 1 es desconocida, no se puede usar la prueba que hem os es ta d o ex am in an d o e n esta sección. Sin em bargo, en el ejercicio 12.33 vim os q u e p ara m uestras aleatorias de poblaciones norm ales, la técnica de la razón de verosim ilitud nos da una prueba correspondiente basada en ,= J ~ s/Vn que, de acuerdo al teorem a 8.13, es un valor de una variable aleatoria que tiene la distri bución t con n — 1 grados de libertad. Así, las regiones criticas de tam año a para p ro b a r la h ip ó tesis n u la /x = /xq c o n tra las a lte rn a tiv a s n ^ /xq, /x > /x0 o / í < /x«, son, resp ectiv am en te. \\t\\ 2 tap..n- \\ - 1 ^ C ,n -i y 1 ^ —C .n -i- A d v ierta q u e los co m en tario s de la página 416 en relación con la hipótesis alternativa ¿q > ^ y la prueba de la hipó tesis nula n ^ /xo c o n tra la altern ativ a /x > /x,, tam bién se aplican en este caso. El siguiente ejem plo ilustra esta prueba t de una m uestra, com o suele llamarse. EJEM PLO 13.3 Las especificaciones para cierta clase de cinta piden una m edia de la resistencia al rom p im ien to d e 185 libras. Si cinco piezas seleccio n ad as a le a to ria m e n te d e d ife re n te s r o llos tien en u n a resisten cia al ro m p im ie n to d e 171.6, 191.8, 178.3, 184.9 y 189.1 libras, p ru e b e la h ipótesis n u la ¡x = 185 libras c o n tra la hipótesis a lte rn a tiv a /x < 185 libras en el nivel 0.05 de significancia.
Sección 13. 3: Pruebas concernientes a diferencias entre m edias 421 Si no se p u ed e sostener la suposición de varianzas iguales en un problem a de es ta clase, hay varias posibilidades. U na relativam ente simple consiste en form ar aleato riam ente parejas d e los valores en las dos m uestras y después considerar sus diferencias c o m o u n a m u estra a le a to ria d e ta m a ñ o « , o n 2. la q u e sea m ás p e q u e ñ a , d e u n a p o b la ción n o rm a l q u e, b a jo la h ip ó tesis n u la, tien e la m ed ia p = 5. D esp u és p ro b a m o s esta hipótesis nula co n tra la alternativa apropiada por m edio de los m étodos de la sección 13.2. É sta es una b u e n a razó n p a ra te n e r n , = n 2, p e ro existen técnicas a lte rn a tiv a s p a ra m anejar el caso donde n, ^ n 2 (una de éstas, la prueba Smith-Satterthwaite, se m en ciona en las referencias al final del capítulo). Hasta ahora hemos lim itado nuestro exam en a m uestras aleatorias que son inde pendientes, y los m étodos que presentam os en esta sección no se pueden usar, por ejem plo, para decidir con base en los pesos “antes y después” si cierta dieta es real m ente eficaz o si las diferencias observadas entre los 1 0 prom edio de m aridos y sus esposas son realm ente significativas. E n am bos ejem plos las m uestras no son indepen dientes porque los datos están realm ente asociados p o r parejas. U na form a com ún de m anejar esta clase de problem as es proceder com o en el párrafo anterior, esto es, tra bajar con las diferencias en tre las parejas de m edidas u observaciones. Si n es grande, podem os entonces usar la prueba descrita en la página 415 para probar la hipótesis nula fi, — fi2 = 8 co n tra la alternativa ap ro p iad a, y si n es p eq u eñ a, podem os usar la p ru e ba / descrita en la página 417, siem pre y cuando las diferencias se puedan considerar com o una m uestra aleatoria de una población normal. EJERCICIOS 13.1 D ada una m uestra aleatoria de tam año n de una población normal con varian za con o cid a tr2, d e m u e stre q u e la h ipótesis nula p = fi# se p u e d e p ro b a r c o n tra la hipótesis alternativa fi ^ fi0 con el uso de un criterio de una cola que se base en la distribución ji cuadrada. 13.2 Suponga q ue una m uestra aleatoria de una población norm al con la varianza conocida o2 se va a usar para probar la hipótesis nula p = p^ contra la hipóte sis a lte rn a tiv a p = f i,, d o n d e /x¡ > fi0, y q u e las p ro b ab ilid a d e s d e e rro re s de tip o I y tip o II van a te n e r los v alores p rea sig n ad o s a y /3. D e m u e stre q u e e l ta m año requerido de la m uestra está dado por n = ^ { z a 4- l e ? (Mi “ 13.3 C o n re sp e c to al ejercicio a n te rio r, e n c u e n tre el ta m a ñ o re q u e rid o d e la m u es tra c u a n d o a = 9, fq, = 15, p x = 20, a = 0.05 y /3 = 0.01. 13.4 Suponga que m uestras aleatorias de tam año n de dos poblaciones norm ales con varianzas conocidas irj y se van a usar para probar la hipótesis nula fi, — fi2 = 5 contra la hipótesis alternativa fi, — p 2 = 8 ' y que las probabilidades de e rro re s d e tip o I y tip o II van a te n e r los v a lo re s p reasig n ad o s a y f3. De m u e s tre q ue el tam año requerido de la m uestra está dado p or
Sección 13.3: Pruebas concernientes a diferencias entre medias 423 13.16 E n 12 co rrid as d e p ru e b a so b re u n a ru ta señ alad a, una lancha m o to ra re c ie n te m ente diseñada prom edió 33.6 segundos con una desviación estándar de 2.3 se gundos. S uponiendo que es razonable tratar los datos com o una m uestra aleatoria d e una población norm al, use los cuatro pasos en la página 412 para p ro b a r la h ip ó tesis nula ¿i = 35 c o n tra la a lte rn a tiv a ¿i < 35 e n el nivel 0.05 de significancia. 13.17 C inco m ediciones del contenido de alquitrán de cierta clase de cigarrillos die ro n 14.5, 14.2, 14.4, 14.3 y 14.6 m g/cigarrillo. S uponga que los d a to s son una m uestra aleatoria de una población norm al, use los cuatro pasos de la página 412 para d em o strar q ue en el nivel 0.05 de significancia se debe rechazar la hi p ó tesis n u la fx = 14.0 e n fav o r d e la a lte rn a tiv a fx 14.0. 13.18 C o n re sp e c to al ejercicio 13.17, d e m u e stre q u e si la p rim e ra m ed ició n se reg is tra in correctam ente com o 16.0 en vez de 14.5, esto invertiría el resultado. E x plique la paradoja ap aren te que aunque ha au m en tad o la diferencia en tre la m ed ia de la m u estra y /x,, ya n o es significativa. 13.19 C o n re sp e c to al ejercicio 13.17, use so ftw are estad ístico a p ro p ia d o p a ra e n c o n trar el valor P que corresponde al valor observado de la estadística de prueba. U se este valor P para resolver de nuevo el ejercicio. 13.20 Si la m ism a hipótesis se prueba con bastante frecuencia, es probable que se re chace p o r lo m enos una vez, au n si es verdad. U n profesor de biología, al in te n tar dem ostrar este hecho, hizo que ratones blancos recorrieran un laberinto p ara d ete rm in a r si los rato n es blancos reco rrían el lab erin to m ás rápido que la norm a establecida en muchas pruebas anteriores que incluyeron ratones de di ferentes colores. (a ) Si el p ro fe s o r realiza e ste e x p e rim e n to u n a vez con varios ra to n e s (y usa el nivel 0.05 de significancia), ¿cuál es el nivel de probabilidad de que ob ten d rá un resultado “significativo\" aun si el color del rató n no afecta su ve locidad al recorrer el laberinto? (b) Si el p ro feso r repite el ex perim ento con un nuevo conjunto de rato n es blancos, ¿cuál es la probabilidad de que al m enos uno de los experim en tos d a rá un resultado “significativo\" aun si el color del rató n no afecta su velocidad al recorrer el laberinto? (c) Si el profesor hace que 30 de sus estudiantes hagan el mismo experim ento, ca da uno con un grupo diferente de ratones blancos, ¿cuál es la probabilidad de que al m enos uno de estos experim entos resultará “significativo\" aun si el co lor del ratón no juega ningún papel en la velocidad al recorrer el laberinto? 13.21 U n e p id e m ió lo g o e stá tra ta n d o d e d e sc u b rir la c au sa de c ie rta clase d e cáncer. E stu d ia u n g ru p o d e 10,(XK) p e rso n a s p o r cinco añ o s, m ide 48 “ fac to re s” d ife rentes e n tre los que estaban hábitos alim enticios, hábitos de beber bebidas al cohólicas, d e fum ar, de hacer ejercicio, y así sucesivam ente. Su objetivo es d eterm in ar si hay alguna diferencia en las m edias de estos factores (variables) entre quienes desarrollaron el cáncer dado y quienes no. Él supone que estas variables son independientes, aun cuando puede haber evidencia en contrario. E n un esfu erzo p o r ser cau telo sam en te conservador, usa el nivel 0.01 de signi ficancia en todas sus pruebas estadísticas.
Sección 13.3: Pruebas concernientes a diferencias entre medias 425 13.29 P ara c o m p a ra r d o s clases d e p ro te c to re s de d efen sas, se m o n ta ro n seis d e cada clase en cierta m arca de auto com pacto. Entonces cada auto se hizo chocar con tra una p ared de concreto a 5 millas por hora, y los siguientes son los costos de la reparaciones (en dólares): Protector d e defensas \\ : 127 168 143 165 122 139 Protector d e defensas 2: 154 135 132 171 153 149 U se los c u a tro pasos de la p ágina 412 p a ra p ro b a r en el nivel O.ül de significan cia si la diferencia en tre las m edias de estas dos m uestras es significativa. 13J O C o n re sp e c to al ejercicio 13.29, use so ftw are estad ístico a p ro p ia d o p a ra e n c o n trar el valor P que corresponde al valor observado de la estadística de prueba. U se este valor P para rehacer el ejercicio. 1331 En un estudio sobre la eficacia de ciertos ejercicios para reducir de peso, un grupo de 16 personas hicieron estos ejercicios durante un m es y m ostraron los siguientes resultados Peso Peso Peso Peso antes después antes después 211 198 172 166 173 155 154 180 172 185 181 171 209 167 164 214 179 203 182 192 181 201 194 161 245 160 182 146 175 182 233 142 U se el nivel 0.05 de significancia para probar la hipótesis nula p x — ^ = 0 con tra la hipótesis alternativa /x, — /x2 > 0 , y así juzgar si los ejercicios son efica ces en la reducción de peso. 1 3 3 2 Las siguientes son las pérdidas sem anales prom edio de horas de trabajo a cau sa de accidentes en 10 plantas industriales antes y después de poner en opera ción cierto program a de seguridad: 45 y 36. 73 y 60, 46 y 44, 124 y 119, 33 y 35 57 y 51, 83 y 77, 34 y 29, 26 y 24, 17 y 11 Use los cu atro pasos en la página 412 y el nivel 0.05 de significancia para p ro bar si el program a de seguridad es eficaz. 1 3 3 3 C on resp ecto al ejercicio 13.32, use softw are estadístico ap ro p iad o p ara encon trar el valor P que corresponda al valor observado de la estadística de prueba. Use este valor P para volver a resolver el ejercicio.
426 Capítulo 13: Prueba d e hipótesis: aplicaciones 1 3 .4 PR UEBAS C O N C ER N IEN TES A V A R IA N Z A S Hay varias razones por las que es im portante probar las hipótesis concernientes a las varianzas de las poblaciones. En lo que concierne a las aplicaciones directas, un fabri cante que tiene que cum plir con especificaciones rígidas tendrá que efectuar pruebas sobre la variabilidad de su p roducto, tal vez un m aestro desea saber si ciertas asev era ciones son verdaderas acerca de la variabilidad que puede esperar en el desem peño de un estudiante, y quizá un farm acéutico tiene que com probar si la variación en la poten cia de una m edicina está dentro de los lím ites perm isibles. En lo que concierne a apli caciones indirectas, las pruebas acerca de las varianzas a m enudo son prerrequisitos para las pruebas concernientes a otros parám etros. Por ejem plo, la prueba t de dos m uestras descrita en la página 420 requiere que las varianzas de las dos poblaciones sean iguales, y en la práctica esto significa que quizá tengam os que com probar la razo- nabilidad de esta suposición antes de efectuar la prueba concerniente a las medias. E n tre las pruebas que estudiarem os en esta sección está una prueba de la hipó tesis nula de que la varianza de una población norm al es igual a una constante dada y la pru eb a de razón de verosim ilitud de la igualdad de las varianzas de dos poblaciones norm ales (a la q u e nos referim os en el ejercicio 13.27). La p rim e ra d e estas p ru eb a s es esencialm ente la del ejercicio 12.35. D a d a una m uestra aleatoria de tam año n de una población norm al, querem os probar la hipótesis n u la ir2 = í t \\ c o n tra u n a d e las a lte rn a tiv a s a 1 & crl, a 2 > a l o er2 < <7 q y, c o m o el lector debe h a b e r d escubierto en el ejercicio 12.35, la técnica de la razón de verosim i litud nos lleva a u n a p ru e b a q u e se basa e n r 2, el v a lo r d e la v a ria n z a d e la m u e stra . B asado en el teorem a 8.10, podem os escribir así las regiones críticas para p ro b ar la hi pótesis nula contra las dos alternativas de un lado com o x 2 x í.n - i y X2 = * i-« .n -i» donde Az _ (* - l )* 2 «o E n lo que c o n c ie rn e a la a lte rn a tiv a b ilateral, rech azam o s la h ip ó tesis nula si x 2 ^ X2an .« - \\ ° X1 = X i-a /2, n - i * y e l ta m a ñ o d e to d a s e stas reg io n e s críticas es, p o r su p u e s to, igual a a. EJEM P LO 13.6 Suponga que el espesor de una parte usada de un sem iconductor es su dim ensión crí tica y que las m ediciones del espesor de una m uestra aleatoria de 18 de dichas partes tiene la varianza s2 = 0.68, donde las m ediciones son en m ilésim as de una pulgada. El proceso se considera que está bajo control si la variación del espesor está d ad a p o r una varianza no m ayor q ue 0.36. Suponga que las m ediciones constituyen u na m uestra alea toria de una población norm al, pruebe la hipótesis nula <r = 0.36 contra la hipótesis alternativa o2 > 0.36 en el nivel 0.05 de significancia.
428 Capítulo 13: Prueba d e hipótesis: aplicaciones que si la variable aleatoria X tiene la distribución F con v x y v2 grados de libertad, e n tonces -p tiene la distribución F con v2 Y v \\ grados de libertad. A EJEM PLO 13.7 Al com parar la variabilidad de la resistencia a la tracción de dos clases de acero estruc tu ra l, u n e x p e rim e n to d io los re s u lta d o s sig u ien tes: n , = 13, 5? = 19.2, n 2 = 16 y j* = 3.5, donde las unidades de m edición son 1,000 libras p o r pulgada cuadrada. S u ponga que las m ediciones constituyen variables aleatorias independientes de dos p o blaciones norm ales, prueba la hipótesis nula a¡ = a \\ contra la alternativa a \\ * a \\ en el nivel 0.0 2 de significancia. Solución 1. H 0: o j = o \\ / / , : a ] ^ 0-2 a = 0.02 s2 2. P u e sto q u e 5? sS 5 *, rech ace la h ip ó tesis n u la si - 5- ^ 3.67, d o n d e 3.67 es el s2 valo r de X.01. a i s - 3. A l su stitu ir sf = 19.2 y 52 = 3.5. o b ten em o s 4. P uesto que / = 5.49 excedea 3.67, se debe rechazar la hipótesis nula; con cluim os que la variabilidad de la resistencia a la tracción de las dos clases de acero no es la m ism a. ▲ EJERCICIOS 1334 Al hacer uso del hecho que la distribución ji cuadrada se puede aproxim ar con una distribución norm al cuando v, el núm ero de grados de libertad, es grande, dem uestre que para m uestras grandes de poblaciones normales s2 £ a i 1 + z es una región crítica aproxim ada de tam año a para p ro b ar la hipótesis nula a 2 = a l contra la alternativa a 2 > a l . C onstruya tam bién las regiones críti cas correspondientes para probar esta hipótesis nula contra las alternativas a 2 < a l y a 2 ^ a l (véase el ejercicio 8.38). 1335 H aga uso del resultado del ejercicio 8.43, dem uestre que p ara m uestras aleato ria s g ran d e s de p o b lacio n es n o rm ales, las p ru e b a s d e la h ip ó tesis nula a 2 = Oq se puede basar en la estadística:
Sección 13.4: Pruebas concernientes a varianzas 429 ( ^ r ~ 0 V 2 (\" \" que tiene aproxim adam ente la distribución norm al estándar. A P L IC A C IO N E S 1336 Nueve determ inaciones del calor específico del hierro dieron una desviación es tándar de 0.0086. Suponga que estas determ inaciones constituyen una m uestra a le a to ria d e una p o b lació n n o rm a l, p ru eb e la h ip ó tesis n u la <t = 0 .0 1 0 0 c o n tra la hipótesis alternativa a < 0.0100 en el nivel 0.05 de significancia. 1337 En una m uestra aleatoria, los pesos de 24 reses Black A ngus de cierta edad tie nen una desviación estándar de 238 libras. Suponga que los pesos constituyen una m u estra aleatoria de una población norm al, p ru eb e la hipótesis nula cr = 250 lib ras c o n tra la a lte rn a tiv a b ilateral o # 250 libras en el nivel 0.01 de significancia. 1338 E n una m uestra aleatoria, s = 2.53 m inutos para la cantidad de tiem po que 30 m ujeres tardaron en term inar la prueba escrita para su licencia de conducir. En el nivel 0.05 d e significancia, p ru eb e la h ipótesis nula <r = 2.85 m in u to s c o n tra la hipótesis alternativa a < 2.85 m inutos (use el m étodo descrito en el texto). 1 3 3 9 U se el m éto d o del ejercicio 13.35 p ara reh acer el ejercicio 13.38. 13.40 Los d ato s pasados indican que la desviación están d ar de m ediciones que ins p e c to re s e x p e rim e n ta d o s h icieron en esta m p ad o s de plancha m etálica e s 0.41 pulgadas cuadradas. Si un inspector nuevo m ide 50 estam pados con una desvia ción e stá n d a r de 0.49 pulgadas cuadradas, use el m éto d o del ejercicio 13.35 p a ra p ro b a r la h ip ó te sis n u la «r = 0.41 p u lg ad as c u a d ra d a s c o n tra la h ip ó tesis a lte rn a tiv a a > 0.41 pulgadas c u a d ra d a s en el nivel 0.05 de significancia. 13.41 C on resp ecto al ejercicio 13.40. encuentre el valor P que corresp o n d e al valor o bservado de la estadística de p rueba y úselo p ara decidir si la hipótesis nula podría haberse rechazado en el nivel 0.015 de significancia. 1 3 .4 2 C o n re sp e c to al e je m p lo 13.5. p ru e b e la h ip ó tesis nula (r¡ — it2 = 0 c o n tra la h ip ó tesis a lte rn a tiv a o x — <r2 > 0 en el nivel 0.05 de significancia. 13.43 C on respecto al ejercicio 13.27, p ruebe en el nivel 0.10 de significancia si es ra zonable suponer que las dos poblaciones m uestreadas tienen varianzas iguales. 13.44 C on respecto al ejercicio 13.29, p ruebe en el nivel 0.02 de significancia si es ra zonable suponer que las dos poblaciones m uestreadas tienen varianzas iguales.
434) Capítulo 13: Prueba de hipótesis: aplicaciones 13.5 PRUEBAS CO N CER N IEN TES A PRO PORCIO NES Si el resultado de un experim ento es el núm ero de votos que un candidato recibe en una votación, el núm ero de defectos encontrados en una pieza de tela, el núm ero de niños que se ausentan d e la escuela en un día dado,..., nos referim os a estos datos com o datos de conteo. Los m odelos apropiados p ara el análisis de los datos de conteo son la distri bución binom ial, la distribución de Poisson, la distribución m ultinom ial, y algunas de las dem ás distribuciones discretas que estudiam os en el capítulo 5. En esta sección presen tarem os una de las pruebas más comunes basada en datos de conteo, una prueba con cerniente al parám etro 0 de la distribución binomial. Así, podríam os probar con base en una m u estra si la v e rd a d e ra p ro p o rció n de curaciones de cierta e n fe rm e d a d es 0.90 o si la v e rd a d e ra p ro p o rc ió n de defecto s q u e salen e n u n a línea de en sam b le es 0 .0 2 . E n el ejercicio 12.12 se pidió al lector que m ostrara que la región crítica m ás p o te n te p a ra p r o b a r la h ip ó tesis n u la 0 = 0 Oc o n tra la h ip ó tesis a lte rn a tiv a 0 = 0 , < 0 O, donde 0 es el parám etro de una población binom ial, se basa en el valor de X , el núm e ro de “éxitos” o b tenidos en n ensayos. C uando se trata de alternativas com puestas, la técnica de la razón de verosim ilitud tam bién brinda pruebas basadas en el núm ero de éxitos o b serv ad o s {com o vim os en el ejercicio 12.31 p a ra el caso especial d o n d e 0 O = 5 ). D e hecho, si qu erem o s p ro b a r la hipótesis nula 0 = 0Oco n tra la alternativa unilateral 0 > 0 O, la reg ió n crítica d e ta m a ñ o a d el criterio d e la razó n d e verosim ilitud es donde k a es el entero más pequeño para el cual 2 b (y; n , 0O) S a >•“ *« y b ( y ; n . 0O) es la p ro b ab ilid a d d e o b te n e r y éx ito s e n n en say o s b in o m iale s c u a n d o 0 = 0O. P o r ta n to el ta m a ñ o d e e s ta región crítica, así com o de las q u e siguen, es tan cercana com o es posible a a sin excederla. La región crítica co rresp o n d ien te p ara p ro b a r la hipótesis n u la 0 = 0O co n tra la alternativa unilateral 0 < 0 Oes x ^ k 'a d o n d e k'a e s el e n te ro m ás g ran d e p a ra e l cual 2 b { y , n , 0 o) á a >=0 y, finalm ente, la región crítica p ara p ro b ar la hipótesis nula 0 = 0Ocontra la altern ati va bilateral 0 0„ es X S k a/2 o X á k 'af2
Sección 13.5: Pruebas concernientes a proporciones 431 No ilustrarem os este m étodo de determ inar las regiones críticas para pruebas concernientes al p arám etro binom ial 0 porque, en la práctica real, es m ucho m enos te d ioso b asar las decisiones en los valores P. EJEM PLO 13.8 Si x = 4 de n = 20 pacientes sufrieron efectos secundarios serios a causa de un nue vo m edicam ento, pruebe la hipótesis nula 0 = 0.50 contra la hipótesis alternativa 0 0.50 en el nivel 0.05 de significancia. En este caso 0 es la proporción v erd ad era de pacientes que sufren efectos secundarios serios a causa del nuevo m edicam ento. Solución 1. H 0: 0 = 0.50 / / , : 0 * 0.50 a = 0.05 2'. U se la estadística de prueba X , el núm ero observado de éxitos. 3'. x = 4, y puesto que P (X S 4 ) = 0.0059. el valor P es 2(0.0059) = 0.0118. 4'. P uesto que el valor P , 0.0118, es m enor que 0.05, se debe rechazar la hipó tesis nula; concluim os que 6 & 0.50. A Las pruebas que hem os descrito requieren el uso de una tabla de probabilidades binom iales, sin im p o rtar si usam os los cuatro pasos de la página 412 o los de la página 414. P ara n ^ 20 podem os usar la tabla I al final del libro, y para valores de n hasta 100 podem os usar las tablas a las que hicim os referencia al final del capítulo 5. A lter nativam ente, para valores grandes de n podem os usar la aproxim ación norm al de la dis tribución binom ial y tratar x ~ nd Vnd{ 1 - 0 ) com o una variable aleatoria que tiene la distribución norm al estándar. Para n grande, p o d e m o s p ro b a r así la h ip ó tesis nula 0 = 0 O c o n tra las a lte rn a tiv a s 0 ¥= 0 O, 0 > 0 O o 0 < 0O al usar, re s p e c tiv a m e n te , las reg io n e s críticas | z | S z a/7, z ^ Za y z = ~ Z a , donde x — ndo V n 0 o{ \\ ~ 0 O) o (x± i) “ nd° Vn00{l - 0O) si usam os la corrección p o r continuidad introducida en el ejem plo 6.5. U sam os el sig no m enos cuando x excede a n 0 o y el signo de m ás cuando x es m enor que n 0 o.
432 Capítulo 13: Prueba d e hipótesis: aplicaciones EJEM PLO 13.9 U na com pañía petrolera afirm a que m enos del 20 p o r ciento de los propietarios de au tos n o han p ro b ad o su gasolina. P ru eb e esta afirm ación e n el nivel 0.01 de significan cia si una com probación aleatoria revela que 2 2 de 2 0 0 propietarios de autos no han probado la gasolina de la com pañía. Solución 1. H 0: 0 = 0.20 / / , : 0 < 0.20 a = 0.01 2. R e c h a ce la h ipótesis n u la d e z á —2.33, d o n d e (sin la co rrecció n p o r c o n tinuidad) x - nOo Vn0o(i - e0) 3. A l su stitu ir x = 22, n = 200 y 0O = 0-20- o b te n e m o s M• - S k ■ 4. P u e sto q u e z = —3.18 es m enos q u e —2.33, se d e b e re c h a z a r la hipótesis nula; concluim os que. com o se afirm a, m enos del 2 0 % de todos los propie tarios de autos no han probado la gasolina de la com pañía. ▲ A dvierta q u e si hubiésem os u sado la corrección p o r co n tin u id ad en el ejem plo a n te rio r, h a b ría m o s o b te n id o z = —3.09 y la conclusión h a b ría sido la m ism a. 13.6 PR UEB AS CO N C ER N IEN TES A D IFER EN CIAS EN TR E k PR O PO R CIO N ES En m uchos problem as de investigación aplicada, debem os decidir si las diferencias ob servadas entre proporciones m uéstrales, o los porcentajes, son significativos o si se pue den atribuir a la suerte. P or ejem plo, si el 6 p o r ciento de los pollos congelados en la m uestra de un proveedor falla en cumplir ciertos estándares y sólo 4 por ciento en la mues tra de o tro p ro v eed o r falla en cum plir los estándares, quizá deseam os investigar si la d i ferencia entre estos dos porcentajes es significativa. D e la m ism a m anera, tal vez deseam os juzgar sobre la base de datos m uéstrales si proporciones iguales de votantes en cuatro ciudades diferentes favorecen a cierto candidato a gobernador. Para indicar un m étodo general de m anejar los problem as de esta clase, suponga q u e x ,, x 2, . . . , x k son los v alores o b serv ad o s d e k variab les a le a to ria s in d ep e n d ien te s A',. X 2 , . . . , X k q u e tienen distribuciones binom iales con los p arám etro s n x y 0 ,, n 2 y 02 n k y 0*. Si las n son suficientem ente grandes, p o dem os aproxim ar las d istrib u ciones de las variables aleatorias independientes:
Sección 13.6: Pruebas concernientes a diferencias entre k proporciones 433 x, - n,0, para í = 1 ,2 ,..., k Zi = V n A ( 1 - 0 ,) co n d istrib u cio n es n o rm a les e stá n d a r, y, d e a c u erd o al te o re m a 8 .8 , p o d e m o s e n to n c e s considerar 2 = y (*< ~ n¡0 , ) 2 x ¿ í u ,e(( i - e.) com o un valor de una variable aleatoria que tiene la distribución ji cuadrada con k gra dos d e libertad. P a ra p ro b ar la hipótesis nula, 0X= 02 = \" • = 0k = 0O(co n tra la a lte r n ativ a q u e al m en o s u n a de las 0 n o es igual a 0 n), p o d em o s u sa r así la región crítica X1 ^ xl.k, do n d e * (x, - n,0 o) 2 x = i2=ji n , 6 o( 1 6 0) C u an d o n o se especifica 0Oesto es, cu an d o sólo nos in teresa la hipótesis nula 0, = 0 2 = ■■• = 0 k , su stitu im o s p o r 0 la estim ació n p o n d e ra d a 0= y la región crítica se vuelve \\ 2 — x í , k - 1* donde 2= y n ,0 {1 - 0 ) La pérdida de 1 grado de libertad, esto es, el cam bio de la región crítica de xi.k a x i se debe al hecho que se sustituye una estim ación por el parám etro desconoci do 0; en una referencia de la página 448 se hace un exam en form al de esto. Presentem os ahora una fórm ula alternativa para la estadística ji cuadrada inm e diata an terior, la cual, com o verem os en la sección 13.7, se presta m ás rápidam ente a otras aplicaciones. Si arreglam os los datos com o en la tabla siguiente Muestra 1 Éxitos Fracasos Muestra 2 *i n, - x, «2 “ -*2 Muestra k *2 - xk Xk
Sección 13.6: Pruebas concernientes a diferencias entre k proporciones 435 las frecuencias de celda esperadas son e u = 4 0 0 (0 .5 3 ) = 212 y e l2 = 4 0 0 (0 .4 7 ) = 188 e2\\ = 5 0 0 (0 .5 3 ) = 265 y e22 = 5 0 0 (0 .4 7 ) = 235 e 3I = 4 0 0 (0 .5 3 ) = 212 y e J2 = 4 0 0 (0 .4 7 ) = 188 y la sustitución en la fórm ula para dada arriba nos da 2 = (232 - 212)2 (260 - 265)2 (197 - 212)2 X 212 265 212 (168 ~ 188)2 (240 ~ 235)2 + (203 - 188)2 + = 6.48 4. Puesto que \\ 2 = 6-48 excede a 5.991, se debe rechazar la hipótesis nula; en o tras palabras, las proporciones verdaderas de com pradores que favorecen el detergente A sobre el detergente B en las tres ciudades no son las mismas. ▲ EJERCICIOS 13.45 M uestre q u e las dos fórm ulas para g 2 en la página 434 son equivalentes. 13.46 M odifique las regiones críticas en la página 430 de m anera que se puedan usar p a ra p ro b a r la hipótesis nula A = A0 co n tra la hipótesis alternativa A > A0, A < A« y A A„ sobre la base de n observaciones. E n este caso A es el p a rá m e tro de la distribución de Poisson. (Sugerencia: use el resultado del ejem plo 7.15.) 13.47 C on resp e c to al ejercicio 13.46, use la tabla II p a ra e n c o n tra r los v alo res q u e c o rre sp o n d e n a &0.025 y ^ó.025 Pa ra p ro b a r Ia h ip ó tesis nula A = 3.6 c o n tra la hi pótesis alternativa A # 3.6 sobre la base de cinco observaciones. U se el nivel 0.05 de significancia. 13.48 P arar k = 2, dem uestre que la fórm ula de x 2 en la página 434 se puede escribir como ( « , + n2){n 2x t - / j , x 2) 2 M |fi2( x , + x 2) [ ( « i + n2) - ( x , + x 2) ] 13.49 D adas m uestras aleatorias grandes de dos poblaciones binomiales, m uestre que la hipótesis nula 0, = 0 2 se puede probar con base en la estadística ÍL _ fi! n¡ n2 z= * X. + X-> d o n d e 0 = ----- . (Sugerencia: refiérase al ejercicio 8.5.) n, + n: 13.50 M uestre q u e el cu ad rad o de la expresión p ara z es igual a ,y ~ n¿ ? n,§{ 1 - 0 )
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372
- 373
- 374
- 375
- 376
- 377
- 378
- 379
- 380
- 381
- 382
- 383
- 384
- 385
- 386
- 387
- 388
- 389
- 390
- 391
- 392
- 393
- 394
- 395
- 396
- 397
- 398
- 399
- 400
- 401
- 402
- 403
- 404
- 405
- 406
- 407
- 408
- 409
- 410
- 411
- 412
- 413
- 414
- 415
- 416
- 417
- 418
- 419
- 420
- 421
- 422
- 423
- 424
- 425
- 426
- 427
- 428
- 429
- 430
- 431
- 432
- 433
- 434
- 435
- 436
- 437
- 438
- 439
- 440
- 441
- 442
- 443
- 444
- 445
- 446
- 447
- 448
- 449
- 450
- 451
- 452
- 453
- 454
- 455
- 456
- 457
- 458
- 459
- 460
- 461
- 462
- 463
- 464
- 465
- 466
- 467
- 468
- 469
- 470
- 471
- 472
- 473
- 474
- 475
- 476
- 477
- 478
- 479
- 480
- 481
- 482
- 483
- 484
- 485
- 486
- 487
- 488
- 489
- 490
- 491
- 492
- 493
- 494
- 495
- 496
- 497
- 498
- 499
- 500
- 501
- 502
- 1 - 50
- 51 - 100
- 101 - 150
- 151 - 200
- 201 - 250
- 251 - 300
- 301 - 350
- 351 - 400
- 401 - 450
- 451 - 500
- 501 - 502
Pages: