Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Estadistica para ingenieros

Estadistica para ingenieros

Published by Ciencia Solar - Literatura científica, 2015-12-31 22:51:07

Description: Estadistica para ingenieros

Keywords: Ciencia, science, chemical, quimica, Astronomia, exaperimentacion científica, libros de ciencia, literatura, matematica, matematicas, Biología, lógica, robótica, computacion, Análisis, Sistemas, Paradojas, Algebra, Aritmetica, Cartografia, sociedad,cubo de Rubik, Diccionario astronomico, Dinamica del metodo Newton, ecuaciones diferenciales, Maxwell, Física cuantica, El universo, estadistica, Estadistica aplicada

Search

Read the Text Version

Apuntes de Estadística para Ingenierosin est— expresiónD χ2α;N ™orresponde ™on —quel v—lor t—l que Fχ2 χ2α;N = αD donde χ2 sigue un— distri˜u™iónχ cuadrado con N grados de libertad.NotaF …n interv—lo de ™on(—nz— p—r— l— desvi—™ión típi™— puede o˜tenerse trivi—lmente ™omo l— r—iz ™u—dr—d— del interv—lo de ™on(—nz— p—r— l— v—ri—nz—F Ejemplo. in el ejemplo donde ™onsider—mos IHHH v—lores simul—dos de un— N (0, 1) tení—mos que x¯ = −0.0133 y s999 = 0.9813F €or t—ntoD teniendo en ™uent— que N (Xi − x¯)2 = 999 × s2999, i=1 el interv—lo de ™on(—nz— p—r— l— v—ri—nz— —l WS 7 que propor™ion— el teorem— es 961.9867 961.9867 1.0885 × 103 , 913.3010 = (0.8838, 1.0533) . y˜sérvese que σ = 1 pertene™e —l interv—lo de ™on(—nz— —l WS 7F€uede que —lguno de vosotros esté pens—ndo ™uál puede ser el interés de l—s estim—™iones puntu—les yD so˜retodoD medi—nte interv—los de ™on(—nz— de l— v—ri—nz—F €ro˜—˜lemente todos tenemos muy ™l—ro qué es un—medi—D in™luso un— propor™iónD pero quizá se nos es™—pe l— import—n™i— prá™ti™— del ™on™epto de v—ri—nz—Fin este sentidoD h—y que de™ir que en el ám˜ito de l— sngenierí— l— v—ri—nz— se utiliz— mu™hísimo en lo quese ™ono™e ™omo control de calidadF vos j—poneses sonD en estoD los pioneros y quizá los mejores expertosF eellos se les —tri˜uye un prin™ipio ˜ási™o del ™ontrol de ™—lid—d en ™u—lquier pro™eso ˜ási™o de produ™™iónX lareducción de la varianza es la clave del éxito en la producciónF€ensemos en ™u—lquier pro™eso de f—˜ri™—™ión genéri™oF in él se tr—t—rá de o˜tener un produ™to sujeto — un—sespe™i(™—™iones ™on™ret—sF ƒin em˜—rgoD el error inherente — ™u—lquier pro™eso experiment—l provo™—ráX IF …n —umento o un— disminu™ión estru™tur—les del produ™to ™on respe™to — un v—lor o˜jetivoF isto podrí— dete™t—rse ™omo un sesgo en l— medi— de lo produ™ido ™on respe™to —l v—lor o˜jetivoF PF …n—s diferen™i—s más o menos import—ntes en los produ™tos result—ntesD que podrí—n ser ev—lu—d—s medi—nte l— v—ri—nz—Fhe es—s dos posi˜les pro˜lemáti™—sD l— más ™omplej—D sin dud— es l— segund—F €ro˜—˜lemente no es un gr—vepro˜lem— calibrar l— máquin— que produ™e p—r— que l— medi— se sitúe en el v—lor o˜jetivoD pero será sin dud—más ™omplejo modi(™—rl— p—r— que produz™— de form— más homogéne—D redu™iendo —sí l— v—ri—nz—F7.3.4. Otros intervalos de conanzaƒe pueden est—˜le™er interv—los de ™on(—nz— p—r— l— diferen™i— entre l—s medi—s de dos v—ri—˜les —le—tori—sDp—r— l— diferen™i— entre propor™iones o p—r— el ™o™iente de v—ri—nz—sD entre otros p—rámetros de interésFesimismoD se pueden o˜tener interv—los de ™on(—nz— unilaterales p—r— ™u—lquier— de los p—rámetros que hemosmen™ion—doD es de™irD interv—los —™ot—dos sólo — un l—doD frente — los interv—los bilaterales que hemos visto—quíFProf. Dr. Antonio José Sáez Castillo 147

Dpto de Estadística e I.O. Universidad de Jaénxo o˜st—nteD no v—mos — det—ll—rlos —quíD —unque su interpret—™ión es —nálog— — l— de los interv—los de ™on(—nz—que hemos vistoF gu—lquier p—quete de softw—re est—dísti™o puede f—™ilit—r estos interv—los sin di(™ult—dF7.4. Resolución del ejemplo de los niveles de plomo‚e™ordemos que —l prin™ipio del ™urso pl—nteᘗmos un pro˜lem— que —p—re™e en un —rtí™ulo pu˜li™—do enJournal of Environmental Engineering en PHHPD titul—do ve—™h—te from v—nd hisposed ‚esidenti—l gonsEtru™tion ‡—steD en el que se present— un estudio de l— ™ont—min—™ión en ˜—sureros que ™ontienen dese™hos de™onstru™™ión y desperdi™ios de demoli™ionesF he™í—mos —llí que De un sitio de prueba se tomaron 42 muestrasde lixiado, de las cuales 26 contienen niveles detectables de plomo. Una ingeniera desea obtener a partir deesos datos una estimación de la probabilidad de que una muestra de un basurero contenga niveles detectablesde plomo. No obstante, es consciente de que esa estimación estará basada en esa muestra, que es de sólo 42datos, luego querrá también obtener una estimación del error que está cometiendo al hacer la estimación.Finalmente, se plantea si con la estimación y el error de ésta, podrá obtener un rango donde la verdade-ra probabilidad se encuentre con un alto nivel de conanza. ehor— est—mos en ™ondi™iones de resolver estepro˜lem—Fin primer lug—rD tenemos que o˜tener un— estim—™ión de l— propor™ión de muestr—s @o pro˜—˜ilid—dA que™ontienen niveles dete™t—˜les de plomoF remos visto que un estim—dor insesg—do de mínim— v—ri—nz—D que—demás ™oin™ide ™on el estim—dor de máxim— verosimilitudD de l— propor™ión es l— propor™ión muestr—lF innuestro ™—soD por t—ntoD podemos estim—r l— propor™ión en pˆ = 26 = 0.6190.F edemásD podemos estim—r el 42error estánd—r de est— estim—™ión en s.e.(pˆ) = 0.6190(1−0.6190) = 0.0749 yD en ™u—lquier ™—soD de™ir que este 42error est—nd—r será inferior — √1 = 0.0771F in resumenD tenemos un— estim—™ión del TIFWH 7 ™on un error 2 42est—nd—r inferior — un UFUI 7F€or últimoD en fun™ión de est— estim—™ión y de su error est—nd—rD puede —(rm—r ™on un WS 7 de ™on(—nz—que el interv—lo 0.6190 ∓ 1.96 × 0.0749 = (0.4722, 0.7658)™ontendrá — l— verd—der— propor™ión de muestr—s ™on niveles dete™t—˜les de plomoF ist— últim— —(rm—™iónpone de m—ni(esto que d—r un interv—lo de ™on(—nz— ™on un nivel de signi(™—™ión —™ept—˜lemente ˜—jo @S 7A™ondu™e — un interv—lo muy —mplioD lo que equiv—le — de™ir que —ún h—y ˜—st—nte in™ertidum˜re ™on respe™to— l— propor™ión que est—mos estim—ndoF €or elloD de˜erí—mos re™omend—rle — l— ingenier— que —umente elt—m—ño de l— muestr—F148 Prof. Dr. Antonio José Sáez Castillo

Capítulo 8Contrastes de hipótesis paramétricas v— gr—n tr—gedi— de l— ™ien™i—X l— destru™™ión de un— ˜ell— hipótesis por un —ntiestéti™o ™onjunto de d—tosF „hom—s rF ruxleyF v— ist—dísti™— puede pro˜—r todoD in™luso l— verd—dF xF woynih—nResumen. in este ™—pítulo expli™—mos qué se entiende por ™ontr—ste de hipótesis est—dísti™— y —prendemos— re—liz—r ™ontr—stes de este tipo — p—rtir de d—tosD referidos — —lgún p—rámetro po˜l—™ion—l des™ono™idoFPalabras clave: ™ontr—ste de hipótesisD error tipo sD error tipo ssD est—dísti™o de ™ontr—steD pEv—lorD nivel designi(™—™iónD nivel de ™on(—nz—F8.1. Introduccióngomo —puntᘗmos en l— introdu™™ión del ™—pítulo —nteriorD l—s ll—m—d—s pruebas o contrastes de hipó-tesis se utiliz—n p—r— inferir de™isiones que se re(eren — un p—rámetro po˜l—™ion—l ˜—sándose en muestr—s del— v—ri—˜leF †—mos — ™omenz—r — expli™—r el fun™ion—miento de un ™ontr—ste de hipótesis ™on un ejemploF Ejemplo. vos ™ientí(™os re™omiend—n que p—r— prever el ™—lent—miento glo˜—lD l— ™on™entr—™ión de g—ses de efe™to invern—dero no de˜e ex™eder l—s QSH p—rtes por millónF …n— org—niz—™ión de prote™™ión del medio —m˜iente quiere determin—r si el nivel medioD µD de g—ses de efe™to invern—dero en un— región ™umple ™on l—s p—ut—s requerid—sD que est—˜le™en un límite máximo de QSH p—rtes por millónF €—r— ello tom—rá un— muestr— de medi™iones di—ri—s de —ire p—r— de™idir si se super— el límiteD es de™irD si µ > 350 o noF €or t—ntoD l— org—niz—™ión dese— en™ontr—r —poyo p—r— l— hipótesis µ > 350D ll—m—d— hipótesis alternativaD o˜teniendo prue˜—s en l— muestr— que indiquen que l— hipótesis ™ontr—ri—D µ = 350 @o µ ≤ 350AD ll—m—d— hipótesis nulaD es f—ls—F hi™ho de otr— form—D l— org—niz—™ión v— — someter — jui™io — l— hipótesis nul— µ ≤ 350F €—rtirá de su inocenciaD suponiendo que es ™iert—D es de™irD suponiendo queD en prin™ipioD no se super—n los límites de IRW

Dpto de Estadística e I.O. Universidad de Jaénpresen™i— de g—ses de efe™to invern—deroD y sólo l— re™h—z—rá en f—vor de H1 si h—y prue˜—s evidentes enlos d—tos de l— muestr— p—r— elloFv— de™isión de re™h—z—r o no l— hipótesis nul— en f—vor de l— —ltern—tiv— de˜erá ˜—s—rse en l— inform—™iónque d— l— muestr—D — tr—vés de —lgun— medid— —so™i—d— — ell—D que se denomin— estadístico de contrasteF€or ejemploD si se tom—n QH le™tur—s de —ire y l— medi— muestr—l es mu™ho m—yor que QSHD lo lógi™o seráre™h—z—r l— hipótesis nul— en f—vor de µ > 350D pero si l— medi— muestr—l es sólo liger—mente m—yor queQSH o menor que QSHD no h—˜rá prue˜—s su(™ientes p—r— re™h—z—r µ ≤ 350 en f—vor de µ > 350Fv— ™uestión ™l—ve es en qué momento se de™ide re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv—F innuestro ejemploD en qué momento podemos de™ir que l— medi— muestr—l es su(™ientemente m—yor queQSHF il ™onjunto de estos v—lores del est—dísti™o de ™ontr—steD que permiten re™h—z—r µ = 350 en f—vor deµ > 350 se ™ono™e ™omo región de rechazoFe l— luz de este ejemploD v—mos — tr—t—r de de(nir de form— gener—l los ™on™eptos que —™—˜—mos de introdu™irF…n contraste de hipótesis es un— prue˜— que se ˜—s— en los d—tos de un— muestr— de un— v—ri—˜le —le—tori—medi—nte l— ™uál podemos re™h—z—r un— hipótesis so˜re un p—rámetro de l— po˜l—™iónD ll—m—d— hipótesisnula (H0)D en f—vor de un— hipótesis ™ontr—ri—D ll—m—d— hipótesis alternativa (H1)Fv— prue˜— se ˜—s— en un— tr—nsform—™ión de los d—tos de l— muestr—D lo que se denomin— estadístico decontrasteFƒe re™h—z—rá l— hipótesis nul— en f—vor de l— —ltern—tiv— ™u—ndo el v—lor del est—dísti™o de ™ontr—ste se sitúeen un— determin—d— regiónD ll—m—d— región de rechazoFv— hipótesis H0 se suele expres—r ™omo un— igu—ld—daD del tipo H0 : θ = θ0D donde θ es un p—rámetro de un—po˜l—™ión y θ0 es un v—lor hipotéti™o p—r— ese p—rámetroF €or su p—rteD H1 puede tener tener dos form—sXH1 : θ > θ0, en ™uyo ™—so se h—˜l— de contraste unilateral a la derecha o de una cola a la derecha o deun extremo a la derecha, o H1 : θ < θ0, en ™uyo ™—so se h—˜l— de contraste unilateral a la izquierdao de una cola a la izquierda o de un extremo a la izquierda.H1 : θ = θ0, en ™uyo ™—so se h—˜l— de contraste bilateral o de dos colas o de dos extremos. aDe todas formas, también es frecuente expresar H0 como negación exacta de H1, en cuyo caso sí puede ser una desigualdadno estricta. Matemáticamente no hay diferencias en estas dos posibilidades.…no de los —spe™tos más import—ntes y que se suele prest—r — m—yor ™onfusión se re(ere — qué hipótesis™onsider—r ™omo H0 y ™uál ™omo H1F …n— regl— prá™ti™— p—r— h—™erlo ™orre™t—mente puede ser l— siguienteX IF ƒi est—mos intent—ndo pro˜—r un— hipótesisD ést— de˜e ™onsider—rse ™omo l— hipótesis —ltern—tiv—F PF €or el ™ontr—rioD si dese—mos des—™redit—r un— hipótesisD de˜emos in™luir ést— ™omo hipótesis nul—F Ejemplo. €—r— un— determin—d— edi(™—™ión se exige que los tu˜os de —gu— teng—n un— resisten™i— medi— — l— ruptur—D µD por en™im— de QH kg por ™entímetroF150 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros gomo primer— situ—™iónD supong—mos que un proveedor quiere f—™ilit—r un nuevo tipo de tu˜o p—r— ser utiliz—do en est— edi(™—™iónF vo que de˜erá h—™er es poner — tr—˜—j—r — sus ingenierosD que de˜en re—liz—r un— prue˜— p—r— de™idir si esos tu˜os ™umplen ™on l—s espe™i(™—™iones requerid—sF in ese ™—soD de˜en proponer un ™ontr—ste que in™luy— ™omo hipótesis nul— H0 : µ ≤ 30 frente — l— —ltern—tiv— H1 : µ > 30F ƒi —l re—liz—r el ™ontr—ste de hipótesis se re™h—z— H0 en f—vor de H1D el tu˜o podrá ser utiliz—doD pero si no se puede re™h—z—r H0 en f—vor de H1D no se tienen su(™ientes g—r—ntí—s so˜re l— ™—lid—d del tu˜o y no será utiliz—doF gomo segund— situ—™iónD un proveedor llev— suministr—ndo su tipo de tu˜o desde h—™e —ñosD sin que se h—y—n dete™t—doD en prin™ipioD pro˜lem—s ™on ellosF ƒin em˜—rgoD un ingeniero que tr—˜—j— p—r— el go˜ierno ™ontrol—ndo l— ™—lid—d en l—s edi(™—™iones viene teniendo sospe™h—s de que ese tipo de tu˜o no ™umple ™on l—s exigen™i—s requerid—sF in ese ™—soD si quiere pro˜—r su hipótesisD el ingeniero de˜erá ™onsider—r un ™ontr—ste de l— hipótesis nul— H0 : µ ≥ 30 frente — H1 : µ < 30F hi™ho de otr— form—D sólo podrá ™ontr—st—r su hipótesis si en™uentr— d—tos empíri™os que permit—n re™h—z—r es— hipótesis nul— en f—vor de su —ltern—tiv—D que demuestren ™on un —lto nivel de (—˜ilid—d que el proveedor que est—˜— siendo —™ept—do —hor— no ™umple ™on los requisitosFhe he™hoD es import—ntísimo que desde el prin™ipio teng—mos ™l—ro qué tipo de de™isiones puede propor™ioEn—rnos un ™ontr—ste de hipótesisF eunque y— l—s hemos ™oment—doD v—mos — insistir en ell—sF ƒon l—s dossiguientesX IF ƒi el v—lor del est—dísti™o de ™ontr—ste p—r— los d—tos de l— muestr— ™—e en l— región de re™h—zoD podremos —(rm—r con un determinado nivel de conanza que los d—tos de l— muestr— permiten re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv—F PF ƒi el v—lor del est—dísti™o de ™ontr—ste p—r— los d—tos de l— muestr— no ™—e en l— región de re™h—zoD no podremos —(rm—r con el nivel de conanza exigido que los d—tos de l— muestr— permiten re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv—Fv— ™l—ve r—di™— en que entend—mos desde el prin™ipio que l— hipótesis nul— ™—re™e de ™on(—nz—F is —sumid—sólo ™omo punto de p—rtid—D pero será —˜—ndon—d— ™u—ndo los d—tos empíri™os muestren eviden™i—s ™l—r—sen su ™ontr— y — f—vor de l— —ltern—tiv—F v— ™—rg— de l— prue˜— de hipótesis r—di™— siempre en l— hipótesis—ltern—tiv—D que es l— úni™— hipótesis en l— que podremos g—r—ntiz—r un determin—do nivel de ™on(—nz—F8.2. Errores en un contraste de hipótesisil ™ontr—ste de un— hipótesis est—dísti™— impli™—D por t—ntoD un— tom— de de™isiónD — f—vor de H0 o en ™ontr—de H0 y en f—vor de H1F isto impli™— que podemos equivo™—rnos —l tom—r l— de™isión de dos form—sFƒe ll—m— error tipo I o falso negativo — re™h—z—r l— hipótesis nul— ™u—ndo es ™iert—D y su pro˜—˜ilid—d senot— por αD ll—m—do nivel de signicaciónFƒe ll—m— nivel de conanza — l— pro˜—˜ilid—d de —™ept—r l— hipótesis nul— ™u—ndo es ™iert—D es de™irD 1 − α.Prof. Dr. Antonio José Sáez Castillo 151

Dpto de Estadística e I.O. Universidad de Jaén Estado real H0 H1 Decisión en H0 he™isión ™orre™t— irror tipo ss el contraste H1 irror tipo s he™isión ™orre™t— gu—dro VFIX isquem—tiz—™ión de los errorres tipo s y tipo ssFƒe ll—m— error tipo II o falso positivo — —™ept—r l— hipótesis nul— ™u—ndo es f—ls—D y su pro˜—˜ilid—d senot— por β.ƒe ll—m— potencia — l— pro˜—˜ilid—d de re™h—z—r l— hipótesis nul— ™u—ndo es f—ls—D es de™irD 1 − β.¾guál de los dos errores es más gr—vec €ro˜—˜lemente eso depende de ™—d— ™ontr—steD pero en gener—lD lo quese pretende es —™ot—r el error tipo s y tr—t—r de minimiz—r el error tipo ssD es de™irD tr—t—r de elegir ™ontr—steslo más potentes posi˜les g—r—ntiz—ndo que l— pro˜—˜ilid—d del error tipo s es inferior — un determin—do nivelFEjemplo. …n f—˜ri™—nte de mini™omput—dor—s ™ree que puede vender ™ierto p—quete de softw—re — másdel PH 7 de quienes ™ompr—n sus ™omput—dor—sF ƒe sele™™ion—ron —l —z—r IH posi˜les ™ompr—dores de l—™omput—dor— y se les preguntó si est—˜—n interes—dos en el p—quete de softw—reF he est—s person—sD Rindi™—ron que pens—˜—n ™ompr—r el p—queteF ¾€ropor™ion— est— muestr— su(™ientes prue˜—s de que másdel PH 7 de los ™ompr—dores de l— ™omput—dor— —dquirirán el p—quete de softw—recƒi p es l— verd—der— propor™ión de ™ompr—dores que —dquirirán el p—quete de softw—reD d—do que dese—mosdemostr—r p > 0.2D tenemos que H0 : p = 0.2 y H1 : p > 0.2Fƒe— X : número de posi˜les ™ompr—dores de l— muestr—D en ™uyo ™—soD X → B (10, p)F …tiliz—remos elv—lor de X ™omo est—dísti™o del ™ontr—steD re™h—z—ndo H0 si X es gr—ndeFƒupong—mos que est—˜le™emos ™omo región de re™h—zo x ≥ 4F in ese ™—soD d—do que en l— muestr— x = 4Dre™h—z—rí—mos H0 en f—vor de H1D lleg—ndo — l— ™on™lusión de que el f—˜ri™—nte tiene r—zónF€eroD ¾™uál es el nivel de ™on(—nz— de este ™ontr—stec g—l™ulemos l— pro˜—˜ilid—d de error tipo sF €—r—elloD en el gu—dro VFP —p—re™e l— distri˜u™ión de pro˜—˜ilid—d del est—dísti™o de ™ontr—ste que hemoselegidoD suponiendo que H0 es ™iert—D y— que de˜emos ™—l™ul—r α = P [‚e™h—z—r H0|H0 es cierta] = P [X ≥ 4|p=0.2] = 0.08808 + 2.6424 × 10−2 + 5.505 × 10−3 + 7.8643 × 10−4 + 7.3728 × 10−5 + 4.096 × 10−6 + 1.024 × 10−7 = 0.12087,luego el nivel de ™on(—nz— del ™ontr—ste es del (1 − 0.12087) × 100 % = 87.913 %F v— ™on™lusión serí— quea la luz de los datos podemos armar con un 87.913 % de conanza que p > 0.2F¾‰ si queremos un nivel de ™on(—nz— m—yorD es de™irD un— pro˜—˜ilid—d de error tipo s menorc he˜emosredu™ir l— región de re™h—zoF ƒi ponemos ™omo región de re™h—zo x ≥ 5D y— no podremos re™h—z—r H0 en152 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosx P [X = x]H 10 0.200.810 = 0.10737 0 10 0.210.89I 1 = 0.26844 ‚egión deP 10 0.220.88 = 0.30199 —™ept—™ión 2 10 0.230.87Q 3 = 0.20133R 10 0.240.86 = 0.08808 4 10 0.250.85 2.6424 × 10−2S 5 =T 10 0.260.84 = 5.505 × 10−3 ‚egiónU 106 0.270.83 = 7.8643 × 10−4 deV 170 0.280.82 = 7.3728 × 10−5 8 re™h—zoW 10 0.290.81 = 4.096 × 10−6 9 10 0.2100.80 1.024 × 10−7IH 10 =gu—dro VFPX pun™ión m—s— del est—dísti™o de ™ontr—ste suponiendo ™iert— H0D es de™irD suponiendo que p = 0.2Ff—vor de H1, y— que x = 4F edemásD —hor— α = 2.6424 × 10−2 + 5.505 × 10−3 + 7.864 3 × 10−4 + 7.3728 × 10−5 + 4.096 × 10−6 + 1.024 × 10−7 = 3.2793 × 10−2,luego el nivel de ™on(—nz— serí— 1 − 3.2793 × 10−2 × 100 % = 96.721 %D y l— ™on™lusión serí— que a laluz de los datos no podemos armar que p > 0.2 con un 96.721 % de conanza.il estudio de β es —lgo más ™ompli™—do y no lo —˜ord—remosF8.3. p-valor de un contraste de hipótesisristóri™—menteD l— form— más ™omún de —™tu—r en un ™ontr—ste de hipótesis p—s— por elegir un nivel designi(™—™ión @˜—joAD que determin— un límite p—r— el error tipo s que est—mos dispuestos — —sumirF ise nivelde signi(™—™ión determin— tod— l— región de re™h—zo yD ex—min—ndo si el v—lor del est—dísti™o ™—e en ell—Dpodemos ™on™luir si re™h—z—mos o no l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on el nivel de ™on(—nz—requeridoFixisteD sin em˜—rgoD otr— form— de —™tu—r que h— tenido un —uge enorme desde que l—s ™omput—dor—s se h—n™onvertido en un— herr—mient— —l —l™—n™e de ™u—lquier—F f—jo est— form— de —™tu—rD ™—l™ul—remos el v—lor delest—dísti™o de ™ontr—ste y v—lor—remos ™ómo es de extremo este v—lor ˜—jo l— distri˜u™ión en el muestreo del— hipótesis nul—F ƒi es más extremo que el nivel de signi(™—™ión dese—doD se re™h—z—rá l— hipótesis nul— enf—vor de l— —ltern—tiv—F ist— medid— de ™uán extremo es el v—lor del est—dísti™o se ll—m— p-valorF8.3.1. Denición de p-valorhe form— gener—lD supong—mos que queremos ™ontr—st—r un— hipótesis est—dísti™— simple del tipo H0 : θ = θ0Dfrente — —lgun— de l—s —ltern—tiv—s siguientesX H1 : θ = θ0, H1 : θ > θ0 o H1 : θ < θ0F ƒupong—mos —demásProf. Dr. Antonio José Sáez Castillo 153

Dpto de Estadística e I.O. Universidad de Jaénque el ™ontr—ste se re—liz— medi—nte un est—dísti™o que not—remos SD y que el v—lor del est—dísti™o p—r— l—muestr— es sFil p-valor —so™i—do —l ™ontr—ste se de(ne ™omo el mínimo nivel de signi(™—™ión ™on el que l— hipótesis nul—serí— re™h—z—d— en f—vor de l— —ltern—tiv—F Ejemplo. in el ijemplo VFP hemos visto ™ómo podemos re™h—z—r l— hipótesis nul— ™on un 87.913 % de ™on(—nz—D pero no ™on un 96.721 %F hi™ho de otr— form—D podemos re™h—z—r l— hipótesis nul— ™on un nivel de signi(™—™ión del 12.087 %D pero no ™on un nivel de signi(™—™ión del 3.279 %F isto impli™— que el pEv—lor est—rá justo entre estos dos últimos v—loresFh—do que norm—lmente se elige ™omo nivel de signi(™—™ión máximo α = 0.05D se tiene que l— regl— de de™isiónen un ™ontr—ste ™on ese nivel de signi(™—™iónD d—do el pEv—lorD serí— l— siguienteXƒi p < 0.05D re™h—z—mos H0 en f—vor de H1 ™on más de un WS 7 de ™on(—nz—Fƒi p ≥ 0.05D no podemos re™h—z—r H0 en f—vor de H1 ™on —l menos un WS 7 de ™on(—nz—Fƒin em˜—rgoD est— regl— de de™isiónD que es l— más h—˜itu—lD es dem—si—do redu™™ionist— si no se propor™ion—el v—lor ex—™to del pEv—lorF v— r—zón es que no es lo mismo re™h—z—r un— hipótesis ™on al menos un WS 7 de™on(—nz— si el pEv—lor es HFHRW que si es HFHHIF r—y que propor™ion—r siempre el pEv—lor de un ™ontr—steD y—que eso permite — ™—d— le™tor de™idir por sí mismoFin resumenD el pEv—lor permite utiliz—r ™u—lquier otro nivel de signi(™—™iónD y— que si ™onsider—mos un nivelde signi(™—™ión αXƒi p < αD re™h—z—mos H0 en f—vor de H1 ™on más de un (1 − α) × % de ™on(—nz—Fƒi p ≥ αD no podemos re™h—z—r H0 en f—vor de H1 ™on —l menos un (1 − α) × % de ™on(—nz—Fgomo ™on™lusiónD siempre que h—g—mos un ™ontr—ste de hipótesisD de˜emos f—™ilit—r el pEv—lor —so™i—doFgomo not— (n—l so˜re el ™on™epto de pEv—lorD es import—nte señ—l—r queD —l ™ontr—rio de lo que erróne—mentese piens— en dem—si—d—s o™—sionesD el pEv—lor no es l— pro˜—˜ilid—d de l— hipótesis nul—F wu™h— gente piens—esto porque es ™ierto que ™u—ndo el pEv—lor es pequeño es ™u—ndo se re™h—z— l— hipótesis nul—F ƒin em˜—rgoDp—r— empez—rD no tiene sentido pl—nte—rnos l— probabilidad de l— hipótesis nul—D y— que ést—D o es ™iert—D o esf—ls—X desde un— perspe™tiv— ™lási™— de l— pro˜—˜ilid—dD se h—˜l— de l— pro˜—˜ilid—d de un su™eso porque —ve™es o™urre y — ve™es noD pero en este ™—so no podemos pens—r —síD y— que l— hipótesis nul— o se d— o no sed—F in re—lid—dD el pEv—lor lo que d— es un indi™io de l— ™ertidum˜re que tenemosD de l— ™on(—nz— en que l—hipótesis nul— se— verd—dD teniendo en ™uent— los d—tos de l— muestr—F ist— interpret—™ión tiene más que ver™on l— interpret—™ión su˜jetiv— de l— pro˜—˜ilid—d de l— que h—˜l—mos —l prin™ipio de ™ursoFr—y que de™ir queD en rel—™ión — est— interpret—™ión su˜jetiv— de l— pro˜—˜ilid—dD existe un— visión de l—ist—dísti™—D ll—m—d— ist—dísti™— f—yesi—n—D en l— que el pEv—lor sí puede entenderse ™omo l— pro˜—˜ilid—dde l— hipótesis nul—D pero entendiendo que medimos l— pro˜—˜ilid—d de l— hipótesis nul—D no porque pued—o™urrir o no o™urrir en fun™ión del —z—rD sino porque tenemos in™ertidum˜re so˜re ell—F154 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros0.0 0.1 0.2 0.3 0.4 Región de aceptación 0.0 0.1 0.2 0.3 0.4 Región de aceptación α 1−α 1−α α −3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3pigur— VFIX ‚egiones de re™h—zo en ™ontr—stes unil—ter—les — l— izquierd— y — l— dere™h—F0.0 0.1 0.2 0.3 0.4 α2 Región de aceptación α2 1−α −3 −2 23 −1 0 1pigur— VFPX ‚egión de re™h—zo en un ™ontr—ste ˜il—ter—lF8.3.2. Cálculo del p-valor€—r— ™omprender ™ómo se ™—l™ul— el pEv—lor de un ™ontr—ste es ne™es—rio distinguir entre ™ontr—stes unil—ter—leso de un— ™ol— frente — ™ontr—stes ˜il—ter—les o de dos ™ol—sFgomo y— ™oment—mosD los ™ontr—stes del tipo H0 : θ = θ0D frente — H1 : θ = θ0 son contrastes bilateraleso de dos colasD y— que el re™h—zo de l— hipótesis nul— en f—vor de l— —ltern—tiv— puede produ™irse porque elest—dísti™o de ™ontr—ste tom— v—lores muy —ltos o muy ˜—josF €or ™ontr—D los ™ontr—stes del tipo H0 : θ = θ0Dfrente — H1 : θ > θ0 o H1 : θ < θ0 son contrastes unilaterales o de una colaD y— que el re™h—zo de l—hipótesis nul— en f—vor de l— —ltern—tiv— puede produ™irse sólo si el est—dísti™o de ™ontr—ste tom— v—lores muy—ltos @™u—ndo H1 : θ > θ0, ll—m—do contraste a la derechaA o muy ˜—jos @™u—ndo H1 : θ < θ0D llamadocontraste a la izquierdaAFProf. Dr. Antonio José Sáez Castillo 155

Dpto de Estadística e I.O. Universidad de Jaén€or t—ntoD teniendo en ™uent— l— de(ni™ión de pEv—lorD su ™ál™ulo se re—liz— de l— siguiente form—Xƒi el ™ontr—ste es unil—ter—l — l— izquierd— @H1 : θ < θ0AD p = P [S ≤ s/H0 ] .ƒi el ™ontr—ste es unil—ter—l — l— dere™h— @H1 : θ > θ0AD p = P [S > s/H0 ] .ƒi el ™ontr—ste es ˜il—ter—l @H1 : θ = θ0AD p = 2 × m´ın {P [S ≤ s/H0 ] , P [S > s/H0 ]} .r—y que de™ir que el uso del pEv—lor se h— extendido h—st— ™onvertirse en el método más h—˜itu—l de tom—de l—s de™isiones desde que el uso de los orden—dores y de los softw—re de ™ál™ulo están — disposi™ión de l—m—yorí— de los usu—riosF roy en dí— ™—si n—die h—™e ist—dísti™— a manoD y prá™ti™—mente todos los progr—m—sest—dísti™os propor™ion—n el pEv—lor ™omo d—to p—r— l— tom— de l—s de™isionesFin lo que rest— del tem— lo que v—mos — h—™er es enun™i—r distintos ™ontr—stes de hipótesis p—r— l— medi—D l—v—ri—nz— o l— propor™ión de un— po˜l—™ión y p—r— ™omp—r—r l—s medi—sD l—s v—ri—nz—s y l—s propor™iones endos po˜l—™iones distint—sF xo nos v—mos — ™entr—r en los det—lles de ™ómo se dedu™en sino sólo en ™ómo seutiliz—n en l— prá™ti™—Fhe tod—s form—sD es import—nte h—™er un— —™l—r—™iónX ™u—ndo los d—tos pro™eden de un— distri˜u™ión norm—lDes muy sen™illo o˜tener l— distri˜u™ión del est—dísti™o del ™ontr—steD gr—™i—s — los result—dos que vimos enel ™—pítulo de distri˜u™iones en el muestreoF ƒin em˜—rgoD si los d—tos no pro™eden de v—ri—˜les norm—lesDest— ™uestión es mu™hísimo más difí™ilF efortun—d—menteD si el t—m—ño de l— muestr— es gr—ndeD el „eorem—gentr—l del vímite g—r—ntiz— que los p—rámetros que se ˜—s—n en sum—s ˜—s—d—s en l—s muestr—s siguen—proxim—d—mente un— distri˜u™ión norm—lF is por ello que en ™—d— tipo de ™ontr—ste que v—mos — des™ri˜ir— ™ontinu—™ión se distinguen —quellos que se ˜—s—n en muestr—s gr—ndes y los que se ˜—s—n en muestr—sredu™id—sD que sólo podrán ser utiliz—dos si l— v—ri—˜le es norm—lFin ™—d— ™—soD v—mos — —™omp—ñ—r el ™ontr—ste ™on un ejemplo que ™oment—remos extens—menteF8.4. Contraste para la media de una población†—mos — suponer que tenemos un— muestr— x1, ..., xn de un— v—ri—˜le —le—tori— ™on medi— po˜l—™ion—l µFxot—remos x¯ — l— medi— muestr—l y s2n−1 — l— v—ri—nz— muestr—lF8.4.1. Con muestras grandes (n ≥ 30)il gu—dro VFQ in™luye un resumen del pro™edimiento p—r— el ™ontr—steF in élD zp es el v—lor de un— N (0, 1)t—l que P [Z < zp] = pFe modo de ejemploD podemos pens—r en que los —rqueólogos utiliz—n el he™ho ™ono™ido de que los húmerosde los —nim—les de l— mism— espe™ie tienden — tener —proxim—d—mente l—s mism—s r—zones longitudG—n™hur—156 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros „ipo de prue˜— e l— izquierd— fil—ter—l e l— dere™h— H0 : µ = µ0 H0 : µ = µ0 ripótesis H1 : µ < µ0 H0 : µ = µ0 H1 : µ > µ0 ist—dísti™o z < zα H1 : µ = µ0 z > z1−α ‚e™h—zo P [Z < z] P [Z > z] pEv—lor z = x¯−µ√0 ƒupuestos sn−1/ n |z| > z1−α/2 2P [Z > |z|] n ≥ 30 gu—dro VFQX gontr—ste p—r— l— medi— ™on muestr—s gr—ndes WFPQ IHFQV WFUT UFSV WFWW WFRT IHFIV WFHV UFHW WFPSIPFSU VFUI WFIT IHFVH WFVT UFTI VFWV IHFVI WFHS WFQW VFRP UFVR WFIT WFRH WFHQ WFHH WFPS IHFQW VFSH WFSI WFSW VFTQ UFRV UFUS VFWP IPFVS IIFHI VFIW UFRR IIFTTIIFQU IHFHT VFHW WFIW IHFUW WFVP WFQU WFTT WFUS WFTT gu—dro VFRX h—tos del ejemplo de l—s espe™iesp—r— tr—t—r de dis™ernir si los húmeros fósiles que en™uentr—n en un y—™imiento ™orresponden o no — un— nuev—espe™ieFƒupong—mos que un— espe™ie ™omún en l— zon— donde se en™l—v— un y—™imientoD l— Bichus localisD tiene un—r—zón medi— longitudG—n™hur— de WF vos —rqueólogos en™—rg—dos del y—™imiento h—n h—ll—do SH húmerosfósilesD ™uyos d—tos —p—re™en en el gu—dro VFRF ¾„ienen los —rqueólogos indi™ios su(™ientes p—r— ™on™luir queh—n des™u˜ierto en el y—™imiento un— espe™ie distint— de l— Bichus localiscin primer lug—rD o˜servemos que no nos h—n espe™i(™—do ningún nivel de signi(™—™ión en el enun™i—doF ineste ™—soD lo h—˜itu—l es ™onsider—r α = 0.05F in ™—so de que l— de™isión se— muy relev—nteD elegirí—mos unnivel más ˜—joFe ™ontinu—™ión de˜emos pl—nte—r l—s hipótesis del ™ontr—steF in prin™ipioD l— zon— de l— ex™—v—™ión indi™— quel— espe™ie del y—™imiento de˜erí— ser l— espe™ie Bichus localisD s—lvo que demostremos lo ™ontr—rioD es de™irDl— hipótesis nul— es H0 : µ = 9D donde por µ est—mos not—ndo l— medi— de l— r—zón longitudG—n™hur— delhúmero de l— espe™ie del y—™imientoF gomo hipótesis —ltern—tiv— nos pl—nte—mos que se tr—te de otr— espe™ieDes de™ir H1 : µ = 9F ƒe tr—t—D por t—ntoD de un ™ontr—ste de dos ™ol—sF€—r— re—liz—rloD de˜emos ™—l™ul—r en primer lug—r el est—dísti™o de ™ontr—steF ÉsteD — su vezD requiere del™ál™ulo de l— medi— y de l— desvi—™ión típi™— muestr—l de los d—tosF istos v—lores sonD respe™tiv—menteD WFRIRy IFPQWF €or t—ntoD z = 9.414 √− 9 = 2.363. 1.239/ 50ehor— tenemos que pl—nte—rnos si este v—lor del est—dísti™o nos permite re™h—z—r l— hipótesis nul— en f—vorde l— —ltern—tiv— o noF €odemos h—™erlo de dos form—sXIF y˜teniendo l— región de re™h—zoF h—do que z1−0.05/2 = 1.96D l— región de re™h—zo es |z| > 1.96F †emos queD en efe™toD 2.363 > 1.96D por lo que podemos re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un WS 7 de ™on(—nz—D ™on™luyendo ™on ese nivel de ™on(—nz— que se tr—t— de un— nuev— espe™ieF xos qued—D sin em˜—rgoD l— dud— de s—˜er qué hu˜ier— p—s—do de tom—r un nivel de signi(™—™ión más exigenteY por ejemploD α = 0.01FProf. Dr. Antonio José Sáez Castillo 157

Dpto de Estadística e I.O. Universidad de Jaén „ipo de prue˜— e l— izquierd— fil—ter—l e l— dere™h— ripótesis H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0 ist—dísti™o H1 : µ < µ0 H1 : µ = µ0 H1 : µ > µ0 ‚e™h—zo pEv—lor t = x¯−µ√0 ƒupuestos sn−1/ n t < tα;n−1 |t| > t1−α/2;n−1 t > t1−α;n−1 P [Tn−1 < t] 2P [Tn−1 > |t|] P [Tn−1 > t] histri˜u™ión de pro˜—˜ilid—d —proxim—d—mente norm—l gu—dro VFSX gontr—ste p—r— l— medi— ™on muestr—s pequeñ—sPF wedi—nte el pEv—lorF „enemos que p = 2 × P [Z > |2.363|] = 0.018. h—do que es inferior —l S 7D podemos re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un WS 7 de ™on(—nz—D ™on™luyendo ™on ese nivel de ™on(—nz— que l— r—zón medi— longitudG—n™hur— de los húmeros del y—™imiento es distint— de l— del Bichus localisD pero no podrí—mos lleg—r — h—™er es— —(rm—™ión ™on un WW 7 de ™on(—nz— @I 7 de signi(™—™iónA1F8.4.2. Con muestras pequeñas (n < 30)v— prin™ip—l diferen™i— es queD —l no poder utiliz—r el „eorem— gentr—l del vímite por tr—t—rse de muestr—spequeñ—sD de˜emos —ñ—dir ™omo hipótesis l— norm—lid—d de los d—tosF in ese ™—soD l— distri˜u™ión en elmuestreo del est—dísti™o y— no es norm—lD sino tEstudentF il resumen —p—re™e en el gu—dro VFSF in ell—D tp;ves el v—lor de un— t de ƒtudent ™on v gr—dos de li˜ert—d t—l que P [Tv < tp;v] = pF†—mos — —pli™—r el test en l— siguiente situ—™iónF il di—rio ƒur pu˜li™—˜— un— noti™i— el S de noviem˜re de PHHVdonde se indi™—˜— que los niveles de concentración de benceno, un tipo de hidrocarburo cancerígeno que seencuentra como vapor a temperatura ambiente y es indisoluble en agua, no superan el máximo permitido porla Directiva Europea de Calidad del Aire, cinco microgramos por metro cúbico. Ésta es la principal conclusióndel estudio elaborado por un equipo de la Escuela Andaluza de Salud Pública en el g—mpo de qi˜r—lt—rF v—noti™i— sólo indi™—˜— que el estudio se ˜—s—˜— en un— muestr—D d—ndo el v—lor medio muestr—l en v—ri—s zon—sdel g—mpo de qi˜r—lt—rD pero no el t—m—ño ni l— desvi—™ión típi™— muestr—lF€—r— re—liz—r el ejemploD nosotros v—mos — im—gin—r unos d—tos ™orrespondientes — un— muestr— de PH hog—resdonde se midió l— ™on™entr—™ión de ˜en™enoD —rroj—ndo un— medi— muestr—l de SFI mi™rogr—mos por metro™ú˜i™o y un— desvi—™ión típi™— muestr—l de IFUF istoy seguro de queD en ese ™—soD el periódi™o h—˜rí— s—™—dogr—ndes titul—res so˜re l— ™ont—min—™ión por ˜en™eno en los hog—res del g—mpo de qi˜r—lt—r peroD ¾podemos—(rm—r queD en efe™toD se super—n los límites de l— hire™tiv— iurope— de g—lid—d del eirecin primer lug—rD de nuevo no nos indi™—n un nivel de signi(™—™ión ™on el que re—liz—r l— prue˜—F is™ogemosDen prin™ipioD α = 0.05F„enemos que tener ™uid—doD porque el pl—nte—miento de l— prue˜—D t—l y ™omo se nos h— pl—nte—doD será™ontr—st—r l— hipótesis nul— H0 : µ = 5 frente — H1 : µ > 5D en ™uyo ™—soD un error tipo s se tr—du™e en™on™luir que se viol— l— norm—tiv— ™u—ndo en re—lid—d no lo h—™eD lo ™uál es gr—ve porque gener— —l—rm—injusti(™—d— en l— po˜l—™iónD mientr—s que el error tipo ssD el que no ™ontrol—mos ™on el αD es ™on™luir que 1Debe quedar claro que, estadísticamente, lo que hemos demostrado es que la razón media es distinta de 9. Son los arqueólogoslos que deciden que eso implica una nueva especie.158 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosse ™umple l— norm—tiv— ™u—ndo en re—lid—d no lo h—™eD ½lo ™u—l es gr—vísimo p—r— l— po˜l—™ión3 gon estoquiero in™idir en un— ™uestión import—nte respe™to — lo que se nos pide que demostremosX se nos di™e quenos pl—nteemos si se super—n los límites de l— norm—tiv—D en ™uyo ™—so H1 de˜e ser µ > 5D pero en re—lid—dDde˜erí—mos pl—nte—rnos l— pregunt— de si podemos est—r seguros de que se está por de˜—jo de los límitesmáximos permitidosD es de™irD de˜erí—mos pro˜—r H1 : µ < 5Fgentrándonos ex™lusiv—mente en lo que se nos pide en el enun™i—doD tenemos que H1 : µ > 5 determin— quese tr—t— de un— prue˜— unil—ter—l — l— dere™h—F il est—dísti™o de ™ontr—ste es t = 5.1 √− 5 = 0.263. 1.7/ 20 IF ƒi queremos ™on™luir ™on l— región de re™h—zoD ést— está form—d— por los v—lores t > t0.95;19 = 1.729D luegoD d—do que 0.263 < 1.729D no podemos —(rm—r ™on un WS 7 de ™on(—nz— que se esté in™umpliendo l— norm—tiv—F PF il pEv—lor es —ún más inform—tivoF ƒu v—lor es p = P [T19 > 0.263] = 0.398D por lo que tendrí—mos que lleg—r h—st— ™—si un RH 7 de signi(™—™ión p—r— re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— —(rm—ndo que se in™umple l— norm—tiv—F€or lo t—ntoD t—l y ™omo está pl—nte—do el pro˜lem—D no podemos —(rm—r que se esté in™umpliendo l— norm—tiv—@™on un S 7 de signi(™—™iónAD por más que un v—lor muestr—l de l— medi—D SFID p—rez™— indi™—r que síF voque yo re™omend—rí— — los respons—˜les del ™umplimiento l— norm—tiv— es que —ument—r—n el t—m—ño de l—muestr—D y— queD por ejemploD si esos mismos d—tos ™orrespondier—n — IHHH hog—res en vez de — PHD sí sepodrí— —(rm—r ™on un WS 7 de ™on(—nz— que se in™umple l— norm—tiv—F8.5. Contraste para la diferencia de medias de poblaciones indepen- dientesƒe—n dos muestr—sD x1, ..., xn1 e y1, ..., yn2 D de vF—F independientes ™on medi—s µ1 y µ2 y v—ri—nz—s σ12 y σ22Fƒe—n x¯D y¯D sn1 −1 2 y s2n−1 2 medi—s y v—ri—nz—s muestr—lesF8.5.1. Con muestras grandes (n1, n2 ≥ 30)il resumen del pro™edimiento p—r— el ™ontr—ste —p—re™e en el gu—dro VFTF†—mos — ™onsider—r un ejemplo donde —pli™—r el ™ontr—steF sm—ginemos que un ingeniero invent— un nuevométodo de produ™™ión ™on el que ™ree que pueden redu™irse los tiempos de produ™™iónF €—r— ™ompro˜—rloDprodu™e SH unid—des ™on el nuevo pro™eso y QH ™on el —ntiguoD ™ont—˜iliz—ndo el tiempo @en segundosA que set—rd— en produ™ir ™—d— unid—dF in el gu—dro VFU —p—re™e un resumen de los result—dosF¾€ropor™ion—n est—s muestr—s prue˜—s su(™ientes p—r— ™on™luir que el promedio de tiempo de produ™™ióndisminuye ™on el nuevo pro™esoc €rué˜ese ™on α = 0.05Fvl—memos µ1 —l tiempo medio de produ™™ión ˜—jo el nuevo pro™eso y µ2 —l tiempo medio de produ™™ión ˜—joel —ntiguo pro™esoF xos piden que ™ontr—stemos H0 : µ1 = µ2 frente — H1 : µ1 < µ2 oD lo que es lo mismoDH1 : µ1 − µ2 < 0X se tr—t—D por t—ntoD de un test unil—ter—l — l— izquierd—FProf. Dr. Antonio José Sáez Castillo 159

Dpto de Estadística e I.O. Universidad de Jaén „ipo de …nil—ter—l — fil—ter—l …nil—ter—l prue˜— l— izquierd— — l— dere™h— H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 ripótesis H1 : µ1 − µ2 < D0 H1 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 ist—dísti™o z= (x¯−y¯)−D0 de ™ontr—ste ( ) ( )s1n−12 2 ‚egión de re™h—zo n1+ sn2 −1 pEv—lor n2 ƒupuestos z < zα |z| > z1−α/2 z > z1−α P [Z < z] 2P [Z > |z|] P [Z > z] n1, n2 ≥ 30F wuestreo independiente y —le—torio gu—dro VFTX gontr—ste p—r— l— diferen™i— de medi—s ™on muestr—s gr—ndes €ro™eso nuevo €ro™eso —ntiguo n1 = 50 n2 = 30 y¯1 = 1255 y¯2 = 1330 s1 = 215 s2 = 238 gu—dro VFUX h—tos del ejemplo del nuevo pro™eso de produ™™iónil est—dísti™o es z = 1255 − 1330 = −1.41. 2152 + 2382 50 30€—r— tom—r l— de™isión podemos o˜tener l— región ™ríti™— o el pEv—lorXIF v— región de re™h—zo es z < z0.05 = −1.65F h—do que z = −1.41 no ™—e en est— regiónD no podemos re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on α = 0.05D es de™irD no tenemos un WS 7 de ™on(—nz— en que el nuevo pro™eso h—y— disminuido el tiempo medio de produ™™iónF xo o˜st—nteD est— respuest— dej— —˜iert— l— pregunt—D si no un WS 7 de ™on(—nz—D ¾™uánt—cFPF h—do que el pEv—lor es p = P [Z < −1.41] = 0.079 > 0.05D no podemos re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on el nivel de signi(™—™ión α = 0.05Fr—y que de™ir que no hemos podido pro˜—r lo que se sospe™h—˜—D que el nuevo pro™eso redu™í— el tiempomedio de produ™™iónD pero los d—tos —punt—n en est— dire™™iónF hesde el punto de vist— est—dísti™oD de˜erí—mosre™omend—r —l ingeniero que —umente el t—m—ño de l—s muestr—s porque es posi˜le que en ese ™—so sí pued—pro˜—r es— hipótesisF8.5.2. Con muestras pequeñas (n1 < 30 o n2 < 30) y varianzas igualesil resumen —p—re™e en el gu—dro VFVF e propósito de l— hipótesis de l— igu—ld—d de l—s v—ri—nz—sD ést— de˜e˜—s—rse en r—zones no est—dísti™—sF vo h—˜itu—l es que se supong— que son igu—les porque el experto que estáre—liz—ndo el ™ontr—ste tiene r—zones experiment—les p—r— h—™erloD r—zones —jen—s — l— est—dísti™—F†—mos — ™onsider—r ™omo ejemplo el de un ingeniero que dese— ™omp—r—r dos equipos de tr—˜—jo p—r— —n—liz—rsi se ™omport—n de form— homogéne—F €—r— ello re—liz— un— prue˜— de destrez— entre los tr—˜—j—dores de—m˜os equiposX IQ del equipo I y IS del equipo PD ™uy—s puntu—™iones —p—re™en en el gu—dro VFWF ¾r—yindi™ios su(™ientes de que exist—n diferen™i—s entre l—s puntu—™iones medi—s de los dos equiposc (α = 0.05)F160 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros „ipo e l— izquierd— fil—ter—l e l— dere™h— ripótesis H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 ist—dísti™o H1 : µ1 − µ2 < D0 H1 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 de ™ontr—ste t= (x¯−y¯)−D0 , sp2 = ( ) ( )(n1−1) s1n−1 2+(n2−1) sn2 −1 2 ‚egión de ‚e™h—zo sp2 1 + 1 n1 +n2 −2 n1 n2 pEv—lor t < tα;n1+n2−2 |t| > t1−α/2;n1+n2−2 t > t1−α;n1+n2−2 ƒupuestos P [Tn1+n2−2 < t] 2P [Tn1+n2−2 > |t|] P [Tn1+n2−2 > t] wuestreo independiente y —le—torioF †—ri—˜les norm—lesF σ12 = σ22 gu—dro VFVX gontr—ste p—r— l— igu—ld—d de medi—s ™on muestr—s pequeñ—siquipo I SW UQ UR TI WP TH VR SR UQ RU IHP US QQiquipo P UI TQ RH QR QV RV TH US RU RI RR VT SQ TV QW gu—dro VFWX h—tos de l—s puntu—™iones de los dos equipos de tr—˜—joxos piden que ™ontr—stemos l— igu—ld—d de l—s medi—s @H0 : µ1 = µ2AD frente — l— —ltern—tiv— H1 : µ1 = µ2Dpor lo que se tr—t— de un ™ontr—ste ˜il—ter—lFin primer lug—rD o˜tenemos los est—dísti™os muestr—les de —m˜os equiposF v—s medi—s sonD respe™tiv—menteDTVFP y SQFVD mientr—s que l—s desvi—™iones típi™—s muestr—les son IVFT y ISFVF gon estos v—lores podemos™—l™ul—r s2pX 12 × 18.6 + 14 × 13 + 15 − 2 s2p = 15.8 = 294.09.gon este v—lor y— podemos ™—l™ul—r el est—dísti™o de ™ontr—steX 68.2 − 53.8 t = = 2.22. 294.09( 1 + 1 ) 13 15eunque no hemos di™ho n—d— —l respe™toD v—mos — suponer que l—s v—ri—nz—s son igu—lesF isto no p—re™edes™—˜ell—do si —dmitimos que l—s ™ondi™iones en que tr—˜—j—n —m˜os equipos determin—n que no de˜e h—˜erdiferen™i—s en l— v—ri—˜ilid—d de sus puntu—™ionesF ist— hipótesis de˜e ser —dmitid— y propuest— por el experto@en este ™—soD el ingenieroA que m—nej— los d—tosF€—r— o˜tener l— ™on™lusiónD ™omo siempreD v—mos — o˜tener l— región de re™h—zo y v—lor—r el pEv—lorXIF v— región de re™h—zo es |t| > t0.975;26 = 2.055F h—do que t = 2.22 ™—e en es— regiónD podemos re™h—z—r l— igu—ld—d de l—s medi—s ™on un WS 7 de ™on(—nz—FPF h—do que el pEv—lorD p = 2P [T26 > 2.22] = 0.035 es inferior — HFHSD podemos re™h—z—r l— igu—ld—d de l—s medi—s ™on un WS 7 de ™on(—nz—F he he™hoD podrí—mos lleg—r — un WTFS 7F8.5.3. Con muestras pequeñas, varianzas distintas y mismo tamaño muestralil resumen del ™ontr—ste se re™oge en el gu—dro VFIH8.5.4. Con muestras pequeñas, varianzas distintas y distinto tamaño muestralil resumen —p—re™e en el gu—dro VFIID donde v se redonde— —l entero más ™er™—noFProf. Dr. Antonio José Sáez Castillo 161

Dpto de Estadística e I.O. Universidad de Jaén „ipo de prue˜— …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 ist—dísti™o H1 : µ1 − µ2 < D0 H1 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 de ™ontr—ste ‚egión de t= (x¯−y¯)−D0 re™h—zo s1n−1 2+ sn2 −1 2 pEv—lor ( ) ( )1 ƒupuestos n t < tα;2(n−1) |t| > t1−α/2;2(n−1) t > t1−α;2(n−1) P [Tα;2(n−1) < t] 2P [Tα;2(n−1) > |t|] P [Tα;2(n−1) > t] v—s dos muestr—s se re™ogen de form— independiente y —le—tori— em˜—s v—ri—˜les siguen distri˜u™iones —proxim—d—mente norm—les v—s muestr—s tienen el mismo t—m—ñoD n1 = n2 = ngu—dro VFIHX gontr—ste p—r— l— igu—ld—d de medi—s ™on muestr—s pequeñ—s v—ri—nz—s distint—s y mismot—m—ño muestr—l „ipo de prue˜— …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 ist—dísti™o de ™ontr—ste H1 : µ1 − µ2 < D0 H1 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 ‚egión ( ) ( )sn1 −12 2 2 de re™h—zo n1 + pEv—lor sn2 −1 ƒupuestos (x¯−y¯)−D0 n2 t= 2 2 ,v = ( ) 2 2 ( ) 2 2   +   ( ) ( )s1n−1 sn1 −1 sn2 −1 n1 sn2 −1  n1   n2  n2 n1−1 + n2−1 t < tα;v |t| > t1−α/2;v t > t1−α;v P [Tv < t] 2P [Tv > |t|] P [Tv > t] v—s dos muestr—s se re™ogen de form— independiente y —le—tori— em˜—s v—ri—˜les siguen distri˜u™iones —proxim—d—mente norm—lesgu—dro VFIIX gontr—ste p—r— l— igu—ld—d de medi—s ™on muestr—s pequeñ—sD v—ri—nz—s distint—s y distintot—m—ño muestr—l8.6. Contraste para la diferencia de medias de poblaciones aparea- das„enemos un— mism— po˜l—™ión en l— que sele™™ion—mos un— muestr— de n individuosF in ™—d— uno de elloso˜serv—mos dos v—ri—˜lesD X e Y F ist—s v—ri—˜les no son independientesX l—s muestr—s están apareadasD(x1, y1) , ..., (xn, yn)F €—r— ™omp—r—r —m˜—s v—ri—˜les se ™onsider— un— nuev— v—ri—˜leD D = X − Y F xot—mosd¯ — l— medi— muestr—l de x1 − y1, ..., xn − yn y sdn−1 2 — su v—ri—nz— muestr—lF8.6.1. Con muestras grandes (n ≥ 30)il resumen —p—re™e en el gu—dro VFIPF8.6.2. Con muestras pequeñas (n < 30)il resumen —p—re™e en el gu—dro VFIQF †e—mos un ejemploF…n— empres— f—rm—™eúti™— está investig—ndo un medi™—mento que redu™e l— presen™i— en s—ngre de un ™omE162 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros „ipo e l— izquierd— fil—ter—l e l— dere™h— H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 ripótesis H1 : µ1 − µ2 < D0 H0 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 H1 : µ1 − µ2 = D0ist—dísti™o z < zα z > z1−α ‚e™h—zo P [Z < z] z = sdnd¯−−1D/√0 n P [Z > z] pEv—lor |z| > z1−α/2ƒupuestos 2P [Z > |z|] n ≥ 30gu—dro VFIPX gontr—ste p—r— l— igu—ld—d de medi—s en po˜l—™iones —p—re—d—s ™on muestr— gr—nde „ipo e l— izquierd— fil—ter—l e l— dere™h— ripótesis H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H1 : µ1 − µ2 < D0 H1 : µ1 − µ2 > D0ist—dísti™o H1 : µ1 − µ2 = D0 ‚e™h—zo t < tα;n−1 t = sdnd¯−−1D/√0 n t > t1−α;n−1 pEv—lor P [Tn−1 < t] P [Tn−1 > t]ƒupuestos |t| > t1−α/2;n−1 2P [Tn−1 > |t|] D = X − Y D es —proxim—d—mente norm—lgu—dro VFIQX gontr—ste p—r— l— igu—ld—d de medi—s en po˜l—™iones —p—re—d—s y muestr— pequeñ—ponente no dese—do2F entes de s—™—rlo —l mer™—do ne™esit— un estudio de ™—sosE™ontroles que demuestre sue(™—™i—Fil estudio de ™—sos ™ontroles ™onsiste en en™ontr—r un número determin—do de p—rej—s de person—s ™on™—r—™terísti™—s (siológi™—s p—re™id—sY en este ™—soD l— más import—nte de est—s ™—r—™terísti™—s serí— que l—sp—rej—s ™—soE™ontrol teng—n —l ini™io del estudio el mismo o muy p—re™ido nivel de presen™i— en s—ngre del™omponente no dese—doX en ™—d— un— de es—s p—rej—sD un— —™tú— ™omo ™—soD tom—ndo l— medi™—™ión en estudioDy l— otr— ™omo ™ontrolD tom—ndo un produ™to ino™uo ll—m—do pl—™e˜oF xingun— de l—s dos person—sD ni siquier—el médi™o o el f—rm—™eúti™o que ™ontrol— el pro™esoD s—˜e quién es el ™—so y quién el ™ontrolF ƒólo quien re™opil—y —n—liz— los result—dosD sin ™ont—™to —lguno ™on el p—™ienteD tiene esos d—tosF ist— metodologí— se ™ono™e™omo doble ciego y evit— que el ™ono™imiento de que se está —dministr—ndo l— medi™in— provoque un efe™toen sí mismoF vos d—tos —p—re™en en el gu—dro VFIRF…n —nálisis ™ostoE˜ene(™io de l— empres— f—rm—™eúti™— muestr— que será ˜ene(™ioso s—™—r —l mer™—do elprodu™to si l— disminu™ión medi— del ™omponente perjudi™i—l es de —l menos P puntosF ‚e—li™emos un— nuev—prue˜— p—r— —yud—r — l— ™omp—ñí— — tom—r l— de™isión ™orre™t—F vos d—tos son l— disminu™ión de presen™i—en s—ngre del ™omponente no dese—do después de tom—r el medi™—mento o el pl—™e˜oFimpe™emos por l— not—™iónF †—mos — ll—m—r muestr— I — l— del medi™—mento y muestr— P — l— del pl—™e˜oFgon est— not—™iónD nos piden que ™ontr—stemos H0 : µ1 −µ2 = 2 frente — H1 : µ1 > µ2 +2D o equiv—lentementeDH1 : µ1 − µ2 > 2F in ese ™—soD el est—dísti™o de ™ontr—ste es t = 3.21 −√2 = 3.375 1.134/ 10y el pEv—lor —so™i—do es p = P [T9 > 3.375] = 0.004F †emos que l— signi(™—™ión determin— un pEv—lor inferiorDpor ejemploD — α = 0.05D por lo que podemos ™on™luir ™on ese nivel de signi(™—™ión que l— mejor— es superiorDen medi—D — P puntos yD por t—ntoD el medi™—mento es rent—˜leF2Podría ser colesterol, ácido úrico, ...Prof. Dr. Antonio José Sáez Castillo 163

Dpto de Estadística e I.O. Universidad de Jaén €—rej— wedi™—mento €l—™e˜o hiferen™i— I QPFIH PUFIH SFHH P QTFIH QIFSH RFTH Q QPFQH QHFRH IFWH R PWFSH PTFWH PFTH S QRFQH PWFWH RFRH T QIFWH PVFUH QFPH U QQFRH QHFPH QFPH V QRFTH QIFVH PFVH W QSFPH QQFTH IFTH IH QPFUH PWFWH PFVH gu—dro VFIRX h—tos del ejemplo de l— ™omp—ñí— f—rm—™eúti™— „ipo de prue˜— …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis H0 : p = p0 H0 : p = p0 H0 : p = p0 H1 : p < p0 H1 : p = p0 H1 : p > p0 ist—dísti™o de ™ontr—ste P [Z < z] z = pˆ−p0 P [Z > z] p0 (1−p0 ) pEv—lor n ‚egión 2P [Z > |z|] de re™h—zo ƒupuestos z < zα |z| > z1−α/2 z > z1−α np0, n (1 − p0) ≥ 10 gu—dro VFISX gontr—ste p—r— un— propor™ión8.7. Contraste para la proporción en una poblaciónin est— o™—sión tenemos un— po˜l—™ión donde un— propor™ión d—d— present— un— determin—d— ™—r—™terísti™—Dque denomin—mos éxitoD y ™uy— pro˜—˜ilid—d es pF hese—mos h—™er inferen™i— so˜re est— propor™iónF €—r—ello sele™™ion—mos un— muestr— —le—tori— simple de t—m—ño n y ™ont—˜iliz—mos l— propor™ión de éxitos en l—muestr—D pˆF il resumen del ™ontr—ste —p—re™e en el gu—dro VFISF†—mos — ™onsider—r un primer ejempo rel—tivo — l— rel—™ión entre el género y los —™™identes de trá(™oF ƒeestim— que el TH 7 de los ™ondu™tores son v—ronesF €or otr— p—rteD un estudio re—liz—do so˜re los d—tos de IPH—™™identes de trá(™o muestr— que en ellos el UH 7 de los —™™identes fueron provo™—dos por un v—rón ™ondu™torF¾€odemosD ™on esos d—tosD ™on(rm—r que los hom˜res son más peligrosos —l vol—ntecƒi not—mos por p — l— propor™ión de v—rones ™—us—ntes de —™™identes de trá(™oD l— pregunt— se responderá—(rm—tiv—mente si logr—mos ™ontr—st—r l— hipótesis H1 : p > 0.6F il v—lor del est—dísti™o es 0.7 − 0.6 z = = 2.236. 0.6×0.4 120€or su p—rteD l— región de re™h—zo serí— |z| > 1.96 p—r— un α = 0.05D luego en efe™toD podemos ™on™luir que l—propor™ión de v—rones ™—us—ntes de —™™identes es superior — l— propor™ión de v—rones ™ondu™tores en gener—lFil pEv—lorD de he™hoD es HFHIQF†—mos — —n—liz—r ™on mu™ho det—lle otro ejemplo so˜re igu—ld—d de propor™ionesF he tod—s form—sD lo quequiero enf—tiz—ros ™on el ejemplo no está rel—™ion—do en sí ™on el he™ho de que se re(er— — un— propor™iónFUna marca de nueces arma que, como máximo, el 6 % de las nueces están vacías. Se eligieron 300 nueces164 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosal azar y se detectaron 21 vacías. Con un nivel de signicación del 5 %, ¾se puede aceptar la armación dela marca?in primer lug—rD pedir un nivel de signi(™—™ión del S 7 es equiv—lente — pedir un nivel de ™on(—nz— delWS 7 FFF ¾so˜re quéc xos pregunt—n si se puede —™ept—r l— —(rm—™ión de l— m—r™— con un nivel designicación del 5 %, es decir, con un nivel de conanza del 95 %F iso impli™— que queremospro˜—r ™on —mpli—s g—r—ntí—s que l— m—r™— no mienteD y l— úni™— form— de h—™erlo es poner su hipótesis@p < 0.06A en l— hipótesis —ltern—tiv—F €or t—ntoD tendrí—mos H0 : p ≥ 0.06 frente — lo que —(rm— l—m—r™—D H1 : p < 0.06Fehor— ˜ienD (jémonos que l— propor™ión muestr—l de nue™es v—™í—s es pˆ = 21/300 = 0.07F is de™irD nospiden que ve—mos si un— propor™ión muestr—l de HFHU d— su(™iente ™on(—nz— @WS 7 p—r— ser ex—™tosA deque p < 0.06FFF ½xo d— ningun—3 xi siquier— h—™e f—lt— h—™er el ™ontr—ste ™on númerosF t—más podremosre™h—z—r l— hipótesis nul— en f—vor de l— hipótesis de l— m—r™—D es de™irD en —˜soluto podemos —(rm—rlo que di™e l— m—r™—D p < 0.06D ™on un WS 7 de ™on(—nz—F he tod—s form—sD por si h—y —lgún in™réduloDel est—dísti™o de ™ontr—ste serí— z = √0.07−0.06 = 0.729F v— región de re™h—zoD d—do que es un test — l— 0.06×0.94 300izquierd—D serí— z < z0.05 = −1.645F gomo vemosD el v—lor del est—dísti™o de ™ontr—ste está en l— ™ol— del— dere™h— y l— región de re™h—zo en l— de l— izquierd—F €or eso de™í— —ntes que es imposi˜le re™h—z—r l—hipótesis nul— en f—vor de l— —ltern—tiv—D independientemente del nivel de ™on(—nz— requeridoFr—st— —hor— hemos demostr—do que l— m—r™— no puede —(rm—r que l— propor™ión de nue™es v—™í—s esinferior —l T 7 ™on un WS 7 de ™on(—nz—F he he™hoD no lo puede —(rm—r ™on ningún nivel de ™on(—nz—Dporque los d—tos tom—dos propor™ion—n un— estim—™ión de HFHU que v— justo en ™ontr— de su hipótesisF€ero v—mos — suponer que nos ponemos g—llitos y de™imosX es más, podría demostrar que hay eviden-cias empíricas que proporcionan un 95 % de conanza en que la compañía miente, siendo en realidadla proporción de nueces vacías superior al 6 % F ehor— somos nosotros los que —(rm—mos otr— ™os—X—(rm—mos p > 0.06 ™on un WS 7 de ™on(—nz—D lo que equiv—le — de™ir que hemos pl—nte—do un nuevo™ontr—ste de hipótesis en el que H0 : p ≤ 0.06 frente — H1 : p > 0.06F v—s ™uent—s están ™—si he™h—sD y—que el v—lor del est—dísti™o de ™ontr—ste es el mismoD z = 0.729D mientr—s que l— región de re™h—zo esz > z0.95 = 1.645F ehor— el v—lor del est—dísti™oD es de™irD l— inform—™ión que nos d—n los d—tos @PI deQHH nue™es v—™í—sAD sí es ™oherente ™on l— hipótesis —ltern—tiv—D de —hí que esté en l— mism— ™ol— que l—región de re™h—zoFFF ½pero no ™—e en ell—3F €or lo t—ntoD no tenemos su(™ientes eviden™i—s en los d—tosp—r— re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un WS 7 de ™on(—nz—D —sí que no podemosdemostr—r ™on ese nivel de ™on(—nz— que l— m—r™— mienteFin resumenD —unque p—rez™— p—r—dóji™oD no tenemos su(™ientes eviden™i—s en los d—tos p—r— —(rm—rque l— ™omp—ñí— di™e l— verd—dD pero t—mpo™o p—r— demostr—r que mienteF v— diferen™i— entre —m˜—shipótesis r—di™— en que no tenemos ningun— ™on(—nz— en l— —(rm—™ión de l— ™omp—ñí—D y sí —lgun—™on(—nz— en l— —(rm—™ión ™ontr—ri—F ¾guánt— ™on(—nz— tenemos en l— —(rm—™ión ™ontr—ri— p > 0.06cise v—lor viene d—do por el pEv—lorD P [Z > 0.729] = 0.233D que determin— que el nivel de ™on(—nz— enp > 0.06 es (1 − 0.233) × 100 % = 72.9 %Fpin—lmenteD —lguien podrí— pens—rD ¾y entonces qué hacemos? F hesde el punto de vist— est—dísti™olo úni™o que podemos re™omend—r es —ument—r el t—m—ño de l— muestr—D es de™irD romper más de QHHnue™es p—r— tom—r l— de™isiónF ep—rentementeD l— inform—™ión re™ogid— ™on QHH nue™es p—re™e indi™—rProf. Dr. Antonio José Sáez Castillo 165

Dpto de Estadística e I.O. Universidad de Jaén „ipo de …nil—ter—l — fil—ter—l …nil—ter—l prue˜— l— izquierd— — l— dere™h— H0 : p1 − p2 = D0 H0 : p1 − p2 = D0 H0 : p1 − p2 = D0 ripótesis H1 : p1 − p2 < D0 H1 : p1 − p2 = D0 H1 : p1 − p2 > D0 ist—dísti™o z= , pˆ =pˆ1−pˆ2−D0 n1 pˆ1 +n2 pˆ2 de ™ontr—ste n1 +n2 pˆ(1−pˆ) 1 + 1 ‚egión n1 n2 de re™h—zo z < zα |z| > z1−α/2 z > z1−α pEv—lor ƒupuestos P [Z < z] 2P [Z > |z|] P [Z > z] el menos IH éxitos y IH fr—™—sos gu—dro VFITX gontr—ste p—r— l— diferen™i— de propor™iones que l— m—r™— mienteF he he™hoD si l— propor™ión muestr—l de HFHU provinier— de un— muestr— de ITHH nue™es en vez de QHHD sí hu˜iér—mos podido demostr—r ™on un WS 7 de ™on(—nz— que l— m—r™— mienteF8.8. Contraste para la diferencia de proporcionesin est— o™—sión p—rtimos de dos po˜l—™iones dentro de l—s ™u—les h—y propor™iones p1 y p2 de individuos ™onl— ™—r—™terísti™— éxitoF €retendemos ™omp—r—r est—s propor™iones medi—nte l— tom— de muestr—s de t—m—ño n1y n2F xot—remos pˆ1 y pˆ2 l—s propor™iones de éxitos en l—s muestr—sF ƒupondremos de nuevo que l—s muestr—sson gr—ndes p—r— poder —pli™—r el „eorem— gentr—l del vímite — l— hor— de tr—˜—j—r ™on el est—dísti™o de™ontr—steF il resumen del ™ontr—ste —p—re™e en el gu—dro VFITF†—mos — ™onsider—r un estudio3 ™on d—tos re—lesD —unque —lgo —nti™u—dosD referente — l— rel—™ión entre los—™™identes de trá(™o y el ™onsumo de —l™oholD re—liz—do por l— hq„ en l— gomunid—d eutónom— de x—v—rr—en IWWIFƒe re—liz—ron prue˜—s de —l™oholemi— en PUR ™ondu™tores impli™—dos en —™™identes de trá(™o ™on heridosDde los ™u—lesD VV dieron positivoF €or su p—rteD l— qu—rdi— givil de „rá(™o re—lizó en l— mism— zon— IHRR™ontroles de —l™oholemi— —l —z—rD de los ™u—les IS dieron positivoFvo que l— hq„ quiere demostr—r es que el —l™ohol es ™—us—nte de los —™™identes de trá(™oF ƒin em˜—rgoDdesde el punto de vist— est—dísti™o sólo podemos ™ontr—st—r l— hipótesis de que l— propor™ión de positivos enl— prue˜— de —l™oholemi— es m—yor en el grupo de ™ondu™tores impli™—dos en —™™identes de trá(™oFxotemos por p1 y p2 — l—s verd—der—s propor™iones en el grupo de impli™—dos en —™™identes y en el grupode ™ondu™tores no impli™—dosF ƒe nos pide ™ontr—st—r H0 : p1 = p2 frente — H1 : p1 > p2F il est—dísti™o de™ontr—ste es 88 − 15 274 1044 z= = 904.29. 88+15 (1 − 88+15 )( 1 + 1 ) 274+1044 274+1044 274 1044istá ™l—ro que el v—lor del est—dísti™o es ˜esti—lD sin ne™esid—d de v—lor—r l— región de re™h—zoD que serí—z > z0.95 = 1.645D luego podemos re™h—z—r l— hipótesis nul— en f—vor de l— —ltern—tiv— ™onD —l menosD el WS 7de ™on(—nz—F il pEv—lorD p = P [Z > 904.29] = 0 indi™— que l— ™on(—nz— esD de he™hoD ˜—st—nte m—yorFxo puedo resistirme — ™on™luir el ejemplo sin re™ord—r que lo que l— hq„ re—lmente querrá d—r — entenderes que el —l™ohol es el ™—us—nte de los —™™identes de trá(™oD pero que eso no puede ser demostr—do ™on el™ontr—steF 3http://www.dgt.es/educacionvial/imagenes/educacionvial/recursos/dgt/EduVial/50/40/index.htm166 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros„ipo de prue˜— …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis ist—dísti™o H0 : σ2 = σ02 H0 : σ2 = σ02 H0 : σ2 = σ02 de ™ontr—ste H1 : σ2 < σ02 H1 : σ2 = σ02 H1 : σ2 > σ02 ‚e™h—zo χ =2 (n−1)sn2 −1 pEv—lor σ02 ƒupuestos χ2 < χ2α;n−1 χ2 < χα2 /2;n−1 o χ2 > χ12−α;n−1 P [χn2 −1 < χ2] χ2 > χ21−α/2;n−1 P [χn2 −1 > χ2] 2min(P [χ2n−1 < χ2], P [χ2n−1 > χ2]) histri˜u™ión de pro˜—˜ilid—d —proxim—d—mente norm—l gu—dro VFIUX gontr—ste p—r— l— v—ri—nz—8.9. Contraste para la varianza de una poblaciónhe nuevo ™onsideremos que tenemos un— v—ri—˜le —le—tori— X ™on v—ri—nz— σ2 y que tom—mos un— muestr— det—m—ño nD ™uy— v—ri—nz— muestr—l not—mos por sn2−1F †—mos — tr—t—r de h—™er inferen™i— so˜re σ2F il pro˜lem—es que —hor— no podemos —pli™—r el „eorem— gentr—l del vímiteD por lo que sólo utiliz—r los ™ontr—stes ™u—ndol— v—ri—˜le X es norm—lF χp2;v es el v—lor de un— χ2 de v gr—dos de li˜ert—d t—l que P χ2 < χ2p;v = pFv—s empres— ƒidel —(rm— que su máquin— de llen—do riwe posee un— desvi—™ión típi™— en el llen—do de™ontenedores de SHHml de produ™to homogéneo inferior — HFV grF4 †—mos — suponer que el supervisor de ™ontrolde ™—lid—d quiere re—liz—r un— ™ompro˜—™ión —l respe™toF ‚e™opil— p—r— ello un— muestr— del llen—do de SH™ontenedoresD o˜teniendo un— v—ri—nz— muestr—l de HFT ¾ist— inform—™ión propor™ion— prue˜—s su(™ientes deque l— desvi—™ión típi™— de su pro™eso de llen—do es re—lmente inferior — HFVgrFc€l—nte—mosD en primer lug—rD l—s hipótesis del ™ontr—steF ƒe nos pide que ™ontr—stemos H0 : σ = 0.8 oDequiv—lentementeD H0 : σ2 = 0.64 frente — l— —ltern—tiv— H1 : σ2 < 0.64F ƒe tr—t—D por t—ntoD de un testunil—ter—l — l— izquierd—F il est—dísti™o de ™ontr—ste es χ2 = 49 × 0.6 = 45.938. 0.64ehor— ™on™luimos — tr—vés de l— región de re™h—zo @elegimos α = 0.05A y del pEv—lorX IF h—do que χ02.05;9 = 33.930D y χ2 = 45.938 > χ02.05;9 = 33.930D no podemos ™on™luir ™on —l menos un WS 7 de ™on(—nz— queD en efe™toD l— desvi—™ión típi™— de l— ™—ntid—d de llen—do es inferior — HFVgrF PF h—do que el pEv—lor es p = P [χ429 < 45.938] = 0.4D ˜—st—nte —ltoD tenemos muy seri—s dud—s —™er™— de queD en efe™toD l— desvi—™ión típi™— se— re—lmente inferior — HFVgrFOjoX —ntes de que l— empres— ƒidel se enf—de ™on nosotrosD no olvidemos que los d—tos son im—gin—riosX sóloson re—les l—s espe™i(™—™iones té™ni™—s de σ < 0.8gr.8.10. Contraste para el cociente de varianzas„enemos dos muestr—sD x1, ..., xn1 y y1, ..., yn2 D de dos v—ri—˜les —le—tori—s independientes ™on v—ri—nz—s σ12 yσ22F xot—remos (sn1−1)2 y (sn2−1)2 — l—s v—ri—nz—s muestr—lesF he nuevo sólo podremos ™onsider—r el ™ontr—ste 4http://www.sidel.com/es/products/equipment/the-art-of-lling/hema-gwProf. Dr. Antonio José Sáez Castillo 167

Dpto de Estadística e I.O. Universidad de Jaén „ipo …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis H0 : σ12 =1 H0 : σ12 =1 H0 : σ12 =1ist—dísti™o H1 : σσ1222 <1 H1 : σσ2122 =1 H1 : σσ2122 >1 ‚e™h—zo σ22 σ22 σ22 pEv—lor ( )s1n−1 2ƒupuestos f = ( )sn2 −1 2 f < fα;n1−1,n2−1 f < fα/2;n1−1,n2−1 o f > f1−α;n1−1,n2−1 f > f1−α/2;n1−1,n2−1 P [Fn1−1,n2−1 < f ] 2min(P [Fn1−1,n2−1 < f ], P [Fn1−1,n2−1 > f ]) P [Fn1−1,n2−1 > f ] v—s dos muestr—s se re™ogen de form— independiente y —le—tori— em˜—s v—ri—˜les siguen distri˜u™iones —proxim—d—mente norm—les gu—dro VFIVX gontr—ste p—r— el ™o™iente de v—ri—nz—ssi —m˜—s v—ri—˜les son norm—lesF il resumen del ™ontr—ste —p—re™e en el gu—dro VFIVF in élD fp;v1,v2 es elv—lor de un— F de v1 y v2 gr—dos de li˜ert—d5 t—l que P [F < fp;v1,v2 ] = pF€—r— pr—™ti™—r so˜re el ™ontr—steD ™onsideremos que se h—n re—liz—do PH medi™iones de l— durez— en l— es™—l—†i™kers de —™ero ™on —lto ™ontenido en ™romo y otr—s PH medi™iones independientes de l— durez— de un—sold—dur— produ™id— so˜re ese met—lF v—s desvi—™iones estánd—r de l—s muestr—s de durez— del met—l y dedurez— de l— sold—dur— so˜re éste fue de IPFHTµHV y IIFRIµHV D respe™tiv—menteF €odemos suponer quel—s durez—s ™orresponden — v—ri—˜les norm—les e independientesF ¾€odemos ™on™luir que l— durez— del met—l˜ási™o es más v—ri—˜le que l— durez— medid— en l— sold—dur—c†—mos — ll—m—r — l— durez— so˜re el —™eroD XD y — l— durez— so˜re l— sold—dur—D Y F ƒe nos pide que ™ontr—stemosH0 : σX2 = σY2 frente — l— —ltern—tiv— H1 : σX2 > σY2 oD equiv—lentementeD H1 : σX2 > 1F ƒe tr—t—D por t—ntoD de σY2un— prue˜— unil—ter—l — l— dere™h—F il est—dísti™o de ™ontr—ste es 12.062 f = 11.412 = 1.1172.†—mos — tom—r un nivel de signi(™—™ión de α = 0.05F v— región ™ríti™— viene delimit—d— por el v—lor f0.95;19,19 =2.168F h—do que f = 1.1172 < f0.95;19,19 = 2.168D no podemos ™on™luir —l nivel de signi(™—™ión α = 0.05 quel— durez— del met—l ˜ási™o se— más v—ri—˜le que l— durez— medid— en l— sold—dur—Fil pEv—lorD por su p—rteD es p = P [F19,19 > 1.1172] = 0.4058F8.11. Contraste para las medias de más de dos poblaciones inde- pendientes. ANOVAin —lgun—s de l—s se™™iones —nteriores hemos ™onseguido ™ontr—stes de hipótesis p—r— v—lor—r si existen diferenE™i—s signi(™—tiv—s entre dos grupos independientesF vo que nos pl—nte—mos —quí es extender estos ™ontr—stesp—r— poder ™omp—r—r no sólo dos sino tres o más gruposF ƒe d— por he™hoD por t—ntoD que existe un factorque sep—r— los v—lores de l— v—ri—˜le en v—rios grupos @dos o másAFgon™ret—menteD supong—mos m muestr—s independientes un—s de otr—sD ™—d— un— de ell—s ™on un t—m—ñoni6F ƒupong—mos t—m˜ién que ™—d— un— de l—s muestr—s provienen de po˜l—™iones ™on distri˜u™ión norm—l5De cara al uso de las tablas hay una propiedad bastante útil: fp;v1,v2 = 1/f1−p;v2,v16No es necesario, aunque sí deseable, que todas las muestras tengan el mismo tamaño.168 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosde medi—s µi y v—ri—nz—s tod—s igu—lesD σ2Fvo que pl—nte—mos es ™ontr—st—r H0 : µ1 = ... = µmfrente — H1 : no tod—s l—s medi—s son igu—lesFy˜sérvese que l— —ltern—tiv— no di™e que todas las medias sean distintas sino t—n sólo que —l menos dos deell—s se—n diferentesFhenotemos por xi1, ..., xni i — l— muestr— i−ésim—D y x¯i y s2i,ni−1 — su medi— y su v—ri—nz— muestr—lD ™oni = 1, ..., mFiste ™ontr—ste se denomin— exy†e ™omo —™rónimo de Analysis of VarianceD y— queD ™omo v—mos — verD se˜—s— en —n—liz—r — qué se de˜e l— v—ri—˜ilid—d tot—l que present—n los d—tosD si —l —z—r o — l—s diferen™i—s entrel—s po˜l—™iones de l—s que pro™eden l—s muestr—sFƒupong—mos que juntamos tod—s l—s muestr—sD o˜teniendo un— úni™— muestr— glo˜—l de t—m—ño m N = ni, i=1y ™—l™ul—mos su medi—D m ni i=1 j=1 x¯ = xji . Nehor—D v—mos — pregunt—rnos por l—s fuentes de variación de los datosXIF in primer lug—rD los d—tos v—rí—n glo˜—lmente respe™to — l— medi— tot—lF …n— medid— de est— v—ri—™ión es l— suma de los cuadrados totalesD m ni xij − x¯ 2 . SCT = i=1 j=1PF €or otro l—doD puede h—˜er diferen™i—s entre l—s medi—s de ™—d— grupo y l— medi— tot—lF €odemos medir est—s diferen™i—s ™on l— suma de los cuadrados entre-gruposX m SCE = ni (x¯i − x¯)2 . i=1 ƒi l— hipótesis nul— fuer— ™iert—D sólo h—˜rí— pequeñ—s diferen™i—s muestrales entre l—s medi—s de ™—d— muestr—D en ™uyo ™—soD l— SCE serí— pequeñ—F ƒi fuer— f—ls—D h—˜rí— mu™h—s diferen™i—s entre l—s medi—s y ™on respe™to — l— medi— tot—lD en ™uyo ™—so SCE serí— gr—ndeFQF €or últimoD de˜ido — l— v—ri—˜ilid—d inherente — tod— muestr—D los d—tos de ™—d— muestr— v—n — v—E ri—r respe™to — su medi— p—rti™ul—rF gomo medid— de est— v—ri—™ión ™onsider—mos l— suma de los cuadrados dentro de los grupos o intra-grupos: m ni xij − x¯i 2 = m SCD = (ni − 1) s2i,ni−1. i=1 j=1 i=1Prof. Dr. Antonio José Sáez Castillo 169

Dpto de Estadística e I.O. Universidad de Jaénv— ™l—ve en est—s ™onsider—™iones lo ™onstituye l— siguiente igu—ld—dD ™ono™id— ™omo teorema de particiónde la varianzaX SCT = SCE + SCD.„eniendo en ™uent— este result—doD el exy†e ™onsiste en ver si SCE es signi(™—tiv—mente gr—nde respe™tode SCDF €—r— ello ˜—st— ™onsider—r queD suponiendo que l— hipótesis nul— es ™iert—X SCT sigue un— χ2 ™on N − 1 gr—dos de li˜ert—dF σ2 SCE sigue un— χ2 ™on m−1 gr—dos de li˜ert—dF σ2 SCD sigue un— χ2 ™on N −m gr—dos de li˜ert—dF σ2esíD el est—dísti™o de ™ontr—ste del test es SCE F= m−1 , SCD N −mqueD suponiendo que l— hipótesis nul— es ™iert—D sigue un— F de ƒnede™or ™on m − 1 y N − m gr—dos deli˜ert—dF€or lo t—ntoD el test podemos resumirlo de l— siguiente form—XIF g—l™ul—mos x¯ = m ni xij y ™on ell— i=1 j=1 N mm SCE = ni (x¯i − x¯)2 = nix¯i2 − N x¯2. i=1 i=1PF g—l™ul—mos m ni m SCD = xij − x¯i 2 = (ni − 1) si2,ni−1. i=1 j=1 i=1QF g—l™ul—mos el est—dísti™o del testX SCE F= m−1 . SCD N −mRF „om—mos l— de™isiónX aA ƒi F ≤ Fm−1,N−m;1−αD no re™h—z—mos l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un nivel de signi(™—™ión αF bA ƒi F > Fm−1,N−m;1−αD re™h—z—mos l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un nivel de signi(™—™ión αFEjemplo. in un experimento se prep—r—ron )ujos de sold—dur— ™on R ™omposi™iones quími™—s diferentesFƒe hi™ieron S sold—dur—s ™on ™—d— ™omposi™ión so˜re l— mism— ˜—se de —™eroD midiendo l— durez— en l—es™—l— de frinellF il gu—dro VFIW siguiente resume los result—dosF†—mos — ™ontr—st—r si existen diferen™i—s signi(™—tiv—s entre l—s durez—sD suponiendo que est—s siguendistri˜u™iones norm—les tod—s ell—s ™on l— mism— v—ri—nz—F170 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros gomposi™ión wedi— muestr—l hesvi—™ión típi™— muestr—l e PSQFV WFUSUH f PTQFP SFRHQU g PUIFH VFUIUV h PTPFH UFRRWV gu—dro VFIWX h—tos del ejemplo de exy†ein primer lug—rD o˜servemos que los t—m—ños muestr—les son igu—lesX n1 = ... = n4 = 5F€or otr— p—rteD tenemosX 5 × 253.8 + 5 × 263.2 + 5 × 271.0 + 5 × 262.0 x¯ = = 262.5 20 SCE = 5 × (253.8 − 262.5)2 + ... + 5 × (262.0 − 262.5)2 = 743.4 SCD = (5 − 1) 9.75702 + ... + (5 − 1) 7.44982 = 1023.6.€or t—ntoD 743.4 F = 4−1 = 3.8734. 1023.6 20−4€or su p—rteD el v—lor de F3,16;0.95 es QFPQVWD de m—ner— que podemos —(rm—r que existen diferen™i—ssigni(™—tiv—s entre l—s durez—s de los R ™ompuestosD ™on un WS 7 de ™on(—nz—F8.12. El problemas de las pruebas múltiples. Método de Bonferroni¾ué o™urre si en un estudio tenemos que re—liz—r más de un— prue˜— de hipótesisc g—d— prue˜— llev— ™onsigoun determin—do nivel de ™on(—nz— yD por t—ntoD un— pro˜—˜ilid—d de equivo™—rnos re™h—z—ndo un— hipótesisnul— que es ™iert— @error tipo sAF gu—nt—s más prue˜—s h—g—mosD más pro˜—˜ilid—des tenemos de ™ometer unerror en l— de™isión re™h—z—ndo un— hipótesis nul— ™iert— oD di™ho de otr— form—D menor ™on(—nz— tendremosFil método de fonferroni es uno de los métodos más simples p—r— tr—t—r de ™orregir este pro˜lem— —so™i—do— l—s prue˜—s múltiplesF ƒe tr—t— de ™orregir los pEv—lores de tod—s l—s prue˜—s que se estén re—liz—ndosimultáne—menteD multipli™ándolos por el nº tot—l de prue˜—sD —ntes de tom—r l— de™isiónF Ejemplo. in fiologí— wole™ul—r se estudi— l— rel—™ión que puede tener el nivel de expresión de un gen ™on l— posi˜ilid—d de p—de™er un tipo de ™án™erF …n investig—dor ™onsigue —n—liz—r el nivel de expresión de IH genes en un— muestr— de p—™ientes y re—liz— IH ™ontr—stes de hipótesis donde l— hipótesis —ltern—tiv— de ™—d— uno de ellos di™e que un gen está rel—™ion—do ™on l— posi˜ilid—d de p—de™er ese ™án™erF vos pEv—lores o˜tenidos son los siguientesX (0.1, 0.01, 0.21, 0.06, 0.32, 0.24, 0.45, 0.7, 0.08, 0.0003)Prof. Dr. Antonio José Sáez Castillo 171

Dpto de Estadística e I.O. Universidad de Jaénin prin™ipioD tendrí—mos eviden™i—s de que el Pº y el último gen están signi(™—tiv—mente rel—™ion—dos ™onese tipo de ™án™erF ƒin em˜—rgoD de˜emos ™orregir el efe™to de l— re—liz—™ión de l—s IH prue˜—s simultáne—sFepli™—ndo el método de fonferroniD de˜emos multipli™—r por IH los pEv—loresF in ese ™—soD el segundogen y— no puede ser ™onsider—do est—dísti™—mente signi(™—tivo p—r— el riesgo de p—de™er el ™án™er (0.01 ×10 > 0.05)Y por el ™ontr—rioD d—do que 0.0003 × 10 < 0.05D el último gen sigue siendo ™onsider—dosigni(™—tiv—mente rel—™ion—do ™on el ™án™erF8.13. Resolución del ejemplo del del diámetro de los cojinetes‚e™ordemos el pl—nte—mientoX Un ingeniero industrial es responsable de la producción de cojinetes de bolas ytiene dos máquinas distintas para ello. Le interesa que los cojinetes producidos tengan diámetros similares,independientemente de la máquina que los produce, pero tiene sospechas de que está produciendo algún pro-blema de falta de calibración entre ellas. Para analizar esta cuestión, extrae una muestra de 120 cojinetes quese fabricaron en la máquina A, y encuentra que la media del diámetro es de 5.068 mm y que su desviaciónestándar es de 0.011 mm. Realiza el mismo experimento con la máquina B sobre 65 cojinetes y encuentra quela media y la desviación estándar son, respectivamente, 5.072 mm y 0.007 mm. ¾Puede el ingeniero concluirque los cojinetes producidos por las máquinas tienen diámetros medios signicativamente diferentes?in este ™—soD —fortun—d—mente tenemos un t—m—ño muestr—l que v— — permitir o˜vi—r l— hipótesis de norm—liEd—dF †emos que se pl—nte— un supuesto que puede ser —n—liz—do — tr—vés de l— medi—D en ™on™retoD ™omp—r—ndol— medi— de —m˜—s máquin—sF ƒi ll—m—mos X —l diámetro de l— máquin— e e Y —l diámetro de l— máquin—fD tenemos que ™ontr—st—r H0 : µX = µY frente — H1 : µX = µY Fil est—dísti™o de ™ontr—ste es z = 5.068 − 5.072 = −3.013. 0.0112 + 0.0072 120 65il pEv—lor —so™i—do es 2 × P [Z < −3.361] = 0.002D luego tenemos eviden™i—s de queD en efe™toD el diámetromedio de —m˜—s máquin—s es distintoF172 Prof. Dr. Antonio José Sáez Castillo

Capítulo 9Contrastes de hipótesis no paramétricas „odos —prendemos de l— experien™i—D y l— le™™ión en est— o™—sión es que nun™— se de˜e perder de vist— l— —ltern—tiv—F ƒherlo™k rolmes @eF gF hoyleAD en v—s eventur—s de fl—™k €eterResumen. gontinu—ndo ™on los ™ontr—ste de hipótesisD present—mos en este ™—pítulo nuevos ™ontr—stes quepermitirán de™idir si un —juste medi—nte un— distri˜u™ión teóri™— es válido y v—lor—r si existe rel—™ión entrev—ri—˜les ™u—lit—tiv—sFPalabras clave: ˜ond—d de —justeD test χ2 de ˜ond—d de —justeD test de ˜ond—d de —juste de uolmogorovEƒmirno'D test χ2 de independen™i—F9.1. Introducción„odos los ™ontr—stes que hemos des™rito en el ™—pítulo —nterior se ˜—s—nD dire™t— o indire™t—mente @— tr—vésdel teorem— ™entr—l del límiteA en que los d—tos se —just—n — l— distri˜u™ión norm—lD h—™iendo inferen™i— deun— u otr— form— so˜re sus p—rámetrosF in este ™—pítulo v—mos — ™onsider—r ™ontr—stes que no ne™esit—nde t—l hipótesisD por lo que no se enun™i—n ™omo ™ontr—stes so˜re —lgún p—rámetro des™ono™idoX de —hí queformen p—rte de los ll—m—dos contrastes no paramétricos o contrastes de hipótesis no paramétricasF9.2. Contrastes de bondad de ajusteqr—™i—s — lo estudi—do en el —p—rt—do ™orrespondiente — l— estim—™ión puntu—l de p—rámetros —hor— somos™—p—™es de —just—r un— distri˜u™ión — unos d—tos medi—nte —lgún método de estim—™ión @momentosD máxim—verosimilitudD FFFAF ƒin em˜—rgoD h—st— —hor— no disponemos de ningun— herr—mient— ™—p—z de juzgar si ese—juste es ˜ueno o m—loD o ™ómo de ˜ueno esF he he™hoD en l— rel—™ión de pro˜lem—s ™orrespondiente dej—mos—˜iert— est— ™uestiónD y— que sólo pudimos v—lor—r est— bondad del ajuste medi—nte represent—™iones grá(™—sDlo que sólo nos dio un— visión p—r™i—l del pro˜lem—D que puede ser muy su˜jetiv—Fvos dos ™ontr—stes de hipótesis que v—mos — des™ri˜ir —hor— v—n — permitir ™ontr—st—r ™omo hipótesis nul— H0 : l— distri˜u™ión se —just— —de™u—d—mente — los d—tosD IUQ

Dpto de Estadística e I.O. Universidad de Jaén ‚esult—do y˜serv—dos isper—dos I IHS IHH P IHU IHH Q VW IHH R IHQ IHH S III IHH T VS IHH THH THH „ot—l gu—dro WFIX pre™uen™i—s o˜serv—d—s y esper—d—s en THH l—nz—mientos del d—doFfrente — l— —ltern—tiv— H1 : l— distri˜u™ión no se —just— —de™u—d—mente — los d—tosDf—™ilit—ndo —demás un pEv—lor que permitiráD —demásD ™omp—r—r l— ˜ond—d de distintos —justesFhe™irD por últimoD que —unque estos dos ™ontr—stes de hipótesis pueden —pli™—rse — ™u—lquier tipo de v—ri—˜lesestán espe™i—lmente indi™—dos p—r— v—ri—˜les de tipo dis™reto o ™u—lit—tivo en el ™—so del primero de ellos @testχ2 de ˜ond—d de —justeA y p—r— v—ri—˜les de tipo ™ontinuo en el segundo @test de uolmogorovEƒmirnovAF9.2.1. Test χ2 de bondad de ajusteEjemplo. ƒupong—mos que un t—hur del wissisipi quiere pro˜—r un d—do p—r— ver si es —de™u—do p—r—jug—r honest—mente ™on élF in ese ™—soD si not—mos por pi — l— pro˜—˜ilid—d de que en el l—nz—miento deld—do resulte el v—lor i = 1, 2, ..., 6D el t—hur quiere pro˜—r l— hipótesis 1 H0 : p1 = ... = p6 = 6frente — l— —ltern—tiv— de H1 que —lgún pi se— distint— de 1 F 6€—r— re—liz—r l— prue˜—D l—nz—rá el d—do THH ve™esD —not—ndo el número de ve™es que se d— ™—d— result—doFist—s ™—ntid—des se denomin—n frecuencias observadasF€or otr— p—rteD si el d—do fuer— justo @hipótesis H0AD en THH l—nz—mientos de˜erí—n d—rse —proxim—d—menteIHH de ™—d— result—do posi˜leF Ést—s fre™uen™i—s se denomin—n frecuencias esperadasFil t—hur tom—rá l— de™isión ™on respe™to —l d—do — p—rtir de l— ™omp—r—™ión de l—s fre™uen™i—s o˜serv—d—sy l—s esper—d—s @ver gu—dro WFIAF ¾ué de™idirí—s tú — l— luz de esos d—tosce ™ontinu—™iónD v—mos — des™ri˜ir el test χ2D que permite re—liz—r prue˜—s de este tipoF gomo hemos ™oment—doen l— introdu™™iónD ™on ell— podremos juzgar —justes de los que hemos logr—do en el ™—pítulo de estim—™iónpuntu—lD pero t—m˜ién podremos utiliz—rl— en ejemplos ™omo el que —™—˜—mos de verD en el que el expertoestá interes—do en ™ontr—st—r d—tos experiment—les ™on respe™to — un— distri˜u™ión teóri™— que le result— deinterésFin primer lug—r y de form— más gener—lD supong—mos que tenemos un— muestr— de t—m—ño N de un— vF—Fdis™ret— o ™u—lit—tiv—D XD —just—d— — un modelo d—do por un— distri˜u™iónF174 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosgonsideremos un— p—rti™ión del ™onjunto de v—lores que puede tom—r l— v—ri—˜leX S1, ..., SrF in prin™ipioDest— p—rti™ión podrí—n ser simplemente todos y ™—d— uno de los v—lores que tom— l— v—ri—˜le XD peroD ™omoveremosD es posi˜le que teng—mos que —grup—r —lgunos de ellosFƒeguid—menteD ™onsideremos l— pro˜—˜ilid—dD según l— distri˜u™ión d—d— por el —juste que queremos ev—lu—rDde ™—d— un— de est—s p—rtesD pi = P [X ∈ Si/H0 ] > 0.he igu—l form—D ™—l™ulemos OiD el número de o˜serv—™iones de l— muestr— que ™—en en ™—d— ™onjunto Si.v— ide— del test es ™omp—r—r el número de o˜serv—™iones Oi que ™—en re—lmente en ™—d— ™onjunto Si ™on elnúmero esper—do de o˜serv—™iones que de˜erí—n ™—er en Si si el —juste es el d—do por nuestro modeloD queserí— N × piF €—r— elloD un— medid— que ™omp—r— est—s dos ™—ntid—des viene d—d— por D = r (Oi − N × pi)2 . i=1 N × piƒiD p—r— un— muestr— d—d—D est— vF—F tom— un v—lor d muy —ltoD indi™— que los v—lores o˜serv—dos no cuadran™on el —juste que hemos propuesto @™on lo ™uál se re™h—z—rí— l— hipótesis nul— en f—vor de l— —ltern—tiv—AYsiD por el ™ontr—rioD tom— un v—lor d ˜—joD indi™— que nuestro —juste ™orresponde ˜ien ™on los d—tos de l—muestr—D por lo que es aceptable l— hipótesis nul—Fil pro˜lem— (n—l es de™idir ™uándo el v—lor de l— vF—F D, dD es lo su(™ientemente —lto ™omo p—r— que nosresulte in—™ept—˜le el —justeF €—r— de™idirlo h—y que tener en ™uent— que ™u—ndo N es r—zon—˜lemente —lto yl— hipótesis H 0 es ™iert—D l— distri˜u™ión de pro˜—˜ilid—d de D es χ2 ™on r − k − 1 gr—dos de li˜ert—dD es de™irD D/H0 N→>> χ2r−k−1,donde k es el número de p—rámetros que h—n sido estim—dos en el —justeF „eniendo en ™uent— este result—doDse ™—l™ul— ˜—jo est— distri˜u™ión l— pro˜—˜ilid—d de que se de un v—lor tod—ví— más —lto que d @el pEv—lorD port—ntoAD p = P [D > d/H0 ] .ƒi est— pro˜—˜ilid—d es inferior —l S 7D se re™h—z— l— hipótesis nul— en f—vor de l— —ltern—tiv— ™on un WS 7 de™on(—nz—F hi™ho de otr— form—D se —™ept— l— hipótesis nul— sólo si el v—lor de D entr— dentro del WS 7 deresult—dos más f—vor—˜les — ell—Fisquemáti™—menteD el pro™eso es el siguienteX IF ƒe enun™i— el testX H0 : los d—tos siguen l— distri˜u™ión d—d— por nuestro —juste H1 : los d—tos no siguen l— distri˜u™ión d—d— por nuestro —justePF ƒi en l— muestr— se d—n los v—lores x1, ..., xmD se ™—l™ul—n l—s fre™uen™i—s esper—d—s según el —juste propuesto de ™—d— v—lor xiD N × P [X = xi]D i = 1, ..., mF ƒi —lgun— de est—s fre™uen™i—s es inferior — SD se —grup— ™on —lgun— de l— más ™er™—n— h—st— que sumen un— fre™uen™i— m—yor o igu—l — SF ƒe ™onstruye —sí l— p—rti™ión del ™onjunto de v—lores posi˜les p—r— XD S1, ...SrD ™uy—s fre™uen™i—s esper—d—sProf. Dr. Antonio José Sáez Castillo 175

Dpto de Estadística e I.O. Universidad de Jaén xi H I P Q R S T pre™F o˜sF RP PV IQ S U Q P gu—dro WFPX pre™uen™i—s o˜serv—d—s en l— muestr— de tiempos entre lleg—d—sF son tod—s m—yores o igu—les — SF in re—lid—dD esto es sólo un— re™omend—™ión que puede rel—j—rseX si —lgun— fre™uen™i— esper—d— es sólo liger—mente inferior — SD no es espe™i—lmente gr—veFQF ƒe ™—l™ul—n l—s fre™uen™i—s o˜serv—d—s de ™—d— SiD y lo not—mos ™omo OiFRF ƒe ™—l™ul— el est—dísti™o del test en l— muestr— d = r (Oi −N × pi)2 . i=1 N × piSF ƒe ™—l™ul— el pEv—lor —so™i—do —l v—lor del est—dísti™oD p = P [D > d/H0 ] , según un— distri˜u™ión χ2 ™on r − k − 1 gr—dos de li˜ert—dFTF ƒe tom— l— de™isión @p—r— un nivel de ™on(—nz— del 95 %AX aA ƒi p < 0.05D se re™h—z— l— hipótesis nul— en f—vor de l— —ltern—tiv—D ™on un 95 % de ™on(—nz—F bA ƒi p ≥ 0.05D se ™on™luye que no h—y eviden™i—s en ™ontr— de —(rm—r que los d—tos se —just—n — l— distri˜u™ión d—d—FEjemplo. vos d—tos que se present—n en el gu—dro WFP ™onstituyen un— muestr— —le—tori— simple deltiempo en msF que tr—ns™urre entre l— lleg—d— de p—quetes tr—nsmitidos por un determin—do proto™oloFin l— t—˜l— —p—re™en los v—lores junto —l número de ve™es que h—n sido o˜serv—dos en l— muestr—Fƒe sospe™h— que un— distri˜u™ión geométri™— puede —just—r ˜ien esos d—tosF †—mos — re—liz—r ese —justey ™ontr—st—r si es —™ept—˜le medi—nte el test de l— ™hiE™u—dr—doFin primer lug—rD p—r— —just—r un— distri˜u™ión geométri™— de˜emos estim—r el p—rámetro de l— mism—F†—mos — h—™erlo de form— sen™ill— por el método de los momentosF il v—lor de l— medi— de l— distri˜u™iónes 6iˆa de donde p = 1 . €or t—ntoD nuestro estim—dor será 1+EX 1 pˆ = . 1 + x¯€or su p—rteD 0 × 42 + 1 × 28 + 2 × 13 + 3 × 5 + 4 × 7 + 5 × 3 + 6 × 2luego 6 x¯ = = 1.24, 100176 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosesí puesD dese—mos ™ontr—st—r en qué medid— el —juste de un— Geo (0.4464) es válido p—r— los d—tos del— muestr—F is de™irD dese—mos ™ontr—st—r H0 : X → Geo (0.4464) frente — l— —ltern—tiv— H1 : XGeo (0.4464) .†—mos — ™—l™ul—r ™uáles son l—s pro˜—˜ilid—des teóri™—s según es— distri˜u™ión de los v—lores o˜serv—dosen l— muestr—X P [X = 0] = 0.4464 × (1 − 0.4464)0 = 0.4464 P [X = 1] = 0.4464 × (1 − 0.4464)1 = 0.2471 P [X = 2] = 0.4464 × (1 − 0.4464)2 = 0.1368 P [X = 3] = 0.4464 × (1 − 0.4464)3 = 0.0757 P [X = 4] = 0.4464 × (1 − 0.4464)4 = 0.0419 P [X = 5] = 0.4464 × (1 − 0.4464)5 = 0.0232 P [X = 6] = 0.4464 × (1 − 0.4464)6 = 0.0128P [X > 6] = 1 − (0.4464 + 0.2471 + 0.1368 + 0.0757 + 0.0419 + 0.0232 + 0.0128) = 0.0159ehor— tenemos que ™onstruir l— p—rti™ión de los v—lores de l— v—ri—˜le queD ™omo s—˜emosD son HDIDFFF r—yque tener en ™uent— que de˜emos pro™ur—r que l—s fre™uen™i—s esper—d—s se—n superiores o igu—les — SFgomo h—y IHH o˜serv—™ionesD será ne™es—rio —grup—r los v—lores R en —del—nte en un solo ™onjuntoF †—mos— resumir este pl—nte—miento en el gu—dro WFQ dondeD —demásD —p—re™en los residuos —l ™u—dr—do entrel—s fre™uen™i—s o˜serv—d—s y esper—d—sD ne™es—rios p—r— ™—l™ul—r el est—dísti™o del testFil v—lor de éste se ™—l™ul— — p—rtir de los result—dos de l— t—˜l— de l— siguiente m—ner—X 6.9696 0.0841 0.4624 6.6049 6.8644 d = + + + + = 1.7973. 44.64 27.71 13.68 7.57 9.38pin—lmenteD el pEv—lor se ™—l™ul— ™omo P [D > 1.7973] , donde D sigue un— χ25−1−1D es de™irD un— Gammade p—rámetros (5 − 1 − 1)/2 y 1/2F €or t—ntoD ˆ∞ 1 1 x 3 −1 e− 1 x 2 Γ 2 2 3 p − valor = 2 2 dx = 0.61552. 1.7973el ser superior @muy superiorD de he™hoA — HFHSD podemos —(rm—r que no h—y eviden™i—s en los d—tos del— muestr— en ™ontr— de que éstos sig—n un— distri˜u™ión Geo (0.4464)FProf. Dr. Antonio José Sáez Castillo 177

Dpto de Estadística e I.O. Universidad de Jaén xi Oi N × pi (Oi − N × pi)2 0 42 44.64 (42 − 44.64)2 = 6.969 6 1 28 27.71 (28 − 27.71)2 = 0 .0841 2 13 13.68 (13 − 13.68)2 = 0.462 4 3 5 7.57 (5 − 7.57)2 = 6.604 9 ≥ 4 12 9.38 (12 − 9.38)2 = 6.864 4 gu—dro WFQX pre™uen™i—s o˜serv—d—sD fre™uen™i—s esper—d—s y residuosF9.2.2. Test de Kolmogorov-Smirnoin este ™—so el test es —pli™—˜le so˜re todo — v—ri—˜les de tipo ™ontinuoF ƒe ˜—s— en l— ™omp—r—™ión de l—fun™ión de distri˜u™ión teóri™— propuest— por el modelo ™uyo —juste est—mos ev—lu—ndo ™on l— fun™ión dedistri˜u™ión empíri™— de los d—tosFgon™ret—menteD si tenemos X1, ..., XN un— muestr— de un— vF—F XD si not—mos por F (x) — l— fun™ión dedistri˜u™ión del modelo propuesto y por SN (x) — l— fun™ión de distri˜u™ión empíri™— —so™i—d— — l— muestr—Del est—dísti™o que se utiliz— p—r— este ™ontr—ste viene d—do por DN = Sup |F (x) − SN (x)| . xe l— hor— de ™—l™ul—r este máximo de˜emos tener en ™uent— que l— v—ri—˜le x es de tipo ™ontinuoFv— hipótesis nul— — ™ontr—st—r es H0 : los d—tos de l— muestr— se —just—n — l— distri˜u™ión d—d— por F (x) ,frente — l— hipótesis —ltern—tiv— H1 : los d—tos de l— muestr— no se —just—n — l— distri˜u™ión d—d— por F (x) .ƒe re™h—z—rá l— hipótesis nul— en f—vor de l— —ltern—tiv— ™u—ndo el pEv—lor —so™i—do —l v—lor que tome DN se—inferior — HFHSFisquemáti™—menteD el pro™eso en el des—rrollo del test puede resumirse en los siguientes p—sosXIF yrden—mos los v—lores de l— muestr— de menor — m—yorX x(1), ..., x(N).PF gonstruimos l— fun™ión de distri˜u™ión empíri™—D que en ™—d— v—lor de l— muestr— viene d—do por SN x(i) = i F NQF il v—lor del est—dísti™o se ™—l™ul— ™omo dN = ma´x m´ax F x(i) − SN x(i) , F x(i) − SN x(i−1) . 1≤i≤NRF ƒe re™h—z—rá l— hipótesis nul— en f—vor de l— —ltern—tiv— si p = P [DN > dN ] < 0.05D ™on un (1 − p) × 100 % de ™on(—nz—Fv— distri˜u™ión de pro˜—˜ilid—d de DN D ne™es—ri— p—r— ™—l™ul—r el pEv—lorD no es muy ™ono™id—F edemásDp—r— ev—lu—r est— pro˜—˜ilid—d h—y que tener en ™uent— el número de p—rámetros de l— distri˜u™ión en el178 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros—justeF …n— metodologí— —de™u—d— p—r— ello es ™ono™id— ™omo wétodos de wonte g—rloD —unque ex™ede los™ontenidos de estos —puntesF he˜o —dvertir que mu™hos de los p—quetes est—dísti™os más h—˜itu—les puedenindu™ir — error en el ™ál™ulo de este pEv—lorD y— que propor™ion—n por defe™to —quél ™orrespondiente — un—juste en el que no se estime ningún p—rámetro en l— distri˜u™ión ˜—jo l— hipótesis nul—D d—ndo lug—r — un—so˜reestim—™ión de di™ho pEv—lorF IFRTRU HFRWWS HFUPIT HFIISI HFPUIU HFUVRP QFWVWV HFIWTU HFVIHQ HFRVSR HFPQQQ HFHVIR HFQHQS IFUQSV HFWHPI HFHTTU HFHVTV HFVWHW HFIIPR HFHSIP gu—dro WFRX h—tos de l— muestr—FEjemplo. vos d—tos que —p—re™en en el gu—dro WFR ™orresponden —l tiempo en se™F entre ™onexiones —un servidorF xos pl—nte—mos si un— distri˜u™ión exponen™i—l es —de™u—d— p—r— su —justeFin primer lug—r hemos de de™idir ™uál es el —juste propuestoF il estim—dor máximo verosímil del p—ráEmetro λ de un— exponen™i—l ™oin™ide ™on el estim—dor del método de los momentosD λˆ = 1 F in este m1™—soD λˆ = 1/0.6902 = 1. 448 9.€—r— ™—l™ul—r el v—lor del est—dísti™o del ™ontr—steD de˜emos ev—lu—r l— fun™ión de distri˜u™ión de un—exp (1.4489)D F (x) = 1 − e−1.4489x, x ≥ 0™on l— fun™ión de distri˜u™ión empíri™—F il gu—dro WFS muestr— —m˜—s fun™iones de distri˜u™iónF he ell—se dedu™e que el v—lor del est—dísti™o de ™ontr—ste es 0.172 72F il pEv—lor —so™i—do @™—l™ul—do por wétodosde wonte g—rlo ™on ‚A tom— el v—lor P [D20 > 0.172 72] = 0.5707.€or t—ntoD no h—y en los d—tos eviden™i— en ™ontr— de —sumir que siguen un— distri˜u™ión exp (1.4489)Fv— pigur— WFI muestr— en un— vertiente grá(™— l— ˜ond—d del —juste y el punto donde se —l™—nz— l—dist—n™i— máxim— entre l—s fun™ión de distri˜u™ión teóri™— y empíri™—F x(i) F x(i) i i−1 x(i) F x(i) i i−1 20 20 0.50505 20 20 0.51506 0.0512 7.1499 × 10−2 0.05 0 0.4854 0.55 0.5 0.0667 9.2119 × 10−2 0.1 0.05 0.4995 0.6 0.55 0.0814 0.11125 0.15 0.1 0.7216 0.64849 0.65 0.6 0.0868 0.11818 0.2 0.15 0.7842 0.67897 0.7 0.65 0.1124 0.15029 0.25 0.2 0.8103 0.69089 0.75 0.7 0.1151 0.1536 0.3 0.25 0.8909 0.72496 0.8 0.75 0.1967 0.24798 0.25 0.3 0.9021 0.72938 0.85 0.8 0.2333 0.28682 0.4 0.35 1.4647 0.88023 0.9 0.85 0.2717 0.32542 0.45 0.4 1.7358 0.91914 0.95 0.9 0.3035 0.3558 0.5 0.45 3.9898 0.99691 1 0.95 gu—dro WFSX „—˜l— —so™i—d— —l „est de uolmogorovEƒmirnovFProf. Dr. Antonio José Sáez Castillo 179

Dpto de Estadística e I.O. Universidad de Jaén 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 3.5 4pigur— WFIX pun™iones de distri˜u™ión teóri™— y empíri™—F †—lor donde se d— el est—dísti™o de uolmogorovEƒmirnofF9.3. Contraste de independencia χ2ƒi nos d—mos ™uent—D desde el ™—pítulo de est—dísti™— des™riptiv— nos hemos ™entr—do ex™lusiv—mente env—ri—˜les de tipo ™u—ntit—tivoFƒin em˜—rgoD en numeros—s o™—siones el o˜jeto de estudio viene determin—doD no por un— ™—ntid—dD sinopor un— ™u—lid—d o un est—do no ™u—nti(™—˜leF is por ello que v—mos — ™onsider—r un ™ontr—ste rel—tivo —v—ri—˜les de tipo ™u—lit—tivoD ™on™ret—menteD p—r— v—lor—r si dos de est—s v—ri—˜les están o no signi(™—tiv—menterel—™ion—d—sF Ejemplo. ¾istá rel—™ion—d— l— ideologí— políti™— ™on el género del vot—ntec is de™irD nos pl—nte—mos si el que un— person— se de™l—re de izquierd—s o de dere™h—s depende de si es v—rón o mujerF ixisten dos v—ri—˜les ™u—lit—tiv—s o ™—r—™terísti™—s que dividen — l— po˜l—™iónF vo que nos interes— es si es— división está o no rel—™ion—d—F ¾ƒerán más ™onserv—dor—s l—s mujerescgonsideremos en gener—l un— po˜l—™ión en l— que ™—d— individuo se ™l—si(™— de —™uerdo ™on dos ™—r—™terísti™—sDdesign—d—s ™omo X e Y F ƒupong—mos que los posi˜les v—lores de X son x1, ..., xr y los posi˜les v—lores de Yson y1, ..., ysFhenotemos por pij — l— propor™ión de individuos de l— po˜l—™ión ™uy—s ™—r—™terísti™—s son simultáne—mentexi e yjF henotemos —demásD ™omo pi. — l— propor™ión de individuos ™on ™—r—™terísti™— xi y p.j — l— propor™iónde individuos ™on ™—r—™terísti™— yjF in términos de pro˜—˜ilid—desD tendremos que si se elige un individuo —l—z—rD P [X = xi, Y = yj] = pij180 s P [X = xi] = pi. = pij j=1 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros r P [Y = yj] = p.j = pij. i=1vo que pretendemos ™ontr—st—r es si l—s dos ™—r—™terísti™—s son independientesD es de™irD si p—r— todo i y p—r—todo jD P [X = xi, Y = yj] = P [X = xi] × P [Y = yj] ,es de™irD si pij = pi. × p.j .esí puesD podemos enun™i—r el ™ontr—ste ™omo H0 : pij = pi. × p.j p—r— todo i = 1, ..., r; j = 1, ..., sfrente — H1 : pij = pi. × p.j p—r— —lgún v—lor de i y jF€—r— llev—r — ™—˜o el ™ontr—ste tom—remos un— muestr— de l— po˜l—™ión de t—m—ño nF henotemos por nij losindividuos de es— muestr— que tom—n simultáne—mente el v—lor xi y el v—lor yj @frecuencias observadasA,ni. = s nij los individuos de l— muestr— que tom—n el v—lor xi y n.j = r nij los que tom—n el v—lor j=1 i=1yj .he est— form—D nij n pˆij =será un estim—dor ˜—s—do en l— muestr— de pijD pˆi. = ni. nserá un estim—dor ˜—s—do en l— muestr— de pi. y pˆ.j = n.j nserá un estim—dor ˜—s—do en l— muestr— de p.j.€or otr— p—rteD si l— hipótesis nul— fuer— ™iert—D el número de individuos en l— muestr—D de t—m—ño nD quetom—n simultáne—mente los v—lores xi y yj serí— eij = n × pi. × p.j .f—s—do en l— muestr—D los v—lores eˆij = n × pˆi. × pˆ.j = ni. × n.j n@frecuencias esperadasA serí—n sus estim—doresFpin—lmenteD el est—dísti™o del ™ontr—ste se ˜—s— en ™omp—r—r los v—lores re—les en l— muestr— de nij ™onlos v—lores eˆij que se d—rí—n si l— hipótesis nul— fuer— ™iert—D es de™irD si l—s ™—r—™terísti™—s X e Y fuer—nProf. Dr. Antonio José Sáez Castillo 181

Dpto de Estadística e I.O. Universidad de JaénindependientesF il v—lor del est—dísti™o es r s (nij − eˆij )2 . eˆij d= i=1 j=1ƒuponiendo que l— hipótesis nul— es ™iert—D l— distri˜u™ión del est—dísti™o del ™ontr—ste es χ2 ™on (r − 1) (s − 1)gr—dos de li˜ert—dD por lo que de™idiremos en fun™ión del pEv—lor —so™i—doD p = P [D > d/H0 ] ,donde D → χ(2r−1)(s−1) o ˜ienX ‚e™h—z—remos H0 ™on nivel de signi(™—™ión α si d > χ(2r−1)(s−1);1−α. xo re™h—z—remos H0 ™on nivel de signi(™—™ión α si d < χ(2r−1)(s−1);1−α.r—y que h—™er un— últim— o˜serv—™iónX p—r— que en efe™to D → χ2 ™on (r − 1) (s − 1) es ne™es—rio que tod—s@o ™—si tod—sA l—s fre™uen™i—s esper—d—s eˆij se—n m—yores o igu—les — SF ƒi —lgun— o —lgun—s de ell—s no losonD l— distri˜u™ión χ2 podrí— no ser —de™u—d— y el result—do del test in™orre™toF €—r— que esto no o™urr— esre™omend—˜le que el t—m—ño de l— muestr— se— gr—ndeFEjemplo. ƒe tom— un— muestr— de QHH person—sD preguntándoles si se ™onsider—n más de dere™h—sD másde izquierd—s o de ™entro y —not—ndo su géneroF il result—do se resume en l— siguiente t—˜l—X wujeres szquierd— here™h— gentro „ot—l rom˜res TV ST QP IST SP UP PH IRR „ot—l IPH IPV SP QHHiste tipo de t—˜l—s se ™ono™en ™omo tablas de contingenciaF gontiene los v—lores que hemos not—donij yD en los márgenes inferior y l—ter—l dere™hoD los v—lores ni. y n.j.†—mos — ver si el género está rel—™ion—do ™on l— ideologí—F ƒi no fuer— —síD si l— ideologí— fuer— independientedel géneroD se tendrí— en un— muestr— de QHH individuos l—s fre™uen™i—s esper—d—s serí—n szquierd— here™h— gentro „ot—l IST wujeres 300 156 120 300 156 128 300 156 52 IRR rom˜res 300 300 300 300 300 300 QHH „ot—l 300 144 120 300 144 128 300 144 52 300 300 300 300 300 300 IPH IPV SP wujeres szquierd— here™h— gentro „ot—l rom˜res TPFRH TTFST PUFHR IST SUFTH TIFRR PRFWT „ot—l IPH IPV . SP IRR QHH182 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosil v—lor del est—dísti™o de ™ontr—ste esD por t—ntoD (68 − 62.40)2 (56 − 66.56)2 (32 − 27.04)2 D= + + + 62.40 66.56 27.04 (52 − 57.60)2 (72 − 61.44)2 (20 − 24.96)2 + + + = 6.433. 57.60 61.44 24.96€or su p—rteD χ2(2−1)(3−1);0.95 = 5.991D de m—ner— que podemos re™h—z—r l— hipótesis nul— en f—vor de l——ltern—tiv—D —(rm—ndo ™on un WS 7 de ™on(—nz— que el genero está rel—™ion—do ™on l— ideologí—F ¾in quésentido lo est—rác ƒi nos ™entr—mos sólo en los de izquierd—sD tenemos que el por™ent—je de hom˜res y mujeres es de 68 × 100 % = 56.667 % y de 52 × 100 % = 43.333 %D respe™tiv—menteF 120 120 ƒi nos ™entr—mos sólo en los de dere™h—sD tenemos que el por™ent—je de hom˜res y mujeres es de 56 × 100 % = 43.75 % y de 72 × 100 % = 56.25 %D respe™tiv—menteF 128 128 pin—lmenteD si nos ™entr—mos sólo en los de ™entroD tenemos que el por™ent—je de hom˜res y mujeres es de 32 × 100 = 61.538 % y de 20 × 100 = 38.462 %D respe™tiv—menteF 52 52vo que p—re™e que o™urre es que l—s mujeres tienen m—yor preferen™i— por l— dere™h—F ƒin em˜—rgoD est——(rm—™ión no se h— ™ontr—st—doD sino que se ˜—s— simplemente en d—tos des™riptivos1F9.4. Resolución del ejemplo de los accidentes laborales‚edordemos el pl—nte—mientoX En una empresa se sospecha que hay franjas horarias donde los accidenteslaborales son más frecuentes. Para estudiar este fenómeno, contabilizan los accidentes laborales que sufrenlos trabajadores según franjas horarias, durante un año. Los resultados aparecen en la tabla. ror—s del dí— xúmero de —™™identes VEIH hF RU IHEIP hF SP IQEIS hF SU ISEIU hF TQCon esa información, los responsables de seguridad de la empresa deben decidir si hay franjas horarias dondelos accidentes son más probables o si, por el contrario, éstos ocurren absolutamente al azar.in primer lug—r de˜emos pl—nte—rnos l— hipótesis que queremos ™ontr—st—rF il he™ho de que o™urr—n los—™™identes —˜solut—mente —l —z—r vendrí— — de™ir que l— pro˜—˜ilid—d de o™urren™i— es l— mism— en ™—d— fr—nj—hor—ri— @puesto que tod—s ell—s tienen l— mism— —mplitudAF €or elloD si not—mos pi — l— pro˜—˜ilid—d de queo™urr— un —™™idente en l— iEésim— fr—nj— hor—ri—D nos pl—nte—mos ™omo hipótesis nul— H0 : p1 = ... = p4 = 1 4frente — l— —ltern—tiv— de que no tod—s l—s pro˜—˜ilid—des se—n igu—lesF€—r— re—liz—r el ™ontr—ste podemos ™onsider—r un ™ontr—ste de ˜ond—d de —juste en el que l— distri˜u™ión depro˜—˜ilid—d se— un— uniforme dis™ret—D que no tiene p—rámetrosFProf. Dr. Antonio José Sáez Castillo 183

Dpto de Estadística e I.O. Universidad de Jaénin este ™—soD el est—dísti™o de ™ontr—ste es muy sen™illoXχ2 = (47 − 219 × (1/4))2 + (52 − 219 × (1/4))2 + (57 − 219 × (1/4))2 + (63 − 219 × (1/4))2 = 2.571. 219 × (1/4) 219 × (1/4) 219 × (1/4) 219 × (1/4)€or su p—rteD el pEv—lor es p = P [χ24−0−1 > 2.571] = 0.462D por lo que no tenemos eviden™i—s en estos d—tosque h—g—n pens—r en que h—y fr—nj—s hor—ri—s más propi™i—s — los —™™identesF184 Prof. Dr. Antonio José Sáez Castillo

Capítulo 10Regresión lineal simple …n políti™o de˜e ser ™—p—z de prede™ir lo que p—s—rá m—ñ—n—D y l— sem—n—D el mes y el —ño próximosF ‰ t—m˜ién de˜e ser ™—p—z de expli™—r por qué no —™ertóF ‡inston ghur™hillResumen. in este ™—pítulo se des™ri˜e el modelo de regresión line—l simpleD que —sume que entre dos v—ri—˜lesd—d—s existe un— rel—™ión de tipo line—l ™ont—min—d— por un error —le—torioF eprenderemos — estim—r di™homodelo yD — p—rtir de est—s estim—™iones y ˜—jo determin—d—s hipótesisD podremos extr—er predi™™iones delmodelo e inferir l— fort—lez— de di™h— rel—™ión line—lFPalabras clave: regresión line—l simpleD v—ri—˜le dependienteD v—ri—˜le independienteD error —le—torioD nu˜ede puntosD prin™ipio de mínimos ™u—dr—dosD ™oe(™iente de ™orrel—™ión line—lD ™oe(™iente de determin—™iónline—lD ˜ond—d del —justeD predi™™iónD estim—™iónF10.1. Introducción…no de los —spe™tos más relev—ntes que —˜ord— l— ist—dísti™— se re(ere —l —nálisis de l—s rel—™iones que se d—nentre dos v—ri—˜les —le—tori—sF il —nálisis de est—s rel—™iones está muy fre™uentemente lig—do —l —nálisis deun— v—ri—˜leD ll—m—d— variable dependiente (Y ) , y del efe™to que so˜re ell— tiene otr— @u otr—sA v—ri—˜le@sADll—m—d—@sA variable(s) independiente(s) (X)D y permite responder — dos ™uestiones ˜ási™—sX ¾is signi(™—tiv— l— in)uen™i— que tiene l— v—ri—˜le independiente so˜re l— v—ri—˜le dependientec ƒiD en efe™toD es— rel—™ión es signi(™—tiv—D ¾™ómo esc y ¾podemos —prove™h—r es— rel—™ión p—r— prede™ir v—lores de l— v—ri—˜le dependiente — p—rtir de v—lores o˜serv—dos de l— v—ri—˜le independientec wás —únD ¾podemos inferir ™—r—™terísti™—s so˜re es— rel—™ión y ™on el fenómeno que su˜y—™e — ell—c Ejemplo. …n equipo de investig—dores que tr—˜—j—n en segurid—d en el tr—˜—jo está tr—t—ndo de —n—liz—r ™ómo l— piel —˜sor˜e un ™ierto ™omponente quími™o peligrosoF €—r— elloD ™olo™— diferentes volúmenes del ™ompuesto quími™o so˜re diferentes segmentos de piel dur—nte distintos interv—los de tiempoD midiendo —l ™—˜o de ese tiempo el por™ent—je de volumen —˜sor˜ido del ™ompuestoF il diseño del experimento se h— IVS

Dpto de Estadística e I.O. Universidad de Jaénre—liz—do p—r— que l— inter—™™ión esper—˜le entre el tiempo y el volumen no in)uy— so˜re los result—dosFvos d—tos —p—re™en en el gu—dro IHFIvo que los investig—dores se ™uestion—n es si l— ™—ntid—d de ™ompuesto por un l—do y el tiempo deexposi™ión —l que se somete por otroD in)uyen en el por™ent—je que se —˜sor˜eF he ser —síD serí— interes—nteestim—r el por™ent—je de —˜sor™ión de person—s que se somet—n — un— exposi™ión de un— determin—d—™—ntid—dD por ejemploD dur—nte V hor—sFin un— primer— —proxim—™ión —l pro˜lem—D podemos o˜serv—r un— represent—™ión grá(™— de los d—tos enlos di—gr—m—s de dispersión o nu˜es de puntos de l— pigur— IHFIF ¾ué —(rm—rí—mosc €—re™e que sí h—yun— rel—™ión line—l más o menos ™l—r— @pero no de(nitiv—A entre el tiempo de exposi™ión y el por™ent—jede —˜sor™iónD pero ¾l— h—y entre el volumen y el por™ent—je de —˜sor™iónc ixperimento †olumen „iempo €or™ent—je e˜sor˜ido I HFHS P SHFVV P HFHS IH RWFWT Q HFHS PR VQFTT R PFHH P SRFHW S PFHH IH TVFPU T PFHH PR VSFTS U SFHH P RVFQW V SFHH IH TRFVV W SFHH PR VVFHI gu—dro IHFIX h—tos so˜re el experimento de l— —˜sor™ión del ™ompuesto…n modelo de regresión lineal simple p—r— un— v—ri—˜leD Y @variable dependienteAD d—d— otr— v—ri—˜leD X@variable independienteAD es un modelo m—temáti™o que permite o˜tener un— fórmul— ™—p—z de rel—™ion—rY ™on X ˜—s—d— sólo en rel—™iones line—lesD del tipo Y = β0 + β1X + ε.in est— expresiónX Y represent— — l— v—ri—˜le dependienteD es de™irD — —quell— v—ri—˜le que dese—mos estudi—r en rel—™ión ™on otr—sF X represent— — l— v—ri—˜le independienteD es de™irD —quell—s que ™reemos que puede —fe™t—r en —lgun— medid— — l— v—ri—˜le dependienteF v— est—mos not—ndo en m—yús™ul—D indi™—ndo que podrí— ser un— v—ri—˜le —le—tori—D pero h—˜itu—lmente se ™onsider— que es un— ™onst—nte que el investig—dor puede (j—r — su —ntojo en distintos v—loresF ε represent— el error aleatorioD es de™irD —quell— ™—ntid—d @—le—tori—A que provo™— que l— rel—™ión entre l— v—ri—˜le dependiente y l— v—ri—˜le independiente no se— perfe™t—D sino que esté sujet— — in™ertidum˜reF186 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para IngenierosPorcentaje.Absorbido 50 60 70 80 Porcentaje.Absorbido 50 60 70 805 15 024 Tiempo Volumenpigur— IHFIX xu˜e de puntosr—y que tener en ™uent— que el v—lor de ε será siempre des™ono™ido h—st— que se o˜serven los v—lores de X eY D de m—ner— que el modelo de predi™™ión será re—lmente Yˆ = β0 + β1X.vo que en primer lug—r result—rí— dese—˜le de un modelo de regresión es que estos errores —le—torios o™urr—n enl— mism— medid— por ex™eso que por defe™toD se— ™u—l se— el v—lor de XD de m—ner— que E [ε/X=x] = E [ε] = 0yD por t—ntoD E [Y /X=x] = β0 + β1x + E [ε/X=x] = β0 + β1x.is de™irD l—s medi—s de los v—lores de Y p—r— un v—lor de X d—do son un— re™t—Fv— pigur— IHFP represent— un— nu˜e de puntos y l— re™t— de regresión que los —just— de unos d—tos genéri™osF€odemos ver el v—lor ™on™reto de ε = y − E [Y /X=x] p—r— un d—toD supuesto que hemos o˜tenido un modelode regresiónF in ell— se puede ver t—m˜ién l— interpret—™ión de los ™oe(™ientes del modeloX β0 es la ordenada al origen del modeloD es de™irD el punto donde l— re™t— inter™ept— o ™ort— —l eje yF β1 represent— la pendiente de l— líne— yD por t—ntoD puede interpret—rse ™omo el in™remento de l— v—ri—˜le dependiente por ™—d— in™remento en un— unid—d de l— v—ri—˜le independienteFProf. Dr. Antonio José Sáez Castillo 187

Dpto de Estadística e I.O. Universidad de Jaén 100 105 yi εi β0 + β1xi y 95 90 85 xi 50 60 70 80 90 100 x pigur— IHFPX hi—gr—m— de dispersión y líne— de l—s medi—s hipotéti™—sFNota. is evidente que l— utilid—d de un modelo de regresión line—l tiene sentido siempre que l— rel—™iónhipotéti™— entre X e Y se— de tipo line—lD pero ¾qué o™urre si en vez de ser de este tipo es de otro tipo@exponen™i—lD log—rítmi™oD hiper˜óli™oFFFAcin primer lug—rD es —˜solut—mente ™onveniente di˜uj—r el di—gr—m— de dispersión —ntes de ™omenz—r —tr—t—r de o˜tener un modelo de regresión line—lD y— que si l— form— de este di—gr—m— sugiere un per(ldistinto —l de un— re™t— quizá de˜erí—mos pl—nte—rnos otro tipo de modeloF‰D por otr— p—rteD si se o˜serv— que el di—gr—m— de dispersión es de otro tipo ™ono™idoD puede opt—rsepor re—liz—r un ™—m˜io de v—ri—˜le p—r— ™onsider—r un modelo line—lF ixisten té™ni™—s muy sen™ill—s p—r—est— ™uestiónD pero no l—s veremos —quíF10.2. Estimación de los coecientes del modelo por mínimos cua- dradosƒi queremos o˜tener el modelo de regresión line—l que mejor se ajuste a los datos de la muestraD de˜eremosestim—r los ™oe(™ientes β0 y β1 del modeloF €—r— o˜tener estim—dores de estos ™oe(™ientes v—mos — ™onsider—run nuevo método de estim—™iónD ™ono™ido ™omo método de mínimos cuadradosF r—y que de™ir que˜—jo determin—dos supuestos que veremos en ˜reveD los estim—dores de mínimos ™u—dr—dos ™oin™iden ™on losestim—dores máximoEverosímiles de β0 y β1.il r—zon—miento que motiv— el método de mínimos ™u—dr—dos es el siguienteX si tenemos un— muestr— de188 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosv—lores de l—s v—ri—˜les independiente y dependienteD (x1, y1) , ..., (xn, yn) ,˜us™—remos v—lores estim—dos de β0 y β1, que not—remos por βˆ0 y βˆ1, de m—ner— que en el modelo —just—doD yˆx = βˆ0 + βˆ1xminimi™e l— sum— de los ™u—dr—dos de los errores o˜serv—dosF ‚e™ordemos que E [Y /X=x] = β0 + β1x,luego yˆx puede interpret—rse de dos form—sX IF gomo un— predi™™ión del v—lor que tom—rá Y si X = x. PF gomo un— estim—™ión del v—lor medio de Y ™u—ndo X = xFgon™ret—ndoD lo que ˜us™—mos es minimiz—r l— suma de los cuadrados de los errores n yi − (βˆ0 + βˆ1xi) 2 SSE = , i=1es de™ir ˜us™—mos βˆ0, βˆ1 = arg m´ın SSE . β0 ,β1ƒe ll—m— recta de regresión por mínimos cuadrados (o simplemente recta de regresión) de Ydada X — l— líne— que tiene l— SSE más pequeñ— de entre todos los modelos line—lesFv— solu™ión de ese pro˜lem— de mínimo se o˜tiene por el me™—nismo h—˜itu—lX se deriv— SSE respe™to de βˆ0y βˆ1, se igu—l— — ™ero y se despej—n estosF v— solu™ión es βˆ1 = SSxy y βˆ0 = y¯ − βˆ1x¯, donde SSxx nn SSxy = (xi − x¯) (yi − y¯) = xiyi − nx¯y¯ i=1 i=1 nn SSxx = (xi − x¯)2 = x2i − nx¯2. i=1 i=1gon est— not—™iónD es fá™il demostr—r que n yi − (βˆ0 + βˆ1xi) 2 SSxxSSyy − SSx2y SSxx SSE = = i=1 =SSyy − S Sxy 2 = SSyy − SSxy × βˆ1. SSxxProf. Dr. Antonio José Sáez Castillo 189

Dpto de Estadística e I.O. Universidad de Jaénin este sentidoD se de(ne ™omo medid— de l— ™—lid—d del —juste de l— re™t— de regresión el error estandar del—juste ™omo i yi − βˆ0 + βˆ1x 2 n−2 se = SSE = n−2 = S Syy − βˆ1S Sxy . n−2gu—nto m—yor se— est— ™—ntid—dD peor son l—s predi™™iones de l— re™t— de regresiónFEjemplo. €—r— los d—tos so˜re el ejemplo de l— —˜sor™ión del ™ompuestoD v—mos — ™—l™ul—r e interpret—rl—s dos re™t—s de regresión posi˜lesFin primer lug—rD v—mos — ™onsider—r l— re™t— de regresión p—r— expli™—r el por™ent—je de —˜sor™ión @y)™ono™ido el volumen de sust—n™i— @xAX SSxy = 36.24, SSx = 37.31luego βˆ1 = SSxy = 0.97 SSxx βˆ0 = y¯ − βˆ1x¯ = 63.69,—sí que l— re™t— de regresión —just—d— es yˆx = 63.69 + 0.97 × x.v— interpret—™ión de βˆ1 = 0.97 es que el por™ent—je de —˜sor™iónD Y D —ument— en promedio HFWU por ™—d—in™remento de I unid—d de volumen de ™ompuestoF v— interpret—™ión de βˆ0 = 63.69 serí— l— del v—lorpromedio de Y ™u—ndo x = 0D pero es que en este ™—so este supuesto no tiene sentidoD —sí que no de˜etenerse en ™uent—F†—mos ™on l— re™t— de regresión p—r— expli™—r el por™ent—je de —˜sor™ión @yA en fun™ión del tiempo deexposi™ión @xAX SSxy = 1187.96, SSxx = 744luego βˆ1 = SSxy = 1.60 SSxx βˆ0 = y¯ − βˆ1x¯ = 46.82,190 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros pigur— IHFQX xu˜es de puntos y re™t—s de regresión —just—d—s en el ejemplo de l— —˜sor™ión—sí que l— re™t— de regresión —just—d— es yˆx = 46.82 + 1.60 × x.€or ™—d— in™remento de un— unid—d del tiempo de exposi™iónD el por™ent—je de —˜sor™ión —ument— enmedi— IFTHFehor— v—mos — represent—r l—s nu˜es de puntos de nuevo ™on sus re™t—s de regresión —just—d—sF hees— m—ner— podremos ™ompro˜—r de un— form— grá(™— ™ómo de ˜uen—s son l—s re™t—s en ™u—nto — su™—p—™id—d de —juste de los d—tosF vos result—dos —p—re™en en l— pigur— IHFQF €odemos ver que el —justees mu™ho mejor ™u—ndo l— v—ri—˜le expli™—tiv— es el tiempo de —˜sor™iónD mientr—s que si l— v—ri—˜leexpli™—tiv— es el volumenD l— re™t— no puede p—s—r ™er™— de los d—tosFNota. r—y que h—™er un— o˜serv—™ión import—nte que suele ™ondu™ir — fre™uentes erroresF v— re™t— deregresión p—r— l— v—ri—˜le dependiente Y D d—d— l— v—ri—˜le independiente X no es l— mism— que l— re™t—de regresión de X d—d— Y F v— r—zón es muy sen™ill—X p—r— o˜tener l— re™t— de regresión de Y d—do Xde˜emos minimiz—r n yi − βˆ0 + βˆ1xi 2 i=1 ,Prof. Dr. Antonio José Sáez Castillo 191

Dpto de Estadística e I.O. Universidad de Jaénmientr—s que p—r— o˜tener l— re™t— de regresión de X d—do Y de˜erí—mos minimiz—r n 2 xi − βˆ0 + βˆ1yi , i=1en ™uyo ™—so o˜tendrí—mos ™omo solu™ión βˆ1 = SSxy SSyy βˆ0 = x¯ − βˆ1y¯,siendo l— re™t— de regresiónD xˆ = βˆ0 + βˆ1yFil error que suele ™ometerse ™on fre™uen™i— es pens—r que si tenemosD por ejemploD l— re™t— de Y d—doXD l— de X d—do Y puede o˜tenerse despejandoFis import—nte queD p—r— termin—r este —p—rt—doD re™ordemos que βˆ0 y βˆ1 son sólo estim—™iones de β0 y β1Destim—™iones ˜—s—d—s en los d—tos que se h—n o˜tenido en l— muestr—F…n— form— de h—™ernos ™ons™ientes de que se tr—t— de estim—™iones y no de v—lores ex—™tos @es imposi˜le™ono™er el v—lor ex—™to de ningún p—rámetro po˜l—™ion—lA es propor™ion—r l—s estim—™iones de los erroresest—nd—r de l—s estim—™iones de β0 y β1F ƒe ™ono™e que di™h—s estim—™iones sonX s.e. βˆ1 = se2 s.e. βˆ0 = SSxx s2e 1 x¯2 + n SSxxEjemplo. in el ejemplo de los d—tos de —˜sor™ión hemos estim—do los ™oe(™ientes de l—s dos re™t—sde regresión del por™ent—je de —˜sor™ión en fun™ión del volumen y del tiempo de —˜sor™iónF †—mos— ™omplet—r ese —nálisis ™on el ™ál™ulo de los errores est—nd—res de es—s estim—™ionesF vos result—dos—p—re™en resumidos en l— siguiente t—˜l—X wodelo βˆ0 s.e. βˆ0 βˆ1 s.e. βˆ1 % absorcio´n = β0 + β1 × V olumen TQFTW VFVH HFWU PFVQ % absorcio´n = β0 + β1 × T iempo RTFVP QFIT IFTH HFPIy˜sérvese que los errores est—nd—r en el modelo en fun™ión del volumen son m—yores propor™ion—lmenteque en el modelo en fun™ión del tiempo de —˜sor™iónF10.3. Supuestos adicionales para los estimadores de mínimos cua- dradosr—st— —hor— lo úni™o que le hemos exigido — l— re™t— de regresión esX192 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros IF ue l—s medi—s de Y p—r— ™—d— v—lor de x se —justen más o menos — un— líne— re™t—D —lgo fá™ilmente ™ompro˜—˜le ™on un— nu˜e de puntosF ƒi el —spe™to de est— nu˜e no re™uerd— — un— líne— re™t— sino — otro tipo de fun™iónD lógi™—mente no h—remos regresión line—lF PF ue los errores teng—n medi— ™eroD independientemente del v—lor de xD lo queD por otr— p—rteD no es un— hipótesis sino más ˜ien un requerimiento lógi™o —l modeloFvo que —hor— v—mos — h—™er es —ñ—dir —lgunos supuestos —l modelo de m—ner— que ™u—ndo éstos se ™umpl—nDl—s propied—des de los estim—dores de los ™oe(™ientes del modelo se—n muy ˜uen—sF isto nos v— — permitirh—™er inferen™i— so˜re estos ™oe(™ientes y so˜re l—s estim—™iones que pueden d—rse de los v—lores de l— v—ri—˜ledependienteFvos supuestos que podemos —ñ—dir se re(eren —l error del modeloD l— v—ri—˜le εFSupuesto 1. „—l y ™omo y— hemos di™hoD E [ /X=x] = E [ ] = 0D lo que impli™— que E [Y /X=x] = β0 + β1xFSupuesto 2. v— v—ri—nz— de t—m˜ién es ™onst—nte p—r— ™u—lquier v—lor de x d—doD es de™irD V ar ( /X=x) = σ2p—r— todo xFSupuesto 3. v— distri˜u™ión de pro˜—˜ilid—d de es norm—lFSupuesto 4. vos errores son independientes unos de otrosD es de™irD l— m—gnitud de un error no in)uye en—˜soluto en l— m—gnitud de otros erroresFin resumenD todos los supuestos pueden resumirse di™iendo que |X=x→ N (0, σ2) y son independientes entresíFistos supuestos son restri™tivosD por lo que de˜en ™ompro˜—rse ™u—ndo se —pli™— l— té™ni™—F ƒi el t—m—ño del— muestr— es gr—ndeD l— hipótesis de norm—lid—d de los residuos est—rá ˜—st—nte g—r—ntiz—d— por el teorem—™entr—l del límiteF in ™u—nto — l— v—ri—nz— ™onst—nte respe™to — los v—lores de xD un in™umplimiento moder—dono es gr—veD pero sí si l—s diferen™i—s son evidentesFixisten té™ni™—s espe™í(™—s p—r— ev—lu—r en qué medid— se ™umplen est—s hipótesisF „—m˜ién existen proE™edimientos p—r— ™orregir el in™umplimiento de estos supuestosF istos —spe™tos serán tr—t—dos —l (n—l deltem—F10.4. Inferencias sobre el modelo10.4.1. Inferencia sobre la pendienteel ™omienzo del ™—pítulo nos pl—nteᘗmos ™omo uno de los o˜jetivos de l— regresión el de™idir si el efe™to del— v—ri—˜le independiente es o no signi(™—tivo p—r— l— v—ri—˜le dependienteF ƒi nos (j—mosD esto es equiv—lente— ™ontr—st—r si el ™oe(™iente β1 es o no signi(™—tiv—mente distinto de ™eroF †—mos — profundiz—r en porqué es—síFy˜servemos l— pigur— IHFRF in l— nu˜e de puntos y l— re™t— de regresión —just—d— de l— izquierd—D ¾o˜serv—mosun— rel—™ión line—l buena entre x e y ™on un ˜uen —juste de l— re™t— de regresiónc g—˜rí— pens—r que síD peroProf. Dr. Antonio José Sáez Castillo 193

Dpto de Estadística e I.O. Universidad de Jaén pigur— IHFRX xu˜es de puntos y re™t—s de regresión que l—s —just—nest—rí—mos equivo™—dosX si l— re™t— de regresión tr—t— de expli™—r y en fun™ión de xD ¾™uánto v—rí— y ™onformev—rí— xc h—do que l— pendiente de es— re™t— es ™ero o prá™ti™—mente ™eroD por mu™ho que ™—m˜ies xD esono —fe™t— —l v—lor de yD es de™irD ½x no inuye nada sobre y! ƒin em˜—rgoD en l— nu˜e de puntos de l—dere™h—D — pes—r de que —p—rentemente el —juste es peorD l— re™t— —just—d— sí tiene pendiente distint— de ™eroDluego el he™ho de que y v—ríe viene d—do en ˜uen— p—rte por el he™ho de que x v—rí—D y ello o™urre porque l—pendiente de es— re™t— es distint— de ™eroF esí puesD no lo olvidemosX de™ir que dos v—ri—˜les están rel—™ion—d—sline—lmente equiv—le — de™ir que l— pendiente de l— re™t— de regresión que —just— un— en fun™ión de l— otr— esdistint— de ™eroF€ues ˜ienD d—dos los supuestos des™ritos en l— se™™ión —nteriorD es posi˜le o˜tener un ™ontr—ste de este tipoDt—l y ™omo se resumen en el gu—dro IHFPF in ell—D siD en efe™toD lo que dese—mos es ™ontr—st—r si el efe™to del— v—ri—˜le independiente es o no signi(™—tivo p—r— l— v—ri—˜le dependienteD el v—lor de b1 será ™eroFEjemplo. €—r— los d—tos del ejemplo so˜re l— —˜sor™iónD p—rtí—mos del deseo de ™ompro˜—r si —l volumenyGo el tiempo de exposi™ión in)uí—n so˜re el por™ent—je de —˜sor™iónF v—s nu˜es de puntos y el —juste del— re™t— y— nos dieron pist—sX d—˜— l— impresión de que el tiempo de —˜sor™ión sí in)uí— en el por™ent—jede —˜sor™iónD pero no qued—˜— t—n ™l—ro si el volumen lo h—™í—F is el momento de ™ompro˜—rloFxos pl—nte—mos en primer lug—r si el tiempo de exposi™ión in)uye o no so˜re el por™ent—je de —˜sor™iónDes de™irD nos pl—nte—mos si en el modelo line—l P orcentaje de absorcio´n = β0 + β1 × T iempo de exposicio´n + ε194 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros„ipo de prue˜— …nil—ter—l — fil—ter—l …nil—ter—l l— izquierd— — l— dere™h— ripótesis H0 : β1 = b1 H0 : β1 = b1 H0 : β1 = b1 ist—dísti™o H1 : β1 < b1 H1 : β1 = b1 H1 : β1 > b1 de ™ontr—ste ‚egión t= √βˆ1−b1 , se2 = SSyy −βˆ1SSxy = SSE de re™h—zo n−2 n−2 se2 /S Sxx pEv—lor ƒupuestos t < tα;n−2 |t| > t1−α/2;n−2 t > t1−α;n−2 P [Tn−2 < t] 2P [Tn−2 > |t|] P [T > t] vos d—dos en l— ƒe™™ión IHFQ gu—dro IHFPX gontr—ste so˜re β1el ™oe(™iente β1 es o no ™eroF porm—lmenteD nos pl—nte—mos H0 : β1 = 0 frente — H1 : β1 = 0X βˆ1 = 1.6 s2e = SSyy − βˆ1SSxy = 32.82 n−2t0.975;9−2 = 2.364624, t0.025;30−2 = −2.364624 1.6 − 0 t = = 7.60, 32.82/744luegoD ™omo ™—˜í— esper—rD podemos —(rm—r — l— luz de los d—tos y ™on un WS 7 de ™on(—nz— que elefe™to del tiempo de exposi™ión so˜re el por™ent—je de —˜sor™ión es signi(™—tivoF il pEv—lorD de he™hoD esp = 2P [T7 > 7.60] = 0.000126F†—mos —hor— — —n—liz—r si el efe™to line—l del volumen so˜re el por™ent—je de —˜sor™ión es signi(™—tivoFis de™irD —hor— nos pl—nte—mos si en el modelo line—lP orcentaje de absorcio´n = β0 + β1 × V olumen + εel ™oe(™iente β1 es o no ™eroD es de™irD pl—nte—mos el ™ontr—ste de H0 : β1 = 0 frente — H1 : β1 = 0X βˆ1 = 0.97 s2e = SSyy − βˆ1SSxy = 298.77 n−2t0.975;9−2 = 2.364624, t0.025;30−2 = −2.364624 0.97 − 0 t = = 0.34, 298.77/37.31luegoD ™omo ™—˜í— esper—rD no podemos —(rm—r — l— luz de los d—tos y ™on un WS 7 de ™on(—nz— que elefe™to del volumen so˜re el por™ent—je de —˜sor™ión se— signi(™—tivoF il pEv—lorD de he™hoD es p = 2P [T7 >0.34] = 0.741Fin vist— de los result—dosD — p—rtir de —hor— dej—remos de ™onsider—r el efe™to del volumen so˜re elpor™ent—je de —˜sor™iónD y sólo tendremos en ™uent— el efe™to del tiempo de exposi™iónFProf. Dr. Antonio José Sáez Castillo 195

Dpto de Estadística e I.O. Universidad de JaénEjemplo. …n ingeniero quími™o está ™—li˜r—ndo un espe™trómetro p—r— medir l— ™on™entr—™ión de gyen muestr—s de —ireF ist— ™—li˜r—™ión impli™— que de˜e ™ompro˜—r que no h—y diferen™i—s signicativasentre l— ™on™entr—™ión verd—der— de gy @xA y l— ™on™entr—™ión medid— por el espe™trómetro @yAF €—r—ello tom— II muestr—s de —ire en l—s que ™ono™e su verd—der— ™on™entr—™ión de gy y l—s ™omp—r— ™on l—™on™entr—™ión medid— por el espe™trómetroF vos d—tos son los siguientes @l—s unid—des son ppmAX x H IH PH QH RH SH TH UH VH WH IHH y I IP PH PW QV RV TI TV UW WI WUvo ide—lD lo dese—doD serí— que y = xD es de™irD que el modelo line—l que expli™— y en fun™ión de x tuvier—™oe(™ientes β0 = 0 y β1 = 1F €or —hor— v—mos — ™entr—rnos en el primer p—so en l— ™ompro˜—™ión de queel espe™trómetro está ˜ien ™—li˜r—doD que impli™— ™ontr—st—r que β1 = 1F €—r— elloD SSxx = 11000; SSyy = 10506.73; SSxy = 10740 βˆ1 = 10460 = 0.976 11000 s2e = SSyy − βˆ1SSxy = 2.286 n−2por lo t—ntoD t = 0.976 − 1 = −1.639. 1.964/11000h—do que t1− 0.05 ;11−2 = t0.975;9 = 2.262 y |−1.639| < 2.262, no h—y r—zones p—r— ™on™luir que β1 = 1F 2esí puesD el modelo podrí— ser y = β0 + x,—unque lo dese—doD insist—mosD serí— que fuer— y = x,es de™irD que lo que mid— el espe™trómetro ™oin™id— ™on l— ™—ntid—d re—l de gy en el —ireF gomo hemosdi™hoD eso o™urrirí— si β0 = 0D lo que equiv—le — de™ir que en —usen™i— de gyD el espe™trómetro esté —™eroFedemás del ™ontr—ste de hipótesisD es trivi—l propor™ion—r un interv—lo de ™on(—nz— p—r— l— pendienteD y— que™ono™emos su estim—™iónD su error est—nd—r y l— distri˜u™ión en el muestreo @tEstudentD ™omo —p—re™e en el™ontr—steAF gon™ret—menteD P β1 ∈ βˆ1 − t1− α ;n−2 × s.e. βˆ1 , βˆ1 + t1− α ;n−2 × s.e. βˆ1 = 1 − α. 2 2Ejemplo. in el ejemplo que —™—˜—mos de ver so˜re l— ™—li˜r—™ión del espe™trómetroD el interv—lo de™on(—nz— p—r— β1 es (0.94, 1.01)F gomo podemos verD el v—lor β1 = 1 es un v—lor ™on(—˜le del interv—loDluego r—ti(™—mos que no podemos —(rm—r que el espe™trómetro esté m—l ™—li˜r—doF196 Prof. Dr. Antonio José Sáez Castillo


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook