Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Estadistica para ingenieros

Estadistica para ingenieros

Published by Ciencia Solar - Literatura científica, 2015-12-31 22:51:07

Description: Estadistica para ingenieros

Keywords: Ciencia, science, chemical, quimica, Astronomia, exaperimentacion científica, libros de ciencia, literatura, matematica, matematicas, Biología, lógica, robótica, computacion, Análisis, Sistemas, Paradojas, Algebra, Aritmetica, Cartografia, sociedad,cubo de Rubik, Diccionario astronomico, Dinamica del metodo Newton, ecuaciones diferenciales, Maxwell, Física cuantica, El universo, estadistica, Estadistica aplicada

Search

Read the Text Version

Capítulo 5Variables aleatorias con distribuciónconjunta il m—trimonio es l— prin™ip—l ™—us— de divor™ioF qrou™ho w—rxResumen. in el estudio de l—s v—ri—˜les —le—tori—s hemos p—s—do por —lto el he™ho de que un ™onjunto dedos o más v—ri—˜les puede verse —fe™t—do por un— serie de rel—™iones entre ell—sF il —nálisis desde el puntode vist— est—dísti™o de est—s rel—™iones es el o˜jetivo de este ™—pítuloF gomo ™—so espe™i—lD des™ri˜iremos deform— det—ll—d— el modelo que p—r— est—s rel—™iones propor™ion— l— distri˜u™ión norm—l multiv—ri—ntePalabras clave: distri˜u™ión ™onjunt—D distri˜u™ión m—rgin—lD distri˜u™ión ™ondi™ion—d—D ™ov—ri—nz—D ™oe(E™iente de ™orrel—™iónD norm—l multiv—ri—nteF5.1. Introducciónil mundo re—l está repleto de rel—™iones — todos los nivelesF xosotrosD por r—zones o˜vi—sD est—remos intereEs—dos prin™ip—lmente en l—s rel—™iones que —fe™t—n — v—ri—˜les que des™ri˜en fenómenos propios del —m˜iente™ientí(™oEte™nológi™oF ist—s rel—™iones pueden tener muy divers—s tipologi—sF €or ejemploD podrí—mos pens—ren rel—™iones ™—us—Eefe™toD ™omo l— queD por ejemploD expli™—rí— que un— págin— ‡e˜ teng— un t—m—ño ™onEsider—˜le debido — que llev— in™rust—do v—rios —r™hivos de vídeo y —udioD o l— que se est—˜le™e entre l— ed—den —ños de un vestigio y su ™ontenido en ™—r˜ono IR1F €ero no sólo tendremos rel—™iones ™—us—Eefe™toX porejemploD s—˜emos que el peso y l— est—tur— de un ser hum—no son v—ri—˜les muy rel—™ion—d—sD h—st— el puntoque no podemos de™ir que un— person— este o˜es— sólo ™on s—˜er su pesoD sino que de˜emos v—lor—rlo enrelación a su est—tur—F€or otr— p—rteD ™u—ndo un fenómeno es determinísti™o y está ˜ien estudi—doD l—s rel—™iones entre v—ri—˜lesson leyes más o menos sen™ill—sD peroD en ™u—lquier ™—soD son inmut—˜lesF €or ejemploD densidad = masa . vol.1Relación que, por cierto, sabemos que permite la datación del vestigio. WU

Dpto de Estadística e I.O. Universidad de Jaén€eroD ¾qué o™urre ™u—ndo el fenómeno es —le—torioc v—s v—ri—˜les en ese ™—so son —le—tori—s y l—s rel—™iones quese pued—n d—r entre ell—s no siempre tienen por qué o˜ede™er — un— ley o˜jetiv— e in—movi˜leF €or ejemploDtodos somos ™ons™ientes de queD ™omo de™í—mosD existe un— rel—™ión entre el peso y l— —ltur— de un— person—Dpero no existe un— razón de conversión ™—p—z de ™—l™ul—r el peso ex—™to de —lguien — p—rtir de su —ltur—F isevidente que el tiempo de des™—rg— de un— págin— we˜ est—rá rel—™ion—do ™on el t—m—ño de los —r™hivos quel— ™on(gur—nD pero ¾™ómo de evidentec y ¾de qué form— es es— rel—™iónc em˜—s pregunt—s tr—t—rán de ser™ontest—d—s — lo l—rgo de este ™—pítuloFƒe—n X1, ..., XN v—ri—˜les —le—tori—sF il ve™tor orden—do  X1  FFF     XNes un vector aleatorio de dimensión NFr—˜l—remos de vectores aleatorios continuos o vectores aleatorios discretos ™u—ndo ™—d— un— de susv—ri—˜les se—n ™ontinu—s o dis™ret—sD respe™tiv—menteF €odrí—n d—rse vectores mixtosD pero su tr—t—mientoest—dísti™o no nos interes— por —hor—FEjemplo. gonsideremos el v—lor de un— señ—l —n—lógi™— que depende del tiempoD x (t)F in est— not—™iónDentendemos que el v—lor de l— señ—l podrí— ser distinto en ™—d— inst—nte de tiempo tF is muy fre™uenteque l— señ—l se o˜serve re—lmente ™ont—min—d— por un ruido —le—torio que t—m˜ién dependerá del tiempoDN (t)F in ese ™—soD si o˜serv—mos l— señ—l en los inst—ntes t1, ..., tN D el ve™tor  x (t1) + N (t1)  FFF     x (tn) + N (tn)es un ve™tor —le—torioFEjemplo. ƒe estudi— el tiempo que un usu—rio de snternet dedi™— — ver un— págin— ‡if (T ) en rel—™ión™on v—ri—˜les ™omo l— ™—ntid—d de texto que ™ontiene (T x)D el número de imágenes (I) y —nim—™ionespl—sh (F ) de l— págin—F inton™esD el ve™tor  T  Tx     I   Fes un ve™tor —le—torioF98 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para IngenierosEjemplo. ƒe ™ont—˜iliz— l— dur—™ión de l—s ll—m—d—s telefóni™—s — un— ™entr—lit—F €—r— ™—d— ™onjunto den-usu—rios de l— ™entr—lit—D ™—d— uno de ellos o™up— un tiempo Ti en su ll—m—d—F in ese ™—soD el ve™tor  T1  FFF     Tnes un ve™tor —le—torioF5.2. Distribuciones conjunta, marginal y condicionadail prin™ip—l o˜jetivo — —˜ord—r en el tem— es ™ómo medir l— in™ertidum˜re —so™i—d— — los su™esos que des™ri˜eun ve™tor —le—torioF ‰— vimos que en el ™—so de un— v—ri—˜le —le—tori— se tr—t—˜— de h—™erlo — p—rtir de l—fun™ión m—s— o l— fun™ión de densid—dF ehor—D ™omo v—mos — verD es —lgo más ™omplejoF5.2.1. Distribución conjuntav— distribución conjunta de probabilidad de un ve™tor —le—torio esD esen™i—lmenteD l— m—ner— en quese rep—rte l— pro˜—˜ilid—d entre todos los posi˜les result—dos del ve™torF €—r— des™ri˜irl— v—mos — de(nir los™on™eptos de fun™ión de densid—d o fun™ión m—s— —nálogos — los —so™i—dos — un— v—ri—˜le —le—tori—Fƒe— (X1, ..., XN ) un ve™tor —le—torio dis™retoF inton™esD se de(ne su función masa conjunta ™omo fX1,...,XN (x1, ..., xN ) = P [X = x1, ..., XN = xN ] .€or su p—rteD si (X1, ..., XN ) es un ve™tor —le—torio ™ontinuoD enton™esD su función de densidad conjuntaes un— fun™ión t—l que ˆˆP (X1, ..., XN ) ∈ A ⊂ RN = ... fX1,...,XN (x1, ..., xN ) dx1...dxN A⊂RNEjemplo. gonsideremos un ve™tor —le—torio ˜idimension—lD(X, Y ) D que tiene densid—d ™onjunt— fX,Y (x, y) = ce−x−y si 0 < y < x . 0 en otro ™—soin primer lug—rD podemos ™—l™ul—r l— ™onst—nte c teniendo en ™uent— que ˆ fX,Y (x, y) dxdy = 1. R2Prof. Dr. Antonio José Sáez Castillo 99

Dpto de Estadística e I.O. Universidad de Jaén€or elloD ˆ∞ ˆx ˆ∞ cde donde c = 2F 1= ce−x e−y dy dx = , dx = ce−x 1 − e−x 2 00 0in segundo lug—rD por ejemploD ™—l™ulemos ˆ 1 ˆ 1−y P [X + Y ≤ 1] = 2e−x e−y dxdy 0y ˆ1 = 2e−y e−y − e−(1−y) dy 0 −1 − 2e + e2 = e2 .@ver pigur— SFIA pigur— SFIX ‚egión del pl—no donde se ™—l™ul— l— pro˜—˜ilid—dFEjemplo. gonsideremos dos v—ri—˜lesD X e Y D que tienen densid—d ™onjunt— fX,Y (x, y) = 1 si 0 ≤ x ≤ 3, 0≤y≤5 . 15 0 en otro ™—soist— densid—d ™onst—nte en el re™tángulo de(nido indi™— que l— distri˜u™ión de pro˜—˜ilid—d es uniformeen di™ho re™tánguloF †—mos — ™—l™ul—r l— pro˜—˜ilid—d de que Y se— m—yor que X @ver pigur— SFPA P [Y > X] = ˆ3 ˆ5 1 dy dx ˆ03 5 x 15 −x = dx 0 15 = x − x2 |03= 7 3 30 . 10100 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros pigur— SFPX ‚egión del pl—no donde se ™—l™ul— l— pro˜—˜ilid—dF5.2.2. Distribuciones marginales…n— vez que somos ™—p—™es de des™ri˜ir l— distri˜u™ión de pro˜—˜ilid—d de un ve™tor —le—torio medi—nte sufun™ión m—s— o su fun™ión de densid—d ™onjunt—D surge un nuevo pro˜lem—X qué o™urre si dese—mos ™ono™er l—distri˜u™ión de pro˜—˜ilid—d de un— o más v—ri—˜les del ve™torD no del ve™tor en su ™onjuntoF is— distri˜u™iónde un— o más v—ri—˜les de un ve™tor se ™ono™e ™omo distribución marginalFƒe— (X1, ..., XN ) un ve™tor —le—torio y (Xi1 , ..., Xik ) un su˜ve™tor de v—ri—˜les suyoF in ese ™—soXƒi el ve™tor es ™ontinuoD ˆˆfXi1 ,...,Xik (xi1 , ..., xik ) = ... fX1,...XN (x1, ..., xn) dxj . xj ∈/(xi1 ,...,xik ) xj ∈/(xi1 ,...,xik )ƒi el ve™tor es dis™retoD fXi1 ,...,Xik (xi1 , ..., xik ) = fX1,...XN (x1, ..., xn) . xj ∈/(xi1 ,...,xik )Ejemplo. ƒe— el ve™tor ˜idimension—l (X, Y ) ™on fun™ión de densid—d ™onjunt— fX,Y (x, y) = x · e−x(y+1)p—r— x, y > 0Fv— fun™ión de densid—d m—rgin—l de XD ˆ∞ ˆ∞ fX (x) = fX,Y (x, y) dy = xe−x(y+1)dy = e−x −∞ 0p—r— x > 0Fenálog—menteD l— fun™ión de densid—d m—rgin—l de Y D fY (y) = ˆ∞ fX,Y (x, y) · dx = ˆ∞ xe−x(y+1)dx = (1 1 + y)2 −∞ 0p—r— y > 0FProf. Dr. Antonio José Sáez Castillo 101

Dpto de Estadística e I.O. Universidad de JaénEjemplo. gonsideremos dos v—ri—˜les dis™ret—sD Q y GD ™uy— fun™ión m—s—D fQ,G (q, g) , viene d—d— por fQ,G (q, g) g=0 g=1 g=2 g=3 q=0 0.06 0.18 0.24 0.12 . q=1 0.04 0.12 0.16 0.08ƒus m—rgin—les respe™tiv—s sonX fQ (q) = fQ,G (q, g) g 0.06 + 0.18 + 0.24 + 0.12 si q = 0 = 0.04 + 0.12 + 0.16 + 0.08 si q = 1 0.6 si q = 0 = 0.4 si q = 1y  0.06 + 0.04 si g = 0   fG (g) =  si g = 1 0.18 + 0.12 0.24 + 0.16 si g = 2    si g = 3 0.12 + 0.08Ejemplo. in un ejemplo —nterior ™onsiderᘗmos dos v—ri—˜les X e Y que tienen densid—d ™onjunt— fX,Y (x, y) = 1 si 0 ≤ x ≤ 3, 0≤y≤5 . 15 0 en otro ™—so†—mos — ™—l™ul—r sus densid—des m—rgin—lesX ˆ∞ fX (x) = fX,Y (x, y) dy −∞ ´5 = 1 dy si 0 ≤ x ≤ 3 0 15 0 en otro ™—so = 1 si 0 ≤ x ≤ 3 3 0 en otro ™—so102 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros ˆ∞ fY (y) = fX,Y (x, y) dx = −∞ ´3 1 dx si 0 ≤ y ≤ 5 0 15 0 en otro ™—so = 1 si 0 ≤ y ≤ 5 . 5 0 en otro ™—so€or t—ntoD —m˜—s m—rgin—les ™orresponden — send—s densid—des uniformesFEjemplo. v— densid—d ™onjunt— de X e Y esfX,Y (x, y) = 2x si 0 ≤ x ≤ 1, |y| < x2 . 0 en otro ™—sog—l™ulemos —m˜—s m—rgin—lesX ˆ∞ fX (x) = fX,Y (x, y) dy = −∞ ´ x2 2xdy si 0 ≤ x ≤ 1 −x2 0 en otro ™—so 4x3 si 0 ≤ x ≤ 1 = 0 en otro ™—so ˆ∞ fY (y) = fX,Y (x, y) dx = −∞ ´√1 2xdx si −1 ≤ y ≤ 1 |y| 0 en otro ™—so 1 − |y| si − 1 ≤ y ≤ 1 =. 0 en otro ™—so5.2.3. Distribuciones condicionadasƒi tenemos un ve™tor X = (X1, ..., XN ) , podemos ™onsider—r l— distri˜u™ión de pro˜—˜ilid—d de un ve™torform—do por un su˜™onjunto de v—ri—˜les de XD (Xi1 , ..., Xik ) , ™ondi™ion—d— —l he™ho de que se h—n d—dodetermin—dos v—lores en otro su˜™onjunto de v—ri—˜les de X, Xj1 = xj1 , ..., Xjl = xjl .Prof. Dr. Antonio José Sáez Castillo 103

Dpto de Estadística e I.O. Universidad de Jaénist— distri˜u™ión vendrá ™—r—™teriz—d— por su fun™ión m—s— o su fun™ión de densid—d condicionadasD segúnse— el ve™tor dis™reto o ™ontinuoD y tendrá l— expresión fXi1 ,...,Xik |Xj1 =xj1 ,...,Xjl =xjl (xi1 , ..., xik ) = fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl ) , fXj1 ,...,Xjl (xj1 , ..., xjl )donde fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl ) es l— fun™ión m—s— o l— fun™ión de densid—d ™onjunt— del—s v—ri—˜les Xi1 , ..., Xik , Xj1 , ..., Xjl y fXj1 ,...,Xjl (xj1 , ..., xjl ) es l— fun™ión m—s— o l— fun™ión de densid—d™onjunt— de l—s v—ri—˜les Xj1 , ..., Xjl Fin el ™—so más h—˜itu—l en el que el ve™tor teng— dimensión dosD tenemos l— densid—d o l— fun™ión m—s— deX ™ondi™ion—d— — Y = y, fX|Y =y (x) = fX,Y (x, y) fY (y)o l— densid—d o l— fun™ión m—s— de Y ™ondi™ion—d— — X = x, fY |X=x (y) = fX,Y (x, y) . fX (x)Ejemplo. ƒe—n l—s v—ri—˜les X e Y ™on l— fun™ión m—s— ™onjunt— siguienteX y\x H I P H QGPV WGPV QGPV I QGIR QGIR H P IGPV H Hv—s m—rgin—les son  3 + 3 + 1 si x=0y 28 14 28   fX (x) = 9 + 3 + 0 si x = 1 28 14  3 + 0 + 0 si x = 2  28  3 + 9 + 3 si y = 0 28 28 28   fY (y) = 3 + 3 + 0 si y = 1 14 14  1 + 0 + 0 si y = 2  28gomo ejemplos de l—s ™ondi™ion—d—s @h—y T en tot—lA ™—l™ulemos l— fun™ión m—s— de X ™ondi™ion—d— —Y = 1 y l— de Y ™ondi™ion—d— — X = 1.  3 si x = 0  14  6  14 si x = 1 . fX|Y =1 (x) = 3  14  6  14 0 si x = 2 6 14  9 si y = 0  28  15  238 si x = 1 . fY |X=1 (y) = 14  15   28 0 si x = 2 15 28104 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosgomo es evidenteD un— vez que tenemos ™—r—™teriz—d— l— distri˜u™ión ™ondi™ion—d— de un— v—ri—˜le —le—tori——l v—lor de otr—D ™u—lquier ™—r—™terísti™— de di™h— distri˜u™iónD ™omo l— medi— o l— v—ri—nz—D puede ™—l™ul—rse— p—rtir de su fun™ión m—s— o su fun™ión de densid—dFEjemploF „—l y ™omo pl—nteᘗmos —l ™omienzo del ™—pítuloD supong—mos que l— posi™ión (X, Y ) de unteléfono móvil que re™i˜e ™o˜ertur— de un— —nten— de telefoní— se en™uentr— dentro de un ™ír™ulo de r—dior —lrededor de es— —nten—D que supondremos sin pérdid— de gener—lid—d que se en™uentr— en el origendel pl—noF †—mos — suponer que es— posi™ión es completamente al azar dentro del ™ír™uloF iso equiv—le —™onsider—r que l— densid—d ™onjunt— de˜e ser ™onst—nte en el ™ír™uloY p—r— que su integr—l se— l— unid—dDes evidente que 1 fX,Y (x, y) = πr2si x2 + y2 ≤ r2 y ™ero en ™u—lquier punto fuer— del ™ír™uloF †—mos — ver qué podemos —verigu—r so˜re l—s™oorden—d—s X e Y por sep—r—do @m—rgin—lesA y so˜re ™ómo —fe™t—n l— un— — l— otr— @™ondi™ion—d—sAFin primer lug—rD ˆ √ √ r2 −x2 2 r2 − x2 1 fX (x) = πr2 dy = √ πr2 − r2−x2si −r < x < rF v— m—rgin—l de Y es —nálog—D 2 r2 − y2 fY (y) = πr2si −r < y < rF istá ™l—ro que p—r— ™—d— ™oorden—d— por sep—r—doD los puntos más densosD más probablesDson los ™er™—nos —l origenD que es donde se d— el máximo de —m˜—s fun™ionesFehor— supong—mos que ™ono™emos un— de l—s ™oorden—d—s y ve—mos qué podemos de™ir so˜re l— otr—X fX|Y =y0 (x) = fX,Y (x, y0) = 2 1 fY (y0) r2 − y02si − r2 − y02 < x < r2 − y02F enálog—menteD fY |X=x0 (y) = fX,Y (x0, y) = 2 1 fX (x0) r2 − x20si − r2 − x20 < y < r2 − x02F ƒi nos d—mos ™uent—D —m˜—s son distri˜u™iones uniformesD lo que equiv—le— de™ir que s—˜er un— ™oorden—d— no me d— ningun— inform—™ión so˜re l— otr— ™oorden—d—FEjemplo. e l—s IP de l— no™he de un dí— de l— sem—n— ™omienz—n — ser registr—dos l—s nuev—s ll—m—d—s— un swit™h de telefoní—F ƒe— X el inst—nte de lleg—d— de l— primer— ll—m—d—D medid— en segundostr—ns™urridos tr—s l— medi—no™heF ƒe— Y el inst—nte de lleg—d— de l— segund— ll—m—d—F in el modelo másProf. Dr. Antonio José Sáez Castillo 105

Dpto de Estadística e I.O. Universidad de Jaénh—˜itu—l utiliz—do en telefoní—D X e Y son v—ri—˜les —le—tori—s ™ontinu—s ™on densid—d ™onjunt— d—d— por fX,Y (x, y) = λ2e−λy si 0 ≤ x < y , 0 en otro ™—sodonde λ es un— ™onst—nte positiv—F †—mos — ™—l™ul—r l—s distri˜u™iones m—rgin—les y ™ondi™ion—d—s quepueden d—rseX w—rgin—l de XX ˆ∞ fX (x) = λ2e−λydy = λe−λx si 0 ≤ x, x luego se tr—t— de un— distri˜u™ión exponen™i—l de p—rámetro λF w—rgin—l de Y : ˆy fY (y) = λ2e−λydx = λ2ye−λy si y ≥ 0F 0 ƒi nos (j—mosD est— densid—d es un— Gamma (2, λ)D es de™ir un— irl—ng de p—rámetros 2 y λF gondi™ion—d— de Y — los v—lores de X : fY /X=x (y) = fX,Y (x, y) = λe−λ(y−x) si y > x. fX (x) in est— expresión no de˜e olvid—rse que x es un v—lor (joD d—doF gondi™ion—d— de X — los v—lores de Y : fX/Y =y (x) = fX,Y (x, y) = 1 si 0 ≤ x < y. fY (y) y is de™irD ™ono™ido el inst—nte en que llegó l— segund— ll—m—d— (y)D no se s—˜e n—d— de ™uándo llegó l— primer— ll—m—d—D y— que l— distri˜u™ión de X ™ondi™ion—d— — Y = y es uniforme en (0, y)FEjemplo. gonsideremos que l— v—ri—˜le X represent— el input de un ™—n—l de ™omuni™—™iónD ™on posi˜lesv—lores +1 y −1 equipro˜—˜lesD y se— Y el dígito que lleg— —l destinoD ™on v—lores t—m˜ién +1 y −1F il™—n—l es un ™—n—l ˜in—rio simétri™o ™on pro˜—˜ilid—d de ™ru™e del S 7Fgon los d—tos expuestos podemos ™—r—™teriz—r medi—nte sus fun™iones m—s— l—s distri˜u™iones m—rgin—lesde X e Y D l— distri˜u™ión ™onjunt— de —m˜os y l—s dos distri˜u™iones ™ondi™ion—d—s posi˜les de ™—d—v—ri—˜le respe™to de l— otr—Fv— distri˜u™ión m—rgin—l de X viene d—d— por fX (x) = 1 si x = 1 2 1 si x = −1 2106 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosv— distri˜u™ión m—rgin—l de Y viene d—d— por P [Y = +1] = P [Y = +1 | X = +1] P [X = +1] + P [Y = +1 | X = −1] P [X = −1] = 0.95 × 0.5 + 0.05 × 0.5 = 0.5 P [Y = −1] = 0.5,es de™ir fY (y) = 1 si y =1 2 1 si y = −1 2v— distri˜u™ión de Y ™ondi™ion—d— —l su™eso X = +1 viene d—d— por: 0.95 si y = 1 fY |X=+1 (y) = 0.05 si y = −1v— distri˜u™ión de Y ™ondi™ion—d— —l su™eso X = −1 viene d—d— por: fY |X=−1 (y) = 0.95 si y = −1 0.05 si y = 1v— distri˜u™ión ™onjunt— de X e Y viene d—d— por fX,Y (x, y) = P [Y = y | X = x] P [X = x]  0.95 × 0.5 si x = +1, y = +1    0.05 × 0.5 si x = +1, y = −1     = 0.05 × 0.5 si x = −1, y = +1  0.95 × 0.5 si x = −1, y = −1      en otro caso 0v— distri˜u™ión de X ™ondi™ion—d— —l su™eso Y = +1 viene d—d— por fX|Y =+1 (x) = fX,Y (x, +1) = 0.95 si x = 1 fY (+1) . 0.05 si x = −1v— distri˜u™ión de X ™ondi™ion—d— —l su™eso Y = −1 viene d—d— por fX|Y =−1 (x) = fX,Y (x, −1) = 0.05 si x = 1 fY (−1) . 0.95 si x = −15.3. Independencia estadísticain el ™—pítulo referente — pro˜—˜ilid—d h—˜l—mos de independen™i— de su™esosF he™í—mos enton™es que dossu™esos A y B er—n independientes si y sólo si P [A ∩ B] = P [A] · P [B] .Prof. Dr. Antonio José Sáez Castillo 107

Dpto de Estadística e I.O. Universidad de Jaénist— de(ni™ión puede extenderse —l ™—so en que teng—mos dos v—ri—˜les —le—tori—s X e Y Fgon™ret—menteD diremos que X e Y son estadísticamente independientes si y sólo si fX,Y (x, y) = fX (x) · fY (y) ,donde fX,Y (·)D fX (·) y fY (·) son fun™ión de densid—d o fun™ión m—s—D dependiendo de si l—s v—ri—˜les sondis™ret—s o ™ontinu—sFv— interpret—™ión del he™ho de que dos v—ri—˜les —le—tori—s se—n est—dísti™—mente independientes es que el™omport—miento de un— no tiene ningún efe™to so˜re l— otr— y vi™evers—F g—˜e pregunt—rse en ese ™—soD quésentido tiene un— distri˜u™ión ™ondi™ion—d— de un— v—ri—˜le — otr— que no gu—rd— ningun— rel—™ión ™on ell—F†—mos — ™ompro˜—rlo ™—l™ul—ndo l—s distri˜u™iones ™ondi™ion—d—s de v—ri—˜les —le—tori—s est—dísti™—menteindependientesX fX|Y =y (x) = fX,Y (x, y) = fX (x) · fY (y) = fX (x) ; fY (y) fY (y)es de™irD el ™omport—miento —le—torio de un— v—ri—˜le —le—tori— ™ondi™ion—d— —l v—lor de otr— que es est—dísEti™—mente independiente de ell— @des™rito medi—nte l— fun™ión fX|Y =y (x)A es ™omplet—mente igu—l que si nose ™ondi™ion— — di™ho v—lor @des™rito por l— fun™ión fX (x)AFEjemplo. ƒe— el ve™tor (X, Y ) ™on fun™ión de densid—d ™onjunt— fX,Y (x, y) = 24xy si x, y ≥ 0 y x + y ≤ 1 . 0 en otro ™—sov— fun™ión de densid—d m—rgin—l de X : ˆ 1−x 24xy · dy = 12x (1 − x)2 si 0 ≤ x ≤ 1 fX (x) = 0v— fun™ión de densid—d m—rgin—l de Y X ˆ 1−y 24xy · dx = 12y (1 − y)2 si 0 ≤ y ≤ 1. fY (y) = 0gomo fX,Y (x, y) = fX (x) · fY (y) ,l—s v—ri—˜les X e Y no son independientesFEjemplo. ƒe— —hor— el ve™tor (X, Y ) ™on fun™ión de densid—d ™onjunt— fX,Y (x, y) = 4xy si 0 ≤ x, y y x, y ≤ 1 0 en otro ™—so108 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosv— fun™ión de densid—d m—rgin—l de XX ˆ1 fX (x) = 4xy · dy = 2x si 0 ≤ x ≤ 1 0v— fun™ión de densid—d m—rgin—l de Y X ˆ1 fY (y) = 4xy · dx = 2y si 0 ≤ y ≤ 1. 0gomo fX,Y (x, y) = fX (x) · fY (y) ,l—s v—ri—˜les —le—tori—s X e Y son independientesFEjemplo. ƒupong—mos que dos ™omponentes ele™tróni™—s tienen un— dur—™ión ™uy— distri˜u™ión de proE˜—˜ilid—d puede ™onsider—rse exponen™i—l de p—rámetro λ = 2 horas−1F v—s ™omponentes fun™ion—n enp—r—leloD por lo que podemos ™onsider—r que son independientesF €or lo t—ntoD su fun™ión de densid—d™onjunt— será fX,Y (x, y) = 2e−2x2e−2y = 4e−2(x+y)si x, y > 0F¾guál será l— pro˜—˜ilid—d de que —lgun— de l—s ™omponentes dure más de dos hor—sc €odemos pl—nte—rlo™omo P [X > 2 ∪ Y > 2] = P [X > 2] + P [Y > 2] − P [X > 2 ∩ Y > 2] = P [X > 2] + P [Y > 2] − P [X > 2] P [Y > 2] ,donde se h— utiliz—do en l— pro˜—˜ilid—d de l— interse™™ión el he™ho de que l—s v—ri—˜les son independientesFehor— sólo ˜—st—rí— re™ord—r que P [X > 2] = e−2×2 y P [Y > 2] = e−2×2F¾guál serí— l— pro˜—˜ilid—d de que l— dur—™ión tot—l de —m˜—s ™omponentes se— inferior — dos hor—sc v—dur—™ión tot—l vendrí— d—d— por X + Y D luego se nos pregunt— por ˆ 2 ˆ 2−x P [X + Y < 2] = 4e−2(x+y)dydx ˆ02 0 dx = 2e−2x 1 − e−2(2−x) ˆ02 = 2e−2x − 2e−4 dx 0 = 1 − e−4 − 2e−4 × 2 = 1 − 5e−4he l— interpret—™ión que hemos d—do de v—ri—˜les independientes se sigue de m—ner— inmedi—t— que si dosv—ri—˜les —le—tori—s son independientesD esto esD no m—ntienen ningun— rel—™iónD t—mpo™o lo h—rán fun™ionesProf. Dr. Antonio José Sáez Castillo 109

Dpto de Estadística e I.O. Universidad de Jaénsuy—sF iste he™ho se re™oge en el siguiente result—doF vo podemos enun™i—r más form—lmente di™iendo que siX e Y son v—ri—˜les —le—tori—s independientes y V = g (X) y W = h (Y ) son fun™iones suy—sD enton™esD V yW t—m˜ién son independientesFin el ám˜ito de l—s „ele™omuni™—™iones se d—n numeros—s situ—™iones donde —p—re™e un— v—ri—˜le —le—tori—W D sum— de otr—s dos v—ri—˜les —le—tori—s @gener—lmente ™ontinu—sA est—dísti™—mente independientesD Xe Y, es de™irD W = X + Y. €or ejemploD se d— ™u—ndo — un— señ—l X se le —dhiere un ruido que le es™omplet—mente —jeno @independienteAD Y F in ese ™—soD l— sum— represent— l— señ—l result—nte y querremos™ono™er su ™omport—miento —le—torio — p—rtir del de X e Y F isto se ™ono™e ™omo teorema de convoluciónFgon™ret—menteD se—n X e Y dos v—ri—˜les —le—tori—s independientes y se— W = X + Y F inton™esXƒi X e Y son ™ontinu—sD ˆ∞ fW (w) = fY (y) · fX (w − y) · dy −∞ = fX ∗ fY (w)donde fX y fY son l—s fun™iones de densid—d de X e Y D respe™tiv—menteFƒi X e Y son dis™ret—sD fW (w) = fY (y) · fX (w − y) y = fX ∗ fY (w)donde fX y fY son l—s fun™iones m—s— de X e Y D respe™tiv—menteFEjemplo. …n sistem— oper— ™on un— ™omponente ™l—ve ™uy— dur—™iónD T1, sigue un— distri˜u™ión exEponen™i—l de p—rámetro λF ƒi est— ™omponente f—ll—D inmedi—t—mente se pone en fun™ion—miento un—™omponente ex—™t—mente igu—l que h—st— enton™es h— fun™ion—do en standbyD ™uy— dur—™ión not—mos porT2D v—ri—˜le —le—tori— independiente de T1.ƒi pretendemos ™ono™er l— distri˜u™ión de pro˜—˜ilid—d de l— dur—™ión tot—l del sistem—D que vendrá d—d—por l— v—ri—˜le —le—tori— T = T1 + T2D podemos poner en prá™ti™— el teorem— de ™onvolu™iónF €—r— elloDteng—mos en ™uent— que fTi (x) = λe−λx, i = 1, 2,p—r— x > 0F €or t—ntoD ˆz fT (z) = λe−λxλe−λ(z−x)dx = λ2ze−λz 0p—r— z > 0F gomo vemosD se tr—t— de un— distri˜u™ión irl—ng de p—rámetros 2 y λF ƒi re™ord—mosD est—er— un— de l—s ™—r—™teriz—™iones de l— distri˜u™ión irl—ngD sum— de exponen™i—les independientesFin el ™—so de que en vez de dos v—ri—˜les —le—tori—s se teng— un ve™tor X = (X1, ..., XN ) D l— m—ner— n—tur—lde extender el ™on™epto de independen™i— es inmedi—t—F110 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosƒe di™e que el ve™tor está form—do por componentes independientes si fX1,...,XN (x1, ..., xN ) = fX1 (x1) · ... · fXN (xN ) .pin—lmenteD si se tienen dos ve™tores —le—torios XN×1 e YM×1D se di™e que son independientes si fX,Y (x1, ..., xN , y1, ..., yM ) = fX (x1, ..., xN ) fY (y1, ..., yM ) .5.4. Medias, varianzas y covarianzas asociadas a un vector aleatorioƒi tenemos un ve™tor —le—torio form—do por l—s v—ri—˜les —le—tori—s X1, ..., XN y g (·) es un— fun™ión de est—sv—ri—˜lesD enton™esD l— media o esperanza matemática de est— fun™ión es ˆ∞ ˆ∞ E [g (X1, ..., XN )] = ... g (x1, ..., xN ) · fX1,...,XN (x1, ..., xN ) · dxN · ... · dx1 −∞ −∞donde fX1,...,XN (x1, ..., xN ) es l— fun™ión de densid—d o l— fun™ión m—s— del ve™tor —le—torio @entendiendo eneste último ™—so l— integr—l ™omo un— sum—AFgomo ™onse™uen™i— inmedi—t— de est— de(ni™iónD tenemos un— primer— e import—nte propied—dX este oper—doresper—nz— multiv—ri—nte t—m˜ién es line—lD en el sentido que se re™oge en el siguiente result—doFgon™ret—menteD podemos form—liz—rlo di™iendo que si tenemos un ve™tor —le—torio (X1, ..., XN ) y α1, ..., αNes™—l—res ™u—lesquier—D enton™es E [α1X1 + ... + αN XN ] = α1E [X1] + ... + αN E [XN ] ,es de™irD l— medi— de l— sum— ponder—d— es l— sum— ponder—d— de l—s medi—sF €odemos tr—t—r de re™ord—reste result—do si pens—mos que es ex—™t—mente l— mism— propied—d que tiene el oper—dor integr—lD que partelas sumas y saca fuera los escalaresF5.4.1. Covarianza y coeciente de correlación linealenteriormente hemos ™oment—do que estudi—r ve™tores —le—torios desde un— perspe™tiv— est—dísti™— tienesentidoD so˜re todoD porque permite —n—liz—r l—s rel—™iones que se d—n entre l—s v—ri—˜les del ve™torF €orejemploD vimos ™ómo los v—lores de un— v—ri—˜le pueden —fe™t—r en m—yor o menor medid— — l— distri˜u™iónde pro˜—˜ilid—d de l—s otr—s v—ri—˜lesFƒin em˜—rgoD serí— muy interes—nte disponer de un— medid— numéri™— sen™ill— de ™—l™ul—r y de interpret—rp—r— ™u—nti(™—r —l menos en p—rte ™uál es el gr—do de rel—™ión existente entre dos v—ri—˜les de un ve™tor—le—torioFProf. Dr. Antonio José Sáez Castillo 111

Dpto de Estadística e I.O. Universidad de Jaénin este sentidoD d—do el ve™tor —le—torio (X, Y )D se de(ne l— correlación entre X e Y ™omo RXY = m11 = E [XY ] ,— p—rtir de l— ™u—l se puede ™—l™ul—r l— covarianza entre X e Y ™omo Cov (X, Y ) = E [(X − EX) · (Y − EY )] = E [XY ] − EX · EY = RXY − EX · EY.v— ™ov—ri—nz— entre dos v—ri—˜les2 es un— medid— de l— —so™i—™ión line—l existente entre ell—sF ƒerá positiv— sil— rel—™ión entre —m˜—s es dire™t— @si ™re™e un— ™re™e l— otr—A y neg—tiv— si es invers— @si ™re™e un— de™re™e l—otr—AY —demásD será t—nto m—yor en v—lor —˜soluto ™u—nto más fuerte se— l— rel—™ión line—l existenteF€—r— poder v—lor—r est— rel—™ión line—l en términos rel—tivos se est—nd—riz— l— ™ov—ri—nz—D d—ndo lug—r — loque se ™ono™e ™omo coeciente de correlación linealX Cov [X, Y ] ρ= . V ar [X] · V ar [Y ]†—mos — det—ll—r ™l—r—mente los posi˜les v—lores de ρ y su interpret—™iónX iste ™oe(™iente es siempre un número re—l entre EI y IF ƒi es ™eroD indi™— un— —usen™i— tot—l de rel—™ión line—l entre l—s v—ri—˜lesF ƒi es uno o menos uno indi™— un— rel—™ión line—l tot—l entre l—s v—ri—˜lesD dire™t— o invers— según lo indique el signo @esto lo veremos enseguid—AF in l— medid— en que esté más lejos del ™ero indi™— un— rel—™ión line—l más intens— entre l—s v—ri—˜lesFƒi dos v—ri—˜les —le—tori—s tienen ™ov—ri—nz— ™ero o equiv—lentementeD si RXY = EX · EY, se di™en que sonincorreladasF €or su p—rteD si dos v—ri—˜les —le—tori—s son t—les que RXY = 0, se di™e que son ortogonalesFhos v—ri—˜les —le—tori—s son in™orrel—d—s si ™—re™en de ™u—lquier tipo de rel—™ión line—lF €or otr— p—rteD de(niEmos —nteriormente el ™on™epto de independen™i— entre v—ri—˜le —le—tori—D que impli™—˜— l— —usen™i— de rel—™iónentre ell—sF „enemosD —síD dos ™on™eptosD independen™i— e in™orrel—™iónD que están ˜—st—nte rel—™ion—dosFin ™on™retoD dos v—ri—˜le —le—tori— independientesD X e Y D son siempre in™orrel—d—sD es de™irD ρX,Y = 0. v—r—zón es queD por ser independientesD fX,Y (x, y) = fX (x) · fY (y) , 2Si se considera la covarianza de una variable aleatoria consigo misma, Cov (X, X) = E [(X − EX) (X − EX)] = E (X − EX)2 = V arX,esta cantidad coincide con su varianza.112 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosluego ˆ∞ˆ∞ RXY = xy · fX (x) · fY (y) · dy · dx ˆ−∞∞ −∞ ˆ∞ = xfX (x) dx · yfY (y) dy = EX · EY, −∞ −∞en ™uyo ™—so Cov [X, Y ] = 0.v— pregunt— o˜vi— que surge — l— luz de este result—do esX ¾ y —l ™ontr—rioc ¾hos v—ri—˜le —le—tori— in™orrel—d—sserán independientesc y equiv—lentementeD ¾si dos v—ri—˜le —le—tori— no tienen ningun— rel—™ión de tipo line—l@in™orrel—d—sAD o™urrirá que t—mpo™o tienen ningun— rel—™ión de ningún tipo @independientesAc v— respuest—es que no en gener—lFEjemplo. ƒe— α un— v—ri—˜le —le—tori— ™on distri˜u™ión uniforme en (0, 2π)F ƒe—n X = cos α Y = sin α.ƒe tiene que ˆ 2π 1 EX = cos α dα = 0 2π ˆ02π 1 EY = sin α dα = 0 2π ˆ02π 1 E [XY ] = sin α cos α dα 2π 0 ˆ 2π 1 = sin 2αdα = 0, 2π 0por lo que X e Y son v—ri—˜les in™orrel—d—sF ƒin em˜—rgoD puede demostr—rse fá™ilmente que no sonindependientesFNota. v— rel—™ión más fuerte de tipo line—l que puede d—rse ™orresponde —l ™—so en que un— v—ri—˜le—le—tori— Y es ex—™t—mente un— ™om˜in—™ión line—l de otr—D XD es de™irD Y = aX + bF in ese ™—soD ρXY = 1 · signo (a) .v— demostr—™ión es muy sen™ill—F „eng—mos en ™uent— que E [XY ] = E [X (aX + b)] = aE X2 + bE [X] ,Prof. Dr. Antonio José Sáez Castillo 113

Dpto de Estadística e I.O. Universidad de Jaénluego Cov (X, Y ) = E [XY ] − EX · EYy = aE X2 + bE [X] − EX (aEX + b) = a E X2 − EX2 = aV arX V arY = E ((aX + b) − (aEX + b))2 = E (aX − aEX)2 = E a2 (X − EX)2 = a2E (X − EX)2 = a2V arX, ρXY = √ Cov (X, Y ) = √ aV arX = 1 · signo (a) . V arX · V arY V arXa2V arXNota. is import—nte insistir en que l— ™ov—ri—nz— y su versión est—nd—riz—d—D el ™oe(™iente de ™orrel—™iónline—lD propor™ion—n un— medid— de l— rel—™ión linealD no de otro tipoF €or ejemploD supong—mos que l—pigur— SFQ represent— los v—lores ™onjuntos de dos v—ri—˜les X e Y F istá ™l—ro que —m˜—s gu—rd—n un—™l—rísim— rel—™ión d—d— por un— p—rá˜ol—X de he™hoD Y = X2F ƒin em˜—rgoD el ™oe(™iente de ™orrel—™iónline—l entre —m˜—s será muy ˜—joD y— que en re—lid—dD l— rel—™ión que l—s une no es line—l en —˜solutoDsino p—r—˜óli™—F in este ™—√soD lo re™omend—˜le serí—D — l— vist— del grá(™oD de™ir que sí existe un— fuerterel—™ión line—l entre X e ± Y F pigur— SFQX wuestr— ™onjunt— de v—lores de dos v—ri—˜les —le—tori—sFgu—ndo se tienen muestr—s de p—res de v—ri—˜les —le—tori—sD podemos ™—l™ul—r l— versión muestr—l del ™oe(E™iente de ™orrel—™ión line—lF is— versión muestr—l d—rá un— estim—™ión del verd—dero v—lor del ™oe(™iente de™orrel—™ión @po˜l—™ion—lAF ist— ™uestión se —˜ord— ™on más det—lle en el ™—pítulo de regresiónF equí t—n sóloqueremos pl—sm—r ™on ejemplos ™ómo se tr—du™e el he™ho de que dos v—ri—˜les teng—n un m—yor o menor™oe(™iente de ™orrel—™iónF in l— pigur— SFR o˜serv—mos represent—™iones ™onjunt—s de muestr—s de p—res dev—ri—˜les en unos ejes ™—rtesi—nos @nu˜es de puntosAF g—d— punto de ™—d— eje ™—rtesi—no represent— un v—lor114 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosd—do de l— muestr— del p—r (X, Y )F ep—re™en R (gur—sD ™orrespondientes — R simul—™iones de p—res de v—ri—˜les(X, Y ) ™on distintos ™oe(™ientes de ™orrel—™iónF ro=1 4 ro=−1 4 8 6 6 5 4 4 2 3 0 2−2 1−4 0 −4 −2 0 2 −1 −4 −2 0 2 ro=0 4 ro=0.7075 4 4 6 3 4 2 2 1 0 0 −2−1 −4−2 −4 −2 0 2−3 −4 −2 0 2pigur— SFRX xu˜es de puntos ™orrespondientes — distintos posi˜les ™oe(™ientes de ™orrel—™ión line—lFEjemplo. ƒe—n X e Y l—s v—ri—˜le —le—tori— que miden el tiempo que tr—ns™urre h—st— l— primer— y l—segund— ll—m—d—D respe™tiv—menteD — un— ™entr—lit— telefóni™—F v— densid—d ™onjunt— de est—s v—ri—˜leses fX,Y (x, y) = e−y p—r— 0 < x < yF in un ejemplo —nterior y— vimos queD lógi™—menteD el tiempo h—st—l— segund— ll—m—d— depende del tiempo h—st— l— primer— ll—m—d—D pero ¾en qué gr—doc †—mos — —˜ord—reste pro˜lem— ™—l™ul—ndo el ™oe(™iente de ™orrel—™ión line—l entre —m˜—s v—ri—˜lesFProf. Dr. Antonio José Sáez Castillo 115

Dpto de Estadística e I.O. Universidad de Jaéngomo ρX,Y = √Cov(X,Y ) , tenemos que ™—l™ul—r Cov (X, Y )D V arX y V arY. V arXV arY ˆˆ E [XY ] = xyfX,Y (x, y) dxdy ˆ ∞ˆ y ˆ∞ x2 y dy = xye−ydxdy = ye−y 20 ˆ0∞ 0 0 = y3 e−y dy = 3. 02 ˆ ˆ∞ fX (x) = fX,Y (x, y) dy = e−ydy = e−xD p—r— x > 0, xluego ˆ ˆ∞luego EX = xfX (x) dx = xe−xdx = 1.€or t—ntoD 0 ˆ ˆy fY (y) = fX,Y (x, y) dx = e−ydx = ye−yD p—r— y > 0, 0 ˆ ˆ∞ EY = yfY (y) dy = y2e−ydy = 2. 0 Cov (X, Y ) = 3 − 1 × 2 = 1.€or su p—rteD ˆ ˆ∞ E X2 = x2fX (x) dx = x2e−xdx = 2 0 V arX = 2 − 12 = 1y ˆ ˆ∞ E Y 2 = y2fY (y) dy = y3e−ydy = 6 0 V arY = 6 − 22 = 2,—sí queD (n—lmenteD √1 1×2 ρX,Y = = 0.707.il result—do indi™— queD en efe™toD el gr—do de rel—™ión line—l es —lto y dire™toFv—s propied—des del oper—dor esper—nz— son muy útiles en l— prá™ti™—D por ejemploD ™u—ndo se tr—t— de ™ono™erl— v—ri—nz— de ™om˜in—™iones line—les de v—ri—s v—ri—˜lesF †e—mos —lgún ejemplo —l respe™to y después unresult—do gener—l que los englo˜e todosF116 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros Ejemplo. g—l™ulemos l— v—ri—nz— de X1 + X2 : E (X1 + X2)2 = E X12 + X22 + 2X1X2 = E X12 + E X22 + 2E [X1X2] V ar (X1 + X2) = E (X1 + X2)2 − E [X1 + X2]2 = E X12 + E X22 + 2E [X1X2] − (EX1 + EX2)2 = E X12 + E X22 + 2E [X1X2] − EX12 − EX22 − 2EX1EX2 = E X12 − EX12 + E X22 − EX22 + 2 (E [X1X2 − EX1EX2]) = V arX1 + V arX2 + 2Cov (X1, X2) . Ejemplo. g—l™ulemos l— v—ri—nz— de X1 − X2 : E (X1 − X2)2 = E X12 + X22 − 2X1X2 = E X12 + E X22 − 2E [X1X2] V ar (X1 − X2) = E (X1 − X2)2 − E [X1 − X2]2 = E X12 + E X22 − 2E [X1X2] − (EX1 − EX2)2 = E X12 + E X22 − 2E [X1X2] − EX12 − EX22 + 2EX1EX2 = E X12 − EX12 + E X22 − EX22 − 2 (E [X1X2 − EX1EX2]) = V arX1 + V arX2 − 2Cov (X1, X2) .€odemos gener—liz—r estos ejemplos en el siguiente result—doF ƒe— un— sum— de N −v—ri—˜lesD X = N αi ·Xi. i=1inton™esD NN V ar [X] = αi · αj · Cov (Xi, Xj) , i=1 j=1donde Cov (Xi, Xi) = V ar (Xi)D p—r— i = 1, ..., N FProf. Dr. Antonio José Sáez Castillo 117

Dpto de Estadística e I.O. Universidad de Jaénv— demostr—™ión es ˜ien sen™ill—F gomo X¯ = N αi · EXi, i=1 V ar [X] = E X − X¯ 2 =E N N αi · Xi − X¯i αi · Xi − X¯i i=1 i=1 NN Xi − X¯i Xj − X¯j = αi · αj · E i=1 j=1 NN = αi · αj · Cov (Xi, Xj) i=1 j=1pijémonos queD en el ™—so en que l—s v—ri—˜les se—n in™orrel—d—sD NN N V ar [X] = αi · αj · Cov (Xi, Xj) = αi2 · V ar [Xi] , i=1 j=1 i=1y— que Cov [X, Y ] = 0 si i = j . V ar [Xi] si i = j5.4.2. Vector de medias y matriz de varianzas-covarianzas de un vectorh—do un ve™tor de N −v—ri—˜lesD X = (X1, ..., XN ) , se de(ne su vector de medias ™omo  E [X1] µX =  FFF  ,    E [XN ]y su matriz de varianzas-covarianzas ™omo CX = (Ci,j )i,j=1,...,N ,donde Ci,j = V ar (Xi) si i = j . Cov (Xi, Xj) si i = jist— m—triz ™ontiene l—s v—ri—nz—s de ™—d— v—ri—˜le del ve™tor en l— di—gon—l y en el elemento (i, j) l— ™ov—ri—nz—entre l— i−ésim— y l— j−ésim— v—ri—˜leFin form— m—tri™i—lD l— m—triz de ™ov—ri—nz—s puede de(nirse ™omo€or otr— p—rteD CX N×N = E (X − µX )N×1 (X − µX )1×N .118 CX = E (X − µX ) (X − µX ) = E [XX ] − µX µX , Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosdonde — l— m—triz E [XX ] se le suele denomin—r matriz de correlaciones o de autocorrelacionesD y sele not— RX Fem˜—s m—tri™esD CX y RX D son m—tri™es simétri™—sFv— line—lid—d del oper—dor medi— f—™ilit— rápid—mente l— expresión del ve™tor de medi—s y l— m—triz dev—ri—nz—sE™ov—ri—nz—s de ™om˜in—™iones line—les de ve™toresD ™omo se re™oge en el siguiente result—doF gon™reEt—menteD si tenemos el ve™tor —le—torio XN×1 ™on ve™tor de medi—s µX y m—triz de v—ri—nz—s ™ov—ri—nz—s CXy el ve™tor YM×1 = AM×N · XN×1 + bM×1D enton™esD el ve™tor de medi—s y l— m—triz de v—ri—nz—s ™ov—ri—nz—sde Y vienen d—d—s por µY = AµX + b CY = ACX A .Ejemplo. †—mos — ver que l— —pli™—™ión de este result—do f—™ilit— ˜—st—nte determin—dos ™ál™ulosF €orejemploD si queremos ™—l™ul—r V ar (X1 + X2)D podemos tener en ™uent— que X1 + X2 = 1 1 X1 , X2de m—ner— que V ar (X1 + X2) = 1 1 V arX1 Cov (X1, X2) 1 1 Cov (X1, X2) V arX2 = V arX1 + V arX2 + 2Cov (X1, X2) .he igu—l form—D si queremos ™—l™ul—r V ar (5X1 − 3X2) , d—do que 5X1 − 3X2 = 5 −3 X1 , X2se tiene que V ar (5X1 − 3X2) = 5 −3 V arX1 Cov (X1, X2) 5 −3 Cov (X1, X2) V arX2 = 25V arX1 + 9V arX2 − 30Cov (X1, X2) .5.5. Distribución normal multivariantein el ™ontexto de los modelos de distri˜u™iones de pro˜—˜ilid—d p—r— v—ri—˜les —le—tori—sD l— distri˜u™iónnorm—l ™onstituye el ejemplo más relev—nteD t—nto por l— fre™uen™i— de su —pli™—™ión en ™—sos re—les ™omo porl— gr—n vers—tilid—d de sus propied—des m—temáti™—F in el ™ontexto de los ve™tores —le—torios que est—mostr—t—ndo en este ™—pítuloD nos o™up—mos de l— versión multiv—ri—nte de est— distri˜u™iónF he nuevo podemosProf. Dr. Antonio José Sáez Castillo 119

Dpto de Estadística e I.O. Universidad de Jaénest—r seguros de que se tr—t— del ™—so más interes—nte por dos motivosX porque —p—re™e ™omo modelo —de™u—doen un gr—n número de fenómenos de l— n—tur—lez— y porque sus propied—des m—temáti™—s on inmejor—˜lesF…n ve™tor form—do por N v—ri—˜les —le—tori—s X = (X1, ..., XN ) se di™e que sigue un— distribución normalmultivariante o distribución conjuntamente normal o conjuntamente gaussiana, ™on ve™tor demedi—s µX y m—triz de v—ri—nz—sE™ov—ri—nz—s CX D si su fun™ión de densid—d ™onjunt— es de l— form— fX (x) = 1 · exp − 1 (x − µX ) · CX−1 (x − µx) , (2π)N det (CX ) 2donde CX = (Ci,j )i,j=1,...,N Cij = V ar [Xi] si i = j Cov [Xi, Xj] si i = j x = (x1, ..., xN ) µX = (EX1, ..., EXN )y se not— X → NN (µX ; CX ) .†—mos — dest—™—r —lgun—s de l—s ex™elentes propied—des de l— distri˜u™ión norm—l multiv—ri—nteF gon™ret—EmenteD nos ™entr—remos en los siguientes result—dosX gu—lquier m—rgin—l sigue t—m˜ién un— distri˜u™ión norm—lF gu—lquier distri˜u™ión ™ondi™ion—d— sigue t—m˜ién un— distri˜u™ión norm—lF gu—lquier ™om˜in—™ión line—l de un ve™tor norm—l es t—m˜ién norm—lF†—mos — ™on™ret—rlosF in primer lug—rD si tenemos un ve™tor XN×1 = (X1, ..., XN ) ™on distri˜u™ión ™onjunEt—mente g—ussi—n— de ve™tor de medi—s µ y m—triz de ™ov—ri—nz—s CX D en ese ™—soD el su˜™onjunto de v—ri—˜lesdel ve™torD (Xi1, ..., XiM )D ™on M < N t—m˜ién sigue distri˜u™ión ™onjunt—mente g—ussi—n—D de p—rámetros(µi1, ..., µiM ) y m—triz de ™ov—ri—nz—s ™onstituid— por l—s (l—s y l—s ™olumn—s de CX ™orrespondientes — l—sv—ri—˜les Xi1, ..., XiM FEjemplo. ƒe— un ve™tor (X1, X2, X3) g—ussi—noD de ve™tor de medi—s ™ero y m—triz de ™ov—ri—nz—s 2 1 0  1 3 1 .  011in —pli™—™ión del result—do —nteriorD l—s m—rgin—les univ—ri—ntes siguen l—s distri˜u™iones siguientesXX1 → N (0, 2) , X2 → N (0, 3) , X3 → N (0, 1)F120 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros€or su p—rteD l—s m—rgin—les ˜iv—ri—ntes siguen l—s distri˜u™iones siguientesX(X1, X2) → N2 0 21(X1, X3) → N2 ,(X2, X3) → N2 0 13 0 20 , 0 01 0 31 , 0 11in ™u—nto — l—s distri˜u™iones ™ondi™ion—lesD ™u—lquier su˜™onjunto de v—ri—˜les de un ve™tor g—ussi—no™ondi™ion—do — los v—lores de ™u—lquier otro su˜™onjunto de v—ri—˜les del propio ve™tor sigue distri˜u™ión™onjunt—mente g—ussi—n—F gon™ret—menteD l— distri˜u™ión de XN×1 ™ondi™ion—d— — YM×1 = yM×1D siendo(X, Y )(M+N)×1 ™onjunt—mente g—ussi—noD es g—ussi—n— de ve™tor de medi—s E [X |Y=y] = µXN×1 + (CXY)N×M CY−1 M×M yM×1 − µYM×1y m—triz de v—ri—nz—sE™ov—ri—nz—s V ar X |Y=y = CX − CXY CY−1CXY ,donde el elemento (i, j) de CXY es Cov (Xi, Yj)FEjemplo. ƒiguiendo ™on el ejemplo —nteriorD v—mos — ™onsider—r l— distri˜u™ión de X1 ™ondi™ion—d— —(X2, X3) = (0.5, 0.25) .ƒegún el result—doD ést— es g—ussi—n—D de ve™tor de medi—s 31 −1 0.5 − 0 11 0.25 − 0E [X1 |X2=0.5, X3=0.25] = 0 + 1 0 = 0.125y m—triz de ™ov—ri—nz—s @es de™irD v—ri—nz—A 31 −1 1 V ar (X1 |X2=0.5, X3=0.25) = 2 − 1 0 11 0 = 1.5Ejemplo. gomo ™—so p—rti™ul—rD v—mos — des™ri˜ir ™on más det—lle el ™—so ˜iv—ri—nteD t—nto en lo querespe™t— — su densid—d ™omo — l—s distri˜u™iones m—rgin—les y ™ondi™ion—d—sFƒe— por t—nto un ve™tor (X, Y )2×1D ™on distri˜u™ión ™onjunt—mente g—ussi—n— de ve™tor de medi—sProf. Dr. Antonio José Sáez Castillo 121

Dpto de Estadística e I.O. Universidad de Jaén(µX , µY ) y m—triz de ™ov—ri—nz—s C(X,Y ) = σX2 ρσX σY , ρσX σY σY2donde ρ = Cov(X,Y ) es el ™oe(™iente de ™orrel—™ión line—lF inton™esD det C(X,Y ) = σX2 σY2 1 − ρ2 y σX σY 1 1 − ρ 1 − ρ2 σX σY C(−X1,Y ) = σX2 . − ρ 1 σX σY σY2€or t—ntoD l— fun™ión de densid—d ™onjunt— es fX,Y (x, y) = 1 2πσX σY 1 − ρ2 · exp −1 (x − µX )2 − 2ρ (x − µx) (y − µY ) + (y − µY )2 . 2 (1 − ρ2) σX2 σX σY σY2ist— fun™ión —l™—nz— su máximoD 1√ , en el punto (µX , µY )F 2πσX σY 1−ρ2ividentementeD l—s distri˜u™iones m—rgin—les son N µX , σX2 y N µY , σY2 Fin lo que respe™t— — l—s distri˜u™iones ™ondi™ion—d—sD —pli™—ndo el último result—do tenemos que X | Y = y0 → N µX + ρ σX (y0 − µY ) ; σX2 1 − ρ2 Y | X = x0 → N σY 1 − ρ2 µY + ρ σY (x0 − µX ) ; σY2 . σXy˜sérvese queD ™urios—menteD l— v—ri—nz— ™ondi™ion—d— no depende del v—lor que ™ondi™ion—F isto tendráimport—ntes reper™usiones más —del—nteFgontinu—ndo ™on l—s propied—desD un— de l—s más útiles es su inv—ri—nz— frente — tr—nsform—™iones line—lesFgon™ret—menteD si tenemos un ve™tor —le—torio XN×1 = (X1, ..., XN ) ™on distri˜u™ión g—ussi—n—D ve™tor demedi—s µX y m—triz de ™ov—ri—nz—s CX D enton™es un— ™om˜in—™ión line—l suy—D YM×1 = AM×N · XN×1 + bM×1tiene distri˜u™ión g—ussi—n— de ve™tor de medi—s µY = A · µX + b y m—triz de ™ov—ri—nz—s CY = A · CX · A FEjemplo. ƒe—n dos v—ri—˜le —le—tori— X1 y X2 ™on distri˜u™ión ™onjunt—mente g—ussi—n— ™on medi—s™eroD v—ri—nz—s σX2 1 = 4 y σX2 2 = 9 y ™ov—ri—nz—D cX1,X2 = 3F ƒi est—s v—ri—˜les se tr—nsform—n line—lmente122 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierospigur— SFSX ijemplos de densid—des de l— norm—l ˜iv—ri—ntes ™on µX = µY = 0D σX = σY = 1 y ρ = 0, 0.5D−0.5 y 0.9F @in httpXGGwwwFilriForgGsnfoƒervG‡e˜pu˜Gpulldo™sGvine—r•wixed•wodelsGeppendixhFhtmAFProf. Dr. Antonio José Sáez Castillo 123

Dpto de Estadística e I.O. Universidad de Jaénen l—s v—ri—˜les Y1 = X1 − 2X2 Y2 = 3X1 + 4X2l—s nuev—s v—ri—˜les tienen distri˜u™ión ™onjunt—mente g—ussi—n—D ™on medi—s 1 −2 0 0 (µY1 , µY2 ) = 3 4 ·= 00y m—triz de ™ov—ri—nz—s σY21 cY1,Y2 = 1 −2 43 13 = 28 −66 39 cY1 ,Y2 σY22 34 −2 4 −66 252ytr— de l—s más import—ntes propied—des es que se tr—t— del úni™o ™—so en el que independen™i— e in™orrel—™iónson equiv—lentesF is de™irD si XN×1 es un ve™tor ™on distri˜u™ión ™onjunt—mente g—ussi—n—D enton™es sus™omponentes son in™orrel—d—s si y sólo si son independientesFv— demostr—™ión es sen™ill—F ‰— s—˜emos que si son independientes son in™orrel—d—s @in™luso si l— distri˜u™iónno es ™onjunt—mente g—ussi—n—AF €or su p—rteD p—r— pro˜—r que si son in™orrel—d—s enton™es son independientessólo h—y que tener en ™uent— que si son in™orrel—d—sD l— m—triz de ™ov—ri—nz—s es di—gon—l y l— densid—d™onjunt— puede expres—rse ™omo produ™to de l—s m—rgin—lesD y— que fX (x1, ..., xN ) = 1 −1 (x − µX ) CX−1 (x − µX ) exp 2 (2π)N det (CX ) = 1 exp − 1 N xi − µi 2 2 σi (2π)N σ12...σN2 i=1 N = fXi (xi) . i=1donde x = (x1, ..., xN ) D µX = (µ1, ..., µN ) y  σ12 . . . 0  CX =  FFF FFF FFF  .    0 . . . σN2124 Prof. Dr. Antonio José Sáez Castillo

Parte IIIInferencia estadística IPS



Capítulo 6Distribuciones en el muestreo €o™—s o˜serv—™iones y mu™ho r—zon—miento ™ondu™en —l errorY mu™h—s o˜serv—™iones y po™o r—zon—mientoD — l— verd—dF elexis g—rrelResumen. in este ™—pítulo se pretende ll—m—r l— —ten™ión —™er™— de que los p—rámetros muestr—les sonen re—lid—d v—ri—˜les —le—tori—sF ƒe —n—liz— —sí l— distri˜u™ión de pro˜—˜ilid—d de l— medi— muestr—l y de l—v—ri—nz— muestr—l en divers—s situ—™ionesFPalabras clave: distri˜u™iones en el muestreoD t de ƒtudentD p de ƒnede™orF6.1. Introducciónel estudi—r el ™on™epto de v—ri—˜le —le—tori—D dijimos que viene motiv—do porque mu™h—s de l—s v—ri—˜les quese o˜serv—n en l— vid— re—lD en el —m˜iente de l—s sngenierí—s en p—rti™ul—rD están sujet—s — in™ertidum˜reFiso quiere de™ir que si nosotros o˜tenemos —lgun—s o˜serv—™iones de es—s v—ri—˜les @muestr—sAD los d—tosno son igu—lesF is másD si o˜tenemos otr—s o˜serv—™ionesD l—s dos muestr—s t—mpo™o serán ni mu™ho menosidénti™—sF€or t—ntoD —l h—˜l—r de distri˜u™iones teóri™—s de pro˜—˜ilid—dD lo que pretendí—mos er— proponer un modeloque permitier— ™—l™ul—r pro˜—˜ilid—des —so™i—d—sD no — un— muestr— en p—rti™ul—r de d—tosD sino — tod—s l—sposi˜les muestr—sD ™on todos los posi˜les d—tos de l— v—ri—˜leF‚e™ordemos el ejemplo que pusimosX l—s distri˜u™iones de pro˜—˜ilid—d son ™omo un tr—je que elegimos p—r—ponernos ™u—lquier dí— dur—nte un periodo de tiempo —mplioF in l— medid— que el tr—je de un— v—ri—˜leDsu distri˜u™iónD le quede bienD los result—dos que o˜teng—mos medi—nte el ™ál™ulo de pro˜—˜ilid—des podrán—pli™—rse — ™u—lquier d—to o ™onjunto de d—tos de l— v—ri—˜leF €ero igu—lmenteD si un tr—je @un— distri˜u™iónde pro˜—˜ilid—d teóri™—A no le queda bien — un— v—ri—˜leD los result—dos teóri™osD o˜tenidos — p—rtir de un—fun™ión m—s— o un— fun™ión de densid—d teóri™—sD pueden no ser re—list—s respe™to — los result—dos empíri™osque se o˜teng—n medi—nte muestr—s de l— v—ri—˜leF¾ué nos qued— por h—™er — lo l—rgo del ™ursoc h—do queD en gener—lD l—s distri˜u™iones teóri™—s de pro˜—˜ilid—ddependen de uno o más p—rámetrosD lo que nos o™up—rá gr—n p—rte del resto del ™urso es tr—t—r de elegir IPU

Dpto de Estadística e I.O. Universidad de Jaén—de™u—d—mente esos p—rámetrosF in el ejemplo de los tr—jes podí—mos pens—r que esto es ™omo —prender —es™oger l— t—ll— del tr—jeFin este ™—pítulo v—mos — ™omenz—r ™on —lgun—s ™uestiones teóri™—s —™er™— de lo que impli™— el pro™eso demuestreoD previo — l— ele™™ión de los p—rámetros yD posteriormenteD nos v—mos — ™entr—r en result—dos queimpli™— el muestreo de d—tos de v—ri—˜les que siguen un— distri˜u™ión norm—lF6.2. Muestreo aleatorioin multitud de ám˜itos de l— vid— re—l es evidente que l— mejor form— de —prender —lgo es — p—rtir de l—experien™i—F iso quiere de™ir que solemos utiliz—r —quello que vemos p—r— —prender p—ut—s y ™ondu™t—s queluego gener—liz—mosFin ist—dísti™— p—s— —lgo muy simil—rX ne™esit—mos ˜—s—rnos en muestr—s de un— v—ri—˜le p—r— poder —prenderde ell—s y gener—liz—rD inferirD —spe™tos referentes — l—s muestr—s — tod— l— po˜l—™iónFƒin em˜—rgoD ™omo en l— vid— re—lD en ist—dísti™— t—m˜ién de˜emos ser muy ™uid—dosos ™on los d—tos so˜re losque ˜—s—mos nuestro —prendiz—jeF ¾ué p—s—rí— si ˜—s—mos nuestro —prendiz—je en experien™i—s in™orre™t—s opo™o signi(™—tiv—sc€—r— que esto no o™urr— de˜emos ˜—s—rnos en muestr—s donde todos los individuos de l— po˜l—™ión pued—nverse represent—dosF €or otr— p—rteD es evidente que ™u—nto m—yores se—n l—s muestr—s más (—˜les de˜erí—nser nuestr—s inferen™i—sFil ™on™epto ™l—ve en este pl—nte—miento es el de muestra aleatoria simpleF ƒupong—mos que est—mos o˜serEv—ndo un— v—ri—˜le —le—tori—D XD en un— po˜l—™ión determin—d—F ‰— dijimos que un— muestr— —le—tori— simplede X ™onsiste en l— re™opil—™ión de d—tos de l— v—ri—˜leD medi—nte l— repeti™ión del experimento —l que está—so™i—d—D ™on dos ™ondi™iones ˜ási™—sX IF ue todos los elementos de l— po˜l—™ión teng—n l—s mism—s posi˜ilid—des de s—lir en l— muestr—F PF ue l—s distint—s o˜serv—™iones de l— muestr— se—n independientes entre síFin ese ™—soD los v—lores que tom— l— v—ri—˜le en ™—d— un— de l—s o˜serv—™iones de un— muestr— de t—m—ñonD X1, ..., XnD son en sí mismosD v—ri—˜les —le—tori—s independientes que siguen l— mism— distri˜u™ión depro˜—˜ilid—dD ll—m—d— distribución poblacionalF ist— distri˜u™ión esD en prin™ipioD des™ono™id—D por loque se intent—rá utiliz—r l— muestr— p—r— h—™er inferen™i— so˜re ell— yD —l menosD —proxim—r l— form— de est—distri˜u™iónF6.3. Distribuciones en el muestreoƒupong—mos que est—mos o˜serv—ndo un— v—ri—˜le —le—tori— XD y que o˜tenemos un— muestr— —le—tori—simple suy—D x11, ..., xn1 F gon esos d—tos podemos ™—l™ul—r l— medi— de l— muestr—D x¯1D y l— desvi—™ión típi™— del— muestr—D s1D por ejemploF€ero de˜emos ser ™ons™ientes de lo que signi(™— muestr— aleatoriaF il he™ho de que h—y—n s—lido los v—loresx11, ..., xn1 es fruto del —z—rF he he™hoD si o˜tenemos otr— muestr—D x12, ..., xn2 D o˜tendremos otr— medi—D x¯2 yotr— desvi—™ión típi™— de l— muestr—D s2F128 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros‰ siD su™esiv—menteD o˜tenemos un— y otr— muestr—D o˜tendremos un— y otr— medi— muestr—lD y un— y otr—desvi—™ión típi™— muestr—lF €or lo t—ntoD en re—lid—dD lo que est—mos viendo es que l— medi— y l— v—ri—nz—muestr—les @y en gener—lD ™u—lquier p—rámetro de un— muestr— —le—tori— simpleA sonD en re—lid—dD v—ri—˜les—le—tori—s queD ™omo t—lesD de˜en tener su distri˜u™iónD su medi—D su v—ri—nz—FFF†—mos — re™ord—r dos de(ni™iones que y— introdujimos —l ™omienzo del ™ursoF…n parámetro muestral es un p—rámetro @medi—D v—ri—nz—D FFFA referido — un— muestr— de un— v—ri—˜le—le—tori—F…n parámetro poblacional es un p—rámetro @medi—D v—ri—nz—D FFFA referido — l— distri˜u™ión po˜l—™ion—l deun— v—ri—˜le —le—tori—F€ues ˜ienD —so™i—dos — estos dos ™on™eptos tenemos —hor— l—s siguientes de(ni™ionesFv— distribución en el muestreo de un p—rámetro muestr—l es su distri˜u™ión de pro˜—˜ilid—dFil error estandar de un p—rámetro muestr—l es l— desvi—™ión típi™— de su distri˜u™ión en el muestreoFil pro˜lem— es queD en gener—lD es ˜—st—nte difí™il ™ono™er l— distri˜u™ión en el muestreo de los p—rámetrosmuestr—lesFƒin em˜—rgoD el ™—so en el que result— más sen™illo h—™erlo es pro˜—˜lemente el más import—nteF gomo v—mos— verD si l— v—ri—˜le que o˜serv—mos sigue un— distri˜u™ión norm—lD podremos ™ono™er de form— ex—™t— l—sdistri˜u™iones en el muestreo de los dos p—rámetros más import—ntesD l— medi— y l— v—ri—nz—F¾‰ si l— v—ri—˜le no es norm—lc ƒi lo que pretendemos es estudi—r l— medi— y l— v—ri—nz— muestr—lesD re™ordemosque el „eorem— gentr—l del vímite nos di™e que si un— v—ri—˜le es sum— de otr—s v—ri—˜lesD su distri˜u™ión es—proxim—d—mente norm—lD y l— medi— es sum— de l—s v—ri—˜les de l— muestr—F is de™irD si l— v—ri—˜le no esnorm—lD tod—ví— podemos tener ™on(—nz— de que lo que h—g—mos p—r— v—ri—˜les norm—les puede ser válidoF6.4. Distribuciones en el muestreo relacionadas con la distribución normalin este —p—rt—do simplemente v—mos — present—r un— serie de result—dos —™er™— de l— distri˜u™ión en elmuestreoD es de™irD —™er™— de l—s distri˜u™iones de pro˜—˜ilid—dD de —lgunos p—rámetros muestr—les que puedeno˜tenerse —so™i—dos — un— v—ri—˜le —le—tori— norm—lFelgun—s de est—s distri˜u™iones —p—re™en por primer— vezD —sí que de˜emos de(nirl—s previ—menteF €or otr—p—rteD sus fun™iones de densid—d son ˜—st—nte po™o tr—t—˜lesF isto no es ningún pro˜lem— hoy en dí—D gr—™i—s—l uso que podemos h—™er de los orden—dores p—r— ™u—lquier ™ál™uloF edemásD p—r— poder tr—˜—j—r ™on ell—s™u—ndo no tenemos un orden—dor — m—noD existen t—˜l—s que pueden ser impres—s en p—pel ™on mu™hos v—loresde sus fun™iones de distri˜u™iónFNota. …n— de l—s primer—s distri˜u™iones en el muestreo será l— χ2F ‚e™ordemos que un— distri˜u™ión χ2 ™onn gr—dos de li˜ert—d es un— distri˜u™ión q—mm— de p—rámetros n y 1 F 2 2Prof. Dr. Antonio José Sáez Castillo 129

Dpto de Estadística e I.O. Universidad de Jaénƒi Z es un— v—ri—˜le —le—tori— norm—l est—nd—r y S un— χ2 ™on n gr—dos de li˜ert—dD siendo —m˜—s indepenEdientesD enton™es Z t= S/nsigue un— distri˜u™ión ll—m—d— t de student con n grados de libertadFƒi S1 y S2 son v—ri—˜les —le—tori—s ™on distri˜u™ión χ2 ™on n1 y n2 gr—dos de li˜ert—d independientesD enton™es F = S1/n1 S2/n2sigue un— distri˜u™ión que se denomin— F con n1 y n2 grados de libertadFgon est—s de(ni™iones y— podemos d—r l—s distri˜u™iones en el muestreo de —lgunos p—rámetros muestr—lesimport—ntes —so™i—dos — l— norm—lX ƒe— X1, ..., Xn un— muestr— —le—tori— simple de un— v—ri—˜le N (µ, σ)F inton™esD el p—rámetro muestr—l t = X¯ −√µ Sn−1/ n sigue un— t de ƒtudent ™on n − 1 gr—dos de li˜ert—dF ƒe— un— muestr— X1, ..., Xn un— muestr— —le—tori— simple de un— v—ri—˜le N (µ, σ)F inton™esD el p—ráE metro muestr—l (n − 1) Sn2−1 σ2 χ2 = sigue un— χ2 ™on n − 1 gr—dos de li˜ert—dF ƒe—n X1, ..., Xn1 e Y1, ..., Yn2 muestr—s —le—tori—s simples de v—ri—˜les independientes ™on distri˜u™iones N (µ1, σ) y N (µ2, σ)F inton™esD el p—rámetro muestr—l t = X¯ − Y¯ − (µ1 − µ2) , Sp 1 + 1 n1 n2 donde Sn1−1 2 + (n2 − 1) 2 n1 + n2 − 2 Sp2 = (n1 − 1) Sn2−1 , sigue un— t de ƒtudent ™on n1 + n2 − 2 gr—dos de li˜ert—dF ƒe—n X1, ..., Xn1 e Y1, ..., Yn2 muestr—s —le—tori—s simples de v—ri—˜les independientes ™on distri˜u™iones N (µ1, σ) y N (µ2, σ)F inton™esD el p—rámetro muestr—l χ2 = (n1 + n2 − 2) Sp2 , σ2 sigue un— χ2 n1 + n2 − 2 gr—dos de li˜ert—dF ƒe—n X1, ..., Xn1 e Y1, ..., Yn2 muestr—s —le—tori—s simples de v—ri—˜les independientes ™on distri˜u™iones130 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para IngenierosN (µ1, σ) y N (µ2, σ)F inton™esD el p—rámetro muestr—l F= Sn1−1 2 /σ12 Sn2−1 2 /σ22sigue un— distri˜u™ión F ™on n1 − 1 y n2 − 1 gr—dos de li˜ert—dFProf. Dr. Antonio José Sáez Castillo 131

Dpto de Estadística e I.O. Universidad de Jaén132 Prof. Dr. Antonio José Sáez Castillo

Capítulo 7Estimación de parámetros de unadistribución ½h—tosD d—tosD d—tos3 Egritó imp—™ientementeEF xo puedo h—™er l—drillos sin —r™ill—F ƒherlo™k rolmes @eF gF hoyleAD en Las aventuras de los bombachos de cobreResumen. ƒe des™ri˜en l—s té™ni™—s más usu—les p—r— estim—r l— medi—D l— v—ri—nz— y otros p—rámetrospo˜l—™ion—les medi—nte v—lores —isl—dos @estim—™ión puntu—lA o medi—nte interv—los de ™on(—nz—FPalabras clave: estim—dor puntu—lD método de los momentosD método de máxim— verosimilitudD interv—lode ™on(—nz—D nivel de ™on(—nz—F7.1. Introducciónin ist—dísti™— h—y tres form—s de inferir un v—lor — un p—rámetro de un— po˜l—™iónX istim—ndo el v—lor ™on™reto de ese p—rámetroF istim—ndo un— región de ™on(—nz— p—r— el v—lor del p—rámetroF „om—ndo un— de™isión so˜re un v—lor hipotéti™o del p—rámetroF Ejemplo. il rendimiento de un equipo de tr—˜—jo en un— ™—den— de produ™™ión puede est—r represent—do por el número medio de ™omponentes produ™id—sF ƒupong—mos que un ingeniero pretende propor™ion—r inform—™ión —™er™— de este promedio en su equipoF ixisten v—ri—s posi˜ilid—desX €odrí— simplemente tr—t—r de estim—r el promedio de ™omponentes produ™id—s — tr—vés de un úni™o v—lor estim—doF €odrí— propor™ion—r un interv—lo de v—lores en el que teng— mu™h— ™on(—nz— que se en™uentr— el v—lor promedioF IQQ

Dpto de Estadística e I.O. Universidad de Jaén €odrí— ™omp—r—r el v—lor promedio de su equipo ™on un v—lor hipotéti™o p—r—D por ejemploD demosE tr—r — l— empres— que tiene un mejor rendimiento que el promedio gener—l de l— empres—Fin este ™—pítulo nos ™entr—remos en l— primer— y l— segund— form—D que ™onsisten en propor™ion—r un v—lorque ™reemos que está ™er™— del p—rámetro @estim—™ión puntu—lA o en propor™ion—r un interv—lo en el que™on(—mos que se en™uentr— el p—rámetro des™ono™ido @estim—™ión por interv—los de ™on(—nz—AF v— ter™er—posi˜ilid—d se estudi—rá en el ™—pítulo de ™ontr—stes de hipótesisF7.2. Estimación puntual7.2.1. Denición y propiedades deseables de los estimadores puntuales…n estimador puntual, θˆD es un— regl— que nos di™e ™ómo ™—l™ul—r un— estim—™ión numéri™— de un p—rámetropo˜l—™ion—l des™ono™idoD θD — p—rtir de los d—tos de un— muestr—F il número ™on™reto que result— de un ™ál™uloDp—r— un— muestr— d—d—D se denomin— estimación puntualFEjemplo. ƒi dese—mos o˜tener estim—™iones de l— medi— de un— v—ri—˜le —le—tori—D lo que p—re™e más lógi™o serí— utiliz—r ™omo estim—dor l— medi— muestr—lF g—d— medi— muestr—l de ™—d— muestr— serí— un— estim—™ión puntu—l de l— medi— po˜l—™ion—lF¾ué serí— dese—˜le que le p—s—r— — ™u—lquier estim—dorc ¾ué ˜uen—s propied—des de˜erí— tener un ˜uenestim—dorc †—mos — ver dos de ell—sFin primer lug—rD p—re™e lógi™o pens—r que si ˜ien el estim—dor no propor™ion—rá siempre el v—lor ex—™to delp—rámetroD —l menos de˜erá est—˜le™er estim—™iones que se equivoquen en igu—l medid— por ex™eso que pordefe™toF iste tipo de estim—dores se denomin—n insesgadosF…n estim—dor θˆ de un p—rámetro θ se di™e insesgado si E θˆ = θ.ƒe denomin— sesgo de un estimador — E Θˆ − θ .y˜servemos que p—r— ™ompro˜—r si un estim—dor es insesg—doD en prin™ipio es ne™es—rio ™ono™er su distri˜u™iónen el muestreoD p—r— poder ™—l™ul—r su esper—nz— m—temáti™—Fedemás de l— f—lt— de sesgoD nos gust—rí— que l— distri˜u™ión de muestreo de un estim—dor tuvier— po™—v—ri—nz—D es de™irD que l— dispersión de l—s estim—™iones ™on respe™to —l v—lor del p—rámetro po˜l—™ion—lD fuer—˜—j—Fin este sentidoD se de(ne el error estandar de un estimador ™omo l— desvi—™ión típi™— de di™ho estim—dorDy se not— s.e.134 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierosil estimador insesgado de mínima varianza de un p—rámetro θ es el estim—dor θˆ que tiene l— v—ri—nz—más pequeñ— de entre todos los estim—dores insesg—dosFr—y que de™ir que no siempre es fá™il en™ontr—r este estim—dorD y que en o™—siones se —dmite un ligero sesgo™on t—l que l— v—ri—nz— del estim—dor se— mínim—F7.2.2. Estimación de la media de una v.a. La media muestralƒe— un— vF—F XD y un— muestr— —le—tori— suy—D X1, ..., XN F inton™esD l— medi— muestr—lD X¯ = X1 + ... + XN Nes un estim—dor insesg—do de E [X] y su error est—nd—r es s.e.(X¯ ) = √σX . Nil result—do est—˜le™e —lgo que podí— h—˜erse intuido desde l— de(ni™ión de l— medi— o esper—nz— m—temáti™—de un— distri˜u™ión de pro˜—˜ilid—dX si tenemos unos d—tos @masA de un— vF—FD un— estim—™ión —de™u—d— del— medi— de l— vF—F es l— medi— de los d—tosFr—y que tener mu™ho ™uid—do ™on no ™onfundir l— medi— de l— vF—FD es de™irD l— medi— po˜l—™ion—lD ™on l—medi— de los d—tos de l— muestr—D es de™irD ™on l— medi— muestr—lF€or otr— p—rteD el error est—nd—r h—™e referen™i— — σX D que es un p—rámetro po˜l—™ion—l yD por lo t—ntoDdes™ono™idoF vo que se suele h—™er es ™onsider—r l— desvi—™ión típi™— muestr—l ™omo un— —proxim—™ión de l—po˜l—™ion—l p—r— ev—lu—r este error est—nd—rF7.2.3. Estimación de la varianza de una v.a. Varianza muestralƒe— un— vF—F X y un— muestr— —le—tori— simple suy—D X1, ..., XN F inton™esD l— v—ri—nz— muestr—lD N Xi − X¯ 2 i=1 SX2 ,N−1 = N −1es un estim—dor insesg—do de V ar [X]FNota. el hilo del ™oment—rio previo que hi™imos so˜re l— medi— muestr—l ™omo estim—dor natural de l—medi—D —hor— quizá sorprend— que en el denomin—dor de l— v—ri—nz— muestr—l —p—rez™— N − 1 y no N Fin este sentidoD si ™onsider—mos el estim—dor SX2 ,N = N Xi − X¯ 2 i=1 , NProf. Dr. Antonio José Sáez Castillo 135

Dpto de Estadística e I.O. Universidad de Jaénse tr—t—rí— de un estim—dor no insesg—doF e este estim—dor de l— v—ri—nz— se le ™ono™e h—˜itu—lmente™omo cuasivarianza muestral. yjoD h—y que —dvertir que en —lgunos li˜ros l— m—ner— de nom˜r—r — l—v—ri—nz— y — l— ™u—siv—ri—nz— muestr—les es justo —l ™ontr—rioFNota. il que l— v—ri—nz— muestr—lD SN2 −1D se— un estim—dor insesg—do de l— v—ri—nz—D σ2D no impli™— que l—desvi—™ión típi™— muestr—lD SN−1 = SN2 −1D se— un estim—dor insesg—do de σD pero en este ™—so sí o™urre —síF Ejemplo. wedi—nte ‚ hemos gener—do un— muestr— —le—tori— simple de IHHH v—lores de un— distri˜u™ión N (0, 1)F ƒ—˜emosD por t—ntoD que l— medi— @po˜l—™ion—lA de los d—tos es H y que l— v—ri—nz— @po˜l—™ion—lA es IF xo o˜st—nteD v—mos — suponer que des™ono™emos de qué distri˜u™ión pro™eden los d—tos y v—mos — tr—t—r de ajustar un— distri˜u™ión teóri™— p—rtiendo de los v—lores de l— muestr—X x1×1000 = (−0.9459, −0.9557, 0.2711, 0.2603, 1.014, ...) €—r— empez—rD de˜emos pens—r en un— distri˜u™ión —de™u—d—F €—r— ello puede o˜serv—rse el histogr—m— de los d—tos por si éste re™uerd— l— form— de —lgun— fun™ión de densid—d ™ono™id—F in este ™—soD el histogr—m— de l— muestr— —p—re™e en l— pigur— UFID histogr—m— que re™uerd— ™l—r—mente l— fun™ión de densid—d de un— distri˜u™ión norm—lF v— pregunt— inmedi—t— un— vez que se opt— por —just—r medi—nte un— distri˜u™ión norm—l es ¾qué norm—lc is de™irD ¾qué medi— y qué v—ri—nz— se proponen p—r— l— distri˜u™ión que queremos —just—r — estos d—tosc …n— respuest— — est— pregunt— l— propor™ion—n los estim—dores insesg—dos que hemos en™ontr—do p—r— estos p—rámetrosF gon™ret—menteD x¯ = −0.0133 y s999 = 0.9813, por lo que —just—rí—mos los d—tos de l— muestr— x medi—nte un— distri˜u™ión N (−0.0133, 0.9813) . v— densid—d de est— distri˜u™ión —p—re™e t—m˜ién en l— pigur— UFID en tr—zo ™ontinuoD y se o˜serv— que —just— muy ˜ien l— form— del histogr—m—F136 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros Histograma de la muestra Densidad 0.0 0.1 0.2 0.3 0.4 0.5 −3 −2 −1 0 1 2 3pigur— UFIX ristogr—m— p—r— l— muestr— x1×1000 ™on QH interv—los y fun™ión de densid—d de l— distri˜u™iónN (−0.0133, 0.9813)F7.2.4. Estimación de una proporción poblacionalƒupong—mos que dese—mos estim—r un— propor™ión pD des™ono™id—D que represent— l— pro˜—˜ilid—d de unsu™eso dentro de un esp—™io muestr—lF €—r— elloD se re—liz—n N experimentos —so™i—dos —l esp—™io muestr—l yse ™uent— el nº de ve™es que o™urre ese su™eso del ™uál queremos estim—r su pro˜—˜ilid—dD kF in ese ™—soD l—propor™ión muestr—lD k pˆ = , Nes un estim—dor insesg—do de pF edemásD su error est—nd—r es p(1 − p) s.e.(pˆ) = Nƒo˜re el error est—nd—rD o˜sérvese de nuevo queD d—do que p es des™ono™idoD en re—lid—d l— expresión de s.e.(pˆ)no puede ev—lu—rseF ƒin em˜—rgoD es ˜—st—nte ™omún que si el t—m—ño de l— muestr—D N D es gr—ndeD se utili™eel v—lor de l— estim—™iónD pˆD en lug—r de p en es— expresiónFhe tod—s form—sD o˜sérvese t—m˜ién que l— fun™ión f (p) = p(1 − p) es menor que 1 si 0 ≤ p ≤ 1D luego 4 s.e.(pˆ) ≤ 1 = √1 . 4N 2 Nis por ello que siempre podemos d—r est— ™—ntid—dD √1 D ™omo ™ot— superior del error est—nd—rF 2NEjemplo. ƒi el número de v—rones en un— muestr— de IHHH individuos de un— po˜l—™ión es SHUD podemos—proxim—r l— verd—der— propor™ión de v—rones en tod— l— po˜l—™ión medi—nte 507 pˆ = = 0.507, 1000™on un error est—nd—r por de˜—jo de √1 = 0.01581139F v— estim—™ión del error est—nd—r de l— 2 1000Prof. Dr. Antonio José Sáez Castillo 137

Dpto de Estadística e I.O. Universidad de Jaénestim—™ión serí— 0.507 × 0.493/1000 = 0.01580984X en este ™—soD l—s diferen™i—s son in—pre™i—˜lesF7.2.5. Obtención de estimadores puntuales. Métodos de estimaciónr—st— —hor— hemos puesto un ejemplo —™er™— de l— estim—™ión de l— medi— o l— v—ri—nz— de un— po˜l—™iónmedi—nte l— medi— y l— v—ri—nz— muestr—lF ƒin em˜—rgoD nosotros hemos visto mu™h—s distri˜u™iones teóri™—sque no dependen dire™t—mente de l— medi— o l— v—ri—nz—F €or ejemploD l— ˜inomi—l depende de pD l— q—mm—de dos p—rámetrosD a y λD FFF ¾gómo o˜tener estim—dores de estos p—rámetroscixisten diversos métodos de estim—™ión de p—rámetrosF xosotros v—mos — ver dos de los más sen™illosF7.2.5.1. Método de los momentos†—mos — expli™—r el método sólo p—r— distri˜u™iones de uno o dos p—rámetros po˜l—™ion—lesD que son l—súni™—s que hemos visto nosotrosFƒe— x1, ..., xn un— muestr— de un— v—ri—˜le —le—tori— XX IF ƒi l— distri˜u™ión de X depende de un sólo p—rámetroD θD l— medi— po˜l—™ion—l de X, E [X] = µD será fun™ión de θ, µ = f (θ)F in ese ™—soD el estim—dor medi—nte el método de los momentos de θ, θˆ, se o˜tiene despejándolo @si es posi˜leA de l— e™u—™ión x¯ = f θˆ F PF ƒi l— distri˜u™ión de X depende de dos p—rámetrosD θ1 y θ2D l— medi— po˜l—™ion—l de X, E [X] = µD será fun™ión de —m˜os, µ = f (θ1, θ2) e igu—lmente l— v—ri—nz— po˜l—™ion—l est—rá expres—d— ™omo fun™ión de estos p—rámetrosD V arX = σ2 = g (θ1, θ2)F in ese ™—soD los estim—dores medi—nte el método de los momentos de θ1 y θ2, θˆ1 y θˆ2, se o˜tienen despejándolos @si es posi˜leA del sistem— de e™u—™iones x¯ = f θˆ1, θˆ2 s2n−1 = g θˆ1, θˆ2 .Ejemplo. in l— distri˜u™ión ˜inomi—l s—˜emos que EX = np, por lo que p = EX F €or t—ntoD d—d— un— nmuestr— de t—m—ño N de l— v—ri—˜leD el método de los momentos propone ™omo estim—dor de p — x¯ pˆ = . n€or ™iertoD este estim—dor ™oin™ide ™on el que h—˜í—mos ™onsider—do en un prin™ipioD que er— l— propor™iónmuestr—lD es de™irD pˆ = k/N D pero puede h—˜er —lgun— ™onfusión en l— not—™iónF †e—mos porquéFƒe supone que tenemos un— muestr— de t—m—ño N de d—tos de un— ˜inomi—l de p—rámetro nD es de™irDtenemos n experimentosD N ve™esD o se—D un tot—l de n × N experimentosD ™on i xi éxitosF vuegoD enefe™toD pˆ = x¯ = n i xi , n ×Nes de™irD l— propor™ión muestr—lD ™o™iente del nº de éxitos entre el nº tot—l de experimentosF xo de˜emos™onfundirnos ™on l— expresión k/N que pusimos —ntes porque N no signi(™— lo mismo en —m˜os ™—sosF138 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para IngenierosEjemplo. in l— distri˜u™ión geométri™— s—˜emos que EX = 1 − 1D de donde p = 1 D luego el método p 1+EXde los momentos propone ™omo estim—dor — 1 pˆ = . 1 + x¯Ejemplo. in el ™—so de l— ˜inomi—l neg—tiv— tenemos dos p—rámetrosF ƒe s—˜e que a (1 − p) EX = p a (1 − p) V arX = p2he est— expresión de˜emos despej—r a y pF h—do que EX = p, V arXse tiene que p EX EX2 − V arX − EX a = EX × = EX × V arX = 1 p 1 − EX V arXde donde se proponen ™omo estim—dores x¯ pˆ = sX2 ,N−1 x¯2 aˆ = sX2 ,N−1 − x¯ .7.2.5.2. Método de máxima verosimilitudiste método o˜ede™e — un prin™ipio muy lógi™oX d—d— un— muestr—D es™oj—mos ™omo estim—™iones —quellosv—lores de los p—rámetros que h—g—n más creibles, más verosímilesD los d—tos de l— muestr—F€—r— des—rroll—r el método de˜emos tener en ™uent— que si tenemos un— muestr— —le—tori— simple de un—v—ri—˜le XD x1, ..., xnD y l— fun™ión m—s— o densid—d de l— v—ri—˜le es p (x)D enton™es l— fun™ión m—s— odensid—d de l— muestr— es p (x1, ..., xn) = p (x1) ...p (xn) .ist— fun™ión m—s— o densid—d represent— en ™ierto modo l— credibilidad de los d—tos de l— muestr—Fh—d— un— v—ri—˜le —le—tori— X ™on fun™ión m—s— o fun™ión de densid—d p (x) , que depende de unoo dos p—rámetrosD y un— muestr— —le—tori— simple de XD x1, ..., xnD l— verosimilitud de l— muestr—es l— fun™ión L = p (x1) ...p (xn) ,fun™ión que dependerá de los p—rámetros des™ono™idos de l— v—ri—˜leFProf. Dr. Antonio José Sáez Castillo 139

Dpto de Estadística e I.O. Universidad de Jaén h—d— l— verosimilitud de un— muestr—D LD si L depende de un sólo p—rámetroD θD enton™es el estimador máximo-verosímil de θ se o˜tiene resolviendo el pro˜lem— de máximo siguienteX θˆ = arg m´ax L . θ si L depende de dos p—rámetrosD θ1 y θ2D enton™es los estimadores máximo-verosímiles de θ1 y θ2 se o˜tienen resolviendo el pro˜lem— de máximo siguienteX θˆ1, θˆ2 = arg ma´x L . θ1 ,θ2Nota. h—do que el máximo de un— fun™ión ™oin™ide ™on el máximo de su log—ritmoD suele ser muy útilm—ximiz—r el log—ritmo de l— fun™ión de verosimilitud en vez de l— fun™ión de verosimilitudFEjemplo. †—mos — ™—l™ul—r el estim—dor máximo verosímil del p—rámetro p de un— distri˜u™ión B (n, p)˜—s—do en un— muestr— x1, ..., xN Fin primer lug—rD l— fun™ión de verosimilitud es N n pxi (1 − p)n−xi xi Lx1,...,xN (p) = i=1 Nn p N xi (1 − p)nN − .Nxi = i=1 i=1 i=1 xiƒu log—ritmo result— Nn NN ln Lx1,...,xN (p) = ln i=1 xi + xi × ln p + nN − xi ln (1 − p) . i=1 i=1€—r— m—ximiz—r est— fun™ión deriv—mos respe™to — p e igu—l—mos — ™eroX N xi − nN − N xi = 0, i=1 i=1 p 1−pde donde N x¯ i=1 n p = xi = x¯ = x¯ . 1−p n − x¯ 1− nN − N xi n i=1vuego el estim—dor es x¯ pˆ = . ny˜sérvese que ™oin™ide ™on el estim—dor que o˜tuvimos por el método de los momentosFEjemplo. †—mos — ™—l™ul—r el estim—dor máximo verosímil del p—rámetro λ de un— distri˜u™ión exp (λ)˜—s—do en un— muestr— x1, ..., xN F140 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenierospun™ión de verosimilitudX N Lx1,...,xN (λ) = λe−λxi = λN e−λ .N xi i=1 i=1vog—ritmo de l— fun™ión de verosimilitudX N ln Lx1,...,xN (λ) = N ln λ − λ xi. i=1€—r— m—ximiz—r est— fun™iónD deriv—mos respe™to — λ e igu—l—mos — ™eroX N N λ − xi = 0, i=1de donde N1 λˆ = N xi = . i=1 x¯he nuevo el estim—dor máximo verosímil ™oin™ide ™on el propor™ion—do por el método de los momentosFEjemplo. in el ™—so de l— distri˜u™ión norm—lD tenemos dos p—rámetrosF †e—mos ™ómo pro™eder en est—situ—™iónF †—mos — preo™up—rnos por los estim—dores de l— medi— y de l— v—ri—nz—Xv— fun™ión de verosimilitudX = N √1 (xi −µ)2 √1 e .N− n (xi −µ)2 2πσ2 i=1 2σ2 Lx1 ,...,xN µ, σ2 e =− 2σ2 i=1 2πσ2ƒu log—ritmoX ln Lx1,...,xN µ, σ2 = − N ln (2π) − N ln σ2 − N (xi − µ)2 . 22 i=1 2σ2he˜emos m—ximiz—r est— fun™ión ™omo fun™ión de µ y σ2F €—r— elloD deriv—mos respe™to de —m˜—sv—ri—˜les e igu—l—mos — ™eroX d µ, σ2 = N (xi − µ) = 0 dµ ln Lx1,...,xN µ, σ2 i=1 d dσ2 ln Lx1,...,xN σ2 = −N + 1 N (xi − µ)2 =0 2σ2 2 i=1 (σ2)2he l— primer— e™u—™ión se sigue NNde donde (xi − µ) = xi − N µ = 0, i=1 i=1 µˆ = N xi = x¯. i=1 NProf. Dr. Antonio José Sáez Castillo 141

Dpto de Estadística e I.O. Universidad de Jaén Modelo Estimadores por el Estimadores por el método método de los momentos de máxima verosimilitud B (n, p) P (λ) pˆ = x¯ pˆ = x¯ Geo (p) n n BN (a, p) λˆ = x¯ λˆ = x¯ exp (λ) pˆ = 1 pˆ = 1 Gamma (a, λ) 1+x¯ 1+x¯ ,x¯2 N (µ, σ) aˆ = pˆ = x¯ ƒólo por métodos numéri™os sX2 ,N−1−x¯ s2X,N −1 λˆ = 1 λˆ = 1 x¯ x¯ ,x¯2 λˆ = aˆ = x¯ ƒólo por métodos numéri™os sn2 −1 sn2 −1 µˆ = x¯, σˆ = sn−1 µˆ = x¯, σˆ = sngu—dro UFIX istim—dores por el método de los momentos y de máxim— verosimilitud de los p—rámetros de l—sdistri˜u™iones más usu—lesFhe l— segund—D sustituyendo en ell— µ por x¯, N (xi − x¯)2 = N i=1 σ2 , (σ2)2de donde N x¯)2 i=1 σˆ2 = (xi − = s2n. N Nota. he nuevo h—y que ll—m—r l— —ten™ión so˜re el he™ho de que hemos ˜us™—do un estim—dorD de máxim— verosimilitudD de σ2D no de σF ƒin em˜—rgoD no es muy difí™il demostr—r que el estim—dor de máxim— verosimilitud de σ en l— distri˜u™ión norm—l es l— ™u—sidesvi—™ión típi™— muestr—lD snF7.2.6. Tabla resumen de los estimadores de los parámetros de las distribuciones más comunesin tod— est— se™™iónD supong—mos que tenemos un— muestr— x1, ..., xN de un— v—ri—˜le —le—tori— XF vosestim—dores según el método de los momentos y de máxim— verosimilitud de los p—rámetros según l—s distriE˜u™iones que hemos des™rito —p—re™en en el gu—dro UFIF7.3. Estimación por intervalos de conanzaƒe— x1, ..., xN un— muestr— de un— determin—d— vF—F X ™uy— distri˜u™ión depende de un p—rámetro des™ono™idoθF …n intervalo de conanza p—r— θ ™on un nivel de signicación αD I (x1, ..., xN ) , es un interv—lo re—lque depende de l— muestr—D pero que no depende de θ t—l que P [θ ∈ I (x1, ..., xN )] = 1 − α.el v—lor 1 − α t—m˜ién se le ll—m— nivel de conanzaF142 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros Confidence intervals based on z distribution Confidence intervals based on z distribution Confidence intervals based on z distributionIndex | Index | | Index | 10 20 30 40 50 | 10 20 30 40 50 | | 10 20 30 40 50 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |0 0 0 −0.4 −0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 −1.0 −0.5 0.0 0.5 1.0 Confidence Interval Confidence Interval Confidence Intervalpigur— UFPX histintos interv—los de ™on(—nz— p—r— un— medi— — un TV 7 @izquierd—AD — un WH 7 @™entroA y— un WW 7 @dere™h—AF €uede o˜serv—rse que —ument—r el nivel de ™on(—nz— h—™e más —mplios los interv—losF„—m˜ién puede o˜serv—rse que no todos los interv—los ™ontienen — l— medi— po˜l—™ion—l @HAD pero que el nºde éstos malos interv—los disminuye ™onforme —ument—mos el nivel de ™on(—nz—Fy˜sérvese que l— (losofí— de ™u—lquier interv—lo de ™on(—nz— es propor™ion—rD ˜—sándonos en los d—tosD un—región donde teng—mos un determin—do nivel de ™on(—nz— en que el p—rámetro se en™uentr—F gomo en el™—so de los estim—dores puntu—lesD el interv—lo de ™on(—nz— es —le—torioD y— que depende de los d—tos deun— muestr—F edemásD se d— por he™ho que existe l— posi˜ilid—d de que el verdadero p—rámetro θ no quedeen™err—do dentro del interv—lo de ™on(—nz—D ™os— que o™urrirí— ™on pro˜—˜ilid—d αFNota. el respe™to de l— interpret—™ión del nivel de ™on(—nz—D tenemos que de™ir queD d—do que desde el™omienzo del ™urso hemos —dopt—do un— interpret—™ión fre™uentist— de l— pro˜—˜ilid—dD un interv—lo de™on(—nz— —l WS 7D por ejemploD g—r—ntiz— que si tom—mos IHH muestr—s el p—rámetro po˜l—™ion—l est—rádentro del interv—lo en —proxim—d—mente WS interv—los ™onstruidosFƒin em˜—rgoD est— interpret—™ión es —˜surd— en l— prá™ti™—D porque nosotros no tenemos IHH muestr—sDsino sólo un—Fxosotros tenemos los d—tos de un— muestr—F gon ellos ™onstruimos un interv—lo de ™on(—nz—F ‰ —hor— sólo™—˜en dos posi˜ilid—desX o el p—rámetro está dentro del interv—lo o no lo estáF il p—rámetro es ™onst—nteDy el interv—lo t—m˜iénF ½xo podemos repetir el experimento3 is por ello que se h—˜l— de interv—los deconanzaD interpret—ndo que tenemos un— conanza del WS 7 en que el p—rámetro est—rá dentroFProf. Dr. Antonio José Sáez Castillo 143

Dpto de Estadística e I.O. Universidad de Jaén7.3.1. Intervalos de conanza para la mediaƒe— X un— vF—F ™on distri˜u™ión norm—l de medi— µ des™ono™id— y v—ri—nz— σ2 ™ono™id—F ƒe— un— muestr—x = (x1, ..., xN ) de XD y x¯ l— medi— muestr—l —so™i—d—F inton™esD P µ∈ x¯ − z1− α √σ , x¯ + z1− α √σ = 1 − α, 2 N 2 Ndonde z1− α a es t—l que FZ z1− α = 1 − α D siendo Z → N (0, 1) . 2 2 2aEl valor de z1− α debe buscarse en la tabla de la normal o calcularse con ayuda del ordenador. 2is de™irD l— medi— se en™uentr— en el interv—lo x¯ − z1− α √σ , x¯ + z1− α √σ 2 N 2 N™on un (1 − α) 7 de ™on(—nz—Fxo o˜st—nteD h—y que re™ono™er que en l— prá™ti™— es po™o pro˜—˜le que se des™onoz™— el v—lor de l— medi—y sí se ™onoz™— el de l— v—ri—nz—D de m—ner— que l— —pli™—™ión de este teorem— es muy limit—d—F il siguienteresult—do responde pre™is—mente — l— ne™esid—d de extender el —nterior ™u—ndo se des™ono™e el v—lor de l—v—ri—nz—Fƒe— X un— vF—F ™on distri˜u™ión norm—l de medi— µ y v—ri—nz— σ2, —m˜—s des™ono™id—sF ƒe— un— muestr—x = (x1, ..., xN ) de XD l— medi— muestr—l x¯ y l— v—ri—nz— muestr—l s2X,N−1F inton™esD   P µ ∈ x¯ − t1− α sX2 ,N −1 , x¯ + t1− α s2X,N −1 = 1 − α, 2 N 2 N ;N −1 ;N −1 donde tα;N a es el v—lor t—l que FTN (tα;N ) = αD siendo TN un— vF—F ™on distri˜u™ión „ de ƒtudent ™on Ngr—dos de li˜ert—d.aEl valor de t1− α debe buscarse en la tabla de la t o calcularse con ayuda del ordenador 2is de™irD ™on(—mos en un (1 − α) 7 en que el interv—lo   sX2 ,N −1 x¯ − t1− α s2X,N −1 , x¯ + t1− α 2 N 2  ;N −1 ;N −1 N™ontiene — l— medi—D que es des™ono™id—FEjemplo. wedi—nte ‚ h—˜í—mos simul—do IHHH v—lores de un— distri˜u™ión N (0, 1)F v— medi— y l—desvi—™ión típi™— muestr—les de esos IHHH v—lores result—ron ser x¯ = −0.0133 y s999 = 0.9813F €or t—ntoDel interv—lo de ™on(—nz— que se est—˜le™e —l WS 7 de ™on(—nz— p—r— l— medi— es −0.0133 ∓ 1.96 √0.9813 = (−0.074, 0.0475) 1000144 Prof. Dr. Antonio José Sáez Castillo

Apuntes de Estadística para Ingenieros y˜sérvese queD en efe™toD l— verd—der— medi—D µ = 0D está en el interv—lo de ™on(—nz—Fvos dos result—dos que —™—˜—mos de enun™i—r se ˜—s—n en que se ™ono™e l— distri˜u™ión ex—™t— de l— muestr—Dnorm—lD lo que permite dedu™ir que l— medi— muestr—l sigue t—m˜iénD y de form— ex—™t—D un— distri˜u™iónnorm—l de medi— µ y v—ri—nz— σ2 F ƒin em˜—rgoD gr—™i—s —l teorem— ™entr—l del límite se s—˜e que se— ™u—l Nse— l— distri˜u™ión de l—s v—ri—˜les de l— muestr— —le—tori— simpleD l— medi— muestr—l sigue —proxim—d—menteun— distri˜u™ión norm—l de medi— µ y v—ri—nz— σ2 D y— que se o˜tiene ™omo sum— de vF—F independientes ™on Nl— mism— distri˜u™iónF €or lo t—ntoD podemos o˜tener un interv—lo de ™on(—nz— aproximado p—r— ™u—lquiermedi— de ™u—lquier distri˜u™iónD ™omo se re™oge en el siguiente result—doFƒe— X un— vF—F ™on distri˜u™ión ™u—lquier— de medi— µ, des™ono™id—D y ™on v—ri—nz—D σ2. ƒe— un— muestr—x = (x1, ..., xN ) de X y l— medi— muestr—lD x¯. inton™esD si N es su(™ientemente elev—do @N > 30 es su(™ienteAD P µ∈ x¯ − z1−α/2 √σ , x¯ + z1−α/2 √σ 1 − α. N Nin est— expresiónD si σ es des™ono™id—D puede sustituirse por l— desvi—™ión típi™— muestr—lD sn−1FEjemplo. €—r— dimension—r el t—m—ño del ˜u'er de un modem ehƒv es ne™es—rio estim—r el promediode p—quetes de d—tos por milisegundo que re™i˜e el modemFƒe ™onsider— que el tiempo @en milisegundosA que tr—ns™urre entre p—quete y p—quete sigue un— distri˜uE™ión exponen™i—l de p—rámetro λF y˜sérvese que l— medi— de est— distri˜u™ión es µ = 1 D tiempo medio λentre p—quetesD por lo que λ es pre™is—mente el promedio de p—quetes por milisegundo que re™i˜e elmodemF €or lo t—ntoD el o˜jetivo es estim—r el p—rámetro λD que es el que se utiliz—rá p—r— dimension—rel modemFwedi—nte un sni'er —™opl—do —l modem p—r— ™—ptur—r d—tos del trá(™oD se tom—n d—tos de los tiemposentre p—quetes de IHHI p—quetesD por lo que se tienen IHHH d—tos de tiempos entre p—quetesF v— medi—de estos tiempos result— ser x¯ = 2.025D siendo l— desvi—™ión típi™— muestr—l de 1.921Fin primer lug—rD v—mos — ™—l™ul—r un interv—lo de ™on(—nz— @—l WS 7A p—r— l— medi— de l— distri˜u™iónDµX x¯ − z0.975 s√n−1 , x¯ + z0.975 s√n−1 = 2.025 ∓ 1.96 × √1.921 = (1.906, 2.144). n n 1000pin—lmenteD d—do que λ = 1 , el interv—lo de ™on(—nz— —l WS 7 de λ es 1 , 1 = (0.466, 0.525) . µ 2.144 1.906e título inform—tivoD el v—lor que se ™onsider— en el dimension—miento del modem es un múltiplo @eldo˜leD por ejemploA del extremo superior del interv—loD en este ™—so HFSPSFProf. Dr. Antonio José Sáez Castillo 145

Dpto de Estadística e I.O. Universidad de Jaén7.3.2. Intervalos de conanza para una proporciónƒe— p l— pro˜—˜ilid—d des™ono™id— de un determin—do eventoD que ll—m—remos éxitoD que puede o™urrir enun determin—do experimentoF ƒupong—mos que tenemos un— muestr— de N re—liz—™iones independientes delexperimentoD y se— pˆ = k l— propor™ión de éxitos en l— muestr—F inton™esD si N es su(™ientemente elev—do N@N > 30AD se tiene que P p∈ pˆ − z1−α/2 pˆ(1 − pˆ) pˆ(1 − pˆ) 1 − α. N , pˆ + z1−α/2 NEjemplo. v— tunt— de end—lu™í— pretende impl—nt—r un progr—m— de —yud— — f—mili—s ™on f—mili—resdependientesF h—do que l— m—yor p—rte de los ƒervi™ios ƒo™i—les son ™ompeten™i— de los muni™ipiosD l—tunt— propor™ion—rá los medios e™onómi™osD pero serán éstos los en™—rg—dos de eje™ut—r el progr—m—Fvos ƒervi™ios ƒo™i—les de ™u—lquier muni™ipio —sumen queD por errores inevit—˜lesD no tod—s l—s f—mili—s— l—s que su˜ven™ion—n reunen los requisitos exigidosD pero l— tunt— les respons—˜iliz— de que esto noo™urr— en más del R 7 de ell—sF ƒi se super— este por™ent—jeD pen—liz—rá —l muni™ipioFin un muni™ipio se muestre—n PHH f—mili—s y se dete™t— que IP de ell—s @T 7A no ™umplen l—s ™ondi™ionesexigid—sF ¾he˜e l— tunt— s—n™ion—r —l muni™ipiocƒi nos (j—mos sólo en el v—lor de l— estim—™ión puntu—lD T 7D sí de˜erí— h—™erloD pero no serí— justoX IPerrores en un— muestr— de PHH pueden no ser un— eviden™i— su(™iente de que el por™ent—je super—r— elR 7Fgonsideremos un un interv—lo de ™on(—nz— p—r— l— propor™ión de errores @S 7 de signi(™—™iónA ™on losd—tos o˜tenidosX 0.06 ∓ 1.96 0.06(1 − 0.06) = (0.027, 0.093). 200€or t—ntoD no h—y eviden™i—s de que el por™ent—je se— superior —l R 7 y no de˜e s—n™ion—rse —l muni™ipioF7.3.3. Intervalos de conanza para la varianzaenálog—menteD pueden d—rse interv—los de ™on(—nz— p—r— l— v—ri—nz— ™on l— medi— ™ono™id— o des™ono™id—Dpero sólo ™u—ndo l— vF—F o˜serv—d— sigue un— distri˜u™ión g—ussi—n—F em˜os ™—sos se re™ogen en el siguienteresult—doFƒe— X un— vF—F ™on distri˜u™ión g—ussi—n— de medi— µ @des™ono™id—A y v—ri—nz— σ2F ƒe— un— muestr—x = (x1, ..., xN ) de X y l— medi— muestr—l x¯. inton™esa X P N (Xi − x¯)2 < σ2 < N (Xi − x¯)2 = 1 − α. i=1 i=1 χ21− α ;N −1 χ2α ;N −1 2 2aEl valor de χ2α/2;N−1 χ21−α/2;N−1y debe buscarse en las tablas de la distribución χ2 u obtenerse mediante el ordenador.146 Prof. Dr. Antonio José Sáez Castillo


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook