Apuntes de Estadística para Ingenieros ipo de prue
nilterl filterl
nilterl l izquierd l dereh ripótesis H0 : β0 = b0 H0 : β0 = b0 H0 : β0 = b0 istdístio H1 : β0 < b0 H1 : β0 = b0 H1 : β0 > b0 de ontrste t= βˆ0 −b0 , se2 = SSyy −βˆ1SSxy = SSE egión n−2 n−2 de rehzo s2e 1 + x¯2 n SSxx pEvlor upuestos t < tα;n−2 |t| > t1−α/2;n−2 t > t1−α;n−2 P [Tn−2 < t] 2P [Tn−2 > |t|] P [T > t] vos ddos en l eión IHFQ gudro IHFQX gontrste sore β010.4.2. Inferencia sobre la ordenada en el origeniste último ejemplo pone de mni(esto que tmién puede tener interés relizr ontrstes sore el vlor deβ0F r elloD el gudro IHFQ desrie el proedimiento de un ontrste de este tipoFpinlmenteD tengmos en uent que podrí ser de interés un ontrste onjunto sore β0 y β1D por ejemploDdel tipo β0 = 0D β1 = 1F ry que deir que este tipo de ontrstes múltiples supern los ontenidos de estsignturF vo únio que podrímos her en un ontexto omo el nuestro es relizr sendos ontrstes soreβ0 y β1 por seprdoD teniendo en uent el nivel de signi(ión de mos ontrstesFEjemplo. in el ejemplo nteriorD vmos ontrstr siD en efetoD β0 = 0D lo que equivldrá onluirque no hy rzones pr pensr que el espetrómetro está ml lirdoF r elloD βˆ0 = y¯ − βˆ1x¯ = 0.636por lo tntoD 0.636 − 0 t = = 0.746. 2.286 1 + 502 11 11000gomoquier que 0.746 < t0.975;9 = 2.261D tmpoo tenemos rzones pr pensr que β0 = 0 on un WS 7de on(nzD luegoD en resumenD no existen rzones pr pensr que el espetrómetro está ml lirdoFEjemplo. smginemos que desemos ompror experimentlmente queD tl y omo predie l ley deyhmD l tensión @V A entre los extremos de un resisteni y l intensidd de orriente @IA que irulpor ell se relionn siguiendo l ley V = R × I,donde R es el vlor de l resisteniF xosotros vmos relizr l omproión on un mism resisteniDvrindo los vlores de l intensiddD por lo que l euión equivle V = β0 + β1 × I,siendo β0 = 0 y β1 = RF vos dtos son los que preen en el gudro IHFRFenemos que relizr un ontrsteD H0 : β0 = 0 frente H1 : β0 = 0 que equivle ontrstr en reliddProf. Dr. Antonio José Sáez Castillo 197
Dpto de Estadística e I.O. Universidad de Jaén yservión s @meA @A I HFIT HFPT P TFSR IFHR Q IPFUT PFHP R IWFPT QFHS S PSFTQ RFHT T QIFVI SFHQ U QVFPI TFHQ V RUFRH UFHQ W SRFHH VFHT IH THFVH VFWW II TVFHH IHFHI gudro IHFRX htos pr l omproión de l vey de yhmque nuestros prtos de medid están ien lirdosD puesto que l ley de yhm olig que β0 = 0Fmos lláX SSxx = 5105.90 SSyy = 107.25 SSxy = 739.49 βˆ1 = 0.14 βˆ0 = 0.25 s2e = 0.022esí puesD 0.25 − 0 t = = 3.531. 0.022 1 + 33.142 11 5105.90hdo que t0.975,9 = 2.262D tenemos que rehzr l hipótesis H0 : β0 = 0D lo que ½contradice la ley deOhm! vo que este nálisis pone de mni(esto es que tenemos lgún prolem en nuestrs mediionesFhejemos un poo de ldo este último resultdoF i queremos estimr el vlor de l resisteniD unestimión puntul esD omo hemos vistoD Rˆ = βˆ1 = 0.14D y un intervlo de on(nz l WS 7 de on(nz@omitimos los detlles de los álulosA result ser (0.141, 0.149)FpinlmenteD podemos tmién proporionr un intervlo de on(nz pr l ordend en el origenD ddopor P β0 ∈ βˆ0 − t1− α ;n−2 × s.e. βˆ0 , βˆ0 + t1− α ;n−2 × s.e. βˆ0 = 1 − α. 2 2Ejemplo. in el ejemplo del espetrómetroD el intervlo de on(nz pr l ordend en el origen es(−1.29, 2.57)D luego es on(le pensr que β0 = 0F in sumD hemos omprodo que es posile β1 = 1 yβ0 = 0D luego hemos omprodo que l euión y = x no puede ser rehzd on los dtos disponilesDes deirD que no hy rzones pr pensr que el espetrómetro esté ml lirdoF198 Prof. Dr. Antonio José Sáez Castillo
Apuntes de Estadística para Ingenieros Ejemplo. in el ejemplo de l omproión de l vey de yhmD el intervlo de on(nz l WS 7 pr l ordend en el origen es (0.09, 0.41)F hdo que ese intervlo no inluye l eroD podemos (rmr on un WS 7 de on(nz que l ret de regresión no ps por el origenD lo que ontrdie l vey de yhmF10.5. El coeciente de correlación linealβˆ1 mide en ierto modo l relión que existe entre l vrile dependiente y l vrile independienteD yque se interpret omo el inremento que sufre Y por d inremento unitrio de XF in emrgoD es unmedid sujet l esl de ls vriles X e Y D de mner que se he difíil poder omprr distintos βˆ1sentre síFin est seión vmos de(nir el llmdo coeciente de correlación linealD que ofree un mediduntittiv de l fortlez de l relión linel entre X e Y en l muestrD pero que difereni de βˆ1D esdimensionlD y que sus vlores siempre están entre −1 y 1D sen ules sen ls uniddes de medid de lsvrilesFhd un muestr de vlores de dos vriles (x1, y1) , ..., (xn, yn)D el coeciente de correlación linealmuestral r se de(ne omo SSxy √ SSxx SSyy r= SSxxSSyy = βˆ1 .gomo omentámosD l interpretión del vlor de r es l siguienteX r erno o igul H impli po o ningun relión linel entre X e Y. gunto más se erque I ó EID más fuerte será l relión linel entre X e Y F i r = ±1D todos los puntos erán extmente en l ret de regresiónF
n vlor positivo de r impli que Y tiende umentr undo X umentD y es tendeni es más usd unto más erno está r de IF
n vlor negtivo de r impli que Y disminuye undo X umentD y es tendeni es más usd unto más erno está r de EIFNota. in l pigur IHFS preen lgunos de los supuestos que mos de enunir respeto losdistintos vlores de rF ry que her hinpié en que r sólo es pz de desurir l preseni de reliónde tipo linelF iD omo en el último grá(o l dereh de est (gurD l relión entre X e Y no es detipo linelD r no es deudo omo indidor de l fuerz de es reliónFNota. in l pigur IHFT pree un vlor típio entre un onjunto de dtos on un relión linel másque evidenteF or ulp de este dtoD el oe(iente de orrelión linel será joF ¾ué dee herse enProf. Dr. Antonio José Sáez Castillo 199
Dpto de Estadística e I.O. Universidad de Jaén 0 20 40 60 80 100 −60 −40 −20 0 −30 −20 −10 0 10 20 6000 10000 −100 0 2000 0 20 60 100 0 20 60 100 0 20 60 100 0 20 60 100 Correlación lineal positiva fuerte Correlación lineal negativa fuerte Ausencia de correlación lineal Correlación parabólica pigur IHFSX lores de r y sus impliionesFeste soc in generlD no se deen eliminr dtos de un muestrD pero podrí ourrir que dtos típiosorrespondn errores en l tom de ls muestrsD en el registro de los dtos oD inlusoD que relmente noproedn de l mism polión que el resto de los dtosX en ese soD eliminrlos podrí estr justi(dode r nlizr de un form más preis l relión linel entre los dtosFNota. gorrelión frente usliddF ry que her un dverteni importnte er de ls interEpretiones del oe(iente de orrelión linelF is muy freuente que se utilie pr justi(r relionesusEefetoD y eso es un grve errorF r sólo indi preseni de relión entre ls vrilesD pero eso nopermite inferirD por ejemploD que un inremento de X se l us de un inremento o un disminuiónde Y FEjemplo. r los dtos del ejemplo sore l soriónD lulemos r e interpretémosloFin el so del porentje de sorión en funión del volumen de ompuestoD r = √ 36.24 = 0.129; 37.30 × 2126.61vemos que l relión es muy pequeñY de hehoD ompromos medinte un ontrste de hipótesis soreβ1 que er no signi(tivFin el so del porentje de sorión en funión del tiempo de soriónD r = √ 36.24 = 0.944. 744 × 2126.61ist relión sí result ser muy fuerte y en sentido diretoF or eso l relizr el test sore β1D éste síresultó ser signi(tivoFxo podemos olvidr que el oe(iente de orrelión linel muestrlD rD mide l orrelión entre los vlores200 Prof. Dr. Antonio José Sáez Castillo
Apuntes de Estadística para Ingenieros r = 0.27 r^2 = 0.07 Slope = 0.26 Intercept = 3.56 y End 0 2 4 6 8 10 LS Line Add Point Delete Point 0 2 4 6 8 10 Move Point x pigur IHFTX
n dto típio entre dtos reliondos linelmenteFde X y de Y en l muestrF ixiste un oe(iente de orrelión linel similr pero que se re(ere todos losposiles vlores de l vrileF ividentementeD r es un estimdor de este oe(iente polionlFhds dos vriles X e Y D el coeciente de correlación lineal poblacional, ρD se de(ne omoa √ ρ = E [(X√− EX) (Y − EY )] = √V arX β1. V arXV arY V arYaEste concepto se estudia también en el capítulo de vectores aleatorios.snmeditmente surge l uestión de ls inferenisF odemos y deemos utilizr r pr her inferenissore ρF he tods formsD en relidd ests inferenis son equivlentes ls que hemos sore β1D y que lrelión entre β1 y ρ provo que l hipótesis H0 : β1 = 0 se equivlente l hipótesis H0 : ρ = 0F odemosDpor lo tntoD utilizr el ontrste resumido en el gudro IHFP pr b1 = 0 y teniendo en uent que √ n−2 r√ . t = 1 − r2Ejemplo. mos ontrstr H0 : ρ = 0 frente H1 : ρ = 0 de nuevo en el ejemplo de l soriónF √ 0√.944× 9−2il estdístio de ontrste es t = 1−0.9442 = 7.60D que oinide on el vlor de t undo ontrstmosH0 : β1 = 0D frente H1 : β1 = 0F emos queD en efetoD es el mismo ontrsteFProf. Dr. Antonio José Sáez Castillo 201
10.6. Dpto de Estadística e I.O. Universidad de Jaén Fiabilidad de la recta de regresión. El coeciente de determi- nación linealgomo hemos vistoD el oe(iente de orrelión linel puede interpretrse omo un medid de l ontriuiónde un vrile l prediión de l otr medinte l ret de regresiónF in est seión vmos ver unmedid más deud pr vlorr hst qué punto l vrile independiente ontriuye predeir l vriledependienteFeordemos lo que hímos oservdo en l pigur IHFRF ellí tenímos un retD l de l izquierdD queprentemente er buenaD mientrs que l de l dereh prentemente er peorF in emrgoD y dijimos queeso er inextoF in relidd nosotros no desemos ompror extmente si los puntos están o no en torno l ret de regresiónD sino en qué medid l ret de regresión expli Y en funión de XFmos entrr en detllesF xeesitmos que l ret explique Y en funión de X porque Y tiene dtos quepresentn un iert vriiliddX ¾uánt vriiliddc gundo de(nimos l vrinzD es vriilidd lmedimos omo n SSyy = (yi − y¯)2 , i=1de tl mner que unto más vríen los dtos de Y myor será SSyyF or otr prteD undo justmos porl ret de regresión yˆx = βˆ0 + βˆ1 × xD medimos el error que ometemos en el juste on n SSE = (yi − yˆx)2 . i=1mos ponernos en ls dos situiones límite que pueden drse en unto l preisión de un ret deregresiónX √ √V arY ρ i X no tiene ningún tipo de relión linel on Y D entones ρ = 0D en uyo so β1 = = 0 y V arX l ret es simplemente yˆi = β0 + β1xi = y¯. is deirD si X no tiene ningún tipo de relión linel on Y D entones l mejor prediión que podemos dr por el método de mínimos udrdos es l mediF edemásD en ese so n SSE = (yi − yˆi)2 i=1 n = (yi − y¯)2 = SSyy, i=1 es deirD SSE es el totl de l vriión de los vlores de Y F istá lro que est es l peor de ls situiones posiles de r l preisiónF √ √V arY F edemásD si l i l relión linel entre X eY es totlD entones ρ = 1, en uyo so β1 = V arX202 Prof. Dr. Antonio José Sáez Castillo
Apuntes de Estadística para Ingenieros relión linel es totlD y = yˆxD de mner que n SSE = (yi − yˆi)2 = 0. i=1 istD desde luegoD es l mejor de ls situiones posilesFv ide de l medid que vmos utilizr es unti(r en qué medid estmos más er o más lejos deests dos situionesF hdo que SSED que es l medid del error de l ret de regresiónD puede ir de 0 @mejorsituión posileA SSyy @peor situión posileAD tn sólo tenemos que reltivizr en un esl ómod unmedid de este errorFe de(ne el coeciente de determinación lineal omo r2 = 1 − SSE . SSyyxótese que l notión es r l udrdoD y queD en efetoD en un regresión linel simple oinide on eloe(iente de orrelión linel l udrdoFor lo tntoD l interpretión de r2 es l medid en que X ontriuye l expliión de Y en un esl deH ID donde el H indi que el error es el totl de l vriión de los vlores de Y y el I es l preisión totlDel error HF v medid suele drse en porentjeF hiho de otr formXAproximadamente 100 × r2 % de la variación total de los valores de Y respecto de su mediapueden ser explicada mediante la recta de regresión de Y dada XF Ejemplo. in el ejemplo de l sorión explid por el tiempo de exposiiónD r2 = 0.892D de mner que podemos deir que el VW 7 de l vriión totl de los vlores del porentje de sorión puede ser explid medinte l ret de mínimos udrdos ddo el tiempo de exposiiónF is evidente que es un porentje importnteD que proporionrá prediiones reltivmente (lesF10.7. Predicción y estimación a partir del modeloeordemos que en el modelo justdo de l ret de regresiónD yˆx = βˆ0 + βˆ1xyD por otro ldoD E [Y /X=x] = β0 + β1x,luego yˆx puede interpretrse de dos formsXIF gomo predicción del vlor que tomrá Y undo X = xFProf. Dr. Antonio José Sáez Castillo 203
Dpto de Estadística e I.O. Universidad de Jaén PF gomo estimación del vlor medio de Y pr el vlor X = x, es deirD de E [Y /X=x]Fems ntiddes están sujets inertidumreD que será tnto myor unto más vriilidd teng Y, yGopeor se el juste medinte l ret de regresiónFvo que vmos ver en est seión pr onluir el tem es ómo estleer regiones de conanza pr estsprediiones de los vlores de Y y pr ls estimiones de los vlores medios de Y ddos vlores de XF istosresultdos requieren que se veri(quen los supuestos diionles sore los errores ddos en l seión IHFQFodemos grntizr on un (1 − α) × 100 % de on(nz que undo X = xD el vlor medio de Y se enuentren el intervlo 1 (x − x¯)2 yˆx − t1−α/2;n−2 × se + SSxx , yˆx + t1−α/2;n−2 × se 1 (x − x¯)2 n + , n SSxxes deirD podemos grntizr que P E[Y /X=x] ∈ yˆx ∓ t1−α/2;n−2 × se 1 + (x − x¯)2 |X=x = 1 − α. n SSxxesimismoD podemos grntizr on un (1 − α)×100 % de on(nz que undo X = xD el vlor Y se enuentren el intervlo yˆx − t1−α/2;n−2 × se 1 (x − x¯)2 × 1 (x − x¯)2 1 + n + SSxx , yˆx + t1−α/2;n−2 se 1+ + , n SSxxes deirD podemos grntizr que 1 (x − x¯)2 P Y ∈ yˆx ∓ t1−α/2;n−2 × se 1+ + SSxx |X=x = 1 − α nNota. xo deemos olvidr que los modelos de regresión que podemos estimr lo son prtir de los dtosde un muestr de vlores de X e Y F e prtir de estos modelos podemos otenerD omo mos dereordrD prediiones y estimiones pr vlores ddos de X. hdo que el modelo se s preismenteen esos valores de la muestraD no es onveniente her prediiones y estimiones pr vlores de Xque se enuentren fuer del rngo de vlores de X en l muestrFEjemplo. in l pigur IHFU pree l ret de regresión pr los dtos del ejemplo sore l sorióndel ompuesto junto on línes que ontienen los intervlos de on(nz l WS 7 pr ls prediiones yls estimiones soids los distintos vlores de XF204 Prof. Dr. Antonio José Sáez Castillo
Apuntes de Estadística para Ingenieros x 110 105 100 Resistencia observed 95 fit conf int pred int 90 85 80 50 60 70 x 80 90 100 Velocidadpigur IHFUX et de regresión on intervlos de on(nz l WS 7 pr ls prediiones @frnjs más exteErioresA y pr ls estimiones @frnjs interioresA en el ejemplo de l soriónFysérvese que l mplitud de los intervlos se he myor en los vlores más extremos de XF is deirDlos errores en ls estimiones y en ls prediiones son myores en estos vlores más extremosF istodee ser un motivo ñdir l omentrio nterior pr no her estimiones ni prediiones fuer delrngo de vlores de X en l muestrFor otr prteD nos plnteámos l omienzo de pítulo que serí de interés estimr el porentje desorión que tendrá lguien que se somet un tiempo de exposiión l ompuesto de V horsF iso esun prediiónD sí que omo estimión puntul dremos yˆ8 = 46.82 + 1.60 × 8 = 59.59y omo intervlo de prediión l WS 7D yˆx ∓ t1−α/2;n−2 × se 1 (x − x¯)2 = ∓ × 1 (8 − 12)2 1 + + 59.59 2.36 5.73 1+ + = (45.17, 74.00) . n SSxx 9 744or el ontrrioD imginemos que los trjdores de un empres vn estr sometidos todos ellos un tiempo de exposiión de V horsF in ese soD no tiene sentido que nos plnteemos un prediiónpr ser uál v ser su porentje de soriónD y que d uno de ellos tendrá un porentjedistintoY lo que sí tiene sentido es que nos plnteemos uál v ser el porentje medio de sorión delos trjdores sometidos V hors de exposiión l ompuestoF isto es un ejemplo de l estimiónde un vlor promedioF v estimión puntul es l mism que en l prediiónD es deirD SWFSWD pero elintervlo de on(nz l WS 7 es yˆx ∓ t1−α/2;n−2 × se 1 + (x − x¯)2 = 59.59 ∓ 2.36 × 5.73 1 (8 − 12)2 + = (54.66, 64.52) . n SSxx 9 744Prof. Dr. Antonio José Sáez Castillo 205
Dpto de Estadística e I.O. Universidad de Jaén10.8. Diagnosis del modeloodo lo reliondo on infereni sore el modelo de regresión se h sdo en el umplimiento de lossupuestos desritos en el prtdo IHFQF gomo y omentmosD en l medid en que todos o lgunos de estossupuestos no se denD ls onlusiones que se extrign en l infereni sore el modelo podrín no ser válidsFis por ello que es neesrio ompror estos supuestos medinte herrmients de dignóstioF equí vmos ver sólo ls más ásisD vinulds l nálisis de los residuos y l grá( de residuos frente los vloresjustdosF10.8.1. Normalidad de los residuosintre los supuestos del modelo onsidermos que los residuosD es deirD i = yi − yˆisiguen un distriuión normlFxi que deir tiene que ompror est hipótesis en trivilX strá on lulr los residuosD justrles undistriuión norml y relizr un ontrste de ondd de juste medinteD por ejemploD el test de uolmogorovEmirno'F10.8.2. Gráca de residuos frente a valores ajustadosil resto de supuestos se re(eren l vrinz onstnte de los residuosD su medi ero y su independeniF
n de ls herrmients dignóstis más simples pr ests hipótesis es l llmd gráca de residuos frentea valores ajustadosF e trt de representr en unos ejes rtesinosXIF in el eje D los vlores yˆi de l muestrFPF in el eje D los residuosD i = yi − yˆiFritulmenteD se le ñde est grá( l ret de regresión de l nue de puntos resultnteFmos ir viendo ómo dee ser est grá( en el so de que se umpln d uno de los supuestosXIF i l medi de los residuos es eroD l nue de puntos de l grá( dee hernos pensr en un ret de regresión horizontl situd en el eroD indindo que se ul se el vlor yˆiD l medi de los residuos es eroFPF i los errores son independientesD no dee oservrse ningún patrón en l grá(D es deirD ningún efeto en ell que hg pensr en lgún tipo de relión entre yˆi y iFQF i los errores tienen un vrinz onstnte @se hl entones de homocedasticidadAD l dispersión vertil de los puntos de l grá( no dee vrir según vríe el eje F in so ontrrioD se hl de heterocedasticidadF
n últim oserviónX si se dn tods ls ondiiones que mos de menionr sore l grá( deresiduos frente vlores justdosD entones es probableD pero no se tiene l seguriddD de que los supuestosdel modelo sen iertosF206 Prof. Dr. Antonio José Sáez Castillo
ResidualsApuntes de Estadística para Ingenieros −15 −10 −5 0 5 Residuals vs Fitted 5 4 2 50 55 60 65 70 75 80 85 Fitted values lm(Porcentaje.Absorbido ~ Tiempo) pigur IHFVX qrá( de vlores justdos vs residuos en el ejemplo de l sorión Ejemplo. or últim vez vmos onsiderr el ejemplo de l soriónF in l pigur IHFV pree el grá(o de residuos vs vlores justdos y podemos ver que primer vist pree que se dn ls ondiiones requeridsX IF vos puntos se sitún en torno l eje Y = 0D indindo que l medi de los residuos pree ser eroF PF xo se oservn ptrones en los residuosF QF xo se oserv myor vriilidd en lguns prtes del grá(oF ry que tener en uent que son muy poos dtos pr sr onlusionesFProf. Dr. Antonio José Sáez Castillo 207
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235