CAPITULO 5 - MODELOS DE REGRESiÓN Tabla 5.4 Ecuaciones normales para algunos modelos de regresión. Modelo de regresi6n lineal Sistema de ecuaciones normales y=Po+p¡x+e poblacional nn y=a+bx mues/ral na+b ¿xl= ¿y¡ ¡- / ¡- / ¿n n n a ¿xl+ b x: = ¿X¡y¡ 1- / ; - / ; - / nn y=po+p/lnx+e poblacional na+b ¿Inx¡= ¿y¡ ¡- / ¡- / nn n y=a+blnx mues/ral a ¿Inx¡+b ¿(lnxl/= ¿y¡lnx¡ ;- 1 ¡- l ¡- J Y = PoxtI'+ e } poblacional ¿ ¿n n lny = InPo +p¡lnx +e n In a + b In x¡ = In y¡ ;- / ;- / ¿n n n Iny=lna+blnx mues/ral In a ¿In x¡+ b ¿(In x;/ = In x¡ Iny¡ / - / 1- / ;=1 }y =Po efl,x+ e poblacional ¿n n Iny=lnPo+p¡x+e n In a + b ¿x¡ = Iny¡ ;- / i=I nn n Iny=ln a +bx mues/ral In a ¿x;+ b¿(X)2 = ¿x¡lny; ; - / 1- / 1- / y=Po+ px¡ +e poblacional n1 n y=a+ -xb mues/ral na+b ¿-=¿y¡ ¡ _ I Xi ¡ _ I xia¿n -1 +b¿n -1 =¿n ~y . ; _ 1 X¡ 1_ / ¡ _ I x¡ Y =Pop/'+ e ¿ - ¿n 1n 1 } poblacional n In a + In b = In y¡ Iny = In Po +-X Inp¡+e ¡ _ / x¡ ¡ _ / 1 mues/ral n 1 n 1 n Iny. Ina¿-+b¿2=¿-' Iny=lna+ -X Inb ¡ _ / x¡ 1_ / XI ¡ _ / x¡ y=Po+P¡X+P2r +e poblacional n nn y=a+bx+d mues/ral na +b ¿xl+c ¿x/=¿y¡ ;- / i = I i- J n n nn a ¿x¡+b ¿x/+c¿x; = ¿x¡y¡ ;- / ¡- I ¡= / ;=/ ¿n n n n a ¿x:+ b ¿x/+ C ¿x/ = X¡2y¡ ; - / ; - / ¡ - I ; \"\"' 1 Continúa en la página siguiente ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 139
VIVIANA VARGAS FRANCO Sistema de ecuaciones normales Viene de la página anterior Modelo de regresión lineal na+b ix,'h+eix,=iy, ¡ - I 1- 1 ¡ - 1 y = flo +fl¡x'h +fllX + e poblaeional a ix,'h+bix,+e ix~=ix: y, /- / /- / /- / ;- / y=a+bx'h + ex muestral a ix,+bix~+e ix/ = ix/y/ /- / /- / /- 1 ¡- I y =flo +fl¡ln x +fll (In x / + e poblacional f fna + b t}n x/ + c (In x/l = y/ /- / /- / 1- / y =a + blnx + e (In x/ muestral fa f/nx,+b f(lnx)'+c f(lnx¡}J= y/In x/ 1- / / - 1 / - / 1- / f f f fa (In x¡l + b (In xli + c (In XI)'= y¡ (In x¡l /- / /- / 1- 1 /- / y = floefl'xxP' + e } fn In a +b fx¡+c f/nx¡ = Iny¡ lny =Inflo +fl¡x +fllln x + e poblacional /- 1 /- / /- / Ina fx¡+b fx:+c fx¡ (Inx¡l= fX¡lny, '-1 /-/ ¡- I ¡- l lny =ln a +bx+clnx muestral In a f/nx¡+b fX¡lnx¡+e f(lnx¡l= f/nY¡lnx¡ 1- 1 /- / ;- / ,- / - fl2 +e ;fl¡< O } ¿ ¿n n e Y 1 +efl·+fl,x poblacional na + b x¡ = In (- - 1 ) In (L -1 )=flo+fl¡x+e ¡ - ¡ / - ¡ y¡ y ,. \" ,. e I n (ye- - 1 ) = a x + b a ¿x¡+b¿x/=¿x¡ln (- -1) y¡¡ - / / - / / - / muestral y =floefl,(x-fl,/+ e,°fl¡<O } ¿ ( ¿n n Iny=lnflo+fl/(x-fll/ +e poblacional n In a + b x¡ - e/ = In y¡ /- / ¡- / Iny =ln a + b(x- e/ muestral In a i(x,-e/+ bi(x¡-e/= i (x,-e/lny¡ /- / /- ¡ /- / 140 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPrTULO 5 - MODELOS DE REGRESiÓN Ejemplo 5.2 Calcular el modelo potencial y =flo X fJ1 + e para estimar niveles de sólidos suspendidos a partir de valores de turbiedad, en una estación de monitoreo del río Cauca, con los datos presentados en el ejemplo 5.1. Con el fin de seguir los procedimientos para estimar los coeficientes de regresión de la línea recta, se debe linealizar la ecuación potencial aplicando logaritmo natural, generando la ecuación 5.11, que es lineal en los parámetros de regresiónfloY fll' In y =Inflo +fllln x + e ecuación poblacional (5 .11) In y = In a + b In x ecuación muestral En la Figura 5.7 se presenta el diagrama de dispersión para esta ecuación. 8 7• ., 7 .:~;¡; 1:: 6 ~ :oc 6 5 :~:'':\"\": .~ ~'\" 5 .~...¡ 4 4 3 34 45 5667 7 LN de turbiedad Figura 5.7 Diagrama de dispersión para el logaritmo de turbiedad y el logaritmo de sólidos suspendidos. Para estimar a y b se define en la ecuación 5.12 la fórmula de los residuales para el modelo transformado a logaritmos. nn n Le: = L(y¡-y¡l =L(lny¡-ln a-b Inx)2 (5.12) /- 1 ¡=1 ¡= I Hallando las derivadas parciales con respecto a cada uno de los parámetros a estimar, se obtienen las ecuaciones 5.13 y 5.14. ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS 141
VIVIANA VARGAS FRANCO n (5.13) (5.14) o~e: = _2 f(lny,-In a-b Inx¡) oa a ¡-1 n oLe: n ¿~ = - 2 In x¡ ( In Y¡ -In a - b In x¡) ob ¡=1 Igualando a cero simultáneamente las dos ecuaciones anteriores y despejando se genera el sistema de ecuaciones (5 .15), denominado sistemas de ecuaciones normales de la regresión, para el modelo potencial. Este sistema coincide con el presentado en la Tabla 5.4. ¿ ¿n n n In a + b In x¡ = In y¡ 1-1 1-1 ¿n n n (5.15) In a ~)nx¡+b ¿(Inx,l= Inx¡ Iny, ¡-1 ¡-1 ¡-1 Con el fin de calcular las diversas sumas que se requieren para la estimación de los coeficientes, se presentan en la Tabla 5.5 los datos que permiten reemplazar las ecuaciones normales del modelo potencial, para el ejemplo 5.2. Tabla 5.5. Valores que permiten estimar el sistema de ecuaciones normales del modelo potencial y =/Jo xP1 + e Observación fecha turbiedad Sólidos In In Un tur)x Un tur)x (x¡} suspendidos (turbiedad) (sólidos (lntur) Un sólidos) i (UNT) ( lnx¡} suspendidos) (lnx;/ (lnx,lny¡) (y¡} ( lny,) 1 04·Mar·91 42 (mgll) 3.74 13,97 15,93 2 07·Mar-91 72 4,28 4,26 18,29 21,31 3 ll -Mar-91 360 71 5,89 4,98 34,65 36,64 4 14-Mar-91 35 146 3,56 6,22 12,64 14,62 5 08-Abr-91 65 505 4,17 4,11 17,43 20,51 6 ll-Abr-91 120 61 4.79 4,91 22,92 24,56 7 15-Abr-91 100 136 4,61 5,13 21,21 24,16 8 14-May-91 190 169 5,25 5,25 27,53 29,36 190 5,59 269 Continúa en la página siguiente 142 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN Viene de la página anterior Observaci6n turbiedad Sólidos In In (In tur}x (In tur}x suspendidos (turbiedad) (sólidos (Inturl (In sólidosl i fecha (x¡) ( Inx¡) suspendidosl (In xi (lnx¡lny¡) (UNT) (y¡) ( Iny¡) (mgll) 6,48 9 16·May·91 650 5,44 6,89 41,95 44,60 10 20·May·91 230 978 4,65 5,98 29,57 32,50 11 23·May·91 105 394 4,32 5,17 21,66 24,06 12 27-May·91 75 176 4,23 4,79 18,64 20,67 13 30·May·91 69 120 4,83 4,60 17,93 19,46 14 04·Jun·91 125 99 4,44 4,89 23,31 23,61 15 06·Jun·91 85 133 3,47 4,94 19,74 21,95 16 11·Jun·91 32 140 3,53 3,97 12,01 13,76 17 13·Jun·91 34 53 4,44 3,99 12,44 14,07 18 17·Jun·91 85 54 6,11 4,81 19,74 21,38 19 24·Jun·91 450 123 3,93 6,34 37,32 38,75 20 02·Jul·91 568 3,61 4,43 15,46 17,42 21 04·Jul·91 51 84 4,13 4,29 13,04 15,49 22 11·Jul·91 37 73 4,43 17,03 18,29 62 84 99,88 22 109,98 468,47 513,09 3074 4626 L=suma I- l Utilizando los resultados de la tabla anterior y reemplazando en las ecuaciones 5.15 . El sistema de ecuaciones lineales para el modelo potencial queda expresado como se presenta a continuación: 22 In a + 99,88 b =109,98 99,88 In a + 468,47 b = 513,09 Resolviendo este sistema de ecuaciones con incógnitas In(a) y b, se tiene que: b = 0,917814 Y In a = 0,8322 Se aplica antilogaritmo para obtener el valor de a: a =2,2984 Por lo tanto el modelo de regresión queda definido por la ecuación 5.16 ó 5.17. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 143
VIVIANA VARGAS FRANCO In SS = 0,8322 + 0,9178 In TU (5.16) o (5.17) SS = 2,2984 TUo.m814 Los coeficientes de la ecuación 5,16 se pueden interpretar de la siguiente forma: In a = 0,832 ~ para un valor de turbiedad de 1 UNT, el valor del logaritmo de sólidos suspendidos es de 0,8322. b =0,9178 ~ por cada unidad de cambio en el logaritmo de turbiedad, el logaritmo de sólidos suspendidos aumenta en 0,9178. En la ecuación 5,17 el coeficiente de la potencia b = 0,917814 tiene la misma interpretación que en la ecuación 5,16, mientras que el valor de a = 2,2984 es el valor de sólidos suspendidos, en mg/l, para un valor de turbiedad de 1 UNT. Como se puede apreciar, las variables sólidos suspendidos y turbiedad se ajustaron de manera adecuada al modelo de la línea recta y al modelo potencial, tal como lo evidenciaron los respectivos diagramas de dispersión. Surge entonces, de manera natural, la pregunta: ¿Cuál es el mejor modelo? Para responder esta pregunta es necesario estudiar los conceptos de correlación, que se presentan en el siguiente numeral. En la Figura 5.8 se ilustran algunas gráficas de modelos no lineales en los parámetros, pero que son linealizables por medio de una transformación matemática, como se presentó en la Tabla 5.3. 144 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPfTULO 5 - MODELOS DE REGRESiÓN ,It•I ~ ,I I t 1-...It.¡ ••I t •I c-;.\",.... I I I ••I I I v.- 1M -.I----------------------------- •I I tic Jl 61. 7 7 6>' 116 x 116 x y y /1 y=ax6 --_-:/1 y=ax6 y b>O x 1x y b<O y =a +blnx y=a +blnx X X Figura 5. 8 Tendencias de algunos modelos no lineales en los parámetros (Behar, 1996). ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 145
VIVIANA VARGAS FRANCO , , b<' ,-u\"\" l: ,-_\"\" \" t------::;--------------- \"1------------------------ xx y 1 y (a + be-X) l/a 1- - - - 1- - - - - - - - :.::.;:..::.::- - - - - ox (a> 0, b> 0, e > O) (a > 0, b> 0, e < O) , y ,,,,,,,,,,,, y y=a + be-x y =a + be-x \" a--r---------------------+ ,, ,,, x ~ a x Figura 5.8 Tendencias de algunos modelos no lineales en los parámetros (Continuación) (Behar, 1996). 146 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN 5.5 Coeficiente de correlación Una pregunta que surge después de la estimación del modelo de regresión, es: ¿cuál es la intensidad de la relación matemática entre las dos o más variables analizadas? Las técnicas estadísticas que permiten responder y determinar el grado de intensidad de la relación del conjunto de variables se denomina análisis de correlación. Un indicador muy utilizado en el análisis de correlación es el denominado coeficiente de correlación muestral, denotado por r, el cual se estima con el conjunto de datos analizado. El coeficiente de correlación muestral, r, fue definido por el investigador Kart Pearson, aproximadamente en 1900. Este coeficiente describe la intensidad lineal de la relación entre dos conjuntos de variables de nivel de intervalo o de razón, y no proporciona necesariamente una medida de la causalidad entre ambas variables. r es una medida de la dependencia estadística lineal, es decir, la ecuación de la línea recta, de las variables x y y. También se le denomina r de Pearson o coeficiente de correlación producto-momento de Pearson, el cual se puede calcular con las ecuaciones 5.18, o, 5.19. n n (5.18) ¿(x¡-x)(y¡-y) ¿(xi-xl ¡- / ¡-/ r= =b n nn ¿(xi-xl ¿(y¡-i l ¿(y¡-il ¡-/ ¡-/ ¡-1 Donde b, es el coeficiente de correlación estimado en el modelo de regresión lineal. (5.19) Propiedades del coeficiente de correlación r A continuación se describen las principales propiedades del coeficiente de correlación: ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 147
VIVIANA VARGAS FRANCO r es un valor adimensional, que no depende de la magnitud de las variables analizadas. • El valor del coeficiente r se encuentra entre: -1 ~ r ~ 1, en términos porcentuales -100% ~ r ~ 100%. • El coeficiente de correlación tiene el mismo signo que la pendiente de la ecuación; (a) r> Osí y sólo si b > O; (b) r < Osí y sólo si b < O. Tal como se presenta a continuación: y y r<' 6<' x x a) • • b) Un valor de r == O significa que no hay correlación lineal entre las variables estudiadas; las variables no presentan ningún grado de dependencia lineal(a) o la dependencia es curvilínea (b) como se observa a continuación: y y • • r 'Z O l .• • • •• x • • r -::, O • • I • •• -=----. • x a) • t• b) 148 ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN • Valores de r cercanos a O indican que hay dependencia estadística lineal débil, por lo tanto las predicciones que se realicen a partir de la recta de regresión son poco fiables . También, es posible en estos casos que la relación pueda ser no lineal entre las variables. Si las variables son independientes r =O, la inversa no es necesariamente cierta. • Un valor de r cercano a 1 (o 100%) indica dependencia lineal fuerte (las variables aumentan al mismo tiempo) y por lo tanto las predicciones que se realicen a partir de la recta de regresión serán bastante fiables. En este caso existe una correlación lineal positiva fuerte, como se observa en la siguiente figura: y r=:.1 x • Un valor de r cercano a -1 indica dependencia lineal fuerte (una variable disminuye a medida que la otra crece) y por lo tanto las predicciones que se realicen a partir de la recta de regresión serán bastante fiables, en forma gráfica se muestra a continuación: y r =:. -1 x ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 149
VIVIANA VARGAS FRANCO Valores de r = 1 o r =-1 (r = 100% o r =-100 %) se presentan cuando los puntos observados se encuentran sobre la línea de regresión; existe una dependencia perfecta entre las dos variables analizadas, como se observa a continuación: y. r=-1 x a) b) Las variables x y y pueden estar correlacionadas linealmente, es decir, un valor de r cercano a ±1 (±100%), lo cual no significa que x causa a yo y causa a x; el modelo de regresión no evidencia una relación de casualidad. Las variables x y y pueden ser depen,dientes, pero su coeficiente de correlación, r, puede ser O, esto sucede en el caso de tendencias parabólicas o exponenciales, pues el coeficiente de correlación mide el grado de asociación de la línea recta, de las dos variables analizadas. Si dos variables aleatorias son independientes también son no correlacionadas, pero si dos variables aleatorias no están correlacionadas no necesariamente son independientes. Se puede definir una guía que permita analizar la intensidad y la dirección del coeficiente de correlación, tal como se presenta a continuación: Co rre lac ión Co rre lac ión Correlación Co rre lac ió n Corre lac ión Corre lació n negativa negati va negativa pos iti va pos iti va positiva fuerte moderada débil débil moderada fuerte r=-1 r=- 0.7 r=-0.4 r=O r=0.4 r=0.7 r=1 Correlación positiva t No hay j correlación Co rre lac ión Corre lació n negati va Correlación negativa positi va per fec ta perfecta ~ ~ 150 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN La anterior guía debe tomarse como un apoyo en el análisis del coeficiente de correlación, pero siempre el coeficiente de correlación debe analizarse en el contexto del fenómeno en estudio. ¿Qué no mide r? • El coeficiente de correlación muestral, r, no mide la magnitud de la pendiente, es decir, la fuerza de la asociación lineal entre las dos variables en estudio, como se presenta en seguida: Igual valor de r • El coeficiente de correlación muestral tampoco mide 10 apropiado del modelo lineal, como se muestra a continuación: ... / Igual valor de r Si r = 0,3 Yr = 0,6, significa, solamente, que se tienen dos correlaciones positivas, una algo mayor que la otra. No se puede concluir que r = 0,6 indica una relación lineal dos veces mejor que la indicada por el valor r = 0,3. ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 151
VIVIANA VARGAS FRANCO Ejemplo 5.3 Calcular el coeficiente de correlación del modelo lineal estimado para sólidos suspendidos y turbiedad, presentado en la ecuación 5.10: E (y) =y = SS = 13,5856 + 1,40765 * TU En la Tabla 5.6 se muestran las columnas que permiten calcular el coeficiente de correlación, el cual se estima a través de la ecuación 5.18. r=b n 512356,36 ¿(xi-xl 1035004,36 = 0,99 o r = 99% ;=1 = 1,40765* n ~:rY;-YY ;=1 El valor del coeficiente de correlación indica que los sólidos suspendidos y la turbiedad, presentan una buena relación lineal, es decir, los datos muestrales se encuentran muy cercanos a la recta estimada. Tabla 5.6 Valores que permiten estimar el coeficiente de correlación para el modelo de regresión lineal entre sólidos suspendidos y turbiedad. Observación Turbiedad Sólidos (xi-xl (Y/-yi i IUNT) suspendidos Irng/ll 9549,20 19396,13 1 Xi Yi 2 4586,00 4130,63 3 42 71 4 72 146 48523,28 86865.77 5 360 505 6 35 61 10966,28 22281,53 7 65 136 8 120 169 5583.08 5516,03 9 100 190 10 190 269 388,88 1703.21 11 650 978 12 230 394 1577,68 410.87 13 105 176 14 75 120 2528,08 3449,21 15 69 99 125 133 260385.68 589409,35 85 140 8150.48 33756.71 1205.48 1174.43 4188.68 8148,67 5001.32 12381.01 216.68 5970.65 2994,28 4937.87 Continúa en la página siguiente 152 ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN Viene de la p ágina anterior Observeción Turbiedad Sólidos (x¡-xl (Y¡-yl i (UNT) suspendidos (mg/l) XI 11603,60 24733.85 16 YI 11176,72 24420.31 17 32 2994,28 7616.05 18 34 53 96273.68 127970,75 19 85 54 7871.24 15944,11 20 450 123 10551,40 18843,05 21 51 568 6040,40 15944.11 22 37 84 62 73 512356.36 1035004.36 22 84 ¿=suma 3074 4626 ¡- 1 139.72 210.27 Media Ejemplo 5.4 Calcular el coeficiente de correlación del modelo potencial y ='p~J para sólidos suspendidos y turbiedad, considerando los datos del ejemplo 5.2. El modelo se calculó en la ecuación 5.17: ss = *2,2984 TUO,91 7814 En la Tabla 5.7 se presentan las columnas que permiten calcular el coeficiente de correlación, el cual se estima a través de la ecuación 5.18, con las variables transformadas a In. ¿(r=b \" In x¡-In xl 15,06 ¡- I ------- =0,917814 * - - - = 0,98 o r =98% n 13,11 ¿(lny¡-Inyl ¡- I El valor del coeficiente de correlación indica que el logaritmo natural de los sólidos suspendidos y el logaritmo natural de la turbiedad presentan una buena correlación lineal, es decir, los datos analizados se encuentran muy cercanos a la recta estimada. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 153
VIVIANA VARGAS FRANCO Tabla 5.7 Valores que permiten estimar el coeficiente de correlación para el modelo de regresión lineal entre In de sólidos suspendidos y In de turbiedad. Observación Turbiedad S6lidos In Turbiedad In Sólidos L,(In x/- bt x)' L,(In y/-In y)' (UNT) suspendidos Iny¡ Inx¡ i x¡ (rng/I) 3,74 4,28 1 42 y¡ 5,89 4,26 0,64 0,54 2 72 3,56 4,98 0,07 0,00 3 360 71 4,17 6,22 1,81 1,50 4 35 146 4,79 4,11 0,97 0,79 5 65 505 4,61 4,91 0,13 0,01 6 120 61 5,25 5,13 0,06 0,02 7 100 136 6.48 5,25 0,00 0,06 8 190 169 5,44 5,59 0,50 0,35 9 650 190 4,65 6,89 3,75 3,56 10 230 269 4,32 5,98 0,81 0,96 11 105 978 4,23 5,17 0,01 0,03 12 75 394 4,83 4,79 0,05 0,04 13 69 176 4,44 4,60 0,09 0,16 14 125 120 3.47 4,89 0,08 0,01 15 85 99 3,53 4,94 0,01 0,00 16 32 133 4,44 3,97 1,15 1.06 17 34 140 6,11 3,99 1,03 1,02 18 85 53 3,93 4,81 0,01 0,03 19 450 54 3,61 6,34 2.46 1,80 20 51 123 4,13 4.43 0,37 0,32 21 37 568 4,29 0,86 0,50 22 62 84 4.43 0,17 0,32 73 12 3074 84 ¿=suma 4626 99,88 109,98 15,06 13,11 ;=1 Media 139,72 210,27 4,54 5,00 154 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 5 - MODELOS DE REGRESiÓN 5.6 Coeficiente de determinación El coeficiente de determinación muestral, R2, es la variación total de la variable dependiente y , que es explicada, o se debe a la variación de la variable independiente x. R2 expresa la proporción de la variación total de los valores de la variable y , que puede ser explicada por una relación lineal con los valores de la variable aleatoria x. Este se puede calcular mediante la ecuación 5.20. (5.20) Propiedades del coeficiente de determinación • OS K S 1 en ténninos porcentuales; 0% S R 2 S 100% • KS,,2 • R 2 da una mejor interpretación de la fuerza de relación entre y y x , que el coeficiente de correlación, r. Un valor de r = 0.9435 indica una buena relación lineal entre x y y , lo cual implica un valor de R2 = 0.8902 u 89.02%, lo cual significa que aproximadamente el 89% de la variación de los valores de y se deben al modelo de regresión estimado. Ejemplo 5.5 Calcular el coeficiente de determinación en los modelos lineal y potencial, para los sólidos suspendidos y turbiedad en una estación de monitoreo del río Cauca, presentados en las ecuaciones 5.10 Y 5.17. Modelo Tipo r K Lineal 0,99039 ss = 13,5856 + 1,40765 * TU 0,98087 SS = 2,2984 * TUO,917814 Potencial 0,98380 0,96786 En la ecuación lineal el 98% de la variación de los sólidos suspendidos es explicada por el modelo, que indica un buen modelo, es decir, solo el 2% de la variación de y no es explicado por el modelo. En la ecuación potencial el 96,8% de la variación de los sólidos suspendidos es explicada por el modelo, lo cual representa un buen modelo, es decir, solo el 3,2% de la variación de y no es explicado por el modelo, presentándose ligeramente mejor el modelo lineal. Además, generalmente se prefiere matemáticamente el modelo de la línea recta, por su sencillez y facilidad de interpretación. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 155
VIVIANA VARGAS FRANCO Coeficiente de no determinación A partir del coeficiente de determinación, se puede definir el coeficiente de no determinación, el cual mide la proporción de la variación total de y, que no es explicada por la variación de x y se calcula como 1 - R2. Por ejemplo, para un valor de r =0.8, el valor del coeficiente de determinación es R 2 =0,64 o 64%, el coeficiente de no determinación es 1- R2 = 0,36 o 36%, es decir, e136% de la variación de y no se debe a la variación de la variable x. Algunos aspectos para definir el modelo de regresión A continuación se presentan algunos aspectos a considerar en la estimación de un modelo de regresión. • Analizar el grado de causa-efecto entre las variables a correlacionar. Si se sabe el comportamiento del fenómeno en términos de su ecuación diferencial, como por ejemplo, si el crecimiento de y por cada unidad de x es constante, es decir: Z= k. Entonces la ecuación de regresión debe considerarse como la función y = kx + e, o sea la familia de modelos rectilíneos, que soluciona la ecuación diferencial. • Estar interesado en estimar la variable y a partir de valores de la variable x o determinar la tendencia de esta relación. • Desear determinar el grado de correlación lineal entre las variables y y x. • Generar y analizar el diagrama de dispersión. Este paso es muy importante porque permite establecer en forma gráfica la tendencia de la relación. Seleccionar el modelo de regresión que tenga el valor más alto del coeficiente de determinación y el menor número de variables en el modelo. 156 ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPíTULO 6 Planeación estadística en un proyecto de investigación La planeación del proceso de recolección y organización del conjunto de observaciones o datos en un proyecto de investigación se constituye en etapas fundamentales en el desarrollo de un estudio, pues estos aspectos permiten contribuir significativamente con la coherencia entre la recolección, el análisis de datos y los objetivos de la investigación. La planeación de la recolección de los datos incluye la organización, el manejo, la sistematización, la definición de variables, sitios y frecuencias de muestreo, definición de instrumentos de recolección de datos, así como la definición de un sistema de información. La planeación estadística debe hacerse desde la toma de las muestras hasta el análisis de los datos y la producción de informes, con el fin de generar información confiable y coherente con los objetivos de la investigación. Para desarrollar el proceso de toma de datos es necesario que el grupo de trabajo comprenda y comparta los objetivos del proyecto, conociendo los aspectos de carácter técnico y los conceptos a manejarse dentro de la investigación. En este capítulo se presenta el método utilizado para el manejo de información en el proyecto de investigación sobre sistemas para potabilización de agua denominado Proyecto Integrado de Investigación y Demostración de Métodos de Filtración Gruesa para Sistemas de Abastecimiento de Agua, el cual fue desarrollado por el Instituto Cinara de la Universidad del Valle en los años de 1990 a 1995, realizado en ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 157
VIVIANA VARGAS FRANCO la Estación de Investigación y Transferencia de Tecnología localizada en la Planta de Tratamiento de Agua Potable de Puerto Mallarino en predios de Emcali. El Instituto Cinara de la Universidad del Valle realiza, entre otras actividades, investigaciones sobre tecnologías simplificadas en el área del abastecimiento de agua potable con el objeto de desarrollarlas y adecuarlas a las condiciones técnicas y socio-económicas de países en vía de desarrollo y como aporte a los problemas de abastecimiento de agua del país. Una de las tecnologías investigadas, por el Instituto Cinara, es la tecnología de Filtración en Múltiples Etapas (FiME), la cual es una alternativa tecnológica para la potabilización de agua, con mucho potencial de ser utilizada en las zonas rurales, pequeños y medianos municipios. Esta tecnología no requiere el uso de sustancias químicas ni componentes mecánicos y puede ser fácilmente operada, mantenida y administrada por miembros de la comunidad. Cuando la tecnología FiME es seleccionada, diseñada, construida, operada y mantenida adecuadamente, produce efluentes con bajos niveles de turbiedad, sin la presencia de impurezas ofensivas y libre de entero-bacterias, entero-virus y quistes de protozoarios. (Visscher, 1996). Una planta de tratamiento FiME generalmente consta de tres etapas de tratamiento: un Filtro Grueso Dinámico (FGDi), un Filtro Grueso (FG) y un Filtro Lento en Arena (FLA), tal como se presenta en la Figura 6.1. El Filtro Grueso presenta varias opciones, dependiendo de tres aspectos: número de unidades, sentido del flujo del agua y la forma de instalación del material filtrante, que en este caso son gravas. En esta investigación se compararon cinco opciones de filtración gruesa (FG) operando en paralelo: Filtro Grueso Ascendente en Serie(FGAS), Filtro Grueso Ascendente en Capas (FGAC), Filtro Grueso Horizontal Modificado(FGHM), Filtro Grueso Horizontal (FGH) y Filtro Grueso Descendente en Serie (FGDS). El estudio de diferentes tipos de filtros gruesos se realizó para remover niveles adecuados de turbiedad y otros parámetros, de tal forma que permitieran superar las limitaciones de operación que tiene la tecnología de Filtración Lenta en Arena (FLA), la cual presenta dificultades en su operación, cuando los niveles en la fuente de abastecimiento supera en turbiedad 50 UNT en el afluente o cuando se presentan amplias variaciones en períodos muy cortos, intensificando las labores de operación y mantenimiento, reduciendo significativamente la eficiencia del FLA. (CINARA- IRC,1989). 158 ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPfTUlO 6 - PlANEACIÓN ESTADfsTICA DE UN PROYECTO DE INVESTIGACiÓN Etapas de filtración Desinfección terminal ,~--------------------------~, ,,-----------\\ Filtro grueso Filtro lento (FG) en arena (FLA) Figura 6.1 Esquema general de una planta de tratamiento con tecnología FiME. (Galvis, 1999). 6.1 Objetivos del proyecto El equipo de trabajo debe entender claramente los objetivos del proyecto, pues estos permiten guiar permanentemente las diversas actividades, en general, y en particular el proceso de recolección y análisis de datos. Entre los objetivos del proyecto de investigación: \"Proyecto Integrado de Investigación y Demostración de Métodos de Filtración Gruesa para Sistemas de Abastecimiento de Agua\", se destacan los siguientes: • Evaluar y comparar desde el punto de vista económico, físico-químico, bacteriológico e hidráulico, diferentes opciones de filtración gruesa: FGAS, FGAC, FGH, FGHM YFGDS. • Investigar diferentes alternativas de Filtración Gruesa orientadas a producir criterios de selección, diseño, operación y mantenimiento. • Promover alternativas de Filtración Gruesa que permitan superar las limitaciones de la tecnología de la Filtración Lenta en Arena. 6.2 Descripción del sistema Realizar el esquema del sistema en estudio es una de las primeras actividades a realizarse dentro del desarrollo de un proyecto de investigación. El sistema de evaluación de la calidad de agua de los filtros gruesos se presenta en la Figura 6.2. La fuente de abastecimiento utilizada fue el agua del río Cauca en su paso por la estación Juanchito de la ciudad Santiago de Cali. La tecnología FiME evaluada consta de tres etapas: Filtro Grueso Dinámico (FGDi), Filtro Grueso (FG) y Filtro Lento en Arena (FLA). ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 159
VIVIANA VARGAS FRANCO Filtro Grueso Dinámico (FGDi). Consiste en una estructura que consta de una capa de grava fina del orden de 0,2m-0,3m de profundidad. El agua que entra en la unidad fluye sobre la capa fina de grava y parte de ella drena, a través del lecho, hacia una tubería perforada y continua hacia la siguiente etapa en el sistema de tratamiento. La velocidad de operación de estas unidades puede estar entre 1,0 m/h y 9,0 m/h. Filtro Grueso Ascendente en Serie (FGAS). Consiste en tres estructuras, de 1,2 m a 1,5 m de altura, encontrándose en cada una determinado tamaño de grava. La grava se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava gruesa hasta la grava más fina, con flujo ascendente. La velocidad de operación es del orden de 0,3 m/h a 3,0 m/h. FLA 1 -t.4 ~ FLA2 -2.2 ~ ~uenteO.1 ~~[B~:]uP~~~~~ FLA3 deagua 3.4 ~ FLA4 -4.4 ~ FLA 5 -5.4 ~ Filtración Gruesa Descendente en serie 3 Etapas (FGDS3) Figura 6.2 Sistema del estudio de comparación de Filtros Gruesos (Galvis, 1999) Filtro Grueso Ascendente en Capas (FGAC). Consiste en una sola estructura, de 1,2 m a 1,5 m de altura, en la cual la grava se encuentra instalada por capas, quedando en el fondo el material grueso y en la superficie el material fino. La grava se coloca de gruesa a fina. El agua atraviesa la estructura desde la grava gruesa hasta la grava más fina, con flujo ascendente. La velocidad de operación es del orden de 0,3 m/h a 3,0 m/h. Filtro Grueso Horizontal (FGH). Consiste en una estructura rectangular, compuesta de tres capas de grava las cuales van de gruesa a fina. El flujo del agua va en sentido horizontal. La velocidad de operación es del orden de 0,3 m/h a 3,0 m/h. 160 ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPfTULO 6 - PLANEACIÓN ESTADfsTICA DE UN PROYECTO DE INVESTIGACiÓN Filtro Grueso Horizontal Modificado (FGHM). Consiste en una estructura rectangular, compuesta de tres capas de grava las cuales van de gruesa a fina. En este estudio éste es una modificación del FGH. El flujo del agua va en sentido horizontal. La velocidad de operación es del orden de 0,3 m/h a 3,0 m/h. Filtro Grueso Descendente en Serie (FGDS) . Consiste en tres estructuras de 1,2 m a 1,5 m de altura, encontrándose en cada una determinado tamaño de grava. La grava se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava gruesa hasta la grava más fina, con flujo descendente. La velocidad de operación es del orden de 0,3 m/h a 3,0 mIh. Filtro Lento en Arena (FLA)~ Es una estructura que consiste en un lecho de arena fina, de diámetro efectivo entre 0,2 mm y 0,3 mm, con una profundidad de 0,5 m a 0,8 m, colocada sobre una camada de grava de medio de soporte y una tubería como sistema de drenaje en el fondo. La altura total del filtro, desde el fondo hasta la corona de los muros, puede variar de 1,90 m a 2,50 m y se puede construir en hormigón reforzado, ferrocemento, piedra o mampostería. 6.3 Codificación del sistema La codificación del sistema de evaluación permite una fácil ubicación, agiliza el manejo y desarrollo del muestreo, así como el diligenciamiento de los formatos de campo y de laboratorio y la retroalimentación al sistema de información. El sistema de experimentación, en la presente investigación, se codificó considerando las diversas etapas de evaluación de la calidad de agua que operan en el sistema, tal como se presenta en la Tabla 6.1. Tabla 6.1 Codificación del sistema de evaluación del proyecto de investigación. Etapas de mulltreo Codificaci6n Cruda 0.1 Cruda Acondicionadores 0.2 FGDi·A: Filtro Grueso Dinámico - A Línea 1 0.3 FGDi·B: Filtro Grueso Dinámico - B 0.4 FGDi·C: Filtro Grueso Dinámico - C Línea 2 1.1 FGAS1: Filtro Grueso Ascendente en Serie etapa 1 I 1.2 FGAS2: Filtro Grueso Ascendente en Serie etapa 2 1.3 FGAS3: Filtro Grueso Ascendente en Serie etapa 3 1.4 HA1: Filtro lento en Arena 1 2.1 FGAC: Filtro Grueso Ascendente en Capas 2.2 FlA2: Filtro lento en Arena 2 Continúa en la página siguiente ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 161
VIVIANA VARGAS FRANCO Codificaci6n 3.1 FGHM 1: Filtro Grueso Horizontal Modificado 1 Viene de la página anterior 3.2 FGHM2: Filtro Grueso Horizontal Modificado 2 3.3 FGHM3: Filtro Grueso Horizontal Modificado 3 Etapas de muestreo 3.4 FLA3: Filtro Lento en Arena 3 línea 3 4.1 FGH1: Filtro Grueso Horizontal 1 4.2 FGH2: Filtro Grueso Horizontal 2 línea 4 4.3 FGH3: Filtro Grueso Horizontal 3 4.4 FLA4: Filtro Lento en Arena 4 línea 5 5.1 FGDS1: Filtro Grueso Descendente en Serie 1 5.2 FGDS2: Filtro Grueso Descendente en Serie 2 5.3 FGDS3: Filtro Grueso Descendente en Serie 3 5.4 FlA5: Filtro Lento en Arena 5 6.4 Definición de variables, sitios y frecuencia de muestreo En un estudio se presentan diversos tipos de variables, pero las que más se encuentran en los fenómenos ambientales y de ingeniería sanitaria son las variables de tipo continuo. En la Tabla 6.2 se presentan las variables estudiadas en el proyecto de acuerdo con su clasificación entre químicas, físicas, biológicas e hidráulicas. Los coliformes fecales y los estreptococos fecales son variables de tipo discreto, las otras variables estudiadas son de carácter continuo con nivel de medición de razón. Tabla 6.2 Clasificación de variables que se analizaron en el estudio. Variables Tipo Nombre de las variables Físicas Cuantitativas Turbiedad (UNT) Químicas continuas Color real (UPC) Sólidos sedimentables (mg/llh) Cuantitativas Sólidos suspendidos (mg/l) continuas Sólidos volátiles (mg/l) Sólidos totales (mg/l) - - - --- ------ -- --- -- -- -- - Temperatura (OC) pH (unidades) Alcalinidad total (mgJl Ca C03) Dureza total (mg/l Ca C03) Oxígeno disuelto (mg/l) Hierro total (mg/l) Manganeso total (mgtl) --- - - - - -- - Continúa en la página siguiente 162 ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS
CAPfTULO 6 - PLANEACIÓN ESTADfsTICA DE UN PROYECTO DE INVESTIGACiÓN Viene de la página anterior Tipo Nombre de las variables Variables Biológicas Cuantitativas Coliformes fecales (UFC/100ml) discretas Estreptococos fecales (UFC/100ml) Hidráulicas Cuantitativas Pérdida de carga hidráulica(cm) continuas Pérdida de carga parcial (cm) Caudal (l/s) Los sitios de muestreo están relacionados con los objetivos de la investigación así como de las necesidades de evaluar y comparar el sistema integralmente. En la Tabla 6.3 se presenta la frecuencia de muestreo para cada una de las variables a analizar en esta investigación. Las frecuencias y puntos de muestreo se definieron de acuerdo con la experiencia de los investigadores, los cuales consideraron la importancia de las variables, los objetivos y el presupuesto disponible del proyecto de investigación. En otros casos, se utiliza la teoría estadística del muestreo para estimar el número de muestras requerido en cada variable, considerando niveles de error, confiabilidad, variabilidad y recursos. Tabla 6.3 Frecuencia y puntos de muestreo para análisis de calidad de agua en el proyecto de investigación. Punto de muestreo 1.3 1.4 01 03 06 1.1 1.2 2.1 2.2 Total de 04 5.1 5.2 3.3 3.4 muestra por 05 4.3 4.4 variable Variable 5.3 5.4 Color real (UPC) 4d d 2s 2s 2s 2s 2s 4d/44s Turbiedad (UNT) 24d d 3d 3d 3d 3d 3d 90d Sólidos sedimentabies (ml/I/h) q qqq 10q Sólidos suspendidos (mg/l) d 2s 2s 2s 2s 2s 2s 1d/44s Sólidos volátiles (mg/l) m mmm m m m 23m Sólidos totales (mg/l) m mmm m m m 23m Temperatura (OC) 4d 4d Pérdida de carga hidráulica (cm) 3s 3s 3s 3s 3s 57s Pérdida de carga parcial (cm) s sss 19s Caudal (l/s) d d d lOd Continúa en la página siguiente ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 163
VIVIANA VARGAS FRANCO Viene de la página anterior 1.3 1.4 Punto de muestreo 01 03 06 1.1 1.2 2.1 2.2 Total de 04 5.1 5.2 3.3 3.4 muestra por 05 4.3 4.4 variable Variable 5.3 5.4 pH lunidadesl I12q q q qq Alcalinidad totallmg/I CaC031 m m 12m Dureza totallmg/l CaC031 m s mm q d 12m Oxígeno disuelto Img/ll ss 12q dd Hierro y manganeso totallmg/ll m mmm mmm 23m Coliformes fecales IUfC/lOOmll 2s 2s 2s 2s 2s 2s 2s 46s Estreptococos fecales IUfC/l00mll q qqq qqq 23q d - diaria s - semanal q - quincenal m - mensual 6.5 Formatos de muestreo Es necesario registrar el conjunto de datos recolectados en instrumentos adecuados como paso previo al resumen y análisis de estos. En general en proyectos de seguimiento de sistemas de monitoreo, el instrumento que se utiliza es el formato. La definición de los formatos debe planearse de tal forma que permita la obtención de los datos de una manera completa y eficiente, que facilite la uniformidad en las diferentes observaciones y evite la recolección de datos no relevantes, redundantes y desorganizados El formato debe responder a los objetivos y propósitos de la investigación y antes de su puesta en operación se debe probar su funcionalidad. Este aspecto se cumple mediante una aplicación piloto que detecte las fallas del instrumento de medición. La distribución para diligenciar el formato debe ser lógica y ordenada. El orden de los aspectos a evaluar debe responder a su importancia en el estudio, los datos deben tener referencia de espacio y tiempo específicos. El diligenciamiento de los formatos debe hacerse con criterios de calidad, considerando que es la primera base de datos, no digital, que se tiene del estudio o de la investigación, y los datos son la materia prima para el procesamiento y análisis de los resultados. Uno de los formatos de la presente investigación se presenta en la Tabla 6.4, donde se incluyen las variables analizadas y los puntos de muestreo definidos. 164 ESTADISTI CA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 6 - PLANEACIÓN ESTADIsTICA DE UN PROYECTO DE INVESTIGACiÓN 6.6 Flujo de información A los datos recolectados es necesario hacerles un proceso de revisión y corrección en cada etapa del flujo de información, considerando que las conclusiones del estudio no pueden ser más precisas que los datos sobre los cuales se basan, es decir, las conclusiones que se derivan del estudio son de tal calidad y precisión como se lo permitan los datos y su análisis. Un conjunto de datos errados necesariamente va a llevar a conclusiones erradas. El flujo de la información del proyecto de investigación se desarrolló con base en el esquema que se presenta en la Figura 6.3; este flujo permitió identificar el seguimiento de los datos desde la toma de la muestra hasta el reporte y publicación de los resultados, además permitió generar responsabilidades definidas en cada área de trabajo de la investigación. Las muestras fueron tomadas por los muestreadores de acuerdo con los sitios y horas de muestreo específicos, las cuales eran llevadas a los laboratorios fisico-químico o bacteriológico de acuerdo con el tipo de análisis a realizar, estos laboratorios analizaron y reportaron los datos al área de ingeniería, que revisó y realizó las observaciones pertinentes, para posteriormente trasladar los formatos al área de información y sistemas donde se digitalizaron los datos en bases de datos y se realizó el procesamiento estadístico, incluyendo resumen de los datos a través de tablas y gráficos, los cuales fueron analizados en el área de ingeniería, para posteriormente ser presentados y analizados con la dirección del proyecto. El procesamiento estadístico se realizó utilizando los programas SPSS y Excel. Laboratorio Dirección Comité de flsico-gulmico del seguimiento y Análisis de proyecto control de muestras y proyectos Cinara reporte de 1----- Toma de muestras datos Área de in¡:enierla Laboratorio Responsable del Información microbioló¡:ico proyecto técnica y socio Análisis de Área de económica muestras y información ~ reporte de datos sistemas Base de datos Análisis estadístico Figura 6.3 Esquema del flujo de información del proyecto de investigación. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 165
O> Tabla 6.4 Formato para la recolección de datos del pro O> Instituto Cinara - Univ Proyecto Integrado de Investigación y Demostración de Mé Fecha: ~Variable LINEA 1 LINEA 2 FGASl FGAS2 FGAS3 FLAl FGAC FLA2 FGHMl 1.1 1.2 1.3 1.4 2.1 2.2 3.1 Hora Turbiedad (UNTl Color real (UPC) pH (Unidades) m Alcalinidad (j) (l11li/1 CaCo3) ~ o ¡¡¡ Dureza total (mgJI CaCo3) -i ~ Oxígeno disuelto (l11li/11 O Sólidos suspendidos (l11li/11 m (j) () Estabilidad en suspensión :Il (an/h) ~ Sólidos sedimentables ~ (mI/h) ~ 000 (l11li/11 :Il ~ Z ~atura(OC) G) m Estreptococos fecales Z ;Ti (UFC/lOOmI) :Il i> CoIiformes fecales ~ (UFC/1OOmI) ;:: !!1 Pérdida de carga (an) m Z Caudal II/s) ~ r Filtrabilidad (mI/3nin) () O r....,(dias) Z - - - - - ---- Ul \"tl Ul Ul Observaciones:
oyecto de investigación. <<: versidad del Valle e IRC-Holanda 'zi> étodos de Pretratamiento para Sistemas de Abastecimiento de Agua. ~ LINEA 3 LINEA 4 LINEAS < Ml FGHM2 FGHM3 FLA3 FGHl FGH2 FGH3 FLA4 FGDSl FGDS2 FGDS3 FLAS ~ 3.2 3.3 3.4 4.1 4.2 4.3 4.4 5.1 5.2 5.3 5.4 :Il G) ~ (j) \"TI :Il ~ Z () o -- - --- - - -
CAPrTULO 6 - PLANEACIÓN ESTADrSTICA DE UN PROYECTO DE INVESTIGACiÓN 6.7 Sistema de información Un sistema de información es un mecanismo o estructura administrativa que tiene como funciones la captación, almacenamiento, recuperación y análisis de datos; permite recopilar, organizar, sistematizar y procesar los datos de manera ágil y confiable. El sistema de información consta de bases de datos que son una combinación de programas y archivos que se utilizan conjuntamente de manera integrada y coordinada, las cuales permiten recolectar un conjunto de datos mutuamente relacionados. La construcción de las bases de datos incluye la obtención de los datos, su codificación, captación y sistematización. Para diseñar el sistema de información se dividió el sistema de estudio en cinco ambientes: cruda, acondicionada, integrada, filtros gruesos y filtros lentos en arena. Estos ítemes forman el esquema principal de la entrada a la base de datos. La base de datos tuvo 21 archivos correspondientes a los diferentes sitios de muestreo en la investigación, tal como se presenta en la Figura 6.4 (ver Figura 6.4 en la página siguiente). En las bases de datos los registros se organizan y se mantienen en una tabla compuesta por filas y columnas, de tal forma que los datos sean fáciles de encontrar y procesar. Las filas en la base de datos se llaman registros y las columnas campos. Entre las ventajas de las bases de datos se destacan las siguientes: evitan la redundancia, reducen las inconsistencias y los errores de captura, y apoyan la integridad y la independencia de los datos. E! sistema de información planteado permitió desarrollar las comparaciones y evaluaciones de interés en la investigación, agilizó la adición, modificación y consulta de registros. El análisis estadístico descriptivo de los datos generados en esta investigación se presenta en el próximo capítulo. ESTADrSTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 167
CAPiTULO 6 - PLANEACIÓN ESTADIsTICA DE UN PROYECTO DE INVESTIGACiÓN l. CRUDA L-J:l FGD¡-A [ FGAS 1 2. ACONDICIONADA I FGD¡-B FGAS2 3. INTEGRADA -- FGAS3 FGD¡ -C FGHM 1 4. FILTROS GRUESOS ---J ~ ( FGHM2 FGHM FGHM3 II FGHI ~~ FGH2 FGH3 =-ti FGDSI F0002 l[ FLA I I FGDS 3 5. FILTROS LENTOS H-.[ lFLA2 EN ARENA l[ FLA3 l[ FLA4 l( FLA5 Figura 6.4 Esquema de la base de datos del proyecto de investigación. 168 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPíTULO 7 Evaluación de sistemas para tratamiento de agua potable Este capítulo presenta el procesamiento descriptivo y gráfico de un conjunto de datos relacionado con la evaluación de sistemas para tratamiento de agua potable. Los datos fueron procesados y presentados en el programa estadístico SPSS y corresponden a la evaluación de cinco Filtros Gruesos (FG), evaluados en el marco de la tecnología de filtración en múltiples etapas, FiME. El estudio de evaluación y seguimiento de los filtros gruesos lo realizó el instituto Cinara de la Universidad del Valle, en la Estación de Investigación y Transferencia de Tecnología localizada en predios de la Planta de Tratamiento de Agua Potable de Puerto Mallarino en Emcali, cuya fuente de agua cruda es el río Cauca. Los aspectos conceptuales de esta investigación se presentaron en el capítulo 6. Un sistema de abastecimiento de agua para beber, asearse y para fines domésticos es un elemento esencial para la salud, el bienestar y la productividad de las comunidades, y es determinante en la calidad de vida de las personas. El agua contaminada contiene una gran cantidad de bacterias y virus que exponen a la comunidad a enfermedades de origen hídrico, entre las que se destacan el cólera y la enfermedad diarreica aguda (EDA). En países en vía de desarrollo, la EDA es la segunda causa de muerte en los niños de 1 a 4 años (OPS). El suministro ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 169
VIVIANA VARGAS FRANCO continuo de agua en suficiente cantidad y de buena calidad es factor básico en la reducción de enfermedades de origen hídrico. En América Latina las coberturas en abastecimiento de agua son del orden del 92% para la zona urbana y 52% para la zona rural. En Colombia las coberturas son del orden del 86% para la zona urbana y del 44% para la zona rural; sin embargo, se estima que solo el 62% de los habitantes de las zonas urbanas reciben agua potable y en la zona rural lo hace solamente el 10% (Mondragón, 1996). En la actualidad estas cifras presentan la misma tendencia. Las cifras presentadas sobre coberturas sugieren que el aprovisionamiento de agua que cumpla con los tres elementos básicos: continuidad, cantidad y calidad, es especialmente crítico en la zona rural, los pequeños y medianos municipios y los asentamientos marginales de las grandes ciudades, donde se presentan limitaciones de recursos humanos, fisicos, económicos, infraestructura administrativa y vías de comunicación, entre otros. Una alternativa tecnológica con mucho potencial para ser utilizada en los pequeños y medianos municipios, las zonas rurales y urbano-marginales de las grandes ciudades es la filtración en múltiples etapas (FiME). Esta tecnología ha sido desarrollada sobre la base de la experiencia de la Filtración Lenta en Arena (FLA) por el Instituto Cinara, de la Universidad del Valle. Una planta de tratamiento FiME generalmente consta de tres etapas: filtro grueso dinámico (FGDi), filtro grueso (FG) y filtro lento en arena (FLA). El filtro grueso presenta varias alternativas que dependen del sentido del flujo del agua y del número de unidades: de flujo ascendente: en capas (FGAC) y en serie de tres etapas (FGAS3), de flujo horizontal: (FGH3) y modificado (FGHM3) y de flujo descendente en serie de tres etapas (FGDS3). Un esquema de la tecnología FiME se presentó en la Figura 6.1. El Instituto Cinara evaluó los cinco filtros gruesos (FG) en parámetros fisico- químicos, bacteriológicos e hidráulicos, con el fin de definir los mejores en eficiencia. En este capítulo se analiza la eficiencia de los FG en las variables turbiedad y coliformes fecales, utilizando técnicas estadísticas descriptivas y gráficos; la metodología presentada se puede generalizar para las otras variables analizadas en la investigación. A continuación se describen conceptualmente estas variables. Turbiedad. Es una medida de partículas orgánicas e inorgánicas en el agua, tales como arcillas, sedimentos, partículas orgánicas coloidales, plancton y otros organismos 170 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE microscópicos, y estas partículas tienen un efecto en la salud pública porque pueden incluir microorganismos patógenos o sustancias tóxicas, p.e. asbesto (Craun, 1993). Niveles altos de turbiedad pueden proteger los microorganismos de los efectos de la desinfección y además estimular el crecimiento de bacterias (WHO, 1993). Coliformes fecales. Son organismos indicadores de contaminación fecal, particularmente Escherichia coli (E. coli), una bacteria que vive en los intestinos del hombre y otros mamíferos, los cuales son excretados en grandes cantidades en las heces fecales. Este es un parámetro universal para indicar el grado de contaminación fecal en una fuente, debido a que el mayor riesgo microbiológico en el agua está asociado con la ingestión de agua contaminada con excretas de origen humano y animal, y porque se ha establecido que la ingestión de patógenos causan enfermedades de origen hídrido. (Craun, 1993) 7.1 Estadísticas descriptivas Considerando que el afluente de los FG es el agua integrada, se calculan las estadísticas descriptivas incluyendo esta etapa. Los filtros gruesos que presenten menores valores efluentes en promedio y los de mayor remoción promedio serán considerados los mejores. La remoción de una variable se calcula con la fórmula: Rem afluente - efluente xl00% afluente • Turbiedad La siguiente tabla presenta los resultados del programa estadístico SPSS en el cálculo de algunas estadísticas descriptivas. Estadísticas descriptivas para turbiedad (UNT) Media Integrad FGAS3 FGAC FGHM3 FGH3 FGDS Mediana 73,6 12,4 21.7 21,2 13,3 16,5 Moda 48,0 8,0 18,0 17,0 9,5 14,0 Varianza 26,0 14,0 17,0 17,0 18,0 18,0 Desviación típica 139,7 100,0 Rango ordinal 5790,1 11,8 342,2 256,6 10,0 228,3 N total 76,1 113,0 18,5 16,0 78,2 15,1 294 126,1 294 137,4 563,0 166,2 294 294 294 294 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 171
VIVIANA VARGAS FRANCO Los filtros con menores efluentes promedios son el FGAS3 y el FGH3, estos presentan un menor valor en la desviación estándar y el rango, que significa una mayor concentración de los datos alrededor del valor medio, seguidos del FGDS. Por el contrario, los filtros que presentan mayores valores en los efluentes son el FGHM3 y el FGAC, con valores de dispersión y rango más elevados, mostrando una mayor dispersión en relación con el valor medio efluente. Las estadísticas descriptivas para la remoción de turbiedad se observan en la siguiente tabla: Estadísticas descriptivas para remoción de turbiedad (%) REMFAGS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS 73,6 Media 80,3 66,2 65,1 77,5 74,3 Mediana 60,0 Moda 80,8 66,6 65,3 78,6 124,9 Varianza 11,2 Desviación típica 80,0 70,0 50,0 80,0 71,5 Rango ordinal 294 N total 82,5 127,0 194,6 103,0 9,1 11,3 13,9 10,1 45.4 59.4 82,1 50,8 294 294 294 294 Se puede analizar que los filtros con mayor eficiencia en la remoción de turbiedad son el FGAS3 y el FGH3, los de menor eficiencia son el FGAC y el FGHM3, generando los dos primeros menor variación en cuanto al valor medio que los dos últimos. En la remoción de turbiedad la distribución del FGAS es muy simétrica, considerando que los valores de la media, la mediana y la moda son muy similares. El filtro que presenta menor simetría es el FGHM3. • Coliformes fecales Las estadísticas descriptivas para coliformes fecales se presentan en la siguiente tabla: Estadísticas descriptivas para coliformes fecales (UFC/100 mI) Media INTEGRAD FGAS3 FGAC FGHM3 FGH3 FGDS Mediana 24758 65 369 929 182 147 Moda 13200 35 260 867 141 80 Varianza 12900 12 10 1600 110 50 Desviación típica 992226516 8287 150381 525016 18199 26053 31500 91 388 725 135 161 Rango ordinal 155000 389 1790 3807 618 760 Ntotal 31 31 31 31 31 31 172 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE Al igual que en turbiedad, los filtros con menores efluentes son el FGAS3, el FGDS y el FGH3, similarmente con los menores valores de dispersión. Los filtros con mayores efluentes en coliformes fecales son el FGAC y el FGHM3, así mismo, con los mayores valores de dispersión. A continuación se presentan las estadísticas descriptivas para la remoción de coliformes fecales. Estadísticas descriptivas para remoción de coliformes fecales(%) REMFGAS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS 99 Media 99 98 93 99 99 91 Mediana 100 98 96 99 4 2 Moda 100 99 76 99 9 31 Varianza 13 39 3 Desviación típica 12 62 Rango ordinal 6 8 24 9 N total 31 31 31 31 Considerando la remoción en coliformes fecales se tiene que los mayores promedios los presentan el FGAS3, FGH3 y el FGDS3 y los menores el FGAC y el FGHM3. Las desviaciones en cada una de las remociones son muy similares. Debido a la magnitud de las unidades en coliformes fecales, los valores de remoción deben analizarse más detalladamente, considerando preferiblemente el número de unidades logarítmicas reducidas. 7.2 Gráficos de medias, mínimos y máximos La presentación gráfica de los datos es una de las etapas fundamentales en el análisis descriptivo del fenómeno estudiado; en este ítem se presentan diversos tipos de gráficos que permiten analizar la eficiencia de los filtros gruesos. Estas gráficas se desarrollaron en la hoja electrónica Excel (Las instrucciones para realizarlas se presentan en el capítulo 11). • Turbiedad La siguiente gráfica muestra los valores medios de los efluentes de los filtros gruesos, la desviación estándar y el valor máximo. ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 173
VIVIANA VARGAS FRANCO .ID so .-._--....... .'10 ~ . ' >20~1 ~ t'00 r~o i80 ~ 60 .1 ! 20 ~40 ~ ,o i:1; ,o 'GAC fGHM3 FGH3 FGDS3 ,GAS, Medi. ___ MlÚimo '. I1111 1. ': '00 :~i l60 ID ~ ~ 40 1l60 ~ ~ 1.'\" 20 40 ~ ): ; 'GAS, 20 ~ ~ 'GAC 'OHM' 'OH' FGOS3 Media ___ Máximo Gráfica de media, desviación estándar y máximos en turbiedad (UNT) y remoción de turbiedad (%) Se puede evidenciar, considerando el valor medio, la desviación estándar y el valor máximo, que los mejores efluentes los tienen el FGAS3 y el FGH3, seguidos del FGDS3. Los valores más altos en el efluente suceden en el FGAC y el FGHM3. En el FGAC se observa el mayor valor máximo, así como la mayor dispersión del conjunto de datos analizados. En la remoción de turbiedad, el FGAS3 es el que mayor media presenta, seguido del FGH3, los filtros de menor remoción son el FGHM3 y el FGAC. El gráfico de series de tiempo permite visualizar la tendencia de una variable con relación al tiempo de muestreo de los datos, tal como se ilustra en las siguientes gráficas, donde se compara el comportamiento de los filtros FGAC y FGAS3 . 174 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPITULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE 1+-----~--~~--~----~----_r----~----~~ 50 70 90 1 lO 130 150 170 190 Día de operación ---FGAS3 - - - FGAC 30 +-----~----r_----r_----r_--~~--~----~~ 50 70 90 110 130 150 170 190 Día de operación ---FGAS3 - - - FGAC Gráficas de series de tiempo en turbiedad (UNT) y remoción de turbiedad (%) En el efluente de turbiedad se puede analizar que la tendencia de los filtros es similar; sin embargo, los efluentes del FGAS3 siempre son menores que los del FGAC, y esta característica es la deseable. En la remoción de turbiedad no se evidencia la misma tendencia, presentando el FGAS3 siempre valores mayores de remoción que los valores del FGAC. Otro gráfico muy útil es el que presenta los valores mínimo, medio y máximo, donde se puede observar y comparar la eficiencia de los filtros gruesos, de manera ágil y clara. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 175
VIVIANA VARGAS FRANCO 110 roo 150 -- - ~ lZ0 i\"\" FGDS3 J 90 FGAS3 r-' -e 60 ~ 30 O ~ FGAC FGHM3 FGH3 + Media ,to 1\"\" ~100 '- J 80 1 60 ~ ,~ 40 .~ =Sc: 20 o FGAS3 FGAC FGHM3 FGH3 FGDS3 + Media Gráfica de mínimos, media y máximos en turbiedad (UNT) y remoción de turbiedad (%) El filtro donde sucede el valor máximo más elevado, en turbiedad, es el FGAC y el filtro que tiene el menor valor máximo es el FGH3. Considerando la definición de rango como la diferencia entre el valor máximo y el valor mínimo, se tiene que el filtro con menor rango es el FGH3 seguido del FGAS3 . Los filtros con mayor rango son el FGAC y el FGDS3 , evidenciando una mayor dispersión de los datos en estos filtros. En remoción, el filtro con los niveles más bajos es el FGH3 y los filtros que tienen los mejores niveles de remoción son el FGAS3 y el FGH3 . El filtro con mayor rango es el FGHM3 y el de menor rango es el FGAS3 , seguido del FGH3 . 176 ESTAD IsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPiTULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE • Co/iformes fecales El siguiente gráfico muestra los valores: medio, desviación estándar y valor máximo del efluente de los filtros gruesos en coliformes fecales. 10000 _.•...--_.....__.~-_._--._--......._------~._---~_._-...-----1 1~ ,I 1000100 ... ~ ~ lO ~ FGAS3 FGAC FGHM3 FGH3 FGDS3 c:==::J Media ------ Máximo 120 I--- -- -=-- -- -- @ 100 r -1- f- - - 1------ --...... 8 0_.~ f-- f-- 60 - 1.f- i- ~. - -r-- 1- f-- 40 .. ~ -f-- r-- t - t - 1- 20 ~.i oo FGAS3 FGAC FGHM3 FGH3 FGDS3 c:=::::J Media ____ Máximo Gráfica de media, desviación estándary máximos en coliformesfecales (UFC/ JOOml) y remoción de coliformesfecales (%) El FGAS3 tiene el menor valor medio y valor máximo, seguidos del FGH3 y el FGDS3. El filtro grueso con el mayor valor medio y el mayor valor máximo es el FGHM3, seguido del FGAC. En la remoción, los menores valores se dan en el FGHM3 y el FGAC. Las mayores remociones suceden en los filtros FGAS3, FGH3 y FGDS3, pero en ninguno de los filtros se evidencian grandes diferencias en sus valores medios y máximos. ESTADIsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 177
VIVIANA VARGAS FRANCO A continuación se presenta la gráfica de series de tiempo para el efluente y la remoción de algunos de los filtros gruesos evaluados, en coliformes fecales. 10000 1 1000 ~e. 100 I a~ 10 SO 70 90 110 130 150 170 190 - - - FGAS3 Día de operación - - - FGHM3 ---FGAC 110~i--~~~~~~~--~------~---------------' ~:;¡.1001 ~. ~ ............... «;;j'*'f' cc:::::::: ::;::w tI '1 .¡ , 90 I ~t~i 80 I---~,\\}L\\\\1t------------------------~____ 70+1----~----~----r_--~_ _--~----~----~~ SO 70 90 110 130 150 170 190 Dla de operación - - - FGAS3 ---FGAC - - - FGHM3 Gráfica de series de tiempo en coliformes f ecales (UFC/l00ml) y remoción de coliformes fecales (%) En el efluente de coliformes fecales se muestra una tendencia irregular en los filtros gruesos, generando los menores valores el FGAS3 y los mayores valores el FGHM3. En la remoción los mayores valores se dan en el FGAS3 y los menores valores el FGAC. 178 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPiTULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE El siguiente gráfico ilustra los valores mínimo, máximo y media de los efluentes de los filtros gruesos en coliformes fecales. 10VV' .... ;;.;.;- 000 :- ~ ... ~:- - 100 ~ ~ FGDS3 10 L.... ~ 1 L.... FGAS3 FGAC FGHM3 FGH3 + Media 110 t .~ 1~ 1 70 FGAC FGHM3 FGH3 FGDS3 FGAS3 + Media Gráfica de mínimos, media y máximos en coliformes fecales (UFC/ 100ml) y remoción de coliformes fecales (%) Se puede analizar que los menores valores medios se encuentran en los filtros gruesos: FGAS3 y FGDS3 y las mayores medias en el FGHM3 y el FGAC. Los mayores rangos suceden en el FGAS3 y el FGAC y los menores rangos en el FGHM3 y el FGH3. Las mayores remociones se observan en los filtros FGAS3, FGH3 YFGDS3 y la menor remoción se da en el FGHM3. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 179
VIVIANA VARGAS FRANCO 7.3 Histogramas Las gráficas de histograma penniten visualizar la fonna de la distribución del conjunto de datos, la cual se puede comparar con distribuciones teóricas establecidas. Para variables discretas las distribuciones a comparar pueden ser binomial, poisson, geométrica e hipergeométrica, entre otras. En una variable continua las distribuciones a comparar pueden ser unifonne, t-student, nonnal, chi-cuadrado, entre otras. A continuación, se presentan, para algunos filtros gruesos, los histogramas de turbiedad y remoción de turbiedad, comparado con la distribución nonnal. Las gráficas corresponden al procesamiento realizado en el software estadístico SSPS (las instrucciones se presentan en el capítulo 10). En cada gráfico se observa la desviación estándar (Desv. tip.), el valor de la media (Media) y el número de datos analizados (N). • Turbiedad loor,- - - - - - - - - - - - , 70 T'-----------------------, 60 80 50 .~ 40 O ~ .:: 40 'r~ .:: 30 20 20 10 D~sv. tlp. - 18,50 UlIII,~ J~~;\".Media- 21 N-2 94,OO 38g~n~~~a~~~~~nn~~ 47.g.~n~u~M~~a~~ FGAC - TURBIEDAD (UN1J FGBJ - TURBIEDAD (UNT) 60,'---------, 50 40 'g ~ 30 .:: 20 10 Desv. tlp. - 16,01 Media -U 1 11 11 1 11 1 1 1 1! II I I II I II ~ N - 194,OO 4 9 1318n 28~37 424752 5761 FGHM3 - TURBIEDAD (UNT) Gráfica de frecuencias absolutas para turbiedad 180 ESTADrSTICA DESCRIPTIVA PARA INGENIERrA AMBIENTAL CON SPSS
CAPfTULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE El gráfico de frecuencias del FGAC muestra valores hasta 88 UNT, con frecuencias significativas hasta 53 UNT Yfrecuencias máximas entre 3 UNT Y28 UNT. El FGH3 tiene valores hasta 49 UNT, con frecuencias significativas hasta 28 UNT Yfrecuencias máximas entre 4 UNT Y 19 UNT. El FGHM3 presenta valores hasta 57 UNT, con frecuencias significativas hasta 42 UNT Y frecuencias máximas entre 9 UNT Y 18 UNT. Las distribuciones evidencian cierto grado de asimetría con relación al valor medio, con sesgo a la derecha, es decir, las mayores frecuencias se presentan en los valores menores de turbiedad, disminuyendo la frecuencia a medida que aumentan los valores de turbiedad. Analizando la distribución de frecuencias, el mejor filtro en turbiedad es el FGH3, pues tiene sus mayores frecuencias entre 4 UNT y 7 UNT, superando más de 120 datos en este rango, mientras que el FGAC tiene más de 120 datos en el rango de 8 UNT a 18 UNT. • Remoción de turbiedad 30. - - - - - - - - - , 40 ~-------' 30 /20 ~ / 10 10 1\\ IL ~ Dtn.tip.- n ,17 rlIAnf1i n Dtn.típ..- JI.IJ Mtm - u lD111 I ~ MtdM • 11 O~46 \"5\"2 ..5!,6J..!e,oJU64,Ue,aU'2,U',6¡.Je.o,J..8!4,J..8!,8u9,2u9L6,LJ N -1f4,1IJ 0 J3;5!:4I,0J..!,J\"U50,U,,,Ue,o¡.J6.5,J..,!,OJ..!,\"5\"\"e\"o\"\"8J5,.U9,.01.J9,5J' N - 1 U , H FGAC - remoción en turbiedad (\") FGHJ • remoción en turbiedad (\") 60 50 40 ';_ 30 ,\\ .\\ ~ ~ ~ 20 .~ Desv. tlp. - IJ,95 Ittl!diQ - 65 / N-194.00 ~10 h- U~~503540\"50\"9085roU908590~ FGHMJ • remoción en turbiedad (%) Gráfica de frecuencias absolutas para remoción de turbiedad ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 181
VIVIANA VARGAS FRANCO El gráfico de frecuencias en remoción de turbiedad para el FGAC muestra valores de remoción entre 35% y 95%, con una gran concentración de datos en el rango entre 50% y 75%. El FGH3 tiene frecuencias de remoción entre e148% y el 96%, con una gran concentración de valores entre 64% y 88%. El FGHM3 presenta frecuencias de remoción entre el 15% y el 95%, con una gran concentración entre 45% y 85%. Las distribuciones de la remoción de turbiedad son simétricas en relación con el valor medio, con una buena aproximación a la curva normal, es decir, las mayores frecuencias se encuentran alrededor del valor medio de la remoción y muy pocas frecuencias en los valores extremos de la distribución de frecuencias. \"'-. Que la distribución de los datos se aproxime a una curva normal es una característica deseable para el proceso de inferencia estadística. 7.4 Tablas cruzadas El cruce de variables, denominado tablas cruzadas o tablas de contingencia, permite evaluar las frecuencias de una variable, condicionada a los valores de otra variable. En la evaluación de los filtros gruesos es importante analizar la eficiencia de diferentes intervalos de calidad de agua en el afluente. Considerando rangos de turbiedad en la integrada y rangos de turbiedad en el efluente de los filtros gruesos, se presentan a continuación tablas de contingencia para los filtros FGAS3, FGAC y FGH3, las cuales fueron generadas con el software estadístico SPSS. En cada tabla la segunda columna muestra los intervalos de calidad del agua afluente (agua integrada) y la primera fila los intervalos efluentes de los filtros gruesos. El término \"Recuento\", en cada casilla, corresponde al número de datos que cumplen la condición del agua integrada y del efluente del filtro grueso. El primer porcentaje en cada casilla corresponde al nivel porcentual por fila y el segundo porcentaje al nivel porcentual por columna. 182 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPfTULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE • Tabla para FGAS3 Tabla de contingencia Integrada * FGAS3 FGAS3 (O-S) (5-lOl (lO-20) (20-301 >30 Total O Integrada [0-201 Recuento 9 O OO 9 [20·401 %de Integrada 100,0% ,0% ,0% 100,0% [40·501 %de FGAS3 12,2% ,0% ,0% ,0% ,0% [50·1001 Recuento 54 3,1% >100 %de Integrada 48 51.4 ,0% ,0% O 105 %de FGAS3 45.7 56,8% ,0% Total Recuento 64,9% 19 3O ,0% 100,0% %de Integrada 46,3% 35.7% %de FGAS3 6 20,0% 2,9 ,0% O 14,6% ,0% 41 Recuento 8,1% 14 3,8% ,0% ,0% 100,0% %de Integrada 18.4% 13,9% %de FGAS3 7 14.7% 15 1 2 Recuento 9,2% 2,6% 76 %de Integrada 8 36,6% 2.4% 11,1% 100,0% %de FGAS3 9,5 12.7% 25,9% Recuento 4 19,2% 3.4% 16 %de Integrada 8.4 25.4% 63 %de FGAS3 6,3% 42 11 100,0% 5.4% 95 88,9 21.4% 32,3% 55,3% 14,5% 74 100,0% 18 294 25,2% 53,8% 37,9% 6,1% 100,0% 100,0% 100,0% 100,0% 18 17 28,6% 27,0% 23,1% 58,6 78 29 26,5 9,9% 100,0% 100,0% De la tabla se pueden analizar diversos aspectos: El 35,7% de los valores del afluente estuvieron entre 20 UNT Y40 UNT yen este caso los valores efluentes se presentaron entre OUNT Y 10 UNT con un porcentaje representativo del 97,1 %. Se obtiene que el 25,2% de los datos del FGAS3, se encuentran entre OUNT Y5 UNT Yel 32,3% entre 5 UNT Y 10 UNT. También se puede analizar que el 84% de los datos del FGAS3 son menores que 20 UNT Yel 57,5% de los datos son menores que 10 UNT. • Tabla para FGH3 Tabla de contingencia Integrada * FGH3 Integrada [0·201 FGH3 [20-401 [40·501 (0·5) (s-lO) (10-20) (20-30) >30 Total [50·1001 > 100 Recuento 7 2 OO O 9 %de Integrada 77,8% 22,2% ,0% 100,0% Total %de FGH3 20,0% ,0% ,0% ,0% 1.7% 3,1% Recuento 23 74 ,0% ,0% O %de Integrada 21,9% ,0% 105 %de FGH3 65.7% 70,5% 71 ,0% 100,0% 61.7% 35.7% Recuento 3 6.7% 1,0% O %de Integrada 7,3% 18 ,0% 41 %de FGH3 8,6% 43,9% 8,5% 2,3% ,0% 100,0% 15,0% 13,9% Recuento 2 17 3 2 %de Integrada 2,6% 17 2,6% 76 %de FGH3 5.7% 22.4% 41,5% 7,3% 14,3% 100,0% Recuento 14,2% 25,9% %de Integrada O 20.7% 7,0% 12 %de FGH3 ,0% 9 19,0% 63 ,0% 14,3% 35 20 85.7% 100,0% Recuento 7,5% 21.4% %de Integrada 35 46,1 26,3% 14 %de FGH3 11,9% 120 4,8% 294 100,0% 40,8% 42.7% 46,5% 100,0% 100,0% 100,0% 100,0% 23 19 36,5% 30,2% 28,0% 44,2% 82 43 27,9% 14,6% 100,0% 100,0% ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS 183
VIVIANA VARGAS FRANCO Se puede analizar que el 35,7% de los datos del agua integrada se encuentran entre 20 UNT Y40 UNT Ypara este rango los valores efluentes al FGH3 se tienen entre O UNT Y 5 UNT Y5 UNT Y 10 UNT en porcentajes de 21 ,9 Y70,5 respectivamente. Se visualiza que el 11,9% de los datos del FGH3 se dan entre O UNT Y 5 UNT Y el 40,8% entre 5 UNT Y 10 UNT. También se puede analizar que el 80,6% de los efluentes del FGH3 son menores que 20 UNT Yel 52,7% de los datos son menores que 10 UNT. • Tabla para FGAC Tabla de contingencia Integrada • FGAC Integrada (0·20) FGAC (20·40) (40·50) (0·5) (5·10) (10·20) (20·30) >30 Total (50·100) O > 100 Recuento 7 2OO 9 %de Integrada ,0% 100,0% Total %de fGAC 77,8% 22,2% ,0% ,0% ,0% 3,1% -- 50,0% 3,1% ,0% ,0% O ,0% 105 Recuento 7 58 40 O ,0% 100,0% %de Integrada 6.7% 55,2% 38,1% ,0% 35,7% %de fGAC 50,0% 89,2% 44,0% ,0% O ,0% 41 Recuento O 3 26 12 ,0% 100,0% %de Integrada ,0% 7,3% 63.4% 29,3% 13,9% %de fGAC ,0% 4.6% 28,6% 18,5% 13 17,1% 76 Recuento O 2 20 41 22,0% 100,0% %de Integrada 25,9% %de fGAC ,0% 2,6% 26,3% 53,9% 46 73,0% 63 ,0% 3,1% 22,0% 63,1 78,0% 100.0% 21.4% Recuento O O 5 12 59 %de Integrada ,0% ,0% 7,9% 19,0% 20,1% 294 %de fGAC ,0% ,0% 5,5% 18,5% 100,0% 100,0% 100,0% Recuento 14 65 91 65 %de Integrada 4,8% 22,1% 31,0% 22,1% %de fGAC , 100,0% 100,0% 100,0% 100,0% Se puede analizar que el 35,7% de los datos de la integrada se encuentran entre 20 UNT Y40 UNT Yen este rango los valores efluentes al FGAC se dan entre OUNT Y 5 UNTy 5 UNTy 10 UNTenporcentajes de 6,7 y 55,2 respectivamente. Se visualiza que el 4,8% de los datos del FGAC están entre OUNT Y 5 UNT Y el 22,1% se da entre 5 UNT Y 10 UNT. También se puede analizar que sólo el 57,9% de los datos del FGAC son menores que 20 UNT, con relación al 84% del FGAS3 y al 80,6% del FGH3 y únicamente el 26,9% es menor que 10 UNT. 184 ESTADfsTICA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPITULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE 7.5 Gráficos de frecuencias acumuladas Los gráficos de frecuencias acumuladas permiten analizar los niveles de turbiedad y los porcentajes en que estos niveles se presentaron en cada filtro grueso. A continuación se muestran las gráficas de frecuencias acumuladas para los filtros: FGAS3, FGDS y FGHM3. Las gráficas se procesaron en el programa estadístico SPSS. ''''' '\" 25,0 \"\"O 15.0 100,0 125,0 75• FGDS .~ lO: .¡~: !O\\ \"\" '\" 25.0 \"\"O 75,0 100,0 FGAS3 ''''' '\" .~ lO: .¡~: !O\\ \"\" 25,0 50,0 75,0 100,0 125.0 FGHM3 Gráfica de frecuencias acumuladas para turbiedad En el FGAS3 alrededor del 88% de los datos son menores que 25 UNT Yalrededor del 98% de los datos son menores que 50 UNT. En el FGDS alrededor del 80% de los datos son menores que 25 UNT Yalrededor del 98% de los datos son menores que 50 UNT. En el FGHM3 alrededor del 70% de los datos son menores que 25 UNTy alrededor del 95% de los datos son menores que 50 UNT. De estos tres filtros, ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 185
VIVIANA VARGAS FRANCO según la gráfica de frecuencias acumuladas, el más eficiente es el FGAS3, seguido del FGDS y por último el FGHM3. 7.6 Gráficos de tallos y hojas Los gráficos de tallos y hojas permiten visualizar en forma detallada la distribución de frecuencias del conjunto de datos. Las salidas que se observan a continuación corresponden al proceso en el software SPSS. En la columna \"Frecuency\" se presenta la frecuencia absoluta de los datos; en la columna \"Steam\" se da el valor de los tallos y en la columna \"Leaf' se tiene el valor de las hojas para cada tallo. • Diagrama para el FGAS3 En este caso las máximas frecuencias se dan en los valores menores o iguales a 9 UNT Y las mínimas frecuencias se tienen en los valores mayores o iguales a 20 UNT. Se puede analizar en el diagrama de tallos y hojas que 33 datos de turbiedad tomaron valores entre 2 UNT y 3 UNT; 63 datos tomaron valores entre 4 UNT y 5 UNT; 46 datos entre 6 UNT y 7 UNT y 27 datos entre 8 UNT y 9 UNT, siendo estas las mayores frecuencias. Diagrama de tallos y hojas para el FGAS3 FGAS3 Stem-and-Lea~ P l o t Frequency Stem & Leaf ,00 o 2222222333333333 33,00 o 4444444444444444444455555555555 63,00 o 66666666667777777777777 46,00 o 8888888889999 27,00 o ,\\; 2,00 1 13,00 223333 27,00 1 4444444555555 18,00 1 66666777 18,00 1 88889999 0111 8,00 1 233 6,00 5& 4,00 2 677 7,00 9& 4,00 2 011 6,00 2 2 2,00 (>=33) 10,00 2 2 3 3 Extr~m~~ Stem widch: 10,0 Each leaf: 2 case(s) & denotes fractional leaves. 186 ESTADISTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPiTULO 7 - EVALUACiÓN DE SISTEMAS PARA TRATAMIENTO DE AGUA POTABLE • Diagrama para el fGAC En el FGAC las máximas frecuencias están en los valores de 5 UNT a 9 UNT Y entre 15 UNT Y 19 UNT. Las menores frecuencias se encuentran en los valores mayores que 30 UNT. Del diagrama de tallos y hojas se puede evidenciar que 65 datos de turbiedad tomaron valores entre 5 UNT Y9 UNT; 27 datos entre 12 UNT y 14 UNT; 64 datos entre 15 UNT y 19 UNT y 39 datos entre 20 UNT y 24 UNT, siendo estas las mayores frecuencias. Diagrama de tallos y hojas para el FGAC FGAC 5tem-and-Lea~ P l o t Frequency Stem o; Lea:f 14,00 o 334444.q 55566666677777888888888999999999 65,00 O 223333.q444.q40; 5555556666777777777788888889999 27,00 1 000111223333444444 55666678889 64,00 1 001134.q& 5678& 3 9,00 2 023& 6& 26,00 2 & 17,00 3 ( > =51) 12,00 3 8,00 4 6,00 4 1,00 5 15,00 Extremes 5tem tJidth: 10,0 Each lea:f: 2 case (s) & denotes fractional leaves. • Diagrama para el fGH3 Aquí, las máximas frecuencias se encuentran entre los valores de 4UNT y 9 UNT y las menores frecuencias entre los valores de 20 UNT a 32 UNT. Del diagrama de tallos y hojas se puede evidenciar que 16 datos tomaron el valor de 3 UNT, 40 datos se encuentran entre 4 UNT y 5 UNT; 71 datos se dan entre 6 UNT y 7 UNT y 28 datos entre 8 UNT y 9 UNT, siendo estas las mayores frecuencias. ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS 187
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313