ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Fórmula ������ = ������������������������������ ������á������������������������ – ������������������������������ ������í������������������������. ������ = ������������ − ������1 Nomenclatura ������ = ������������������������������ ������1 = ������������������������������������ ������é������������������������������ ������������ = ú������������������������������ ������é������������������������������ Ejemplo de aplicación 23 El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue: 31582483 Calcule e interprete el rango. Solución: La fórmula del rango es: ������ = ������������ − ������1 Ordenando la serie, 12334588 El número de elementos está dado por ������ = 8 Por tanto ������ = ������8 − ������1 Reemplazando valores en la fórmula, se tiene ������ = 8 − 1 = 7 Página 100
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Desviación media La desviación media es el promedio de los valores absolutos de las desviaciones en relación de la media aritmética. Características Con datos no agrupados, guarda el mismo número de dimensiones y observaciones. La suma de valores absolutos es relativamente sencilla de calcular. Es engorroso trabajar con ella cuando se trata de poblaciones o muestras grandes en datos no agrupados. Cuanto mayor sea el valor de la desviación media, mayor es la dispersión de los datos. La desviación media al tomar los valores absolutos mide una observación sin mostrar si la misma está por encima o por debajo de la media aritmética. Fórmula para datos no agrupados ������������ = |������������ − ���̅���| ������ Nomenclatura ������������ = ������������������������������ ������������ ������������������������ ������������������������������������������������������ó������ ���̅��� = ������������������������������ ������������������������������é������������������������. ������ = ������������������������������������������������ ������������ ������������������������������������������������������ |������������ − ���̅���| = ������������ ������������ ������������������������������ ������������������������������������������������ ������������ ������������������������ ������������������ ������������ − ������������������ ������������������������������������������������������������������������������ ������������������ ������������������������������������������������ ������ ������������ ������������������������������ Ejemplo de aplicación 24 El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue: 31582483 Calcule e interprete la Desviación Media. Página 101
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Solución. Para la aplicación de la fórmula de ������������, primero se debe calcular la media aritmética. Por tanto X̅ = ∑ ������������ n ̅X = 3 + 1 + 5 + 8 + 2 + 4 + 8 + 3 = 34 8 8 ���̅��� = 4.25 Para una mejor comprensión se ha preparado una tabla en la que se notará las operaciones necesarias y el valor absoluto correspondiente. ������������ |������������ − ���̅���| Desviación Absoluta 3 |3 − 4,25| = |− 1.25| 1.25 1 |1 − 4,25| = |− 3.25| 3.25 5 |5 − 4,25| = |0.75| 0.75 8 |8 − 4,25| = |3.75| 3.75 2 |2 − 4,25| = |− 2.25| 2.25 4 |4 − 4,25| = |− 0.25| 0.25 8 |8 − 4,25| = | 3.75| 3.75 3 |3 − 4,25| = |−1.25| 1.25 34 16.5 Con estos datos se calcula la desviación media en base a la siguiente fórmula: ������������ = |������������ − ���̅���| ������ Reemplazando valores, se tiene: 16.50 ������������ = 8 ������������ = 2.06 Se observa que la desviación media es de 2.06 pacientes por día, es decir que el número varía, en promedio, en 2.06 pacientes por día respecto de la media de 4.25 enfermos diarios. Página 102
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Fórmula para datos agrupados. Se emplea la ecuación: ������������ = ������������������ |������������ − ���̅���| ������ Nomenclatura ������������ = ������������������������������������������������������������ ������������ ������������������������ ������������������������������������������������������ ������������ = ������������������������������ ������������ ������������������������ ������������������������������ ������������ ������������������������������ ���̅��� = ������������������������������ ������������������������������é������������������������. ������ = ������������������������������������������������ ������������ ������������������������������������������������������ Ejemplo de aplicación 25 Calcular la desviación media de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue. Calificación Cantidad de estudiantes (0 − 2] (2 − 4] 2 (4 − 6] 4 (6 − 8] 8 (8 − 10] 16 Total 10 40 Solución: Para calcular la media aritmética se llena la siguiente tabla: Calificación Cantidad de Marca de ������������������������ estudiantes clase ������������ (0 − 2] 2 (2 − 4] ������������ 1 12 (4 − 6] 2 3 40 (6 − 8] 4 5 112 (8 − 10] 8 7 90 16 9 256 Σ 10 Σ 40 Página 103
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Calculando la media aritmética se obtiene: ���̅��� = ∑ ������������ ������������ ������ ���̅��� = 256 40 ���̅��� = 6.4 Para calcular la desviación media es necesario adecuar la tabla de la siguiente forma: Calificación Cantidad de Marca de |������������ − ���̅���| ������������|������������ − ���̅���| estudiantes clase ������������ (0 − 2] 5.4 10.8 (2 − 4] ������������ 1 3.4 13.6 (4 − 6] 2 3 1.4 11.2 (6 − 8] 4 5 0.6 9.6 (8 − 10] 7 2.6 26.0 8 9 71.2 Σ 16 Σ 10 40 ������������ = ������������������ |������������ − ���̅���| ������ 71.2 ������������ = 40 ������������ = 1.78 Varianza La varianza de un conjunto de datos se define como el cuadrado de la desviación típica y viene dada en consecuencia por ������2 . Cuando sea necesario distinguir la desviación típica de una población y de una muestra, se usará ������2 o ������2 , correspondientemente. La varianza no puede ser negativa. Características Para su cálculo se utilizan todos los valores. No se ve influenciada por valores extremos. Página 104
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. La varianza indica el grado en que están dispersos los datos en una distribución. A mayor medida, mayor dispersión. La varianza es un número muy grande con respecto a las observaciones, por lo que con frecuencia se vuelve difícil para trabajar. Debido a que la varianza siempre se expresa en términos de los datos originales elevados al cuadrado, el resultado tiene unidades de medida al cuadrado, lo cual no permite una apreciación lógica. Para solucionar las complicaciones que se tiene con la varianza, se halla la raíz cuadrada de la misma, es decir, se calcula la desviación estándar. Fórmulas Para el cálculo de la varianza poblacional y muestral se debe tener en cuenta si se trata de datos agrupados o no agrupados. Datos no agrupados ������2 = ∑(������������ − ������)2 Datos agrupados ������ ������2 = ∑(������������ − ���̅���)2 ������ − 1 ������2 = ∑ ������������(������������ − ������)2 ������ ������2 = ∑ ������������(������������ − ���̅���)2 ������ − 1 Nomenclatura ������2 = ������������������������������������������������ ������������ ������������ ������������������������������������������ó������ ������������ = ������������������������������������������ ������������ ������������������ ������������������������������������������������������������������������������ ������������ ������������ ������������������������������������������ó������ ������ ������������������������������������������ ������������ = ������������������������������������������������������������ ������������ ������������������������ ������������������������������������������������������ Página 105
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������ = ������������������������������ ������������������������������é������������������������ ������������������������������������������������������������������ ������ = ������ú������������������������ ������������ ������������������������������������������������������������������������������ ������������ ������������ ������������������������������������������ó������ ������2 = ������������������������������������������������ ������������ ������������ ������������������������������������������ ���̅��� = ������������������������������ ������������������������������é������������������������ ������������������������������������������ ������ = ������ú������������������������ ������������ ������������������������������������������������������������������������������ ������������ ������������ ������������������������������������������ Ejemplo de aplicación 26 El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue: 31582483 Calcule e interprete la varianza. Solución. Para la aplicación de la fórmula de ������2, primero se debe calcular la media aritmética. Por tanto ̅X = ∑ ������������ n X̅ = 3 + 1 + 5 + 8 + 2 + 4 + 8 + 3 = 34 8 8 ���̅��� = 4.25 La fórmula de la varianza muestral ������2 = ∑(������������ − ���̅���)2 ������ − 1 Reemplazando los datos en la fórmula, se tiene. (3 − 4.25)2 + (1 − 4.25)2 + (5 − 4.25)2 + (8 − 4.25)2 ������2 = +(2 − 4.25)2 + (4 − 4.25)2 + (8 − 4.25)2 + (3 − 4.25)2 8−1 ������2 = 1.5625 + 10.5625 + 0.5625 + 14.0625 + 5.0625 + 0.0615 + 14.0625 + 1.5625 8−1 Página 106
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������2 = 47.50 8−1 ������2 = 6.79 ������������������������������������������������������2 Ejemplo de aplicación 27 Calcular la varianza de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue. Calificación Cantidad de estudiantes (0 − 2] (2 − 4] 2 (4 − 6] 4 (6 − 8] 8 (8 − 10] 16 Total 10 40 Solución: Para calcular la varianza es necesario primero calcular la media aritmética, la siguiente tabla permite su cálculo. Calificación Cantidad de Marca de ������������������������ estudiantes clase ������������ (0 − 2] 2 (2 − 4] ������������ 1 12 (4 − 6] 2 3 40 (6 − 8] 4 5 112 (8 − 10] 8 7 90 16 9 256 Σ 10 Σ 40 La media aritmética es: ���̅��� = ∑ ������������ ������������ ������ ���̅��� = 256 40 ���̅��� = 6.4 Página 107
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Para calcular la varianza es necesario adecuar la tabla de la siguiente forma: Calificación Cantidad de Marca de (������������ − ���̅���)������ ������������(������������ − ���̅���)������ estudiantes clase ������������ (0 − 2] 29.16 58.32 (2 − 4] ������������ 1 11.56 46.24 (4 − 6] 2 3 1.96 15.68 (6 − 8] 4 5 0.36 5.76 (8 − 10] 7 6.76 67.6 8 9 193.6 Σ 16 Σ 10 40 La fórmula para el cálculo de la varianza del problema, es ������2 = ∑ ������������(������������ − ���̅���)2 ������ − 1 ������2 = 193.6 40 − 1 ������2 = 4.96 ������������������������������������2 Desviación estándar Es la medida más frecuentemente usada de variabilidad y se calcula como la raíz cuadrada de la varianza. Características Expresa la cantidad de variabilidad promedio en una distribución. Permite determinar cómo se distribuyen los valores en relación con la media Su fórmula es indistinta para distribuciones de datos originales o agrupados. Para solucionar las complicaciones que se tiene con la varianza, se halla la raíz cuadrada de la misma, es decir, se calcula la desviación estándar es un número pequeño expresado en unidades de los datos originales y que tiene un significado lógico. A pesar de lo anterior, es difícil describir exactamente qué es lo que mide la desviación estándar. Sin embargo, el teorema de Página 108
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Chebyshev establece que para todo conjunto de datos en una distribución, se cumple lo siguiente. ������ ± ������ ≅ ������������ 68% ������������ ������������������ ������������������������������ ������������ ������������������ ������������������������������������������������������������ó������ ������ ± 2������ ≅ ������������ 95% ������������ ������������������ ������������������������������ ������������ ������������������ ������������������������������������������������������������ó������ ������ ± 3������ ≅ ������������ 99.74% ������������ ������������������ ������������������������������ ������������ ������������������ ������������������������������������������������������������ó������ Fórmula poblacional ������ = √������2 Fórmula muestral ������ = √������2 Nomenclatura ������ = ������������������������������������������������ó������ ������������������á������������������������ ������������������������������������������������������������������ ������ = ������������������������������������������������ó������ ������������������á������������������������ ������������������������������������������������ Ejemplo de aplicación 28 Calcule las desviaciones estándar de los ejemplos de aplicación 26 y 27. Ejemplos aplicación 26 Página 109
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Se tiene que ������2 = 6.79 ������������������������������������������������������2 Aplicando la fórmula de la desviación estándar ������ = √6.79 ������ = 2.61 ������������������������������������������������������ Ejemplos de aplicación 27 Se tiene que ������2 = 4.96 ������������������������������������2 Aplicando la fórmula de la desviación estándar ������ = √4.96 ������ = 2.23 ������������������������������������ 2.6.2 DISPERCIÓN RELATIVA Cuando el objetivo es realizar comparaciones, no resulta adecuado comparar magnitudes absolutas, ya que las unidades no son siempre comparables. Cuando se pretende comparar la dispersión de variables medidas en distintas unidades o variables con distinto orden de magnitud, es necesario relativizar. Coeficiente de variabilidad Una forma de relativizar es considerar la dispersión en relación al valor absoluto de la media, consiguiendo así el coeficiente de variación, que suele ser interpretado en términos de proporción o porcentaje: El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética expresada con un porcentaje. Características Se utiliza cuando no es posible una comparación directa de dos o más medidas de dispersión y muy útil cuando: Página 110
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Los datos están en unidades diferentes (como dólares y días de inasistencia) Los datos están en las mismas unidades, pero los valores medios están muy distantes (como sucede con los ingresos de ejecutivos superiores, y el ingreso de empleados no calificados) Fórmula Se calcula con la siguiente fórmula: ������ ������������ = |���̅���| Nomenclatura ������������ = ������������������������������������������������������������������ ������������ ������������������������������������������ó������ ������ = ������������������������������������������������ó������ ������������������á������������������������ |���̅���| = ������������������������������ ������������������������������������������������ ������������ ������������ ������������������������������ ������������������������������é������������������������ Ejemplo de aplicación 29 El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue: 31582483 Calcule e l coeficiente de variación. Solución. La media aritmética es ���̅��� = 4.25 La varianza es ������2 = 6.79 ������������������������������������������������������2 La desviación estándar es ������ = 2.61 ������������������������������������������������������ La fórmula para el cálculo del coeficiente de variación es Página 111
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������ ������������ = |���̅���| Reemplazando valores, se tiene 2.61 ������������ = |4.25| ������������ = 0.61 ������������������������������������������������������ Ejemplo de aplicación 30 Calcular el coeficiente de variación de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue. Calificación Cantidad de (0 − 2] estudiantes (2 − 4] (4 − 6] 2 (6 − 8] 4 (8 − 10] 8 Total 16 10 40 Solución: La media aritmética es ���̅��� = 6.4 La varianza es ������2 = 4.96 ������������������������������������2 La desviación estándar es ������ = 2.23 ������������������������������������ La fórmula para el cálculo del coeficiente de variación es ������ ������������ = |���̅���| Reemplazando valores, se tiene Página 112
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 2.23 ������������ = |6.4| ������������ = 0.35 2.7 MEDIDAS DE ASIMETRÍA Mide la desviación de la simetría, expresada la diferencia entre la media y la mediana con respecto a la desviación estándar del conjunto de mediciones de la población o muestra. En un conjunto de datos con asimetría positiva, la parte alargada de la gráfica está a la derecha y cuando un conjunto de datos con asimetría negativa, la parte alargada de la gráfica está a la izquierda. Características Definiremos asimetría positiva, cuando ������������ ≤ ������������ ≤ ���̅��� . Esto queda reflejado en el diagrama de barras o en un histograma presentando la distribución de los datos una cola a la derecha. Definiremos asimetría negativa, cuando ���̅��� ≤ ������������ ≤ ������������ . Esto queda reflejado en el diagrama de barras o en un histograma presentando la distribución de los datos una cola a la izquierda. Fórmula ������������ = 3(���̅��� − ������������) ������ Página 113
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Tomando en cuenta esta relación, el coeficiente de asimetría puede variar desde −3 hasta +3. Un valor cercano a −3, como por ejemplo −2.57 indica una considerable asimetría negativa; un valor como +1.63 indica una asimetría positiva moderada. El valor de 0 que se presenta cuando la media y la mediana son iguales, señala que la distribución es simétrica. Nomenclatura ������������ = ������������������������������������������������������������������ ������������ ������������������������������������������í������ ���̅��� = ������������������������������ ������������������������������é������������������������ ������������ = ������������������������������������������ ������ = ������������������������������������������������ó������ ������������������á������������������������ Ejemplo de aplicación 31 El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue: 31582483 Calcule el coeficiente de asimetría. Solución. El ejemplo tiene una media aritmética de ���̅��� = 4.25 Una mediana de ������������ = 3.5 Una desviación estándar de ������ = 2.61 ������������������������������������������������������ La fórmula de coeficiente de variación es ������������ = 3(���̅��� − ������������) ������ Reemplazando valores, se tiene Página 114
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 3(4.25 − 3.5) ������������ = 2.61 2.25 ������������ = 2.61 ������������ = 0.86 Definiremos asimetría positiva, cuando ������������ ≤ ���̅��� . Presenta la distribución de los datos una cola a la derecha. Ejemplo de aplicación 32 Calcular el coeficiente de asimetría de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue. Calificación Cantidad de (0 − 2] estudiantes (2 − 4] (4 − 6] 2 (6 − 8] 4 (8 − 10] 8 Total 16 10 40 Solución: La media aritmética es ���̅��� = 6.4 ������������������������������������ La mediana es ������������ = 6.75 ������������������������������������ La desviación estándar es ������ = 2.23 ������������������������������������ La fórmula para el cálculo del coeficiente de asimetría es ������������ = 3(���̅��� − ������������) ������ Página 115
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 3(6.4 − 6.75) ������������ = 2.23 ������������ = −0.47 Definiremos asimetría negativa, cuando ���̅��� ≤ ������������ . Presenta la distribución de los datos una cola a la izquierda. 2.8 MEDIDAS DE APUNTAMIENTO O CURTOSIS La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: 1. Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). 2. Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. 3. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable (Aula Fácil, 2015). Características ������2 = 0 ; ������������������������������������������������������������ó������ ������������������������������ú������������������������������ Página 116
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������2 > 0 ; ������������������������������������������������������������ó������ ������������������������������������ú������������������������������ ������2 < 0 ; ������������������������������������������������������������ó������ ������������������������������������ú������������������������������ Fórmula El coeficiente de curtosis viene definido por la siguiente fórmula: ������2 = ������4 − 3 = 1 ∑���1���(������������ − ���̅���)4 − 3 ������4 ������ ������4 ������2 = 1 ∑1������ ������������ (������������ − ���̅���)4 − 3 ������ ������4 Página 117
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 32 Calcular el coeficiente de apuntamiento o curtosis de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue. Calificación Cantidad de (0 − 2] estudiantes (2 − 4] (4 − 6] 2 (6 − 8] 4 (8 − 10] 8 Total 16 10 40 Solución: La media aritmética es ���̅��� = 6.4 ������������������������������������ La desviación estándar es ������ = 2.23 ������������������������������������ La fórmula para el cálculo del coeficiente de apuntamiento es ������2 = ������4 − 3 = 1 ∑1������ ������������(������������ − ���̅���)4 − 3 ������4 ������ ������4 1 [2(1 − 6.4)4 + 4(3 − 6.4)4 + 8(5 − 6.4)4 + 16(7 − 6.4)4 + 10(9 − 6.4)4] ������2 = 40 −3 (2.23)4 1 [2(−5.4)4 + 4(−3.4)4 + 8(−1.4)4 + 16(−0.6)4 + 10(−2.6)4] ������2 = 40 −3 (2.23)4 1 [1,700.61 + 534.53 + 30.73 + 2.07 + 456.98] ������2 = 40 −3 24.73 2,724.93 ������2 = 989.2 − 3 ������2 = 2.7547 − 3 ������2 = −0.2453 Página 118
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Como ������2 < 0 Entonces la distribución es platicúrtica. Página 119
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 3 CAPÍTULO III: NÚMEROS ÍNDICES OBJETIVOS El estudiante podrá: 1. Expresar las características y definir un número índice. 2. Calcular e interpretar los números índices de precios, cantidad y valor. 3. Calcular e interpretar los números índices simples, ponderados y no ponderados. 3.1 INTRODUCCIÓN Número índice es una medida estadística diseñada para poner de relieve cambios en una variable o en un grupo de variables relacionadas con respecto al tiempo, situación geográfica, ingresos, o cualquier otra característica. (Spiegel, 1997) Número índice es un número que expresa el cambio relativo en precio, cantidad o valor comparado con un periodo base. (Lind, Marchal, & Wathen, 2006). 3.2 CARACTERÍSTICAS Es un porcentaje, pero generalmente se omite el signo porcentual. Tiene un período base. La mayor parte de los índices se aproximan al décimo más próximo de un porcentaje . La base de la mayor parte de los índices es 100. 3.3 CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES 3.3.1 NÚMEROS ÍNDICES DE PRECIOS Es un número que expresa el cambio relativo de precio comparando con un periodo base. El índice de este tipo más conocido es Índice de precios al consumidor (IPC), el cual mide el costo de vida en los países. Página 120
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 3.3.2 NÚMEROS ÍNDICES DE CANTIDAD Es un número que expresa el cambio relativo de cantidad de una variable comparando con un periodo base. 3.3.3 NÚMEROS ÍNDICES DE VALOR Es un número que expresa el cambio relativo de valor comparando con un periodo base. Es decir mide los cambios en el valor monetario total. (Levin & Rubin, 2004) 3.4 NÚMEROS ÍNDICES SIMPLES Son los que se refieren a una sola magnitud, y por lo tanto nos proporcionan la variación que ha sufrido esa magnitud en dos periodos distintos. Se calcula hallando el cociente del valor del año determinado entre el valor del año base por 100, así: ������������ ������ = ������������ ∗ 100 Donde: ������ = í������������������������������ ������������������������������������ ������������ = ������������������������������ ������������������ ������ñ������ ������������������������������������������������������������������ ������������ = ������������������������������ ������������������ ������ñ������ ������������������������ Ejemplo de aplicación 1 El salario básico unificado en enero del 2012 fue de $292, el salario básico unificado en enero del 2015 fue de $354. Cuál es el índice correspondiente para los trabajadores en enero del 2015, con base en los datos de enero del 2012? ������������ 354 ������ = ������������ ∗ 100 = 292 100 = 121.23 Durante este periodo aumento en 121.23 − 100 = 21.23 el salario básico unificado. Página 121
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 2 En el 2013 la población de hombres en Ecuador fue de 7,868,368 y el de mujeres fue de 7,869,510 ¿Cuál fue la proporción de la población de hombres comparada con la de mujeres? ������������ 7,868,368 ������ = ������������ ∗ 100 = 7,869,510 100 = 99.98 El índice de hombres es de 99.98 de la población de mujeres o la población de hombres es 100 − 99.98 = 0.02 menor que la de mujeres Ejemplo de aplicación 3 Los siguientes datos, se tomaron de los informes anuales de la empresa Johnson & Johnson, de la misma que sus acciones comunes se enlistan en la Bolsa de Valores con el símbolo de JNJ. Tomando como base el año 1991, calcular el Índice Simple. Regla de tres : 5.43 ---- 100 % 6.25 ---- x = 115,10 Años Ventas Cálculo del Índice Índice Nacionales Simple % 1991 (miles de 5.43 /5.43 =1 1992 6.25 /5.43 =1.15101289 100 1993 dólares) 6.90 /5.43 =1.2071823 115.1 1994 7.20 /5.43 =1.32596685 127.07 1995 5.43 7.81 /5.43 =1.43830571 132.6 1996 6.25 9.19 /5.43 =1.69244936 143.83 6.9 169.24 7.2 7.81 9.19 3.5 NÚMEROS ÍNDICES NO PONDERADOS 3.5.1 PROMEDIO SIMPLE DE LOS ÍNDICES DE PRECIOS Este índice se obtiene sumando los índices simples de cada producto y dividiendo para el número de productos. Página 122
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Así: ������ = ∑ ������������ ������ ������������ = Í������������������������������������ ������������������������������������������ ������������ ������������������������ ������������������ ������������ ������������������ ������������������������������������������������������ ������ = ������ú������������������������ ������������ ������������������������������������������������������ Ejemplo de aplicación 4 Tomando como base los siguientes datos se calcula el promedio simple de los índices de precios relativos. 100 + 115.1 + 127.07 + 132.60 + 143.83 + 169.24 ������ = 6 787.85 ������ = 6 ������ = 131.31 Ejemplo de aplicación 5 Un administrador estudia la evolución de los precios de un artículo que produce su empresa en los 5 últimos años, los valores se registran en la siguiente tabla. Calcule el promedio simple de los índices de precios, tomando como periodo de referencia el año 1. Años 12345 Precio del producto 4 5.5 6 5 8 Primero calculo los índices simples Años Precio del Índice producto Simple 1 2 4 100 3 5.5 137.5 4 5 6 150 5 125 8 200 ������ = ∑ ������������ = 100 + 137.5 + 150 + 125 + 200 = 142.5 ������ 5 Página 123
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Esto indica que el precio del producto a incrementado en 42.5% 3.5.2 ÍNDICE AGREGADO SIMPLE Un índice agregado simple se calcula sumando todos los elementos de un periodo dado y luego dividiendo este resultado entre la suma de los mismos elementos durante el periodo base. Así: ������ = ∑ ������������ ∗ 100 ∑ ������0 ������������ ∶ Cantidad de elementos del periodo que se desea el índice ������0: Cantidad de elementos en el año base Ejemplo de aplicación 6 Determine el índice agregado simple de precios para el año 2015 y 2012 de tres productos considerados, usando como año base 2012. Tabla 3: PRODUCTOS DE PRIMERA NECESIDAD Producto 2012 2015 Leche $/lt 0.84 0,86 Pan $/und 0.14 0.16 Huevos$/doc 1.44 1.50 ∑ = 2.42 ∑ = 2.52 ������ = ∑ ������������ ∗ 100 = 2.52 ∑ ������0 2.42 ∗ 100 ������ = 104.13 3.6 NÚMEROS ÍNDICES PONDERADOS Dos métodos para calcular el índice de precios compuestos o ponderado son el método de Laspeyres y el de Paasche. Difieren sólo en el periodo para la ponderación. En el método de Laspeyres se utilizan ponderaciones en el periodo base; es decir, los precios y las cantidades originales de los artículos comprados se utilizan para Página 124
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. encontrar el cambio porcentual durante un periodo, ya sea en el precio o en la cantidad consumida, según el problema. En el método de Paasche se utilizan ponderaciones en el año en curso. (Lind, Marchal, & Wathen, 2006) 3.6.1 ÍNDICE DE LAYSPEYRES ������ = ∑ ������������������0 ������ 100 ∑ ������0������0 Dónde: ������ ������������ ������������ í������������������������������ ������������ ������������������������������������������. ������������es el precio actual ������0 es el precio del periodo base ������0 es la cantidad en el periodo base (Lind, Marchal, & Wathen, 2006) Ejemplo de aplicación 7 Determinar un índice de precios ponderado con el método de Laysperes, con los precios dados en la siguiente tabla tomando como referencia Quito. Producto Cantidad Quito Guayaquil (Libras) Arveja tierna 12,50 20,00 Banano 0,55 7,00 5,00 Limón 0,65 Piña 0,80 15,00 15,18 0,05 1,50 1,31 ������ = ∑ ������������������0 ������ 100 ∑ ������0������0 Calculemos el índice simple de cada producto tomando como referencia Quito, a continuación presentamos los precios de diferentes productos en Quito y Guayaquil Página 125
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Quito Guayaquil Producto ������������(������������) ������������ ������������(������������) ������������ ������������������������ ������������������������ ������������������������ ������������������������ Arveja tierna Banano 110 25 55 20 2,200 2,750 1,100 1,375 Limón 455 325 455 Piña 65 7 65 5 325 1,200 1,710 1,425 80 15 95 18 1,440 7.5 1105 97.5 4,240 5 1.5 65 17 85 4,412.5 3,352.5 4,050 ������ = ∑ ������������������0 ������ 100 ∑ ������0������0 4,050 ������ = 4,412.5 ������ 100 = 91.78 3.6.2 ÍNDICE DE PAASCHE El cálculo es similar que el índice de Laspeyres, pero en lugar de emplear cantidades en el periodo base como ponderaciones, se utilizan cantidades en el período actual. ������ = ∑ ������������������������ ������ 100 ∑ ������0������������ Ejemplo de aplicación 8 En el ejercicio de aplicación 7, calculemos el índice de Paasche 4,240 ������ = 3,352.5 ������ 100 = 126.47 Ejemplo de aplicación 9 Los precios, de cuatro artículos que se indican a continuación, en los años 2001 y 2003, permitiran calcular el índice de Paasche. Artículo po Qo Pt qt pt*qt po*qt 2001 2001 2003 2003 Pan 0.05 0.08 1.92 1.20 Huevos 0.06 20 0.09 24 3.24 2.16 Leche 0.35 30 0.48 36 7.20 5.25 Manzana 0.15 10 0.25 15 5.00 3.00 0.61 15 0.90 20 17.36 11.61 ∑ 75 95 Página 126
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������ = ∑ ������������������������ ������ 100 ∑ ������0������������ 17.36 ������ = 11.61 ������ 100 ������ = 149.52 Este resultado. indica que el precio de este grupo de alimentos. aumentó en el 49.52 %. en el período de dos años. 3.6.3 ÍNDICE DE FISHER Es la media geométrica de los índices de Laspeyres y Paasche. Í������������������������������ ������������������������������ ������������ ������������������ℎ������������ = √(Í������������������������������ ������������ ������������������������������������������������������)(Í������������������������������ ������������ ������������������������������ℎ������) Parece ser el ideal porque combina las mejores características del de Laspeyres y del de Paasche. Ejemplo de aplicación 10 Al tener ya determinado el índice de Laspeyres y el índice de Paasche, en el ejemplo de aplicación 9 procedemos a calcular el índice ideal de Fisher. Í������������������������������ ������������������������������ ������������ ������������������ℎ������������ = √(150.29)(149.52) Í������������������������������ ������������������������������ ������������ ������������������ℎ������������ = √22471.3608 Í������������������������������ ������������������������������ ������������ ������������������ℎ������������ = 149.90 3.7 ÍNDICES DE VALOR Mide cambios tanto en los precios como en las cantidades que intervienenen. Se usa precios y cantidades del perìodo base y del perìodo actual. ∑������������ ∗ ������������ ������ = ∑������������ ∗ ������������ Página 127
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. donde: ������ ������������ ������������ í������������������������������ ������������ ������������������������������ ������������ ������������ ������������ ������������������������������������ ������������ ������������ ������������������í������������������ ������������������������ ������������ ������������ ������������ ������������������������������������������������ ������������������������������������������������������ ������������ ������������ ������������������í������������������ ������������������������ ������������ ������������ ������������ ������������������������������������������������ ������������������������������������������������������ ������������ ������������ ������������������í������������������ ������������������������������������ ������������ ������������ ������������ ������������������������������������ ������������������������������������ Ejemplo de aplicación 11 Los precios de cuatro artículos que se indican a continuación, en los años 2001 y 2003, permitirán calcular el índice de Valor. Artículo Po qo Pt Qt ptqt poqo 2001 2001 2003 2003 Pan 0.05 0.08 1.92 1.00 Huevos 0.06 20 0.09 24 3.24 1.80 Leche 0.35 30 0.48 36 7.20 3.50 Manzana 0.15 10 0.25 15 5.00 2.25 ∑ 15 20 17.36 8.55 0.61 0.90 75 95 ∑������������ ∗ ������������ ������ = ∑������������ ∗ ������������ 17.36 ������ = 8.55 ∗ 100 ������ = 203.04 Con este resultado, miramos que el valor de este grupo de alimentos, aumentó en el 103.04 %, en el período de dos años. Página 128
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 4 CAPÍTULO IV: REGRESIÓN. CORRELACIÓN Y SERIES DE TIEMPO OBJETIVOS El estudiante podrá: 1. Diferenciar e interpretar los términos variable dependiente e independiente. 2. Encontrar y analizar los coeficientes de correlación y determinación y error estándar. 3. Encontrar la ecuación de la recta aplicando el método del libre ajuste 4. Encontrar la ecuación de la recta aplicando el método de los mínimos cuadrados. 5. Especificar los componentes de una serie de tiempo. 6. Encontrar un promedio móvil. 7. Calcular la ecuación para una tendencia lineal 4.1 ANÁLISIS DE CORRELACIÓN Mide la intensidad de la asociación entre dos variables, cuyo principal objetivo es determinar, qué tan intensa es la relación entre esas dos variables. 4.1.1 VARIABLE DEPENDIENTE: Es la variable que se predice o se calcula. 4.1.2 VARIABLE INDEPENDIENTE: Es una variable que proporciona las bases para el cálculo. Es la variable de predicción. 4.1.3 COEFICIENTE DE CORRELACIÓN Mide la intensidad de la asociación entre dos variables. Ambas variables deben ser al menos el nivel de intervalo de medición. El coeficiente de correlación puede variar desde -1.00 hasta 1.00. Página 129
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Si la correlación entre dos variables es 0, no hay asociación entre ellas. Un valor de 1.00 indica una correlación positiva perfecta, y una de -1.00, una correlación negativa perfecta. Un signo positivo significa que hay una relación directa entre las variables, y un signo negativo, que hay una relación inversa. Se identifica con la letra ������. La fórmula que permite calcular el coeficiente de correlación es la siguiente: ������(∑������������) − (∑������)(∑������) ������ = √(������(∑������2) − (∑������)2)(������(∑������2) − (∑������)2) donde: ������ ������������ ������������ ������ú������������������������ ������������ ������������������������������ ������������ ������������������������������������������������������������������������������ ∑������ ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ ∑������ ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ (∑������2) ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ (∑������2) ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ (∑������)2 ������������ ������������ ������������������������������������������������ ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ (∑������)2 ������������ ������������ ������������������������������������������������ ������������ ������������ ������������������������ ������������ ������������������ ������������������������������������������ ������������ ������������ ������������������������������������������������ ������ ∑������������ ������������������������ ������������ ������������������ ������������������������������������������������������ ������������ ������ ������ ������ En la Figura 1 y 2 se resume la intensidad y la dirección del coeficiente de correlación. Figura 1. Intensidad del coeficiente de correlación Página 130
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Figura 2. Recta con correlación positiva y negativa Ejemplo de aplicación 1 Las llamadas mensuales realizadas para la venta de productos de limpieza y desinfección de la empresa Solquim S.A. de lo cual se toma una muestra de 5 vendedores, se expresa en la siguiente tabla. Representantes de No. de No. de ventas llamadas productos vendidos Paquita Trujillo 20 Kléver Sosa 40 40 Ximena López 20 60 Andrea Flores 30 40 Marcelo Campaña 10 60 20 Solución El primer paso para mostrar la relación entre dos variables es graficando los datos en un diagrama de dispersión. En la Figura 3 podemos obsevar que existe relación entre el número de llamadas y los productos vendidos, puesto que, a mayor número de llamadas, se realizan mayores ventas de productos. Para realizar el cálculo del coeficiente de correlación es importante que identifiquemos las variable dependiente (No. de productos vendidos) y la independiente (No. de llamadas). Página 131
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Figura 3. Diagrama de dispersión. A continuación añadimos tres columnas a la tabla para realizar los cálculos requeridos por la fórmula de coeficiente de correlación. ������(∑������������) − (∑������)(∑������) ������ = √(������(∑������2) − (∑������)2)(������(∑������2) − (∑������)2) Representantes de No. de No. de X2 Y2 XY ventas llamadas productos vendidos 400 1,600 800 Paquita Trujillo (X) 1,60 3,600 2,400 Kléver Sosa (Y) 20 40 0 1,600 800 Ximena López 40 60 400 3,600 1,800 Andrea Flores 900 Marcelo Campaña 20 40 100 400 200 Total 30 60 3,40 10,800 6,000 10 20 120 220 0 Reemplazando los datos obtenidos en la fórmula, se tiene. r 56000 120220 53400 1202 510800 2202 Página 132
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. r 30000 26400 17000 1440054000 48400 r 3600 26005600 r 3600 14560000 r 3600 3815.76 El coeficiente de correlación es: ������ = 0.94 El coeficiente de correlación es positivo, lo cual nos permite ver que existe una relación directa entre el número de llamadas y la cantidad de productos vendidos. El valor de 0.94, está bastante cercano a 1.00. Si observamos la figura 1 podemos concluir que la relación es fuerte. 4.1.4 CÁLCULO DE COEFICIENTE DE DETERMINACIÓN Es la porción de la variación total en la variable dependiente Y que se explica por la variación en la variable independiente X. Varía de 0 a 1. Es el cuadrado del coeficiente de correlación. Al elevar el coeficiente de correlación al cuadrado. obtendremos el coeficiente de determinación. ������ = 0.94 Entonces ������2 = 0.942 ������2 = 0.89 Ver figura 3, obtenido a través de excel. Página 133
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 4.2 ANÁLISIS DE REGRESIÓN La intensidad y dirección de la relación que existe entre dos variables se determina en una ecuación que define la relación lineal entre dos variables. 4.2.1 PRINCIPIO DE LOS MÍNIMOS CUADRADOS Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de ������ y los valores pronosticados de ������′. La forma general de la ecuación de regresión lineal es: ������′ = ������ + ������������ donde: ������’ se lee “Y prima”, es el valor pronosticado de la variable ������ para un valor seleccionado de ������. ������ es la ordenada de la intersecciòn con el eje ������; es decir, el valor estimado de ������′ cuando ������ = 0 . Dicho de otra forma, corresponde al valor estimado de ������′, donde la recta de regresiòn cruza el eje ������, cuando ������ = 0. ������ es la pendiente de la recta, o el cambio promedio en Y’ por unidad de cambio (incremento o decremento) en la variable independiente ������. ������ es cualquier valor seleccionado de la variable independiente. Para poder encontrar ( ������ que es la ordenada) y ( ������ que es la pendiente) a las que se les denomina coeficientes de regresión estimado, o simplemente coeficiente de regresión, para lo cual se requiere de las siguientes fórmulas Pendiente de la línea de regresión ������ ∗ ∑(������������) − ∑������ ∗ ∑������ ������ = ������ ∗ ∑������2 − (∑������)2 Punto donde se intercepta con el eje ������ Página 134
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ∑������ ∗ ∑������2 − ∑������ ∗ ∑(������������) ������ = ������ ∗ ∑������2 − (∑������)2 o’ ∑������ ∑������ donde: ������ = ������ − ������ ������ ������ es un valor de la variable independiente ������ es un valor de la variable dependiente ������ es el número de elementos en la muestra Ejemplo de aplicación 2 Para calcular la ecuación de la recta, utilizando el método de los mínimos cuadrados, traemos el planteamiento del problema del ejemplo 1. Representantes de No. de No. de ventas llamadas productos vendidos Paquita Trujillo 20 Kléver Sosa 40 40 Ximena López 20 60 Andrea Flores 30 40 Marcelo Campaña 10 60 20 Las fórmulas a utilizar son las siguientes: Pendiente de la línea de regresión ������ ∗ ∑(������������) − ∑������ ∗ ∑������ ������ = ������ ∗ ∑������2 − (∑������)2 Punto donde se intercepta con el eje ������ ∑������ ∗ ∑������2 − ∑������ ∗ ∑(������������) ������ = ������ ∗ ∑������2 − (∑������)2 Página 135
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ∑������ ∗ ∑������2 − ∑������ ∗ ∑(������������) ������ = ������ ∗ ∑������2 − (∑������)2 o’ ∑������ ∑������ ������ = ������ − ������ ������ A la tabla anterior añadimos tres columnas para realizar los cálculos requeridos por las fórmulas de los mínimos cuadrados. Identificando primero la variable dependiente (No. de productos vendidos) Y y la independiente (No. de llamadas) X. Representantes No. de No. de X2 Y2 XY de ventas llamadas productos vendidos (Y) 400 1,600 800 Paquita Trujillo (X) 1,600 3,600 2,400 Kléver Sosa 20 40 1,600 Ximena López 40 60 400 3,600 800 Andrea Flores 20 40 900 1,800 Marcelo Campaña 30 60 100 400 Total 10 20 3,400 10,800 200 6,000 120 220 Pendiente de la línea de regresión: ������ ∗ ∑(������������) − ∑������ ∗ ∑������ ������ = ������ ∗ ∑������2 − (∑������)2 5(6000) − (120)(220) ������ = 5(3400) − (120)2 30000 − 26400 ������ = 17000 − 14400 3600 ������ = 2600 ������ = 1.38 Punto donde se intercepta con el eje ������: ������ = ∑������ − ������ ∑������ ������ ������ 220 120 ������ = 5 − (1.38) 5 ������ = 44 − 33.12 Página 136
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������ = 10.88 Remplazando en la ecuación ������′ = ������ + ������������, los valores obtenidos se obtiene Y= 10.88+1.38X El valor de ������ = 1.38 significa que para cada llamada adicional que realizan los representantes de ventas pueden esperar aumentar en casi 1.4 el número de venta de productos de limpieza y desinfección. El valor a de 10.88 es el punto donde la ecuaciòn cruza el eje ������, luego si no se hacen llamadas esto es ������ = 0 se venderán 10.88 productos. 4.2.2 TRAZO DE LA LÍNEA DE REGRESIÓN Consideraciones Básicas Para aplicar correctamente la regresión lineal deben satisfacerse varias suposiciones: Para cada valor de la variable ������, hay un cojunto de valores de ������. Estos valores de ������ siguen una distribución normal. Las medias de estas distribuciones normales se encuentran sobre la línea de regresión. Las desviaciones estándar de todas estas distribuciones normales, son iguales. La mejor estimación que se tiene de esta desviación estándar es común, es el error estándar de estimación (������������, ������). Los valores de ������ son estadísticamente independientes. Lo que significa que el tomar la muestra en determinado valor de X no depende de ningún otro valor de X. Esto es importante cuando se toman datos durante un período. En esos casos los errores de un determinado período suelen estar correlacionados con lo de otro período. Ejemplo de aplicación 3 En el ejemplo 2 se obtuvo la gráfica ������ = 10.88 + 1.38������. El valor de 10.88 representa la intersección con el eje y, para encontrar otro punto, arbitrariamente damos un punto cualquiera a la variable X, podría ser el 20, remplazando en la ecuación ������ = 10.88 + 1.38(20) se obtiene Y = 38.48. Si tenemos dos puntos ya podemos encontrar el gráfico de la ecuación al unir estos puntos. Tomando en cuenta que se trata de la Ecuación de la recta, como se muestra a continuación. Página 137
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Figura 4 Gráfica de la ecuación de la recta. 4.2.3 EL ERROR ESTÁNDAR DE LA ESTIMACIÓN Es la medida de la dispersión de los valores observados. con respecto a la línea de regresión. Está en las mismas unidades que la variable dependiente. Se basa en las desviaciones al cuadrado respecto de la recta de regresión Valores pequeños indican que los puntos se agrupan cerca de la recta de regresión Para su cálculo se utiliza la siguiente fórmula: S y.x Y 2 aY bXY n2 Ejemplo de aplicación 4 Al trabajar con los datos del ejercicio del ejemplo 3, tendremos el siguiente error estándar de estimación. Para su cálculo se utiliza la siguiente fórmula: S y.x Y 2 aY bXY n2 S y.x 10,800 10.88220 1.386,000 52 Página 138
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Sy.x 10,800 2,393.6 8,280 3 S y.x 126.4 3 S y.x 42.13 S y.x 6.49 El error estándar de estimación. mide la variación alrededor de la línea de regresión. 4.3 FUNDAMENTOS PARA EL ANÁLISIS DE UNA SERIE DE TIEMPO Una serie de tiempo es una oportunidad, de poder mejorar las decisiones que toma la gerencia ya que se puede realizar una predicción a largo plazo. Ya que una serie de tiempo al registrar los datos puede hacer uso de ellos para realizar proyecciones, ya que los patrones del pasado pueden repetirse y ser de gran utilidad. En una empresa si disponemos de la información en que los periodos de ventas en que la demanda es alta pueden ayudar a predecir, planificar y programar la producción en un período posterior, incluso puede ayudar a tomar decisiones a largo plazo. 4.4 COMPONENTES DE UNA SERIE DE TIEMPOS Tendencia Secular Variación cíclica Variación estacional Variación irregular. 4.4.1 TENDENCIA SECULAR La serie de tiempo con tendencia secular sigue una dirección uniforme en el tiempo. A pesar de que pueda haber variaciones, es importante notar a largo plazo la tendencia que sigue. Página 139
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 5 En el siguiente ejemplo se muestra una empresa se sabe que en función del tiempo, sus clientes han incrementado en cientos, figuran en la tabla siguiente: se puede observar que el incremento es proporcional en el tiempo y sigue una tendencia definida. Figura 5. Ventas del 2009 al 2014 El micro mercado Cotocollao revisa el historial de sus ventas y encuentra que las ventas se han incrementado con el tiempo, a pesar de tener una acentuada disminución en las ventas en el año 2001 comparado con las ventas en el 2000, luego se observa una recuperación en los años siguientes. Figura 6. Venta del micro mercado Cotocollao Página 140
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Si consideramos el número personas que salieron a España a buscar trabajo de un determinado sector del país en el transcurso del 2000 al 2010, encontramos que en el 2000 salieron 1,000 personas, mientras que en el 2002 fueron 1,300, luego encontramos una clara disminución para el año 2010 ya tenemos 70 personas que abandonaron el país, la tendencia a largo plazo está bastante clara. Figura 7. Emigrantes a España (datos supustos) 4.4.2 VARIACIÓN CÍCLICA Se da un aumento y una disminución en períodos mayores a un año, manteniendo la tendencia en el trascurso del tiempo. Ejemplo de aplicación 6 En la parte productiva es normal que existan variaciones en las ventas o ingresos en el trascurso de períodos de tiempo, esto se puede dar por reactivación de la economía por nuevos ingresos petroleros o disminución de los mismos. Nuevas obras de inversión en el país como es el caso de las hidroeléctricas, finalización de estas obras, incluso cambios de gobierno, entre otros factores que determina e influyen sobre la producción. El ejemplo expuesto a continuación muestra la variación de los ingreso de Sinec Constructores en miles de dólares entre 1998 y el 2015. Página 141
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ingresos en miles de dolares 800 600 400 200 0 Ingresos en miles de dólares 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 Año Figura 8. Ingresos en miles de dólares Sinec Constructores 4.4.3 VARIACIÓN ESTACIONAL Sigue patrones de cambio durante un año, y se repiten en los años posteriores. Ejemplo de aplicación 7 En la mayoría de negocios suele suceder que se repiten los patrones de venta de un año a otro, pueden ser por situaciones como las de fin de año en la que la mayoría realiza compras y regalos por motivos religiosos o de comportamiento, que en nuestro país viene acompañado del sueldo adicional que se recibe en diciembre, lo mismo sucede con el inicio de clases y todos los requerimientos, que pueden ser lista de útiles, ropa de uniformes, zapatos. Negocios que se ven estimulados en sus ingresos en estas fechas. Este comportamiento suele repetirse cada año, para ello se muestra un ejemplo de la ventas en miles de dólares. Figura 9. Ventas en miles de dólares Página 142
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 4.4.4 VARIACIÓN IRREGULAR Es aquella cuya variación es difícil predecir y pueden se variaciones episódicas y residuales. Ejemplo de aplicación 8 Las variaciones episódicas pueden originarse por eventos como una guerra, una huelga, un golpe de estado, una catástrofe natural y la residual por los demás factores que originan la variación. Como se indica son impredecibles. 4.5 MEDICIÓN DE TENDENCIAS 4.5.1 TENDENCIA LINEAL Se da un aumento y una disminución de los ingresos, ventas, gastos u otra variable, manteniendo la tendencia en el trascurso del tiempo. Del ejemplo 6 anterior la variación de los ingreso de Sinec Constructores en miles de dólares entre 1998 y el 2015. Podemos ver que la tendencia que sigue a pesa de la variación en el transcurso del tiempo el lineal. Método de libre ajuste Es un método aproximado y rápido para obtener la ecuación de la recta. Ejemplo de aplicación 9 En la tabla 4, se muestra los ingreso en miles de dólares en función del tiempo. Solución Graficamos como se muestra en la figura 10 los puntos de los años y los ingresos, numerados el primero como el año uno (1998 = Página 143
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 1), como se indica en la tabla 4 para los siguientes años tomando la misma consideración. Trace una recta entre los puntos, la recta indica la tendencia. Tabla 4 CÁLCULO POR EL MÉTODO DEL LIBRE AJUSTE Ingresos Ingresos Años (X) Años (X) en miles de Años (X) Años (X) en miles de 1998 1 dólares (Y) dólares (Y) 1999 2 2000 3 200 2007 10 450 2001 4 2002 5 300 2008 11 470 2003 6 2004 7 350 2009 12 490 2005 8 2006 9 250 2010 13 600 270 2011 14 700 290 2012 15 750 400 2013 16 650 500 2014 17 670 550 2015 18 690 Extendemos la recta para obtener el punto donde interseca con el eje ‘������’. Encontramos dos puntos de esta recta estimando los valores que serán aproximados, el primero puede ser (0; 185) y el oro el final (18; 735). Encuentre el valor de la pendiente con los puntos anteriores ������2 − ������1 735 − 185 ������ = ������2 − ������1 = 18 − 0 = 30.55 El valor de ������ recuerde que es la intersección con el eje ‘������’ el cual es ������ = 185 La ecuación de la recta es ������ = ������ + ������������ Remplazando los valores encontrados ������ = 185 + 30.55������ Al realizar una comparación de la ecuación de la recta encontrada en Excel es bastante aproximada a la encontrada. Página 144
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Figura 10. Ingreso en miles de dólares Método de mínimos cuadrados Para encontrar la tendencia aplicando el método de los mínimos cuadrado realizamos las siguientes consideraciones. Grafique los puntos de los años numerados el primero como el año uno (1998 = 1) los siguiente tomando la misma consideración como en el caso anterior o simplemente con los años reales y los ingresos. La ecuación de la recta es ������ = ������ + ������������ Donde ∑������ ∗ ∑������2 − ∑������ ∗ ∑(������������) ������ = ������ ∗ ∑������2 − (∑������)2 ������ ∗ ∑(������������) − ∑������ ∗ ∑������ ������ = ������ ∗ ∑������2 − (∑������)2 Ejemplo de aplicación 10 Realice una tabla y encuentre los valores requeridos, al final podemos ver los valores encontrados. Página 145
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Tabla 5. CÁLCULO DE LOS MÍNIMOS CUADRADOS Número de Años (X) Ingresos en ������������ X*Y años miles de 1998 3,992,004 399,600 1 1999 dólares (Y) 3,996,001 599,700 2 2000 200 4,000,000 700,000 3 2001 300 4,004,001 500,250 4 2002 350 4,008,004 540,540 5 2003 250 4,012,009 580,870 6 2004 270 4,016,016 801,600 7 2005 290 4,020,025 1,002,500 8 2006 400 4,024,036 1,103,300 9 2007 500 4,028,049 903,150 10 2008 550 4,032,064 943,760 11 2009 450 4,036,081 984,410 12 2010 470 4,040,100 1,206,000 13 2011 490 4,044,121 1,407,700 14 2012 600 4,048,144 1,509,000 15 2013 700 4,052,169 1,308,450 16 2014 750 4,056,196 1,349,380 17 2015 650 4,060,225 1,390,350 18 36117 670 17,230,560 690 72,469,245 ∑������������ 18 ∑������ ∑������2 ������ 8,580 ∑������ Remplace los valores encontrados en las fórmulas. ∑������ ∗ ∑������2 − ∑������ ∗ ∑(������������) ������ = ������ ∗ ∑������2 − (∑������)2 8580 ∗ 72469245 − 36117 ∗ 17230560 ������ = 18 ∗ 72469245 − (36117)2 = −60,774 ������ ∗ ∑(������������) − ∑������ ∗ ∑������ ������ = ������ ∗ ∑������2 − (∑������)2 18 ∗ 17230560 − 36117 ∗ 8580 ������ = 18 ∗ 72469245 − (36117)2 ������ = 30.526 Página 146
ESTADÍSTICA BÁSICA IIngreso en miles de dólares Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Remplazando los valores encontrados ������ = ������ + ������������ ������ = − 60,774 + 30.526������ Al realizar una comparación de la ecuación de la recta encontrada en Excel es igual al calculado. Ingresos en miles de dolares (Y) 800 600 400 y = 30,526x + 186,67 200 R² = 0,8713 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Años Figura 11. Ingreso en miles de dólares 4.5.2 MÉTODO DEL PROMEDIO MÓVIL El promedio móvil es óptimo para patrones de demanda aleatoria o nivelada donde se pretende eliminar el impacto de los elementos irregulares históricos mediante un enfoque en períodos de demanda reciente. El promedio móvil podemos observar la tendencia que indica la proyección de la serie, la variación cíclica en este caso el ciclo se repite cada 7 años Finalmente se promedia la variación cíclica y la variación irregular y como resultado obtenemos la tendencia, que esta expresada por una recta que es una forma suavizada de representar el promedio móvil, recta viene dada de la forma ������ = ������ + ������������ , donde ������ es la pendiente de la recta y ������ representa la intersección con el eje ������. Página 147
ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 11 Tabla 6 CÁLCULO DEL PROMEDIO MOVIL PARA 7 AÑOS Año Ventas Promedio móvil de 7 años 1990 4 1991 5 6.14 1992 6 6.29 1993 7 6.43 1994 8 6.57 1995 7 6.71 1996 6 6.86 1997 5 7.00 1998 6 7.14 1999 7 7.29 2000 8 7.43 2001 9 7.57 2002 8 7.71 2003 7 7.86 2004 6 8.00 2005 7 8.14 2006 8 8.29 2007 9 8.43 2008 10 8.57 2009 9 8.71 2010 8 2011 7 2012 8 2013 9 2014 10 La primera columna indica el año, la segunda la ventas anuales en miles de dólares y la tercera el promedio móvil el mismo que se calcula sumando los primeros 7 años de ventas que es donde se repite completamente el ciclo (color azul) y dividimos para en número de años (4 + 5 + 6 + 7 + 8 + 7 + 6)/7 = 6.14 que viene a ser el promedio móvil, el siguiente de color naranja (5 + 6 + 7 + 8 + 7 + 6)/7 = 6.29 y de esta manera continuamos con los siguientes valores. Si graficamos los años con las ventas observamos diferentes rectas cada una con una tendencia propia, en este caso al graficar el tiempo con el promedio móvil, la gráfica se suaviza y Página 148
Ventas ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. se convierte en la tendencia de las ventas, si tomamos dos puntos cualquiera de los años y el valor de promedio móvil (1993; 6.14) y (2011; 8.71), calculamos la pendiente ������ = 8.71−6.14 = 0.1429 , 2011−1993 la proyección de la recta sobre el eje “y” es 5.57. De ésta manera obtenemos la ecuación ������ = 0.1429������ + 5.57 que representa el promedio móvil; excel es una gran herramienta que permite encontrar la variación y la tendencia con la respectiva ecuación, la gráfica muestra lo expuesto. 12 Ventas y = 0,1429x + 5,5714 10 8 6 Ventas 4 Promedio Movil Lineal (Promedio 2 Movil) 0 Años Figura 12. Ventas entre 1900 y 2014 En la mayoría de los casos es difícil obtener una tendencia lineal, por lo general sea las ventas, los ingreso, la producción u otra variable en función del tiempo presentan una variación irregular, razón por la que la tendencia del promedio móvil no representa una línea recta como se muestra en el ejemplo a continuación. Además se debe considerar la naturaleza de los datos que pueden ser mensuales en este caso el promedio móvil se sugiere que se lo tome para los doce meses, o incluso la información la podemos tener diaria, que la relacionaríamos con el número de días de la semana. En la tabla expuesta a continuación los ingresos por Página 149 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157