Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Estadística básica I

Estadística básica I

Published by veroronquillo1, 2021-10-21 00:08:31

Description: Estadística básica I

Search

Read the Text Version

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Diagrama de barras. Se representa en el primer cuadrante de un sistema coordenado rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase son proporcionales a las alturas de las barras. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción de cada uno de los posibles resultados. Una característica distintiva de la gráfica de barras es que existe una distancia o espacio entre las barras. 500 Número de vehículos500 400 400 300 300 200 200 200 100 0 Modelos SUV'S Figura 7. Gráfica de barras de vehículos Toyota, modelos Suv's vendidos en el ecuador en el año 2014. Gráficas en forma de pastel. Es una gráfica que muestra la parte o porcentaje que representa cada clase del total de números de frecuencia. Para elaborar una gráfica de pastel consiste en registrar los porcentajes 0, 10, 20, … , 100 uniformemente alrededor de la circunferencia (véase la figura 8). Para indicar la parte de 19% destinada a 4RUNNER, trace una línea del centro del círculo al 0, y otra línea del centro del círculo al 19%. Tome el punto cero del círculo y constitúyalo como punto de partida, girando en sentido a las manecillas del reloj, señale los valores constantes en las frecuencias relativas acumuladas, en su orden; ello le permitirá distribuir los porcentajes correspondientes de cada una de las características de la variable. Página 50

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 4RUNNER 19% 4RUNNER RAV4 FJ FJ CRUISER 31% CRUISER FORTUNER LAND CRUISER 12% RAV4 FORTUNER 25% LAND CRUISER 13% Figura 8. Gráfica de pastel de vehículos Toyota, modelos Suv's vendidos en el ecuador en el año 2014. 1.8.2 DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO DISCRETO Diagrama de barras En el ejemplo del número de hijos por familia, la variable número de hijos, es cuantitativa discreta, por tanto, recordando la distribución de frecuencias absolutas del número de hijos por familia de la tabla 15, se tiene NÚMERO DE FRECUENCIA HIJOS ������������ ������������ 0 3 1 6 2 7 3 5 4 3 5 1 TOTAL 25 El diagrama de barras correspondiente, se representa a continuación. Página 51

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 8 3 7 1 0 6 5 F7 5 R6 3 E5 C4 1234 U3 NÚMERO DE HIJOS E2 N C1 I0 A Figura 9. Diagrama de barras del número de hijos por familia Diagrama en forma de pastel Recordando la distribución de frecuencias absolutas y relativas del número de hijos por familia de la tabla 16, se tiene ������������ ������������ ������������ 0 3 0.12 1 6 0.24 2 7 0.28 3 5 0.20 4 3 0.12 5 1 0.04 TOTAL 25 1 El diagrama en forma de pastel correspondiente a la frecuencia absoluta ������������, se representa a continuación. 1 3 3 6 0 5 1 2 3 4 5 7 Figura 10. Frecuencias absolutas del número de hijos por familia. Página 52

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. El diagrama en forma de pastel correspondiente a la frecuencia relativa ℎ������, se representa a continuación. 0,04 0,12 0,12 0,20 0,24 01 23 45 0,28 Figura 11. Frecuencias relativas del número de hijos por familia. 1.8.3 DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO CONTINUO Son de común aplicación en datos agrupados cuantitativo continuo. El histograma, el polígono y la ojiva, son gráficas usualmente usadas para datos cuantitativos continuos, en los que, como se observará a continuación, se representa las frecuencias: absolutas, absolutas acumuladas, relativas y relativas acumuladas. Para la representación gráfica, tenga en cuenta la Tabla 18, que se observa a continuación. ������′������−������ − ������′������ ������������ ������������ ������������ ������������ 150 – 156 10 10 0.20 0.20 156 – 162 6 16 0.12 0.32 162 – 168 6 22 0.12 0.44 168 – 174 11 33 0.22 0.66 174 – 180 9 42 0.18 0.84 180 – 186 8 50 0.16 1.00 50 1.00 Página 53

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Histograma Se representa en el primer cuadrante de un sistema coordenado rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase son proporcionales a las alturas de las barras. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción de cada uno de los posibles resultados. Una característica distintiva de la gráfica de barras es que no existe una distancia o espacio entre las barras. El histograma es útil para representar las frecuencias absolutas y relativas de una variable continua. F 12 11 8 RA 10 9 EB 6 CS 10 6 UO EL 8 NU CT 6 IA A 4 2 0 150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186 ESTATURAS Figura 12. Histograma de frecuencias absolutas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. 0,25 0,2 0,22 0,2 F 0,18 0,16 RR EE 0,15 0,12 0,12 CL UA 0,1 ET NI 0,05 CV IA 0 A 150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186 ESTATURAS Figura 13. Histograma de frecuencias relativas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. Página 54

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Polígono Se representa en el primer cuadrante de un sistema coordenado rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias se representan por las alturas correspondientes en los extremos superiores de cada intervalo. Una característica distintiva del polígono es que las alturas correspondientes a los extremos superiores se unen mediante segmentos. El Polígono es útil para representar las frecuencias absolutas y relativas de una variable continua. 12 F 10 10 11 RA 8 9 EB 6 8 CS UO EL 4 66 NU CT 2 IA A0 150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186 ALTURAS Figura 14. Polígono de frecuencias absolutas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. 0,25 F 0,2 0,2 0,22 RR 0,15 EE 0,18 CL 0,16 UA ET 0,1 NI CV 0,12 0,12 IA A 0,05 0 150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186 ALTURAS Figura 15. Polígono de frecuencias relativas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. Ojiva Se representa en el primer cuadrante de un sistema coordenado rectangular, aquí las clases se representan en el eje horizontal y la Página 55

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. frecuencia de clase en el eje vertical. Las frecuencias acumuladas se representan por las alturas correspondientes en los extremos superiores de cada intervalo, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del último. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción de cada uno de los posibles resultados. Una característica distintiva de la ojiva es que las alturas correspondientes a los extremos superiores se unen mediante segmentos. La ojiva es útil para representar las frecuencias absolutas acumuladas y relativas acumuladas de una variable continua. F A A 60 50 50 R B C 50 42 E S U 40 33 C O M U L U 30 22 E U L 16 N T A 20 10 CD 10 0 A IA 0 S AS 144 – 150 – 156 – 162 – 168 – 174 – 180 – 186 – 150 156 162 168 174 180 186 192 ALTURAS Figura 16. Ojiva de frecuencias absolutas acumuladas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. 1,2 1 1 F A 1 0,84 0,8 0,66 RR C 0,6 0,4 0,44 E E U 0,2 0,32 C L 0,2 M 0 UA 0 U ET 144 – 150 – 156 – 162 – 168 – 174 – 180 – 186 – L 150 156 162 168 174 180 186 192 N I A C V D IA A A ALTURAS Figura 17. Ojiva de frecuencias relativas acumuladas de las alturas de 50 estudiantes de estadística, del periodo 2015 – 2015. Página 56

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 2 CAPÍTULO II: ANÁLISIS ESTADÍSTICO SIMPLE OBJETIVOS 1. Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica. 2. Conocer las características, uso, ventajas de las Medidas de Tendencia Central. 3. Identificar la ubicación de las Medidas de Tendencia Central. 4. Calcular la amplitud de variación, desviación media, la varianza y la desviación estándar de datos originales. 5. Calcular la amplitud de variación, desviación media, la varianza y la desviación estándar de datos agrupados. 6. Conocer las ventajas y desventajas de las Medidas de Dispersión. 7. Calcular y analizar los cuartiles, deciles y centiles, la amplitud cuartílica e intecuartílica. 8. Elaborar el diagrama de caja. 9. Calcular y analizar el coeficiente de variación y asimetría. 2.1 INTRODUCCIÓN En el capítulo anterior se presentó algunas definiciones útiles para el estudio de la estadística, la recolección de la información, su forma de resumir, tanto en tablas como en gráficos para variables cualitativas y cuantitativas. En el presente capítulo se considera medidas resúmenes, tales como; las medidas de centralización, de posición, de dispersión, de asimetría y apuntamiento. Resumir un conjunto de datos es pasar de una visión detallada a una generalización simple e informativa tratando de preservar las características esenciales. ¿Por qué resumir? Para simplificar la comprensión y la comunicación de los datos. 2.2 TIPOS DE ESTADÍGRAFOS Después de haber ordenado y descrito un conjunto de datos, aún el análisis resulta un tanto incompleto; es necesario entonces resumir la información y facilitar así su análisis e interpretación utilizando ciertos indicadores. A estos indicadores se les denomina Página 57

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. también estadígrafos o medidas de resumen, permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en el estudio; estas son: 1. Medidas de tendencia central a. Media aritmética b. Media ponderada c. Mediana d. Moda e. Media geométrica f. Media armónica 2. Medidas de tendencia no central a. Deciles b. Cuartiles c. Percentiles 3. Medidas de dispersión a. Rango b. Desviación media c. Desviación estándar d. Varianza e. Coeficiente de variación 4. Medidas de asimetría, y 5. Medidas de apuntamiento o curtosis. 2.3 ESTADÍGRAFOS DE TENDENCIA CENTRAL Al recolectar y organizar los datos, el objetivo es encontrar un punto central en función de sus frecuencias. En estadística las medidas de tendencia central, varían de acuerdo con lo que se desea o que se requiera encontrar del conjunto de datos recolectados. Estas medidas serán estudiadas en dos formas: 1. Datos no agrupados, y 2. Datos agrupados en una tabla de frecuencias. Las fórmulas difieren para calcular en vista de que depende si Página 58

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. son datos de población o datos de muestras, pero el procedimiento es el mismo. Una medida de tendencia central es un valor único que resume un conjunto de datos, señalando el centro de los valores. 2.3.1 MEDIA ARITMÉTICA Es la medida de tendencia central que más se utiliza en Estadística, se calcula sumando todos los valores de las observaciones y se divide para el total de las mismas. Características 1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas. 2. En su cálculo se toman en cuenta todos los valores de la variable. 3. Es lógica desde el punto de vista algebraico. 4. La media aritmética es altamente afectada por valores extremos. 5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. 6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo una media aritmética. 7. Esta medida es muy útil para analizar y comparar dos o más poblaciones. Media aritmética con datos no agrupados La media aritmética poblacional y muestral de datos no agrupados, es la suma de todos los valores de la población o muestra, dividido para el número total de los datos. Fórmula poblacional La fórmula está dada por: μ = ∑ ������������ N donde: Página 59

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. μ Es la representación de la media de la población, con letra griega “mu” minúscula. N Indica el número total de elementos de la población. ������������ Es cualquier valor en particular.  La letra griega “sigma” mayúscula, es para sumar los datos. ∑ ������������ Indica que es la sumatoria total de los valores de ������. La característica que mide a la población, está representada por el parámetro. Es una característica de una población. Ejemplo de aplicación 1 Las edades de un equipo titular de básquet de la liga ecuatoriana es: 22, 28, 19, 25 y 26. Calcular la media de edad de los jugadores. Solución El equipo titular de básquet contiene cinco jugadores, en consecuencia, se trata de la población o equipo titular. ������ = 5, equipo titular ∑ ������������ = ������1 + ������2 + ������3 + ������4 + ������5 = 22 + 28 + 19 + 25 + 26 = 120 μ = ∑ ������������ = 120 = 24 ������ñ������������ N 5 μ = ∑ ������������ = 120 N 5 μ = 24 ������ñ������������ Interpretación del resultado El equipo titular de básquet está conformado con una media de edad de 24 años. Página 60

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 2 El bufete de abogados Emily’s Asociados tiene 10 socios, el día de hoy estos socios atendieron el siguiente número de clientes. Bufete de No. de clientes Abogados ������������ 5 Socio 1 10 Socio 2 8 Socio 3 6 Socio 4 7 Socio 5 6 Socio 6 12 Socio 7 11 Socio 8 10 Socio 9 5 Socio 10 a. ¿Esta información es una muestra o una población? b. ¿Cuál es el número medio de clientes atendidos por los 10 socios del bufete? Solución Es una población, puesto que se toma en cuenta a todos los socios del bufete de abogados Emily’s Asociados y para sacar la media aritmética poblacional, se debe sumar todos los valores y dividir para el número total de los socios atendidos. ������ = 10 ∑ ������������ = 80 μ = ∑ ������������ = 80 N 10 μ=8 Interpretación del resultado El valor medio de clientes atendidos por socio es 8. Página 61

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Fórmula muestral La fórmula está dada por: ���̅��� = ∑ ������������ ������ donde ���̅��� Media aritmética de la muestra ������ Número de elementos de la muestra ∑ ������������ Indica que es la sumatoria total de los valores de ������. Ejemplo de aplicación 3 Un equipo de básquet de la liga ecuatoriana está conformado por 12 jugadores, de los cuales se toma una muestra aleatoria de 5 de ellos, con el propósito de calcular la estatura promedio. Si sus estaturas en centímetros son: 190, 208, 196, 205 y 206. ¿Cuál es la media en centímetros? Solución El equipo completo de básquet contiene 12 jugadores, si se considera a cinco de ellos, tomados de manera aleatoria, entonces se tiene una muestra, ya que se ha considerado una parte del total. ������ = 5, muestra aleatoria ∑ ������������ = ������1 + ������2 + ������3 + ������4 + ������5 = 190 + 208 + 196 + 205 + 206 = 1,005 ���̅��� = ∑ ������������ = 1,005 n 5 ���̅��� = 201 ������������������������í������������������������������������ Interpretación del resultado La estatura promedio de la muestra de los jugadores de básquet es de 201 centímetros. Página 62

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Media aritmética con datos agrupados En datos agrupados se pueden presentar dos grupos de tablas de frecuencia. Cuando una serie simple se le agrupa con frecuencias para obtener la media aritmética, se multiplica la variable ������������ por la frecuencia respectiva fi , se obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos ������ (Suárez, 2015). La fórmula de cálculo está dada por: Fórmula poblacional ������ = ������1������1 + ������2������2 + ⋯ + ������������������������ = ∑ ������������������������ = ∑ ������������ ������1 + ������2 + ⋯ + ������������ ∑ ������ ������ Donde ∑ ������ = ������ que es el número total de elementos de una población. Ejemplo de aplicación 4 En una fiesta infantil se encuentran 20 niños (as) de edades de 4 a 10 años, las edades en años están distribuidas de acuerdo a la información siguiente. ������������ ������������ en años frecuencia 4 3 5 2 6 3 7 1 8 6 9 1 10 4 Total 20 Se requiere calcular la media aritmética. Solución Como ������ = ∑ ������������������������ = ∑ ������������ ∑ ������ ������ Página 63

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Entonces, de acuerdo a la información prevista en la tabla del problema, se tiene (3)(4) + (2)(5) + (3)(6) + (1)(7) + (6)(8) + (1)(9) + (4)(10) 144 ������ = 3 + 2 + 3 + 1 + 6 + 1 + 4 = 20 ������ = 7.2 ������ñ������������ Interpretación del resultado El promedio de edad de los 20 niños y niñas que se encuentran en la fiesta infantil es de 7.2 años. Cuando una serie se la agrupa en intervalos para obtener la media aritmética, se multiplica la marca de clase de intervalo ������������ por la frecuencia respectiva ������������ , se obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos (Suárez, 2015). La fórmula de cálculo está dada por: ������ = ������1������1 + ������2������2 + ⋯ + ������������������������ = ∑ ������������������������ = ∑ ������������ ������1 + ������2 + ⋯ + ������������ ∑ ������ ������ Donde ������������ es la marca de clase de los intervalos. La fórmula para el cálculo de la marca de clase es: ������������ = ���������′���−1 + ���������′��� 2 Donde ���������′���−1 = ������í������������������������ ������������������������������������������������ ������������������ ������������������������������������������������������ ���������′��� = ������í������������������������ ������������������������������������������������ ������������������ ������������������������������������������������������ Ejemplo de aplicación 5 La edad de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, matriculados en el periodo abr – sep del 2015, arrojaron los resultados siguientes. Página 64

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. EDAD (AÑOS MARCA DE CLASE NÚMERO CUMPLIDOS) ������′������−������ + ������������ 1,146 ���������′��� 18 + 28 573 2 = 23 291 [������������ – ������������) ᴬ 113 28 + 38 52 [������������ – ������������) 2 = 33 2,175 [������������ – ������������) 38 + 48 2 = 43 [������������ – ������������) 48 + 58 MÁS DE 57 2 = 53 TOTAL ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa que el 28 no está incluido, pero si incluye los valores cercanos al 28 por la izquierda. Se requiere calcular la media de edad en años. Solución Se ha considerado a todos los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de toda la población. En consecuencia ������ = ∑ ������������������������ = ∑ ������������ ∑ ������ ������ Entonces, de acuerdo a la información prevista en la tabla del problema y a la característica cinco de la media aritmética, no es posible el cálculo de ������������������������ , en razón que el quinto intervalo es abierto. Fórmula muestral ���̅��� = ∑ ������������������������ = ∑ ������������ ∑ ������ ������ Ejemplo de aplicación 6 Si de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se toma como muestra a 50 Página 65

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. matriculados de manera aleatoria en el periodo abr – sep del 2015, para determinar la media de estatura en centímetros. Entonces, de acuerdo a las mediciones correspondientes se tiene. ���������′���−������ − ������′������ ������������ ������������ [150 – 156) 153 10 [156 – 162) 159 6 [162 – 168) 165 6 [168 – 174) 171 11 [174 – 180) 177 9 [180 – 186) 183 8 50 ∑= Solución Como ���̅��� = ∑ ������������������������ = ∑ ������������ ∑ ������ ������ Entonces, adecuando la tabla de información del problema y obteniendo la marca de clase ������������ , se tendría: ���������′���−������ − ������′������ ������������ ������������ ������������������������ [150 – 156) 153 10 1,530 [156 – 162) 159 6 954 [162 – 168) 165 6 990 [168 – 174) 171 11 1,881 [174 – 180) 177 9 1,593 [180 – 186) 183 8 1,464 50 8,412 ∑= Reemplazando en la fórmula, queda: ���̅��� = 8,412 = 168.24 ������������������������í������������������������������������ 50 Página 66

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 2.3.2 MEDIA PONDERADA En ocasiones es necesaria la obtención de una media aritmética de variables cuyos valores observados tienen distinta importancia y por tanto se deben ponderar de distinta manera para obtener la media. En el caso que la ponderación sea distinta, se habla de una media ponderada y los valores por los cuales se ponderan los distintos valores se llaman pesos o ponderaciones (������������). La fórmula está dada por: ���̅��������� = ������1������1 + ������2������2 + ������3������3 + ⋯+ ������������������������ ������1 + ������2 + ������3 + ⋯ + ������������ A la fórmula se le resume de la siguiente forma: ���̅��������� = ∑������������=1 ������������������������ ∑������������=1 ������������ Siendo: ���̅��������� = ������������ ������������������������������ ������������������������������������������������������ Que se lee: “X barra subíndice W” Ejemplo de aplicación 7 A continuación se muestran las ponderaciones de las evaluaciones en los cursos de estadística y las calificaciones de un estudiante durante el semestre. Evaluación Nota ������������ Porcentaje ������������ Parcial 1 9 30 Parcial 2 7 30 Examen final 8 20 Tema especial 9 10 Otras evaluaciones 8.4 10 Determine la calificación promedio del estudiante. Página 67

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Solución Como ���̅��������� = ������1������1 + ������2������2 + ������3������3 + ⋯+ ������������������������ Entonces ������1 + ������2 + ������3 + ⋯ + ������������ ���̅��������� = (30)(9) + (30)(7) + (20)(8) + (10)(9) + (10)(8.4) 30 + 30 + 20 + 10 + 10 ���̅��������� = 814 100 ���̅��������� = 8.14 ������������������������������������ La calificación promedio del estudiante de los cinco ítems evaluados es de 8.14 puntos. 2.3.3 LA MEDIANA La mediana de un conjunto finito de valores, es aquel valor que divide al conjunto en dos partes iguales, de forma que el número de valores mayor o igual a la mediana es igual al número de valores menores o igual a estos. Su aplicación se ve limitada ya que solo considera el orden jerárquico de los datos y no alguna propiedad propia de los datos, como en el caso de la media. Mediana de datos no agrupados Los criterios necesarios para calcular la mediana, son los siguientes: a. Se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de las ordenaciones conducen al mismo resultado. Esto es: ������1, ������2, ������3, ⋯ , ������������. b. Si N es Impar, hay un término central, el término ���������2���+1 , que será el valor de la mediana. c. Si N es Par, hay dos términos centrales, ������������ y ���������2���+1 , la mediana será la 2 media de esos dos valores Página 68

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Características:  Para el cálculo de la mediana interesa que los valores estén ordenados de menor a mayor o viceversa.  La mediana no es afectada por valores extremos.  Puede ser calculada en distribuciones de frecuencia con clases abiertas. La notación más usual que se utiliza para representar a la mediana son ������������, ������������, ���̃��� Fórmula para población y muestra impar ������������ = ������������+1 2 ������������ = ������������+1 2 Donde ������������+1 y ������������+1, es la posición que ocupa el valor de la 22 mediana. Ejemplo de aplicación 8 El contenido de cinco botellas de gaseosas denominadas personal son seleccionadas de forma aleatoria de un lote de producción en ml, al medir sus contenidos se tiene: 235.4, 236.3, 234.9, 236.4, y 236.0. ¿Cuál es la mediana de las observaciones muestreadas? Solución Primero se ordena de mayor a menor, entonces: 234.9, 235.4, 236.0, 236.3, 236.4 Aplicando la regla para el cálculo de la mediana de datos no agrupados de un conjunto de elementos impar, se tiene: ������������ = ������������+1 2 ������ + 1 5 + 1 2 = 2 =3 Página 69

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. El tres es la posición de la serie de elementos ordenados y contados de izquierda a derecha, por lo que se tendría que: ������������ = 236.0 234.9, 235.4, 236.0, 236.3, 236.4 Fórmula para población y muestra par ������������ = ������������ + ���������2���+1 2 2 ������������ = ������������ + ���������2���+1 2 2 y ,���������2���+���������2���+1 Donde ���������2���+���������2���+1 es la posición que ocupa el valor de la 22 mediana. Ejemplo de aplicación 9 El contenido de seis botellas de gaseosas denominadas personal son seleccionadas de forma aleatoria de un lote de producción en ml, al medir sus contenidos se tiene: 235.4, 236.3, 234.9, 236.4, 237.2 y 236.0. ¿Cuál es la mediana de las observaciones muestreadas? Solución Primero se ordena de mayor a menor, entonces: 234.9, 235.4, 236.0, 236.3, 236.4, 237.2 Aplicando la regla para el cálculo de la mediana de datos no agrupados de un conjunto de elementos impar, se tiene: ������ + ������ + 1 = 6+6+1 7 = 3.5 2 =2 2 22 2 2 El tres punto cinco, es la posición de la serie de elementos ordenados y contados de izquierda a derecha, por lo que cuando la serie contiene un número de elementos par, se contará con dos elementos medios y se tendrá: 234.9, 235.4, 236.0, 236.3, 236.4, 237.2 Página 70

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 236.0 + 236.3 ������������ = 2 = 236.15 ������������ == 169.64 ������������������������í������������������������������������ Mediana de datos agrupados Cuando los datos se encuentran agrupados en una distribución de frecuencia, no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos: 1. Calcular el valor ������/2 o ������⁄2, según se trate. 2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que ������/2. 3. Aplicar la siguiente fórmula de la mediana para datos agrupados con respecto al intervalo mediano. Fórmula de la mediana para una población. ������������ = ������������−1 + (������) ������ − ������������−1 2 ������������ Fórmula de la mediana para una muestra. ������������ = ������������−1 + (������) ������ − ������������−1 2 ������������ Donde: ������������ = ������������������������������������������ ������������−1 = ������í������������������������ ������������������������������������������������ ������������ ������������ ������������������������������ ������������ ������������ ������������������������������������������ ������ = ������������ ������������������������������������������������ ������������������ ������������������������������������������������������ ������������ ������������������������������ ������������������������������������������ ������������−1 = ������������������������������������������������������������ ������������������������������������������������������ ������������������������������������������������ ������ ������������ ������������������������������ ������������������������������������������ ������������ = ������������������������������������������������������������ ������������ ������������ ������������������������������ ������������ ������������ ������������������������������������������ Características:  Existe una mediana para un conjunto de datos. Página 71

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.  Para el cálculo de la mediana interesa que los valores estén ordenados de menor a mayor o viceversa.  Al existir valores extremadamente grandes o muy pequeños la mediana no se ve afectada.  Se calculará la mediana para una distribución de frecuencias con una clase de extremo abierto. Cuando la mediana no se encuentra en esa clase. Ejemplo de aplicación 10 La edad de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, matriculados en el periodo abr – sep del 2015, arrojaron los resultados siguientes. EDAD (AÑOS MARCA DE CLASE NÚMERO CUMPLIDOS) ������′������−������ + ������������ 1,146 ���������′��� 18 + 28 573 2 = 23 291 [������������ – ������������) ᴬ 113 28 + 38 52 [������������ – ������������) 2 = 33 2,175 [������������ – ������������) 38 + 48 2 = 43 [������������ – ������������) 48 + 58 MÁS DE 57 2 = 53 TOTAL ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa que el 28 no está incluido, pero si incluye los valores cercanos al 28 por la izquierda. Se requiere calcular la mediana de edad en años de los estudiantes de la modalidad a distancia. Solución Se ha considerado a todos los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de toda la población. En consecuencia Página 72

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������ = ������������−1 + (������) ������ − ������������−1 2 ������������ Donde ������ 2,175 2 = 2 = 1,087.5 Completando la tabla para la aplicación de la fórmula, se tiene: EDAD (AÑOS MARCA DE CLASE FRECUENCIA FRECUENCIA CUMPLIDOS) ���������′���−������ + ������������ ������������ ACUMULADA ���������′��� 18 + 28 1,146 ������������ 2 = 23 573 1,146 [18 – 28) 291 [28 – 38) 28 + 38 113 1,719 [38 – 48) 2 = 33 52 [48 – 58) 2,010 38 + 48 2,175 MÁS DE 57 2 = 43 2,123 TOTAL 48 + 58 2,175 2 = 53 ������������−1 =18 ������ = 10 ������������−1 = 0 ������������ = 1,146 Reemplazando 2,175 − 0 ������������ = 18 + (10) 2 = 18 + 9.49 1,146 ������������ = 27.49 ������ñ������������ Ejemplo de aplicación 11 Si de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se toma como muestra a 50 matriculados de manera aleatoria en el periodo abr – sep. del 2015, para determinar la mediana de estatura en centímetros. Entonces, de acuerdo a las mediciones correspondientes se tiene. Página 73

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ���������′���−������ − ������′������ ������������ ������������ [150 – 156) 153 10 [156 – 162) 159 6 [162 – 168) 165 6 [168 – 174) 171 11 [174 – 180) 177 9 [180 – 186) 183 8 50 Σ Solución Se ha considerado a una parte de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de una muestra. En consecuencia ������������ = ������������−1 + (������) ������ − ������������−1 2 ������������ Donde ������ 50 2 = 2 = 25 ������������−1 =168 ������ = 6 ������������−1 = 22 ������������ = 11 Completando la tabla para la aplicación de la fórmula, se tiene: ������′������−������ − ���������′��� ������������ ������������ ������������ [150 – 156) 153 10 10 [156 – 162) 159 6 16 [162 – 168) 165 6 22 [168 – 174) 171 11 33 [174 – 180) 177 9 42 [180 – 186) 183 8 50 50 ∑= Página 74

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Reemplazando 50 − 22 ������������ = 168 + (6) 2 11 = 168 + 1.64 ������������ = 169.64 2.3.4 MODA La moda es el valor de la variable que tiene mayor frecuencia absoluta o la que más se repite. Características 1. Es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. 2. En su determinación no se incluyen todos los valores de la variable. 3. El valor de la moda puede ser afectado grandemente por el método de designación de los intervalos de clases. 4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas. 5. No es afectada por valores extremos. 6. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia, siendo esta máxima; en cuyo caso se tendrá una distribución bimodal o polimodal, según el caso. Moda de datos no agrupados La moda es una medida que se relaciona con la frecuencia con que se presenta el dato o los datos con mayor incidencia; por lo que se considera la posibilidad de que exista más de una moda para un conjunto de datos. La notación más frecuente es la siguiente: ������������ y ���̂���. Esta medida es aplicable tanto para datos cualitativos como cuantitativos. Página 75

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Forma de cálculo ������������ = ������������ ������á������������������������ ������������ máxima, quiere decir que es la de mayor frecuencia absoluta Tipos de moda 1. Unimodal. La moda es única. 2. Polimodal. Por su propia definición, la moda puede no ser única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia, siendo esta máxima; en cuyo caso se tendrá una distribución bimodal o polimodal según el caso (Universidad Michoacana de San Nicolás de Hidalgo, 2015). Ejemplo de aplicación 12 Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3. Solución Para mayor facilidad, si se ordena de manera ascendente se tiene: 1, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 7, 9. Se identifica el elemento que más se repite, por lo cual ������������ = 3 Por tanto, la moda del conjunto de datos es igual a 3 y si considera unimodal. Ejemplo de aplicación 13 Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 3, 4. Solución Para mayor facilidad, si se ordena de manera ascendente se tiene: 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 6, Se identifica los elementos que más se repite, por lo cual Página 76

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������ = 3, y ������������ = 4 Las modas de este conjunto de datos son 3 y 4, ya que ambas tienen la más alta frecuencia y se determina que es bimodal. Ejemplo de aplicación 14 Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4, 5, 6, 7, 8, 9 Solución La muestra no contiene dato o datos repetidos, por lo que se considera que la muestra es amodal. Moda de datos agrupados Para determinar la moda de datos agrupados se debe utilizar intervalos con igual amplitud. Fórmula La fórmula de cálculo para la moda de datos agrupados está dada por: ������������ = ������������−1 + (������) ∆������������ ∆������������ + ∆������������ Nomenclatura ������������ = ������������������������ ������������−1 = ������í������������������������ ������������������������������������������������ ������������ ������������ ������������������������������ ������������������������������ ������ = ������������ ������������������������������������������������ ������������������ ������������������������������������������������������ ������������ ������������������������������ ������������������������������ ∆������������ = ������������������������������������������ó������ ������������ ������������ ������������������������������������������������������������ ������������������������������ ������������������������������ ������������ ������������������������������ ������������������������������ ������������������������������������������������������ ������������������������������������������������ ∆������������ = ������������������������������������������ó������ ������������ ������������ ������������������������������������������������������������ ������������������������������ ������������������������������ ������������ ������������������������������ ������������������������������ ������������������������������������������������������ ������������������������������������������������ ∆������������ = ������������ − ������������−1 ∆������������ = ������������ − ������������+1 Página 77

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 15 La edad de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, matriculados en el periodo abr – sep del 2015, arrojaron los resultados siguientes. EDAD (AÑOS FRECUENCIA CUMPLIDOS) ������������ ���������′���−������ + ���������′��� 1,146 573 [������������ – ������������) ᴬ 291 [������������ – ������������) 113 [������������ – ������������) 52 [������������ – ������������) MÁS DE 57 2,175 TOTAL ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa que el 28 no está incluido, pero si incluye los valores cercanos al 28 por la izquierda. Se requiere calcular la moda de edad en años de los estudiantes de la modalidad a distancia. Solución Se ha considerado a todos los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de toda la población. En consecuencia ������������ = ������������−1 + (������) ∆������������ ∆������������ + ∆������������ Donde ∆������������ = ������������ − ������������−1 ������������−1 = 0 ������������ = 1,146 ∆������������ = 1,146 − 0 = 1,146 ∆������������ = ������������ − ������������+1 Página 78

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������+1 = 573 ������������ = 1,146 ∆������������ = 1,146 − 573 = 573 ������������−1 =18 ������ = 10 Reemplazando ������������ = 18 + (10) 573 573 = 18 + 10 1,146 − ������������ = 28 ������ñ������������ 2.3.5 MEDIA GEOMÉTRICA La media geométrica nos permite encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento, es utilizada ampliamente en los negocios y la economía, ya que frecuentemente permite determinar el cambio porcentual en ventas, sueldos, o cifras económicas, como el Producto Interno Bruto. La media geométrica al ser un conjunto de n números positivos se realiza como la raíz n-enésima del producto de n valores. Características 1. Se toman en cuenta todos los valores de la variable 2. Se utiliza cuando se quiere dar importancia a valores pequeños de la variable 3. Su valor no es muy influenciable por datos extremos grandes. 4. No puede ser calculada en distribuciones con clase abiertas. 5. Es usada para promediar razones, tasas de cabio, interés compuesto y números índices. Es recomendada para datos de progresión geométrica Fórmula de la media geométrica de datos no agrupados. Está dada por: Página 79

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������ ������ ������������ = ������ = ������������ = √∏ ������������ = ���√��� ������1 ∗ ������2 ∗ ������3 ∗ ⋯ ∗ ������������ ������=1 Nomenclatura ������������ = ������ = ������������ = ������������������������������ ������������������������é������������������������������ ������������ = ������������������ ������������������������������������������������������������������������������ ������ ������������������������������������������������������ ������������������������������������������ ������ ������������ ������������������������������������������ó������ ������������ ������. ������ = 1, 2, 3, ⋯ , ������ Usando logaritmos la fórmula queda como: log ������������ = ∑ ������������������ ������������ ������ ������������ = ������������������������������������������ ∑ ������������������������������ ������ Ejemplo de aplicación 16 Si los precios por acción de uno de los supermercados de la cuidad en los últimos cuatro meses fueron; 4.75, 5.23, 4.78 y 6.32 dólares por unidad. Calcular el factor de crecimiento promedio y el crecimiento porcentual promedio. Solución Se considera el factor de crecimiento mes a mes, esto es ������������+1, ������������ por lo que el primer factor se tendría 5.23, el segundo sería 4.78, y así 4.75 5.23 sucesivamente. Para el cálculo de la media geométrica se tienen dos formas de solución, de acuerdo a las fórmulas dadas. Primer método. Aplicando la fórmula radical, se tiene: ������������ = 3√5.23 × 4.78 × 6.32 = 3√1.33053 = 1.0999 4.75 5.23 4.78 El 1.0999 es factor de crecimiento promedio y para obtener el crecimiento se aplica la siguiente formula: Página 80

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������������������������������������������������������������ ������������������������������������������������������������ ������������������������������������������������ = (������������ − 1) × 100 = (1.0999 − 1) × 100 ������������������������������������������������������������������ ������������������������������������������������������������ ������������������������������������������������ = 9.99% Segundo método. Aplicando la fórmula logarítmica se tiene: ������������ ������������������������������ 5.23 0.041808 4.75 = 1.101053 4.78 -0.039074 5.23 = 0.913958 6.32 0.121289 4.78 = 1.322176 0.124023 ������������ = ������������������������������������������ ∑ ������������������������������ ������ 0.124023 ������������ = ������������������������������������������ 3 ������������ = ������������������������������������������0.041341 ������������ = 1.0999 El 1.0999 es factor de crecimiento promedio y el crecimiento porcentual promedio es: ������������������������������������������������������������������ ������������������������������������������������������������ ������������������������������������������������ = (������������ − 1) × 100 = (1.0999 − 1) × 100 ������������������������������������������������������������������ ������������������������������������������������������������ ������������������������������������������������ = 9.99% Fórmula de la media geométrica de datos agrupados. Está dada por: log ������������ = ∑ ������������ ������������������ ������������ ������ ������������ = ������������������������������������������ ∑ ������������ ������������������������������ ������ Página 81

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 17 Si de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se toma como muestra a 10 matriculados de manera aleatoria en el periodo abr – sep del 2015, para determinar la media geométrica de estatura en centímetros. Entonces, de acuerdo a las mediciones correspondientes se tiene. ESTATURA (EN MARCA DE FRECUENCIA CENTÍMETROS) CLASE ������������ ������������ ���������′���−������ + ���������′��� 155 5 165 3 [������������������ – ������������������) 175 2 [������������������ – ������������������) 10 [������������������ – ������������������) TOTAL Solución Se ha considerado a una parte de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de una muestra. En consecuencia ������������ = ������������������������������������������ ∑ ������������ ������������������������������ ������ Adecuando la tabla de datos a para la aplicación de la fórmula de ������������, se tiene: ESTATURA (EN MARCA DE FRECUENCIA ������������������ ������������ ������������������������������������������ CENTÍMETROS) CLASE ������������ ������������ 2.19033 10.95165 ���������′���−������ + ���������′��� 155 5 2.21748 6.65244 165 3 2.24303 4.48606 [������������������ – ������������������) 175 2 [������������������ – ������������������) 22.09015 [������������������ – ������������������) 10 TOTAL 22.09015 ������������ = ������������������������������������������ 10 Página 82

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������ = ������������������������������������������ 2.209015 ������������ = 161.81 ������������������������í������������������������������������ 2.3.6 MEDIA ARMÓNICA La Media Armónica, se representa como ������������ y ������−1. Dada una serie de datos ������1, ������2, ������3, ⋯ , ������������, el inverso de la media armónica de la variable ������ es igual a la media aritmética del inverso de los valores de la variable (Martínez, 2012). Características  Es de gran utilidad cuando la variable está dada en forma de tasa.  La media armónica se basa en todas las observaciones por lo que está afectada por todos los valores de la variable.  Un valor de la variable de cero, invalida su cálculo.  La media armónica está rígidamente definida y su resultado no puede ser usado en cálculos posteriores. Fórmula de datos no agrupados 11 ������������������������������������ → ������ ������−1 = ������ (������������) ������−1 = ∑ 1 ������������ Fórmula de datos agrupados ������ ������������ = ������−1 = ∑ ������������ ������������ Se adapta para tasas medias de velocidad, tiempo, rendimiento, precio, etc. Nomenclatura ������������ = ������−1 = ������������������������������ ������������������ó������������������������ ������ = ������ú������������������������ ������������ ������������������������������������������������������ ������������ ������������ ������������������������������������������������ Ejemplo de aplicación 18 Suponga que se tiene seis observaciones con los siguientes valores: 2, 8, 6, 3, 5, 4 y se quiere calcular la media armónica. Página 83

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Solución Al aplicar la fórmula de datos no agrupados, se tiene ������ ������������ = ������−1 = ∑ 1 ������������ 66 ������������ = ������−1 = 1 + 1 + 1 + 1 + 1 + 1 = 63 2 8 6 3 5 4 40 240 ������������ = ������−1 = 63 ������������ = ������−1 = 3.81 ������������������������������������������������ Ejemplo de aplicación 19 Con los datos de la siguiente tabla de frecuencias, de una distribución continua, calcular la media armónica. ���������′���−������ + ������′������ ������������ ������������ ������������ ������������ 2.1 – 6 4 6.1 - 10 8 1 0.25 10.1 - 14 12 14.1 - 18 16 3 0.38 Σ 4 0.33 2 0.13 10 1.08 Solución Al aplicar la fórmula de datos no agrupados, se tiene ������ ������������ = ������−1 = ∑ ������������ ������������ 10 ������������ = ������−1 = 1.08 ������������ = ������−1 = 9.26 ������������������������������������������������ Página 84

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 2.4 FORMA DE LA DISTRIBUCIÓN 2.4.1 RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente: Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden (Cabrera, 2015) Ejemplo de aplicación 20 Una granja ganadera registro durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente: 22 31 33 34 35 36 37 38 38 39 40 40 40 41 41 42 42 42 42 42 43 43 44 45 46 46 46 46 50 Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvo la siguiente tabla resultante. Página 85

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Clases Frecuencia ������′������−������ + ������′������ ������������ 21.5 – 26.5 1 26.5 – 31.5 1 31.5 – 36.5 4 36.5 – 41.5 9 41.5 – 46.5 13 46.5 – 51.5 1 Total 29 Calcule en las dos variantes (datos no agrupados y datos agrupados) la media aritmética, la mediana y la moda. Solución Datos no agrupados: Los nacimientos registrados en el mes de febrero es de 29 terneros, razón por la que se trata de un valor poblacional 22 31 33 34 35 36 37 38 38 39 40 40 40 41 41 42 42 42 42 42 43 43 44 45 46 46 46 46 50 Media aritmética. La fórmula de cálculo es μ = ∑ ������������ N Reemplazando los datos, se tiene 22 + 31 + 33 + ⋯ + 46 + 50 μ = 29 1,164 μ = 29 = 40.14 ������������������������������������������������������������ Mediana La fórmula de cálculo es ������������ = ������������+1 2 Página 86

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������+1 = ������29+1 = ������30 = ������15 2 22 Sustituyendo ������15, se tiene ������������ = ������15 = 41 ������������������������������������������������������������ Moda La fórmula de cálculo es ������������ = ������������ ������á������������������������ La frecuencia mayor se encuentra en el número 42, donde ������������ = 5. Por tanto, se tiene que ������������ = 42 ������������������������������������������������������������ Al comparar ������, ������������ ������ ������������, se tiene: μ = 40.14 ������������������������������������������������������������ ������������ = 41 ������������������������������������������������������������ ������������ = 42 ������������������������������������������������������������ Como ������ < ������������ < ������������ Entonces, la distribución es asimétrica hacia la izquierda. Página 87

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Datos agrupados: Para el cálculo de la media, mediana y moda, es necesario adecuar la tabla proporcionada, por la siguiente. Clases Marca de Frecuencia ������������������������ Frecuencia ������′������−������ + ������′������ acumulada clase ������������ ������������ 24 29 ������������ 21.5 – 26.5 24 1 136 1 26.5 – 31.5 29 1 351 2 31.5 – 36.5 34 4 572 6 36.5 – 41.5 39 9 49 15 41.5 – 46.5 44 13 1,161 28 46.5 – 51.5 49 1 29 Σ 29 Media aritmética. La fórmula de cálculo es ������ = ∑ ������������������������ = ∑ ������������ ∑ ������ ������ Reemplazando los datos, se tiene 1,161 ������ = 29 ������ = 40.03 ������������������������������������������������������������ Mediana La fórmula de cálculo es ������������ = ������������−1 + (������) ������ − ������������−1 2 ������������ Para la aplicación de la fórmula, es necesario identificar el renglón de la clase mediana, para lo cual el número de elementos se divide para dos. ������ 29 2 = 2 = 14.5 Página 88

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Como 14.5 es la mitad del total, buscamos en la columna de ������������ el valor más cercano mayor a 14.5, obteniéndose el renglón 36.5 – 41.5 39 9 351 15 En base a este renglón y sus relacionados en la tabla, se procede a su reemplazo. 29 − 6 ������������ = 36.5 + (5) 2 9 ������������ = 36.5 + (5)(0.94444) = 36.5 + 4.7222 ������������ = 41.22 ������������������������������������������������������������ Moda La fórmula de cálculo es ������������ = ������������−1 + (������) ∆������������ ∆������������ + ∆������������ Para la aplicación de la fórmula, es necesario identificar el renglón de la clase modal, la cual está dada por el intervalo de clase con mayor frecuencia, esto es 41.5 – 46.5 44 13 572 28 En base a este renglón y sus relacionados en la tabla, se procede a su reemplazo. Entonces ∆������������ = ������������ − ������������−1 = 13 − 9 = 4 ∆������������ = ������������ − ������������+1 = 13 − 1 = 12 Reemplazando en la fórmula, se tiene ������������ = 41.5 + (5) 4 4 + 12 ������������ = 41.5 + (5)(0.25) = 41.5 + 1.25 Página 89

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������ = 42.75 ������������������������������������������������������������ Al comparar ������, ������������ ������ ������������, se tiene: μ = 40.03 ������������������������������������������������������������ ������������ = 41.22 ������������������������������������������������������������ ������������ = 42.75 ������������������������������������������������������������ Como ������ < ������������ < ������������ La gráfica de la distribución, sería aproximadamente así. 2.5 CUARTILES, DECILES Y PERCENTILES Está claro que para localizar cuál es el valor que se encuentra al centro de un grupo de datos utilizamos la mediana y que ésta es el valor que divide al grupo de datos en mitades. Pues bien, para ciertos fines puede ser de mucha utilidad saber qué valor se encuentra al primer cuarto del grupo de datos, o al tercer cuarto del grupo de datos. De esta forma:  Los cuartiles dividen a la distribución en cuartos  Los deciles en décimos, y  Los percentiles en 100 partes Los cuales se obtienen con fórmulas que modifican la de la mediana como en los siguientes ejemplos: Página 90

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 2.5.1 Medidas de posición relativa Estas medidas son también llamadas cuantilas, cuantiles o fractiles y cuyo objetivo es describir el comportamiento de una variable dividiendo la serie de valores en diferente número de partes porcentualmente iguales, las más usadas son: los cuartiles (cuartas partes), los deciles (decimas partes) y los centiles o percentiles (centésimas partes). Los Cuartiles Son aquellos números que dividen a éstas en cuatro partes porcentualmente iguales. Hay tres cuartiles ������1, ������2 ������ ������3 . El primer cuartil ������1 , es el valor en el cual o por debajo del cual queda aproximadamente un cuarto (25%) de todos los valores de la sucesión (ordenada); El segundo cuartil ������2 es el valor por debajo del cual queda el 50% de los datos (Mediana), el tercer cuartil ������3 es el valor por debajo del cual quedan las tres cuartas partes (75%) de los datos. Los Deciles Son ciertos números que dividen el conjunto de observaciones (ordenadas) en diez parte porcentualmente iguales. Los deciles se denotan por ������1, ������2, ⋯ , ������9 . El decil 5 corresponde al cuartil 2 (mediana). Los Percentiles Son ciertos números que dividen el conjunto de datos ordenados en cien partes porcentualmente iguales. El percentil 50 equivale a la mediana. Considerando la definición de la mediana, esta será el segundo cuartil, el quinto decil o el 50avo percentil o centil. En cualquiera de estas medidas el valor matemático que se obtenga será representativo del número de datos o menos que corresponde al valor relativo planteado. (Ejemplo: el primer cuartil es un valor representativo del 25% o menos de los valores de una distribución, es decir, los valores inferiores de la distribución). Cuantiles para datos no agrupados Para ubicar los cuartiles, deciles y percentiles, se aplica la siguiente fórmula, siendo este valor la posición donde se ubican. Página 91

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ubicación de un centil: ������ ������������ = (������ + 1) 100 donde: ������������, ������������ ������������ ������������������������������������������������������������������������ó������ ������������������ ������������������������������������������, ������������������������������ ������ ������������������������������������. ������, ������������ ������������ ������ú������������������������ ������������������������������ ������������ ������������������������������������������������������������������������������. ������, ������������ ������������ ������������������������������������ó������ ������������������ ������������������������������������������, ������������������������������ ������ ������������������������������������. Para calcular los cuartiles, deciles y centiles primero se debe ordenar los datos. Ejemplo de aplicación 21 Con la información que siguiente: 18 23 38 41 43 45 50 51 52 53 54 54 58 58 58 59 60 62 63 63 66 71 77 83 84 95 Se pide: a. Calcular el primer y tercer cuartil. b. Calcular el sexto decil. c. Calcular el ochenta percentil. Solución a. Calcular el primer y tercer cuartil. Primer cuartil. Donde ������1 = ������25 ������ ������������ = (������ + 1) 100 Reemplazando los datos del problema en la fórmula general, se tiene 25 ������������ = (26 + 1) 100 Página 92

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. ������������ = 6.75 ������������������������������������ó������ El valor observado indica la posición del primer cuartil. En el conjunto de datos la posición del primer cuartil, ocupa la posición 6 y 7, siendo 45 y 50 y se calcula de la siguiente manera: 6 45 7 50 Restamos el valor mayor del menor, es decir, 50 − 45 = 5 Se resta la posición del primer cuartil y el inmediato anterior entero. 6.75 − 6 = 0.75 Se procede a multiplicar 5 ∗ 0.75 = 3.75 El resultado obtenido de la multiplicación más el valor menor, es el primer cuartil; es decir, 45 + 3.75 = 48.75 A los cuartiles se les abrevia con la letra ������, entonces el ������1, es: ������1 = 48.75 Tercer cuartil. Donde ������3 = ������75 ������ ������������ = (������ + 1) 100 Reemplazando los datos del problema en la fórmula general, se tiene 75 ������������ = (26 + 1) 100 ������������ = 20.25 ������������������������������������ó������ El valor observado indica la posición del tercer cuartil. Página 93

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. En el conjunto de datos la posición del tercer cuartil, ocupa la posición 20 y 21 siendo 63 y 66 y se calcula de la siguiente manera: 20 63 21 66 Restamos el valor mayor del menor, es decir, 66 − 63 = 3 Se resta la posición del tercer cuartil y el inmediato anterior entero. 20,25 – 20 = 0,25 Se procede a multiplicar 3 ∗ 0.25 = 0,75 El resultado obtenido de la multiplicación más el valor menor es el tercer cuartil, es decir, 63 + 0.75 = 63.75 Por tanto, ������3 = 63.75 b. Calcular el sexto decil. ������ ������������ = (������ + 1) 100 El sexto decil es igual a 60 percentil, por tanto: 60 ������������ = (26 + 1) 100 ������������ = 16.2 ������������������������������������ó������ Realizando la interpolación correspondiente, se tiene: 16 59 17 60 Página 94

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Restamos el valor mayor del menor, es decir: 60 − 59 = 1 Se resta la posición del sexto decil y el inmediato anterior entero. 16.2 – 16 = 0.2 Se procede a multiplicar 1 ∗ 0.2 = 0.2 El resultado obtenido de la multiplicación más el valor menor, es el sexto decil, es decir: 59 + 0.2 = 59.20 Por tanto ������6 = 59.20 c. Calcular el ochenta percentil. ������ ������������ = (������ + 1) 100 Reemplazando percentil 80, en P, entonces: ������������ = (26 + 1) 80 100 ������������ = 21.16 ������������������������������������ó������ Realizando la interpolación correspondiente, se tiene: 21 66 22 71 Restamos el valor mayor del menor, es decir: 71 − 66 = 5 Se resta la posición del percentil 80 y el inmediato anterior entero. Página 95

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 21.16 – 21 = 0.16 Se procede a multiplicar los resultados obtenidos 5 ∗ 0.16 = 0.8 El resultado obtenido de la multiplicación más el valor menor, es el percentil 80, es decir: 66 + 0.8 = 66.80 Por tanto ������80 = 59.20 Cuantiles para datos agrupados Para calcular los cuartiles ������������, deciles ������������ y percentiles ������������, se aplica las fórmulas que siguen. ������������ = ������������−1 + ������������ − ������������−1 ∗ ������������ 4 ������������ donde ������ = 1,2,3 ������������ = ������������−1 + ������������ − ������������−1 ∗ ������������ 10 ������������ donde ������ = 1,2,3, … , 9 ������������ = ������������−1 + ������������ − ������������−1 ∗ ������������ 100 ������������ donde ������ = 1,2,3, … , 99 Nomenclatura ������������−1 = ������í������������������������ ������������������������������������������������ ������������ ������������ ������������������������������ ������������������������������������������ ������ ������������������������������ ������ ������������������������������������������������������ ������ = ������������ ������������������������������������������������ ������������������ ������������������������������������������������������ ������������ ������������������������������ ������������������������������������������ ������ ������������������������������ ������ ������������������������������������������������������ ������������−1 = ������������������������������������������������������������ ������������������������������������������������������ ������������������������������������������������ ������ ������������ ������������������������������ ������������������������������������������ ������ ������������������������������ ������ ������������������������������������������������������ ������������ = ������������������������������������������������������������ ������������ ������������ ������������������������������ ������������������������������������������ ������ ������������������������������ ������ ������������������������������������������������������ Página 96

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. Ejemplo de aplicación 22 Para la tabla de salarios de la compañía P&R, encontrar: a. Los cuartiles ������1, ������2 ������ ������3. b. Decil ������6. c. Percentil ������80. Salarios Frecuencia Frecuencia ������������ acumulada 250.00 - 259.99 260.00 - 269.99 8 ������������ 270.00 - 279.99 10 8 280.00 - 289.99 16 290.00 - 299.99 14 18 300.00 - 309.99 10 310.00 - 319.99 5 34 2 Σ 65 48 58 63 65 Solución a. Los cuartiles ������1, ������2 ������ ������3. ������������ = ������������ + ������������ − ������������−1 ∗ ������������ 4 ������������ Para la aplicación de ������1, tenga en cuenta que ������ = 1, por consiguiente 1∗65 − 8 ������1 = 260 + 4 (10) 10 16.25 − 8 ������1 = 260 + 10 (10) ������1 = 268.25 Para la aplicación de ������2, tenga en cuenta que ������ = 2, por Página 97

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. consiguiente 2∗65 − 18 ������2 = 270 + 4 (10) 16 32.5 − 18 ������2 = 270 + 16 (10) ������2 = 279.06 Para la aplicación de ������3, tenga en cuenta que ������ = 3, por consiguiente 3∗65 − 48 ������3 = 290 + 4 (10) 10 48.75 − 48 ������3 = 289.995 + 10 (10) ������3 = 290.75 b. Decil ������6. ������������ = ������������−1 + ������������ − ������������−1 ∗ ������������ 10 ������������ Para la aplicación de ������6, tenga en cuenta que ������ = 6, por consiguiente 6∗65 − 34 ������6 = 280 + 10 ∗ 10 14 ������6 = 280 + 3.57 ������6 = 283.57 c. Percentil ������80. ������������ = ������������−1 + ������������ − ������������−1 ∗ ������������ 100 ������������ Para la aplicación de ������80, tenga en cuenta que ������ = 80, por consiguiente Página 98

ESTADÍSTICA BÁSICA I Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V. 52 − 48 ������80 = 290 + 10 ∗ 10 ������80 = 290 + 4 ������80 = 294 2.6 ESTADÍGRAFOS DE DISPERCIÓN Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar una imagen mental de la distribución de frecuencias. Una vez localizado el centro de la distribución de un conjunto de datos, lo que procede es buscar una medida de dispersión de los datos (García Pérez, 2015). La dispersión o variación es una característica importante de un conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos. Se puede diferenciar dos tipos de dispersión, las absolutas y relativas. 2.6.1 DISPERCIÓN ABSOLUTA Se toma como punto central de referencia la media aritmética, aunque puede considerarse además a la mediana. Entre las medidas de dispersión absoluta se tiene al rango, desviación media, varianza y desviación estándar. Rango Se obtiene sacando la diferencia entre el valor mayor y el valor meno de un conjunto de datos. Características  El rango es la medida de dispersión más sencilla de calcular e interpretar.  Se basa en los valores extremos por lo que puede ser errática  El recorrido solo se encuentra influenciado por los valores extremos y no considera el resto de valores de la variable.  Existe el peligro que el recorrido ofrezca una descripción distorsionada de la dispersión cuando existe valores muy pequeños o muy grandes. Página 99


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook