1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA ❍ 27 TABLA 1.12 ● Tabla de frecuencia para el ejemplo 1.11 Número de visitas Frecuencia a Starbucks Frecuencia relativa 1 1 .04 2 —— 3 2 .08 4 3 .12 5 8 .32 6 7 .28 7 3 .12 8 1 .04 FIGURA 1.16 ● Histograma del MINITAB para el ejemplo 1.11 Frecuencia relativa 8/25 6/25 4/25 2/25 0 12345678 Visitas Observe que la distribución está sesgada a la izquierda y que hay una brecha entre 1 y 3. MI ENTRENADOR PERSONAL ¿Cómo construyo un histograma de frecuencia relativa? 1. Escoja el número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan, más clases deben usarse. 2. Calcule el ancho aproximado de clase al dividir la diferencia entre los valores máximo y mínimo entre el número de clases. 3. Redondee el ancho aproximado de clase hasta un número cómodo. 4. Si los datos son discretos, se puede asignar una clase para cada valor entero tomado por los datos. Para un número grande de valores enteros, puede que sea necesario agruparlos en clases. 5. Localice las fronteras de clase. La clase más baja puede incluir la medición más pequeña. A continuación sume las clases restantes usando el método de inclusión izquierda. 6. Construya una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias relativas. 7. Construya un histograma como una barra de gráficas, graficando intervalos de clase en el eje horizontal y frecuencias relativas como las alturas de las barras. (continúa) www.FreeLibros.me
28 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS Repertorio de ejercicios A. Para los siguientes conjuntos de datos, encuentre el rango, el ancho mínimo de clase y un ancho práctico de clase. El primer conjunto de datos está hecho para usted. Número de Valores máximo Número de Rango Ancho mínimo Ancho práctico mediciones y mínimo clases 90 de clase de clase 50 10 a 100 7 12.86 15 25 0.1 a 6.0 6 100 500 a 700 8 B. Para los mismos conjuntos de datos, seleccione un punto inicial conveniente y haga una lista de fronteras de clase para las primeras dos clases. El primer conjunto de datos está hecho para usted. Número de Valores máximo Punto inicial Primeras dos mediciones y mínimo conveniente clases 50 10 a 100 0 0 a Ͻ 15 15 a Ͻ 30 25 0.1 a 6.0 100 500 a 700 Informe de progreso • ¿Todavía tiene problemas? Pruebe de nuevo usando las Repeticiones de un ejercicio del final de esta sección. • ¿Ya domina los histogramas de frecuencia relativa? Puede saltarse el reperto- rio de ejercicios y pasar directo a los ejercicios de Técnicas básicas del final de esta sección. Las respuestas se encuentran al final de este libro. Se puede usar un histograma de frecuencia relativa para describir la distribución de un conjunto de datos en términos de su ubicación y forma, y ver si hay resultados atípi- cos como lo hizo usted con otras gráficas. Por ejemplo, los datos de peso al nacimiento fueron relativamente simétricos, sin mediciones poco comunes, en tanto que los datos de Starbucks estuvieron sesgados a la izquierda. Como la barra construida arriba de cada clase representa la frecuencia relativa o proporción de las mediciones en esa clase, estas alturas se pueden usar para darnos información adicional: • La proporción de las medidas que caen en una clase o grupo particular de clases • La probabilidad de que una medida tomada al azar del conjunto caerá en una clase particular o grupo de clases Considere el histograma de frecuencia relativa para los datos del peso al nacimiento de la figura 1.15. ¿Qué proporción de los recién nacidos tienen al nacer pesos de 7.6 o mayores? Esto abarca todas las clases de más de 7.6 en la tabla 1.10. Como hay 17 recién www.FreeLibros.me
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA ❍ 29 nacidos en esas clases, la proporción de quienes tienen pesos al nacer de 7.6 o más es 17/30, o sea alrededor de 57%. Éste también es el porcentaje del área total bajo el histo- grama de la figura 1.15 que está a la derecha de 7.6. Supongamos que usted escribió cada uno de los 30 pesos al nacer en un papel, los puso en un sombrero y sacó uno de ellos al azar. ¿Cuál es la probabilidad de que este papel contenga un peso de 7.6 al nacimiento o más alto? Como 17 de los 30 peque- ños papeles caen en esta categoría, hay 17 probabilidades en 30; esto es, la probabilidad es 17/30. La palabra probabilidad no es desconocida para el lector; la estudiaremos en más detalle en el capítulo 4. Aun cuando estamos interesados en describir un conjunto de n ϭ 30 mediciones, también podríamos estar interesados en la población de donde se sacó la muestra, que es el conjunto de pesos al nacer de todos los bebés nacidos en este hospital. O bien, si esta- mos interesados en los pesos de recién nacidos en general, podríamos considerar nuestra muestra como representativa de la población de pesos al nacer para recién nacidos en hospitales metropolitanos similares. Un histograma de muestra da valiosa información acerca del histograma de población, es decir, la gráfica que describe la distribución de toda la población. Recuerde, sin embargo, que diferentes muestras de la misma pobla- ción producirán histogramas diferentes, aun cuando se usen fronteras de la misma clase. No obstante, puede esperarse que los histogramas de la muestra y población sean simila- res. Al agregar más y más datos a la muestra, los dos histogramas se hacen cada vez más semejantes. ¡Si se agranda la muestra para incluir toda la población, ambos histogra- mas son idénticos! 1.5 EJERCICIOS REPERTORIO DE EJERCICIOS Estos ejercicios se refieren a la sección Mi entrenador personal de la página 27. 1.16 Para los siguientes conjuntos de datos, encuentre el rango, el ancho mínimo de clase y ancho práctico de clase. Número de Valores mínimo Número Rango Ancho mínimo Ancho práctico mediciones y máximo de clases de clase de clase 0.5 a 1.0 75 0 a 1006 8 25 1200 a 1500 6 200 9 1.17 Consulte el ejercicio 1.16. Para los mismos conjuntos de datos, seleccione un punto inicial conveniente y haga una lista de fronteras de clase para las primeras dos clases. Número de Valores mínimo Punto inicial Primeras mediciones y máximo conveniente dos clases 75 0.5 a 1.0 25 0 a 100 200 1200 a 1500 www.FreeLibros.me
30 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS TÉCNICAS BÁSICAS b. ¿Qué proporción de las mediciones es mayor a 1? MIS DATOS 1.18 Construya una gráfica de tallo y hoja para c. ¿Qué proporción de las mediciones es menor a 2? EX0118 estas 50 mediciones: d. Si una medición se selecciona al azar de entre las 20 3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9 mediciones mostradas, ¿cuál es la probabilidad de que 2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2 sea un 2? 3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4 2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9 d. Describa la forma de la distribución. ¿Ve algunos 4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9 resultados atípicos? a. Describa la forma de la distribución de datos. 1.22 Consulte el ejercicio 1.21. ¿Ve algunos resultados atípicos? a. Trace una gráfica de puntos para describir los datos. b. Use la gráfica de tallo y hoja para hallar la observación mínima. b. ¿Cómo podría usted definir el tallo y la hoja para este conjunto de datos? c. Encuentre la octava y novena observaciones más grandes. c. Trace la gráfica de tallo y hoja usando su decisión del inciso b). 1.19 Consulte el ejercicio 1.18. Construya un histograma de frecuencia relativa para los datos. d. Compare la gráfica de puntos, la gráfica de tallo y hoja y el histograma de frecuencia relativa (ejercicio a. ¿Aproximadamente cuántos intervalos de clase debe 1.21). ¿Llevan todos ellos más o menos la misma usar? información? b. Supongamos que usted decide usar clases que 1.23 Navegar en un laberinto Un psicólogo empiezan en 1.6 con ancho de clase de .5 (es decir, experimental midió el tiempo que tardó una rata para 1.6 a <2.1, 2.1 a <2.6). Construya el histograma de navegar con éxito por un laberinto en cada uno de cinco frecuencia relativa para los datos. días. Los resultados se muestran en la tabla siguiente. Genere una gráfica de líneas para describir los datos. c. ¿Qué fracción de las mediciones es menor a 5.1? ¿Piensa usted que hay algún aprendizaje? d. ¿Qué fracción de las mediciones es mayor a 3.6? e. Compare el histograma de frecuencia relativa con Día 1234 5 Tiempo (seg.) 45 43 46 32 25 la gráfica de tallo y hoja del ejercicio 1.18. ¿Son semejantes las formas? MIS DATOS 1.24 Medición en el tiempo El valor de EX0124 una variable cuantitativa se mide una vez al año MIS DATOS 1.20 Considere este conjunto de datos: durante un periodo de 10 años. He aquí los datos: EX0120 Año Medición Año Medición 4.5 3.2 3.5 3.9 3.5 3.9 4.3 4.8 3.6 3.3 4.3 4.2 1 61.5 6 58.2 3.9 3.7 4.3 4.4 3.4 4.2 2 62.3 7 57.5 4.4 4.0 3.6 3.5 3.9 4.0 3 60.7 8 57.5 4 59.8 9 56.1 a. Construya una gráfica de tallo y hoja usando el dígito 5 58.0 10 56.0 inicial como tallo. a. Genere una gráfica de líneas para describir la variable b. Construya una gráfica de tallo y hoja usando dos veces cuando cambie con el tiempo. cada uno de los dígitos iniciales. ¿Esta técnica mejora la presentación de los datos? Explique. b. Describa las mediciones usando la gráfica construida en el inciso a). 1.21 Una variable discreta puede tomar sólo los valores de 0, 1 o 2. Un conjunto de 20 mediciones en esta MIS DATOS 1.25 Calificaciones de examen Las variable se muestra: EX0125 calificaciones en un examen de 100 puntos se 12102 registraron para 20 estudiantes: 21100 22110 61 93 91 86 55 63 86 82 76 57 01211 94 89 67 62 72 87 68 65 75 84 a. Construya un histograma de frecuencia relativa para a. Use una gráfica apropiada para describir los datos. los datos. b. Describa la forma y ubicación de las calificaciones. www.FreeLibros.me
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA ❍ 31 c. ¿Es poco común la forma de la distribución? ¿Puede a. Construya una gráfica de tallo y hoja para los datos. usted considerar alguna razón por la que la distribución de las calificaciones tendría esa forma? b. Construya un histograma de frecuencia relativa para estos datos. Empiece en la frontera inferior de la APLICACIONES primera clase en 30 y use un ancho de clase de 5 meses. MIS DATOS 1.26 Una enfermedad recurrente c. Compare las gráficas de los incisos a) y b). ¿Hay EX0126 El tiempo (en meses) entre el inicio de una alguna diferencia importante que le haría escoger una como el mejor método para exhibir los datos? enfermedad en particular y su recurrencia se registró para n ϭ 50 pacientes: d. ¿Qué proporción de los niños tenían 35 meses (2 años, 11 meses) o más, pero menos de 45 meses 2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6 (3 años, 9 meses) de edad cuando se inscribieron 14.7 9.6 16.7 7.4 8.2 19.2 6.9 4.3 3.3 1.2 por primera vez en preescolar? 4.1 18.4 .2 6.1 13.5 7.4 .2 8.3 .3 1.3 14.1 1.0 2.4 2.4 18.0 8.7 24.0 1.4 8.2 5.8 e. Si un niño fuera seleccionado al azar de este grupo de 1.6 3.5 11.4 18.0 26.7 3.7 12.6 23.1 5.6 .4 niños, ¿cuál es la probabilidad de que tuviera menos de 50 meses de edad (4 años, 2 meses) cuando se a. Construya un histograma de frecuencia relativa para inscribió por primera vez en preescolar? los datos. MIS DATOS 1.29 Religión organizada Las b. ¿Describiría usted la forma como aproximadamente simétrica, sesgada a la derecha o sesgada a la EX0129 estadísticas de las religiones del mundo son izquierda? aproximaciones muy vagas, dado que muchas religiones c. Dé la fracción de tiempos de recurrencia menores o no dan seguimiento a sus miembros. Una estimación iguales a 10 meses. de estos números (en millones) se muestra en la tabla siguiente.8 1.27 La educación funciona La educación Religión Miembros Religión Miembros funciona, según una instantánea dada en un informe a la (millones) (millones) ciudad de Riverside por la Dirección de Educación7 del mismo condado. El promedio de ingresos anuales para Budismo 375 Judaísmo 15 seis niveles diferentes de educación se muestra en la Cristianismo 2100 Sijismo 25 tabla: Hinduismo 851 Otras 21 Islamismo 1300 Fuente: Time Almanac 2007 Nivel de educación Promedio de ingreso anual a. Construya una gráfica de pastel para describir el total de miembros en las religiones organizadas del mundo. Secundaria terminada $26 795 Universidad, sin título 29 095 b. Construya una gráfica de barras para describir el total Título de licenciatura 50 623 de miembros en las religiones organizadas del mundo. Título de maestría 63 592 Doctorado 85 675 c. Ordene los grupos religiosos del número menor al Profesional (médico, abogado) 101 375 mayor de miembros. Construya una gráfica de Pareto para describir los datos. ¿Cuál de las tres es más Fuente: U.S. Census Bureau efectiva? a. ¿Qué métodos gráficos podría usted usar para describir MIS DATOS 1.30 ¿Qué tan larga es la fila? Para los datos? EX0130 determinar el número de cajas de pago que b. Seleccione el método del inciso a) que usted piensa en el futuro es necesario construir, una cadena de describe mejor los datos. supermercados desea obtener información del tiempo (en c. ¿Cómo podría resumir la información mostrada en la gráfica respecto a niveles educativos y salario? minutos) necesario para dar servicio a clientes. MIS DATOS 1.28 Preescolar A continuación se dan las Para hallar la distribución de tiempos de tal servicio, EX0128 edades (en meses) a los que se inscribieron por se registró una muestra de 1000 tiempos. Sesenta de primera vez 50 niños en una escuela preescolar. éstos se muestran a continuación: 38 40 30 35 39 40 48 36 31 36 3.6 1.9 2.1 .3 .8 .2 1.0 1.4 1.8 1.6 47 35 34 43 41 36 41 43 48 40 1.1 1.8 .3 1.1 .5 1.2 .6 1.1 .8 1.7 32 34 41 30 46 35 40 30 46 37 1.4 .2 1.3 3.1 .4 2.3 1.8 4.5 .9 .7 55 39 33 32 32 45 42 41 36 50 .6 2.8 2.5 1.1 .4 1.2 .4 1.3 .8 1.3 42 50 37 39 33 45 38 46 36 31 1.1 1.2 .8 1.0 .9 .7 3.1 1.7 1.1 2.2 1.6 1.9 5.2 .5 1.8 .3 1.1 .6 .7 .6 www.FreeLibros.me
32 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS a. Construya una gráfica de tallo y hoja para los datos. a. Antes de graficar los datos, trate de visualizar la b. ¿Qué fracción de los tiempos de servicio son menores distribución de las edades al fallecimiento de los presidentes. ¿Qué forma piensa usted que tendrá? o iguales a 1 minuto? c. ¿Cuál de las 60 mediciones es la más pequeña? b. Construya una gráfica de tallo y hoja para los datos. Describa la forma. ¿Le sorprende? 1.31 Tiempos de servicio, continúa Consulte el ejercicio 1.30. Construya un histograma de frecuencia c. Los cinco presidentes más jóvenes al momento de relativa para los tiempos de servicio de supermercado. su fallecimiento aparecen en la “cola” inferior de la distribución. Tres de los cinco más jóvenes tienen una a. Describa la forma de la distribución. ¿Ve algunos característica común. Identifique los cinco presidentes resultados atípicos? más jóvenes a su fallecimiento. ¿Qué característica común explica estas mediciones? b. Suponiendo que los resultados atípicos de este conjunto de datos sean observaciones válidas, ¿cómo MIS DATOS 1.34 Cantidades de glóbulos rojos los explicaría a la administración de la cadena de EX0134 La cantidad de glóbulos rojos de una persona supermercados? sana se midió en cada uno de 15 días. El número c. Compare el histograma de frecuencia relativa con registrado se midió en 106 células por microlitro (L). la gráfica de tallo y hoja del ejercicio 1.30. ¿Las dos gráficas llevan la misma información? 5.4 5.2 5.0 5.2 5.5 5.3 5.4 5.2 5.1 5.3 MIS DATOS 1.32 Contenido de calcio El contenido 5.3 4.9 5.4 5.2 5.2 EX0132 de calcio (Ca) de una sustancia mineral en a. Use una gráfica apropiada para describir los datos. polvo fue analizado 10 veces, con las siguientes composiciones porcentuales registradas: b. Describa la forma y ubicación de las cantidades de glóbulos rojos. .0271 .0282 .0279 .0281 .0268 .0271 .0281 .0269 .0275 .0276 c. Si la cantidad de glóbulos rojos de la persona se mide hoy como 5.7 ϫ 106/L, ¿usted consideraría que esto a. Trace una gráfica de puntos para describir los datos. es poco común? ¿Qué conclusiones podría sacar? (sugerencia: La escala del eje horizontal debe ir de .0260 a .0290.) MIS DATOS 1.35 Campeones de bateo Los directivos EX0135 del béisbol de ligas mayores han coronado b. Trace una gráfica de tallo y hoja para los datos. Use los números de centenas y millares como tallo. a un campeón de bateo en la Liga Nacional cada año desde 1876. En la tabla siguiente aparece una muestra de c. ¿Algunas de las mediciones son inconsistentes con las promedios ganadores de bateo:5 otras mediciones, indicando así que el técnico puede haber cometido un error en el análisis? MIS DATOS 1.33 Presidentes de Estados Unidos Año Nombre Promedio EX0133 A continuación aparecen las edades, al 2005 Derreck Lee .335 momento de su fallecimiento, de los 38 presidentes ya 2000 Todd Helton .372 desaparecidos desde George Washington a Ronald Reagan:5 1915 Larry Doyle .320 1917 Edd Roush .341 Washington 67 Garfield 49 1934 Paul Waner .362 J. Adams 90 Arthur 56 1911 Honus Wagner .334 Jefferson 83 Cleveland 71 1898 Willie Keeler .379 Madison 85 B. Harrison 67 1924 Roger Hornsby .424 Monroe 73 Cleveland 71 1963 Tommy Davis .326 J. Q. Adams 80 McKinley 58 1992 Gary Sheffield .330 Jackson 78 T. Roosevelt 60 1954 Willie Mays .345 Van Buren 79 Taft 72 1975 Bill Madlock .354 W. H. Harrison 68 Wilson 67 1958 Richie Ashburn .350 Tyler 71 Harding 57 1942 Ernie Lombardi .330 Polk 53 Coolidge 60 1948 Stan Musial .376 Taylor 65 Hoover 90 1971 Joe Torre .363 Fillmore 74 F. D. Roosevelt 63 1996 Tony Gwynn .353 Pierce 64 Truman 88 1961 Roberto Clemente .351 Buchanan 77 Eisenhower 78 1968 Pete Rose .335 Lincoln 56 Kennedy 46 1885 Roger Connor .371 A. Johnson 66 L. Johnson 64 Grant 63 Nixon 81 Hayes 70 Reagan 93 www.FreeLibros.me
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA ❍ 33 a. Construya un histograma de frecuencia relativa desechos peligrosos cercanos? La tabla siguiente muestra para describir los promedios de bateo para estos 20 campeones. el número de lugares con desechos peligrosos en cada b. Si al azar usted fuera a escoger uno de los 20 nombres, uno de los 50 estados de la unión americana y el Distrito ¿qué probabilidad hay de que escoja un jugador de Columbia en el año 2006:5 cuyo promedio fuera arriba de .400 para su año de campeonato? AL 15 HI 3 MA 33 NM 13 SD 2 AK 6 ID 9 MI 68 NY 87 TN 14 AZ 9 IL 48 MN 24 NC 31 TX 44 MIS DATOS 1.36 Mejores 20 películas La tabla que AR 10 IN 30 MS 5 ND 0 UT 18 EX0136 sigue presenta las ventas brutas de boletos en CA 95 IA 12 MO 26 OH 37 VT 11 CO 19 KS 11 MT 15 OK 11 VA 28 fin de semana para las mejores 20 películas, durante la CT 16 KY 14 NE 14 OR 11 WA 47 semana del 4 de agosto de 2006:9 DE 15 LA 14 NV 1 PA 96 WV 9 Venta bruta DC 1 ME 12 NH 21 RI 12 WI 38 fin de semana FL 50 MD 18 NJ 117 SC 26 WY 2 Película ($ millones) GA 17 1.Talladega Nights: The Ballad of Ricky Bobby $47.0 a. ¿Qué variable se está midiendo? ¿La variable es 2. Barnyard 15.8 discreta o continua? 3. Pirates of the Caribbean: Dead Man’s Chest 11.0 4. Miami Vice 10.2 b. A continuación se muestra una gráfica de tallo y 5. The Descent 8.9 hoja generada por MINITAB. Describa la forma de 6. John Tucker Must Die 6.2 la distribución de datos. Identifique las mediciones 7. Monster House 6.1 anormalmente grandes marcadas “HI” por estado. 8. The Ant Bully 3.9 9. You, Me and Dupree 3.6 Gráfica de tallo y hoja: Desechos peligrosos 10. The Night Listener 3.6 11. The Devil Wears Prada 3.0 Stem-and-leaf of Sites N = 51 12. Lady in the Water 2.7 Leaf Unit = 1.0 13. Little Man 2.5 14. Superman Returns 2.2 60 011223 15. Scoop 1.8 11 0 56999 16. Little Miss Sunshine 1.5 24 1 0111122234444 17. Clerks II 1.3 (8) 1 55567889 18. My Super Ex-Girlfriend 1.2 19 2 14 19. Cars 1.1 17 2 668 20. Click 0.8 14 3 013 11 3 78 Fuente: www.radiofree.com/mov-tops.shtml 94 4 84 78 a. Trace una gráfica de tallo y hoja para los datos. 65 0 Describa la forma de la distribución. ¿Hay algunos resultados atípicos? HI 68, 87, 95, 96, 117 b. Construya una gráfica de puntos para los datos. ¿Cuál c. ¿Puede usted dar alguna razón por la que estos cinco de las dos gráficas es más informativa? Explique. estados tienen un gran número de sitios con desechos peligrosos? ¿Qué otra variable podría usted medir para MIS DATOS 1.37 Desechos peligrosos ¿Qué tan seguro ayudar a explicar por qué los datos se comportan así? EX0137 es su vecindario? ¿Hay algunos lugares con Conforme usted siga trabajando los ejercicios de este capítulo, adquirirá más expe- riencia para reconocer diferentes tipos de datos y determinar el método gráfico más apro- piado a usar. Recuerde que el tipo de gráfica que use no es tan importante como la inter- pretación que acompaña a la imagen. Busque estas importantes características: • Ubicación del centro de los datos • Forma de la distribución de datos • Observaciones poco comunes del conjunto de datos www.FreeLibros.me
34 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS Al utilizar estas características como guía, podrá interpretar y comparar conjuntos de datos usando métodos gráficos, que son sólo la primera de numerosas herramientas esta- dísticas que pronto tendrá a su disposición. REPASO DEL CAPÍTULO 2. Datos cuantitativos a. Gráficas de pastel y de barras Conceptos clave b. Gráficas de líneas c. Gráficas de puntos I. Cómo se generan datos d. Gráficas de tallo y hoja 1. Unidades experimentales, variables, mediciones e. Histogramas de frecuencia relativa 2. Muestras y poblaciones 3. Datos univariados, bivariados y multivariados 3. Descripción de distribuciones de datos a. Formas: simétricas, sesgadas a la izquierda, II. Tipos de variables sesgadas a la derecha, unimodales, bimodales 1. Cualitativas o categóricas b. Proporción de mediciones en ciertos intervalos 2. Cuantitativas c. Resultados atípicos a. Discretas b. Continuas III. Gráficas para distribuciones univariadas de datos 1. Datos cualitativos o categóricos a. Gráficas de pastel b. Gráficas de barras MI APPLET El acceso fácil a la web ha hecho posible entender conceptos de estadística usando una herramienta interactiva de la web llamada applet. Estos applets dan un refuerzo visual para los conceptos que se han presentado en el capítulo. A veces el lector podrá realizar experimentos estadísticos, a veces podrá interactuar con una gráfica estadística para cambiar su forma y a veces podrá usar el applet como “tabla estadís- tica” interactiva. Al final de cada capítulo, el lector encontrará ejercicios diseñados específicamente para usar con un applet en particular. Los applets han sido personalizados en forma específica para comparar la presen- tación y notación empleadas en el texto. Se pueden hallar en el sitio web Premium. Si es necesario, siga las instrucciones para descargar el último buscador de la web y/o conexión a Java, o simplemente dé un clic en el vínculo apropiado para cargar los applets. Su buscador de la web abrirá el índice de applets, organizados por capítulo y nombre. Cuando haga clic en un título particular de applet, éste aparecerá en su bus- cador. Para regresar al índice de applets, dé un clic en el vínculo situado en la parte inferior de la página. www.FreeLibros.me
REPASO DEL CAPÍTULO ❍ 35 Gráficas de puntos Dé un clic en el applet del capítulo 1 llamado Construcción de una gráfica de pun- tos. Si el usuario mueve el cursor sobre el applet marcado Dotplot Demo, verá una línea verde con un valor que cambia al moverlo a lo largo del eje horizontal. Cuando dé un clic con el botón izquierdo de su mouse, aparecerá un dato en ese punto de la gráfica de puntos. Si dos medidas son idénticas, los puntos se apilan uno encima de otro (figura 1.17). Siga las instrucciones del Dotplot Demo, usando los datos mues- trales dados ahí. Si se equivoca, el applet se lo indica. El segundo applet no corregirá errores y el usuario puede agregar tantos puntos como desee. FIGURA 1.17 ● Construcción de un applet de gráfica de puntos Histogramas Dé un clic en el applet del capítulo 1 llamado Construcción de un histograma. Si se desplaza hacia abajo, al applet marcado Histogram Demo, verá las fronteras de intervalo (o puntos medios de intervalo) para el histograma a lo largo del eje horizon- tal. Al mover el apuntador por la gráfica, una caja de color gris claro indicará dónde se agrega la medición al siguiente clic del mouse. Cuando suelte éste, la caja pasa a color azul oscuro (azul oscuro en la figura 1.18). El histograma parcialmente com- pleto de la figura 1.18 contiene un 3, un 4, un 5, tres 6 y un 7. Siga las instrucciones del Histogram Demo usando los datos muestrales dados ahí. Dé un clic en el vínculo para comparar sus resultados contra el histograma correcto. El segundo applet se usará para algunos de los ejercicios Mi Applet. Haga clic en el applet llamado Flipping Fair Coins y desplace el apuntador al applet marcado tamaño muestral ؍3. La computadora recolectará algunos datos al “virtualmente” lanzar al aire 3 monedas y registrar la variable discreta cuantitativa x ϭ número de caras observadas Haga clic en “Nuevo tiro de moneda”. Verá el resultado de sus tres tiros en la esquina superior izquierda, junto con el valor de x. Para el experimento de la figura 1.19 observamos x ϭ 2. El applet empieza a construir un histograma de frecuencia relativa para describir el conjunto de datos, que en este punto contiene sólo una observación. Haga clic en “New Coin Flip” (Nuevo Tiro de Moneda) unas pocas veces más. Observe las mone- www.FreeLibros.me
36 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS FIGURA 1.18 ● Construcción de un applet de histograma FIGURA 1.19 ● Applet de tiro al aire de monedas “limpias” FIGURA 1.20 ● Applet de tiro al aire de monedas “limpias” www.FreeLibros.me
MI MINITAB ❍ 37 das, junto con el valor de x, y observe cómo crece el histograma de frecuencia rela- tiva. La parte roja (azul claro en las figuras 1.19 y 1.20) representa los datos actuales agregados al histograma, y la parte azul oscuro de la figura 1.20 está aportada de los tipos previos de moneda. El usuario puede tirar las tres monedas 10 veces o 100 para generar datos con más rapidez. La figura 1.20 muestra el histograma de frecuencia relativa para 500 observacio- nes en nuestro conjunto de datos. El conjunto de datos del usuario se mostrará un poco diferente pero debe tener la misma forma aproximada, es decir, debe ser rela- tivamente simétrico. Para nuestro histograma, podemos decir que los valores x ϭ 0 y x ϭ 3 ocurrieron alrededor de 12-13% del tiempo, mientras que los valores x ϭ 1 y x ϭ 2 ocurrieron entre 38 y 40% del tiempo. ¿El histograma de usted produce resul- tados similares? MI MINITAB Introducción a MINITABTM MINITAB es un paquete de software que presenta numerosas formas para diferentes ambientes de computadora. La versión actual de MINITAB al momento de imprimir este texto es el MINITAB 15, que se usa en ambientes Windows. Supondremos que el usuario está familiarizado con Windows; si no es así, quizá una asistente de enseñanza pueda ayudarlo a dominar los aspectos básicos. Una vez que inicie Windows, hay dos formas de iniciar MINITAB: • Si hay un icono de atajo MINITAB en el escritorio, dé doble clic en el icono. • Haga clic en el botón Start de la barra de tareas. Siga los menús, seleccionando All Programs Ǟ MINITAB Solutions Ǟ MINITAB 15 Statistical Software English. Haga clic en MINITAB 15 Statistical Software English para iniciar el programa. FIGURA 1.21 Cuando se abra el MINITAB, aparece la pantalla principal MINITAB (véase la figura 1.21). Contiene dos ventanas: la ventana Data y la ventana Session. Un clic en cualquier parte ● www.FreeLibros.me
38 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS de la ventana activa a ésta para que el usuario pueda introducir datos o teclear comandos. Aun cuando es posible teclear comandos MINITAB en la ventana Session, escogemos usar el método Windows por ser más conocido. Si prefiere usar comandos con tecleo, consul- te en el manual MINITAB las instrucciones detalladas. En el inciso superior de la ventana Session se mostrará la barra Menu. Si se seleccio- na y hace clic en cualquier comando de la barra de Menu, aparece un menú descendente, del cual usted seleccionará los comandos necesarios. Usaremos la notación estándar para indicar una secuencia de comandos del menú. Por ejemplo, File Ǟ Open Worksheet permitirá recuperar una “hoja de trabajo”, es decir, un conjunto de datos de la ventana Data que el usuario ha guardado previamente. Para cerrar el programa, la secuencia de comandos es File Ǟ Exit. MINITAB 15 permite guardar numerosas hojas de trabajo como “proyectos”. Cuando el usuario trabaje en un proyecto, puede agregar nuevas hojas de trabajo o abrir hojas de trabajo de otros proyectos para agregar a su proyecto actual. A medida que se familiarice más con MINITAB, podrá organizar su información en “hojas de trabajo” o en “proyec- tos”, dependiente de la complejidad de su trabajo. Gráficas con MINITAB El primer conjunto de datos a ser graficado está formado por datos cualitativos cuyas frecuencias ya han sido registradas. El estatus de clase de 105 estudiantes de un curso introductorio de estadística se muestra en la tabla 1.13. Antes de introducir los datos en la ventana Minitab Data, inicie un proyecto llamado “capítulo 1” al dar un clic en File Ǟ New. Aparece un cuadro de diálogo llamado “New”. Haga clic en Minitab Pro- ject y en OK. Antes de continuar, guardemos este proyecto como “capítulo 1” usando la serie de comandos File Ǟ Save Project. Teclee Chapter 1 en la caja File Name y seleccione un lugar usando la caja blanca marcada “Save in:” en la parte superior del cuadro de diálogo. Dé un clic en Save. En la ventana Data de la pantalla, parte superior, verá el nombre de su nuevo proyecto, “Chapter 1.MPJ”. TABLA 1.13 Estatus de estudiantes del curso de estadística ● Estatus 1er año Segundo año Penúltimo año Último año Graduado Frecuencia 5 23 32 35 10 Para introducir los datos en la hoja de trabajo, dé un clic en la celda gris situada abajo del nombre C1 de la ventana Data. Puede introducir su propio nombre descriptivo para las categorías, posiblemente “Status”. A continuación use la flecha hacia abajo ↓ del mouse para continuar por la columna C1, introduciendo las cinco descripciones de es- tatus. Observe que el nombre C1 ha cambiado a C1-T porque está usted introduciendo texto en lugar de números. Continúe dando nombre a la columna 2 (C2) “Frecuency”, e introduzca las cinco frecuencias numéricas en C2. La ventana de datos aparecerá como Frecuency en la figura 1.22. Para construir una gráfica de pastel para estos datos, haga clic en Graph Ǟ Pie Chart, y aparecerá una caja de diálogo (véase la figura 1.23). En esta caja, el usuario debe especificar la forma en que desee crear la gráfica. Dé un clic en el botón de radio mar- cado Chart values from a table. Enseguida coloque su cursor en la caja marcada “Ca- tegorical Variable”. El usuario puede (1) dar clic en C1 en la lista a la izquierda y esco- ger Select, (2) dar doble clic en C1 de la lista a la izquierda, o (3) teclear C1 en la caja “Categorical variable”. Del mismo modo, ponga el cursor en la caja marcada “Summary variables” y seleccione C2. Dé un clic en Labels y seleccione la ficha marcada Slice www.FreeLibros.me
MI MINITAB ❍ 39 FIGURA 1.22 ● FIGURA 1.23 ● Labels. Verifique las cajas marcadas “Category names” y “Percent”. Cuando dé un clic en OK, MINITAB creará la gráfica de pastel de la figura 1.24. Hemos removido la leyenda al seleccionarla y eliminarla. Cuando adquiera más experiencia en el uso del comando de gráficas de pastel, podrá aprovechar algunas opciones disponibles. Una vez creada la gráfica, dé un clic derecho en la gráfica de pastel y seleccione Edit Pie. Puede cambiar los colores y formato de la gráfica, “mostrar por separado” sectores importantes del pastel y cambiar el orden de las categorías. Si el usuario da un clic derecho en la gráfica de pastel y selecciona Update Graph Automatically, la gráfica de pastel se actualizará en forma automática cuando se cambien los datos de las columnas C1 y C2 de la hoja de trabajo MINITAB. Si el usuario prefiere construir una gráfica de barras, use el comando Graph Ǟ Bar Chart. En la caja de Diálogo que aparece, escoja Simple. Seleccione una opción de la lista descendente “Bars represent”, dependiendo de la forma en que los datos se hayan www.FreeLibros.me
40 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS FIGURA 1.24 ● introducido en la hoja de trabajo. Para los datos de la tabla 1.13, escogimos “Values from a table” y dimos clic en OK. Cuando aparezca la caja de Dialog, ponga su cursor en la caja “Graph variables” y seleccione C2. Ponga su cursor en la caja “Categorical variable” y seleccione C1. Dé un clic en OK para terminar la gráfica de barras, mostrada en la figura 1.25. Una vez creada la gráfica, dé un clic derecho en las diversas partes de la gráfica de barras y escoja Edit para cambiar el aspecto de la gráfica. MINITAB puede crear gráficas de puntos, gráficas de tallo y hoja e histogramas para datos cuantitativos. Las 40 acciones superiores del mercado secundario, clasificadas por el porcentaje de acciones en circulación negociadas en un día en particular, aparecen en la tabla 1.14. Aun cuando podríamos simplemente introducir estos datos en la tercera columna (C3) de la Hoja de Trabajo 1 del proyecto “Chapter 1”, iniciemos una nueva hoja de trabajo dentro de “Chapter 1” usando File Ǟ New, dando clic en Minitab Wor- ksheet y dando clic en OK. La Hoja de Trabajo 2 aparecerá en la pantalla. Introduzca los datos en la columna C1 y llámelas “Stocks” (Acciones) en la celda gris que está un poco abajo de C1. TABLA 1.14 Porcentaje de acciones en circulación negociadas ● 11.88 6.27 5.49 4.81 4.40 3.78 3.44 3.11 2.88 2.68 7.99 6.07 5.26 4.79 4.05 3.69 3.36 3.03 2.74 2.63 7.15 5.98 5.07 4.55 3.94 3.62 3.26 2.99 2.74 2.62 7.13 5.91 4.94 4.43 3.93 3.48 3.20 2.89 2.69 2.61 Para crear una gráfica de puntos, use Graph Ǟ Dotplot. En la caja de Dialog que aparece, escoja One Y Ǟ Simple y dé un clic en OK. Para crear una gráfica de tallo y hoja, use Graph Ǟ Stem-and-Leaf. Para cualquiera de estas gráficas, ponga su cursor en la caja “Graph variables” y seleccione “Stocks” (Acciones) de la lista a la izquierda (véase la figura 1.26). www.FreeLibros.me
MI MINITAB ❍ 41 FIGURA 1.25 ● FIGURA 1.26 ● El usuario puede seleccionar de una variedad de opciones de formato antes de hacer clic en OK. La gráfica de puntos aparece como una gráfica, en tanto que la gráfica de tallo y hoja aparece en la ventana Session. Para imprimir una ventana Graph o la venta- na Session, dé un clic en la ventana para activarla y use File Ǟ Print Graph (o Print Session Window). Para crear un histograma, use Graph Ǟ Histogram. En la caja de Dialog que apa- rece, escoja Simple y dé un clic en OK, seleccionando “Stocks” para la caja “Graph www.FreeLibros.me
42 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS Variables”. Seleccione Scale Ǟ Y-Scale Type y dé un clic en el botón de radio marcado “Frequency”. (Después puede editar el histograma para mostrar frecuencias relativas.) Dé doble clic en OK. Una vez creado el histograma, dé un clic derecho en el eje Y y seleccione Edit Y Scale. Bajo la ficha marcada “Scale”, el usuario puede dar clic en el botón de radio marcado “Position of ticks” y teclear 0 5 10 15. A continuación dé un clic en la ficha marcada “Labels” (Leyendas), en el botón de radio marcado “Specified” y teclee 0 5/40 10/40 15/40. Haga clic en OK. Esto reducirá el número de “palomas” en el eje y y las cambia a frecuencias relativas. Por último, dé doble clic en la palabra “Fre- quency” junto al eje y. Cambie la caja marcada “Text” para leer “Relative frequency” y dé clic en OK. Para ajustar el tipo de fronteras para el histograma, dé un clic derecho en las barras del histograma y escoja Edit Bars. Use la ficha marcada “Binning” para escoger ya sea “Cutpoints” (Puntos de corte) o “Midpoints” (Puntos medios) para el histograma; puede usted cambiar los colores, llenar el tipo y estilo de fuente del histograma. Si da un clic derecho en las barras y selecciona Update Graph Automatically, el histograma se ac- tualiza en forma automática cuando se cambien los datos de la columna “Stocks”. Cuando el usuario se familiarice con el MINITAB para Windows, podrá explorar las diversas opciones disponibles para cada tipo de gráfica. Es posible graficar más de una variable a la vez, cambiar los ejes, escoger los colores y modificar gráficas en numerosas formas. No obstante, aun con los comandos básicos predeterminados, es evidente que la distribución de acciones en circulación está muy sesgada a la derecha. Asegúrese de guardar su trabajo usando el comando File Ǟ Save Project antes de salir del MINITAB. FIGURA 1.27 ● www.FreeLibros.me
EJERCICIOS SUPLEMENTARIOS ❍ 43 Ejercicios suplementarios 1.38 ¿Cuantitativa o cualitativa? Identifique cada a. Número de personas en fila de espera en la caja de variable como cuantitativa o cualitativa: pago de un supermercado a. Origen étnico de un candidato a un cargo público b. Profundidad de una nevada b. Calificación (0-100) en un examen de conocimientos c. Establecimiento de comida rápida preferida c. Tiempo para que un conductor responda ante un choque inminente por un estudiante (McDonald’s, Burger King o Carl’s Jr.) d. Número de aviones que llegan al aeropuerto de d. Concentración de mercurio en una muestra de atún Atlanta en una hora determinada 1.39 ¿Simétrica o sesgada? ¿Espera usted que las MIS DATOS 1.43 Agua corriente Se ha sugerido agua distribuciones de las variables siguientes sean simétricas EX0143 corriente como método de acondicionamiento o sesgadas? Explique. cardiovascular para atletas lesionados y otros que deseen a. Monto en dólares de préstamos no asegurados un programa de aerobics de bajo impacto. Un estudio b. Monto en dólares de préstamos asegurados publicado en la Journal of Sports Medicine investigó la c. Precio de una lata de 8 onzas (¼ kg) de chícharos relación entre la cadencia de ejercicio y la frecuencia d. Estatura en pulgadas de mujeres de primer año en la cardiaca, al medir las frecuencias cardiacas de 20 voluntarios sanos a una cadencia de 48 ciclos por minuto universidad (un ciclo formado por dos pasos).10 Los datos aparecen a e. Número de envolturas de taco rotas en un paquete de continuación: 100 envolturas 87 109 79 80 96 95 90 92 96 98 f. Número de garrapatas halladas en cada uno de 50 101 91 78 112 94 98 94 107 81 96 conejos de cola de algodón atrapados Construya una gráfica de tallo y hoja para describir los datos. Analice las características de la distribución 1.40 ¿Continuas o discretas? Identifique cada de datos. variable como continua o discreta: MIS DATOS 1.44 Lagos más grandes del mundo Un a. Número de homicidios en Detroit en el periodo de EX0144 lago es un cuerpo de agua rodeado por tierra. un mes Por lo tanto, algunos cuerpos de agua llamados “mares”, b. Lapso entre llegadas de un paciente externo a una como el mar Caspio, en realidad son lagos salados. clínica En la tabla siguiente, la longitud en millas aparece para los lagos naturales más grandes del mundo, excluyendo c. Número de errores de tipografía en una página de el mar Caspio, que tiene un área de 143 244 millas manuscrito cuadradas, una longitud de 760 millas y una profundidad máxima de 3363 pies.5 d. Número de focos defectuosos en un paquete que contiene cuatro focos Nombre Longitud (millas) Nombre Longitud (millas) e. Tiempo necesario para terminar un examen Superior 350 Eyre 90 122 1.41 Continuas o discretas, otra vez Identifique Victoria 250 Titicaca 102 cada variable como continua o discreta: 208 Huron 206 Nicaragua 143 a. Peso de dos docenas de camarones 154 b. Temperatura corporal de una persona Michigan 307 Athabasca 115 c. Número de personas en espera de tratamiento en la 130 Aral Sea 260 Reindeer 91 sala de emergencia de un hospital 67 d. Número de propiedades a la venta de una agencia de Tanganyika 420 Turkana 141 100 bienes raíces Baykal 395 Issyk Kul 72 e. Número de reclamaciones recibidas por una compañía 90 Great Bear 192 Torrens 90 de seguros en un día 140 Nyasa 360 Vänern 175 1.42 Continua o discreta, otra vez Identifique cada variable como continua o discreta: Great Slave 298 Nettilling Erie 241 Winnipegosis Winnipeg 266 Albert Ontario 193 Nipigon Balkhash 376 Gairdner Ladoga 124 Urmia Maracaibo 133 Manitoba Onega 145 Chad Fuente: The World Almanac and Book of Facts 2007 www.FreeLibros.me
44 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS a. Use una gráfica de tallo y hoja para describir las Taylor 0 Eisenhower 73 longitudes de los lagos más grandes del mundo. Fillmore 0 Kennedy 12 Pierce 9 L. Johnson 16 b. Use un histograma para exhibir estos mismos datos. Buchanan 4 Nixon 26 ¿Cómo se compara con la gráfica de tallo y hoja del Lincoln 2 Ford 48 inciso a)? A. Johnson 21 Carter 13 Grant 45 Reagan 39 c. ¿Estos datos son simétricos o sesgados? Si son Hayes 12 G. H. W. Bush 29 sesgados, ¿cuál es la dirección del sesgo? Garfield 0 Clinton 36 Arthur 4 G. W. Bush 1 Cleveland 304 MIS DATOS 1.45 Edades de centavos Recolectamos Fuente: The World Almanac and Book of Facts 2007 EX0145 50 monedas de un centavo y registramos sus edades, al calcular EDAD ϭ AÑO ACTUAL – AÑO Use una gráfica apropiada para describir el número de vetos emitidos por los 43 presidentes. Escriba un párrafo EN EL CENTAVO. de resumen que describa este conjunto de datos. 5 1 9 1 2 20 0 25 0 17 MIS DATOS 1.48 Ciudades ventosas ¿Hay algunas 1 4 4 3 0 25 3 3 8 28 EX0148 ciudades más ventosas que otras? ¿Chicago 5 21 19 9 0 5 0 2 1 0 0 1 19 0 2 0 20 16 22 10 merece el apodo de “La Ciudad de los Vientos”? Estos datos 19 36 23 0 1 17 6 0 5 0 son las velocidades promedio del viento (en millas por hora) para 55 ciudades seleccionadas en Estados Unidos:5 a. Antes de trazar gráfica alguna, trate de visualizar el aspecto que tendrá la distribución de edades de 8.9 12.4 12.9 8.4 7.8 11.5 8.2 9.0 8.8 9.0 centavos. ¿Tendrá forma de montículo, será simétrica, 7.1 11.8 10.3 7.7 9.2 10.5 9.3 8.7 8.7 estará sesgada a la derecha o sesgada a la izquierda? 9.1 9.0 10.5 11.3 7.8 8.8 12.2 7.9 8.8 8.8 10.8 8.7 7.6 5.5 35.1 10.5 10.4 11.0 b. Trace un histograma de frecuencia relativa para 10.2 8.6 10.7 9.6 8.3 8.0 9.5 7.7 9.4 describir la distribución de edades de centavos. 8.7 5.8 10.2 6.9 9.2 10.2 6.2 9.6 12.2 ¿Cómo describiría usted la forma de la distribución? Fuente: The World Almanac and Book of Facts 2007 MIS DATOS 1.46 Edades de centavos, continúa a. Construya un histograma de frecuencia relativa para EX0146 Los datos que aparecen a continuación los datos. (sugerencia: Escoja las fronteras de clase sin incluir el valor x ϭ 35.1 en el rango de valores.) representan las edades de un conjunto diferente de 50 b. El valor x ϭ 35.1 se registró en Monte Washington, centavos, de nuevo calculados usando EDAD ϭ AÑO New Hampshire. ¿La geografía de esa ciudad explica la observación? ACTUAL – AÑO EN EL CENTAVO. c. El promedio de velocidad del viento en Chicago está 41 9 0 43 0 3 8 21 3 registrado en 10.3 millas por hora. ¿Considera usted 2 10 4 0 14 0 25 12 24 19 que esto es extraordinariamente ventoso? 31 14 72 4 4 5 1 20 14 9 3 53 0 8 17 16 0 MIS DATOS 1.49 Kentucky Derby El siguiente conjunto 07 3 5 23 7 28 17 9 2 EX0149 de datos muestra los tiempos ganadores (en a. Trace un histograma de frecuencia relativa para segundos) para las carreras del Derby de Kentucky de describir la distribución de edades de centavos. 1950 a 2007:11 ¿La forma es similar a la del histograma de frecuencia relativa del ejercicio 1.41? (1950) 121.3 122.3 121.3 122.0 123.0 121.4 123.2 122.1 125.0 122.1 (1960) 122.2 124.0 120.2 121.4 120.0 121.1 122.0 120.3 122.1 121.4 b. Trace una gráfica de tallo y hoja para describir (1970) 123.2 123.1 121.4 119.2† 124.0 122.0 121.3 122.1 121.1 122.2 las edades de centavos. ¿Hay algunas medidas (1980) 122.0 122.0 122.2 122.1 122.2 120.1 122.4 123.2 122.2 125.0 anormalmente grandes o pequeñas en el conjunto? (1990) 122.0 123.0 123.0 122.2 123.3 121.1 121.0 122.4 122.2 123.2 (2000) 121.0 119.97 121.13 121.19 124.06 122.75 121.36 122.17 MIS DATOS 1.47 Vetos presidenciales A continuación †Tiempo récord establecido por Secretariat en 1973 EX0147 aparece una lista de los 43 presidentes de Fuente: www.kentuckyderby.com Estados Unidos, junto con el número de vetos regulares a. ¿Piensa usted que con los años habrá una tendencia en empleados por cada uno de ellos:5 los tiempos ganadores? Trace una gráfica de línea para verificar su respuesta. Washington 2 B. Harrison 19 J. Adams 0 Cleveland 42 b. Describa la distribución de tiempos ganadores usando Jefferson 0 McKinley 6 una gráfica apropiada. Comente sobre la forma de la Madison 5 T. Roosevelt 42 distribución y busque algunas observaciones poco Monroe 1 Taft 30 comunes. J. Q. Adams 0 Wilson 33 Jackson 5 Harding 5 Van Buren 0 Coolidge 20 W. H. Harrison 0 Hoover 21 Tyler 6 F. D. Roosevelt 372 Polk 2 Truman 180 www.FreeLibros.me
EJERCICIOS SUPLEMENTARIOS ❍ 45 MIS DATOS 1.50 Redes computarizadas en casa MIS DATOS 1.52 Resultados de elecciones, EX0150 A medida que los norteamericanos estén EX0152 continúa Consulte el ejercicio 1.51. A más informados acerca del hardware y el software de computadoras, los precios bajen y la instalación se haga continuación aparece el porcentaje del voto popular más fácil, se espera que las redes de las PC en casa penetren al 27% de hogares en Estados Unidos hacia el recibido por el presidente Bush en cada uno de los 50 año 2008, con la tecnología inalámbrica a la delantera.12 estados:8 Redes domésticas en Estados Unidos (en millones) AL 62 HI 45 MA 37 NM 50 SD 60 Año Conectada Inalámbrica AK 61 ID 68 MI 48 NY 40 TN 57 AZ 55 IL 44 MN 48 NC 56 TX 61 2002 6.1 1.7 AR 54 IN 60 MS 59 ND 63 UT 73 2003 6.5 4.5 CA 44 IA 50 MO 53 OH 51 VT 39 2004 6.2 8.7 CO 52 KS 62 MT 59 OK 66 VA 54 2005 5.7 13.7 CT 44 KY 60 NE 66 OR 47 WA 46 2006 4.9 19.1 DE 46 LA 57 NV 51 PA 48 WV 56 2007 4.1 24.0 FL 52 ME 45 NH 49 RI 39 WI 49 2008 3.4 28.2 GA 58 MD 43 NJ 46 SC 58 WY 69 Fuente: Jupiter Research a. Con sólo mirar la tabla, ¿qué forma piensa usted que tendrá la distribución de datos para el porcentaje del a. ¿Qué métodos gráficos podría usted usar para describir voto popular? los datos? b. Trace un histograma de frecuencia relativa para b. Antes de trazar una gráfica, busque en la tabla el número describir la distribución. Describa la forma de la pronosticado de instalaciones conectadas e inalámbricas. distribución y busque resultados atípicos. ¿La gráfica ¿Qué tendencias espera ver en las gráficas? confirma su respuesta al inciso a)? c. Use una gráfica de línea para describir el número 1.53 Resultados de elecciones, continúa Consulte pronosticado de instalaciones domésticas alámbricas los ejercicios 1.51 y 1.52. Las siguientes gráficas de para los años 2002 a 2008. tallo y hoja fueron generadas usando el MINITAB para las variables llamadas “Voto popular” y “Porcentaje de d. Use una gráfica de línea para describir el número Votos”. pronosticado de instalaciones domésticas inalámbricas para los años 2002 a 2008. Pantalla de tallo y hoja: Voto popular y porcentaje de votos MIS DATOS 1.51 Resultados de elecciones Las EX0151 elecciones de 2004 fueron una carrera en la Stem-and-leaf of Stem-and-leaf of Popular Vote N = 50 Percent Vote N = 50 que el titular, George W. Bush, derrotó a John Kerry, Leaf Unit = 100 Leaf Unit = 1.0 Ralph Nader y otros candidatos, recibiendo 50.7% de la votación. El voto popular (en miles) para George W. Bush 7 0 1111111 3 3 799 en cada uno de los 50 estados aparece a continuación:8 12 0 22333 8 4 03444 18 0 444555 19 4 55666788899 AL 1176 HI 194 MA 1071 NM 377 SD 233 22 0 6667 (9) 5 001122344 AK 191 ID 409 MI 2314 NY 2962 TN 1384 25 0 899 22 5 566778899 AZ 1104 IL 2346 MN 1347 NC 1961 TX 4527 25 1 0001111 13 6 00011223 AR 573 IN 1479 MS 685 ND 197 UT 664 18 1 333 5 6 6689 CA 5510 IA 572 MO 1456 OH 2860 VT 121 15 1 444 1 73 CO 1101 KS 736 MT 266 OK 960 VA 1717 12 1 67 CT 694 KY 1069 NE 513 OR 867 WA 1305 10 1 99 DE 172 LA 1102 NV 419 PA 2794 WV 424 82 FL 3965 ME 330 NH 331 RI 169 WI 1478 8 2 33 GA 1914 MD 1025 NJ 1670 SC 938 WY 168 62 6 27 a. Con sólo mirar la tabla, ¿qué forma piensa usted que 5 2 89 tendrá la distribución de datos para el voto popular por estado? HI 39, 45, 55 b. Trace un histograma de frecuencia relativa para a. Describa las formas de las dos distribuciones. ¿Hay describir la distribución del voto popular para el resultados atípicos? presidente Bush en los 50 estados. b. ¿Las gráficas de tallo y hoja se asemejan a los c. ¿El histograma del inciso b) confirma el cálculo histogramas de frecuencia relativa construidos en de usted en el inciso a)? ¿Hay resultados atípicos? los ejercicios 1.51 y 1.52? ¿Cómo puede explicarlos? c. Explique por qué la distribución del voto popular para el presidente Bush por estado está sesgada, en tanto www.FreeLibros.me
46 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS que el porcentaje de votos populares por estadoFrecuencia relativa y seguridad nacional. Use el tiempo como eje tiene forma de montículo. horizontal. MIS DATOS 1.54 Estaturas de estudiantes Las estaturas EX0154 de 105 estudiantes de un grupo de bioestadística, b. Coloque encima otra gráfica de línea sobre la trazada indicadas voluntariamente, están descritas en el en el inciso a) para describir el porcentaje que no histograma de frecuencia relativa siguiente. aprueba. 10/105 c. La siguiente gráfica de línea fue creada usando el MINITAB. ¿Difiere de la gráfica que usted trazó? Use la 5/105 gráfica de línea para resumir cambios en las encuestas, poco después de los ataques terroristas en España el 11 de marzo de 2004, y en Inglaterra en julio de 2005. d. Un complot para derribar aviones en vuelos de Inglaterra a Estados Unidos fue frustrado por agentes secretos ingleses y el arresto de 12 sospechosos siguió el 9 de agosto de 2006. Resuma cualesquier cambios en porcentaje de aprobación que puedan haber sido causados después de los arrestos del 9 de agosto. 0 ¿Aprueba o desaprueba usted el manejo que dio el presidente Opinión 60 63 66 69 72 75 al terrorismo y seguridad nacional? Aprueba Estaturas Desaprueba 70 a. Describa la forma de la distribución. Respuesta b. ¿Ve alguna característica poco común en este 60 histograma? 50 c. ¿Puede considerar una explicación para los dos picos 40 del histograma? ¿Hay algún otro factor que esté causando que las estaturas formen un montículo en 30 dos picos separados? ¿Qué es? ’04 ’04 ’04 ’05 ’05 ’05 ’05 ’05 ’06 ’06 ’06 MIS DATOS 1.55 Temor al terrorismo Numerosas MarF2e5b, EX0155 encuestas de opinión han dado seguimiento a Abr Mar puntos de vista respecto al temor a ataques terroristas Ago después del 11 de septiembre de 2001 al Centro Mundial de Comercio. Una encuesta del Newsweek SeSpep298,, realizada por Princeton Survey Research Associates Nov International presentó los resultados de varias encuestas Mar en un periodo de dos años que preguntaba: “¿Aprueba o desaprueba usted el modo en que Bush está manejando el AgoM1a0,y terrorismo y la seguridad nacional?” Los datos aparecen en la tabla siguiente:13 Fecha Fecha % aprueba % desaprueba % que no sabe MIS DATOS 1.56 Frecuencia del pulso Un grupo EX0156 de 50 estudiantes de biomedicina tomaron 8/10–11/06 55 40 5 5/11–12/06 44 50 6 la frecuencia de sus pulsos, al contar el número de 3/16–17/06 44 50 6 pulsaciones durante 30 segundos y luego multiplicando 11/10–11/05 45 49 6 por 2. 9/29–30/05 51 44 5 9/8–9/05 46 48 6 80 70 88 70 84 66 84 82 66 42 8/2–4/05 51 41 8 52 72 90 70 96 84 96 86 62 78 3/17–18/05 57 35 8 60 82 88 54 66 66 80 88 56 104 4/8–9/04 59 35 6 84 84 60 84 88 58 72 84 68 74 3/25–26/04 57 38 5 84 72 62 90 72 84 72 110 100 58 2/19–20/04 65 28 7 a. ¿Por qué son pares todos los números de las a. Trace una gráfica de línea para describir el porcentaje mediciones? que aprueba el manejo que hace Bush del terrorismo b. Trace una gráfica de tallo y hoja para describir los datos, dividiendo cada tallo en dos líneas. c. Construya un histograma de frecuencia relativa para los datos. d. Escriba un párrafo corto que describa la distribución de las frecuencias de pulsos de los estudiantes. 1.57 Internet móvil El internet móvil está creciendo, con usuarios teniendo acceso a sitios como Yahoo! Mail, the Weather Channel, ESPN, Google, Hotmail www.FreeLibros.me
EJERCICIOS SUPLEMENTARIOS ❍ 47 y Mapquest desde sus teléfonos celulares. Los Llanederyn Caldicot Island Thorns Ashley Rails buscadores más conocidos en la web se muestran en 14.4 11.6 11.8 18.3 17.7 13.8 11.1 11.6 15.8 18.3 la tabla siguiente, junto con el porcentaje de la parte 14.6 13.4 18.0 16.7 de mercado de cada uno.14 11.5 12.4 18.0 14.8 13.8 13.1 20.8 19.1 Buscador Parte de Buscador Parte de 10.9 12.7 mercado mercado 10.1 12.5 Openwave 27% Teleca AU 6% a. Construya un histograma de frecuencia relativa para Motorola 24% Sony Ericsson 5% describir el contenido de óxido de aluminio en las 26 Nokia 13% RIM 5% muestras. Access Net Front 9% Blazer 4% b. ¿Qué característica poco común observa usted en esta Fuente: www.clickz.com gráfica? ¿Puede considerar una explicación de esta característica? a. ¿Los porcentajes suman 100%? Si no es así, genere una categoría llamada “Otros” para considerar los c. Trace una gráfica de puntos para los datos, usando porcentajes faltantes. una letra (L, C, I o A) para localizar el punto de datos en la escala horizontal. ¿Ayuda esto a explicar la b. Use una gráfica de pastel para describir las partes de característica poco común del inciso b)? mercado para los diversos buscadores móviles de la web. MIS DATOS 1.58 ¿Cuánto puede ahorrar? Un anuncio 1.60 El gran debate de calorías ¿Quiere bajar de peso? Puede hacerlo si reduce sus calorías, mientras EX0158 en una revista Times reciente decía que Geico tome suficiente valor nutricional de los alimentos que Insurance ayudaría a ahorrar un promedio de $200 consuma. A continuación tenemos una representación dólares por año en seguro de automóviles.15 visual del número de calorías, en algunos de los alimentos favoritos de los estadounidenses, adaptada de WA $178 un artículo de The Press-Enterprise.17 OR $180 ID $189 WI $189 NY $237 IN $203 PA $194 NV $239 WY $189 CT $268 UT $191 NE $189 CA $144 IL $149 OH $208 MD $240 Número de calorías AZ $188 MO $174 VA $215 NM $146 OK $189 TN $235 NC $127 GA $209 AL $189 TX $183 UN MUESTREO FL $130 26 53 140 145 330 800 DE AHORROS Kiss de Galleta lata de cerveza rebanada grande hamburguesa Hershey Oreo Coca-Cola Budweiser de pizza Burger King 350 ml de 350 ml Papa John’s grande con queso de pepperoni a. Construya un histograma de frecuencia relativa a. Comente sobre la precisión de la gráfica mostrada para describir el promedio de ahorros para los 27 arriba. ¿Los tamaños, alturas y volúmenes de los estados mostrados en el mapa de Estados Unidos. seis artículos representan con precisión el número de ¿Ve usted algunas características poco comunes en el calorías en el artículo? histograma? b. Trace una gráfica de barras real para describir el b. Construya una gráfica de tallo y hoja para los datos número de calorías en estos seis alimentos favoritos. dados por Geico Insurance. MIS DATOS 1.61 Laptops y aprendizaje Un experimento c. ¿Cómo cree usted que Geico seleccionó los 27 estados EX0161 informal fue realizado por la secundaria McNair para incluirlos en este anuncio? Academic de Jersey City, Nueva Jersey, para investigar MIS DATOS 1.59 Un hallazgo arqueológico Un artículo el uso de computadoras portátiles como herramienta de EX0159 en Archaeometry contenía un análisis de 26 aprendizaje en el estudio del álgebra.18 Un grupo de 20 estudiantes de primer año recibió estas computadoras muestras de alfarería romano-británica, hallada en cuatro para usar en la escuela y en casa, al tiempo que a otro sitios de hornos en el Reino Unido.16 Las muestras fueron grupo de 27 no se les dieron laptops; no obstante, muchos analizadas para determinar su composición química, con de éstos podían usarlas en casa. Las calificaciones el porcentaje de óxido de aluminio de cada una de las 26 muestras presentadas en la tabla siguiente. www.FreeLibros.me
48 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS de examen final para los dos grupos se muestran a MIS DATOS 1.63 Impuesto a la gasolina Las siguientes continuación. EX0163 son tasas de impuesto estatal a la gasolina en Con laptops Sin laptops 2006, en centavos por galón, para los 50 estados y el 98 84 63 83 97 distrito de Columbia.5 97 93 93 52 74 88 57 83 63 88 AL 18.0 HI 16.0 MA 21.0 NM 17.0 SD 20.0 100 84 86 81 84 AK 8.0 ID 25.0 MI 19.0 NY 23.9 TN 20.0 100 81 99 91 49 AZ 18.0 IL 19.0 MN 20.0 NC 29.9 TX 20.0 78 83 80 81 89 AR 20.0 IN 18.0 MS 18.0 ND 23.0 UT 24.5 68 84 78 29 64 CA 18.0 IA 21.0 MO 17.0 OH 28.0 VT 19.0 47 93 74 72 89 CO 22.0 KS 24.0 MT 27.0 OK 20.0 VA 17.5 90 57 67 89 70 CT 25.0 KY 19.0 NE 26.1 OR 24.0 WA 31.0 94 83 DE 23.0 LA 20.0 NV 23.0 PA 32.0 WV 20.5 DC 20.0 ME 25.9 NH 18.0 RI 30.0 WI 32.9 Los histogramas que se muestran a continuación FL 14.9 MD 23.5 NJ 10.5 SC 16.0 WY 14.0 muestran la distribución de calificaciones del examen GA 10.0 final para los dos grupos. Fuente: The World Almanac and Book of Facts 2007 Con laptops 30 40 50 60 70 80 90 100 a. Construya una gráfica de tallo y hoja para los datos. .40 Sin laptops b. ¿Cómo describiría la forma de esta distribución? Frecuencia relativa .30 c. ¿Hay estados con impuesto a la gasolina .20 extraordinariamente bajo o alto? Si es así, ¿cuáles son esos estados? MIS DATOS 1.64 Plantas hidroeléctricas Los datos EX0164 siguientes representan capacidades estimadas en megawatts (millones de watts) para las 20 plantas hidroeléctricas más grandes del mundo.5 .10 18 200 4 500 3 000 14 000 4 200 2 940 0 10 000 4 200 2 715 30 40 50 60 70 80 90 100 8 370 3 840 2 700 6 400 3 230 2 541 6 300 3 300 2 512 6 000 3 100 Escriba un párrafo con un resumen que describa y Fuente: The World Almanac and Book of Facts 2007 compare la distribución de calificaciones del examen final para los dos grupos de estudiantes. a. Construya una gráfica de tallo y hoja para los datos. b. ¿Cómo describiría usted la forma de esta distribución? MIS DATOS 1.62 El Old Faithful Los datos siguientes son EX0162 los tiempos de espera entre erupciones del géiser MIS DATOS 1.65 Colores de autos Los colores más llamado Old Faithful (Viejo Fiel) del parque nacional EX0165 populares para autos compactos y deportivos en Yellowstone.19 Use uno de los métodos gráficos de este un año reciente se dan en la tabla.5 capítulo para describir la distribución de tiempos de espera. Si hay algunas características poco comunes en Color Porcentaje Color Porcentaje su gráfica, vea si puede idear alguna explicación práctica de ellas. Plateado 20 Rojo 9 Gris 17 Verde 6 56 89 51 79 58 82 52 88 52 78 Azul 16 Café claro 5 69 75 77 53 80 54 79 74 65 78 Negro 14 Amarillo/oro 1 55 87 53 85 61 93 54 76 80 81 Blanco 10 Otro 2 59 86 78 71 77 89 45 93 72 71 76 94 75 50 83 82 72 77 75 65 Fuente: The World Almanac and Book of Facts 2007 79 72 78 77 79 72 82 74 80 49 75 78 64 80 49 49 88 51 78 85 Use un método gráfico apropiado para describir estos 65 75 77 69 92 91 53 86 49 79 datos. 68 87 61 81 55 93 53 84 70 73 93 50 87 77 74 89 87 76 59 80 MIS DATOS 1.66 Starbucks El número de cafeterías EX0166 Starbucks en ciudades a no más de 20 millas de la Universidad de California, en Riverside, se muestra en la tabla siguiente.20 www.FreeLibros.me
EJERCICIOS SUPLEMENTARIOS ❍ 49 Ciudad Starbucks Ciudad Starbucks .25 Riverside 16 Ontario 11 .20 Grand Terrace 1 Norco 4 Rialto 3 Fontana 6 Frecuencia relativa .15 Colton 2 Mira Loma 1 San Bernardino 5 Perris 1 .10 Redlands 7 Highland 1 Corona 7 Rancho Cucamonga 12 .05 Yucaipa 2 Lake Elsinore 1 Chino 1 Moreno Valley 4 Fuente: www.starbucks.com a. Trace una gráfica de puntos para describir los datos. 0 b. Describa la forma de la distribución. 96.8 97.6 98.4 99.2 100.0 100.8 c. ¿Hay otra variable que usted pudiera medir para Temperatura ayudar a explicar por qué algunas ciudades tienen más Starbucks que otras? Explique. a. Describa la forma de la distribución de temperaturas. MIS DATOS 1.67 ¿Qué es normal? Los 98.6 grados b. ¿Hay algunas observaciones poco comunes? ¿Puede EX0167 normales para la temperatura corporal en seres idear alguna explicación para éstas? humanos fue obtenida por un médico alemán en 1868. c. Localice los 98.6 grados normales en el eje horizontal En un intento por verificar esta afirmación, Mackowiak, de la gráfica. ¿Parece estar cerca del centro de Wasserman y Levine21 tomaron temperaturas de 148 distribución? personas sanas en un periodo de tres días. Un conjunto de datos, que estrechamente se compara con el del artículo de Mackowiak, fue obtenido por Allen Shoemaker y aparece en la Journal of Statistics Education.22 Las temperaturas corporales para estas 130 personas se muestran en el histograma de frecuencia relativa que sigue. MI APPLET Ejercicios 1.68 Si todavía no lo hace, use el primer applet en 1 6915 90284 Building a Dotplot (Construir una gráfica de puntos) 0 7342 35842 para crear una gráfica de puntos para el siguiente 3 2002 12774 conjunto de datos: 2, 3, 9, 6, 7, 6. 0 0995 38474 6 6902 62958 1.69 Hamburguesa con queso Use el segundo applet 5 1777 87518 en Building a Dotplot para crear una gráfica de puntos el 3 4193 86666 número de hamburguesas con queso consumidas en una semana determinada por 10 estudiantes universitarios: a. Antes de graficar los datos, use su sentido común para adivinar la forma de la distribución de datos. Explique 45421 su razonamiento. 33427 b. Use el segundo applet en Building a Dotplot a. ¿Cómo describiría usted la forma de la distribución? (Construir una gráfica de puntos) para crear b. ¿Qué proporción de los estudiantes comió más de 4 una gráfica de puntos para describir los datos. ¿Su intuición fue correcta en el inciso a)? hamburguesas con queso esa semana? 1.71 Si todavía no lo hace, use el primer applet en MIS DATOS 1.70 Números del Seguro Social A un Building a Histogram (Construir un histograma) para EX0170 grupo de 70 estudiantes se le pidió registrar el crear un histograma para los datos del ejemplo 1.11, el número de visitas a Starbucks durante una semana típica. último dígito de su número de Seguro Social. www.FreeLibros.me
50 ❍ CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS MIS DATOS 1.72 El Fondo Unido El siguiente conjunto 8 127 EX0172 de datos registra las aportaciones caritativas 11 133 52 139 anuales (en dólares) al Fondo Unido, para un grupo de 57 142 empleados de una universidad pública. 65 144 87 147 41 81 80 65 47 56 80 69 79 63 93 148 28 51 112 71 83 84 82 103 80 70 97 157 77 75 59 63 63 80 101 115 99 67 109 162 42 78 81 90 103 125 92 79 24 93 120 165 Use el segundo applet de Building a Histogram para a. Observe los datos. ¿Puede usted calcular la forma construir un histograma de frecuencia relativa para los aproximada de la distribución de datos? datos. ¿Cuál es la forma de la distribución? ¿Puede usted ver algunos resultados atípicos obvios? b. Use el segundo applet de Building a Histogram para construir un histograma de frecuencia relativa para los 1.73 Tiempos de supervivencia Altman y Bland datos. ¿Cuál es la forma de la distribución? MIS DATOS informan de los tiempos de supervivencia EX0173 para pacientes con hepatitis activa, la mitad c. ¿Hay algunos resultados atípicos en el conjunto? de ellos tratados con prednisone y la mitad sin recibir Si es así, ¿cuáles tiempos de supervivencia son tratamiento.23 Los datos que siguen están adaptados extraordinariamente cortos? de los de estos investigadores para los tratados con prednisona. Los tiempos de supervivencia están registrados al mes más cercano: CASO ¿Cómo está su presión sanguínea? PRÁCTICO La presión sanguínea es la presión que la sangre ejerce contra las paredes de las arterias. MIS DATOS Presión Cuando los médicos o enfermeras miden la presión sanguínea a una persona, toman dos sanguínea lecturas. La presión sistólica es aquella cuando el corazón se contrae y, por lo tanto, bombea. La presión diastólica es la presión en las arterias cuando el corazón se dilata. La presión diastólica siempre es la menor de las dos lecturas. La presión sanguínea varía de una persona a otra; también varía en una sola persona de un día para otro e incluso en un mismo día. Si la presión sanguínea de usted es demasiado alta, puede llevarle a una hemorragia cerebral o un ataque al corazón. Si es demasiado baja, la sangre no llega a las extremida- des y el paciente puede marearse. La presión baja suele no ser tan grave. Por lo tanto, ¿cuál debe ser la presión de usted? Una presión sistólica de 120 se con- sidera normal; una de 150 es alta, pero como la presión varía con el género y aumenta con la edad, una mejor posición de su presión sanguínea se obtendría al compararla con la población de presiones sanguíneas de todas las personas de su género y edad en Estados Unidos. Desde luego, no podemos darle a usted ese conjunto de datos, pero podemos mos- trarle una muestra muy grande seleccionada de él. Los datos de presión sanguínea en 1910 personas, 965 hombres y 945 mujeres entre 15 y 20 años, se encuentran en el sitio web Student Companion. Los datos son parte del estudio de salud llevado a cabo el National Institutes of Health (NIH). Las entradas para cada persona incluyen la edad y presiones sistólica y diastólica de esa persona, al momento de registrar la presión sanguínea. 1. Describa las variables que se han medido en este estudio. ¿Las variables son cuantita- tivas o cualitativas? ¿Discretas o continuas? ¿Los datos son univariados, bivariados o multivariados? 2. ¿Qué tipos de métodos gráficos hay para describir este conjunto de datos? ¿Qué tipos de preguntas podrían ser contestados usando varios tipos de técnicas gráficas? www.FreeLibros.me
ESTUDIO PRÁCTICO ❍ 51 3. Usando el conjunto de datos de presión sanguínea sistólica, construya un histograma de frecuencia relativa para los 965 hombres y otro para las 945 mujeres. Use un paquete de software de estadística si tiene acceso a uno. Compare los dos histogramas. 4. Considere los 965 hombres y 945 mujeres como toda la población de interés. Escoja una muestra de n ϭ 50 hombres y n ϭ 50 mujeres, registrando sus presiones sanguí- neas sistólicas y sus edades. Trace dos histogramas de frecuencia relativa para exhibir gráficamente las presiones sanguíneas sistólicas para sus dos muestras. ¿Las formas de los histogramas se asemejan a los histogramas de población del inciso 3? 5. ¿Cómo se compara la presión sanguínea de usted con la de otros de su mismo género? Verifique su presión sanguínea sistólica contra el histograma apropiado del inciso 3 o 4 para determinar si la presión sanguínea de usted es “normal” o si es extraordinaria- mente alta o baja. www.FreeLibros.me
Descripción 2 de datos con medidas © Stu Griffith/Dreamstime numéricas OBJETIVOS GENERALES Los muchachos de verano Las gráficas son sumamente útiles para la descripción ¿Los campeones de béisbol de hoy son mejores visual de un conjunto de datos, pero no siempre son la que los de “ayer”? ¿Los jugadores de la Liga Na- mejor herramienta cuando se desea hacer inferencias cional batean mejor que los de la Liga America- acerca de una población a partir de la información conte- na? El estudio práctico del final de este capítulo nida en una muestra. Para este propósito, es mejor usar contiene los promedios de bateo de campeones medidas numéricas para construir una imagen mental de de las ligas mayores. Se pueden usar medidas nu- los datos. méricas descriptivas para contestar éstas y otras preguntas similares. ÍNDICE DEL CAPÍTULO ● Gráficas de caja (2.7) ● Medidas de centro: media, mediana y moda (2.2) ● Medidas de posición relativa: puntajes z, percentiles, cuartiles y el rango intercuartil (2.6) ● Medidas de variabilidad: rango, varianza y desviación estándar (2.3) ● Teorema de Chebyshev y la Regla Empírica (2.4) MI ENTRENADOR PERSONAL ¿Cómo calculo cuartiles muestrales? 52 www.FreeLibros.me
2.2 MEDIDAS DE CENTRO ❍ 53 DESCRIPCIÓN DE UN CONJUNTO DE DATOS CON MEDIDAS NUMÉRICAS 2.1 Las gráficas pueden ayudar a describir la forma básica de una distribución de datos. Sabemos que “una imagen vale por mil palabras” pero hay limitaciones para usar grá- ficas. Supongamos que usted necesita presentar sus datos a un grupo de personas y que el foco del proyector de imágenes se quema o que usted necesita describir sus datos por teléfono; no hay modo de ver las gráficas. Necesita entonces hallar otra forma de llevar la imagen mental de los datos a su audiencia. Una segunda limitación es que las gráficas son un tanto imprecisas para usar en infe- rencia estadística. Por ejemplo, supongamos que desea usar un histograma muestral para hacer inferencias acerca de un histograma poblacional. ¿Cómo puede medir las similitu- des y diferencias entre los dos histogramas en alguna forma concreta? Si son idénticas, podría usted decir que son las mismas, pero, si son diferentes, es difícil describir el grado de diferencia. Una forma de superar estos problemas es usar medidas numéricas, que se pueden calcular para una muestra o una población de mediciones. Se pueden usar los datos para calcular un conjunto de números que llevarán una buena imagen mental de la dis- tribución de frecuencia. Estas mediciones se llaman parámetros cuando se asocian con la población y se denominan estadísticas cuando se calculan a partir de mediciones muestrales. Definición Las mediciones descriptivas numéricas asociadas con una población de mediciones se llaman parámetros; las calculadas a partir de mediciones muestrales reciben el nombre de estadísticas. MEDIDAS DE CENTRO 2.2 En el capítulo 1 introdujimos gráficas de puntos, gráficas de tallo y hoja e histogramas para describir la distribución de un conjunto de mediciones en una variable cuantita- tiva x. El eje horizontal presenta los valores de x, y los datos están “distribuidos” a lo largo de esta recta horizontal. Una de las primeras mediciones numéricas importantes es una medida de centro, es decir, una medida a lo largo del eje horizontal que localiza el centro de la distribución. Los datos de peso al nacer presentados en la tabla 1.9 iban de un punto bajo de 5.6 a uno alto de 9.4, con el centro del histograma situado en la cercanía de 7.5 (véase la figura 2.1). Consideremos algunas reglas para localizar el centro de una distribución de mediciones. FIGURA 2.1 ● Centro de los datos de 8/30 peso al nacer 7/30 Frecuencia relativa 6/30 5/30 4/30 3/30 2/30 1/30 0 5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6 Centro Pesos al nacer www.FreeLibros.me
54 ❍ CAPÍTULO 2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS El promedio aritmético de un conjunto de mediciones es una medida de centro muy común y útil. Es frecuente que esta medida se conozca como media aritmética o sim- plemente media, de puanracolanjpuonbtoladceiómn,eudsicaimonoesse. lPsaírma bdoislotinx_gu(xir entre la media para la muestra y la media barra) para una media muestral y el símbolo m para la media de una población. Definición La media aritmética o promedio de un conjunto de n mediciones es igual a la suma de las mediciones dividida entre n. Como es frecuente que las fórmulas estadísticas comprendan la suma de números o “sumarlos”, usamos un símbolo para indicar el proceso de sumar. Suponga que hay n mediciones en la variable x y que las llamamos x1, x2, …, xn. Para sumar las n medicio- nes, usamos esta notación abreviada: n Αxi que significa x1 ϩ x2 ϩ x3 ϩ и и и ϩ xn iϭ1 La letra griega mayúscula (8) pide sumar los términos que aparezcan a su derecha, empezando con el número debajo de la sigma (i ϭ 1) y terminando con el número arriba (i ϭ n). No obstante, como las sumas típicas en cálculos estadísticos se hacen casi siem- pre sobre el conjunto total de n mediciones, se puede usar una notación más sencilla: 8xi que significa “la suma de todas las mediciones de x” Usando esta notación, escribimos la fórmula para la media muestral: NOTACIÓN Media muestral: x_ ϭ _8_x_i n Media poblacional: m E J E M P L O 2.1 Trace una gráfica de puntos para las n ϭ 5 mediciones 2, 9, 11, 5, 6. Encuentre la media muestral y compare su valor con lo que usted pudiera considerar el “centro” de estas observaciones en la gráfica de puntos. Solución La gráfica de puntos de la figura 2.2 parece estar centrada entre 6 y 8. Para hallar la media muestral, calcule xෆ ϭ _8_x_i ϭ _2_ϩ__9__ϩ__1_1_ϩ___5_ϩ__6_ ϭ 6.6 n 5 FIGURA 2.2 ● Gráfica de puntos para el ejemplo 2.1 2 4 6 8 10 Mediciones La estadística _ ϭ 6.6 es el punto de equilibrio o fulcro que se muestra en la gráfica de x puntos. Parece marcar el centro de los datos. www.FreeLibros.me
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372
- 373
- 374
- 375
- 376
- 377
- 378
- 379
- 380
- 381
- 382
- 383
- 384
- 385
- 386
- 387
- 388
- 389
- 390
- 391
- 392
- 393
- 394
- 395
- 396
- 397
- 398
- 399
- 400
- 401
- 402
- 403
- 404
- 405
- 406
- 407
- 408
- 409
- 410
- 411
- 412
- 413
- 414
- 415
- 416
- 417
- 418
- 419
- 420
- 421
- 422
- 423
- 424
- 425
- 426
- 427
- 428
- 429
- 430
- 431
- 432
- 433
- 434
- 435
- 436
- 437
- 438
- 439
- 440
- 441
- 442
- 443
- 444
- 445
- 446
- 447
- 448
- 449
- 450
- 451
- 452
- 453
- 454
- 455
- 456
- 457
- 458
- 459
- 460
- 461
- 462
- 463
- 464
- 465
- 466
- 467
- 468
- 469
- 470
- 471
- 472
- 473
- 474
- 475
- 476
- 477
- 478
- 479
- 480
- 481
- 482
- 483
- 484
- 485
- 486
- 487
- 488
- 489
- 490
- 491
- 492
- 493
- 494
- 495
- 496
- 497
- 498
- 499
- 500
- 501
- 502
- 503
- 504
- 505
- 506
- 507
- 508
- 509
- 510
- 511
- 512
- 513
- 514
- 515
- 516
- 517
- 518
- 519
- 520
- 521
- 522
- 523
- 524
- 525
- 526
- 527
- 528
- 529
- 530
- 531
- 532
- 533
- 534
- 535
- 536
- 537
- 538
- 539
- 540
- 541
- 542
- 543
- 544
- 545
- 546
- 547
- 548
- 549
- 550
- 551
- 552
- 553
- 554
- 555
- 556
- 557
- 558
- 559
- 560
- 561
- 562
- 563
- 564
- 565
- 566
- 567
- 568
- 569
- 570
- 571
- 572
- 573
- 574
- 575
- 576
- 577
- 578
- 579
- 580
- 581
- 582
- 583
- 584
- 585
- 586
- 587
- 588
- 589
- 590
- 591
- 592
- 593
- 594
- 595
- 596
- 597
- 598
- 599
- 600
- 601
- 602
- 603
- 604
- 605
- 606
- 607
- 608
- 609
- 610
- 611
- 612
- 613
- 614
- 615
- 616
- 617
- 618
- 619
- 620
- 621
- 622
- 623
- 624
- 625
- 626
- 627
- 628
- 629
- 630
- 631
- 632
- 633
- 634
- 635
- 636
- 637
- 638
- 639
- 640
- 641
- 642
- 643
- 644
- 645
- 646
- 647
- 648
- 649
- 650
- 651
- 652
- 653
- 654
- 655
- 656
- 657
- 658
- 659
- 660
- 661
- 662
- 663
- 664
- 665
- 666
- 667
- 668
- 669
- 670
- 671
- 672
- 673
- 674
- 675
- 676
- 677
- 678
- 679
- 680
- 681
- 682
- 683
- 684
- 685
- 686
- 687
- 688
- 689
- 690
- 691
- 692
- 693
- 694
- 695
- 696
- 697
- 698
- 699
- 700
- 701
- 702
- 703
- 704
- 705
- 706
- 707
- 708
- 709
- 710
- 711
- 712
- 713
- 714
- 715
- 716
- 717
- 718
- 719
- 720
- 721
- 722
- 723
- 724
- 725
- 726
- 727
- 728
- 729
- 730
- 731
- 732
- 733
- 734
- 735
- 736
- 737
- 738
- 739
- 740
- 741
- 742
- 743
- 744
- 745
- 746
- 747
- 748
- 749
- 750
- 751
- 752
- 753
- 754
- 755
- 756
- 757
- 758
- 759
- 760
- 761
- 762
- 763
- 764
- 765
- 766
- 767
- 768
- 769
- 770
- 771
- 772
- 773
- 774
- 775
- 776
- 777
- 778
- 779
- 780
- 1 - 50
- 51 - 100
- 101 - 150
- 151 - 200
- 201 - 250
- 251 - 300
- 301 - 350
- 351 - 400
- 401 - 450
- 451 - 500
- 501 - 550
- 551 - 600
- 601 - 650
- 651 - 700
- 701 - 750
- 751 - 780
Pages: