Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Triola

Triola

Published by veroronquillo1, 2021-10-23 05:45:29

Description: Triola

Search

Read the Text Version

7-2 Estimación de un promedio poblacional 329 12. Programa de pérdida de peso Atkins En una prueba a programas de pérdida de peso, 40 adul- tos utilizaron el programa de pérdida de peso Atkins. Después de 12 meses, se descubrió que su pérdida de peso promedio era de 2.1 lb, con una desviación estándar de 4.8 lb. Construya una estimación del intervalo de confianza del 90% para la pérdida de peso media de todos estos sujetos. ¿Parece que el programa Atkins es efectivo? ¿Parece ser práctico? 13. Tratamiento del insomnio Se realizó un ensayo clínico para probar la efectividad del fármaco zopiclona en el tratamiento del insomnio en sujetos mayores. Antes del tratamiento con zopiclona, 16 sujetos tuvieron un tiempo de vigilia medio de 102.8 minutos. Después del tratamiento con zopiclo- na, los 16 sujetos tuvieron un tiempo de vigilia medio de 98.9 minutos y una desviación estándar de 42.3 minutos (con base en los datos de “Cognitive Behavioral Therapy vs Zoplicone for Treatment of Chronic Primary Insomnia in Older Adults”, de Sivertsen et al., en Journal of the American Medical Association, vol. 295, núm. 24). Suponga que los 16 valores muestrales parecen ser de una población normalmente distribuida y construya una estimación del intervalo de confianza del 98% para el tiempo de vigilia medio de una población con tratamiento de zopiclona. ¿Qué sugiere el resultado sobre el tiempo de vigilia medio de 102.8 minutos antes del tratamiento? ¿La zopiclona parece ser efectiva? 14. Ajo para reducir el colesterol En una prueba de la efectividad del ajo para bajar el colesterol, 49 sujetos fueron tratados con ajo crudo. Los niveles de colesterol se midieron antes y después del trata- miento. Los cambios (antes menos después) en sus niveles de colesterol LDL (en mg>dL) tuvieron una media de 0.4 y una desviación estándar de 21.0 (según datos de “Effect of Raw Garlic vs Commercial Garlic Supplements on Plasma Lipid Concentrations in Adults with Moderate Hypercholesterolemia”, de Gardner et al., en Archives of Internal Medicine, vol. 167). Construya una estimación del intervalo de confianza del 98% para el cambio neto medio en el colesterol LDL después del tratamiento con ajo. ¿Qué sugiere el intervalo de confianza sobre la efectividad del ajo en la reducción del colesterol LDL? 15. Genes Se recolectan muestras de ADN y las cuatro bases de ADN de A, G, C y T se codifican como 1, 2, 3 y 4, respectivamente. Los resultados se listan a continuación. Construya una estimación del intervalo de confianza del 95% para la media. ¿Cuál es el uso práctico del intervalo de confianza? 2214333341 16. Arsénico en el arroz A continuación se listan las cantidades de arsénico (mg, o microgramos, por porción) en muestras de arroz integral de California (según datos de la FDA, Administración de Drogas y Alimentos). Use un nivel de confianza del 90%. La Administración de Drogas y Alimentos también midió cantidades de arsénico en muestras de arroz integral de Arkansas. ¿Se puede usar el intervalo de confianza para describir los niveles de arsénico en Arkansas? 5.4 5.6 8.4 7.3 4.5 7.5 1.5 5.5 9.1 8.7 17. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió a los sujetos masculinos que calificaran el atractivo de sus citas femeninas, y una muestra de los resultados se detalla a continuación (1 5 no atractiva; 10 5 extremadamente atractiva). Use un nivel de confianza del 99%. ¿Qué nos dicen los resultados sobre la media de las calificaciones del atractivo hechas por la población de todas las mujeres adultas? 7 8 2 10 6 5 7 8 8 9 5 9 18. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió a los sujetos femeninos que calificaran el atractivo de sus citas masculinas, y una muestra de los resultados se detalla a continuación (1 5 no atractivo; 10 5 extremadamente atractivo). Use un nivel de confianza del 99%. ¿Puede usarse el resultado para estimar el atractivo medio de la población de todos los adultos masculinos? 5 8 3 8 6 10 3 7 9 8 5 5 6 8 8 7 3 5 5 6 8 7 8 8 8 7 19. Mercurio en el sushi Una directriz de la FDA es que el mercurio en el pescado debe ser inferior a 1 parte por millón (ppm). A continuación se listan las cantidades de mercurio (ppm) encontrados en el sushi de atún que se muestreó en diferentes establecimientos de la ciudad de Nueva York. El estudio fue patrocinado por el New York Times, y las establecimientos (en orden) son D’Agostino, Eli’s Manha- ttan, Fairway, Food Emporium, Gourmet Garage, Grace’s Marketplace y Whole Foods. Construya una estimación del intervalo de confianza del 98% para la cantidad media de mercurio en la población. ¿Se puede inferir que hay demasiado mercurio en el sushi de atún? 0.56 0.75 0.10 0.95 1.25 0.54 0.88

330 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 20. Años en la universidad A continuación se listan las cantidades de años que requirió una muestra aleatoria de estudiantes universitarios para obtener títulos de licenciatura (según datos del Centro Na- cional de Estadísticas de Educación). Elabore una estimación del intervalo de confianza del 95% para el tiempo medio requerido por todos los estudiantes universitarios para obtener una licenciatura. ¿Se puede inferir que los estudiantes universitarios generalmente obtienen títulos de licenciatura en cuatro años? ¿Hay algo acerca de los datos que sugiera que el intervalo de confianza podría no ser un buen resultado? 4 4 4 4 4 4 4.5 4.5 4.5 4.5 4.5 4.5 6 6 8 9 9 13 13 15 21. Patrimonio de celebridades A continuación se listan los montos del patrimonio neto (en millones de dólares) de las diez celebridades más ricas: Tom Cruise, Will Smith, Robert De Niro, Drew Carey, George Clooney, John Travolta, Samuel L. Jackson, Larry King, Demi Moore y Bruce Willis. Construya un intervalo de confianza del 98%. ¿Qué nos dice el resultado sobre la población de todas las celebrida- des? ¿Los datos parecen ser de una población normalmente distribuida como es requerido? 250 200 185 165 160 160 150 150 150 150 22. Cafeína en bebidas refrescantes A continuación se listan las cantidades medidas de cafeína (mg por 12 onzas de bebida) obtenidas en una lata de cada una de 20 marcas (7UP, A&W Root Beer, Cherry Coke, . . . , TaB). Use un nivel de confianza del 99%. ¿El intervalo de confianza nos da informa- ción buena sobre la población de todas las latas de las mismas 20 marcas que se consumen? ¿La muestra parece provenir de una población normalmente distribuida? De lo contrario, ¿cómo se ven afectados los resultados? 0 0 34 34 34 45 41 51 55 36 47 41 0 0 53 54 38 0 41 47 23. Evaluaciones de estudiantes A continuación se listan las calificaciones que algunos estudiantes dan a sus cursos, donde una calificación de 5 es para “excelente”. Las calificaciones se obtuvieron en la Universidad de Texas en Austin (consulte el conjunto de datos 17 “Evaluaciones de cursos” en el apén- dice B). Use un nivel de confianza del 90%. ¿Qué nos dice el intervalo de confianza sobre la población de estudiantes universitarios en Texas? 3.8 3.0 4.0 4.8 3.0 4.2 3.5 4.7 4.4 4.2 4.3 3.8 3.3 4.0 3.8 24. Llegadas de vuelo A continuación se listan los retrasos de llegada (en minutos) de vuelos de American Airlines seleccionados, desde Nueva York (JFK) hasta Los Ángeles (LAX). Los números negativos corresponden a vuelos que llegaron antes de la hora de llegada programada. Use un intervalo de confianza del 95%. ¿Qué tan bueno es el desempeño en cuanto al tiempo? 25 232 213 29 219 49 230 223 14 221 232 11 Conjuntos de datos del apéndice B. En los ejercicios 25 a 28, use los conjuntos de datos del apéndice B para construir estimaciones del intervalo de confianza para la media. 25. Pulsos Consulte el conjunto de datos 1 “Datos corporales” y construya una estimación del inter- valo de confianza del 95% para el pulso medio de las mujeres adultas: luego haga lo mismo para los hombres adultos. Compare los resultados. 26. Velocidades de datos en aeropuertos Consulte el conjunto de datos 32 “Velocidades de datos en aeropuertos” y construya una estimación del intervalo de confianza del 95% para la velocidad media de Sprint, luego haga lo mismo para T-Mobile. Compare los resultados. 27. Tiempos de servicio de comida rápida Consulte el conjunto de datos 25 “Comida rápida” y construya una estimación del intervalo de confianza del 95% para el tiempo medio de servicio en auto en las cenas de McDonald’s; luego haga lo mismo para las cenas en Burger King. Compare los resultados. 28. Galletas con chispas de chocolate Consulte el conjunto de datos 28 “Galletas con chispas de chocolate” y construya una estimación del intervalo de confianza del 95% para el número medio de chis- pas de chocolate en las galletas Chips Ahoy regulares; luego haga lo mismo para las galletas Keebler. Compare los resultados.

7-2 Estimación de un promedio poblacional 331 Tamaño de muestra. En los ejercicios 29 a 36, encuentre el tamaño de muestra requerido para estimar la media poblacional. 29. IQ medio de profesores universitarios La prueba Wechsler de IQ está diseñada para que la me- dia sea 100 y la desviación estándar sea 15 para la población de adultos normales. Encuentre el tamaño de muestra necesario para estimar la puntuación promedio de IQ de los profesores universitarios. Que- remos tener el 99% de confianza de que nuestra media muestral está dentro de 4 puntos del coeficiente intelectual de la media verdadera. La media para esta población es claramente mayor que 100, la des- viación estándar es menor que 15 porque es un grupo con menos variación que un grupo seleccionado al azar de la población general; por lo tanto, si usamos s 5 15, estamos siendo conservadores al usar un valor que hará que el tamaño de muestra sea tan grande como se necesite. Suponga entonces que s 5 15 y determine el tamaño de muestra requerido. ¿Se puede inferir que el tamaño de muestra es práctico? 30. IQ medio de abogados Vea el ejercicio anterior, en el que podemos suponer que s 5 15 para los puntajes de IQ. Los abogados son un grupo con puntajes de IQ que varían menos que las puntuaciones de la población general. Encuentre el tamaño de muestra necesario para estimar el coeficiente intelec- tual medio de los abogados, dado que queremos un 98% de confianza de que la media muestral está dentro de 3 puntos del IQ medio poblacional. ¿Se puede inferir que el tamaño de muestra es práctico? 31. Media de calificaciones promedio Suponga que todas las calificaciones promedio deben estan- darizarse en una escala entre 0 y 4. ¿Cuántas calificaciones promedio se deben obtener para que la me- dia muestral esté dentro de 0.01 de la media poblacional? Suponga que se desea un nivel de confianza del 95%. Si usamos la regla práctica, podemos estimar s como rango>4 5 (4 2 0)>4 5 1. ¿Se puede inferir que el tamaño de la muestra es práctico? 32. Peso medio de estudiantes varones de estadística El conjunto de datos 1 “Datos corporales” en el apéndice B incluye pesos de 153 hombres adultos seleccionados al azar, y esos pesos tienen una desviación estándar de 17.65 kg. Debido a que es razonable suponer que los pesos de los estudiantes varones de estadística tienen menos variación que los pesos de la población de varones adultos, sea s 5 17.65 kg. ¿Cuántos estudiantes varones de estadística deben pesarse para estimar el peso promedio de todos los estudiantes de estadística del sexo masculino? Suponga que deseamos tener un 90% de confianza en que la media muestral está dentro de 1.5 kg desde la media poblacional. ¿Parece razonable suponer que los pesos de los estudiantes varones de estadística tienen menos variación que los pesos de la población de hombres adultos? 33. Edad media de las estudiantes de estadística El conjunto de datos 1 “Datos corporales” en el apéndice B incluye las edades de 147 mujeres adultas seleccionadas al azar, y esas edades tienen una desviación estándar de 17.7 años. Suponga que las edades de las estudiantes de estadística tienen menos variación que las edades de las mujeres en la población general, por lo que s 5 17.7 años para el cálculo del tamaño de la muestra. ¿De cuántas estudiantes femeninas de estadística se debe obtener la edad para estimar la edad media de todas las estudiantes de estadísticas? Suponga que deseamos tener un 95% de confianza en que la media muestral está dentro del medio año desde la media poblacional. ¿Se puede inferir que las edades de las estudiantes de estadística tienen menos variación que las edades de las mujeres en la población general? 34. Pulso medio de mujeres El conjunto de datos 1 “Datos corporales” en el apéndice B incluye los pulsos de 147 mujeres adultas seleccionadas al azar, y esos pulsos varían desde un mínimo de 36 lpm hasta un máximo de 104 lpm. Encuentre el tamaño de muestra mínimo requerido para estimar el pulso promedio de las mujeres adultas. Suponga que deseamos tener un 99% de confianza en que la media de la muestra está dentro de 2 lpm desde la media poblacional. a. Encuentre el tamaño de muestra usando la regla práctica del rango para estimar s. b. Suponga que s 5 12.5 lpm, con base en el valor de s 5 12.5 lpm para la muestra de 147 pulsos femeninos. c. Compare los resultados de los incisos (a) y (b). ¿Cuál resultado parece ser mejor? 35. Pulso medio de hombres El conjunto de datos 1 “Datos corporales” en el apéndice B incluye los pulsos de 153 hombres adultos seleccionados al azar, y esos pulsos varían desde un mínimo de 40 lpm hasta un máximo de 104 lpm. Encuentre el tamaño de muestra mínimo requerido para estimar el pulso medio de los hombres adultos. Suponga que deseamos tener un 99% de confianza en que la media muestral está dentro de 2 lpm desde la media poblacional. continúa

332 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra a. Encuentre el tamaño de muestra usando la regla práctica del rango para estimar s. b. Suponga que s 5 11.3 lpm, con base en el valor de x 5 11.3 lpm para la muestra de 153 pulsos masculinos. c. Compare los resultados de los incisos (a) y (b). ¿Cuál resultado parece ser mejor? 36. Temperatura corporal media El conjunto de datos 3 “Temperaturas corporales” en el apéndice B incluye 106 temperaturas corporales de adultos para el Día 2 a las 12 am, y varían desde un mínimo de 96.5 °F hasta un máximo de 99.6 °F. Encuentre el tamaño de muestra mínimo requerido para estimar la temperatura corporal media de todos los adultos. Suponga que deseamos tener un 98% de confianza en que la media muestral está dentro de 0.1 °F desde la media poblacional. a. Encuentre el tamaño de muestra usando la regla práctica del rango para estimar s. b. Suponga que s 5 0.62 °F, con base en el valor de s 5 0.62 °F para la muestra de 106 temperaturas corporales. c. Compare los resultados de los incisos (a) y (b). ¿Qué resultado parece ser mejor? 7.2 Más allá de lo básico Intervalo de confianza con S conocida. En los ejercicios 37 y 38, encuentre el intervalo de con- fianza usando el valor conocido de S. 37. Pesos al nacer de niñas Construya el intervalo de confianza para el ejercicio 9 “Pesos al nacer de niñas”, suponiendo que se sabe que s es 7.1 hg. 38. Pesos al nacer de niños Construya el intervalo de confianza para el ejercicio 10 “Pesos al nacer de niños”, suponiendo que se sabe que s es 6.6 hg. 39. Factor de corrección de población finita Si se selecciona una muestra aleatoria simple de ta- maño n y sin reemplazo de una población finita de tamaño N, y el tamaño de la muestra supera el 5% del tamaño de la población (n > 0.05N), pueden obtenerse mejores resultados utilizando el factor de correc- ción de población finita, lo que implica multiplicar el margen de error E por 2( N - n)>(N - 1). Para la muestra de un peso de 100 para los caramelos M&M en el conjunto de datos 27 “Peso de M&Ms” del apéndice B, obtenemos x 5 0.8565 g y s 5 0.0518 g. Primero construya una estimación del intervalo de confianza del 95% para m, suponiendo que la población es grande; luego construya una estimación del intervalo de confianza del 95% para el peso medio de los M&Ms en la bolsa completa de la que se tomó la muestra. La bolsa completa tiene 465 M&Ms. Compare los resultados. Estimación de una desviación estándar 7-3 o varianza poblacionales Concepto clave Esta sección presenta métodos para usar una desviación estándar mues- tral s (o una varianza muestral s2) para estimar el valor de la desviación estándar poblacio- nal s (o la varianza poblacional s2) correspondiente. A continuación se enuncian los con- ceptos principales incluidos en esta sección: ■ Estimación puntual: La varianza muestral s2 es la mejor estimación puntual (o estima- ción de valor único) de la varianza poblacional s2. La desviación estándar muestral s se usa comúnmente como una estimación puntual de s, aunque es un estimador sesgado, como se describió en la sección 6-3. ■ Intervalo de confianza: Al construir una estimación del intervalo de confianza de una desviación estándar poblacional (o varianza poblacional), construimos el intervalo de confianza utilizando la distribución x2. (La letra griega x se pronuncia “ji”).

7-3 Estimación de una desviación estándar o varianza poblacionales 333 Distribución ji cuadrada Los puntos clave sobre la distribución x2 (ji cuadrada o chi cuadrada) son: ■ En una población normalmente distribuida con varianza s2, si seleccionamos aleatoria- mente muestras independientes de tamaño n y, para cada muestra, calculamos la varian- za muestral s2, el estadístico muestral x2 5 (n 2 1)s2>s2 tiene una distribución muestral llamada distribución ji cuadrada, como se muestra en la fórmula 7-5. FÓRMULA 7.5 x2 = 1n - 12s2 s2 ■ Valores críticos de x2 Expresamos un valor crítico de la cola derecha por xR2 y un valor crítico de la cola izquierda por xL2. Esos valores críticos se pueden encontrar mediante el uso de tecnología o de la tabla A-4, y requieren que primero determinemos un valor para la cantidad de grados de libertad. ■ Grados de libertad Para los métodos de esta sección, el número de grados de libertad es el tamaño de la muestra menos 1. Grados de libertad: gl 5 n 2 1 ■ La distribución ji cuadrada es asimétrica a la derecha, a diferencia de las distribuciones normal y t de Student (vea la figura 7-7). ■ Los valores de la ji cuadrada pueden ser cero o positivos, pero no pueden ser negativos, como se muestra en la figura 7-7. ■ La distribución ji cuadrada es diferente para cada cantidad de grados de libertad, como se ilustra en la figura 7-8. A medida que aumenta la cantidad de grados de libertad, la distribución ji cuadrada se acerca a una distribución normal. No simétrica df 5 10 df 5 20 x2 0 5 10 15 20 25 30 35 40 45 0 Todos los valores son no negativos x2 FIGURA 7-7 Distribución ji cuadrada FIGURA 7-8 Distribución ji cuadrada para gl 5 10 y gl 5 20 Debido a que la distribución ji cuadrada no es simétrica, una estimación del intervalo de confianza para s2 no se ajusta a un formato del tipo s2 2 E < s2 < s2 1 E, por lo que debe- mos hacer cálculos separados para los límites superior e inferior del intervalo de confianza. Si usted usa la tabla A-4 para encontrar los valores críticos, tenga en cuenta la siguiente ca- racterística de diseño de dicha tabla: En la tabla A-4, cada valor crítico de x2 en el cuerpo de la tabla corresponde a un área dada en la fila superior de la tabla, y cada área en esa fila superior es un área acumulada a la derecha del valor crítico.

334 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra PRECAUCIÓN La tabla A-2 para la distribución normal estándar proporciona áreas acu- muladas desde la izquierda, pero la tabla A-4 para la distribución ji cuadrada usa áreas acumuladas desde la derecha. EJEMPLO 1 Determinación de los valores críticos de x2 Se obtiene una muestra aleatoria simple de 22 puntuaciones de IQ (como en el ejemplo 2, que sigue). La construcción de un intervalo de confianza para la desviación estándar pobla- cional s requiere los valores críticos a la izquierda y a la derecha de x2 correspondientes a un nivel de confianza del 95% y un tamaño de muestra de n 5 22. Encuentre xL2 (el valor crítico de x2 que separa un área de 0.025 en la cola izquierda), y encuentre xR2 (el valor crí- tico de x2 que separa un área de 0.025 en la cola derecha). SOLUCIÓN V Con un tamaño de muestra de n 5 22, el número de grados de libertad es gl 5 n 2 1 5 21. Vea la figura 7-9. 0.025 0.025 0 x2L 5 10.283 x2R 5 35.479 x2 (gl 5 21) Tabla A-4: Tabla A-4: Use gl 5 21 y un Use gl 5 21 y un área acumulada a área acumulada a la derecha de 0.975. la derecha de 0.025. FIGURA 7-9 Determinación de valores críticos de x2 El valor crítico a la derecha (xR2 5 35.479) se obtiene de la tabla A-4 de manera directa al ubicar 21 en la columna de grados de libertad a la izquierda y 0.025 a lo largo de la fila superior. El valor crítico más a la izquierda de xL2 5 10.283 también corresponde a 21 en la columna de grados de libertad, pero debemos ubicar 0.975 (o 1 2 0.025) en la fila superior porque los valores en la fila superior siempre son áreas a la derecha del valor crítico. Consulte la figura 7-9 y vea que el área total a la derecha de xL2 5 10.283 es 0.975. SU TURNO Encuentre los valores críticos en el ejercicio 5 “Nicotina en cigarrillos mentolados”. Al obtener valores críticos de x2 con base en la tabla A-4, si no se encuentra un número de grados de libertad específico, usted puede ser conservador usando el siguiente número menor de grados de libertad, también puede usar el valor crítico más cercano en la tabla, o bien puede obtener un resultado aproximado mediante interpolación. Para cantidades de grados de libertad superiores a 100, use la ecuación dada en el ejercicio 23 “Determinación de valores críticos” en la página 342, también puede usar una tabla más extensa, o bien use tecnología.

7-3 Estimación de una desviación estándar o varianza poblacionales 335 Aunque s2 es la mejor estimación puntual de s2, no hay una indicación de cuán buena es, por lo que usamos un intervalo de confianza que nos proporciona un rango de valores asocia- dos con un nivel de confianza. ELEMENTOS CLAVE Intervalo de confianza para estimar una desviación estándar o varianza poblacionales Objetivo Construir una estimación del intervalo de confianza para una desviación estándar o varianza poblacionales. Notación s2 5 varianza poblacional s2 5 varianza muestral s 5 desviación estándar poblacional E 5 margen de error s 5 desviación estándar muestral xR2 5 valor crítico de la cola derecha de x2 n 5 número de valores muestrales xL2 5 valor crítico de la cola izquierda de x2 Requisitos 1. La muestra debe ser una muestra aleatoria simple. 2. La población debe tener valores normalmente distribuidos (incluso si la muestra es grande). El requisito de una distri- bución normal es mucho más estricto aquí que en las secciones anteriores, por lo que las grandes desviaciones de las distribuciones normales pueden generar grandes errores. (Si el requisito de normalidad no se cumple, use el método de bootstrap descrito en la sección 7-4). Intervalo de confianza para la varianza poblacional S2 (n - 1) s2 6 s2 6 (n - 1)s2 x2R x2L Intervalo de confianza para la desviación estándar poblacional S (n - 1) s2 (n - 1) s2 6 s 6 B x2L B xR2 Regla de redondeo 1. Datos originales: Cuando utilice el conjunto original de valores de datos, redondee los límites del intervalo de con- fianza a un lugar decimal más de lo usado en los datos originales. 2. Estadísticos de resumen: Cuando utilice los estadísticos de resumen (n, s), redondee los límites del intervalo de con- fianza al mismo número de decimales utilizados para la desviación estándar muestral. PRECAUCIÓN Un intervalo de confianza se puede expresar en un formato del tipo 11.0 < s < 20.4 o como (11.0, 20.4), pero no en un formato del tipo s 6 E. Procedimiento para construir un intervalo de confianza para s o s2 Los intervalos de confianza pueden construirse fácilmente con tecnología o bien utilizando la tabla A-4 con el siguiente procedimiento. 1. Verifique que se satisfagan los dos requisitos: La muestra es una muestra aleatoria de una población normalmente distribuida. continúa

336 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 2. Mediante el uso de n 2 1 grados de libertad, encuentre los valores críticos xR2 y x2L que corresponden al nivel de confianza deseado (como en el ejemplo 1). 3. Para obtener una estimación del intervalo de confianza de s2, use la siguiente expresión: 1n - 12s2 6 s2 6 1n - 12s2 x2R x2L 4. Para obtener una estimación del intervalo de confianza de s, calcule la raíz cuadrada de cada componente del intervalo de confianza anterior. 5. Redondee los límites del intervalo de confianza usando la regla de redondeo dada en el recuadro anterior de Elementos clave. Uso de intervalos de confianza para realizar comparaciones o pruebas de hipótesis Comparaciones Los intervalos de confianza pueden usarse de manera informal para com- parar la variación en diferentes conjuntos de datos, pero la superposición de los intervalos de confianza no debe usarse para formular conclusiones formales y finales sobre la igualdad de varianzas o desviaciones estándar. EJEMPLO 2 Intervalo de confianza para estimar S de puntuaciones de IQ El conjunto de datos 7 “IQ y plomo” en el apéndice B lista las puntuaciones de IQ para su- jetos en tres diferentes grupos de exposición al plomo. Las 22 puntuaciones totales de IQ para el grupo con exposición media al plomo (grupo 2) tienen una desviación estándar de 14.29263. Considere que la muestra es una muestra aleatoria simple y construya una esti- mación del intervalo de confianza del 95% para s, la desviación estándar de la población a partir de la cual se obtuvo la muestra. SOLUCIÓN V VERIFICACIÓN DE REQUISITOS Paso 1: Verifique los requisitos. (1) La muestra puede tratarse como una muestra aleatoria simple. (2) El histograma adjunto tiene una forma muy cercana a la forma de campana de una distribución normal, por lo que se cumple el requisito de normalidad. FrecuenciaMinitab 9 60 70 80 90 100 110 8 Puntaje de CI completo 7 6 5 4 3 2 1 0 50 Paso 2: Uso de tecnología El intervalo de confianza se puede encontrar usando algún software de estadística. La pantalla de StatCrunch muestra los límites inferior y superior del intervalo

7-3 Estimación de una desviación estándar o varianza poblacionales 337 de confianza para la estimación del intervalo de confianza del 95% para s2, por lo que ob- tenemos 120.9 < s2 < 417.2. Al obtener las raíces cuadradas, resulta 11.0 < s < 20.4 En cifras StatCrunch 1 minuto y 41 segundos: Tiempo medio que dura una llamada de Uso de la tabla A-4: Si usamos la tabla A-4, primero consideramos el tamaño de muestra servicio al cliente personalizado, n 5 22 para encontrar los grados de libertad: gl 5 n 2 1 5 21. En la tabla A-4, consulte la al llamar al número 800 de fila correspondiente a 21 grados de libertad, y las columnas con áreas de 0.975 y 0.025. (Para uno de los 100 principales un nivel de confianza de 95%, dividimos a 5 0.05 equitativamente entre las dos colas de la proveedores de Internet. distribución ji cuadrada (x2), y consultamos los valores de 0.975 y 0.025 en la fila superior de la tabla A-4). Los valores críticos son xL2 5 10.283 y xR2 5 35.479 (como se muestra en el ejemplo 1). Paso 3: Mediante el uso de los valores críticos de 10.283 y 35.479, la desviación estándar muestral s 5 14.29263 y el tamaño de la muestra de n 5 22, construimos el intervalo de confianza del 95% evaluando lo siguiente: 1n - 12s2 6 s2 6 1n - 12s2 xR2 xL2 122 - 12 114.292632 2 6 s2 6 122 - 12 114.292632 2 35.479 10.283 Paso 4: La evaluación de la expresión anterior resulta en 120.9 < s2 < 417.2. Al deter- minar la raíz cuadrada de cada parte (antes del redondeo), para después redondear a un decimal, se obtiene la siguiente estimación del intervalo de confianza del 95% para la desviación estándar poblacional: 11.0 < s < 20.4. I N T E R P R E TA C I Ó N Con base en este resultado, tenemos un 95% de confianza de que los límites de 11.0 y 20.4 contienen el verdadero valor de s. El intervalo de confianza también se puede expresar como (11.0, 20.4), pero no se puede expresar en un formato del tipo s 6 E. SU TURNO Encuentre el intervalo de confianza en el ejercicio 5 “Nicotina en cigarrillos mentolados”. Justificación del intervalo de confianza Vea la figura 7-9 en la página 334 para dar sentido a esta afirmación: si seleccionamos muestras aleatorias de tamaño n de una población distribuida normalmente con varianza s2, existe una probabilidad de 1 2 a de que el esta- dístico (n 2 1)s2>s2 se encuentre entre los valores críticos de xL2 y xR2. Se deduce que hay una probabilidad de 1 2 a de que las dos expresiones siguientes sean verdaderas: 1n - 12s2 6 xR2 y 1n - 12s2 7 xL2 s2 s2 Multiplique las dos desigualdades anteriores por s2, luego divida cada desigualdad entre el valor crítico adecuado de x2, de modo que ambas desigualdades puedan expresarse en es- tas formas equivalentes: 1n - 12s2 6 s2 y 1n - 12s2 7 s2 xR2 x2L continúa

338 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra TABLA 7-2 Determinación del Las dos desigualdades anteriores se pueden combinar en una desigualdad para obtener el tamaño de muestra formato del intervalo de confianza utilizado en esta sección: S - 12s2 - 12s2 xR2 xL2 del valor de S, 1n 6 s2 6 1n Para estar el tamaño de Determinación del tamaño de muestra 95% seguros muestra n debe de que s está Los procedimientos para encontrar el tamaño de muestra necesario para estimar s son mu- dentro de . . . ser al menos cho más complejos que los procedimientos proporcionados anteriormente para las medias de . . . y proporciones. Con poblaciones normalmente distribuidas, se puede usar la tabla 7-2 o la fórmula dada en el ejercicio 24 “Determinación del tamaño de muestra” en la página 342. 1% 19,205 Statdisk también proporciona tamaños de muestra. Con Statdisk, seleccione Analysis, 5% 768 Sample Size Determination y luego Estimate Standard Deviation. Minitab, Excel, StatCrunch y la calculadora TI-83>84 Plus no proporcionan tamaños de muestra. 10% 192 20% 48 30% 21 40% 12 50% 8 EJEMPLO 3 Determinación del tamaño de muestra para estimar s Para estar del valor de S, Queremos estimar la desviación estándar s de todas las puntuaciones de IQ de las personas 99% seguros con exposición al plomo. Deseamos tener el 99% de confianza de que nuestra estimación de que s está el tamaño de está dentro de 5% del valor real de s. ¿Qué tan grande debería ser la muestra? Suponga dentro de . . . muestra n debe que la población se distribuye normalmente. ser al menos SOLUCIÓN de . . . Podemos ver en la tabla 7-2 que el 99% de confianza y un error del 5% para s correspon- 1% 33,218 den a una muestra de tamaño 1336. Deberíamos obtener una muestra aleatoria simple de 1336 IQ de la población de sujetos expuestos al plomo. 5% 1,336 10% 336 20% 85 30% 38 40% 22 50% 14 SU TURNO Resuelva el ejercicio 19 “IQ de profesores de estadística”. CENTRO DE TECNOLOGÍA Estimación del intervalo de confianza para la desviación estándar o la varianza Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab Excel Intervalo de confianza Intervalo de confianza Ni Excel 1. Verifique que la distribución sea normal ni XLSTAT 1. Haga clic en Stat en el menú superior. tienen una usando Data—Normality Assessment. función para 2. Haga clic en Analysis en el menú superior. 2. Seleccione Basic Statistics en el menú desplegable generar una 3. Seleccione Confidence Intervals en el y seleccione 1 Variance en el submenú. estimación del intervalo de menú desplegable y seleccione Standard 3. Si utiliza estadísticos de resumen: seleccione Sam- confianza para Deviation One Sample en el submenú. ple standard deviation o Sample Variance del la desviación 4. Introduzca el nivel de confianza deseado. menú desplegable e ingrese el tamaño de muestra y estándar o la 5. Si utiliza estadísticos de resumen: selec- la desviación estándar o la varianza muestrales. varianza. cione la pestaña Use Summary Statistics e ingrese el tamaño de muestra y la des- Si utiliza datos muestrales: seleccione One or more viación estándar muestral. samples, each in a column del menú desplegable y seleccione la(s) columna(s) de datos deseada(s). Si utiliza datos muestrales: Seleccione la pestaña Use Data y seleccione la 4. Confirme que Perform hypothesis test no esté columna de datos deseada. marcada. 6. Haga clic en Evaluate. 5. Haga clic en el botón Options, ingrese el nivel de confianza deseado y, para Alternative Hypothesis, seleccione ?. 6. Haga clic en OK dos veces. Los resultados incluyen un intervalo de confianza para la desviación están- dar y otro para la varianza.

7-3 Estimación de una desviación estándar o varianza poblacionales 339 CENTRO DE TECNOLOGÍA continuación Estimación del intervalo de confianza para la desviación estándar o la varianza Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola StatCrunch Calculadora TI-83/84 Plus Intervalo de confianza 1. Descargue e instale los programas Michael Lloyd 1. Haga clic en Stat en el menú superior. S2INT y ZZINEWT (disponible en www.pearsonen 2. Seleccione Variance Stats en el menú desplegable, luego español.com>triola) en su calculadora TI-83>84 Plus. seleccione One Sample en el submenú. 2. Presione PRGM , seleccione S2INT en el menú y pre- 3. Si utiliza estadísticos de resumen: seleccione With Summary sione ENTER dos veces. en el submenú e ingrese la varianza muestral y el tamaño 3. Ingrese la varianza muestral Sx2, el tamaño de muestra n de muestra. y el nivel de confianza C-Level. Presione ENTER después de cada entrada. Si utiliza datos muestrales: seleccione With Data en el sub- menú y seleccione la(s) columna(s) de datos deseada(s). 4. Espere a que se muestre el intervalo de confianza sx2. 4. Seleccione Confidence Interval for S2 e ingrese el nivel de (Sea paciente, ¡puede llevar cierto tiempo!). confianza deseado. 5. ¡Haga clic en Compute! 5. Presione ENTER para ver el intervalo de confianza de sx. 7-3 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Volumen del cerebro Mediante el uso de todos los volúmenes cerebrales listados en el conjunto de datos 8 “IQ y tamaño del cerebro”, obtenemos la siguiente estimación del intervalo de confianza del 95%: 9027.8 < s2 < 33,299.8, y las unidades de medida son (cm3)2. Identifique la estimación del intervalo de confianza correspondiente para s e incluya las unidades apropiadas. Dado que los valores originales son números enteros, redondee los límites usando la regla de redondeo dada en esta sección. Escriba un enunciado que interprete correctamente la estimación del intervalo de confianza para s. 2. Expresión de intervalos de confianza El ejemplo 2 mostró cómo los datos estadísticos de n 5 22 y s 5 14.3 dan como resultado una estimación del intervalo de confianza del 95% para s: 11.0 < s < 20.4. Ese intervalo de confianza también se puede expresar como (11.0, 20.4), pero no se puede expresar como 15.7 6 4.7. Dado que 15.7 6 4.7 resulta en valores de 11.0 y 20.4, ¿por qué es incorrecto expre- sar el intervalo de confianza como 15.7 6 4.7? 3. Análisis del último dígito La gráfica de puntos que se presenta a continuación representa los últimos dígitos de los pesos de 153 hombres en el conjunto de datos 1 “Datos corporales”. ¿Será po- sible que esos dígitos procedan de una población normalmente distribuida? De no ser así, ¿el tamaño de muestra grande de n 5 153 justifica tratar los valores como si fueran de una distribución normal? ¿Se puede usar la muestra para construir una estimación del intervalo de confianza del 95% para la s poblacional de todos esos dígitos? 4. Requisito de normalidad ¿Qué diferencia hay entre el requisito de normalidad para una estima- ción del intervalo de confianza de s y el requisito de normalidad para una estimación del intervalo de confianza de m?

340 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra Determinación de valores críticos e intervalos de confianza. En los ejercicios 5 a 8, use la información dada para encontrar la cantidad de grados de libertad, los valores críticos xL2 y x2R, y la estimación del intervalo de confianza para S. Las muestras son del apéndice B y es razonable suponer que se ha seleccionado una muestra aleatoria simple de una población con una distribución normal. 5. Nicotina en cigarrillos mentolados 95% de confianza; n 5 25, s 5 0.24 mg. 6. Peso de los centavos 95% de confianza; n 5 37, s 5 0.01648 g. 7. Conteo de plaquetas de mujeres 99% de confianza; n 5 147, s 5 65.4. 8. Estaturas de hombres 99% de confianza; n 5 153, s 5 7.10 cm. Determinación de intervalos de confianza. En los ejercicios 9 a 16, suponga que cada muestra es una muestra aleatoria simple obtenida de una población con una distribución normal. 9. Temperatura corporal El conjunto de datos 3 “Temperaturas corporales” en el apéndice B incluye una muestra de 106 temperaturas corporales con una media de 98.20 °F y una desviación estándar de 0.62 °F (para el día 2 a las 12 AM). Construya una estimación del intervalo de confianza del 95% para la desviación estándar de las temperaturas corporales de toda la población. 10. Programa de pérdida de peso Atkins En una prueba a programas de pérdida de peso, 40 adultos utilizaron el programa de pérdida de peso Atkins. Después de 12 meses, su pérdida de peso promedio fue de 2.1 lb, con una desviación estándar de 4.8 lb. Construya una estimación del intervalo de con- fianza del 90% para la desviación estándar de la pérdida de peso de todos los sujetos. ¿El intervalo de confianza proporciona información sobre la efectividad de la dieta? 11. Tratamiento del insomnio Se realizó un ensayo clínico para probar la efectividad del fármaco zopiclona para tratar el insomnio en sujetos mayores. Después del tratamiento con zopiclona, 16 su- jetos tuvieron un tiempo de vigilia medio de 98.9 minutos y una desviación estándar de 42.3 minutos (de acuerdo con los datos de “Cognitive Behavioral Therapy vs Zopiclone for Treatment of Chronic Primary Insomnia in Older Adults”, de Sivertsen et al, en Journal of the American Medical Association, vol. 295, núm. 24). Suponga que los 16 valores muestrales parecen ser de una población distribuida normalmente y construya una estimación del intervalo de confianza del 98% para la desviación estándar de los tiempos de vigilia para una población con tratamientos de zopiclona. ¿El resultado indica si el tratamiento es efectivo? 12. Ajo para reducir el colesterol En una prueba de la efectividad del ajo para reducir el colesterol, 49 sujetos fueron tratados con ajo crudo. Los niveles de colesterol se midieron antes y después del trata- miento. Los cambios (antes menos después) en sus niveles de colesterol LDL (en mg>dL) tuvieron una media de 0.4 y una desviación estándar de 21.0 (según datos de “Effect of Raw Garlic vs Commercial Garlic Supplements on Plasma Lipid Concentrations in Adults with Moderate Hypercholesterolemia”, de Gardner et al., en Archives of Internal Medicine, vol. 167). Construya una estimación del intervalo de confianza del 98% para la desviación estándar de los cambios en el colesterol LDL después del trata- miento con ajo. ¿El resultado indica si el tratamiento es efectivo? 13. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió a los sujetos masculinos que calificaran el atractivo de sus citas femeninas, y una muestra de los resultados se detalla a continuación (1 5 no atractiva; 10 5 extremadamente atractiva). Construya una estimación del intervalo de confianza del 95% para la desviación estándar de la población a partir de la cual se obtuvo la muestra. 7 8 2 10 6 5 7 8 8 9 5 9 14. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió a las mujeres que calificaran el atractivo de sus citas masculinas, y una muestra de los resultados se detalla a continuación (1 5 no atractivo; 10 5 extremadamente atractivo). Construya una estimación del intervalo de confianza del 95% para la desviación estándar de la población a partir de la cual se obtuvo la muestra. 5 8 3 8 6 10 3 7 9 8 5 5 6 8 8 7 3 5 5 6 8 7 8 8 8 7 15. Velocidades en carretera A continuación se listan las velocidades (mi>h) medidas en el tráfico hacia el sur de la carretera I-280 cerca de Cupertino, California (según datos de SigAlert). Esta muestra

7-3 Estimación de una desviación estándar o varianza poblacionales 341 simple aleatoria se obtuvo a las 3:30 PM en un día laborable. Use los datos muestrales para construir una estimación del intervalo de confianza del 95% para la desviación estándar poblacional. ¿El interva- lo de confianza describe la desviación estándar para todas las horas de la semana? 62 61 61 57 61 54 59 58 59 69 60 67 16. Comparación de líneas de espera a. Los valores que se listan a continuación son los tiempos de espera (en minutos) de los clientes en el banco Jefferson Valley, donde los clientes ingresan a una sola fila de espera que alimenta tres ventani- llas. Construya un intervalo de confianza del 95% para la desviación estándar poblacional s. 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7 b. Los valores que se listan a continuación son los tiempos de espera (en minutos) de los clientes en el banco Providence, donde los clientes pueden ingresar a una de tres diferentes filas que se han formado en tres ventanillas. Construya un intervalo de confianza del 95% para la desviación estándar poblacional s. 4.2 5.1 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0 c. Interprete los resultados encontrados en los incisos (a) y (b). ¿Los intervalos de confianza sugieren una diferencia en la variación entre los tiempos de espera? ¿Qué arreglo parece mejor: el sistema de una sola fila o el sistema de varias filas? Grandes conjuntos de datos del apéndice B. En los ejercicios 17 y 18, use el conjunto de datos del apéndice B. Suponga que cada muestra es una muestra aleatoria simple obtenida de una pobla- ción con una distribución normal. 17. Evaluaciones de estudiantes Consulte el conjunto de datos 17 “Evaluaciones de cursos” en el apéndice B. a. Use las 93 evaluaciones de curso para construir una estimación del intervalo de confianza del 95% para la desviación estándar de la población de la que se obtuvo la muestra. b. Repita el inciso (a) usando las 93 evaluaciones a los profesores. c. Compare los resultados del inciso (a) y del inciso (b). 18. Pesos al nacer Consulte el conjunto de datos 4 “Nacimientos” en el apéndice B. a. Use los 205 pesos al nacer de niñas para construir una estimación del intervalo de confianza del 95% para la desviación estándar de la población de la que se obtuvo la muestra. b. Repita el inciso (a) usando los 195 pesos al nacer de niños. c. Compare los resultados del inciso (a) y del inciso (b). Determinación del tamaño de muestra. En los ejercicios 19 a 22, suponga que cada muestra es una muestra aleatoria simple obtenida de una población normalmente distribuida. Utilice la tabla 7-2 de la página 338 para encontrar el tamaño de muestra indicado. 19. IQ de profesores de estadística Usted desea estimar s para la población de puntuaciones de IQ de los profesores de estadística. Encuentre el tamaño mínimo de muestra necesario para estar 95% seguro de que la desviación estándar muestral s está dentro de 1% de s. ¿Es práctico este tamaño de la muestra? 20. Space Mountain Desea estimar s para la población de tiempos de espera para entrar a la atracción Space Mountain en Walt Disney World. Desea estar 99% seguro de que la desviación estándar muestral está dentro de 1% de s. Encuentre el tamaño de muestra mínimo. ¿Es práctico este tamaño de la muestra? 21. Ingresos de estudiantes de estadística Usted desea estimar la desviación estándar de los ingresos anuales de todos los estudiantes actuales de estadística. Encuentre el tamaño mínimo de muestra necesario para estar 95% seguro de que la desviación estándar de la muestra está dentro de 20% de la desviación es- tándar poblacional. ¿Es probable que esos ingresos satisfagan el requisito de tener una distribución normal? 22. Monedas de ¢25 Al establecer las especificaciones de las monedas de ¢25 que se aceptarán en una máquina expendedora, usted debe estimar la desviación estándar de la población de monedas de esa denominación en uso. Encuentre el tamaño de muestra mínimo necesario para estar seguro de que la desviación estándar muestral está dentro de 10% de la desviación estándar poblacional.

342 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 7-3 Más allá de lo básico 23. Determinación de valores críticos Al construir intervalos de confianza para s o s2, es posible utilizar la tabla A-4 para encontrar los valores críticos xL2 y x2R sólo para valores seleccionados de n hasta 101, por lo que el número de grados de libertad es 100 o menos. Para números más grandes de grados de libertad, podemos aproximar xL2 y x2R usando x2 = 1 3{ za>2 + 22k - 142 2 cdioónnde7-k1.esUesleneúsmtaearporodxeimgraacdioósndpearliabeenrtcaodnytrazra>l2oessvlaalopruenstucraíctiicóonszxc2LryítixcaR2 que se describió en la sec- en el ejercicio 8 “Estaturas de hombres”, donde el tamaño de muestra es 153 y el nivel de confianza es del 99%. ¿Cómo se compa- ran los resultados con los valores críticos reales de x2L 5 110.846 y xR2 5 200.657? 24. Determinación del tamaño de muestra En lugar de utilizar la tabla 7-2 con el fin de determinar el tamaño de muestra requerido para estimar una desviación estándar poblacional s, es posible emplear la siguiente fórmula n = 1 a za>2 2 2d b donde za>2 corresponde al nivel de confianza y d es la forma decimal del error porcentual. Por ejemplo, para estar 95% seguro de que s está dentro de 15% del valor de s, use za>2 5 1.96 y d 5 0.15 con el fin de obtener un tamaño de muestra n 5 86. Encuentre el tamaño de muestra requerido para estimar s, suponiendo que queremos tener un 98% de confianza de que s está dentro de 15% de s. 7-4 Bootstrap: Uso de la tecnología para realizar estimaciones Concepto clave Las secciones anteriores presentaron métodos para estimar proporciones, me- dias y desviaciones estándar (o varianzas) poblacionales. Todos estos métodos tienen ciertos re- quisitos que limitan las situaciones en las que se pueden usar. Cuando algunos de los requisitos no se cumplen, a menudo podemos usar el método bootstrap para estimar un parámetro con un intervalo de confianza. El método bootstrap normalmente requiere el uso de software. Requisito de muestreo Los métodos anteriores de este capítulo tienen todos un requisito de que la muestra debe ser una muestra aleatoria simple. Si la muestra no se recolecta de forma adecuada, existe una buena probabilidad de que no se pueda hacer nada para obtener una estimación útil del intervalo de confianza para un parámetro. Los métodos bootstrap no se corrigen para los malos métodos de muestreo. Requisitos A continuación se listan los importantes requisitos de las secciones anteriores de este capítulo: ■ IC para proporción (sección 7-1): Hay al menos 5 éxitos y al menos 5 fracasos, o np ≥ 5 y nq ≥ 5. ■ IC para media (sección 7-2): La población se distribuye normalmente o n > 30. ■ IC para S o S2 (sección 7-3): La población debe tener valores normalmente distribui- dos, incluso si la muestra es grande. Cuando los requisitos anteriores no se cumplen, no deberíamos utilizar los métodos presen- tados en las secciones previas de este capítulo, pero podemos emplear en su lugar el método bootstrap. Este método no requiere muestras grandes, ni que la muestra se recolecte a partir de una distribución normal o de cualquier otra distribución particular, por lo que se denomina método no paramétrico o libre de distribución; en el capítulo 13, se estudian otros méto- dos no paramétricos.

7-4 Bootstrap: Uso de la tecnología para realizar estimaciones 343 DEFINICIÓN ¿A cuántas personas Dada una muestra aleatoria simple de tamaño n, una muestra bootstrap es otra muestra conoce? aleatoria de n valores obtenidos con reemplazo de la muestra original. Es difícil para Sin reemplazo, cada muestra sería idéntica a la muestra original, por lo que las proporciones, cualquiera medias, desviaciones estándar o varianzas serían iguales, y no habría “intervalo” de confianza. contar el número de PRECAUCIÓN Tenga en cuenta que una muestra bootstrap implica muestrear con reem- personas que plazo, de modo que cuando se selecciona un valor muestral, se repite antes de realizar la conoce, pero siguiente selección. es posible utilizar métodos estadísticos EJEMPLO 1 Muestra bootstrap de ingresos para estimar el número medio de personas que todos conocemos. Cuando el autor recolectó los ingresos anuales de estudiantes de estadística actuales, ob- El enfoque simple de preguntar tuvo los siguientes resultados (en miles de dólares): 0, 2, 3, 7. a alguien a cuántas personas conoce no ha funcionado bien Muestra original Muestra bootstrap con anterioridad. Un enfoque 0 7 mucho más útil es seleccionar 2 2 una muestra representativa de 3 2 personas y preguntarle a cada 7 3 una a cuántas personas conoce que se llamen Mario, Ginny, La muestra de {7, 2, 2, 3} es una muestra bootstrap obtenida de la muestra original. Otras Rachel o Todd. (Los nombres muestras bootstrap pueden ser diferentes. poco comunes son más efectivos porque las personas con Los ingresos tienden a tener distribuciones asimétricas en lugar de ser normales, por lo nombres más típicos son difíciles que no deberíamos usar los métodos de la sección 7-2 con una pequeña muestra de ingre- de recordar con precisión). sos. Esta es una situación en la que el método bootstrap viene al rescate. Las respuestas se usan para proyectar el número total de SU TURNO Resuelva el ejercicio 3 “Muestra bootstrap”. personas que se conocen. (Si los sujetos de la muestra conocen ¿Por qué se llama “bootstrap”? El término “bootstrap” (que significa literalmente lengüeta de un promedio de 1.76 personas la bota) se utiliza porque los datos “se estiran a sí mismos por sus propias lengüetas” para generar con esos nombres, y sabemos nuevos conjuntos de datos. En los días de antaño, “jalarse a uno mismo por la lengüeta” sig- que 0.288% de la población nificaba que de alguna manera se lograba una tarea imposible, y el método bootstrap descrito tiene tales nombres, entonces en esta sección puede parecer imposible, ¡pero funciona! el número medio de personas conocidas es 1.76>0.00288 5 611). ¿Cuántos? Con el fin de proporcionar ejemplos manejables que no ocupen varias páginas Según una estimación, el número cada uno, los ejemplos en esta sección incluyen conjuntos de datos muy pequeños y no más medio de personas conocidas de 20 muestras bootstrap, pero deberíamos usar al menos 1000 muestras cuando usamos este es 611 y la mediana es 472. método en aplicaciones reales. Los estadísticos profesionales comúnmente usan 10,000 o (Vea “How Much People Do You más muestras bootstrap. Know?, Efficiently Estimating Personal Network Size”, de McCormick, Salganik y Zheng, en Journal of the American Statistical Association, vol. 105, núm. 4). Procedimiento bootstrap para estimar el intervalo de confianza de un parámetro 1. Dada una muestra aleatoria simple de tamaño n, obtenga muchas (como 1000 o más) muestras bootstrap del mismo tamaño n. 2. Para el parámetro que se estima, busque el estadístico correspondiente para cada una de las muestras bootstrap. (Ejemplo: para una estimación de confianza de m, encuentre la media muestral x de cada muestra bootstrap). 3. Clasifique la lista de estadísticos muestrales de menor a mayor. continúa

344 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 4. Con base en la lista ordenada de los estadísticos, cree el intervalo de confianza encon- trando los valores de percentil correspondientes. Los procedimientos para encontrar los percentiles se dan en la sección 3-3. (Ejemplo: Con base en una lista de medias muestrales ordenadas, los límites del intervalo de confianza del 90% son P5 y P95. La estimación del intervalo de confianza del 90% para m es P5 < m < P95). Utilidad de los resultados Con el fin de ilustrar el procedimiento bootstrap, los ejemplos 2, 3 y 4 implican muestras muy pequeñas con sólo 20 muestras bootstrap. En consecuencia, los intervalos de confianza resultantes incluyen casi todo el rango de valores muestrales, y esos intervalos de confianza no son muy útiles. Las muestras más grandes con 1000 o más mues- tras bootstrap proporcionarán resultados mucho mejores que las de los ejemplos 2, 3 y 4. Proporciones Cuando se trabaja con proporciones, es muy útil representar los datos de las dos categorías mediante el uso de 0 y 1, como en el siguiente ejemplo. EJEMPLO 2 Encuesta del color de ojos: IC bootstrap para la proporción En una encuesta, se preguntó a cuatro sujetos seleccionados al TABLA 7-3 Muestras bootstrap para p azar si tenían ojos marrones, y los resultados fueron: 0, 0, 1, 0 (donde 0 5 no y 1 5 sí). Use el procedimiento de remuestreo Muestra bootstrap pn pn ordenadas bootstrap para construir una estimación del intervalo de confianza del 90% para la proporción poblacional p, la proporción de perso- 1 0 0 1 0.50 0.00 P5 = 0.00 nas con ojos marrones en la población. 1 0 1 0 0.50 0.00 SOLUCIÓN V 0 1 1 1 0.75 0.00 VERIFICACIÓN DE REQUISITOS La muestra es una muestra alea- 0 0 0 0 0.00 0.00 toria simple. (No hay requisito de al menos 5 éxitos y al menos 5 fallas, o np ≥ 5 y nq ≥ 5. No hay requisito de que la muestra 0 1 0 0 0.25 0.25 deba provenir de una población distribuida normalmente). 1 0 0 0 0.25 0.25 Paso 1: En la tabla 7-3, creamos 20 muestras bootstrap de la muestra original 0, 0, 1, 0. 0 1 0 1 0.50 0.25 Paso 2: Como queremos una estimación del intervalo de con- 1 0 0 0 0.25 0.25 fianza para la proporción poblacional p, necesitamos la proporción muestral pˆ para cada una de las 20 muestras bootstrap, y esas pro- 0 0 0 0 0.00 0.25 90% de intervalo porciones muestrales se presentan en la columna más a la derecha 0 0 1 1 0.50 0.25 de confianza: de las muestras bootstrap. 0 0 0 1 0.25 0.25 0.00 6 p 6 0.75 Paso 3: La columna de datos que se muestra más a la derecha es una lista de las 20 proporciones muestrales ordenadas de menor a 0 0 1 0 0.25 0.25 mayor. 1 1 1 0 0.75 0.50 0 0 0 0 0.00 0.50 0 0 0 0 0.00 0.50 0 1 1 0 0.50 0.50 0 0 1 0 0.25 0.50 1 0 0 0 0.25 0.75 1 1 1 0 0.75 0.75 P95 = 0.75 0 0 0 1 0.25 0.75 Paso 4: Puesto que queremos un nivel de confianza del 90%, tenemos que encontrar los percentiles P5 y P95. Recuerde que P5 separa el 5% más bajo de los valores, y P95 separa el 5% más alto de los valores. Usando los métodos de la sección 3-3 para encontrar percentiles, empleamos la lista ordenada de proporciones muestrales bootstrap para encontrar que P5 5 0.00 y P95 5 0.75. La estimación del intervalo de confianza del 90% para la proporción poblacional es 0.00 < p < 0.75. I N T E R P R E TA C I Ó N El intervalo de confianza de 0.00 < p < 0.75 es bastante amplio. Después de todo, cada intervalo de confianza para cada proporción debe caer entre 0 y 1, por lo que el intervalo de confianza resultante no parece ser útil, pero se basa sólo en cuatro valores muestrales. SU TURNO Resuelva el ejercicio 5 “Compra en línea”.

7-4 Bootstrap: Uso de la tecnología para realizar estimaciones 345 SUGERENCIA: El ejemplo 2 utiliza sólo 20 muestras bootstrap, pero la aplicación efectiva del método requiere el uso de software para generar 1000 o más muestras bootstrap. Medias En la sección 7-2 observamos que cuando se construye una estimación del intervalo de con- fianza para una media poblacional, existe un requisito de que la muestra provenga de una po- blación normalmente distribuida o que el tamaño de la muestra sea mayor que 30. El método bootstrap se puede usar aun cuando tal requisito no esté satisfecho. EJEMPLO 3 Ingresos: IC bootstrap para la media Cuando el autor recolectó una muestra aleatoria simple de los ingresos anuales de sus estudiantes de estadística, obtuvo los siguientes resultados (en miles de dólares): 0, 2, 3, 7. Utilice el procedimiento de remuestreo bootstrap para construir una estimación del intervalo de confianza del 90% para el ingreso anual medio de la población de todos los estudiantes de esta- dística del autor. SOLUCIÓN V VERIFICACIÓN DE REQUISITOS La muestra es una muestra aleatoria simple y no existe el requisito de que la muestra deba provenir de una población distribuida normalmente. Debido a que las distribuciones de ingresos suelen ser asimétri- cas en lugar de normales, no deberíamos usar los métodos de la sección 7-2 para encontrar el intervalo de confianza, pero se puede usar el método bootstrap. Paso 1: En la tabla 7-4, creamos 20 muestras bootstrap (¡con TABLA 7-4 Muestras bootstrap para m reemplazo!) de la muestra original 0, 2, 3, 7. (Aquí usamos sólo 20 muestras bootstrap, por lo que tenemos un ejemplo manejable Muestra bootstrap x x ordenadas que no ocupará muchas páginas de texto, pero generalmente se requieren al menos 1000 muestras bootstrap). 3 3 0 2 2.00 1.75 P5 = 1.75 0 3 2 2 1.75 1.75 Paso 2: Como queremos una estimación del intervalo de con- fianza para la media poblacional m, necesitamos la media mues- 7 0 2 7 4.00 1.75 tral x para cada una de las 20 muestras bootstrap, y esas medias muestrales se presentan en la columna más a la derecha de la 3 2 7 3 3.75 2.00 tabla. 0 0 7 2 2.25 2.00 Paso 3: La columna de datos que se muestra más a la derecha es una lista de las 20 medias muestrales ordenadas de menor 7 0 0 3 2.50 2.25 a mayor. 3 0 3 2 2.00 2.50 Paso 4: Puesto que queremos un nivel de confianza del 90%, tenemos que encontrar los percentiles P5 y P95. Recuerde que P5 3 7 3 7 5.00 2.50 separa el 5% más bajo de los valores, y P95 separa el 5% más alto de los valores. Con base en los métodos de la sección 3-3 para 0 3 2 2 1.75 2.50 Intervalo de encontrar percentiles, usamos la lista ordenada de medias mues- confianza del 90%: trales bootstrap para encontrar que P5 5 1.75 y P95 5 4.875. La 0 3 7 0 2.50 2.75 estimación del intervalo de confianza del 90% para la media po- 0 7 2 2 2.75 3.00 1.75 6 m 6 4.875 blacional es 1.75 < m < 4.875, donde los valores se dan en miles 7 2 2 3 3.50 3.25 de dólares. 7 2 3 7 4.75 3.25 2 7 2 7 4.50 3.50 0 7 2 3 3.00 3.75 7 3 7 2 4.75 4.00 3 7 0 3 3.25 4.50 0 0 3 7 2.50 4.75 3 3 7 0 3.25 4.75 P95 = 4.875 2 0 2 3 1.75 5.00 SU TURNO Resuelva el ejercicio 7 “Novato 15”.

346 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra En cifras Desviaciones estándar En la sección 7-3 observamos que cuando se construyen estimaciones del intervalo de con- 61.68 °F es la temperatura fianza para las desviaciones estándar o varianzas poblacionales, existe el requisito de que global media en el mes de julio, la muestra debe provenir de una población con valores distribuidos normalmente. Incluso si la al momento de escribir estas muestra es grande, este requisito de normalidad es mucho más estricto que el utilizado para palabras. Este mes fue el mes estimar las medias poblacionales. En consecuencia, el método bootstrap se vuelve más im- más caluroso de la historia, portante para las estimaciones del intervalo de confianza de s o s2. según la Administración Nacional Oceánica y Atmosférica. EJEMPLO 4 Ingresos: IC bootstrap para la desviación estándar Considere los mismos ingresos (en miles de dólares) del ejemplo 3: 0, 2, 3, 7. Utilice el procedimiento de remuestreo bootstrap a fin de construir una estimación del intervalo de confianza del 90% para la desviación estándar poblacional s; es decir, la desviación están- dar de los ingresos anuales de los estudiantes de estadística del autor. SOLUCIÓN V VERIFICACIÓN DE REQUISITOS Aquí se aplica la misma verificación de requisitos utili- zada en el ejemplo 3. También se usa el mismo procedimiento básico. El ejemplo 3 ya incluye 20 muestras bootstrap, así que se encontrará la desviación estándar de cada muestra, y luego se clasifi- carán para obtener la lista ordenada de desviaciones estándar muestrales: 1.26 1.26 1.26 1.41 1.41 2.22 2.31 2.38 2.63 2.63 2.87 2.87 2.89 2.94 2.99 3.30 3.32 3.32 3.32 3.56 Los límites del intervalo de confianza del 90% se encuentran en esta lista ordenada de des- viaciones estándar mediante la determinación de P5 y P95. Con base en los métodos de la sección 3-3, obtenemos P5 5 1.26 y P95 5 3.44. La estimación del intervalo de confianza del 90% para la desviación estándar poblacional s es 1.26 < s < 3.44, donde los valores se dan en miles de dólares. SU TURNO Resuelva el inciso (b) del ejercicio 8 “Radiación del teléfono celular”. Una vez más, tenga en cuenta que, por razones prácticas, los ejemplos de esta sección incluyeron conjuntos de datos muy pequeños y no más de 20 muestras bootstrap, pero se recomienda utili- zar al menos 1000 muestras de este tipo. El uso de 10,000 o más muestras bootstrap es común. CENTRO DE TECNOLOGÍA Remuestreo bootstrap Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch 1. Ingrese los valores muestrales lis- Minitab aún no tiene una función 1. Ingrese los valores muestrales lista- tados en la columna 1 del editor de de bootstrap, pero las muestras dos en la columna var1. muestras. se pueden generar mediante una serie de comandos existentes en 2. Haga clic en Stat en el menú superior. 2. Haga clic en Analysis en el menú Minitab. superior y seleccione Bootstrap 3. Seleccione Resample-Statistic en el Resampling en el menú desplegable. Visite www.pearsonenespañol. menú desplegable. com>triola para obtener más in- 3. Ingrese la cantidad deseada de formación. 4. En Columns to resample, seleccione muestras bootstrap, luego haga clic var1. en Resample. 5. En Statistic haga clic en Build y 4. Las medias muestrales ordenadas cree la expresión deseada, como se listan en la columna 2; las des- mean(var1) o std(var1). Haga clic viaciones estándar muestrales or- en Okay cuando haya terminado. denadas se listan en la columna 3. 6. Complete el cuadro de diálogo y haga clic en Compute!

7-4 Bootstrap: Uso de la tecnología para realizar estimaciones 347 CENTRO DE TECNOLOGÍA continuación Remuestreo bootstrap Acceda a los complementos tecnológicos, videos y conjuntos de datos en www.pearsonenespañol.com/triola Calculadora TI-83/84 Plus Excel No disponible. Complemento XLSTAT (requerido) 1. Haga clic en la pestaña XLSTAT en la cinta de opciones y luego en Describing data. 2. Seleccione Resampled statistics en el menú desplegable. 3. En Quantitative Data introduzca el rango de celdas que contiene los valores muestrales. Si la primera fila contiene una etiqueta, marque la casilla Sample Labels. 4. En Method, seleccione Bootstrap. 5. Introduzca el número deseado de muestras. 6. Haga clic en la pestaña Outputs e ingrese el nivel de confianza (%) de 95; confirme que Standard bootstrap interval esté seleccionado. También seleccione Mean y Standard deviation (n 2 1). 7. Haga clic en OK. 7-4 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Sustitución ¿Por qué el método bootstrap requiere muestreo con reemplazo? ¿Qué sucedería si usáramos los métodos de esta sección pero muestreamos sin reemplazo? 2. Muestra bootstrap La siguiente es una muestra aleatoria de los tiempos de salida (min) para los vuelos de American Airlines en el aeropuerto JFK: 12, 19, 13, 43, 15. Para esta muestra, ¿cuál es una muestra bootstrap? 3. Muestra bootstrap Considere los datos muestrales del ejercicio 2, ¿cuál(es) de las siguientes op- ciones no son posibles muestras bootstrap? a. 12, 19, 13, 43, 15 b. 12, 19, 15 c. 12, 12, 12, 43, 43 d. 14, 20, 12, 19, 15 e. 12, 13, 13, 12, 43, 15, 19 4. ¿Cuántos? Los ejemplos en esta sección implican no más de 20 muestras bootstrap, ¿cuántos se deben usar en aplicaciones reales? En los ejercicios 5 a 8, use el número relativamente pequeño de muestras bootstrap proporciona- das para construir el intervalo de confianza. 5. Compras en línea En una encuesta del Centro de Investigación de Informes del Consumidor, a las mujeres se les preguntó si compraban libros en línea, y las respuestas incluían lo siguiente: no, sí, no, no. Si “sí” 5 1 y “no” 5 0, aquí hay diez muestras bootstrap para tales respuestas: 50, 0, 0, 06, 51, 0, 1, 06, 51, 0, 1, 06, 50, 0, 0, 06, 50, 0, 0, 06, 50, 1, 0, 06, 50, 0, 0, 06, 50, 0, 0, 06, 50, 1, 0, 06, 51, 1, 0, 06. Utilizando sólo las diez muestras bootstrap proporcionadas, construya una estimación del intervalo de confianza del 90% para la proporción de mujeres que afirman comprar libros en línea. 6. Elección del asiento En una encuesta de 3M Privacy Filters, se pidió a los encuestados que iden- tificaran su asiento favorito cuando vuelan, y el resultado incluye las siguientes respuestas: ventanilla, ventanilla, otro y otro. Sí “ventanilla” 5 1 y “otro” 5 0, las siguientes son diez muestras bootstrap para tales respuestas: 50, 0, 0, 06, 50, 1, 0, 06, 50, 1, 0, 16, 50, 0, 1, 06, 51, 1, 1, 06, 50, 1, 1, 06, 51, 0, 0, 16, 50, 1, 1, 16, 51, 0, 1, 06, 51, 0, 0, 16. Usando sólo las diez muestras bootstrap proporcio- nadas, construya una estimación del intervalo de confianza del 80% para la proporción de encuestados que indicaron que su asiento favorito es “ventanilla”. continúa

348 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 7. Novato 15 La siguiente es una muestra de los cambios de peso (kg) de estudiantes universitarios en su primer año (del conjunto de datos 6 “Novato 15” en el apéndice B): 11, 3, 0, 22, donde 22 repre- senta una pérdida de 2 kg y los valores positivos representan el peso ganado. A continuación se presentan diez muestras bootstrap: 511, 11, 11, 06, 511, 22, 0, 116, 511, 22, 3, 06, 53, 22, 0, 116, 50, 0, 0, 36, 53, 22, 3, 226, 511, 3, 22, 06, 522, 3, 22, 36, 522, 0, 22, 36, 53, 11, 11, 116. a. Usando sólo las diez muestras bootstrap proporcionadas, construya una estimación del intervalo de confianza del 80% para el cambio de peso medio en la población. b. Usando sólo las diez muestras bootstrap proporcionadas, construya una estimación del intervalo de confianza del 80% para la desviación estándar de los cambios de peso en la población. 8. Radiación del teléfono celular La siguiente es una muestra de las emisiones de radiación medi- das (cW>kg) para teléfonos celulares (según datos del Grupo de Trabajo Ambiental): 38, 55, 86, 145. A continuación se presentan diez muestras bootstrap: 538, 145, 55, 866, 586, 38, 145, 1456, 5145, 86, 55, 556, 555, 55, 55, 1456, 586, 86, 55, 556, 538, 38, 86, 866, 5145, 38, 86, 556, 555, 86, 86, 866, 5145, 86, 55, 866, {38, 145, 86, 556. a. Usando sólo las diez muestras bootstrap proporcionadas, construya una estimación del intervalo de confianza del 80% para la media poblacional. b. Usando sólo las diez muestras bootstrap proporcionadas, construya una estimación del intervalo de confianza del 80% para la desviación estándar poblacional. En los ejercicios 9 a 22 use la tecnología para crear la gran cantidad de muestras bootstrap. 9. Novato 15 Repita el ejercicio 7 “Novato 15” usando un nivel de confianza del 90% para los incisos (a) y (b) y empleando 1000 muestras bootstrap en lugar de las 10 que se dieron en ese ejercicio. 10. Radiación del teléfono celular Repita el ejercicio 8 “Radiación del teléfono celular” usando un nivel de confianza del 90% para los incisos (a) y (b) y empleando 1000 muestras bootstrap en lugar de las 10 que se dieron en ese ejercicio. 11. Citas rápidas Use las siguientes medidas masculinas del atractivo femenino dadas en el ejercicio 17 “Citas rápidas” de la sección 7-2 en la página 329: 7, 8, 2, 10, 6, 5, 7, 8, 8, 9, 5, 9. Use el método bootstrap con 1000 muestras. a. Construya una estimación del intervalo de confianza del 99% para la media de poblacional. ¿Es dramáticamente diferente el resultado del intervalo de confianza al 99% encontrado en el ejercicio 17 de la sección 7-2? b. Construya una estimación del intervalo de confianza del 95% para la desviación estándar poblacio- nal. ¿Es dramáticamente diferente el resultado del intervalo de confianza al 95% que se encontró en el ejercicio 13 “Citas rápidas” de la sección 7-3 en la página 340? 12. Citas rápidas Use las siguientes medidas femeninas del atractivo masculino dadas en el ejercicio 18 “Citas rápidas” de la sección 7-2 de la página 329: 5, 8, 3, 8, 6, 10, 3, 7, 9, 8, 5, 5, 6, 8, 8, 7, 3, 5, 5, 6, 8, 7, 8, 8, 8, 7. Use el método bootstrap con 1000 muestras. a. Construya una estimación del intervalo de confianza del 99% para la media poblacional. ¿Es dramática- mente diferente el resultado al intervalo de confianza del 99% encontrado en el ejercicio 18 de la sección 7-2? b. Construya una estimación del intervalo de confianza del 95% para la desviación estándar poblacio- nal. ¿Es dramáticamente diferente el resultado al intervalo de confianza del 95% que se encontró en el ejercicio 14 “Citas rápidas” de la sección 7-3 en la página 340? 13. Mickey D’s En un estudio sobre la precisión de los pedidos de comida rápida, McDonald’s tuvo 33 pedidos que no fueron precisos entre los 362 pedidos observados (según datos de la revista QSR). Utilice el método bootstrap para construir una estimación del intervalo de confianza del 95% para la proporción de pedidos que no son precisos. Use 1000 muestras bootstrap. ¿Cómo se compara el resul- tado con el intervalo de confianza encontrado en el ejercicio 13 “Mickey D’s” de la sección 7-1? 14. Eliquis El medicamento Eliquis (apixaban) se usa para ayudar a prevenir los coágulos en la sangre de ciertos pacientes. En los ensayos clínicos, entre 5924 pacientes tratados con Eliquis, 153 desarrollaron la reacción adversa de náuseas (según datos de Bristol-Myers Squibb Co.). Utilice el método bootstrap para construir una estimación del intervalo de confianza del 99% para la propor- ción de pacientes que experimentan náuseas. Use 1000 muestras bootstrap. ¿Cómo se compara este resultado con el intervalo de confianza encontrado en el ejercicio 14 “Eliquis” de la sección 7-1 en la página 312?

7-4 Bootstrap: Uso de la tecnología para realizar estimaciones 349 15. Tasa de retorno de la encuesta En un estudio sobre el uso de teléfonos celulares y el dominio hemisférico del cerebro, se envió un cuestionario por Internet a 5000 sujetos seleccionados aleatoriamente de un grupo otológico en línea (centrado en los oídos) y 717 encuestas fueron devueltas. Use el método bootstrap para construir una estimación del intervalo de confianza del 90% para la proporción de encues- tas devueltas. Use 1000 muestras bootstrap. ¿Cómo se compara este resultado con el del intervalo de con- fianza encontrado en el ejercicio 15 “Tasa de retorno de la encuesta” de la sección 7-1 en la página 312? 16. Negligencia médica En un estudio de 1228 demandas legales por negligencia médica seleccio- nadas aleatoriamente, se descubrió que 856 de ellas fueron descartadas o desechadas (con base en datos de la Asociación de Aseguradores de Médicos de EUA). Utilice el método bootstrap para construir una estimación del intervalo de confianza del 95% para la proporción de demandas que se descartan o des- echan. Use 1000 muestras bootstrap. ¿Cómo se compara este resultado con el del intervalo de confianza encontrado en el ejercicio 16 “Negligencia médica” de la sección 7-1 en la página 312? 17. Evaluaciones de estudiantes A continuación se listan las calificaciones dadas por estudiantes a sus cursos, donde una calificación de 5 equivale a “excelente”. Las calificaciones se obtuvieron en la Universidad de Texas en Austin. (Consulte el conjunto de datos 17 “Evaluaciones de cursos” en el apéndice B). Utilizando el método bootstrap con 1000 muestras, construya una estimación del intervalo de confianza del 90% para m. ¿Cómo se compara este resultado con el del intervalo de confianza encon- trado en el ejercicio 23 “Evaluaciones de estudiantes” de la sección 7-2 en la página 330? 3.8 3.0 4.0 4.8 3.0 4.2 3.5 4.7 4.4 4.2 4.3 3.8 3.3 4.0 3.8 18. Cafeína en bebidas refrescantes A continuación se listan las cantidades medidas de cafeína (mg por 12 onzas de bebida) obtenidas en una lata de cada una de 20 marcas. Utilizando el método bootstrap con 1000 muestras, construya una estimación del intervalo de confianza del 99% para m. ¿Cómo se compara este resultado con el del intervalo de confianza encontrado en el ejercicio 22 “Cafeína en bebidas refrescantes” de la sección 7-2 en la página 330? 0 0 34 34 34 45 41 51 55 36 47 41 0 0 53 54 38 0 41 47 19. Old Faithful Use los siguientes tiempos de duración de las erupciones del Old Faithful (en segundos): 125 203 205 221 225 229 233 233 235 236 236 237 238 238 239 240 240 240 240 241 241 242 242 242 243 243 244 245 245 245 245 246 246 248 248 248 249 249 250 251 252 253 253 255 255 256 257 258 262 264 a. Utilice el método bootstrap con 1000 muestras para encontrar una estimación del intervalo de con- fianza del 95% para m. b. Encuentre la estimación del intervalo de confianza del 95% para m determinada mediante los méto- dos de la sección 7-2. c. Compare los resultados. 20. Old Faithful Repita el ejercicio 19 “Old Faithful” usando la desviación estándar en lugar de la media. Compare el intervalo de confianza que se encontraría usando los métodos de la sección 7-3. Si los dos intervalos de confianza son muy diferentes, ¿cuál es mejor? ¿Por qué? 21. Análisis de los últimos dígitos El peso de varios encuestados se registró como parte de la En- cuesta Entrevista de Salud en California. A continuación se listan los últimos dígitos de los pesos de 50 encuestados seleccionados al azar. 5010205050385050560000008 5504500400000809530500058 a. Utilice el método bootstrap con 1000 muestras a fin de encontrar una estimación del intervalo de confianza del 95% para s. b. Encuentre la estimación del intervalo de confianza del 95% para s determinada mediante los méto- dos de la sección 7-3. c. Compare los resultados. Si los dos intervalos de confianza son diferentes, ¿cuál es mejor? ¿Por qué? 22. Análisis de los últimos dígitos Repita el ejercicio 21 “Análisis de los últimos dígitos” utilizando la media en vez de la desviación estándar. Compare el intervalo de confianza con el que se encontraría usando los métodos de la sección 7-2.

350 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 7-4 Más allá de lo básico 23. Efecto del número de muestras bootstrap Repita el ejercicio 21 “Análisis de los últimos dígi- tos” utilizando 10,000 muestras bootstrap en lugar de 1000. ¿Qué sucede? 24. Formas de distribución Use los datos muestrales que se proporcionan en el ejercicio 21 “Análisis de los últimos dígitos”. a. ¿Los valores muestrales originales parecen ser de una población distribuida normalmente? Explique. b. ¿Las 1000 muestras bootstrap parecen tener medias que provienen de una población distribuida normalmente? Explique. c. ¿Las 1000 muestras bootstrap parecen tener desviaciones estándar que provienen de una población distribuida normalmente? Explique. Examen rápido del capítulo 1. Celebridades y la ley A continuación se presenta una estimación del intervalo de confianza del 95% para la proporción de adultos que dicen que la ley es permisiva para las celebridades: 0.692 < p < 0.748 (según datos de una encuesta de Rasmussen Reports). ¿Cuál es la mejor estimación puntual de la pro- porción de adultos en la población que dice que la ley es permisiva para las celebridades? 2. Interpretación del IC Escriba un enunciado breve que interprete correctamente el intervalo de confianza dado en el ejercicio 1 “Celebridades y la ley”. 3. Valor crítico Para la encuesta descrita en el ejercicio 1 “Celebridades y la ley”, encuentre el valor crítico que se usaría para construir una estimación del intervalo de confianza del 99% para la proporción poblacional. 4. Cambio suelto USA Today informó que 40% de las personas encuestadas planeaba usar el cambio suelto acumulado para pagar algunas cuentas. El margen de error se dio como 63.1 puntos porcentua- les. Identifique el intervalo de confianza que corresponde a esa información. 5. Tamaño de muestra para la proporción Encuentre el tamaño de muestra requerido para estimar el porcentaje de estudiantes universitarios que toman un curso de estadística. Suponga que queremos un 95% de confianza de que la proporción muestral se encuentre dentro de cuatro puntos porcentuales del porcentaje real poblacional. 6. Tamaño de muestra para la media Encuentre el tamaño de muestra requerido para estimar el IQ promedio de músicos profesionales. Suponga que queremos un 98% de confianza de que la media muestral se encuentre dentro de tres puntos de IQ de la media real poblacional. También suponga que s 5 15. 7. Requisitos Un analista de control de calidad ha recolectado una muestra aleatoria de 12 baterías de teléfonos inteligentes y planea probar su nivel de voltaje y construir una estimación del intervalo de confianza del 95% para el nivel de voltaje medio en la población de baterías. ¿Qué requisitos se deben cumplir para construir el intervalo de confianza usando el método de la distribución t? 8. Grados de libertad En general, ¿a qué se refieren los “grados de libertad”? Para los datos muestra- les descritos en el ejercicio 7 “Requisitos”, encuentre la cantidad de grados de libertad, suponiendo que se desea construir una estimación del intervalo de confianza de m usando la distribución t. 9. Valor crítico Consulte el ejercicio 7 “Requisitos” y suponga que se cumplen los requisitos. Encuen- tre el valor crítico que se usaría para construir una estimación del intervalo de confianza del 95% para m usando la distribución t. 10. ¿Qué método? Consulte el ejercicio 7 “Requisitos” y suponga que la muestra de 12 niveles de voltaje parece ser de una población con una distribución que está sustancialmente lejos de ser normal. ¿Debería construirse una estimación del intervalo de confianza del 95% para s usando la distribución x2? De no ser así, ¿qué otro método se podría emplear para encontrar una estimación del intervalo de confianza del 95% para s?

CAPÍTULO 7 Ejercicios de repaso 351 Ejercicios de repaso 1. Noticias en línea En una encuesta de Harris aplicada a 2036 adultos, el 40% dijo que prefieren recibir sus noticias en línea. Construya una estimación del intervalo de confianza del 95% para el por- centaje de todos los adultos que dicen que prefieren recibir sus noticias en línea. ¿Podemos decir con seguridad que menos del 50% de los adultos prefieren recibir sus noticias en línea? 2. Computadoras Con el fin de planificar mejor los recursos de los estudiantes, el presidente del departamento de matemáticas del Broward College quiere calcular el porcentaje de estudiantes que poseen una computadora. Si deseamos estimar ese porcentaje según los resultados de la encuesta, ¿a cuántos estudiantes debemos aplicar la encuesta para tener el 90% de confianza de que estamos dentro de cuatro puntos porcentuales desde el porcentaje poblacional? Suponga que el número de estudiantes es muy grande. 3. Magnitudes de sismos A continuación se listan las magnitudes en la escala Richter de sismos seleccionados al azar. a. Identifique la mejor estimación puntual de la media poblacional m. b. Construya una estimación del intervalo de confianza del 95% para la magnitud media de la población de sismos. c. Escriba un enunciado que interprete el intervalo de confianza. 3.09 2.76 2.65 3.44 3.01 2.94 3.45 2.72 2.69 2.89 2.71 2.76 4. Zurdos Se han llevado a cabo varios estudios en un intento por identificar las formas en que las personas zurdas son diferentes de los diestros. Suponga que desea calcular el IQ medio de todos los adultos zurdos. ¿Cuántos adultos zurdos al azar deben ser evaluados para estar 99% seguros de que el IQ medio del grupo muestral está dentro de cuatro puntos desde el IQ medio de todos los adultos zur- dos? Suponga que se sabe que s es 15. 5. Distribuciones Identifique la distribución (normal, t de Student, ji cuadrada) que debe usarse en cada una de las siguientes situaciones. Si no se puede usar ninguna de las tres distribuciones, ¿qué otro método podría emplearse? a. Al construir un intervalo de confianza para m, usted tiene 75 valores muestrales y parecen provenir de una población con una distribución asimétrica. Se desconoce la desviación estándar de la población. b. Al construir una estimación del intervalo de confianza para m, usted tiene 75 valores muestrales y parecen provenir de una población con una distribución asimétrica. Se sabe que la desviación estándar poblacional es de 18.2 cm. c. Al construir una estimación del intervalo de confianza para s, usted tiene 75 valores muestrales y parecen provenir de una población con una distribución asimétrica. d. Al construir una estimación de intervalo de confianza para s, usted tiene 75 valores muestrales y parecen pertenecer a una población con distribución normal. e. Al construir una estimación del intervalo de confianza para p, usted tiene 1200 encuestados y el 5% respondió “sí” a la primera pregunta. 6. Tamaño de muestra Su nuevo empleador lo ha contratado para encuestar adultos sobre sus sus- cripciones a periódicos impresos. a. Si desea calcular el porcentaje de adultos que tienen una suscripción pagada a un periódico impreso, ¿a cuántos adultos debe encuestar si desea un 95% de confianza de que su porcentaje tenga un margen de error de tres puntos porcentuales? b. Si desea estimar la cantidad media que gastaron los adultos en periódicos impresos durante el año pasado, ¿a cuántos adultos debe encuestar si desea un 95% de confianza de que su promedio muestral tenga un error no mayor a $5? (Según los resultados de un estudio piloto, suponga que la desviación estándar de los montos gastados en periódicos impresos en el último año es de $47). c. Si planea obtener las estimaciones descritas en los incisos (a) y (b) con una sola encuesta que tenga varias preguntas, ¿cuántos adultos deben ser encuestados?

352 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 7. Precisión de relojes de pulsera Los estudiantes del autor recopilaron datos que miden la precisión de los relojes de pulsera. Los siguientes tiempos (en segundos) muestran la discrepancia entre la hora real y la hora indicada en el reloj de pulsera. Los valores negativos corresponden a los relojes que están atrasados. Los datos parecen ser de una población normalmente distribuida. Construya una estimación del intervalo de confianza del 95% para la discrepancia media de la población de relojes de pulsera. 285 325 20 305 293 15 282 27 555 570 2241 36 8. Precisión de relojes de pulsera Use los datos muestrales del ejercicio 7 “Precisión de relojes de pulsera” y construya una estimación del intervalo de confianza del 95% para s. 9. Bootstrap para la precisión de relojes de pulsera Repita el ejercicio 7 “Precisión de relojes de pulsera” utilizando 1000 muestras bootstrap. 10. IC para la proporción En una encuesta de TE Connectivity aplicada a 1000 adultos seleccionados al azar, el 2% dijo que “no sabían” si se sentirían cómodos estando en un vehículo autónomo. Existe la necesidad de construir una estimación del intervalo de confianza del 95% para la proporción de todos los adultos en la población que no saben si se sentirían cómodos. a. Encuentre el intervalo de confianza usando la distribución normal como una aproximación a la dis- tribución binomial. b. Encuentre el intervalo de confianza usando 1000 muestras bootstrap. c. Compare los resultados. Ejercicios de repaso acumulado Llegadas de vuelos. A continuación se listan los tiempos de retraso en la llegada (minutos) de algunos vuelos de American Airlines seleccionados al azar que volaron desde JFK en Nueva York hasta LAX en Los Ángeles. Los valores negativos corresponden a los vuelos que llegaron antes de la hora de llegada programada. Use estos valores para los ejercicios 1 a 4. 230 223 14 221 232 11 223 28 103 219 25 246 1. Estadísticos Encuentre la media, la mediana, la desviación estándar y el rango. ¿Los resultados son estadísticos o parámetros? 2. Regla práctica del rango Utilice los resultados del ejercicio 1 “Estadísticos” con la regla práctica del rango para encontrar los tiempos de llegada que separan aquellos que son significativamente bajos y significativamente altos. ¿El tiempo de retraso en la llegada de 103 min es significativamente alto? 3. Nivel de medición ¿Cuál es el nivel de medición (nominal, ordinal, de intervalo, de razón) de estos datos? ¿Los tiempos de llegada originales no redondeados son datos continuos o discretos? 4. Intervalo de confianza Construya una estimación del intervalo de confianza del 95% para el tiempo medio de retraso en la llegada de la población de todos los vuelos de American Airlines desde JFK a LAX. 5. Distribución normal Mediante el uso de un conjunto de datos mayor que el dado para los ejerci- cios 1 a 4, suponga que los retrasos en la llegada de las líneas aéreas se distribuyen normalmente con una media de 25.0 minutos y una desviación estándar de 30.4 minutos. a. Encuentre la probabilidad de que un vuelo seleccionado aleatoriamente tenga un tiempo de retraso en la llegada de más de 15 minutos. b. Encuentre el valor de Q3, el tiempo de retraso en la llegada que es el tercer cuartil. 6. Tamaño de muestra Encuentre el tamaño de muestra necesario para calcular el tiempo medio de retraso en la llegada de todos los vuelos de American Airlines desde JFK a LAX. Suponga que quere- mos un 95% de confianza de que la media muestral tenga un error no mayor de 5 minutos. Con base en una muestra más grande que la dada para los ejercicios 1 a 4, suponga que todos los tiempos de retraso en la llegada tienen una desviación estándar de 30.4 minutos. 7. Llegadas a tiempo De acuerdo con la Oficina de Transporte, American Airlines tuvo una tasa de llegada a tiempo del 80.3% para un año determinado. Suponga que esta estadística se basa en una muestra de 1000 vuelos de American Airlines seleccionados al azar. Encuentre una estimación del intervalo de confianza del 99% para el porcentaje de todos los vuelos de American Airlines que llegan a tiempo.

CAPÍTULO 7 Proyecto de tecnología 353 8. Evaluación de la normalidad Una muestra aleatoria consiste en 48 tiempos (en minutos) reque- ridos para la salida (despegue) de los vuelos de American Airlines. Todos los vuelos son de American Airlines de Nueva York (JFK) a Los Ángeles y todos ocurrieron en enero de un año reciente. A conti- nuación se representan los 48 tiempos de salida en un histograma y en una gráfica cuantilar normal. Con base en esas gráficas, ¿se puede inferir que los tiempos de salida son de una población con distribución normal? Dé una explicación de la distribución que se muestra. ¿Se puede inferir que los tiempos de sali- da satisfacen los requisitos necesarios para la construcción de una estimación del intervalo de confianza para la desviación estándar poblacional de todos esos tiempos? Frecuencia Puntuación z Valores x Tiempo de salida (minutos) Proyecto de tecnología Profundidades de sismos El conjunto de datos 21 “Terremotos” en el apéndice B incluye las pro- fundidades (en km) de las fuentes de 600 terremotos. Use tecnología para lo siguiente. a. Encuentre la media y la desviación estándar de las 600 profundidades. b. Genere un histograma y una gráfica cuantilar normal de las 600 profundidades. ¿Parece que las pro- fundidades son de una población que tiene una distribución normal? Explique. c. Si se desea obtener una estimación del intervalo de confianza del 95% para la profundidad de todos los terremotos, ¿se cumplen los requisitos para usar una distribución t? Explique. d. Encuentre una estimación del intervalo de confianza del 95% para la profundidad de todos los terre- motos utilizando la distribución t. e. Encuentre una estimación del intervalo de confianza del 95% para la profundidad de todos los sismos utilizando 1000 muestras bootstrap. f. Compare los resultados de los incisos (d) y (e). ¿Qué intervalo de confianza parece ser mejor? ¿Por qué? DE LOS DATOS A LA DECISIÓN 3. Explique por qué estaría bien, o no, que un periódico hiciera esta afirmación: “Con base en los resultados de una encuesta Pensamiento crítico: ¿Qué nos dice la encuesta? reciente, más de 3 de cada 4 adultos conocen Twitter”. Las encuestas se han convertido en una parte integral de nues- tras vidas. Debido a que es tan importante que cada ciudadano 4. Suponga que usted es un reportero. Escriba una descripción tenga la capacidad de interpretar los resultados de este tipo de de los resultados de la encuesta para su periódico. estudios, las encuestas son el foco del presente proyecto. El Pew Research Center llevó a cabo recientemente una encuesta aplicada a 1007 adultos de EUA y descubrió que 85% de los encuestados conocen Twitter. Análisis de los datos 1. Use los resultados de la encuesta para construir una estima- ción del intervalo de confianza del 95% para el porcentaje de todos los adultos que conocen Twitter. 2. Identifique el margen de error para esta encuesta.

354 CAPÍTULO 7 Estimación de parámetros y determinación del tamaño de la muestra 5. Una crítica común a las encuestas es que sondean sólo un por- 6. Con referencia a otro estudio, el presidente de una compañía centaje muy pequeño de la población y, por lo tanto, no pueden escribió a Associated Press sobre una encuesta nacional de 1223 ser precisas. ¿Tiene una muestra de sólo 1007 adultos tomada sujetos; él escribió: de una población de todos los adultos un tamaño demasiado pequeño? Escriba una breve explicación de por qué el tamaño Cuando usted u otra persona intenta decirme a mí y a mis de muestra de 1007 es demasiado pequeño, o no. socios que 1223 personas explican nuestras opiniones y gustos aquí en EUA, ¡me vuelvo loco! ¡Cómo se atreve! Cuando usted o alguien más me dice que 1223 personas representan a EUA, es asombroso e injusto y debería estar prohibido. El autor de esa carta insiste más adelante que, dado que el tamaño de muestra de 1223 personas representa a 120 millones de personas, su carta representa a 98,000 (120 millones divididos por 1223) que comparten las mismas opiniones. ¿Está usted de acuerdo o en desacuerdo con esta afirmación? Escriba una res- puesta que respalde o refute el enunciado. Actividades de cooperación en grupo 1. Actividad fuera de clase Recopile datos muestrales y use los métodos de este capítulo para cons- truir estimaciones del intervalo de confianza para los parámetros poblaciones. A continuación se dan algunas sugerencias de parámetros: y Proporción de estudiantes en su universidad que pueden levantar una ceja sin levantar la otra. y Edad media de los autos manejados por estudiantes de estadística y>o la edad media de los autos manejados por el profesorado. y Longitud media de las palabras en los editoriales del New York Times y longitud media de las palabras en los editoriales del periódico local. y Proporción de estudiantes en su universidad que pueden identificar correctamente al presidente, vice- presidente y secretario de estado. y Proporción de estudiantes en su universidad que tienen más de 18 años y están registrados para votar. y Edad media de los estudiantes de tiempo completo en su universidad. y Tiempo medio en horas que los estudiantes de su universidad estudian cada semana. y Proporción de autos de estudiantes pintados de blanco. y Proporción de autos que son rojos. 2. Actividad en clase Sin utilizar ningún dispositivo de medición, cada alumno debe dibujar una línea de 3 pulgadas de longitud y otra de 3 cm de largo. Luego use reglas para medir y registrar las longitudes de las líneas dibujadas. Encuentre las medias y las desviaciones estándar de los dos conjuntos de longi- tudes. Use los datos muestrales con el fin de construir un intervalo de confianza para la longitud de la línea estimada en 3 pulgadas, y luego haga lo mismo para la longitud de la línea estimada en 3 cm. ¿Los límites del intervalo de confianza realmente contienen la longitud correcta? Compare los resultados. ¿Las líneas estimadas en 3 pulgadas parecen ser más precisas que las líneas de 3 cm? 3. Actividad en clase Suponga que un método de selección de género puede afectar la probabilidad de que un bebé sea niña, de modo que la probabilidad sea de 1>4. Cada estudiante debe simular 20 nacimientos escogiendo 20 cartas de un paquete de naipes barajado. Reemplace cada carta después de escogerla, luego vuelva a barajarla. Considere que los corazones son niñas y que todas las demás cartas son niños. Después de hacer 20 selecciones y registrar los “géneros” de los bebés, construya una estimación del intervalo de confianza para la proporción de niñas. ¿El resultado parece ser eficaz para

CAPÍTULO 7 Actividades de cooperación en grupo 355 identificar el verdadero valor de la proporción poblacional? (Si no hay paquetes de naipes disponibles, use alguna otra forma para simular los nacimientos, por ejemplo use el generador de números aleatorios en una calculadora o use los dígitos de los números telefónicos o los números de Seguridad Social). 4. Actividad fuera de clase En grupos de tres o cuatro estudiantes deben asistir a la biblioteca y recolectar una muestra que consista en las edades de los libros (según las fechas de copyright). Piense y describa el procedimiento de muestreo, ejecute ese procedimiento y luego use los resultados para construir una estimación del intervalo de confianza de la edad media de todos los libros en la biblioteca. 5. Actividad en clase Cada estudiante debe escribir una estimación de la edad del actual presidente de EUA. Todas las estimaciones deben recolectarse, para después calcular la media y la desviación estándar muestrales. Luego use los resultados para construir un intervalo de confianza. ¿Los límites del intervalo de confianza contienen la edad correcta del presidente? 6. Actividad en clase Debe diseñarse un proyecto en clase para un ensayo en el que cada estudiante pruebe el sabor de Coca-Cola y Pepsi. Luego, se le pedirá al estudiante que identifique cuál muestra es Coca-Cola. Después de recopilar todos los resultados, analice la afirmación de que la tasa de éxito es mejor que la esperada con estimaciones aleatorias. 7. Actividad en clase Cada estudiante debe estimar la longitud del aula. Los valores deben basarse en estimaciones visuales, sin tomar medidas reales. Una vez recolectadas las estimaciones, construya un intervalo de confianza y luego mida la longitud real. ¿El intervalo de confianza contiene la longitud verdadera del aula? ¿Hay una “sabiduría colectiva”, debido a la cual la media de la clase es aproxima- damente igual a la longitud real del aula? 8. Actividad en clase Divídanse en grupos de tres o cuatro. Examinen una muestra de diferentes te- mas de una revista actual y encuentren la proporción de páginas que incluyen publicidad. Con base en los resultados, construyan una estimación del intervalo de confianza del 95% para el porcentaje de todas las páginas que tienen publicidad. Comparen sus resultados con los de otros grupos. 9. Actividad en clase Divídanse en grupos de dos. Primero encuentren el tamaño de muestra reque- rido para estimar la proporción de veces que aparece cara al lanzar una moneda, suponiendo que desea un 80% de confianza de que la proporción muestral esté dentro de 0.08 desde la proporción poblacional verdadera. Luego, lancen una moneda el número requerido de veces y registren sus resultados. ¿Qué porcentaje de los intervalos de confianza debería contener realmente el valor de la proporción pobla- cional, que sabemos es p 5 0.5? Verifiquen este último resultado comparando su intervalo de confianza con los intervalos de confianza encontrados en otros grupos. 10. Actividad fuera de clase Identifique un tema de interés general y coordínese con todos los miem- bros de la clase para realizar una encuesta. En lugar de realizar una encuesta “científica” utilizando principios sólidos de selección aleatoria, utilice una muestra de conveniencia que incluya a los sujetos que estén disponibles, como amigos, parientes y otros estudiantes. Analice e interprete los resultados. Identifique la población. Describa las deficiencias de usar una muestra de conveniencia e intente identi- ficar cómo una muestra de sujetos seleccionados al azar de la población podría ser diferente. 11. Actividad fuera de clase Cada estudiante debe encontrar un artículo en una revista profesional que incluya un intervalo de confianza del tipo discutido en este capítulo. Redacte un breve informe que describa el intervalo de confianza y su papel en el contexto del artículo.

8-1 Fundamentos de las pruebas de hipótesis 8-2 Prueba de una hipótesis respecto a una proporción 8-3 Prueba de una hipótesis respecto a una media 8-4 Prueba de una hipótesis respecto a una desviación estándar o varianza 8 4PRUEBAS DE HIPÓTESIS PROBABILITY PROBLEMA Drones: ¿La mayoría de los consumidores se sentirían incómodos DEL si sus compras les fueran entregadas por drones? CAPÍTULO Las décadas recientes han traído consigo avances notables en Podemos usar métodos estadísticos para analizar encues- tecnología, incluyendo drones, dispositivos GPS, teléfonos inte- tas y así evaluar e implementar de mejor manera las nuevas ligentes, televisión de alta definición, dispositivos de seguridad tecnologías. En una encuesta de Pitney Bowes, se preguntó a biométricos y el interruptor de luz activado por aplausos. Para 1009 consumidores si se sentirían cómodos si sus compras les aprovechar las tecnologías más avanzadas, Amazon ha estado fueran entregadas por drones, y 54% (o 545) de ellos respon- desarrollando Amazon Prime Air, que utiliza drones para entre- dieron con un “no”. Con base en el resultado de esta encuesta, gar paquetes a sus clientes en 30 minutos o menos. El uso de es razonable afirmar que la mayoría de los consumidores no se los drones para esta actividad ha generado mucha discusión y sienten cómodos con que sus compras les sean entregadas por debate. drones, pero ¿los resultados de la encuesta realmente justifican 356

Objetivos del capítulo 357 esa afirmación? Después de todo, los encuestadores obtuvieron que p > 0.5, que es la forma simbólica de la afirmación verbal respuestas de sólo 1009 consumidores entre los 247,696,327 de que la mayoría (más de la mitad o 0.5) de los consumidores consumidores de Estados Unidos. no se sienten cómodos con las entregas realizadas por drones. Este capítulo presentará los métodos estándar para probar La afirmación de que la mayoría de los consumidores no dichas hipótesis. Con este conocimiento estaremos mejor se sienten cómodos con las entregas realizadas por drones se preparados para responder a la pregunta de si estamos listos puede abordar utilizando el método de las pruebas de hipóte- para aceptar drones como vehículos de entrega. sis que se presenta en este capítulo. Tenemos la afirmación de OBJETIVOS DEL CAPÍTULO Los objetivos del capítulo son: 8-1 Fundamentos de las pruebas de hipótesis • Desarrollar la capacidad de identificar las hipótesis nula y alternativa cuando se da alguna afirmación sobre un parámetro poblacional (como una proporción, media, desviación estándar o varianza). • Desarrollar la capacidad de calcular un dato estadístico de prueba, encontrar valores críticos, calcular valores P y establecer una conclusión final sobre la hipótesis original. A continuación se listan los componentes que debe incluir una prueba de hipótesis: • Enunciados de las hipótesis nula y alternativa expresados en forma simbólica • Valor del dato estadístico de prueba • Selección de la distribución muestral que se utilizará para la prueba de hipótesis • Identificación de un valor P y/o el(los) valor(es) crítico(s) • Declaración de una conclusión que rechace la hipótesis nula o no la rechace • Declaración de una conclusión final que utilice términos simples y no técnicos sobre la hipótesis original 8-2 Prueba de una hipótesis respecto a una proporción • Desarrollar la capacidad de utilizar datos muestrales para realizar una prueba de hipó- tesis formal de una afirmación acerca de una proporción poblacional. El procedimiento debe incluir los componentes listados anteriormente en los objetivos de la sección 8-1. 8-3 Prueba de una hipótesis respecto a una media • Desarrollar la capacidad de utilizar datos muestrales para realizar una prueba de hipó- tesis formal de una afirmación acerca de una media poblacional. El procedimiento debe incluir los mismos componentes listados anteriormente en los objetivos de la sección 8-1. 8-4 Prueba de una hipótesis respecto a una desviación estándar o varianza • Desarrollar la capacidad de utilizar datos muestrales para realizar una prueba de hipótesis formal de una afirmación de una desviación estándar o varianza poblacionales. El procedimiento debe incluir los mismos componentes listados anteriormente en los objetivos de la sección 8-1.

358 CAPÍTULO 8 Pruebas de hipótesis 8-1 Fundamentos de las pruebas de hipótesis Concepto clave En esta sección presentamos los componentes clave de una prueba de hipóte- sis formal. Los conceptos en esta sección son generales y se aplican a las pruebas de hipótesis que involucran proporciones, medias, desviaciones estándar o varianzas. En la parte 1 comen- zamos con el “panorama general” para comprender el enfoque básico subyacente a las prue- bas de hipótesis. Luego describimos las hipótesis nulas y alternativas, el nivel de significancia, los tipos de pruebas (de dos colas, de cola izquierda, de cola derecha), el estadístico de prueba, el valor P, los valores críticos y las conclusiones. En la parte 2, describimos los tipos de erro- res (tipo I y tipo II). En la parte 3, puntualizamos la potencia de una prueba de hipótesis. PARTE 1 Conceptos básicos de las pruebas de hipótesis Comenzamos con dos definiciones muy básicas. DEFINICIONES En estadística, una hipótesis es una afirmación o declaración sobre una propiedad de una población. Una prueba de hipótesis (o prueba de significancia) es un procedimiento para probar una hipótesis sobre una propiedad de una población. La “propiedad de una población” a la que se hace referencia en las definiciones anteriores suele ser el valor de un parámetro poblacional, por lo que a continuación se dan algunos ejemplos de hipótesis típicas: ■ m < 98.6 °F “La temperatura corporal media de los humanos es menor que 98.6 °F”. ■ p > 0.5 “La proporción de consumidores que no se sienten cómodos con las entregas realizadas por drones es mayor que 0.5”. ■ s 5 15 “La población de estudiantes universitarios tiene puntuaciones de IQ con una desviación estándar de 15”. EJEMPLO 1 La mayoría de los consumidores no se sienten cómodos con las entregas realizadas por drones Considere la afirmación del problema del capítulo de que “la mayoría de los consumidores no se sienten cómodos con las entregas realizadas por drones”. Si se usa p para expresar la proporción de consumidores que no se sienten cómodos con las entregas mediante drones, la declaración de “mayoría” es equivalente a la afirmación de que la proporción es mayor que la mitad, o p > 0.5. La expresión p > 0.5 es la forma simbólica de la afirmación origi- nal. (En el problema del capítulo, una encuesta a 1009 consumidores incluyó un 54% que afirmaron no sentirse cómodos con las entregas mediante drones). Panorama general En el ejemplo 1, tenemos la afirmación de que la proporción poblacional p es tal que p > 0.5. Entre 1009 consumidores, ¿cuántos necesitamos para obtener una cantidad significativamente alta de consumidores que no se sienten cómodos con la entrega mediante drones? Un resultado de 506 (o 50.1%) es apenas más de la mitad, por lo que resulta claro que 506 no es significativamente alto. Es evidente que un resultado de 1006 (o 99.1%) es significativamente alto. Pero ¿qué pasa con el resultado de 545 (o 54.0%) que se obtuvo en realidad en la encuesta de Pitney Bowes? ¿Es 545 (o 54.0%) significativamente alto? El método de las pruebas de hipótesis nos permite responder a esa pregunta clave.

8-1 Fundamentos de las pruebas de hipótesis 359 Uso de la tecnología Es fácil obtener resultados de las pruebas de hipótesis usando tecnolo- gía. Las pantallas siguientes muestran los resultados de cuatro tecnologías diferentes, por lo que podemos usar computadoras o calculadoras para hacer todo el esfuerzo de cálculo. Al examinar las cuatro pantallas, vemos algunos elementos comunes. Todos muestran un “estadístico de prueba” z 5 2.55 (redondeado), y todos incluyen un “valor P” de 0.005 (re- dondeado). Estos dos resultados son importantes, pero la comprensión del procedimiento de la prueba de hipótesis tiene una importancia crucial. Concéntrese en comprender cómo funciona el procedimiento de la prueba de hipótesis y aprenda la terminología asociada. Sólo entonces los resultados de la tecnología tendrán sentido. Statdisk Minitab TI-83@84 Plus StatCrunch Significancia Las pruebas de hipótesis también se llaman pruebas de significancia. En la sec- ción 4-1 usamos las probabilidades para determinar cuándo los resultados muestrales son sig- nificativamente bajos o significativamente altos. Este capítulo formaliza esos conceptos en un procedimiento unificado que se aplica con frecuencia en diferentes campos. La figura 8-1 de la página siguiente resume los procedimientos utilizados en dos métodos ligeramente diferen- tes para realizar una prueba de hipótesis formal. Procederemos a realizar una prueba formal de la hipótesis del ejemplo 1: p > 0.5. Para probar tal hipótesis n, utilizaremos los datos mues- trales de la encuesta citada en el problema del capítulo, con x 5 545 consumidores que no se sienten cómodos con el envío mediante drones, entre n 5 1009 consumidores encuestados. Pasos 1, 2 y 3: uso de la afirmación original para crear una hipótesis nula H0 y una hipótesis alternativa H1 El objetivo de los pasos 1, 2 y 3 es identificar la hipótesis nula y la hipótesis alternativa de modo que la prueba de hipótesis formal incluya estos componentes estándar que se usan con frecuencia en muchas disciplinas diferentes. La hipótesis nula incluye el supuesto de trabajo para los propósitos de realización de la prueba de hipótesis. DEFINICIONES La hipótesis nula (expresada mediante H0) es una afirmación de que el valor de un pará- metro poblacional (por ejemplo la proporción, la media o la desviación estándar) es igual a algún valor declarado. La hipótesis alternativa (expresada por H1 o Ha o HA) es una afirmación de que el pará- metro tiene un valor que difiere en alguna forma de la hipótesis nula. Para los métodos de este capítulo, la forma simbólica de la hipótesis alternativa debe usar uno de los siguien- tes símbolos: <, >, Þ.

360 CAPÍTULO 8 Pruebas de hipótesis 1. Identifique la afirmación FIGURA 8-1 Identifique la afirmación que será probada y exprésela en forma simbólica. Procedimiento para las pruebas de hipótesis 2. Proporcione la forma simbólica Proporcione la forma simbólica que debe ser verdadera cuando la afirmación original sea falsa. 3. Identifique las hipótesis nula y alternativa Considere las dos expresiones simbólicas obtenidas hasta ahora: • La hipótesis alternativa H1 es la que NO contiene igualdad, por lo que H1 usa el símbolo ., , o Þ. • La hipótesis nula H0 es la expresión simbólica de que el parámetro es igual al valor fijo bajo consideración. 4. Seleccione el nivel de significancia Seleccione el nivel de significancia A en función de la gravedad de un error de tipo I. Haga A pequeño si las consecuencias de rechazar una H0 verdadera son severas. • Son muy comunes los valores de 0.05 y 0.01. 5. Identifique el estadístico de prueba Identifique el estadístico de prueba que sea relevante para la prueba y determine su distribución muestral (por ejemplo normal, t, ji cuadrada). Método del valor P Método de valor crítico 6. Encuentre los valores 6. Determine los valores Encuentre el valor del estadístico de prueba Encuentre el valor del estadístico de prueba y el valor P (vea la figura 8-3). Trace una y de los valores críticos. Trace una gráfica que gráfica y muestre el estadístico de prueba muestre el estadístico de prueba, los valores y el valor P. críticos y la región crítica. 7. Tome una decisión 7. Tome una decisión • Rechace H0 si el valor P # a. • Rechace H0 si el estadístico de prueba está • No rechace H0 si el valor P . a. en la región crítica. • No rechace H0 si el estadístico de prueba no está en la región crítica. 8. Exprese de nuevo la decisión en términos no técnicos Exprese de nuevo la decisión previa en términos simples, no técnicos y en relación con la afirmación original. Método del intervalo de confianza Tabla 8-1 Nivel de confianza para el intervalo de confianza Elabore un intervalo de confianza con un nivel de Nivel de 0.01 Prueba de Prueba de confianza seleccionado en la tabla 8-1. significancia 0.05 dos colas una cola para una prueba 0.10 Debido a que una estimación del intervalo de confianza de hipótesis 99% 98% para un parámetro poblacional contiene los valores 95% 90% probables de ese parámetro, rechace una afirmación 90% 80% de que el parámetro poblacional tiene un valor que no está incluido en el intervalo de confianza.

8-1 Fundamentos de las pruebas de hipótesis 361 El término nulo se usa para indicar que no hay cambio, o que no hay ningún efecto o ninguna diferencia. La prueba de hipótesis se realiza suponiendo que el parámetro es igual a un valor específico para que podamos trabajar con una sola distribución que tenga un valor específico. Ejemplo: La siguiente es una hipótesis nula que involucra una proporción: H0: p 5 0.5 Ejemplo: Las siguientes son tres hipótesis alternativas que involucran proporciones: H1: p > 0.5 H1: p < 0.5 H1: p ≠ 0.5 Dada la afirmación en el ejemplo 1 de que “la mayoría de los consumidores no se sienten cómodos con la entrega mediante drones”, podemos aplicar los pasos 1, 2 y 3 en la figura 8-1 de la siguiente manera. Paso 1: Identifique la afirmación que se va a probar y exprésela en forma simbólica. Si p expresa la probabilidad de seleccionar un consumidor incómodo con la entrega mediante drones, la afirmación de que “la mayoría están incómodos con la entrega mediante drones” puede expresarse simbólicamente como p > 0.5. Paso 2: Proporcione la forma simbólica que debe ser verdadera cuando la afirmación original sea falsa. Si la afirmación original de p > 0.5 es falsa, entonces p ≤ 0.5 debe ser verdadera. Paso 3: Esta etapa consta de dos partes: la identificación de la hipótesis alternativa H1 y la identificación de la hipótesis nula H0. • Identificación de H1: Mediante el uso de las dos expresiones simbólicas p > 0.5 y p ≤ 0.5, la hipótesis alternativa H1 es la que no contiene igualdad. De las dos expresiones, p > 0.5 no contiene igualdad, entonces obtenemos H1: p > 0.5 • Identificación de H0: La hipótesis nula H0 es la expresión simbólica de que el parámetro es igual al valor fijo bajo consideración, por lo que obtenemos H0: p 5 0.5 Los primeros tres pasos conducen a las hipótesis nula y alternativa: H0: p 5 0.5 (hipótesis nula) H1: p > 0.5 (hipótesis alternativa) Nota sobre la formación de sus propias afirmaciones (Hipótesis) Si usted está realizando un estudio y desea utilizar una prueba de hipótesis para respaldar su afirmación, ésta debe redactarse de modo que se convierta en la hipótesis alternativa (y se pueda expresar utili- zando sólo los símbolos <, > o Þ). No puede sostener una aformación de un parámetro es igual a un valor específico. Paso 4: Seleccione el nivel de significancia a DEFINICIONES El nivel de significancia A para una prueba de hipótesis es el valor de probabilidad uti- lizado como punto de corte para determinar cuándo la evidencia muestral es suficiente- mente significativa contra la hipótesis nula. Por su naturaleza, el nivel de significancia a es la probabilidad de rechazar erróneamente la hipótesis nula cuando es verdadera: Nivel de significancia A 5 P (rechazar H0 cuando es verdadera) El nivel de significancia a es igual al que se presentó en la sección 7-1, donde definimos el “valor crítico”. Las opciones típicas para a son 0.05, 0.01 y 0.10; siendo 0.05 la más común.

362 CAPÍTULO 8 Pruebas de hipótesis En cifras Paso 5: Identifique el estadístico relevante para la prueba y determine su distribución muestral (por ejemplo normal, t o X2) 140,000,000,000,000,000,000 millas: La distancia hasta la que En la tabla 8-2 se listan los parámetros junto con las distribuciones muestrales correspon- un humano puede ver a simple dientes. vista. Lo que usted ve es luz de hace 2.4 millones de años. Ejemplo: La afirmación p > 0.5 trata sobre la proporción poblacional p; por lo tanto, use la distribución normal, siempre que se cumplan los requisitos. (Con n 5 1009, p 5 0.5 y q 5 0.5 del ejemplo 1, np ≥ 5 y nq ≥ 5 son verdaderas). TABLA 8-2 Distribución muestral Requisitos Estadístico de prueba Parámetro p 2p Normal (z) np $ 5 y nq $ 5 Proporción p z5 pq Media m t s desconocida y población n distribuida normalmente Media m Normal (z) o x 2m s desconocida y n . 30 t5 Des. est. s x2 o varianza s2 s conocida y población s distribuida normalmente n o s conocida y n . 30 x 2m z5 s Requisito estricto: población normalmente distribuida n x2 5 ( n 2 1) s2 s2 Paso 6: Encuentre el valor del dato estadístico de prueba, después determine el valor P o el(los) valor(es) crítico(s) DEFINICIÓN El dato estadístico de prueba es eulnevsatalodrísuttiiclizoamduoeasltrtoaml (acromunoapnd,ex_coisisó)nesnoubnrea la hipóte- sis nula. Se encuentra al convertir puntua- ción (como z, t o x2) con el supuesto de que la hipótesis nula es verdadera. En este capítulo usamos los datos estadísticos de prueba listados en la última columna de la tabla 8-2. Ejemplo: En el ejemplo 1 hay una afirmación sobre la proporción poblacional p, y tenemos n 5 1009 y x 5 545, entonces pˆ 5 x͞n 5 0.540. Con la hipótesis nula H0: p 5 0.5, esta- mos trabajando con el supuesto de que p 5 0.5, y se sigue que q 5 1 2 p 5 0.5. Podemos evaluar el dato estadístico de prueba como se muestra a continuación (o bien usando soft- ware). El dato estadístico de prueba z 5 2.55 en cada una de las pantallas presentadas anterior- mente es más preciso que el resultado de z 5 2.54 mostrado a continuación. (Si reemplazamos 0.540 por 545/1009 5 0.54013875, obtenemos z 5 2.55). p 2p 0.540 2 0.5 5 2.54 z 5 pq 5 ( 0.5)( 0.5) n 1009 Para determinar el valor P y/o el(los) valor(es) crítico(s) se requiere que primero consi- deremos si la prueba de hipótesis es de dos colas, de cola izquierda o de cola derecha, según se describe a continuación.
































Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook