13-5 Prueba de Kruskal-Wallis para tres o más muestras 629 mayor que el nivel de significancia de 0.05, no podemos rechazar la hipótesis nula de las medianas poblacionales iguales. Valor crítico Consulte la tabla A-4 para encontrar el valor crítico de 5.991, que corres- ponde a 2 grados de libertad y un nivel de significancia de 0.05 (con un área de 0.05 en la cola derecha). La figura 13-4 muestra que el dato estadístico de prueba H 5 0.694 no cae dentro de la región crítica limitada por 5.991, por lo que no podemos rechazar la hipótesis nula de las medianas poblacionales iguales. La figura 13-4 muestra el dato estadístico de prueba H 5 0.694 y el valor crítico x2 5 5.991. (La distribución ji cuadrada tiene la forma general que se muestra en la figura 13-4 cuando el número de grados de libertad es 1 o 2). El dato estadístico de prueba no se encuentra en la región crítica, por lo que no podemos rechazar la hipótesis nula de las me- dianas iguales 0 0.05 H 5 0.694 Valor crítico: 5.991 FIGURA 13-4 Distribución ji cuadrada para el ejemplo 1 I N T E R P R E TA C I Ó N No hay evidencia suficiente para rechazar la afirmación de que las tres muestras de pun- tuaciones de IQ del desempeño provienen de poblaciones con medianas que son todas iguales. Las medianas poblacionales no parecen ser significativamente diferentes. SU TURNO Resuelva el ejercicio 5 “Citas rápidas”. Justificación: El dato estadístico de prueba H de Kruskal-Wallis es la versión del rango del dato estadístico de prueba F utilizado en el análisis de varianza discutido en el capítulo 12. Cuando tratamos con los rangos R en lugar de los valores originales x, muchos componentes están predeterminados. Por ejemplo, la suma de todos los rangos se puede expresar como N(N 1 1)>2, donde N es el número total de valores en todas las muestras combinadas. La expresión H = 12 12 Σni1Ri - R2 2 N1N + donde Ri = Ri y R = ΣRi ni Σni combina las varianzas ponderadas de los rangos para producir el dato estadístico de prueba H dado aquí, y esta expresión para H es algebraicamente equivalente a la expresión proporcio- nada anteriormente como el dato estadístico de prueba.
630 CAPÍTULO 13 Pruebas no paramétricas CENTRO DE TECNOLOGÍA Prueba de Kruskal-Wallis Acceda a los complementos tecnológicos, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch 1. Haga clic en Analysis 1. Liste todos los datos muestrales en la columna 1. Haga clic en Stat en el menú en el menú superior. C1 e identifique la muestra (usando nombres o superior. números) para el valor correspondiente en una 2. Seleccione Kruskal- segunda columna C2. 2. Seleccione Nonparametrics en Wallis Test en el menú el menú desplegable y Krus- desplegable. • Para los datos de la tabla 13-6 de esta sec- kal-Wallis en el submenú. ción, ingrese los 19 valores muestrales en C1 3. Ingrese un nivel de sig- y en C2 ingrese ocho 1s, seguidos por seis 3. Seleccione las columnas que se nificancia y seleccione 2s y cinco 3s. utilizarán en el análisis. las columnas que se incluirán en el análisis. 2. Haga clic en Stat en el menú superior. 4. Marque Adjust for ties en la Opciones. 4. Haga clic en Evaluate. 3. Seleccione Nonparametrics en el menú desplega- ble y seleccione Kruskal-Wallis en el submenú. 5. Haga clic en Compute! 4. Para la respuesta, seleccione la columna C1 y SUGERENCIA: Si marca el ajuste para para el factor seleccione la columna C2. empates, obtendrá resultados más precisos que pueden ser diferentes de 5. Haga clic en OK. los que se muestran en esta sección del libro. Calculadora TI-83/84 Plus Excel Requiere los programas KWTEST y ZZRANK (disponibles en Complemento XLSTAT (requerido) www.pearsonenespañol.com/triola) 1. Haga clic en la pestaña XLSTAT en la 1. Los datos deben ingresarse como columnas en la Matriz A: cinta de opciones y luego haga clic en Nonparametric tests. Introducción manual de datos: presione 2ND luego x–1 para ir al menú MATRIX, seleccione EDIT en el menú superior, seleccione [A] y presione 2. Seleccione Comparison of k samples ENTER . Ingrese el número de filas y columnas necesarias, presione ENTER del menú desplegable. y proceda a ingresar los valores muestrales. 3. En el recuadro de muestras, ingrese el Uso de listas existentes: Las listas se pueden combinar y almacenar en la rango de datos para los valores muestra- Matriz A. Presione 2ND luego x–1 para ir al menú MATRIX, seleccione les. Si el rango incluye etiquetas, marque MATH en el menú superior y seleccione el elemento List : matr. Ingrese la casilla de Column labels. los nombres de la lista seguidos por el nombre de la matriz [A], todos se- parados por comas. Importante: El nombre de la matriz debe ingresarse 4. Seleccione One column per sample en presionando 2ND luego x–1 , seleccionando [A], y presionando .ENTER el formato de los datos. El siguiente es un resumen de los comandos utilizados para crear una matriz a partir de tres listas (L1, L2, L3): List : matr(L1, L2, L3, [A]). 5. Marque solamente la opción de Krus- kal-Wallis. 2. Presione PRGM , seleccione KWTEST y presione ENTER dos veces. Se proporcionará el valor del dato estadístico de prueba H y la cantidad de 6. Haga clic en la pestaña Options. grados de libertad. Consulte la tabla A-4 para encontrar el valor crítico. 7. Ingrese un nivel de significancia y marque SUGERENCIA: Si las muestras tienen diferentes tamaños, algunas de las entradas la casilla de Asymptotic p-value. de la matriz serán ceros. Si alguno de los valores de datos originales es cero, agregue una constante conveniente a todos los valores muestrales para que no haya ceros en- 8. Haga clic en OK. tre los valores de datos originales. 13-5 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Citas rápidas En la parte superior de la página siguiente se muestran las calificaciones de los atributos de los hombres, otorgadas por las mujeres que participaron en eventos de citas rápidas (del conjunto de datos 18 “Citas rápidas” en el apéndice B). Al utilizar la prueba de Kruskal-Wallis, debe- mos clasificar todos los datos combinados, para después determinar la suma de los rangos para cada muestra. Encuentre la suma de los rangos para cada una de las tres muestras.
13-5 Prueba de Kruskal-Wallis para tres o más muestras 631 Edad 20-22 38 42 30.0 39 47 43 33 31 32 28 Edad 23-26 39 31 36.0 35 41 45 36 23 36 20 Edad 27-29 36 42 35.5 27 37 34 22 47 36 32 2. Requisitos Supongamos que queremos utilizar los datos del ejercicio 1 con la prueba de Krus- kal-Wallis. ¿Se satisfacen los requisitos? Explique. 3. Notación Para los datos proporcionados en el ejercicio 1, identifique los valores de n1, n2, n3 y N. 4. Eficiencia Consulte la tabla 13-2 en la página 600 e identifique la eficiencia de la prueba de Krus- kal-Wallis. ¿Qué nos dice ese valor sobre la prueba? Uso de la prueba de Kruskal-Wallis. En los ejercicios 5 a 8, use la prueba de Kruskal-Wallis. 5. Citas rápidas Utilice los datos muestrales del ejercicio 1 para probar la afirmación de que las mu- jeres de los diferentes grupos de edad otorgan calificaciones de atributos con la misma mediana. Use un nivel de significancia de 0.05. 6. Arsénico en el arroz A continuación se listan las cantidades de arsénico en muestras de arroz in- tegral de tres estados. Las cantidades se dan en microgramos de arsénico y todas las muestras tienen el mismo tamaño de porción. Los datos provienen de la Administración de Alimentos y Medicamentos de Estados Unidos. Use un nivel de significancia de 0.01 para probar la afirmación de que las tres muestras provienen de poblaciones con la misma mediana. Arkansas 4.8 4.9 5.0 5.4 5.4 5.4 5.6 5.6 5.6 5.9 6.0 6.1 California 1.5 3.7 4.0 4.5 4.9 5.1 5.3 5.4 5.4 5.5 5.6 5.6 Texas 5.6 5.8 6.6 6.9 6.9 6.9 7.1 7.3 7.5 7.6 7.7 7.7 7. Mediciones de accidentes automovilísticos Utilice las siguientes medidas listadas de desace- leración del cofre (en g, donde g es la fuerza de la gravedad) a partir de muestras de automóviles pe- queños, medianos y grandes. (Estos valores provienen del conjunto de datos 19 “Pruebas de colisión de automóviles” en el apéndice B). Use un nivel de significancia de 0.05 para probar la afirmación de que las diferentes categorías de tamaño tienen la misma desaceleración media del cofre en la prueba de colisión estándar. ¿Los datos sugieren que los autos más grandes son más seguros? Pequeños 44 39 37 54 39 44 42 Medios 36 53 43 42 52 49 41 Grandes 32 45 41 38 37 38 33 8. Consumo de combustible en carretera A continuación se listan los consumos de combustible en carretera (mi>gal) para automóviles categorizados de acuerdo con su tamaño: pequeño, mediano y grande (del conjunto de datos 20 “Mediciones de automóviles” en el apéndice B). Utilizando un nivel de significancia de 0.05, pruebe la afirmación de que las tres categorías de tamaño tienen el mismo consumo mediano de combustible en carretera. ¿El tamaño de un automóvil parece afectar el consumo de combustible en la carretera? Pequeños 28 26 23 24 26 24 25 Medios 28 31 26 30 28 29 31 Grandes 34 36 28 40 33 35 26 Conjuntos de datos del apéndice B. En los ejercicios 9 a 12, use la prueba de Kruskal-Wallis con los datos del apéndice B. 9. Tiempos de servicio de comida rápida en la hora de la cena El conjunto de datos 25 “Comida rápida” en el apéndice B lista los tiempos de servicio (en segundos) para cenas en los establecimientos de comida rápida McDonald’s, Burger King y Wendy’s. Utilizando un nivel de significancia de 0.05, pruebe la afirmación de que las tres muestras provienen de poblaciones con la misma mediana. 10. Fumadores pasivos y activos El conjunto de datos 12 “Fumadores pasivos y activos” en el apéndice B lista los niveles de cotinina medidos en una muestra de sujetos que fuman, otra muestra de sujetos que no fuman pero están expuestos al humo de tabaco ambiental y una tercera muestra de sujetos que no fuman y no están expuestos al humo de tabaco ambiental. La cotinina se produce cuando continúa
632 CAPÍTULO 13 Pruebas no paramétricas el cuerpo absorbe nicotina. Use un nivel de significancia de 0.01 para probar la afirmación de que las tres muestras provienen de poblaciones con la misma mediana. ¿Qué sugieren los resultados sobre un fumador que argumenta que absorbe tanta nicotina como las personas que no fuman? 11. Pesos al nacer El conjunto de datos 4 “Nacimientos” en el apéndice B lista el peso al nacer de bebés nacidos en el Albany Medical Center, el Bellevue Hospital en la ciudad de Nueva York, el Olean General Hospital y el Strong Memorial Hospital en Rochester, Nueva York. Use un nivel de significan- cia de 0.05 para probar la afirmación de que los cuatro diferentes hospitales tienen distintas medianas de los pesos al nacer. 12. Galletas con chispas de chocolate Consulte el Conjunto de datos 28 “Galletas con chispas de chocolate” en el apéndice B y utilice los conteos de chispas de chocolate de los tres tipos diferentes de galletas Chips Ahoy. Use un nivel de significancia de 0.01 para probar la afirmación de que los tres tipos de galletas tienen la misma cantidad mediana de chispas de chocolate. 13-5 Más allá de lo básico 13. Corrección de empates para el dato estadístico de prueba H Al usar la prueba de Kruskal-Wallis, hay un factor de corrección que debe aplicarse siempre que haya muchos empates: Divida H por 1 - ΣT N3 - N Primero combine todos los datos muestrales en una lista, y luego, en esa lista combinada, identifique los diferentes grupos de valores muestrales que están empatados. Para cada grupo individual de obser- vaciones empatadas, identifique el número de valores muestrales que están empatados y designe ese número como t, luego calcule T 5 t3 2 t. Enseguida, sume los valores T para obtener ΣT. El valor de N es el número total de observaciones en todas las muestras combinadas. Use este procedimiento para encontrar el valor corregido de H en el ejemplo 1 de esta sección en la página 628. ¿El valor corregido de H difiere sustancialmente del valor encontrado en el ejemplo 1? 13-6 Correlación de rangos Concepto clave Esta sección describe el método no paramétrico de la prueba de correlación de rangos, que usa rangos de datos pareados para probar una asociación entre dos variables. En la sección 10-1, se usaron datos de muestras pareadas para calcular valores del coeficiente de correlación lineal r, pero en esta sección usamos rangos como la base para calcular el co- eficiente de correlación de rangos rs. Como en el capítulo 10, debemos comenzar un análisis de datos pareados mediante la exploración con un diagrama de dispersión, a fin de identificar cualquier patrón en los datos, así como los valores atípicos. DEFINICIÓN La prueba de correlación de rangos (o prueba de correlación de rangos de Spear- man) es una prueba no paramétrica que utiliza rangos de datos muestrales que constan de pares relacionados. Se usa para probar una asociación entre dos variables. Usamos la notación rs para el coeficiente de correlación de rangos a fin de no confun- dirlo con el coeficiente de correlación lineal r. El subíndice s no se refiere a una desviación estándar; se usa en honor a Charles Spearman (1863-1945), quien originó el método de la correlación de rangos. De hecho, rs se denomina frecuentemente coeficiente de correlación de rangos de Spearman. Los componentes clave de la prueba de correlación de rangos se proporcionan en el siguiente recuadro de elementos clave, y el procedimiento se resume en la figura 13-5 de la página 634.
13-6 Correlación de rangos 633 ELEMENTOS CLAVE Correlación de rangos Objetivo H0: rs 5 0 (No existe correlación) H1: rs Þ 0 (Existe correlación) Calcular el coeficiente de correlación de rangos rs y usarlo para probar una asociación entre dos variables. Las hipótesis nula y alternativa son: Notación n 5 número de pares de datos muestrales d 5 diferencia entre rangos para los dos valores dentro de rs 5 coeficiente de correlación de rangos para datos mues- trales pareados (rs es un estadístico muestral) un par individual rs 5 coeficiente de correlación de rangos para todos los da- Nota: A diferencia de los métodos paramétricos de la sec- tos de la población (rs es un parámetro poblacional) ción 10-1, no existe el requisito de que los pares de datos muestrales tengan una distribución normal bivariada (como Requisitos se describió en la sección 10-1). No hay ningún requisito de una distribución normal para ninguna población. 1. Los datos pareados son una muestra aleatoria simple. 2. Los datos son rangos o se pueden convertir en rangos. Dato estadístico de prueba Dato estadístico de prueba más simple si no hay empates: Después de convertir los datos de cada muestra en rangos, si Dentro de cada muestra, primero convierta los datos en ran- no hay empates entre los rangos para la primera variable y no gos, luego encuentre el valor exacto del coeficiente de corre- hay empates entre los rangos para la segunda variable, el va- lación de rangos rs mediante el uso de la fórmula 10-1: lor exacto del dato estadístico de prueba se puede calcular utilizando la fórmula 10-1 o la siguiente fórmula relativa- FÓRMULA 10-1 mente simple; pero probablemente sea más fácil emplear la fórmula 10-1 con tecnología: n1Σxy2 - 1Σx2 1Σy2 rs = 2n1Σx22 - 1Σx2 2 2n1Σy22 - 1Σy2 2 rs = 1 - 6Σd2 n1n2 - 12 Valores P En ocasiones, los valores P pueden obtenerse mediante el uso de la tecnología, pero utilícelos solamente si resultan de la co- rrelación de rangos de Spearman. (No use valores P resultantes de las pruebas de correlación lineal; consulte la “precaución” en la parte superior de la página 635). Valores críticos FÓRMULA 13-1 1. Si n # 30, los valores críticos se encuentran en la tabla rs = {z (valores críticos para n > 30) A-9. 2n - 1 2. Si n > 30, valores críticos de rs se encuentran usando la donde el valor de z corresponde al nivel de significancia. fórmula 13-1. (Por ejemplo, si a 5 0.05, z 5 1.96).
634 CAPÍTULO 13 Pruebas no paramétricas Inicio ¿Los n pares de No Convierta los datos de la primera muestra datos se dan en forma en rangos de 1 a n y luego haga lo mismo para la segunda muestra. de rangos? Sí ¿Alguna de las No Calcule la diferencia d para cada par de variables tiene empates rangos restando el rango más bajo del rango más alto entre sus rangos? Eleve al cuadrado cada diferencia d encuentre la suma de esos cuadrados Sí para obtener Σ(d2). Calcule rs usando la fórmula 10-1 con Complete el cálculo de los rangos: 6Σd 2 nΣxy – (Σx) (Σy) rs 5 1 2 n(n2 – 1) rs 5 para obtener el dato estadístico de prueba. Ïn(Σx2) – (Σx)2 Ïn(Σy2) – (Σy)2 Calcule los valores críticos Es n ◊ 30? No rs 5 6 z Sí Ïn – 1 donde z corresponde al nivel de significancia. Encuentre los valores críticos negativos y positivos de rs en la tabla A-9. • Si rs está entre los valores críticos negativos y positivos, no se puede rechazar la hipótesis nula rs 5 0 (sin correlación). • Si rs no está entre los valores críticos negativos y positivos, rechace la hipótesis nula rs 5 0 y concluya que hay evidencia suficiente para sustentar la afirmación de una correlación. FIGURA 13-5 Procedimiento de correlación de rangos para la prueba H0: rs 5 0
13-6 Correlación de rangos 635 PRECAUCIÓN No use valores P de la correlación lineal para los métodos de la correla- ción de rangos. Al trabajar con datos que tienen empates entre rangos, el coeficiente de correlación de rangos rs puede calcularse usando la fórmula 10-1. Es posible emplear la tecnología en lugar de los cálculos manuales, pero los valores P mostrados para la corre- lación lineal no se aplican a los métodos de la correlación de rangos. Ventajas de la correlación de rangos: La correlación de rangos tiene las siguientes ven- tajas sobre los métodos paramétricos analizados en el capítulo 10: 1. La correlación de rangos se puede usar con datos pareados que son rangos o se pue- den convertir en rangos. A diferencia de los métodos paramétricos del capítulo 10, el método de correlación de rangos no requiere una distribución normal para ninguna población. 2. La correlación de rangos se puede usar para detectar algunas (no todas) las relaciones que no son lineales. Desventaja de la correlación de rangos: Eficiencia Una desventaja menor de la co- rrelación de rangos es su índice de eficiencia de 0.91, como se describe en la sección 13-1. Esta calificación de eficiencia muestra que, con todas las demás circunstancias iguales, el método no paramétrico de la correlación de rangos requiere 100 pares de datos de muestra para lograr los mismos resultados que con 91 pares de observaciones muestrales analizadas mediante el método paramétrico, suponiendo que se cumplen los requisitos más estrictos del método paramétrico. EJEMPLO 1 ¿Los mejores televisores cuestan más? La tabla 13-1 del problema del capítulo lista los rangos y costos (en cientos de dólares) de televisores con pantallas LCD de al menos 60 pulgadas (según datos de Consumer Reports). Encuentre el valor del coeficiente de correlación de rangos y úselo para determinar si hay suficiente evidencia para respaldar la afirmación de una correlación entre calidad y precio. Use un nivel de significancia de 0.05. Según el resultado, ¿parece que puede obte- nerse una mejor calidad si se gasta más? TABLA 13-1 Rangos y costos de televisores LCD Rango de calidad 1 2 3 4 5 6 7 8 9 10 Costo (cientos de dólares) 23 50 23 20 32 25 14 16 40 22 SOLUCIÓN VERIFICACIÓN DE REQUISITOS Los datos muestrales son una muestra aleatoria simple de los televisores que se probaron. Los datos son rangos o se pueden convertir a rangos. Los rangos de calidad son enteros consecutivos y no provienen de una población que se distribuye normalmente, por lo que usamos el coeficiente de correlación de rangos para probar una relación entre calidad y precio. Las hipótesis nula y alternativa son: H0: rs 5 0 (No existe una correlación entre calidad y precio). H1: rs Þ 0 (Existe una correlación entre calidad y precio). Siguiendo el procedimiento de la figura 13-5, comenzamos convirtiendo los costos en la tabla 13-1 en sus rangos correspondientes que se muestran en la tabla 13-7 de la página siguiente. Al costo más bajo de $1400 en la tabla 13-1 se le asigna un rango de 1. Debido a que los costos quinto y sexto están empatados en $2300, asignamos el rango de 5.5 a cada uno de ellos (donde 5.5 es el promedio de los rangos 5 y 6). Los rangos correspondientes a los costos de la tabla 13-1 se muestran en la segunda fila de la tabla 13-7. continúa
636 CAPÍTULO 13 Pruebas no paramétricas TABLA 13-7 Rangos de datos de la tabla 13-1. Vínculo directo entre el Rango de calidad 1 2 3 4 5 6 7 8 9 10 tabaquismo y el cáncer Rango de costo 5.5 10 5.5 3 8 7 1 2 9 4 Cuando encontramos Debido a que hay empates entre los rangos, debemos usar la fórmula 10-1 para encon- una trar que el coeficiente de correlación de rangos rs es igual a 20.274. correlación estadística Fórmula 10-1 entre dos variables, nΣxy - 1Σx2 1Σy2 debemos ser sumamente rs = 2n1Σx22 - 1Σx2 2 2n1Σy22 - 1Σy2 2 cuidadosos para evitar el error de concluir que existe un vínculo 1012802 - 1552 1552 de causa y efecto. La industria = = - 0.274 tabacalera ha enfatizado una y otra vez que la correlación no 21013852 - 1552 22101384.52 - 1552 2 implica causalidad. Sin embargo, el doctor David Sidransky, de Ahora consultamos la tabla A-9 para encontrar los valores críticos de 10.648 (con base la Universidad Johns Hopkins y en a 5 0.05 y n 5 10). Debido a que el dato estadístico de prueba rs 5 20.274 está entre otros investigadores encontraron los valores críticos de 20.648 y 0.648, no podemos rechazar la hipótesis nula. No hay un vínculo físico directo que evidencia suficiente para respaldar la afirmación de una correlación entre calidad y costo. implica mutaciones de un gen Según los datos muestrales proporcionados, parece que al pagar más no necesariamente se específico entre los fumadores. obtiene una mejor calidad. El análisis molecular de los cambios genéticos permite a SU TURNO Resuelva el ejercicio 7 “Chocolate y premios Nobel”. los investigadores determinar si el consumo de cigarrillos es EJEMPLO 2 Caso de muestra grande la causa de un cáncer. (Vea “Association Between Cigarette Consulte las medidas de presión arterial sistólica y diastólica de 147 mujeres selecciona- Smoking and Mutation of the das al azar en el conjunto de datos 1 “Datos corporales” del apéndice B y use un nivel de p53 Gene in Squamous-Cell significancia de 0.05 para probar la afirmación de que en el caso de las mujeres existe una Carcinoma of the Head and correlación entre las presiones arteriales sistólica y diastólica. Neck” de Brennan, Boyle, et al., New England Journal of SOLUCIÓN Medicine, vol. 332, núm. 11). Aunque los métodos estadísticos VERIFICACIÓN DE REQUISITOS Los datos son una muestra aleatoria simple y se pueden no permiten determinar que convertir en rangos. fumar causa cáncer, es posible utilizar métodos estadísticos para Dato estadístico de prueba El valor del coeficiente de correlación de rangos es rs 5 identificar una asociación para 0.354, que se puede encontrar utilizando la tecnología. que entonces los investigadores sean capaces de visualizar una Valores críticos Debido a que hay 147 pares de datos, tenemos n 5 147. Como n es ma- demostración física. yor que 30, encontramos los valores críticos a partir de la fórmula 13-1 en lugar de la tabla A-9. Con a 5 0.05 en dos colas, consideramos que z 5 1.96 para obtener los valores críti- cos de 20.162 y 0.162, como se muestra a continuación. rs = {z 1 = { 1.96 1 = { 0.162 2n - 2147 - El dato estadístico de prueba de rs 5 0.354 no está entre los valores críticos de 20.162 y 0.162, por lo que rechazamos la hipótesis nula de rs 5 0. Hay suficiente evidencia para respaldar la afirmación de que, en el caso de las mujeres, existe una correlación entre la presión arterial sistólica y la presión arterial diastólica. SU TURNO Resuelva el ejercicio 13 “Chocolate y premios Nobel”. Detección de patrones no lineales En ocasiones, los métodos de correlación de rangos nos permiten detectar relaciones que no podemos identificar con los métodos de correla- ción lineal del capítulo 10. Vea el siguiente diagrama de dispersión que muestra un patrón de puntos en forma de S que sugiere que hay una correlación entre x y y. Los métodos del capítulo 10 resultan en el coeficiente de correlación lineal de r 5 0.590 y valores críticos de
13-6 Correlación de rangos 637 60.632, lo que sugiere que no hay suficiente evidencia para respaldar la afirmación de una correlación lineal entre x y y. Pero si usamos los métodos de esta sección, obtendremos rs 5 1 y valores críticos de 60.648, lo que sugiere que hay suficiente evidencia para respaldar la afirmación de una correlación entre x y y. Con la correlación de rangos, a veces podemos detectar relaciones que no son lineales. Patrón no lineal CENTRO DE TECNOLOGÍA Correlación de rangos Acceda a los complementos tecnológicos, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch 1. Haga clic en Analysis en el menú 1. Ingrese los datos pareados en las co- 1. Haga clic en Stat en el menú superior. lumnas C1 y C2. superior. 2. Seleccione Rank Correlation en el 2. Haga clic en Stat en el menú superior. 2. Seleccione Nonparametrics en menú desplegable. el menú desplegable y Spearman 3. Seleccione Basic Statistics en el Correlation en el submenú. 3. Ingrese un nivel de significancia y menú desplegable y elija Correlation seleccione las dos columnas de en el submenú. 3. Seleccione las columnas que se datos que se incluirán. utilizarán en el análisis. 4. Seleccione las columnas que se in- 4. Haga clic en Evaluate. cluirán en Variables. 4. En la pantalla, marque Two-sided P-value. 5. Seleccione Spearman rho para el método y marque la casilla Display 5. Haga clic en Compute! p-values. 6. Haga clic en OK. Calculadora TI-83/84 Plus La calculadora TI-83>84 Plus no está diseñada para calcular la correlación de rangos, pero podemos reemplazar cada valor con su rango correspondiente y calcular el valor del coeficiente de correlación lineal r. 1. Reemplace cada valor muestral con su rango correspondiente e ingrese los rangos pareados en las listas L1 y L2. 2. Presione STAT , luego seleccione TESTS en el menú superior. 3. Seleccione LinRegTTest en el menú y presione .ENTER 4. Ingrese los nombres de lista para las variables x y y. Ingrese 1 para Freq y para b & r seleccione Þ 0 para probar la hipóte- sis nula de no correlación. 5. Seleccione Calculate y presione ENTER . Como el cálculo de r se realiza utilizando rangos, el valor que se muestra como r es en realidad el coeficiente de correlación de rangos rs. No tome en cuenta el valor P porque utiliza los métodos del capítulo 10, no los de esta sección.
638 CAPÍTULO 13 Pruebas no paramétricas CENTRO DE TECNOLOGÍA continuación Correlación de rangos Acceda a los complementos tecnológicos, videos y conjuntos de datos en www.pearsonenespañol.com/triola Excel Complemento XLSTAT 1. Haga clic en la pestaña XLSTAT en la cinta de opciones y luego haga clic en Correlation>Association tests. 2. Seleccione Correlation tests en el menú desplegable. 3. Para Observations>variables table, ingrese el rango de celdas para los valores de datos. Si el rango de datos incluye una etiqueta de datos, marque la casilla de Variable labels. 4. Para el tipo de correlación, seleccione Spearman. 5. Ingrese el nivel de significancia deseado. 6. Haga clic en OK. El coeficiente de correlación de rangos se muestra en la matriz de correlación. Si el valor mostrado está en negritas, podemos rechazar la afirmación de que no hay correlación. Excel Excel no tiene una función que calcule el coeficiente de correlación de rangos a partir de los valores muestrales originales, pero se puede usar el siguiente procedimiento. 1. Reemplace cada uno de los valores muestrales originales con su rango correspondiente. 2. Haga clic en Insert function fx, seleccione la categoría Statistical, seleccione la función CORREL y haga clic en OK. 3. En Array1 ingrese el rango de datos para la primera variable. En Array2 ingrese el rango de datos para la segunda variable. 4. Haga clic en OK para obtener el coeficiente de correlación de rangos rs. 13-6 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Regresión Si los métodos de esta sección se usan con datos muestrales pareados, y la conclusión es que hay suficiente evidencia para respaldar la afirmación de una correlación entre las dos variables, ¿podemos usar los métodos de la sección 10-2 para encontrar la ecuación de regresión que se puede utilizar en las predicciones? ¿Por qué sí o por qué no? 2. Nivel de medición ¿Cuál de los niveles de medición (nominal, ordinal, de intervalo, de razón) describe datos que no se pueden usar con los métodos de correlación de rangos? Explique. 3. Notación ¿Qué representan r, rs, r y rs? ¿Por qué se usa el subíndice s? ¿El subíndice s representa la misma desviación estándar introducida en la sección 3-2? 4. Eficiencia Consulte la tabla 13-2 en la página 600 e identifique la eficiencia de la prueba de corre- lación de rangos. ¿Qué nos dice ese valor sobre la prueba?
13-6 Correlación de rangos 639 En los ejercicios 5 y 6, use el diagrama de dispersión para encontrar el valor del coeficiente de correlación de rangos rs y los valores críticos correspondientes a un nivel de significancia de 0.05, utilizado para probar la hipótesis nula de rs 5 0. Determine si existe una correlación. 5. Datos de distancia/tiempo para un objeto que se deja caer 6. Datos de altitud/tiempo para una aeronave que desciende Distancia Altitud Tiempo Tiempo Pruebas para el rango de correlación. En los ejercicios 7 a 12, use el coeficiente de correlación de rangos para probar una correlación entre las dos variables. Use un nivel de significancia de A 5 0.05. 7. Chocolate y premios Nobel La siguiente tabla lista el consumo de chocolate (kg per cápita) y el número de ganadores del Premio Nobel (por cada 10 millones de personas) para varios países (del conjunto de datos 16 en el apéndice B). ¿Existe una correlación entre el consumo de chocolate y la proporción de premios Nobel? ¿Cómo podría explicarse tal correlación? Chocolate 11.6 2.5 8.8 3.7 1.8 4.5 9.4 3.6 2.0 3.6 6.4 Nobel 12.7 1.9 12.7 3.3 1.5 11.4 25.5 3.1 1.9 1.7 31.9 8. Edades de las mejores actrices y los mejores actores A continuación se listan edades de las mejores actrices y los mejores actores en el momento en que ganaron los premios Oscar (del conjunto de datos 14 “Edades de ganadores del Oscar” en el apéndice B). ¿Estos datos sugieren que existe una correlación entre las edades de las mejores actrices y los mejores actores? Actriz 61 32 33 45 29 62 22 44 54 Actor 45 50 48 60 50 39 55 44 33 9. Pizza y el metro La “conexión de la pizza” es el principio de que el precio de una rebanada de pizza en la ciudad de Nueva York es siempre aproximadamente igual a la tarifa del metro. Use los datos que se listan a continuación para determinar si existe una correlación entre el costo de una rebanada de pizza y la tarifa del metro. Año 1960 1973 1986 1995 2002 2003 2009 2013 2015 Costo de pizza 0.15 0.35 1.00 1.25 1.75 2.00 2.25 2.30 2.75 Tarifa del metro 0.15 0.35 1.00 1.35 1.50 2.00 2.25 2.50 2.75 IPC 30.2 48.3 112.3 162.2 191.9 197.8 214.5 233.0 237.2 10. IPC y el metro Utilice los datos de IPC>metro del ejercicio anterior para probar la correlación entre el IPC (índice de precios al consumidor) y la tarifa del metro. 11. Medición de focas a partir de fotografías A continuación se listan los anchos generales (en cm) de focas medidas a partir de fotografías y el peso de las focas (en kg). Los datos se basan en “Mass Estimation of Weddell Seals Using Techniques of Photogrammetry”, de R. Garrott de la Universidad Es- tatal de Montana. El objetivo del estudio fue determinar si el peso de las focas podría determinarse a partir de fotografías aéreas. ¿Hay suficiente evidencia para concluir que existe una correlación entre los anchos generales y el peso de las focas? Ancho general (cm) 7.2 7.4 9.8 9.4 8.8 8.4 Peso (kg) 116 154 245 202 200 191
640 CAPÍTULO 13 Pruebas no paramétricas 12. Grillos y temperatura Se estudió la asociación entre la temperatura y el número de veces que un grillo chirría en 1 minuto. A continuación se listan los números de chirridos en 1 minuto y las tempe- raturas correspondientes en grados Fahrenheit (con base en datos de The Songs of Insects de George W. Pierce, Harvard University Press). ¿Existe evidencia suficiente para concluir que existe una relación entre el número de chirridos en 1 minuto y la temperatura? Chirridos en 1 minuto 882 1188 1104 864 1200 1032 960 900 Temperatura (°F) 69.7 93.3 84.3 76.3 88.6 82.6 71.6 79.6 Conjuntos de datos del apéndice B. En los ejercicios 13 a 16, use los datos en el apéndice B para evaluar la correlación de rangos con un nivel de significancia de 0.05. 13. Chocolate y premios Nobel Repita el ejercicio 7 usando todos los datos combinados de choco- late>Nobel en el conjunto de datos 16 “Premios Nobel y Chocolate” en el apéndice B. 14. Edades de las mejores actrices y los mejores actores Repita el ejercicio 8 usando todas las edades pareadas del conjunto de datos 14 “Edades de ganadores del Oscar” en el apéndice B. 15. Presión arterial Consulte las medidas de las presiones arteriales sistólica y diastólica de 153 hom- bres seleccionados al azar en el conjunto de datos 1 “Datos corporales” del apéndice B y use un nivel de significancia de 0.05 para probar la afirmación de que, en el caso de los hombres, existe una correlación entre la presión arterial sistólica y presión arterial diastólica. 16. IQ y volumen cerebral Consulte el conjunto de datos 8 “IQ y tamaño del cerebro” en el apéndice B y pruebe la correlación entre el volumen cerebral (cm3) y la puntuación del IQ. 13-6 Más allá de lo básico 17. Determinación de valores críticos Una alternativa al uso de la tabla A-9 para encontrar valores críticos de la correlación de rangos es calcularlos mediante la siguiente aproximación: rs = { Bt2 t2 - 2 +n Aquí, t es el valor crítico t de la tabla A-3 correspondiente al nivel de significancia deseado y n 2 2 grados de libertad. Use esta aproximación para encontrar los valores críticos rs del ejercicio 15 “Presión sanguínea”. ¿Cómo se comparan los valores críticos resultantes con los valores críticos que se encon- trarían al usar la fórmula 13-1 de la página 633? 13-7 Prueba de rachas para aleatoriedad Concepto clave En esta sección se describe la prueba de rachas para aleatoriedad, que se utiliza para determinar si una secuencia de datos muestrales tiene un orden aleatorio. Esta prueba requiere un criterio para categorizar cada valor de datos en una de dos cate- gorías separadas, y analiza las rachas de esas dos categorías para determinar si parecen ser el resultado de un proceso aleatorio, o si las rachas sugieren que el orden de los datos no es aleatorio. DEFINICIONES Después de caracterizar cada valor de datos en una de dos categorías separadas, una racha es una secuencia de datos que tiene la misma característica; la secuencia está precedida y seguida de datos con una característica diferente o sin datos en absoluto. La prueba de rachas utiliza el número de rachas en una secuencia de datos muestrales para probar la aleatoriedad en el orden de los datos.
13-7 Prueba de rachas para aleatoriedad 641 ELEMENTOS CLAVE Prueba de rachas para aleatoriedad Objetivo Aplicar la prueba de rachas para aleatoriedad a una secuencia de datos muestrales para probar la aleatoriedad en el orden de los datos. Use las siguientes hipótesis nula y alternativa: H0: Los datos están en un orden aleatorio. H1: Los datos están en un orden que no es aleatorio. Notación n1 5 número de elementos en la secuencia que tienen una característica particular. (La característica elegida para n1 es arbitraria). n2 5 número de elementos en la secuencia que tienen la otra característica G 5 número de rachas Requisitos 2. Cada valor de datos se puede categorizar en una de dos categorías (como masculino>femenino). 1. Los datos muestrales se organizan de acuerdo con algún esquema de ordenamiento, como el orden en que se ob- tuvieron los valores muestrales. Dato estadístico de prueba y valores críticos Para muestras pequeñas y A 5 0.05: Si n1 # 20 y n2 # 20 • Criterios de decisión: Rechace la aleatoriedad si el y el nivel de significancia es a 5 0.05, el dato estadístico de número de rachas G es tal que • G # menor valor crítico encontrado en la tabla prueba, los valores críticos y los criterios de decisión son los A-10. siguientes: • Dato estadístico de prueba: número de rachas G • o G $ mayor valor crítico encontrado en la tabla • Valores críticos de G: Use la tabla A-10. A-10. Para muestras grandes o A Þ 0.05: Si n1 > 20 o n2 > 20 o a Þ 0.05, el dato estadístico de prueba, los valores críticos y los criterios de decisión son los siguientes: • Dato estadístico de prueba: z = G - mG • Valores críticos de z: Use la tabla A-2. sG • Criterios de decisión: Rechace la aleatoriedad si el donde mG = 2n1n2 + 1 dato estadístico de prueba z es tal que n1 + n2 • z # puntuación z crítica negativa (como 21.96) • o z $ puntuación z crítica positiva (como 1.96). y sG = 12n1n22 12n1n2 - n1 - n22 B 1n1 + n22 21n1 + n2 - 12 PRECAUCIÓN La prueba de rachas para aleatoriedad se basa en el orden en que ocurren los datos; no se basa en la frecuencia de los datos. Por ejemplo, una secuencia de 3 hombres y 20 mujeres podría parecer aleatoria, pero la cuestión de si 3 hombres y 20 mujeres constituyen una muestra sesgada (con un número desproporcionadamente mayor de mujeres) no se aborda mediante la prueba de rachas.
642 CAPÍTULO 13 Pruebas no paramétricas Rachas de suerte Inicio en los deportes Identifique una secuencia de dos Existe la características diferentes creencia de que los atletas Determine el valor de n1, la cantidad suelen tener de elementos del primer tipo. “rachas de suerte”—es Determine el valor de n2, la cantidad decir, periodos de elementos del segundo tipo. breves de éxito extraordinario. El psicólogo Amos Tversky, de Determine el valor de G, el número la Universidad de Stanford, y de rachas. otros investigadores utilizaron la estadística para analizar los miles ¿Es n1 > 20? Sí de tiros de los 76 de Filadelfia No en una temporada completa y la mitad de otra. Encontraron que el número de “rachas de suerte” no difería de lo que se esperaría en pruebas aleatorias, donde el resultado de cada prueba es independiente de cualquier resultado previo. Es decir, la probabilidad de hacer una anotación no depende de las anotaciones o fallas anteriores. Sí Calcule ¿Es n2 > 20? mG 5 2n1n2 11 n1 1 n2 No ¿Calcule si No Calcule ÎsG 5 a 5 0.05? 2n1n2(2n1n2 2 n1 2 n2) (n1 1 n2)2(n1 1 n2 2 1) Sí Calcule el dato estadístico de prueba El dato estadístico de prueba es G. Use la G 2 mG tabla A-10 para obtener los valores críticos. sG z5 Rechace la aleatoriedad si el dato estadístico Determine los valores críticos de z de prueba es menor o igual que el mayor valor crítico. De lo contrario, no se puede rechazar a partir de la tabla A-2 como de la hipótesis nula de aleatoriedad. costumbre. (Si a 5 0.05, los valores críticos son 21.96 y 1.96). FIGURA 13-6 Procedimiento de la prueba de rachas para aleatoriedad
13-7 Prueba de rachas para aleatoriedad 643 Principio fundamental de la prueba de rachas La idea clave que subyace a la prueba de rachas es: Rechace la aleatoriedad si el número de rachas es muy bajo o muy alto. ■ Ejemplo: La secuencia de géneros FFFFFMMMMM no es aleatoria porque tiene sólo 2 rachas, por lo que el número de rachas es muy bajo. ■ Ejemplo: La secuencia de géneros FMFMFMFMFM no es aleatoria porque tiene 10 rachas, que es una cantidad muy alta. Los criterios exactos para determinar si un número de rachas es muy alto o muy bajo se en- cuentran en el recuadro de elementos clave. El procedimiento para la prueba de aleatoriedad se resume también en la figura 13-6. EJEMPLO 1 Muestra pequeña: Partidos políticos de los presidentes A continuación se listan los partidos políticos recientes de los presidentes de Estados Unidos. La letra R representa a un presidente republicano y la letra D representa a un pre- sidente demócrata. Use un nivel de significancia de 0.05 para probar la aleatoriedad en la secuencia. RRDDRDDRRDRRDRD SOLUCIÓN VERIFICACIÓN DE REQUISITOS (1) Los datos están ordenados. (2) Cada valor de datos se clasifica en una de dos categorías distintas (Republicano>Demócrata). Los requisitos se cumplen. Seguiremos el procedimiento resumido en la figura 13-6. Se ha identificado la secuen- cia de dos características (republicano>demócrata). Ahora debemos encontrar los valores de n1, n2 y el número de rachas G. La secuencia se muestra a continuación con el espaciado ajustado para identificar de mejor manera las diferentes rachas. RR DD R DD RR D RR D R D 1a. racha 2a. racha 3a. racha 4a. racha 5a. racha 6a. racha 7a. racha 8a. racha 9a. racha 10a. racha La presentación anterior muestra que hay 8 presidentes republicanos y 7 presidentes de- mócratas, y el número de rachas es 10. Representamos esos resultados con la siguiente notación. n1 5 número de presidentes republicanos 5 8 n2 5 número de presidentes demócratas 5 7 G 5 número de rachas 5 10 Como n1 < 20 y n2 < 20 y el nivel de significancia es a 5 0.05, el dato estadístico de prueba es G 5 10 (el número de rachas), y consultamos la tabla A-10 para encontrar los valores críticos de 4 y 13. Dado que G 5 10 no es menor o igual que el valor crítico de 4, ni es mayor o igual que el valor crítico de 13, no rechazamos la aleatoriedad. No hay evi- dencia suficiente para rechazar la aleatoriedad en la secuencia de los partidos políticos de los presidentes más recientes.
644 CAPÍTULO 13 Pruebas no paramétricas ¿La reproducción del iPod EJEMPLO 2 Muestra grande: Aleatoriedad de los nacimientos es realmente aleatoria? El conjunto de datos 4 “Nacimientos” en el apéndice B lista los sexos de 100 nacimientos En The en el Bellevue Hospital Center. Consideremos la secuencia de los géneros listados a conti- Guardian, nuación, donde 1: niño y 0: niña. (La lista completa de 100 géneros se puede ver en el con- Steven Levy junto de datos 4). Use un nivel de significancia de 0.05 para probar la afirmación de que la escribió secuencia es aleatoria. acerca de una entrevista 1 0 1 0 0 0 0 1...1 0 1 realizada a Steve Jobs, quien era director SOLUCIÓN de Apple en ese momento, en la que le planteó el siguiente dilema: VERIFICACIÓN DE REQUISITOS (1) Los datos están ordenados. (2) Cada valor de datos “Tengo un problema con se clasifica en una de dos categorías distintas (niño>niña). Los requisitos se cumplen. mi iPod. La función de reproducción aleatoria no parece Las hipótesis nula y alternativa son: realmente aleatoria. Algunos artistas aparecen demasiado H0: La secuencia es aleatoria. y algunos no aparecen nunca”. H1: La secuencia no es aleatoria. Según Jeff Robbin, directivo del Un examen de la secuencia de 100 géneros da como resultado los siguientes valores: equipo de desarrollo de iTunes, “se trata de una aleatoriedad n1 5 número de niños 5 51 inequívoca”. El matemático n2 5 número de niñas 5 49 John Allen Paulos comentó G 5 número de rachas 5 59 que “a menudo interpretamos e imponemos patrones sobre Dado que n1 > 20, necesitamos calcular el dato estadístico de prueba z, por lo que primero eventos que son aleatorios”. debemos evaluar mG y sG de la siguiente manera: Levy también afirma que, cuando pensamos que la función de mG = 2n1n2 + 1 = 21512 1492 + 1 = 50.98 reproducción aleatoria del iPod no n1 + n2 51 + 49 es aleatoria, el problema reside en nuestra percepción. Nuestra mente sG = 12n1n22 12n1n2 - n1 - n22 percibe patrones y tendencias B 1n1 + n22 21n1 + n2 - 12 que en realidad no existen. Con frecuencia escuchamos rachas =B 122 1512 1492 3 21512 1492 - 51 - 494 = 4.972673 de canciones consecutivas del mismo artista, y creemos que 151 + 492 2151 + 49 - 12 esto no se debe al azar; pero, con una verdadera aleatoriedad, Ahora encontramos el dato estadístico de prueba: este tipo de rachas consecutivas son mucho más probables de lo z = G - mG = 59 - 50.98 = 1.61 esperado. sG 4.972673 La percepción incorrecta de ausencia de aleatoriedad Podemos usar el dato estadístico de prueba z 5 1.61 para determinar el valor P de 0.1074, provocó que Apple introdujera una que es mayor que el nivel de significancia de a 5 0.05, por lo que no podemos rechazar la característica de “reproducción hipótesis nula de aleatoriedad. inteligente” en una nueva versión de iTunes: ésta permite que Además, como el nivel de significancia es a 5 0.05 y tenemos una prueba de dos los usuarios tengan control colas, los valores críticos son z 5 21.96 y z 5 1.96. El dato estadístico de prueba z 5 1.61 sobre las sucesiones de varias no cae dentro de la región crítica, por lo que de nuevo no podemos rechazar la hipótesis canciones del mismo artista, para nula de aleatoriedad. evitar rachas consecutivas del mismo cantante. Según declaró I N T E R P R E TA C I Ó N Steve Jobs en aquella ocasión: “Lo estamos haciendo menos No tenemos suficiente evidencia para rechazar la aleatoriedad de la secuencia de 100 na- aleatorio para que se perciba cimientos en el Bellevue Hospital Center (del conjunto de datos 4 “Nacimientos” en el más aleatorio”. apéndice B). SU TURNO Realice el ejercicio 9 “Prueba de aleatoriedad de las victorias en el Súper Bowl”. Prueba de aleatoriedad por encima y por debajo de la media o la mediana Podemos evaluar la aleatoriedad en la forma en que los datos numéricos fluctúan por encima o por debajo de una media o una mediana. Para probar la aleatoriedad por encima y por debajo de la mediana, por ejemplo, use los datos muestrales para hallar el valor de la me-
13-7 Prueba de rachas para aleatoriedad 645 diana, luego reemplace cada valor individual con la letra E si está por encima de la mediana y reemplácelo por D si está debajo de la mediana. Elimine cualquier valor que sea igual a la mediana. (Es útil escribir las Es y las Ds directamente encima o debajo de los números que representan, porque esto facilita la verificación y también reduce la posibilidad de tener un número equivocado de letras). Después de encontrar la secuencia de letras E y D, podemos proceder a aplicar la prueba de rachas como se describió anteriormente. Los economistas usan la prueba de rachas para aleatoriedad por encima y por debajo de la mediana para identificar tendencias o ciclos. Una tendencia económica ascendente conten- dría un predominio de Ds al comienzo y Es al final, por lo que el número de corridas sería muy pequeño. Una tendencia descendente tendría Es dominando al principio y Ds al final, con un pequeño número de rachas. Un patrón cíclico produciría una secuencia que cambia sistemáticamente, por lo que el número de rachas tendería a ser grande. CENTRO DE TECNOLOGÍA Prueba de rachas para aleatoriedad Acceda a los complementos tecnológicos, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch No disponible 1. Determine la cantidad de elementos Minitab hará una prueba de rachas solamente en la primera categoría, la cantidad con una secuencia de datos numéricos. El de elementos en la segunda cate- manual y el libro de trabajo del laboratorio goría y cuente el número de rachas. estudiantil de Minitab proporciona información adicional sobre cómo eludir esta restricción. 2. Haga clic en Analysis en el menú superior. 1. Ingrese los datos numéricos en la columna C1. 3. Seleccione Runs Tests en el menú desplegable. 2. Haga clic en Stat en el menú superior. 4. Ingrese un nivel de significancia 3. Seleccione Nonparametrics en el menú y los valores para el número de desplegable y elija Runs Test en el sub- rachas, el número de elementos menú. en la primera categoría (Elemento 1) y el número de elementos en la 4. Seleccione la columna C1 en Variables. segunda categoría (Elemento 2). 5. Seleccione probar por encima y por debajo de 5. Haga clic en Evaluate. la media o ingrese un valor que desee utilizar. 6. Haga clic en OK. Calculadora TI-83/84 Plus Excel No disponible No disponible 13-7 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico En los ejercicios 1 a 4, use la siguiente secuencia de afiliaciones a partidos políticos de los recien- tes presidentes de Estados Unidos, donde R representa a los republicanos y D representa a los demócratas. RRRRDRDRRRDRRRDDRDDRRDRRDRD 1. Prueba de sesgo ¿Se puede usar la prueba de rachas para mostrar que la proporción de republica- nos es significativamente mayor que la proporción de demócratas?
646 CAPÍTULO 13 Pruebas no paramétricas 2. Notación Identifique los valores de n1, n2 y G que se usarían en la prueba de rachas para aleato- riedad. 3. Prueba de rachas Si usamos un nivel de significancia de 0.05 para probar la aleatoriedad, ¿cuáles son los valores críticos de la tabla A-10? Con base en esos valores y el número de rachas del ejercicio 2, ¿qué debería concluir sobre la aleatoriedad? 4. ¿Buena muestra? Dada la secuencia de datos, si no rechazamos la aleatoriedad, ¿se deduce que el método de muestreo es adecuado para los métodos estadísticos? Explique. Uso de la prueba de rachas para aleatoriedad. En los ejercicios 5 a 10, use la prueba de rachas con un nivel de significancia de a 5 0.05. (Todos los datos están ordenados por fila). 5. Muertes en cumplimiento de la ley A continuación se listan las cifras de víctimas mortales del cumplimiento de la ley durante 20 años recientes y consecutivos. Primero encuentre la media, identifi- que cada valor por encima de la media (E) o por debajo de la media (D), luego pruebe la aleatoriedad por encima y por debajo de la media. ¿Hay una tendencia? 183 140 172 171 144 162 241 159 150 165 163 156 192 148 125 161 171 126 107 117 6. Dígitos pares e impares en Pi Un artículo del New York Times sobre el cálculo de las posiciones decimales de p señaló que “los matemáticos están bastante seguros de que los dígitos de p son indis- tinguibles de cualquier secuencia aleatoria”. A continuación se muestran las primeras 25 posiciones decimales de p. Pruebe la aleatoriedad de la forma en que los dígitos impares (I) y pares (P) ocurren en la secuencia. Con base en el resultado, ¿la afirmación del New York Times parece ser precisa? 1415926535897932384626433 7. Lotería de reclutamiento En 1970, se utilizó una lotería para determinar quién sería reclutado en el ejército de Estados Unidos. Las 366 fechas en el año se colocaron en cápsulas individuales, se mez- claron, y luego se seleccionaron las cápsulas para identificar las fechas de nacimiento de los hombres que se reclutarían primero. A continuación se listan los primeros 30 resultados. Pruebe la aleatoriedad antes y después de la mitad del año, que es el 1 de julio. Sep. 14 Abr. 24 Dic. 30 Feb. 14 Oct. 18 Sep. 6 Oct. 26 Sep. 7 Nov. 22 Dic. 6 Ago. 31 Dic. 7 Jul. 8 Abr. 11 Jul. 12 Dic. 29 Ene. 15 Sep. 26 Nov. 1 Jun. 4 Ago. 10 Jun. 26 Jul. 24 Oct. 5 Feb. 19 Dic. 14 Jul. 21 Jun. 5 Mar. 2 Mar. 31 8. Periódicos Los expertos en medios afirman que los periódicos impresos diarios están disminu- yendo debido a la llegada de Internet. A continuación se listan los números de periódicos impresos en Estados Unidos durante una secuencia reciente de años. Primero encuentre la mediana, luego pruebe la aleatoriedad de los números por encima y por debajo de la mediana. ¿Qué sugieren los resultados? 1611 1586 1570 1556 1548 1533 1520 1509 1489 1483 1480 1468 1457 1456 1457 1452 1437 1422 1408 1387 1382 Prueba de rachas con muestras grandes. En los ejercicios 9 a 12, use la prueba de rachas con un nivel de significancia de A 5 0.05. (Todos los datos están ordenados por fila). 9. Prueba de aleatoriedad de las victorias en el Súper Bowl A continuación se listan las designa- ciones de la conferencia a la que pertenecen los equipos que ganaron el Súper Bowl, donde N expresa un equipo de la NFC y A uno de la AFC. ¿Los resultados sugieren que alguna de las conferencias es superior? NN A A A N A A AAANAAANNANNNNNNN NN N N N N A ANAANAAAA NANNNANA 10. Victorias de la Serie Mundial de Béisbol Pruebe la afirmación de que la secuencia de victorias en la Serie Mundial de los equipos de la Liga Americana y la Liga Nacional es aleatoria. En la página siguiente se muestran los resultados recientes, con A 5 Liga Americana y N 5 Liga Nacional.
CAPÍTULO 13 Examen rápido del capítulo 647 ANANNNAAAANAAAANANNAANNA AAANANNAAAAANANANANAAAAA AANNANANNAANNNANANANAAAN NAANNNNAAANANANAAANANAAA NANAANANANNNAN 11. Mercado de valores: pruebas de aleatoriedad por encima y por debajo de la mediana A continuación se listan los valores anuales más altos del promedio industrial Dow Jones para una se- cuencia de años recientes. Encuentre la mediana, luego pruebe la aleatoriedad por debajo y por encima de la mediana. ¿Qué sugiere el resultado sobre el mercado de valores como una consideración de inversión? 969 995 943 985 969 842 951 1036 1052 892 882 1015 1000 908 898 1000 1024 1071 1287 1287 1553 1956 2722 2184 2791 3000 3169 3413 3794 3978 5216 6561 8259 9374 11568 11401 11350 10635 10454 10855 10941 12464 14198 13279 10580 11625 12929 13589 16577 18054 12. Aleatoriedad de los nacimientos Repita el ejemplo 2 “Aleatoriedad de los nacimientos” utili- zando los nacimientos del conjunto de datos 4 “Nacimientos” en el apéndice B, para los sexos de los nacimientos en el Strong Memorial Hospital en lugar del Bellevue Center Hospital. Nuevamente use un nivel de significancia de 0.05 para probar la afirmación de que la secuencia de géneros es aleatoria. 13-7 Más allá de lo básico 13. Determinación de valores críticos a. Usando todos los elementos A, A, A, B, B, B, B, B, B, lista las 84 diferentes secuencias posibles. b. Encuentra el número de rachas para cada una de las 84 secuencias. c. Use los resultados de los incisos (a) y (b) para encontrar sus propios valores críticos para G. d. Compare sus resultados con los que se presentan en la tabla A-10. Examen rápido del capítulo 1. Citas rápidas Algunos de los métodos no paramétricos de este capítulo utilizan rangos de datos. Encuentre los rangos correspondientes a las siguientes clasificaciones de atractivo (1 5 Nada atractivo, 10 5 Extremadamente atractivo) de hombres dadas por mujeres que participaron en un evento de citas rápidas (del conjunto de datos 18 “Citas rápidas”): 5, 7, 7, 8, 7. 2. Eficiencia ¿Qué significa cuando decimos que la prueba de correlación de rangos tiene una califica- ción de eficiencia de 0.91 cuando se compara con la prueba paramétrica de correlación lineal? 3. Pruebas no paramétricas a. ¿Cuál de los siguientes términos se usa a veces en lugar de “prueba no paramétrica”: prueba de normalidad; prueba de anormalidad; prueba sin distribución; último testamento; prueba de paciencia? b. ¿Por qué el término que es la respuesta al inciso (a) es mejor que “prueba no paramétrica”? 4. Longitud del pie>estatura A continuación se listan las longitudes de los pies (cm) y las estaturas (cm) de los hombres del conjunto de datos 2 “Pies y estaturas” en el apéndice B. ¿Qué método de es- tadística no paramétrica se debe utilizar? ¿Qué característica de los datos se investiga con esta prueba? Longitud del pie 27.8 25.7 26.7 25.9 26.4 29.2 26.8 28.1 25.4 27.9 Estatura 180.3 175.3 184.8 177.8 182.3 185.4 180.3 175.3 177.8 185.4
648 CAPÍTULO 13 Pruebas no paramétricas 5. Longitud del pie/Estatura Al analizar los datos pareados del ejercicio 4, ¿los valores P y las con- clusiones de la prueba no paramétrica y la prueba paramétrica son siempre los mismos? 6. Longitud del pie/Estatura Para los datos muestrales dados en el ejercicio 4, identifique al menos una ventaja de usar la prueba no paramétrica adecuada sobre la prueba paramétrica. 7. Prueba de rachas Suponga que utilizamos la prueba de aleatoriedad por encima y por debajo de la media para el valor monetario de Google al final de cada año durante 20 años y encontramos que G 5 2. ¿Qué nos dice ese valor sobre el valor monetario de Google? 8. Prueba de rachas Considere datos muestrales que consisten en los géneros de delincuentes acu- sados de piratear los sistemas informáticos de las empresas. Determine si las siguientes afirmaciones son verdaderas o falsas. a. Si la prueba de rachas sugiere que los datos muestrales ocurren en un orden aleatorio, se deduce que los datos se han seleccionado al azar. b. Si la prueba de rachas sugiere que los datos muestrales ocurren en un orden aleatorio, entonces no hay una diferencia significativa entre las proporciones de hombres y mujeres. 9. Prueba del signo y prueba de los rangos con signo de Wilcoxon ¿Cuál es una gran ventaja de la prueba de los rangos con signo de Wilcoxon sobre la prueba del signo al analizar datos que constan de pares relacionados? 10. ¿Qué prueba? Tres jueces diferentes califican a los mismos cantantes en una escala de 0 a 10. ¿Qué método de este capítulo se puede utilizar para determinar si uno de los jueces es más severo o indulgente que los demás, según lo indica una calificación mediana que es significativamente diferente a la de los demás? Ejercicios de repaso Uso de pruebas no paramétricas. En los ejercicios 1 a 10, use un nivel de significancia de 0.05 con la prueba indicada. Si no se especifica ninguna prueba particular, use la prueba no paramétri- ca adecuada de este capítulo 1. Estrés laboral e ingresos A continuación se listan las puntuaciones de estrés laboral y los salarios anuales medianos (miles de dólares) para varios empleos, incluyendo a los bomberos, pilotos de líneas aéreas, oficiales de policía y profesores universitarios (con base en datos de las “Puntuaciones de estrés laboral” de CareerCast.com). ¿Estos datos sugieren que existe una correlación entre el estrés laboral y el ingreso anual? ¿Parece que los trabajos con más estrés tienen salarios más altos? Estrés 71.59 60.46 50.82 6.94 8.10 50.33 49.2 48.8 11.4 Salario mediano 45.6 98.4 57.0 69.0 35.4 46.1 42.5 37.1 31.2 2. Presidentes, papas y monarcas A continuación se enumeran los años que vivieron los presi- dentes, papas y monarcas británicos después de su toma de posesión, elección o coronación, respecti- vamente. Supongamos que los datos son muestras seleccionadas al azar de poblaciones más grandes. Pruebe la afirmación de que las tres muestras provienen de poblaciones con la misma mediana. Presidentes 10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4 18 21 11 2 9 36 Papas Monarcas 12 28 3 16 9 25 23 32 2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26 17 6 13 12 13 33 59 10 7 63 9 25 36 15 3. Serie mundial Las últimas 110 Series Mundiales de Béisbol terminaron con 63 victorias para equipos de la Liga Americana y 47 victorias para equipos de la Liga Nacional. Use la prueba del signo para probar la afirmación de que en cada Serie Mundial, el equipo de la Liga Americana tiene una pro- babilidad de 0.5 de ganar.
CAPÍTULO 13 Ejercicios de repaso 649 4. Lotería de California A continuación se listan los primeros dígitos consecutivos de la Lotería de California Daily 4. Pruebe la aleatoriedad de los enteros pares e impares. ¿La lotería parece estar fun- cionando como debería? 522848871064151553141500396637 5. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se les pidió a las mujeres que calificaran el atractivo de sus citas masculinas, y una muestra de los resultados se detalla a continuación (1 5 Nada atractivo, 10 5 Extremadamente atractivo). Use la prueba del signo para probar la afirmación de que la muestra proviene de una población con una mediana igual a 5. 5 8 3 8 6 10 3 7 9 8 5 5 6 8 8 7 3 5 5 6 8 7 8 8 8 7 6. Citas rápidas Repita el ejercicio anterior usando la prueba de los rangos con signo de Wilcoxon. 7. Old Faithful A continuación se listan los intervalos de tiempo (min) entre las erupciones del géiser Old Faithful. Los tiempos “recientes” están dentro de los últimos años, y los “pasados” son de 1995. Pruebe la afirmación de que las dos muestras provienen de poblaciones con la misma mediana. ¿La conclusión cambia con un nivel de significancia de 0.01? Reciente 78 91 89 79 57 100 62 87 70 88 82 83 56 81 74 102 61 Pasado (1995) 89 88 97 98 64 85 85 96 87 95 90 95 8. Tarifas de aerolíneas A continuación se listan los costos (en dólares) de ocho vuelos diferentes desde Nueva York (JFK) a San Francisco para Virgin America, US Airways, United Airlines, JetBlue, Delta, American Airlines, Alaska Airlines y Sun Country Airlines. (Cada par de costos es para el mismo vuelo). Use la prueba del signo para probar la afirmación de que no hay diferencia en el costo entre los vuelos programados con 1 día de anticipación y los programados con 30 días de anticipa- ción. ¿Cuál parece ser una sabia estrategia de programación? Vuelos programados con un día de antelación 584 490 584 584 584 606 628 717 Vuelos programados con 30 días de antelación 254 308 244 229 284 509 394 258 9. Tarifas de aerolíneas Consulte los mismos datos del ejercicio anterior. Use la prueba de rangos con signo de Wilcoxon para probar la afirmación de que las diferencias entre las tarifas para vuelos pro- gramados con 1 día de anticipación y los programados con 30 días de anticipación tienen una mediana igual a 0. ¿Qué sugieren los resultados? 10. Clasificación de universidades por estudiantes y US News & World Report Cada año, la revista US News & World Report publica clasificaciones de las universidades con base en estadísticas como las tasas de admisión, las tasas de graduación, los tamaños de clase, la proporción de profesores y estudiantes, los salarios de los docentes y las calificaciones dadas por administradores. Los economistas Christopher Avery, Mark Glickman, Caroline Minter Hoxby y Andrew Metrick pusieron en práctica un método alternativo de analizar las opciones universitarias de 3240 estudiantes de alto rendimiento en su último año de la escuela preparatoria. Examinaron las universidades que ofrecieron la admisión junto con las universidades a las que los estudiantes decidieron asistir. La siguiente tabla lista las clasifica- ciones de una muestra pequeña de universidades. Encuentre el valor del coeficiente de correlación de rangos y úselo para determinar si existe una correlación entre las clasificaciones de los estudiantes y las clasificaciones de la revista. Rangos de estudiantes 12345678 Rangos de US News & World Report 12547638
650 CAPÍTULO 13 Pruebas no paramétricas Ejercicios de repaso acumulado En los ejercicios 1 a 3, use los datos que se dan a continuación. Los valores son los tiempos de demo- ra en la salida (minutos) para los vuelos de American Airlines de Nueva York a Los Ángeles. Los valores negativos corresponden a vuelos que salieron temprano. Vuelo 1 (min) 22 21 22 2 22 0 22 23 Vuelo 19 (min) Vuelo 21 (min) 19 24 25 21 24 73 0 1 18 60 142 21 211 21 47 13 1. Demoras en la salida de vuelos Compare las tres muestras usando medias, medianas y desvia- ciones estándar. 2. Prueba de normalidad Use los tiempos de demora en la salida para el vuelo 19 y prueba la norma- lidad usando una gráfica cuantilar normal. 3. Tiempos de demora en la salida Use una prueba no paramétrica para probar la afirmación de que las tres muestras provienen de poblaciones con el mismo tiempo mediano de demora en la salida. 4. Pruebas de drogas Hay una tasa de 3.9% de resultados positivos en las pruebas de drogas que se realizan a trabajadores en Estados Unidos (según datos de Quest Diagnostics). Suponiendo que este estadístico se basa en una muestra con un tamaño de 2000, elabore una estimación del intervalo de confianza del 95% para el porcentaje de resultados positivos en la prueba de drogas. Escriba una breve declaración que interprete el intervalo de confianza. 5. Pruebas de drogas Utilice los datos del ejercicio anterior y pruebe la afirmación de que la propor- ción de resultados positivos en las pruebas de drogas entre los trabajadores de Estados Unidos es mayor al 3%. Use un nivel de significancia de 0.05. 6. Aleatoriedad Consulte las siguientes edades de los presidentes electos de Estados Unidos el día que tomaron posesión (del conjunto de datos 15 “Presidentes” en el apéndice B). Pruebe la aleatoriedad por encima y por debajo de la media. ¿Los resultados sugieren una tendencia a la alza o a la baja? 57 61 57 57 58 57 61 54 68 49 64 48 65 52 46 54 49 47 55 54 42 51 56 55 51 54 51 60 62 43 55 56 52 69 64 46 54 47 7. Tamaño de muestra Los avances en la tecnología están afectando dramáticamente diferentes aspectos de nuestras vidas. Por ejemplo, la cantidad de periódicos diarios impresos está disminuyendo debido al fácil acceso a las noticias en Internet y por la televisión. Para ayudar a abordar estos pro- blemas, queremos estimar el porcentaje de adultos en Estados Unidos que usan una computadora al menos una vez al día. Encuentre el tamaño de muestra necesario para estimar ese porcentaje. Suponga que queremos un 95% de confianza en que el porcentaje muestral se encuentre dentro de dos puntos porcentuales del porcentaje poblacional real. 8. Media y mediana En un año reciente, los jugadores del equipo de béisbol de los Yankees de Nueva York tenían sueldos con una media de $7,052,129 y una mediana de $2,500,000. Explique por qué la media y la mediana pueden ser tan diferentes. 9. Miedo a las alturas Entre los lectores de un sitio web de USA Today, 285 eligieron responder a la siguiente pregunta: “¿Le teme a las alturas en los rascacielos?” Entre los que decidieron responder, 46% respondió “sí” y el 54% respondió “no”. Use un nivel de significancia de 0.05 para probar la afirmación de que la mayoría de la población no le teme a las alturas en los rascacielos. ¿Qué hay de erróneo en esta prueba de hipótesis? 10. Teléfonos celulares y accidentes: análisis de un informe de periódico En un artículo de Associated Press, se informó que los investigadores “seleccionaron al azar a 100 automovilistas de Nueva York que habían sufrido un accidente y 100 que no habían tenido un accidente. De los que sufrieron un accidente, 13.7 por ciento poseía un teléfono celular, mientras que sólo 10.6 por ciento de los conduc- tores sin accidentes tenían un teléfono en el automóvil”. ¿Qué es erróneo en estos resultados?
CAPÍTULO 13 Proyecto de tecnología 651 Proyecto de tecnología Los intentos anteriores para identificar o contactar vida inteligente extraterrestre han implicado esfuer- zos para enviar mensajes de radio con información sobre nosotros, los terrícolas. El doctor Frank Drake, de la Universidad de Cornell, desarrolló un mensaje de radio de este tipo que podría transmitirse como una serie de pulsos y silencios. Los pulsos y los silencios se pueden considerar como 1s y 0s. A conti- nuación se presenta un mensaje que consta de 77 entradas de 0s y 1s. Si factorizamos 77 en los números primos 7 y 11 y luego hacemos una cuadrícula de 11 3 7 y ponemos un punto en las posiciones corres- pondientes a un pulso de 1, podemos obtener una imagen simple de algo. Supongamos que la secuencia de 77 entradas de 1s y 0s se envía como un mensaje de radio que es interceptado por vida extraterrestre con suficiente inteligencia como para haber estudiado este libro. Si el mensaje de radio se prueba usan- do los métodos de este capítulo, ¿la secuencia parecerá ser “ruido aleatorio” o se identificará como un patrón que no es aleatorio? Además, trace la imagen representada por los dígitos e identifíquela. 001110000111000001000 111111100111000011100 001110001000101000010 10000101000010 DE LOS DATOS A LA DECISIÓN Pensamiento crítico: ¿El reclutamiento fue aleatorio? Análisis de resultados El 1 de diciembre de 1969, durante la Guerra de Vietnam, se a. Use la prueba de rachas para probar la aleatoriedad de la utilizó una lotería para determinar quién sería reclutado por el secuencia por encima y por debajo de la mediana de 183.5. ejército de Estados Unidos, pero la lotería generó una gran con- troversia. Las diferentes fechas en un año se colocaron en 366 b. Use la prueba de Kruskal-Wallis para probar la afirmación de cápsulas individuales. Primero, se colocaron las 31 cápsulas de que los 12 meses tienen números de prioridad extraídos de la enero en una caja, luego se agregaron las 29 cápsulas de febrero misma población. y los dos meses se mezclaron. Enseguida se agregaron las 31 cápsulas de marzo y se mezclaron los tres meses. Este proceso c. Calcule las 12 medias mensuales. Luego grafique esas 12 continuó hasta que se incluyeron todos los meses. La primera medias. (Donde la escala horizontal muestre los 12 meses y la cápsula seleccionada fue el 14 de septiembre, por lo que los escala vertical varíe de 100 a 260). Observe cualquier patrón hombres nacidos en esa fecha fueron reclutados primero. La que sugiera que los números de prioridad originales no se selec- lista adjunta muestra las 366 fechas en el orden de selección de cionaron aleatoriamente. prioridad. Esta lista puede descargarse en www.pearsonenespa- ñol.com>triola. d. Con base en los resultados de los incisos (a), (b) y (c), decida si este sorteo en particular fue justo. Escriba una declaración que explique por qué cree que fue o no fue justo. Si decidió que esta lotería fue injusta, describa un proceso para seleccionar los números de la lotería que hubiera sido justo. Día Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic. 1 305 86 108 32 330 249 93 111 225 359 19 129 2 159 144 29 271 298 228 350 45 161 125 34 328 3 251 297 267 83 40 301 115 261 49 244 348 157 4 215 210 275 81 276 20 279 145 232 202 266 165 5 101 214 293 269 364 28 188 54 82 24 310 56 6 224 347 139 253 155 110 327 114 6 87 76 10 7 306 91 122 147 35 85 50 168 8 234 51 12 8 199 181 213 312 321 366 13 48 184 283 97 105 9 194 338 317 219 197 335 277 106 263 342 80 43 10 325 216 323 218 65 206 284 21 71 220 282 41 11 329 150 136 14 37 134 248 324 158 237 46 39 12 221 68 300 346 133 272 15 142 242 72 66 314 continúa
652 CAPÍTULO 13 Pruebas no paramétricas Día Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic. 13 318 152 259 124 295 69 42 307 175 138 126 163 14 238 4 354 231 178 356 331 198 1 294 127 26 15 17 89 169 273 130 180 322 102 113 171 131 320 16 121 212 166 148 55 274 120 44 207 254 107 96 17 235 189 33 260 112 73 98 154 255 288 143 304 18 140 292 332 90 278 341 190 141 246 5 146 128 19 58 25 200 336 75 104 227 311 177 241 203 240 20 280 302 239 345 183 360 187 344 63 192 185 135 21 186 363 334 62 250 60 27 291 204 243 156 70 22 337 290 265 316 326 247 153 339 160 117 9 53 23 118 57 256 252 319 109 172 116 119 201 182 162 24 59 236 258 2 31 358 23 36 195 196 230 95 25 52 179 343 351 361 137 67 286 149 176 132 84 26 92 365 170 340 357 22 303 245 18 7 309 173 27 355 205 268 74 296 64 289 352 233 264 47 78 28 77 299 223 262 308 222 88 167 257 94 281 123 29 349 285 362 191 226 353 270 61 151 229 99 16 30 164 217 208 103 209 287 333 315 38 174 3 31 211 30 313 193 11 79 100 Actividades en equipo 1. Actividad fuera de clase La mitad de los estudiantes debe inventar los resultados de 200 lanza- mientos de monedas y la otra mitad debe recolectar los resultados de 200 lanzamientos reales de una moneda. Luego use la prueba de rachas para determinar si los resultados parecen ser aleatorios. 2. Actividad en clase Use la distribución de asientos existente en su clase y aplique la prueba de rachas para determinar si los estudiantes están organizados aleatoriamente de acuerdo con el género. Después de registrar la disposición de los asientos, el análisis se puede hacer en subgrupos de tres o cuatro estudiantes. 3. Actividad en clase Divídanse en grupos de 8 a 12 personas. Mida la estatura y el alcance de los brazos de cada miembro del grupo. Para medir el alcance de los brazos, el sujeto debe pararse con los brazos extendidos, como las alas de un avión. Divida las siguientes tareas entre subgrupos de tres o cuatro personas. a. Utilice la correlación de rangos con los datos muestrales pareados para determinar si existe una co- rrelación entre la estatura y el alcance. b. Use la prueba del signo para probar la diferencia entre las dos variables. c. Use la prueba de los rangos con signo de Wilcoxon para probar la diferencia entre las dos variables. 4. Actividad en clase Realice la actividad 3 usando el pulso en lugar del alcance de los brazos. Mida los pulsos contando el número de latidos en 1 minuto.
CAPÍTULO 13 Actividades en equipo 653 5. Actividad fuera de clase Divídanse en grupos de tres o cuatro estudiantes. Investigue la relación entre dos variables recolectando sus propios datos muestrales pareados y utilizando los métodos de la sección 13-6 para determinar si existe una correlación. Temas sugeridos: • ¿Existe una correlación entre el sabor y el costo de las diferentes marcas de galletas con chispas de chocolate (o bebidas de cola)? (El sabor se puede medir en una escala numérica, como de 1 a 10). • ¿Existe una correlación entre los salarios de los jugadores profesionales de béisbol (o basquetbol o fútbol) y sus logros en la temporada (como el promedio de bateo o los puntos anotados)? • ¿Existe una correlación entre las tasas de consumo de combustible de los automóviles y sus pesos? • ¿Existe una correlación entre la longitud de los pies de los hombres (o de las mujeres) y sus estaturas? • ¿Existe una correlación entre los promedios de calificaciones de los estudiantes y el tiempo que pasan mirando televisión? • ¿Existe una correlación entre las estaturas de los padres (o las madres) y las estaturas de sus primo- génitos (o primogénitas)? 6. Actividad fuera de clase Consulte el proyecto “De los datos a la decisión” de este capítulo, que incluye el análisis de la lotería de 1970 utilizada para el reclutamiento de hombres en el ejército de Estados Unidos. Debido a que los resultados de 1970 generaron inquietudes sobre la aleatoriedad de la selección de los números de prioridad, diseñe un nuevo procedimiento para generar los 366 números de prioridad. Use su propio procedimiento para generar los 366 números y pruebe sus resultados usando las técnicas sugeridas en los incisos (a), (b) y (c) del proyecto “De los datos a la decisión”. ¿Cómo se comparan sus resultados con los obtenidos en 1970? ¿Su proceso de selección aleatoria parece ser mejor que el utilizado en 1970? Escriba un reporte que describa claramente el proceso que diseñó. También incluya sus análisis y conclusiones. 7. Actividad fuera de clase Divídanse en grupos de tres o cuatro personas. Encueste a otros estu- diantes pidiéndoles que identifiquen su especialidad y género. Para cada sujeto encuestado, determine su cantidad de seguidores en Twitter o amigos en Facebook. Use los datos muestrales para responder las siguientes preguntas: • ¿Los números de seguidores en Twitter o amigos en Facebook parecen ser iguales para ambos sexos? • ¿Los números de seguidores en Twitter o amigos en Facebook parecen ser iguales para las diferentes especialidades? 8. Actividad en clase Divídanse en grupos de 8 a 12 personas. Mida la estatura de cada miembro del grupo, también mida la altura de su ombligo, que es la altura desde el piso hasta el ombligo de la persona. Use el coeficiente de correlación de rangos para determinar si existe una correlación entre la estatura y la altura del ombligo. 9. Actividad en clase Divídanse en grupos de tres o cuatro personas. El apéndice B incluye muchos conjuntos de datos aún no utilizados con los métodos de este capítulo. Busque en el apéndice B algu- nas variables de interés, luego analícelas usando los métodos adecuados de estadística no paramétrica. Indique sus conclusiones y trate de identificar aplicaciones prácticas.
14-1 Gráficas de control para la variación y la media 14-2 Gráficas de control para atributos 14 4CONTROL ESTADÍSTICO DE PROCESOS PROBABILITY PROBLEMA Seguridad aérea: ¿la producción de altímetros para aviones está fuera de control DEL estadístico? CAPÍTULO La compañía Orange Avionics fabrica instrumentos y dispositivos incorrectas del altímetro que llevaron a los pilotos a creer que es- de navegación utilizados en aviones, incluyendo los altímetros taban a salvo sobre el suelo cuando en realidad volaban en forma que proporcionan a los pilotos lecturas de sus alturas sobre el peligrosamente baja. nivel del mar. La precisión de los altímetros es importante porque los pilotos dependen de ellos para mantener alturas seguras por Debido a que estos dispositivos son tan importantes para encima de montañas, torres y edificios, así como una separación la seguridad operativa de la aviación, su exactitud está cuida- vertical adecuada con respecto a otros aviones. La precisión de dosamente regulada por las regulaciones gubernamentales. los altímetros es especialmente importante cuando los pilotos se La Regulación 91.411 de la Administración Federal de Aviación acercan al aterrizaje sin poder ver el suelo. Ha habido fallecimien- (FAA, por sus siglas en inglés) exige pruebas periódicas a tos de pilotos y pasajeros en accidentes causados por lecturas los altímetros de las aeronaves, los cuales deben cumplir con especificaciones incluidas en la Parte 43 del Apéndice E 654
Problema del capítulo 665555 de las reglamentaciones de la FAA. Una de esas especifica- 2007, 1999 y 2002 pies, por lo que los errores correspondientes ciones es que un altímetro debe dar una lectura con un error (en pies) son 21, 7, 7, 21 y 2. de no más de 30 pies cuando se prueba para una altitud de 2000 pies. En este capítulo, evaluamos este proceso de fabricación del altímetro al analizar el comportamiento de los errores a lo En la compañía Orange Avionics, se seleccionan cinco largo del tiempo. Veremos cómo se pueden usar los métodos altímetros al azar de su producción en cada uno de 20 días de estadísticos para monitorear un proceso de fabricación con el producción consecutivos; la tabla 14-1 lista los errores (en pies) objetivo de identificar y corregir problemas graves. Además de cuando se prueban en una cámara de presión que simula una ayudar a las empresas a mantenerse en el negocio, los méto- altitud de 2000 pies. El día 1, por ejemplo, las lecturas de altitud dos estadísticos pueden afectar nuestra seguridad de manera reales para los cinco altímetros seleccionados son 1999, 2007, muy significativa. TABLA 14-1 Errores de altímetros para avión (en pies) Disponible para descarga en www.pearsonenespañol.com/triola Día Error (pies) Media x Mediana Desviación Rango R estándar s 1 -1 7 7 -1 2 2.8 2 8 4.02 2 9 2 3 -1 - 5 1.6 2 14 5.18 3 504 1 3 2.6 3 5 2.07 4 0 10 1 4 3 3.6 3 10 3.91 5 10 8 5 16 3 8.4 8 13 5.03 6 6 9 3 -6 - 16 - 0.8 3 25 10.18 7 14 4 2 14 8 8.4 8 12 5.55 8 20 9 4 - 4 28 11.4 9 32 12.72 9 - 12 - 4 21 - 5 - 5 - 1.0 - 5 33 12.71 10 - 21 - 12 7 2 19 - 1.0 2 40 15.76 11 2 20 12 - 3 - 13 3.6 2 33 12.86 12 - 1 9 5 12 - 4 4.2 5 16 6.69 13 - 16 - 21 - 14 6 7 - 7.6 - 14 28 13.13 14 - 21 - 27 - 3 - 1 - 9 - 12.2 - 9 26 11.37 15 - 27 0 - 37 - 15 4 - 15.0 - 15 41 17.42 16 0 29 18 - 27 25 9.0 18 56 22.99 17 29 - 24 9 20 48 16.4 20 72 26.73 18 1 30 8 - 15 13 7.4 8 45 16.47 19 2 - 5 - 23 - 25 - 4 - 11.0 - 5 27 12.19 20 3 - 46 31 - 20 - 3 - 7.0 - 3 77 28.50 OBJETIVOS DEL CAPÍTULO En este capítulo se presentan métodos para elaborar e interpretar las gráficas de control que se usan comúnmente para monitorear las características cambiantes de datos a lo largo del tiempo. Una gráfica de control incluye una línea central, un límite de control superior y un límite de control inferior. Se puede usar una gráfica de control para determinar si un proceso es estadísticamente estable (o si está bajo control estadístico) con sólo una variación natural y sin patrones, ciclos o puntos inusuales.
656 CAPÍTULO 14 Control estadístico de procesos Los objetivos del capítulo son: 14-1 Gráficas de control para la variación y la media • Desarrollar la capacidad de elaborar una gráfica de rachas. • Desarrollar la capacidad de elaborar una gráfica de control para R (el rango). • Desarrollar la capacidad de elaborar una gráfica de control para x–. • Identificar los criterios fuera de control y aplicarlos para determinar si los datos del proceso están bajo control estadístico. 14-2 Gráficas de control para atributos • Desarrollar la capacidad de elaborar una gráfica de control para p, la proporción corres- pondiente a algún atributo, como ser defectuoso. • Identificar los criterios fuera de control y aplicarlos para determinar si los datos de los atri- butos están bajo control estadístico con sólo la variación natural y sin patrones, ciclos o puntos inusuales. 14-1 Gráficas de control para la variación y la media Concepto clave En esta sección se presentan las gráficas de rachas, las gráficas R y las grá- ficas x como herramientas que permiten monitorear las características de los datos a lo largo del tiempo. Podemos usar dichas gráficas para determinar si un proceso es estadísticamente estable (o si está bajo control estadístico). Datos de proceso La siguiente definición describe formalmente el tipo de datos que se considerarán en este capítulo. DEFINICIÓN Los datos de proceso son datos dispuestos de acuerdo con una secuencia temporal. Son medidas de una característica de bienes o servicios que resultan de alguna combi- nación de equipo, personas, materiales, métodos y condiciones. EJEMPLO 1 Errores de los altímetros de avión como datos de proceso La tabla 14-1 incluye datos de proceso que consisten en los errores medidos (en pies) de altímetros para avión. Debido a que los valores de la tabla 14-1 están organizados de acuerdo con la hora en que fueron seleccionados, son datos de proceso. Es importante saber que algunas empresas se han declarado en quiebra porque permitie- ron que sus procesos de fabricación se deterioraran sin un monitoreo constante. Esta sección presenta tres herramientas comúnmente usadas para monitorear los datos de proceso: gráfi- cas de rachas, gráficas R y gráficas x. Comenzamos con las gráficas de rachas. Gráfica de rachas Una gráfica de rachas es una de varias herramientas que se usan con frecuencia para monitorear un proceso con el fin de asegurar que las características deseadas no cambien. Una gráfica de rachas es básicamente igual a una gráfica de series de tiempo, que se estudió en la sección 2-3.
14-1 Gráficas de control para la variación y la media 657 Error (pies)DEFINICIÓN El efecto Flynn: Una gráfica de rachas representa una secuencia de valores de datos individuales a través Tendencia al alza en las del tiempo. Un eje (generalmente el eje vertical) se utiliza para los valores de datos, y el puntuaciones de IQ otro eje (usualmente el eje horizontal) se usa para la secuencia de tiempo. Un IQ EJEMPLO 2 Gráfica de rachas para los errores en altímetros de avión (cociente de Trate los 100 errores en altímetros de avión de la tabla 14-1 como una cadena de 100 me- inteligencia; diciones consecutivas y elabore una gráfica de rachas usando un eje vertical para los erro- IQ, por res y un eje horizontal para identificar el orden cronológico de dichos errores. sus siglas en inglés) SOLUCIÓN se mide a partir de pruebas estándar de En la figura 14-1 se muestra la gráfica de rachas generada por Minitab para los datos de inteligencia. Una gráfica de la tabla 14-1. La escala horizontal identifica el número de muestra, por lo que el número 1 rachas o una gráfica de control corresponde al primer error del altímetro, el número 2 corresponde al segundo error, y así de las puntuaciones de IQ sucesivamente. La escala vertical representa los errores medidos. revelarían que éstas exhiben una tendencia a incrementarse, Observación ya que las puntuaciones de IQ han aumentado de forma FIGURA 14-1 Gráfica de rachas para los altímetros de avión estable desde que comenzaron a utilizarse aproximadamente en I N T E R P R E TA C I Ó N 1930. Esta tendencia es mundial y es igual en los distintos tipos de Examine la figura 14-1 e intente identificar cualquier patrón. Vemos que a medida que el pruebas de inteligencia, incluso tiempo avanza de izquierda a derecha, los puntos parecen mostrar una mayor variación. Si en aquellas que se basan casi este patrón continúa, algunos errores se volverán inaceptablemente grandes. El patrón de por completo en el razonamiento incremento de la variación es un problema clásico en el control de calidad, y si no se reco- abstracto y no verbal, con noce, las empresas pueden llegar a desaparecer. mínima influencia de la cultura. Esta tendencia al alza se conoce SU TURNO Resuelva el ejercicio 6 “Latas de Pepsi: Gráfica de rachas”. como efecto Flynn, ya que el científico político James R. Flynn DEFINICIÓN descubrió esta tendencia en sus Un proceso es estadísticamente estable (o está bajo control estadístico) si sólo tiene estudios con reclutas del ejército variación natural, sin patrones, ciclos o puntos inusuales. estadounidense. La cantidad del incremento es muy sustancial: Interpretación de las gráficas de rachas con base en la puntuación media Una gráfica de rachas sin un patrón obvio sugiere que los datos provienen de un proceso que del IQ de 100, se estima que esta es estadísticamente estable, y los datos pueden tratarse como si provinieran de una población era de aproximadamente 77 en con una media, una desviación estándar, una distribución y otras características constantes. 1920. Por lo tanto, el estudiante En la figura 14-1 se muestra un patrón de variación creciente, y ése es uno de varios criterios común actual es brillante, si se para determinar que un proceso no es estadísticamente estable (o está fuera de control esta- le compara con sus bisabuelos. dístico). La violación de uno o más de los siguientes criterios indica que un proceso no es Hasta ahora no está claro si estadísticamente estable o está fuera de control estadístico. la tendencia ascendente en las puntuaciones de IQ indica una población cada vez más inteligente o si hay problemas con los métodos utilizados para la prueba de cociente intelectual.
658 CAPÍTULO 14 Control estadístico de procesos Mejora de la calidad de ■ Aumento de la variación: A medida que avanza la gráfica de rachas de izquierda a los autos al reducir la derecha, la variación vertical de los puntos aumenta, por lo que los valores de datos variación correspondientes experimentan un aumento en la variación. (Vea la figura 14-1). Éste es un problema común en el control de calidad. El efecto neto es que los productos varían Ford y Mazda más y más hasta que casi todos se consideran defectuosos. estaban produciendo ■ Tendencia al alza: Los puntos suben al avanzar de izquierda a derecha, por lo que los transmisiones valores correspondientes aumentan con el tiempo. similares que se suponía ■ Distancia hacia abajo: Los puntos caen al avanzar de izquierda a derecha, por lo que debían los valores correspondientes disminuyen con el tiempo. hacerse con las mismas especificaciones, pero pronto ■ Cambio hacia arriba: Los puntos cercanos al inicio son notablemente más bajos que se hizo evidente que las los que están cerca del final, por lo que los valores correspondientes han cambiado transmisiones de Ford requerían hacia arriba. muchas más reparaciones de garantía que las transmisiones ■ Cambio hacia abajo: Los puntos cercanos al inicio son notablemente más altos que los de Mazda fabricadas en que están cerca del final, por lo que los valores correspondientes han cambiado hacia Japón. Los investigadores de abajo. Ford buscaron la causa de esto y descubrieron que sus ■ Valor excepcional: Hay un solo punto que es excepcionalmente alto o bajo. transmisiones cumplían con las ■ Patrón cíclico: Hay un ciclo que se repite. especificaciones requeridas, pero la variación en las transmisiones Causas de la variación de Ford era mucho mayor que Muchos métodos diferentes de control de calidad intentan reducir la variación en los pro- las de Mazda. Mazda estaba ductos o servicios. La variación en un proceso puede ser el resultado de dos tipos de causas utilizando una mejor esmeriladora como se define a continuación. y más cara, pero el mayor costo se compensaba con menos DEFINICIÓN reparaciones bajo garantía. La variación aleatoria se debe al azar; es el tipo de variación inherente en cualquier pro- Armado con estos importantes ceso que no es capaz de producir cada bien o servicio exactamente de la misma manera resultados, Ford realizó cambios en cada ocasión. y procedió no sólo a cumplir con La variación asignable es el resultado de causas que pueden identificarse (como maqui- las especificaciones requeridas naria defectuosa o empleados no capacitados). sino también a mejorar la calidad reduciendo la variación. (Vea Más adelante en el capítulo consideraremos formas de distinguir entre la variación asignable Taguchi Techniques for Quality y la variación aleatoria. Engineering de Phillip J. Ross). La gráfica de rachas es una herramienta para controlar la estabilidad de un proceso. Ahora estudiaremos las gráficas de control, que también son útiles para monitorear la estabi- lidad de un proceso. Gráficas de control Debido a que Walter Shewhart introdujo las tablas de control en 1924, a veces se les deno- mina gráficas de Shewhart. Comenzamos con una definición básica. DEFINICIÓN Una gráfica de control (o gráfica de Shewhart o gráfica de comportamiento del pro- ceso) de una característica del proceso (como la media o la variación) consiste en valo- res representados secuencialmente a lo largo del tiempo, e incluye una línea central así como un límite de control inferior (LCI) y un límite de control superior (LCS). La línea de en medio representa un valor central de las medidas características, mientras que los límites de control son las fronteras utilizadas para separar e identificar cualquier punto que se considere significativamente alto o significativamente bajo.
14-1 Gráficas de control para la variación y la media 659 Supondremos que la desviación estándar poblacional s no se conoce puesto que ahora consideramos dos de varios tipos diferentes de gráficas de control: 1. Gráficas R (o gráficas de rangos) utilizadas para monitorear la variación. 2. Gráficas x utilizadas para monitorear las medias. Cuando se usan gráficas de control para monitorear un proceso, es común considerar juntas las gráficas R y x, porque un proceso estadísticamente inestable puede ser el resultado de una variación creciente, un cambio en las medias o ambos. Gráfica de control para el monitoreo de la variación: La gráfica R Una gráfica R (o gráfica de rango) es un diagrama donde se representan rangos muestra- les en vez de valores muestrales individuales, y se usa para monitorear la variación en un proceso. Puede tener más sentido usar desviaciones estándar, pero las gráficas de rango son bastante efectivas para los casos donde el tamaño de las muestras (o subgrupos) es de 10 o menos. Si todas las muestras tienen un tamaño superior a 10, se recomienda el uso de una gráfica s en lugar de una R. (Vea el ejercicio 13). Además de graficar los valores de los ran- gos, incluimos una línea central ubicada en R, que representa la media de todos los rangos muestrales, así como otra línea para indicar el límite de control inferior y una tercera línea para marcar el límite de control superior. A continuación se presenta un resumen de la nota- ción y los componentes de la gráfica R. ELEMENTOS CLAVE Monitoreo de la variación del proceso: Gráfica de control para R Objetivo Elaborar una gráfica de control para R (o una “gráfica R”) que se pueda usar para determinar si la variación de los datos del proceso está bajo control estadístico. Requisitos 3. Los valores de datos muestrales individuales son inde- pendientes. 1. Los datos son datos del proceso que consisten en una se- cuencia de muestras del mismo tamaño n. 2. La distribución de los datos del proceso es esencialmente normal. Notación n 5 tamaño de cada muestra o subgrupo R 5 media de los rangos muestrales (la suma de los rangos muestrales dividida por el número de muestras) Gráfica Puntos graficados: rangos muestrales (cada punto representa el rango para cada subgrupo) Línea central: R (la media de los rangos muestrales) Límite de control superior (LCS): D4R (donde D4 es una constante que se encuentra en la tabla 14-2) Límite de control inferior (LCI): D3R (donde D3 es una constante que se encuentra en la tabla 14-2)
660 CAPÍTULO 14 Control estadístico de procesos TABLA 14-2 Constantes de la gráfica de control Variación asignable n: Número de Gráfica R Gráfica x Gráfica s costosa observaciones en el subgrupo El Mars Climate D3 D4 A2 A3 B3 B4 Orbiter fue 0.000 3.267 lanzado por la 2 0.000 3.267 1.880 2.659 NASA hacia Marte, pero 3 0.000 2.574 1.023 1.954 0.000 2.568 se destruyó al volar demasiado cerca de su 4 0.000 2.282 0.729 1.628 0.000 2.266 planeta de destino. La pérdida se calculó en $125 millones 5 0.000 2.114 0.577 1.427 0.000 2.089 de dólares. Se descubrió que la causa de la colisión fue la 6 0.000 2.004 0.483 1.287 0.030 1.970 confusión en el empleo de las unidades utilizadas para 7 0.076 1.924 0.419 1.182 0.118 1.882 realizar cálculos. Los datos de la aceleración estaban en las 8 0.136 1.864 0.373 1.099 0.185 1.815 unidades inglesas de libras fuerza, pero el Laboratorio 9 0.184 1.816 0.337 1.032 0.239 1.761 de Propulsión supuso que las unidades utilizadas eran 10 0.223 1.777 0.308 0.975 0.284 1.716 “newtons” métricos en vez de libras. Quienes dirigían Fuente: Adaptada del Manual ASTM sobre la Presentación de Datos y el Análisis de las Gráficas de la nave espacial dieron Control,© 1976 ASTM, pp. 134-136. Reproducida con autorización de la Sociedad Estadounidense consecutivamente cantidades de Pruebas y Materiales. erróneas de la fuerza para ajustar la posición de la nave. Los valores de D4 y D3 son constantes calculadas por expertos en control de calidad, y Los errores causados por están destinadas a simplificar los cálculos. Los límites de control superior e inferior de D4R la discrepancia fueron muy y D3R son valores aproximadamente equivalentes a los límites del intervalo de confianza del pequeños al principio, pero el 99.7%. Por lo tanto, es muy poco probable que los valores de un proceso estadísticamente error acumulado a lo largo de los meses de travesía de la estable caigan fuera de esos límites. Si un valor cae más allá de los límites de control, es muy nave espacial fue la causa de su fracaso. probable que el proceso no sea estadísticamente estable. En 1962 la nave espacial que transportaba al satélite Mariner I EJEMPLO 3 Gráfica R de errores en altímetros fue destruida por controladores en la Tierra, cuando se salió de Elabore una gráfica de control para R usando los errores en los altímetros que se presentan curso debido a la falta de un en la tabla 14-1. Use las muestras de tamaño n 5 5 para cada uno de los 20 días de pro- signo menos en un programa de ducción. cómputo. SOLUCIÓN Consulte la tabla 14-1 en el problema del capítulo de la página 655 para ver la columna de rangos muestrales R. El valor de R es la media de esos 20 rangos muestrales, por lo que su valor se encuentra de la siguiente manera: R = 8 + 14 +g + 77 = 30.65 pies 20 Por lo tanto, la línea central de nuestra gráfica R se ubica en R 5 30.65 pies. Para encon- trar los límites de control superior e inferior, primero debemos encontrar los valores de D3 y D4. Con referencia a la tabla 14-2 para n 5 5, obtenemos D4 5 2.114 y D3 5 0.000, por lo que los límites de control son como siguen: Límite de control superior (LCS): D4R 5 (2.114)(30.65) 5 64.79 Límite de control inferior (LCI): D3R 5 (0.000)(30.65) 5 0.0000 Utilizando un valor de línea central de R 5 30.65 y límites de control de 64.79 y 0.0000, ahora procedemos a graficar los 20 rangos muestrales como 20 puntos individuales. El re- sultado se muestra en la página siguiente en la pantalla de Minitab de la gráfica R.
14-1 Gráficas de control para la variación y la media 661 Gráfica R Rango muestral LCS = 64.79 ¡No exageres! R– = 30.65 La empresa Nashua LCI = 0 Corp. tuvo problemas Día con su máquina para SU TURNO Resuelva el ejercicio 7 “Latas de Pepsi: Gráfica R”. recubrimiento de papel y consideró gastar Interpretación de gráficas de control millones de dólares con la finalidad de reemplazarla. La Al interpretar las gráficas de control, es importante tener la siguiente precaución: máquina estaba funcionando bien y con un proceso estable, PRECAUCIÓN Los límites de control superior e inferior de una gráfica de control se ba- pero las muestras se empezaron san en el comportamiento real del proceso, no en el comportamiento deseado. Los límites a tomar con mucha frecuencia; de control superior e inferior no corresponden a ninguna especificación de proceso que con base en esos resultados, haya sido decretada por el fabricante. se le hicieron ajustes. Tales ajustes excesivos, denominados Cuando se investiga la calidad de algún proceso, por lo general se deben considerar dos alteración indebida, causaron preguntas clave: desviaciones de la distribución que hasta entonces había 1. Con base en el comportamiento actual del proceso, ¿podemos concluir que éste se sido buena. El efecto fue un encuentra bajo control estadístico? incremento en los defectos. Cuando el experto en estadística 2. ¿Los productos o servicios del proceso cumplen con las especificaciones de diseño? y control W. Edwards Deming estudió el proceso, recomendó En el presente capítulo abordamos la primera pregunta, pero no la segunda; nos estamos que no se le hicieran ajustes, a enfocando en el comportamiento del proceso con el objetivo de determinar si éste se encuen- menos que hubiera una señal de tra bajo control estadístico. Además, debemos comprender claramente los siguientes criterios que el proceso había cambiado específicos para determinar si un proceso está bajo control estadístico (o si es estadística- o se había vuelto inestable. La mente estable). compañía funcionó mejor sin ajustes que con la alteración realizada. Criterios para determinar si un proceso está fuera de control DEFINICIÓN Un proceso no es estadísticamente estable o está fuera de control estadístico si se cumplen uno o más de los siguientes criterios para determinar si un proceso está fuera de control. 1. Hay un patrón, tendencia o ciclo que obviamente no es aleatorio. 2. Hay al menos un punto por encima del límite de control superior o al menos un punto por debajo del límite de control inferior. 3. Regla de la racha de 8: Hay al menos ocho puntos consecutivos por encima o por debajo de la línea central. (Con un proceso estadísticamente estable, hay una proba- bilidad de 0.5 de que un punto esté por encima o por debajo de la línea central, por lo que es muy poco probable que ocho puntos consecutivos estén todos sobre la línea central o debajo de ella).
662 CAPÍTULO 14 Control estadístico de procesos Detección de sobornos En este libro utilizaremos sólo los tres criterios mencionados anteriormente, pero algunas con gráficas de control compañías usan criterios adicionales como los siguientes: Las gráficas ■ Hay al menos seis puntos consecutivos, todos creciendo o decreciendo. de control ■ Hay al menos 14 puntos consecutivos que alternan entre arriba y abajo (es decir, arriba, se utilizaron para enviar a abajo, arriba, abajo, etcétera). prisión a una ■ Dos de tres puntos consecutivos se salen de los límites de control que están a 2 desvia- persona que sobornaba a ciones estándar de la línea central. jugadores de jai alai en Florida ■ Cuatro de cinco puntos consecutivos se salen de los límites de control que están a 1 para que perdieran. (Vea “Using Control Charts to Corroborate desviación estándar de la línea central. Bribery in Jai Alai”, de Charnes y Gitlow, The American Statistician, EJEMPLO 4 Interpretación de la tabla R para errores en los altímetros vol. 49, núm. 4). El auditor de una cancha de jai alai notó Examine la gráfica R que se muestra en la pantalla para el ejemplo 3 y determine si la va- que cantidades anormalmente riación del proceso está bajo control estadístico. grandes de dinero se jugaban en ciertos tipos de apuestas, y SOLUCIÓN que algunos participantes no ganaban tanto como se esperaba Podemos interpretar las gráficas de control para R aplicando los tres criterios anteriores para cuando se realizaban tales determinar si un proceso está fuera de control. Al aplicar los tres criterios a la pantalla de la apuestas. Se utilizaron gráficas gráfica R, concluimos que la variación en este proceso no está bajo control estadístico. Con- R y x en la Corte como evidencia siderando los tres criterios utilizados, vemos que los primeros dos criterios para estar fuera de patrones sumamente de control se satisfacen: (1) Existe un patrón obvio de puntos crecientes. (2) Hay dos puntos inusuales de apuestas. El por encima del límite de control superior. El tercer criterio no se cumple porque no hay ocho estudio de las gráficas de control puntos consecutivos que estén por encima o por debajo de la línea central. señala claramente puntos que se encuentran muy lejos del I N T E R P R E TA C I Ó N límite de control superior, lo que indica que el proceso de Concluimos que la variación (no necesariamente la media) del proceso está fuera de con- apuestas estaba fuera de control trol estadístico. estadístico. El especialista en estadística fue capaz de SU TURNO Resuelva el ejercicio 7 “Latas de Pepsi: Gráfica R”. identificar una fecha en la cual la variación asignable parecía Gráfica de control para monitorear medias: La gráfica x detenerse, y los fiscales supieron que se trataba de la fecha del Una gráfica x es una representación de las medias muestrales, y se usa para monitorear el arresto del sospechoso. centro en un proceso. Además de representar las medias muestrales, incluimos una línea central ubicada en x, que expresa la media de todas las medias muestrales (igual a la media de todos los valores muestrales combinados), así como otra línea para el límite de control inferior y una tercera línea para el límite de control superior. Usando el método común en los negocios y la industria, los límites de control se basan en rangos en lugar de en las desviaciones estándar. (Consulte el ejercicio 14 para obtener una gráfica x basada en las desviaciones estándar). ELEMENTOS CLAVE Monitoreo de la media del proceso: Gráfica de control para x Objetivo Elaborar una gráfica de control para x (o una gráfica x) que pueda usarse para determinar si el centro de los datos del proceso está bajo control estadístico. Requisitos 3. Los valores de datos muestrales individuales son inde- pendientes. 1. Los datos son datos de proceso que consisten en una se- cuencia de muestras del mismo tamaño n. 2. La distribución de los datos del proceso es esencialmente normal.
14-1 Gráficas de control para la variación y la media 663 Notación n 5 tamaño de cada muestra o subgrupo x 5 media de todas las medias muestrales (igual a la media de todos los valores muestrales combinados) Gráfica Puntos graficados: medias muestrales Línea central: x 5 media de todas las medias muestrales Límite de control superior (LCS): x 1 A2R (donde A2 es una constante que se encuentra en la tabla 14-2) Límite de control inferior (LCI): x 2 A2R (donde A2 es una constante que se encuentra en la tabla 14-2) EJEMPLO 5 Gráfica x de errores en los altímetros El alto costo de la baja calidad A partir de los errores en los altímetros de la tabla 14-1 en la página 655, con muestras de tamaño n 5 5 para cada uno de 20 días, elabore una gráfica de control para x. Con base en Microsoft la gráfica de control para x, determine si el proceso está bajo control estadístico. anunció que gastaría 1,150 SOLUCIÓN millones de dólares para Antes de graficar los 20 puntos correspondientes a los 20 valores de x, primero debemos reparar las encontrar los valores de la línea central y los límites de control. Obtenemos consolas del juego Xbox 360. Analistas de la x = 2.8 + 1.6 + g - 7.0 = 1.19 pies industria estiman que alrededor 20 de una tercera parte de las unidades están defectuosas y R = 8 + 14 +g + 77 = 30.65 pies necesitan reparación. Muchos 20 usuarios reportaron que la máquina se apagaba después de Con referencia a la tabla 14-2 de la página 660, encontramos que para n 5 5, que tres luces rojas intermitentes aparecían en la consola. A2 5 0.577. Dado que ya se conocen los valores de x, A2 y R, ahora podemos evaluar los límites de control. Por otro lado, la Federal Drug Administration (FDA) Límite de control superior (LCS): x 1 A2R 5 1.19 1 (0.577)(30.65) 5 18.88 pies recientemente llegó a un Límite de control inferior (LCI) x 2 A2R 5 1.19 2 (0.577)(30.65) 5 216.50 pies acuerdo en el que una compañía farmacéutica, Schering-Plough La gráfica de control resultante para x será como se muestra en la pantalla de Minitab Corporation, pagaría la cantidad adjunta. récord de 500 millones de dólares por no lograr corregir problemas Gráfica x en la producción de fármacos. Según un artículo del New York LCS=18.88 Times, de Melody Petersen, “Algunos de los problemas se Media muestral X–=1.19 relacionan con la falta de controles que identifican medicamentos LCI=16.50 defectuosos, mientras otros Día provienen de equipos demasiado viejos. Tales problemas están continúa relacionados con unos 200 medicamentos, incluyendo el Claritin, el fármaco contra alergias que es el producto más vendido de Schering”.
664 CAPÍTULO 14 Control estadístico de procesos I N T E R P R E TA C I Ó N Un examen de la gráfica x muestra que la media del proceso está fuera del control estadístico porque se cumple al menos uno de los tres criterios para estar fuera de control. Específica- mente, se cumple el primer criterio porque hay un patrón de variación creciente, que también se identificó mediante la gráfica R. SU TURNO Resuelva el ejercicio 8 “Latas de Pepsi: Gráfica x”. Al analizar los errores en los altímetros de la tabla 14-1 mediante una gráfica de rachas, una gráfica R y una gráfica x, podemos ver que el proceso está fuera del control estadístico. Si el proceso de fabricación continúa sin correcciones, muchos de los altímetros no cumplirán con las reglamentaciones de la FAA y, en consecuencia, la compañía Orange Avionics sufrirá enormes pérdidas. CENTRO DE TECNOLOGÍA Gráficas de control Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch Visite www.pearson- Gráfica de rachas 1. Haga clic en Stat en enespañol.com>triola 1. Ingrese todos los datos muestrales en la columna C1. el menú superior. para obtener instruc- 2. Haga clic en Stat en el menú superior. ciones detalladas. 3. Seleccione Quality Tools en el menú desplegable y seleccione Run 2. Seleccione Con- trol Charts en el Chart en el submenú. menú desplegable 4. En el cuadro de columna única, ingrese C1. En el tamaño de sub- y X-bar, R en el submenú. grupo, ingrese 1. 5. Haga clic en OK. 3. Seleccione las columnas que se Gráfica R y gráfica x utilizarán. 1. Ingrese los valores muestrales secuencialmente en la columna C1 o 4. Haga clic en introdúzcalos en columnas o filas como en la tabla 14-1. Compute! 2. Haga clic en Stat en el menú superior. 3. Seleccione Control Charts en el menú desplegable y seleccione Va- 5. Haga clic en los botones de flecha riable Charts for Subgroups para alternar entre 4. Seleccione Xbar-R del submenú. las gráficas y los re- 5. Seleccione el formato de los datos ingresados en el paso 1 y luego se- sultados numéricos. leccione las columnas adecuadas en el cuadro de entrada. 6. Ingrese el tamaño del subgrupo si todas las observaciones están en una columna. 7. Haga clic en el botón de Xbar-R Options y luego haga clic en la pes- taña Estimate y seleccione Rbar. 8. Haga clic en OK dos veces. Calculadora TI-83/84 Plus Excel La creación de gráficas de ra- Complemento XLSTAT (no disponible con todas las licencias de XLSTAT) chas, gráficas R y gráficas con 1. Haga clic en la pestaña XLSTAT de la cinta de opciones y luego haga clic en SPC. una calculadora TI-83/84 Plus es 2. Seleccione Subgroup charts en el menú desplegable. posible pero no se recomienda 3. Para la familia de gráficas, haga clic en Subgroup charts y seleccione la X-bar-R debido a los complejos proce- dimientos requeridos y la infor- chart en el tipo de gráfico. mación limitada que se muestra. 4. Haga clic en la pestaña General. Visite www.pearsonenespañol. 5. En formato de datos, seleccione Column si los datos se listan en columnas separa- com>triola para obtener instruc- ciones detalladas. das o One column si los datos están apilados en una sola columna. 6. Si se selecciona One column, ingrese el tamaño de muestra común a todas las en- tradas de datos en el tamaño común de subgrupo. 7. En el cuadro de datos, ingrese el rango de celdas de los datos. Si el rango de datos incluye una etiqueta, marque la casilla de Column labels. 8. Haga clic en la pestaña Estimation y seleccione R bar. 9. Haga clic en OK dos veces.
14-1 Gráficas de control para la variación y la media 665 Media muestral14-1 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Requisito de la FAA La tabla 14-1 de la página 655 lista datos de proceso que consisten en los errores (en pies) de los altímetros para avión cuando se prueban para una altitud de 2000 pies, y la Administración Federal de Aviación (FAA por sus siglas en inglés) requiere que los errores sean como máximo de 630 pies. Si las gráficas de control x y R muestran que el proceso de fabricación de altíme- tros está bajo control estadístico, ¿eso indica que los altímetros tienen errores que son como máximo de 630 pies? ¿Por qué sí o por qué no? 2. Notación y terminología Considere los datos de proceso que consisten en las cantidades (onzas) de bebida de cola en latas de Coca-Cola regular seleccionadas al azar. El proceso debe ser monitoreado me- diante gráficas de control x y R basadas en muestras de 50 latas seleccionadas al azar cada día durante 20 días consecutivos de producción. ¿Qué son las gráficas de control x y R, y qué denotan x, R, LCS y LCI? 3. Elevaciones del lago Mead Muchas personas en Nevada, Arizona y California obtienen agua y electricidad del lago Mead y de la presa Hoover. En el ejercicio 4 se muestra una gráfica x (arriba) y una gráfica R (abajo) obtenidas mediante el uso de las elevaciones mensuales (pies) del lago Mead en la Presa Hoover (según los datos del Departamento del Interior de Estados Unidos). Las gráficas de control se basan en las 12 elevaciones mensuales para cada uno de los 75 años consecutivos y recientes. ¿Qué nos dice la gráfica x sobre el lago Mead? 4. Elevaciones del lago Mead ¿Qué nos dice la gráfica R sobre el lago Mead? Minitab LCS=1169.8 X=1164.1 LCI=1158.5 Año (1 = 1940) LCS=36.52Rango muestral R=21.27 LCI=6.02 Año (1 = 1940) Latas de Pepsi. En los ejercicios 5 a 8, consulte las cargas axiales (libras) en latas de Pepsi he- chas de aluminio con un espesor de 0.0109 pulg., como se detalla en el conjunto de datos 30 “Latas de aluminio” del apéndice B. Una carga axial de una lata es el peso máximo admisible en su costado, y es importante tener una carga axial suficientemente alta para que la lata no se aplaste al presionar la tapa superior. Hay siete mediciones en cada uno de 25 días de producción. Si las 175 cargas axiales se dan en una columna, las primeras 7 son del primer día, las 7 siguientes son del segundo día, y así sucesivamente; de modo que el “tamaño del subgrupo” es 7. 5. Latas de Pepsi: Notación Después de encontrar la media muestral y el rango muestral para cada uno de los 25 días, encuentre los valores de x y R. También determine los valores del LCI y el LCS para una gráfica R, después encuentre los valores del LCI y el LCS para una gráfica x. 6. Latas de Pepsi: Grafica de rachas Trate las 175 cargas axiales como una cadena de medidas consecutivas y elabore un diagrama de rachas. ¿Qué sugiere el resultado? 7. Latas de Pepsi: Gráfica R Trate las siete mediciones de cada día como una muestra y elabore una gráfica R. ¿Qué sugiere el resultado? 8. Latas de Pepsi: Gráfica x Trate las siete mediciones de cada día como una muestra y elabore una gráfica. ¿Qué sugiere el resultado?
666 CAPÍTULO 14 Control estadístico de procesos Monedas de ¢25. En los ejercicios 9 a 12, consulte la tabla adjunta de pesos (en gramos) de mone- das de ¢25 acuñadas por el gobierno de Estados Unidos. Esta tabla está disponible para su descarga en www.pearsonenespañol.com>triola Día Hora 1 Hora 2 Hora 3 Hora 4 Hora 5 x s Rango 1 5.543 5.698 5.605 5.653 5.668 5.6334 0.0607 0.155 2 5.585 5.692 5.771 5.718 5.720 5.6972 0.0689 0.186 3 5.752 5.636 5.660 5.680 5.565 5.6586 0.0679 0.187 4 5.697 5.613 5.575 5.615 5.646 5.6292 0.0455 0.122 5 5.630 5.770 5.713 5.649 5.650 5.6824 0.0581 0.140 6 5.807 5.647 5.756 5.677 5.761 5.7296 0.0657 0.160 7 5.686 5.691 5.715 5.748 5.688 5.7056 0.0264 0.062 8 5.681 5.699 5.767 5.736 5.752 5.7270 0.0361 0.086 9 5.552 5.659 5.770 5.594 5.607 5.6364 0.0839 0.218 10 5.818 5.655 5.660 5.662 5.700 5.6990 0.0689 0.163 11 5.693 5.692 5.625 5.750 5.757 5.7034 0.0535 0.132 12 5.637 5.628 5.646 5.667 5.603 5.6362 0.0235 0.064 13 5.634 5.778 5.638 5.689 5.702 5.6882 0.0586 0.144 14 5.664 5.655 5.727 5.637 5.667 5.6700 0.0339 0.090 15 5.664 5.695 5.677 5.689 5.757 5.6964 0.0359 0.093 16 5.707 5.890 5.598 5.724 5.635 5.7108 0.1127 0.292 17 5.697 5.593 5.780 5.745 5.470 5.6570 0.1260 0.310 18 6.002 5.898 5.669 5.957 5.583 5.8218 0.1850 0.419 19 6.017 5.613 5.596 5.534 5.795 5.7110 0.1968 0.483 20 5.671 6.223 5.621 5.783 5.787 5.8170 0.2380 0.602 9. Monedas de ¢25: Notación Encuentre los valores de x y R. También determine los valores del LCI y el LCS para una gráfica R, luego encuentre los valores del LCI y LCS para una gráfica . 10. Monedas de ¢25: Gráfica R Trate las cinco mediciones de cada día como una muestra y elabore una tabla R. ¿Qué sugiere el resultado? 11. Monedas de ¢25: Gráfica x Trate las cinco mediciones de cada día como una muestra y elabore una gráfica x. ¿Qué sugiere el resultado? 12. Monedas de ¢25: Gráfica de rachas Trate las 100 mediciones consecutivas de los 20 días como valores individuales y elabore una gráfica de rachas. ¿Qué sugiere el resultado? 14-1 Más allá de lo básico 13. Gráfica s En esta sección describimos las gráficas de control para R y x basadas en rangos. Las gráficas de control para monitorear la variación y el centro (la media) también se pueden basar en las desvia- ciones estándar. Una gráfica s para monitorear la variación se traza al graficar desviaciones estándar muestrales con una línea central en s (la media de las desviaciones estándar muestrales) y límites de control en B4s y B3s, donde B4 y B3 se encuentran en la tabla 14-2 en la página 660 de esta sección. Elabore una gráfica para los datos de la tabla 14-1 en la página 655. Compare el resultado con la gráfica R del ejemplo 3 “Gráfica R de errores en altímetros”. 14. Gráfica x basada en desviaciones estándar Una gráfica x basada en desviaciones estándar (y no en rangos) se construye graficando las medias muestrales con una línea central en x y límites de control en x 1 A3s y x 2 A3s, donde A3 se encuentra en la tabla 14-2 de la página 660 y s es la media de las desviaciones estándar muestrales. Use los datos en la tabla 14-1 de la página 655 para elaborar una gráfica x basada en desviaciones estándar. Compare el resultado con la gráfica x en función de los rangos muestrales del ejemplo 5 “Gráfica x de errores en altímetros”.
14-2 Gráficas de control para atributos 667 14-2 Gráficas de control para atributos Concepto clave Esta sección presenta un método para elaborar una gráfica de control con el fin de monitorear la proporción p para algún atributo; por ejemplo, si un servicio o producto manufacturado es defectuoso o discordante. (Un bien o servicio es discordante si no cumple con las especificaciones o los requisitos dados. En ocasiones, los productos discordantes se descartan, se reparan o se “recuperan” y se venden a precios bajos). La gráfica de control se interpreta utilizando los mismos tres criterios dados en la sección 14-1 para determinar si el proceso es estadísticamente estable: Criterios para determinar si un proceso está fuera de control DEFINICIÓN Un proceso no es estadísticamente estable o está fuera de control estadístico si se cumplen uno o más de los siguientes criterios: 1. Hay un patrón, una tendencia o un ciclo que claramente no es aleatorio. 2. Hay al menos un punto por encima del límite de control superior o al menos un punto por debajo del límite de control inferior. 3. Regla de la racha de 8: Hay al menos ocho puntos consecutivos por encima o por debajo de la línea central. (Con un proceso estadísticamente estable, existe una pro- babilidad de 0.5 de que un punto esté por encima o por debajo de la línea central, por lo que es muy poco probable que ocho puntos consecutivos estén todos sobre la línea central o debajo de ella). Como en la sección 14-1, seleccionamos muestras de tamaño n en intervalos de tiempo regula- res y graficamos los puntos en una gráfica secuencial con una línea central y límites de control. (Hay formas de tratar con muestras de diferentes tamaños, pero no las consideraremos aquí). DEFINICIÓN Una gráfica de control para p (o gráfica p) es un diagrama de las proporciones de al- gún atributo (por ejemplo, si los productos son defectuosos) graficadas secuencialmente a través del tiempo e incluye una línea central, un límite de control inferior (LCI) y un límite de control superior (LCS). La notación y los valores de la gráfica de control se resumen en el siguiente recuadro de elementos clave. En este recuadro, el atributo “defectuoso” puede reemplazarse por cual- quier otro atributo relevante (de modo que cada elemento de la muestra pertenezca a una de dos categorías distintas). ELEMENTOS CLAVE Monitoreo de un atributo del proceso: Gráfica de control para p Objetivo Elabore una gráfica de control para p (o una “gráfica p”) que se pueda usar para determinar si la proporción de algún atributo (por ejemplo, si los productos son defectuosos) de los datos del proceso se encuentran bajo control estadístico. Requisitos 3. Los valores de datos muestrales individuales son inde- pendientes. 1. Los datos son datos de proceso que consisten en una se- cuencia de muestras del mismo tamaño n. continúa 2. Cada elemento de la muestra pertenece a una de dos cate- gorías (como defectuoso o no defectuoso).
668 CAPÍTULO 14 Control estadístico de procesos Notación p = estimación de la proporción de artículos defectuosos en el proceso número total de defectos encontrados entre todos los artículos muestreados = número total de artículos muestreados q = estimación de la proporción de elementos del proceso que no son defectuosos =1 - p n = tamaño de cada muestra o subgrupo individual Gráfica Puntos representados: proporciones de las muestras individuales de tamaño n Línea central: p pq Límite de control superior: p + 3A n (Use 1 si este resultado es mayor que 1). pq Límite de control inferior: p - 3A n (Use 0 si este resultado es menor que 0). PRECAUCIÓN Tenga en cuenta la siguiente distinción en los cálculos: Al evaluar p, divida el número total de defectos entre el número total de elementos muestreados. Sin embargo, los cálculos para el LCS y el LCI requieren división por n, el tamaño de cada muestra individual. Usamos p como línea central porque es la mejor estimación de la proporción de defec- tos del proceso. Las expresiones para los límites de control corresponden a los límites del intervalo de confianza del 99.7% para los intervalos de confianza descritos en la sección 7-1. (La sección 7-1 no incluyó ningún intervalo de confianza del 99.7%, pero la puntuación z utilizada para éste es z 5 2.97, redondeada a 3 en las expresiones utilizadas para el LCI y el LCS en esta sección). EJEMPLO 1 Altímetros para avión defectuosos El problema del capítulo describe el proceso de fabricación de altímetros para aviones. La sección 14-1 incluye ejemplos de gráficas de control para monitorear los errores en las lecturas del altímetro. Se considera que un altímetro está defectuoso si no se puede calibrar o corregir para obtener lecturas precisas (a menos de 30 pies de la altitud real de 2000 pies). La compañía Orange Avionics fabrica altímetros en lotes de 100, y cada altímetro se prueba y se determina si es aceptable o defectuoso. A continuación se lis- tan los altímetros defectuosos en lotes sucesivos de 100. Elabore una gráfica de control para la proporción p de altímetros defectuosos y determine si el proceso está bajo con- trol estadístico. Si no es así, identifique cuál de los tres criterios de un proceso fuera de control se aplica. Defectos: 2 0 1 3 1 2 2 4 3 5 12 7
14-2 Gráficas de control para atributos 669 SOLUCIÓN Control de calidad en Perstorp La línea central para la gráfica de control se encuentra con el valor de p: Perstorp número total de defectos en todas las muestras combinadas Components, p= , Inc. utiliza una computadora número total de altímetros muestreados que genera automática- = 2 + 0 +1 +g + 7 = 42 = 0.035 mente gráficas 100 1200 de control para monitorear el 12 # grosor del aislamiento del piso que fabrica para las camionetas Debido a que p 5 0.035, se sigue que q 5 1 2 p 5 0.965. Mediante el uso de p 5 0.035, Ford Ranger y Jeep Grand q 5 0.965, y n 5 100, encontramos los límites de control de la siguiente manera: Cherokee. El costo de la computadora de $20,000 Límite de control superior: se compensó con los ahorros de $40,000 del primer año de p q 10.0352 10.9652 = 0.090 operaciones, dinero que se p + 3 B n = 0.035 + 3B empleaba anteriormente 100 para generar gráficas de control de forma manual que Límite de control inferior: aseguraban que el grosor del aislamiento cumpliera con las p - pq = 0.035 - 3B 10.0352 10.9652 = - 0.020 especificaciones establecidas 3B n entre 2.912 y 2.988 mm. Por 100 medio de gráficas de control y de otros métodos de control Debido a que el límite de control inferior es negativo, utilizamos en su lugar el valor de 0. de calidad, Perstorp redujo sus Una vez encontrados los valores para la línea central y los límites de control, podemos mermas en más de dos tercios. proceder a trazar la gráfica de control para las proporciones de altímetros defectuosos. La gráfica de control de Minitab para p se muestra en la pantalla adjunta. Minitab Proporción de defectos LCS=0.090 P=0.035 LCI=0 Muestra I N T E R P R E TA C I Ó N Podemos interpretar la gráfica de control para p considerando los tres criterios para un proceso fuera de control listados anteriormente en esta sección. Concluimos que el proceso está fuera del control estadístico por las siguientes razones: parece haber una tendencia al alza y hay un punto que se extiende más allá del límite de control superior. La compañía debe tomar medidas correctivas inmediatas. SU TURNO Resuelva el ejercicio 5 “Monedas de un euro”. PRECAUCIÓN Los límites de control superior e inferior de una gráfica de control para una proporción p se basan en el comportamiento real del proceso, no en el compor- tamiento deseado. Los límites de control superior e inferior no están relacionados con ninguna de las especificaciones del proceso que pudiera haber establecido el fabricante.
670 CAPÍTULO 14 Control estadístico de procesos CENTRO DE TECNOLOGÍA Gráfica de control para p Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch Visite www.pearson 1. Ingrese el número de defectos (o elementos con 1. Haga clic en Stat en el menú superior. enespañol.com> cualquier atributo particular) en la columna C1. 2. Seleccione Control Charts en el menú triola para obtener instrucciones 2. Haga clic en Stat en el menú superior. desplegable y p del submenú. detalladas. 3. Seleccione Control Charts en el menú des- 3. Seleccione la columna que se utilizará, plegable y seleccione Attribute Charts y P del seleccione Constant e ingrese el ta- submenú. maño de las muestras individuales. 4. En el cuadro de variables, ingrese la columna C1. 4. Haga clic en Compute! 5. En los tamaños de subgrupo ingrese el tamaño 5. Haga clic en los botones de flecha para de las muestras individuales. alternar entre la gráfica y los resultados 6. Haga clic en OK. numéricos. Calculadora TI-83/84 Plus Excel No disponible. Complemento XLSTAT (no disponible con todas las licencias XLSTAT) 1. Haga clic en la pestaña XLSTAT en la cinta de opciones y luego haga clic en SPC. 2. Seleccione Attribute charts en el menú desplegable. 3. Para la familia de gráficas, haga clic en Attribute charts y seleccione P chart en el tipo de gráfico. 4. Haga clic en la pestaña General. 5. En el cuadro de datos, ingrese el rango de celdas de los datos. Si el rango de datos incluye una etiqueta, marque la casilla de Column labels. 6. En el cuadro del tamaño de subgrupo común, ingrese el tamaño de muestra que es común a todas las entradas de datos. 7. Haga clic en OK. Los resultados incluyen una gráfica p. 14-2 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Monedas de 25¢ Las especificaciones para una moneda de 25¢ requieren que sea 8.33% de níquel y 91.67% de cobre; debe pesar 5.670 g y tener un diámetro de 24.26 mm y un espesor de 1.75 mm; asimismo, debe tener 119 ranuras en el borde. Una moneda de 25¢ se considera defectuosa si se des- vía sustancialmente de esas especificaciones. Se monitorea un proceso de producción, se registran los defectos y se obtiene la gráfica de control adjunta. ¿Este proceso parece estar bajo control estadístico? De lo contrario, identifique cualquier criterio de un proceso fuera de control que se cumpla. ¿Se está deteriorando el proceso de fabricación? LCS=0.1865 Proporción de defectos P=0.0975 LCI=0.0085 Muestra
14-2 Gráficas de control para atributos 671 2. Notación La gráfica de control para el ejercicio 1 muestra un valor de p 5 0.0975. ¿Qué significa ese valor y cómo se obtiene? ¿Qué indican el LCS y el LCI? 3. Límites de control Al elaborar una gráfica de control para las proporciones de monedas de diez centavos defectuosas, se encuentra que el límite inferior de control es 20.00325. ¿Cómo se debe ajustar ese valor? 4. Monedas de un euro Después de elaborar una gráfica de control para las proporciones de monedas de un euro defectuosas, se concluye que el proceso está bajo control estadístico. ¿Esto implica que casi todas las monedas cumplen con las especificaciones deseadas? Explique. Gráficas de control para p. En los ejercicios 5 a 12, use los datos de proceso dados para elaborar una gráfica de control para p. En cada caso, use los tres criterios presentados al principio de esta sección para determinar si el proceso está bajo control estadístico. Si no es así, identifique cuál de los tres criterios para un proceso fuera de control se aplica. 5. Monedas de un euro Considere un proceso de acuñación de monedas con valor de un euro. A continuación se listan las cantidades de monedas defectuosas en lotes sucesivos de 10,000 monedas seleccionadas al azar en días consecutivos de producción. 32 21 25 19 35 34 27 30 26 33 6. Monedas de un euro Repita el ejercicio 5, suponiendo que el tamaño de cada lote es de 100 en lugar de 10,000. Compare la gráfica de control con la encontrada para el ejercicio 5. Comente sobre la calidad general del proceso de fabricación descrito en el ejercicio 5 en comparación con el proceso de fabricación descrito en este ejercicio. 7. Tabletas de aspirina Los frascos de tabletas de aspirina suelen tener etiquetas que indican que cada tableta contiene 325 mg de aspirina, pero las cantidades reales pueden variar entre 315 mg y 335 mg. Una tableta es defectuosa si tiene menos de 315 mg o más de 335 mg de aspirina. A continua- ción se listan los defectos encontrados en lotes de 1000 tabletas. 16 18 13 9 10 8 6 5 5 3 8. Desfibriladores Al menos una corporación fue demandada por la fabricación de desfibriladores cardíacos defectuosos. A continuación se listan las cantidades de desfibriladores defectuosos en lotes sucesivos de 1000. Elabore una gráfica de control para la proporción p de desfibriladores defec- tuosos y determine si el proceso está bajo control estadístico. Si no es así, identifique cuál de los tres criterios para un proceso fuera de control se aplica. 8 5 6 4 9 3 12 7 8 5 22 4 9 10 11 8 7 6 8 5 9. Tasa de votación En cada uno de los años recientes y consecutivos en los que hubo elecciones presidenciales, se seleccionaron aleatoriamente 1000 personas en edad de votar en Estados Unidos y se determinó el número de personas que realmente votaron, con los resultados que se listan a continua- ción. Comente sobre el comportamiento de la votación de la población. 631 619 608 552 536 526 531 501 551 491 513 553 568 10. Baterías de automóvil Las baterías de automóvil defectuosas son una molestia porque pueden dañar e incomodar a los conductores, incluso podrían ponerlos en peligro. Se considera que una batería de automóvil es defectuosa si falla antes de que expire la garantía. Los defectos se identifican cuando las baterías se devuelven según el programa de garantía. La corporación Powerco Battery fabrica baterías de automóvil en lotes de 250, y los números de defectos se listan a continuación para cada uno de 12 lotes consecutivos. ¿El proceso de fabricación requiere corrección? 3 4 2 5 3 6 8 9 12 14 17 20 11. Latas de bebidas de cola En cada uno de varios días consecutivos de producción de latas de refresco de cola, se prueban 50 latas y a continuación se lista el número de defectos por día. ¿Las pro- porciones de defectos parecen ser aceptables? ¿Qué acción se debería tomar? 8 7 9 8 10 6 5 7 9 12 9 6 8 7 9 8 11 10 9 7 12. Baterías de teléfonos inteligentes La compañía SmartBatt fabrica baterías para teléfonos inte- ligentes. A continuación listan las cantidades de defectos en lotes de 200 baterías seleccionadas al azar en cada uno de 12 días consecutivos de producción. ¿Qué acción se debería tomar? 5 7 4 6 3 10 10 13 4 15 4 19
672 CAPÍTULO 14 Control estadístico de procesos 14-2 Más allá de lo básico 13. Gráfica np Una variación de la gráfica de control para p es la gráfica np, en la que se grafican los números reales de defectos en lugar de las proporciones de defectos. El gráfico np tiene una línea central con valor de np, y los límites de control tienen valores de np + 3 np q y np - 3 np q. Las gráficas p y np difieren sólo en la escala de valores utilizada para el eje vertical. Elabore la gráfica np para el ejemplo 1 “Altímetros para avión defectuosos” en esta sección. Compare la gráfica np con la gráfica de control para p que se proporciona en la presente sección. Examen rápido del capítulo 1. ¿Qué son los datos de proceso? 2. ¿Cuál es la diferencia entre la variación aleatoria y la variación asignable? 3. Identifique tres criterios específicos para determinar cuándo un proceso está fuera de control estadístico. 4. ¿Cuál es la diferencia entre una gráfica R y una gráfica x ? En los ejercicios 5 a 8, use las siguientes dos gráficas de control que resultan de probar lotes de altímetros para avión recién fabricados, con 100 en cada lote. Los valores muestrales originales son errores (en pies) obtenidos al probar los altímetros en una cámara de presión que simula una altitud de 6000 pies. La Administración Federal de Aviación requiere un error de no más de 40 pies a esa altura. Media muestral LCS=1.77 X=–2.24 Muestra LCI=–6.26 Rango muestral LCS=91.4 R=67.0 LCI=42.5 Muestra 5. ¿La variación del proceso está bajo control estadístico? ¿Por qué sí o por qué no? 6. ¿Cuál es el valor de R? En general, ¿cómo se obtiene un valor de R? 7. ¿La media del proceso está bajo control estadístico? ¿Por qué sí o por qué no? 8. ¿Cuál es el valor de x? En general, ¿cómo se encuentra un valor de x? 9. Si la gráfica R y la gráfica x muestran que el proceso de fabricación de altímetros para avión está bajo control estadístico, ¿podemos concluir que los altímetros satisfacen el requisito de la Adminis- tración Federal de Aviación de tener errores no mayores a 40 pies cuando se prueban a una altitud de 6000 pies?
CAPÍTULO 14 Ejercicios de repaso 673 10. Examine la siguiente gráfica p para baterías de calculadora defectuosas y describa brevemente la acción que debe tomarse. LCS=0.12338 Proporción P=0.858 LCI=0.04822 Muestra Ejercicios de repaso Consumo de energía. Los ejercicios 1 a 5 se refieren a la cantidad de energía consumida en el hogar del autor. (La mayoría de los datos son reales, pero algunos se inventaron). Cada valor representa la energía consumida (kWh) en un periodo de dos meses. Considere que cada subgrupo consiste en las seis cantidades pertenecientes al mismo año. Los datos pueden descargarse de www.pearsonenespañol.com>triola. Año 1 Ene.-Feb. Mar.-Abr. Mayo-Jun. Jul.-Ago. Sept.-Oct. Nov.-Dic. Año 2 3637 2888 2359 3704 3432 2446 Año 3 4463 2482 2762 2288 2423 2483 Año 4 3375 2661 2073 2579 2858 2296 Año 5 2812 2433 2266 3128 3286 2749 Año 6 3427 578 3792 3348 2937 2774 Año 7 4016 3458 3395 4249 4003 3118 Año 8 5261 2946 3063 5081 2919 3360 3853 3174 3370 4480 3710 3327 1. Consumo de energía: Notación Después de encontrar los valores de la media y el rango para cada año, encuentre los correspondientes a x y R. Después determine los valores del LCI y el LCS para una gráfica R y para una gráfica x . 2. Consumo de energía: Gráfica R Considere que cada subgrupo consiste en los 6 valores per- tenecientes a un año. Elabore una gráfica R y determine si la variación del proceso está bajo control estadístico. Si no es así, identifique cuál de los tres criterios para un proceso fuera de control conduce al rechazo de la variación estadísticamente estable. 3. Consumo de energía: Gráfica x Considere que cada subgrupo consiste en los 6 valores pertene- cientes a un año. Elabore una gráfica x y determine si la media del proceso está bajo control estadístico. Si no es así, identifique cuál de los tres criterios para un proceso fuera de control conduce al rechazo de una media estadísticamente estable. 4. Consumo de energía: Gráfica de rachas Elabore una gráfica de rachas para los 48 valores. ¿Pa- rece haber un patrón que sugiera que el proceso no está bajo control estadístico? 5. Tiempos de servicio El restaurante Newport registra los tiempos (minutos) que transcurren antes de que se solicite a los clientes su pedido. Cada día, 50 clientes se seleccionan al azar y el pedido se considera defectuoso si demora más de tres minutos. A continuación se listan las cantidades de pedidos defectuosos en días consecutivos. Elabore una gráfica de control apropiada y determine si el proceso está bajo control estadístico. Si no es así, identifique qué criterios conducen al rechazo de la estabilidad estadística. 3 2 3 5 4 6 7 9 8 10 11 9 12 15 17
674 CAPÍTULO 14 Control estadístico de procesos Ejercicios de repaso acumulado 1. Médicos en Internet: Intervalo de confianza En una encuesta aplicada a n 5 2015 adultos, 1108 de ellos dijeron que conocían más a menudo los síntomas de enfermedades a través de Internet que por su médico (según una encuesta de MerckManuals.com). Use los datos para elaborar una estimación del intervalo de confianza del 95% para la proporción poblacional de todos los adultos que dicen que cono- cen más a menudo los síntomas de enfermedades a través de Internet que por su médico. ¿El resultado sugiere que la mayoría de los adultos conocen más a menudo los síntomas de enfermedades a través de Internet que por su médico? 2. Médicos en Internet: Prueba de hipótesis Utilice los resultados de la encuesta dados en el ejercicio 1 y use un nivel de significancia de 0.05 para evaluar la afirmación de que la mayoría de los adultos conocen más a menudo los síntomas de enfermedades a través de Internet que por su médico. 3. Médicos en Internet: Gráfica La gráfica adjunta fue creada para representar los resultados de la encuesta descrita en el ejercicio 1. ¿Es la gráfica algo engañosa? ¿Si es así, por qué? Frecuencia Sí No ¿Usa el internet más que el médico? 4. Médicos en Internet: Probabilidad Según los datos de la encuesta proporcionados en el ejercicio 1, suponga que 55% de los adultos conocen más a menudo los síntomas de enfermedades a través de Internet que por su médico. a. Encuentre la probabilidad de que tres adultos seleccionados al azar conozcan más a menudo los síntomas de enfermedades a través de Internet que por su médico. b. Encuentre la probabilidad de que al seleccionar tres adultos aleatoriamente, al menos uno de ellos conozca más menudo los síntomas de enfermedades a través de Internet que por su médico. 5. Manchas solares y el DJIA A continuación se listan las cantidades anuales de manchas solares combinados con los valores anuales más altos del Promedio Industrial Dow Jones (DJIA, por sus siglas en inglés). Las cantidades de manchas solares se miden de acuerdo con los puntos oscuros en el Sol, y el índice DJIA mide el valor de ciertas acciones seleccionadas. Los datos son de años recientes y con- secutivos. Use un nivel de significancia de 0.05 para probar una correlación lineal entre los valores del DJIA y las cantidades de manchas solares. ¿El resultado es sorprendente? Manchas solares 45 31 46 31 50 48 56 38 65 51 DJIA 10,941 12,464 14,198 13,279 10,580 11,625 12,929 13,589 16,577 18,054 6. Manchas solares y el DJIA Utilice los datos del ejercicio 5 y encuentre la ecuación de la línea de regresión. Luego, determine el mejor valor predicho del DJIA en el año 2004, cuando el número de manchas solares fue de 61. ¿Cómo se compara el resultado con el valor real del DJIA de 10,855? 7. Estaturas Con base en el conjunto de datos 1 “Datos corporales” en el apéndice B, suponga que las estaturas de los hombres se distribuyen normalmente, con una media de 68.6 pulgadas y una desviación estándar de 2.8 pulgadas. a. La Guardia Costera de Estados Unidos exige que los hombres tengan una altura entre 60 y 80 pulga- das. Encuentre el porcentaje de hombres que satisfacen ese requisito de estatura. b. Encuentre la probabilidad de que 4 hombres elegidos al azar tengan estaturas con una media mayor a 70 pulg.
CAPÍTULO 14 Proyecto de tecnología 675 8. Sistemas de seguridad infantil defectuosos La compañía Tracolyte Manufacturing produce bastidores de plástico para asientos infantiles de automóvil. Durante cada semana de producción, el Departamento de Transporte selecciona y prueba 120 bastidores acerca de su cumplimiento de todas las regulaciones. Los bastidores se consideran defectuosos si no cumplen con todos los requisitos. A continuación se listan cantidades de bastidores defectuosos entre los 120 que se prueban cada sema- na. Use una gráfica de control para p con el fin de verificar que el proceso esté bajo control estadístico. Si no está bajo control, explique por qué no lo está. 3 2 4 6 5 9 7 10 12 15 9. Sistemas de seguridad infantil Use las cantidades de sistemas de seguridad infantil defectuosos que se proporcionan en el ejercicio 8. Encuentre la media, la mediana y la desviación estándar. ¿Qué característica importante de los datos muestrales se pasa por alto si exploramos los datos mediante el uso de esos estadísticos? 10. ¿Vale la pena declararse culpable? La tabla adjunta resume los datos muestrales selecciona- dos al azar de acusados en casos de robo en San Francisco (con base en datos de “Does It Pay to Plead Guilty? Differential Sentencing and the Functioning of the Criminal Courts”, de Brereton y Casper, Law and Society Review, vol. 16, núm. 1). Todos los sujetos tenían condenas carcelarias previas. Use un nivel de significancia de 0.05 para probar la afirmación de que la sentencia (enviado a prisión o no enviado a prisión) es independiente de la declaración de culpabilidad. Si usted fuera un abogado que defiende a un acusado culpable, ¿estos resultados sugieren que debe alentar una declaración de culpabilidad? Enviado a prisión Se declara Se declara no No enviado a prisión culpable culpable 392 58 564 14 Proyecto de tecnología a. Simule el siguiente proceso durante 20 días: cada día, 200 calculadoras se fabrican con una tasa de defectos del 5% y la proporción de defectos se registra para cada uno de los 20 días. Las calculadoras de un día se simulan generando al azar 200 números, donde cada número se encuentra entre 1 y 100. Considere que un resultado de 1, 2, 3, 4 o 5 es un defecto, siendo aceptable de 6 a 100. Esto corresponde a una tasa de defectos del 5%. (Sugerencia: Consulte el proyecto de tecnología del capítulo 11 en la página 563 para obtener sugerencias sobre tecnología). b. Elabore una gráfica p para la proporción de calculadoras defectuosas y determine si el proceso está bajo control estadístico. Como sabemos que el proceso es realmente estable con p 5 0.05, la conclusión de que no es estable sería un error de tipo I; es decir, tendríamos una señal positiva falsa, lo que hace que creamos que el proceso debe ajustarse cuando, en realidad, debe dejarse como está. c. El resultado del inciso (a) es una simulación de 20 días. Ahora simule otros 10 días de fabrica- ción de calculadoras, pero modifique estos últimos 10 días para que la tasa de defectos sea de 10% en vez de 5%. d. Combine los datos generados en los incisos (a) y (c) para representar un total de 30 días de resultados muestrales. Elabore una gráfica p para este conjunto combinado de datos. ¿El proceso está fuera de control estadístico? Si llegamos a la conclusión de que el proceso no está fuera de control estadístico, estaríamos cometiendo un error de tipo II; es decir, creemos que el proceso está bien cuando, de hecho, debe modificarse para corregir el cambio al 10% en la tasa de defectos.
676 CAPÍTULO 14 Control estadístico de procesos DE LOS DATOS A LA DECISIÓN Pensamiento crítico: ¿Están las cargas axiales bajo tes son del segundo día, y así sucesivamente, de modo que el control estadístico? ¿El proceso de fabricación de latas “tamaño del subgrupo” es 7. funciona como debería? Análisis de los resultados Los ejercicios 5 a 8 en la sección 14-1 utilizaron datos de pro- ceso de la fabricación de latas de aluminio con 0.0109 pulgadas En función de los datos de proceso dados, ¿debería la empre- de espesor. Consulte el conjunto de datos 30 “Latas de alumi- sa tomar alguna medida correctiva? Escriba un informe que nio” en el apéndice B y realice un análisis de los datos de proceso resuma sus conclusiones. Aborde no sólo la cuestión de la es- para latas con un espesor de 0.0111 pulgadas. Los valores en el tabilidad estadística sino también la capacidad de las latas para conjunto de datos son las cargas axiales medidas en las latas, y resistir las presiones aplicadas cuando las tapas superiores se las tapas superiores se presionan en su sitio con presiones que presionan en su sitio. También compare el comportamiento de varían entre 158 lb y 165 lb. Las 175 cargas axiales se dan en las latas de 0.0111 pulgadas con el comportamiento de las latas una columna, las primeras 7 son del primer día, las 7 siguien- de 0.0109 pulgadas, y recomiende qué espesor se debe utilizar. Actividades en equipo 1. Actividad fuera de clase Colecte sus propios datos de proceso y analícelos utilizando los méto- dos de este capítulo. Sería ideal recopilar datos de un proceso de fabricación real, pero eso podría ser difícil. En su lugar, considere usar una simulación o hacer referencia a datos publicados. Obtenga una copia de los resultados de la computadora y escriba un breve informe que resuma sus conclusiones. A continuación damos algunas sugerencias: • Dispare cinco tiros libres de básquetbol (o lance cinco hojas de papel arrugadas en una papelera) y anote el número de tiros acertados; luego repita este procedimiento 20 veces. Use una gráfico p para comprobar la estabilidad estadística en la proporción de tiros acertados. • Mida su pulso contando la cantidad de veces que su corazón late en 1 minuto. Mida su pulso cuatro veces por hora durante varias horas, luego elabore las gráficas de control adecuadas. ¿Qué factores contribuyen a la variación aleatoria? ¿y a la variación asignable? • Busque en Internet y registre el Promedio Industrial Dow Jones (DJIA) al cierre de cada día hábil de las últimas 12 semanas. Use gráficas de rachas y control para explorar la estabilidad estadística del DJIA. Identifique al menos una consecuencia práctica de tener este proceso estadísticamente estable e identifique al menos una consecuencia práctica de tener este proceso fuera de control estadístico. • Encuentre la tasa de matrimonios por cada 10,000 habitantes durante varios años. Suponga que cada año se seleccionan y encuestan 10,000 personas al azar para determinar si están casados. Use una grá- fica p para evaluar la estabilidad estadística de la tasa de matrimonios. (Otras tasas posibles: muerte, accidente fatal, crimen). • Busque en Internet y encuentre las cantidades de carreras anotadas por su equipo de béisbol favorito en juegos recientes, luego use gráficas de rachas y control para explorar el control estadístico. 2. Actividad en clase Si el profesor puede proporcionar el número de faltas en cada clase, grupos de tres o cuatro estudiantes pueden analizarlo en cuanto a su estabilidad estadística y hacer recomendacio- nes basadas en las conclusiones. 3. Actividad fuera de clase Realice una investigación para encontrar una descripción del experimen- to del embudo de Deming, luego use un embudo y canicas para recopilar datos de las diferentes reglas para ajustar la ubicación del embudo. Elabore las gráficas de control apropiadas para las diferentes reglas de ajuste del embudo. ¿Qué ilustra el experimento del embudo? ¿A qué conclusión se llega?
15 677 4LA ÉTICA EN ESTADÍSTICA PROBABILITY Concepto clave A pesar de que los métodos estadísticos nos otorgan un gran poder para comprender mejor el mundo en el que vivimos, éste también brinda oportunidades para usos que son fundamentalmente antiéticos. Es importante considerar algunos problemas éticos en la estadística; la presente sección considera tales aspectos relacionados con la recolección de datos, el análisis y la generación de informes. I. Recolección de datos En ocasiones, los usos poco éticos de la estadística comienzan con el proceso de recolección de datos. Ocasionalmente, los seres humanos son tratados de maneras que no son éticas y las muestras pueden sesgarse de formas que tampoco lo son. Tratamiento humano durante la obtención de datos Existen muchos estudios en los que la salud y la seguridad de los sujetos de una investiga- ción se han visto comprometidas para que otros pudieran resultar beneficiados. Estudios con prisioneros A principios de la década de 1970, se estimó que 90% de las investigaciones farmacéuticas en Estados Unidos se realizaban utilizando prisioneros como sujetos de prueba, a veces sin su conocimiento o consentimiento. En la actualidad, la Regla Común (que se describe más adelante en esta sección) protege a los sujetos humanos de in- vestigación en Estados Unidos. Experimento de Milgram Durante la década de 1960, Stanley Milgram llevó a cabo uno de los estudios psicológicos más infames. Se ordenó a los sujetos que administraran “descar- gas eléctricas” progresivamente más fuertes a actores que se encontraban en otra habitación. Estos actores no eran visibles para el sujeto y en realidad no recibían ninguna descarga. Los gritos grabados previamente se reproducían de modo que el sujeto pudiera escucharlos. El actor golpeaba la pared y suplicaba al sujeto que se detuviera. Antes del experimento, los expertos estimaron que sólo 3% de los sujetos continuaría dando descargas después de escuchar los gritos y las súplicas para detenerse, pero 65% de los sujetos aumentaron las descargas hasta alcanzar el máximo de 375 voltios. Este experimento infligió una angustia extrema en los sujetos y ahora se considera poco ético y psicológicamente abusivo. Sesgo del muestreo Los investigadores pueden sesgar intencional o involuntariamente su estudio mediante el uso de una muestra parcial. El sesgo en el muestreo puede distorsionar seriamente los resultados
678 CAPÍTULO 15 La ética en estadística y llevar a conclusiones erróneas o engañosas. En algunos casos, los investigadores usaron in- tencionalmente muestras sesgadas para garantizar que se obtuvieran los resultados deseados. Selección arreglada El informe “¿Están los investigadores escogiendo los participantes en sus estudios de antidepresivos?” de la Escuela de Ciencias de la Salud en la University of Pittsburgh, describió los resultados de estudios clínicos realizados con el objetivo de obte- ner la aprobación de antidepresivos por parte de la Administración de Alimentos y Medica- mentos. Sólo un pequeño porcentaje de los individuos deprimidos cumplió con los criterios requeridos para participar en el ensayo clínico y aquellos que calificaron tuvieron mejores re- sultados que otras personas deprimidas que no calificaron. En este caso, los criterios necesarios para participar en el ensayo clínico crearon un sesgo muestral que favorecía a los fabricantes de medicamentos que patrocinaron la investigación. Sesgo de no respuesta El sesgo de no respuesta ocurre cuando las personas que no responden a una encuesta difieren de aquellos que sí la responden. Dos aspectos del tema de una encuesta que afectan las respuestas son la prominencia (si el tema es de interés o no para el encuestado) y la deseabilidad social (si el tema es amenazante o embarazoso, o si no lo es). Un estudio encontró que cuando un tema tiene un gran interés para los encuestados, las probabilidades de obtener una respuesta aumentan casi al doble. Otros estudios han encontrado que los comporta- mientos socialmente deseables, como el ejercicio y la buena nutrición, con frecuencia se decla- ran en exceso, mientras que los comportamientos indeseables, como fumar, no son aceptados. Para la investigación del alcohol, varios estudios han demostrado que los bebedores empeder- nidos tienen menos probabilidades de responder. (Vea “Non-response Bias in a Sample Survey on Alcohol Consumption”, de V. M. Lahaut et al., Alcohol and Alcoholism). Sesgo del entrevistador La manera en que se formula una pregunta puede afectar la res- puesta. El autor recibió una encuesta por correo que formulaba las siguientes preguntas re- dactadas de una manera en que se pretendía afectar las respuestas: ■ “¿Apoya usted la creación de una política nacional de seguridad social que sea adminis- trada por burócratas en Washington, DC?” ■ “¿Está usted a favor de crear un ‘Cuerpo de Voluntarios Ciudadanos’ financiado por el gobierno, que les pague a los jóvenes para que trabajen en iglesias y organizaciones benéficas, realizando el trabajo que ahora hacen los veteranos militares, y que reciban la misma paga y prestaciones que éstos?” Sesgo voluntario Las personas que se ofrecen como voluntarias para participar constituyen una muestra de respuesta voluntaria y, a menudo, tienen características diferentes en com- paración con los participantes que son seleccionados por quienes realizan la encuesta. Los efectos del sesgo voluntario han sido ampliamente estudiados para el tema de la sexualidad humana. “Volunteer Bias in Sexuality Research” de D. S. Strassberg et al., Departamento de Psicología de la University of Utah, encontró que, en comparación con los no voluntarios, los sujetos voluntarios presentaban una actitud más positiva hacia la sexualidad, menos culpa y más experiencia sexual. II. Análisis Con frecuencia, los resultados de los estudios de investigación se distorsionan por un análisis inadecuado. Aunque los datos muestrales pueden no ser concluyentes, ser insuficientes o apo- yar un resultado indeseable, muchos investigadores han sucumbido a presiones para informar resultados significativos o “concluyentes” a través de análisis negligentes y poco éticos. Datos falsificados Varias encuestas han intentado determinar la incidencia de la falsifica- ción o fabricación de datos entre los científicos. “How Many Scientists Fabricate and Fal- sify Research? A Systematic Review and Meta-Analysis of Survey Data”, de D. Fanelli, PLoS ONE, vol. 4, núm. 5, encontró que casi 2% de los científicos admitieron haber fabricado, falsi- ficado o modificado datos o resultados al menos una vez. Es probable que sea una estimación
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372
- 373
- 374
- 375
- 376
- 377
- 378
- 379
- 380
- 381
- 382
- 383
- 384
- 385
- 386
- 387
- 388
- 389
- 390
- 391
- 392
- 393
- 394
- 395
- 396
- 397
- 398
- 399
- 400
- 401
- 402
- 403
- 404
- 405
- 406
- 407
- 408
- 409
- 410
- 411
- 412
- 413
- 414
- 415
- 416
- 417
- 418
- 419
- 420
- 421
- 422
- 423
- 424
- 425
- 426
- 427
- 428
- 429
- 430
- 431
- 432
- 433
- 434
- 435
- 436
- 437
- 438
- 439
- 440
- 441
- 442
- 443
- 444
- 445
- 446
- 447
- 448
- 449
- 450
- 451
- 452
- 453
- 454
- 455
- 456
- 457
- 458
- 459
- 460
- 461
- 462
- 463
- 464
- 465
- 466
- 467
- 468
- 469
- 470
- 471
- 472
- 473
- 474
- 475
- 476
- 477
- 478
- 479
- 480
- 481
- 482
- 483
- 484
- 485
- 486
- 487
- 488
- 489
- 490
- 491
- 492
- 493
- 494
- 495
- 496
- 497
- 498
- 499
- 500
- 501
- 502
- 503
- 504
- 505
- 506
- 507
- 508
- 509
- 510
- 511
- 512
- 513
- 514
- 515
- 516
- 517
- 518
- 519
- 520
- 521
- 522
- 523
- 524
- 525
- 526
- 527
- 528
- 529
- 530
- 531
- 532
- 533
- 534
- 535
- 536
- 537
- 538
- 539
- 540
- 541
- 542
- 543
- 544
- 545
- 546
- 547
- 548
- 549
- 550
- 551
- 552
- 553
- 554
- 555
- 556
- 557
- 558
- 559
- 560
- 561
- 562
- 563
- 564
- 565
- 566
- 567
- 568
- 569
- 570
- 571
- 572
- 573
- 574
- 575
- 576
- 577
- 578
- 579
- 580
- 581
- 582
- 583
- 584
- 585
- 586
- 587
- 588
- 589
- 590
- 591
- 592
- 593
- 594
- 595
- 596
- 597
- 598
- 599
- 600
- 601
- 602
- 603
- 604
- 605
- 606
- 607
- 608
- 609
- 610
- 611
- 612
- 613
- 614
- 615
- 616
- 617
- 618
- 619
- 620
- 621
- 622
- 623
- 624
- 625
- 626
- 627
- 628
- 629
- 630
- 631
- 632
- 633
- 634
- 635
- 636
- 637
- 638
- 639
- 640
- 641
- 642
- 643
- 644
- 645
- 646
- 647
- 648
- 649
- 650
- 651
- 652
- 653
- 654
- 655
- 656
- 657
- 658
- 659
- 660
- 661
- 662
- 663
- 664
- 665
- 666
- 667
- 668
- 669
- 670
- 671
- 672
- 673
- 674
- 675
- 676
- 677
- 678
- 679
- 680
- 681
- 682
- 683
- 684
- 685
- 686
- 687
- 688
- 689
- 690
- 691
- 692
- 693
- 694
- 695
- 696
- 697
- 698
- 699
- 700
- 701
- 702
- 703
- 704
- 705
- 706
- 707
- 708
- 709
- 710
- 711
- 712
- 713
- 714
- 715
- 716
- 717
- 718
- 719
- 720
- 721
- 722
- 723
- 724
- 725
- 726
- 727
- 728
- 729
- 730
- 731
- 732
- 733
- 734
- 735
- 736
- 737
- 738
- 739
- 740
- 741
- 742
- 743
- 744
- 745
- 746
- 747
- 748
- 749
- 750
- 751
- 752
- 753
- 754
- 755
- 756
- 757
- 758
- 759
- 760
- 761
- 762
- 763
- 764
- 765
- 766
- 767
- 768
- 769
- 770
- 771
- 772
- 773
- 774
- 775
- 776
- 777
- 778
- 779
- 780
- 781
- 782
- 783
- 784
- 785
- 786
- 787
- 788
- 1 - 50
- 51 - 100
- 101 - 150
- 151 - 200
- 201 - 250
- 251 - 300
- 301 - 350
- 351 - 400
- 401 - 450
- 451 - 500
- 501 - 550
- 551 - 600
- 601 - 650
- 651 - 700
- 701 - 750
- 751 - 788
Pages: