Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Triola

Triola

Published by veroronquillo1, 2021-10-23 05:45:29

Description: Triola

Search

Read the Text Version

CAPÍTULO 15 La ética en estadística 679 conservadora, dada la sensibilidad del tema y el potencial de sesgo del factor de deseabilidad social descrito anteriormente. Un ejemplo notable de la falsificación de datos se encuentra en el estudio original que sugiere un vínculo entre las vacunas infantiles y el autismo. Andrew Wakefield publicó un estudio de 1998 que relacionaba la vacuna MMR con el autismo. En 2010, la British Medical Journal proporcionó pruebas de que el estudio de Wakefield se basó en datos falsificados. The Lancet, que publicó el estudio original en 1998, se retractó de éste y la licencia médica de Wakefield fue revocada. Mientras que algunos ac- tivistas del autismo aún defienden sus acciones, la comunidad científica ha condenado esta investigación por ser poco ética. Métodos estadísticos inapropiados El uso inadecuado de métodos estadísticos puede conducir a resultados incorrectos y distorsionados, incluso si los datos son sólidos. “Statistical Errors in Manuscripts Submitted to Biochemia Medica Journal”, de Simundic y Nikolac, Bio- chemia Medica, vol. 19, núm. 3, examinó 55 manuscritos que se enviaron para su publicación y encontró que 48 (87%) contenían al menos un error estadístico; 34 (62%) tuvieron una elec- ción incorrecta de la prueba estadística; 22% tuvo una interpretación incorrecta de un valor P; y 75% incluyó el uso incorrecto de una prueba estadística para comparar tres o más grupos. La revisión por colegas es una defensa primaria contra el uso de métodos estadísticos inapropia- dos, pero no garantiza que tales errores estadísticos sean identificados y corregidos. Elección de un nivel de significancia Una buena práctica consiste en seleccionar un nivel de significancia para una prueba de hipótesis y encontrar un valor P antes de recolectar los datos muestrales. Una mala práctica es ajustar posteriormente el nivel de significancia a fin de que los resultados parezcan significativos cuando no lo son en función del nivel de signi- ficancia original. III. Ética e informes Otras oportunidades para prácticas poco éticas ocurren con la interpretación de los resultados estadísticos y la decisión de cómo y dónde reportar los hallazgos. Los intereses personales y egoístas pueden influir en las conclusiones y recomendaciones finales. Conflictos de interés Autor fantasma Un autor médico fantasma es alguien que contribuye a la redacción de un estudio o artículo de investigación, pero no se le reconoce en el trabajo publicado. En los últimos años, varios litigios han revelado que las compañías farmacéuticas han contratado redactores profesionales para escribir artículos sobre ensayos clínicos y han pagado a los médicos para que acepten la autoría de tales artículos. Ni el papel de los autores fantasmas ni la compensación financiera para el autor reconocido se menciona en los trabajos. Apoyo financiero La organización sin fines de lucro Fair Warning informó que durante va- rios años recientes, los hospitales invirtieron millones de dólares para comprar nuevos desfi- briladores automáticos de corazón. Un comité de la Asociación Estadounidense del Corazón recomendó la actualización sin el beneficio de la investigación o los ensayos clínicos que de- mostraran que los nuevos dispositivos eran mejores que los dispositivos que se estaban utili- zando. De acuerdo con Fair Warning, más de 25% de los miembros del comité “tenían vínculos comerciales con los fabricantes de los dispositivos” y “según una estimación, las deficiencias de los equipos automatizados ocasionan que cada año mueran cerca de 1000 pacientes adicionales por paro cardíaco en Estados Unidos”. Debido a la aprobación en 2010 de una ley federal, ahora se requiere que las compañías divulguen los pagos por bienes y servicios brindados a médicos u hospitales de enseñanza. Si bien esta ley no prohíbe las relaciones financieras entre empresas y médicos u hospitales de enseñanza, sí requiere la divulgación de tales relaciones. Reporte de resultados no significativos Un artículo reciente apareció con el titular “Después de 39 años, el apoyo a la pena de muerte disminuye en Estados Unidos”. Una encuesta de Gallup encontró que el 61% de los estadounidenses estaba a favor de la pena de

680 CAPÍTULO 15 La ética en estadística Anonimato y muerte, lo que implicaba una caída del 3% con respecto la tasa del año anterior. La descrip- confidencialidad ción del “método de la encuesta” al final del artículo indicaba que “se puede decir con un 95% de confianza que el margen máximo de error en el muestreo es de 4%”. Con un error de Una encuesta muestreo del 4%, una disminución del 3% en los encuestados que indicaron estaban a favor con anonimato de la pena de muerte no es significativo. Realmente no sabemos si hubo una disminución, un se realiza si aumento o ningún cambio en las opiniones sobre la pena de muerte. no se conocen las identidades IV. Cumplimiento de la ética de los encuestados. Para ayudar a evitar prácticas estadísticas poco éticas, muchas organizaciones han estable- Una encuesta con cido directrices para sus miembros o para los autores cuyos trabajos publican. Por ejemplo, confidencialidad se presenta la Asociación Estadounidense de Estadística, ratificó sus “directrices éticas para la práctica si las identidades de los estadística”, que proporciona pautas éticas en ocho temas generales, que incluyen las Res- encuestados no se divulgan. ponsabilidades con los sujetos de investigación, las Responsabilidades en publicaciones y Idealmente, las encuestas deben testimonios, y las Responsabilidades con otros estadísticos. El texto completo de las Directri- ser anónimas y confidenciales, ces Éticas se puede encontrar en el sitio web www.amstat.org. pero eso no siempre es práctico o bueno. La confidencialidad La Regla Común se ha establecido en Estados Unidos como el estándar de ética para puede dejarse de lado si la investigación biomédica y conductual que involucra seres humanos. Este es el estándar de se encuentra que algunos referencia para cualquier investigación financiada por el gobierno y prácticamente todas las encuestados son un peligro para instituciones académicas. Para la regla común, los siguientes requisitos resultan fundamentales: ellos mismos o para los demás. En tales casos, los encuestados 1. Que las personas que participan como sujetos en la investigación cubierta se selec- deben ser informados con una cionen de forma equitativa y den su consentimiento por escrito completamente infor- declaración como la siguiente: mado y totalmente voluntario; y “Toda la información que proporcione será confidencial, 2. Que la investigación propuesta sea revisada por un grupo de supervisión independiente a menos que implique riesgos denominado Junta de Revisión Institucional (IRB, por sus siglas en inglés) y aprobada graves para usted o para otras sólo si los riesgos para los sujetos se han minimizado y son razonables en relación con personas”. los beneficios anticipados, si los hubiera, para los sujetos, y la importancia del conoci- El periódico National miento que razonablemente se espera como resultado. Observer ya no existe, pero en cierta ocasión contrató El texto detallado de la regla común se puede encontrar en el sitio web del Departamento de a una empresa para realizar Salud y Servicios Humanos de Estados Unidos. En www.hhs.gov. una encuesta confidencial por correo. La encuesta se Como consumidores de datos, es importante tener un escepticismo saludable cuando realizó con la promesa de que se citen estadísticas para respaldar un hallazgo. Deberíamos hacernos preguntas como las “cada respuesta individual se siguientes: mantendría confidencial”. Un suscriptor inteligente usó una ■ ¿Quién informa sobre el estudio?, ¿tiene algún interés financiero o personal en el resultado? luz ultravioleta para detectar un código de identificación único ■ ¿Cómo se obtuvieron los datos muestrales? ¿Cuál es el potencial de sesgo? impreso en la encuesta en tinta invisible. Aquí, la confidencialidad ■ ¿Estos resultados han sido revisados o replicados por colegas o por cualquier otra persona? se prometió y se cumplió, pero no ocurrió lo mismo con ■ ¿Qué detalles se proporcionan sobre los métodos utilizados?, ¿cuál es el margen de el anonimato. En lugar de error, el intervalo de confianza, el valor P, el tamaño del efecto, etcétera? usar tinta invisible, la empresa Los investigadores siempre deben cumplir con los más altos estándares éticos en su tra- debería haber informado a los encuestados que su información bajo. Todos debemos esforzarnos por comportarnos éticamente de la siguiente manera: no era anónima. ■ Sea cabal y honesto acerca de los hallazgos, incluso si los resultados no son los espera- dos o deseados. ■ Busque el consejo de profesionales cuando no esté seguro sobre qué análisis estadísti- cos son los apropiados. ■ Siempre revele las relaciones financieras o cualquier otro interés en el resultado de la investigación. ■ Dé crédito sólo a aquellas personas que hicieron una contribución significativa al estudio. ■ Esté preparado y dispuesto a compartir los datos, métodos, análisis y resultados. ■ Identifique claramente cualquier supuesto, limitación o pregunta pendiente en la inves- tigación.

CAPÍTULO 15 La ética en estadística 681 Puntos de discusión 1. ¿Es ético utilizar prisioneros como sujetos si comprenden los riesgos potenciales y han dado su consentimiento?, ¿es ético ofrecerles un incentivo para que den su consen- timiento, como darles privilegios adicionales o reducirles la sentencia? 2. ¿El experimento de Milgram descrito en esta sección fue poco ético? ¿Por qué sí o por qué no? 3. Para proyectos de investigación que afectan a sujetos humanos, ¿el daño psicológico potencial es diferente del daño físico potencial? 4. ¿Es poco ético infectar intencionalmente a sujetos de prueba humanos?, ¿qué hay de los animales? 5. El sesgo voluntario está bien documentado en el tema de la sexualidad humana. ¿Cuáles son algunos otros temas que pueden tener un alto riesgo de sesgo voluntario? 6. Una reducción del sesgo muestral puede generar un resultado general menos positivo, que puede retrasar o detener la liberación de un medicamento del que un segmento de la población podría beneficiarse. ¿Es esto una compensación aceptable? 7. Un artículo sobre el tema de los errores estadísticos en la investigación médica listó 47 posibles fuentes de error. Intente identificar 5 de estas posibles fuentes de error. 8. ¿Qué es la autoría médica fantasma?, ¿esta práctica es poco ética? 9. ¿Deberían existir estándares comunes para reclamar la autoría de un estudio?, ¿qué debería incluirse en esos estándares? 10. ¿La ley que exige la revelación de pagos es suficiente para evitar que el apoyo finan- ciero sesgue los resultados de los estudios?, ¿tiene usted otras recomendaciones?



APÉNDICE A Tablas TABLA A-1 Probabilidades binomiales p n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x 2 0 .980 .903 .810 .640 .490 .360 .250 .160 .090 .040 .010 .003 0+ 0 1 .020 .095 .180 .320 .420 .480 .500 .480 .420 .320 .180 .095 .020 1 2 0 + .003 .010 .040 .090 .160 .250 .360 .490 .640 .810 .903 .980 2 3 0 .970 .857 .729 .512 .343 .216 .125 .064 .027 .008 .001 0+ 0+ 0 1 .029 .135 .243 .384 .441 .432 .375 .288 .189 .096 .027 .007 0+ 1 2 0 + .007 .027 .096 .189 .288 .375 .432 .441 .384 .243 .135 .029 2 3 0 + 0 + .001 .008 .027 .064 .125 .216 .343 .512 .729 .857 .970 3 4 0 .961 .815 .656 .410 .240 .130 .063 .026 .008 .002 0+ 0+ 0+ 0 1 .039 .171 .292 .410 .412 .346 .250 .154 .076 .026 .004 0+ 0+ 1 2 .001 .014 .049 .154 .265 .346 .375 .346 .265 .154 .049 .014 .001 2 3 0 + 0 + .004 .026 .076 .154 .250 .346 .412 .410 .292 .171 .039 3 4 0 + 0 + 0 + .002 .008 .026 .063 .130 .240 .410 .656 .815 .961 4 5 0 .951 .774 .590 .328 .168 .078 .031 .010 .002 0+ 0+ 0+ 0+ 0 1 .048 .204 .328 .410 .360 .259 .156 .077 .028 .006 0+ 0+ 0+ 1 2 .001 .021 .073 .205 .309 .346 .313 .230 .132 .051 .008 .001 0+ 2 3 0 + .001 .008 .051 .132 .230 .313 .346 .309 .205 .073 .021 .001 3 4 0 + 0 + 0 + .006 .028 .077 .156 .259 .360 .410 .328 .204 .048 4 5 0 + 0 + 0 + 0 + .002 .010 .031 .078 .168 .328 .590 .774 .951 5 6 0 .941 .735 .531 .262 .118 .047 .016 .004 .001 0+ 0+ 0+ 0+ 0 1 .057 .232 .354 .393 .303 .187 .094 .037 .010 .002 0+ 0+ 0+ 1 2 .001 .031 .098 .246 .324 .311 .234 .138 .060 .015 .001 0+ 0+ 2 3 0 + .002 .015 .082 .185 .276 .312 .276 .185 .082 .015 .002 0 + 3 4 0 + 0 + .001 .015 .060 .138 .234 .311 .324 .246 .098 .031 .001 4 5 0 + 0 + 0 + .002 .010 .037 .094 .187 .303 .393 .354 .232 .057 5 6 0 + 0 + 0 + 0 + .001 .004 .016 .047 .118 .262 .531 .735 .941 6 7 0 .932 .698 .478 .210 .082 .028 .008 .002 0+ 0+ 0+ 0+ 0+ 0 1 .066 .257 .372 .367 .247 .131 .055 .017 .004 0+ 0+ 0+ 0+ 1 2 .002 .041 .124 .275 .318 .261 .164 .077 .025 .004 0+ 0+ 0+ 2 3 0 + .004 .023 .115 .227 .290 .273 .194 .097 .029 .003 0 + 0+ 3 4 0 + 0 + .003 .029 .097 .194 .273 .290 .227 .115 .023 .004 0 + 4 5 0 + 0 + 0 + .004 .025 .077 .164 .261 .318 .275 .124 .041 .002 5 6 0 + 0 + 0 + 0 + .004 .017 .055 .131 .247 .367 .372 .257 .066 6 7 0 + 0 + 0 + 0 + 0 + .002 .008 .028 .082 .210 .478 .698 .932 7 8 0 .923 .663 .430 .168 .058 .017 .004 .001 0+ 0+ 0+ 0+ 0+ 0 1 .075 .279 .383 .336 .198 .090 .031 .008 .001 0+ 0+ 0+ 0+ 1 2 .003 .051 .149 .294 .296 .209 .109 .041 .010 .001 0+ 0+ 0+ 2 3 0 + .005 .033 .147 .254 .279 .219 .124 .047 .009 0 + 0 + 0 + 3 4 0 + 0 + .005 .046 .136 .232 .273 .232 .136 .046 .005 0 + 0 + 4 5 0 + 0 + 0 + .009 .047 .124 .219 .279 .254 .147 .033 .005 0 + 5 6 0 + 0 + 0 + .001 .010 .041 .109 .209 .296 .294 .149 .051 .003 6 7 0 + 0 + 0 + 0 + .001 .008 .031 .090 .198 .336 .383 .279 .075 7 8 0 + 0 + 0 + 0 + 0 + .001 .004 .017 .058 .168 .430 .663 .923 8 NOTA: 0+ representa un valor de probabilidad positivo menor que 0.0005. Tomado de Frederick C. Mosteller, Robert E.K. Rourke, y George B. Thomas, Jr., Probability with Statistical Applications, 2a. ed., © 1970. Reimpreso y reproducido electrónica- mente con autorización de Pearson Education, Inc., Upper Saddle River, Nueva Jersey. 683

684 APÉNDICE A Tablas Puntuaciones z NEGATIVAS z0 TABLA A-2 Distribución normal estándar (z): Área acumulada desde la IZQUIERDA z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 - 3.50 y menores .0001 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0002 - 3.4 .0003 .0005 .0005 .0004 .0004 .0003 - 3.3 .0005 .0007 .0006 .0006 .0004 .0004 .0006 .0004 .0004 .0005 - 3.2 .0007 .0009 .0009 .0009 .0008 .0007 - 3.1 .0010 .0013 .0013 .0012 .0006 .0006 .0011 .0005 .0005 .0010 - 3.0 .0013 .0018 .0018 .0017 .0015 .0014 - 2.9 .0019 .0025 .0024 .0023 .0008 .0008 .0021 .0008 .0007 .0019 - 2.8 .0026 .0034 .0033 .0032 .0029 .0026 - 2.7 .0035 .0045 .0044 .0043 .0012 .0011 .0039 .0011 .0010 .0036 - 2.6 .0047 .0060 .0059 .0057 .0052 .0048 - 2.5 .0062 .0080 .0078 .0075 .0016 .0016 .0069 .0015 .0014 .0064 - 2.4 .0082 .0104 .0102 .0099 .0091 .0084 - 2.3 .0107 .0136 .0132 .0129 .0023 .0022 .0119 .0021 .0020 .0110 - 2.2 .0139 .0174 .0170 .0166 .0154 .0143 - 2.1 .0179 .0222 .0217 .0212 .0031 .0030 .0197 .0028 .0027 .0183 - 2.0 .0228 .0281 .0274 .0268 .0250 .0233 - 1.9 .0287 .0351 .0344 .0336 .0041 .0040 .0314 .0038 .0037 .0294 - 1.8 .0359 .0436 .0427 .0418 .0392 .0367 - 1.7 .0446 .0537 .0526 .0516 .0055 .0054 .0485 .0051 * .0049 .0455 - 1.6 .0548 .0655 .0643 .0630 .0594 .0559 - 1.5 .0668 .0793 .0778 .0764 .0073 .0071 .0721 .0068 .0066 .0681 - 1.4 .0808 .0951 .0934 .0918 .0869 .0823 - 1.3 .0968 .1131 .1112 .1093 .0096 .0094 .1038 .0089 .0087 .0985 - 1.2 .1151 .1335 .1314 .1292 .1230 .1170 - 1.1 .1357 .1562 .1539 .1515 .0125 .0122 .1446 .0116 .0113 .1379 - 1.0 .1587 .1814 .1788 .1762 .1685 .1611 - 0.9 .1841 .2090 .2061 .2033 .0162 .0158 .1949 .0150 .0146 .1867 - 0.8 .2119 .2389 .2358 .2327 .2236 .2148 - 0.7 .2420 .2709 .2676 .2643 .0207 .0202 .2546 .0192 .0188 .2451 - 0.6 .2743 .3050 .3015 .2981 .2877 .2776 - 0.5 .3085 .3409 .3372 .3336 .0262 .0256 .3228 .0244 .0239 .3121 - 0.4 .3446 .3783 .3745 .3707 .3594 .3483 - 0.3 .3821 .4168 .4129 .4090 .0329 .0322 .3974 .0307 .0301 .3859 - 0.2 .4207 .4562 .4522 .4483 .4364 .4247 - 0.1 .4602 .4960 .4920 .4880 .0409 .0401 .4761 .0384 .0375 .4641 - 0.0 .5000 .0505 * .0495 .0475 .0465 (continúa) .0618 .0606 .0582 .0571 .0749 .0735 .0708 .0694 .0901 .0885 .0853 .0838 .1075 .1056 .1020 .1003 .1271 .1251 .1210 .1190 .1492 .1469 .1423 .1401 .1736 .1711 .1660 .1635 .2005 .1977 .1922 .1894 .2296 .2266 .2206 .2177 .2611 .2578 .2514 .2483 .2946 .2912 .2843 .2810 .3300 .3264 .3192 .3156 .3669 .3632 .3557 .3520 .4052 .4013 .3936 .3897 .4443 .4404 .4325 .4286 .4840 .4801 .4721 .4681 NOTA: Para valores de z por debajo de –3.49, use un área de 0.0001. *Use los siguientes valores comunes que resultan de interpolación: Puntuación z Área - 1.645 0.0500 - 2.575 0.0050

APÉNDICE A Tablas 685 Puntuaciones z POSITIVAS 0z TABLA A-2 (continuación) Área acumulada desde la IZQUIERDA z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 .5120 .5160 .5199 .5239 .5279 .5319 .5359 0.0 .5000 .5040 .5080 .5517 .5557 .5596 .5636 .5675 .5714 .5753 .5910 .5948 .5987 .6026 .6064 .6103 .6141 0.1 .5398 .5438 .5478 .6293 .6331 .6368 .6406 .6443 .6480 .6517 .6664 .6700 .6736 .6772 .6808 .6844 .6879 0.2 .5793 .5832 .5871 .7019 .7054 .7088 .7123 .7157 .7190 .7224 .7357 .7389 .7422 .7454 .7486 .7517 .7549 0.3 .6179 .6217 .6255 .7673 .7704 .7734 .7764 .7794 .7823 .7852 .7967 .7995 .8023 .8051 .8078 .8106 .8133 0.4 .6554 .6591 .6628 .8238 .8264 .8289 .8315 .8340 .8365 .8389 .8485 .8508 .8531 .8554 .8577 .8599 .8621 0.5 .6915 .6950 .6985 .8708 .8729 .8749 .8770 .8790 .8810 .8830 .8907 .8925 .8944 .8962 .8980 .8997 .9015 0.6 .7257 .7291 .7324 .9082 .9099 .9115 .9131 .9147 .9162 .9177 .9236 .9251 .9265 .9279 .9292 .9306 .9319 0.7 .7580 .7611 .7642 .9370 .9382 .9394 .9406 .9418 .9429 .9441 .9484 .9495 .9505 .9515 .9525 .9535 .9545 0.8 .7881 .7910 .7939 .9582 .9591 .9599 .9608 .9616 .9625 .9633 .9664 .9671 .9678 .9686 .9693 .9699 .9706 0.9 .8159 .8186 .8212 .9732 .9738 .9744 .9750 .9756 .9761 .9767 .9788 .9793 .9798 .9803 .9808 .9812 .9817 1.0 .8413 .8438 .8461 .9834 .9838 .9842 .9846 .9850 .9854 .9857 .9871 .9875 .9878 .9881 .9884 .9887 .9890 1.1 .8643 .8665 .8686 .9901 .9904 .9906 .9909 .9911 .9913 .9916 .9925 .9927 .9929 .9931 .9932 .9934 .9936 1.2 .8849 .8869 .8888 .9943 .9945 .9946 .9948 .9949 .9951 .9952 .9957 .9959 .9960 .9961 .9962 .9963 .9964 1.3 .9032 .9049 .9066 .9968 .9969 .9970 .9971 .9972 .9973 .9974 .9977 .9977 .9978 .9979 .9979 .9980 .9981 1.4 .9192 .9207 .9222 .9983 .9984 .9984 .9985 .9985 .9986 .9986 .9988 .9988 .9989 .9989 .9989 .9990 .9990 1.5 .9332 .9345 .9357 .9991 .9992 .9992 .9992 .9992 .9993 .9993 .9994 .9994 .9994 .9994 .9995 .9995 .9995 1.6 .9452 .9463 .9474 .9996 .9996 * .9996 .9996 .9996 .9996 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998 1.7 .9554 .9564 .9573 1.8 .9641 .9649 .9656 1.9 .9713 .9719 .9726 2.0 .9772 .9778 .9783 2.1 .9821 .9826 .9830 2.2 .9861 .9864 .9868 2.3 .9893 .9896 .9898 2.4 .9918 .9920 .9922 2.5 .9938 .9940 .9941 * 2.6 .9953 .9955 .9956 2.7 .9965 .9966 .9967 2.8 .9974 .9975 .9976 2.9 .9981 .9982 .9982 3.0 .9987 .9987 .9987 3.1 .9990 .9991 .9991 3.2 .9993 .9993 .9994 3.3 .9995 .9995 .9995 3.4 .9997 .9997 .9997 3.50 y .9999 mayores NOTA: Para valores de z superiores a 3.49, use un área de 0.9999. Valores críticos comunes *Use los siguientes valores comunes que resultan de interpolación: Nivel de Valor confianza crítico 0.90 1.645 Puntuación z Área 0.95 1.96 1.645 0.9500 2.575 0.9950 0.99 2.575

686 APÉNDICE A Tablas TABLA A-3 Distribución t: Valores t críticos Cola izquierda Área en una cola 0.025 a Grados 0.005 0.01 0.05 0.10 de libertad Área en dos colas Valor t crítico 0.01 0.02 0.05 0.10 0.20 (negativo) 1 63.657 31.821 6.314 3.078 2 9.925 6.965 12.706 2.920 1.886 Cola derecha 3 5.841 4.541 4.303 2.353 1.638 4 4.604 3.747 3.182 2.132 1.533 a 5 4.032 3.365 2.776 2.015 1.476 6 3.707 3.143 2.571 1.943 1.440 Valor t crítico 7 3.499 2.998 2.447 1.895 1.415 (positivo) 8 3.355 2.896 2.365 1.860 1.397 9 3.250 2.821 2.306 1.833 1.383 Dos colas 10 3.169 2.764 2.262 1.812 1.372 11 3.106 2.718 2.228 1.796 1.363 a͞2 a͞2 12 3.055 2.681 2.201 1.782 1.356 13 3.012 2.650 2.179 1.771 1.350 Valor t crítico Valor t crítico 14 2.977 2.624 2.160 1.761 1.345 (negativo) (positivo) 15 2.947 2.602 2.145 1.753 1.341 16 2.921 2.583 2.131 1.746 1.337 17 2.898 2.567 2.120 1.740 1.333 18 2.878 2.552 2.110 1.734 1.330 19 2.861 2.539 2.101 1.729 1.328 20 2.845 2.528 2.093 1.725 1.325 21 2.831 2.518 2.086 1.721 1.323 22 2.819 2.508 2.080 1.717 1.321 23 2.807 2.500 2.074 1.714 1.319 24 2.797 2.492 2.069 1.711 1.318 25 2.787 2.485 2.064 1.708 1.316 26 2.779 2.479 2.060 1.706 1.315 27 2.771 2.473 2.056 1.703 1.314 28 2.763 2.467 2.052 1.701 1.313 29 2.756 2.462 2.048 1.699 1.311 30 2.750 2.457 2.045 1.697 1.310 31 2.744 2.453 2.042 1.696 1.309 32 2.738 2.449 2.040 1.694 1.309 33 2.733 2.445 2.037 1.692 1.308 34 2.728 2.441 2.035 1.691 1.307 35 2.724 2.438 2.032 1.690 1.306 36 2.719 2.434 2.030 1.688 1.306 37 2.715 2.431 2.028 1.687 1.305 38 2.712 2.429 2.026 1.686 1.304 39 2.708 2.426 2.024 1.685 1.304 40 2.704 2.423 2.023 1.684 1.303 45 2.690 2.412 2.021 1.679 1.301 50 2.678 2.403 2.014 1.676 1.299 60 2.660 2.390 2.009 1.671 1.296 70 2.648 2.381 2.000 1.667 1.294 80 2.639 2.374 1.994 1.664 1.292 90 2.632 2.368 1.990 1.662 1.291 100 2.626 2.364 1.987 1.660 1.290 200 2.601 2.345 1.984 1.653 1.286 300 2.592 2.339 1.972 1.650 1.284 400 2.588 2.336 1.968 1.649 1.284 500 2.586 2.334 1.966 1.648 1.283 1000 2.581 2.330 1.965 1.646 1.282 2000 2.578 2.328 1.962 1.646 1.282 Grandes 2.576 2.326 1.961 1.645 1.282 1.960

APÉNDICE A Tablas 687 TABLA A-4 Distribución Ji cuadrada (x2) Área a la derecha del valor crítico Grados 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005 de libertad — — 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597 1 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838 2 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860 3 0.412 0.554 0.831 1.145 1.610 9.236 11.071 12.833 15.086 16.750 4 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548 5 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278 6 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955 7 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589 8 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188 9 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757 10 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299 11 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819 12 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319 13 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801 14 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267 15 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718 16 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156 17 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582 18 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997 19 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401 20 8.643 9.542 10.982 12.338 14.042 30.813 33.924 36.781 40.289 42.796 21 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181 22 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559 23 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928 24 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290 25 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.194 46.963 49.645 26 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993 27 13.121 14.257 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336 28 13.787 14.954 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672 29 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766 30 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490 40 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952 50 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215 60 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321 70 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299 80 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169 90 100 Fuente: Donald B. Owen, Handbook of Statistical Tables. Grados de libertad n21 Intervalo de confianza o prueba de hipótesis para una desviación estándar s o varianza s2 k21 Prueba de bondad de ajuste con k categorías diferentes (r 2 1)(c 2 1) Prueba de tabla de contingencia con r filas y c columnas k21 Prueba de Kruskal-Wallis con k muestras diferentes

688 APÉNDICE A Tablas 0.025 F TABLA A-5 Distribución F (a 5 0.025 en la cola derecha) Grados de libertad en el numerador (df1) 7 8 9 123456 948.22 956.66 963.28 39.335 39.373 39.387 1 647.79 799.50 864.16 899.58 921.85 937.11 14.624 14.540 14.473 2 38.506 39.000 39.165 39.248 39.298 39.331 9.0741 8.9796 8.9047 6.8531 6.7572 6.6811 3 17.443 16.044 15.439 15.101 14.885 14.735 5.6955 5.5996 5.5234 4.9949 4.8993 4.8232 4 12.218 10.649 9.9792 9.6045 9.3645 9.1973 4.5286 4.4333 4.3572 4.1970 4.1020 4.0260 5 10.007 8.4336 7.7636 7.3879 7.1464 6.9777 3.9498 3.8549 3.7790 3.7586 3.6638 3.5879 6 8.8131 7.2599 6.5988 6.2272 5.9876 5.8198 3.6065 3.5118 3.4358 3.4827 3.3880 3.3120 7 8.0727 6.5415 5.8898 5.5226 5.2852 5.1186 3.3799 3.2853 3.2093 3.2934 3.1987 3.1227 8 7.5709 6.0595 5.4160 5.0526 4.8173 4.6517 3.2194 3.1248 3.0488 3.1556 3.0610 2.9849 9 7.2093 5.7147 5.0781 4.7181 4.4844 4.3197 3.0999 3.0053 2.9291 3.0509 2.9563 2.8801 10 6.9367 5.4564 4.8256 4.4683 4.2361 4.0721 3.0074 2.9128 2.8365 2.9686 2.8740 2.7977 11 6.7241 5.2559 4.6300 4.2751 4.0440 3.8807 2.9338 2.8392 2.7628 2.9023 2.8077 2.7313 12 6.5538 5.0959 4.4742 4.1212 3.8911 3.7283 2.8738 2.7791 2.7027 2.8478 2.7531 2.6766 Grados de libertad en el denominador (df2) 13 6.4143 4.9653 4.3472 3.9959 3.7667 3.6043 2.8240 2.7293 2.6528 2.8021 2.7074 2.6309 14 6.2979 4.8567 4.2417 3.8919 3.6634 3.5014 2.7820 2.6872 2.6106 2.7633 2.6686 2.5919 15 6.1995 4.7650 4.1528 3.8043 3.5764 3.4147 2.7460 2.6513 2.5746 2.6238 2.5289 2.4519 16 6.1151 4.6867 4.0768 3.7294 3.5021 3.3406 2.5068 2.4117 2.3344 2.3948 2.2994 2.2217 17 6.0420 4.6189 4.0112 3.6648 3.4379 3.2767 2.2875 2.1918 2.1136 18 5.9781 4.5597 3.9539 3.6083 3.3820 3.2209 (continúa ) 19 5.9216 4.5075 3.9034 3.5587 3.3327 3.1718 20 5.8715 4.4613 3.8587 3.5147 3.2891 3.1283 21 5.8266 4.4199 3.8188 3.4754 3.2501 3.0895 22 5.7863 4.3828 3.7829 3.4401 3.2151 3.0546 23 5.7498 4.3492 3.7505 3.4083 3.1835 3.0232 24 5.7166 4.3187 3.7211 3.3794 3.1548 2.9946 25 5.6864 4.2909 3.6943 3.3530 3.1287 2.9685 26 5.6586 4.2655 3.6697 3.3289 3.1048 2.9447 27 5.6331 4.2421 3.6472 3.3067 3.0828 2.9228 28 5.6096 4.2205 3.6264 3.2863 3.0626 2.9027 29 5.5878 4.2006 3.6072 3.2674 3.0438 2.8840 30 5.5675 4.1821 3.5894 3.2499 3.0265 2.8667 40 5.4239 4.0510 3.4633 3.1261 2.9037 2.7444 60 5.2856 3.9253 3.3425 3.0077 2.7863 2.6274 120 5.1523 3.8046 3.2269 2.8943 2.6740 2.5154 ` 5.0239 3.6889 3.1161 2.7858 2.5665 2.4082

APÉNDICE A Tablas 689 TABLA A-5 (continuación) Distribución F (a 5 0.025 en la cola derecha) Grados de libertad en el numerador (df1) 10 12 15 20 24 30 40 60 120 ` 1 968.63 976.71 984.87 993.10 997.25 1001.4 1005.6 1009.8 1014.0 1018.3 2 39.398 39.415 39.431 39.448 39.456 39.465 39.473 39.481 39.490 39.498 3 14.419 14.337 14.253 14.167 14.124 14.081 14.037 13.992 13.947 13.902 4 8.8439 8.7512 8.6565 8.5599 8.5109 8.4613 8.4111 8.3604 8.3092 8.2573 5 6.6192 6.5245 6.4277 6.3286 6.2780 6.2269 6.1750 6.1225 6.0693 6.0153 6 5.4613 5.3662 5.2687 5.1684 5.1172 5.0652 5.0125 4.9589 4.9044 4.8491 7 4.7611 4.6658 4.5678 4.4667 4.4150 4.3624 4.3089 4.2544 4.1989 4.1423 8 4.2951 4.1997 4.1012 3.9995 3.9472 3.8940 3.8398 3.7844 3.7279 3.6702 9 3.9639 3.8682 3.7694 3.6669 3.6142 3.5604 3.5055 3.4493 3.3918 3.3329 10 3.7168 3.6209 3.5217 3.4185 3.3654 3.3110 3.2554 3.1984 3.1399 3.0798 11 3.5257 3.4296 3.3299 3.2261 3.1725 3.1176 3.0613 3.0035 2.9441 2.8828 12 3.3736 3.2773 3.1772 3.0728 3.0187 2.9633 2.9063 2.8478 2.7874 2.7249 Grados de libertad en el denominador (df2) 13 3.2497 3.1532 3.0527 2.9477 2.8932 2.8372 2.7797 2.7204 2.6590 2.5955 14 3.1469 3.0502 2.9493 2.8437 2.7888 2.7324 2.6742 2.6142 2.5519 2.4872 15 3.0602 2.9633 2.8621 2.7559 2.7006 2.6437 2.5850 2.5242 2.4611 2.3953 16 2.9862 2.8890 2.7875 2.6808 2.6252 2.5678 2.5085 2.4471 2.3831 2.3163 17 2.9222 2.8249 2.7230 2.6158 2.5598 2.5020 2.4422 2.3801 2.3153 2.2474 18 2.8664 2.7689 2.6667 2.5590 2.5027 2.4445 2.3842 2.3214 2.2558 2.1869 19 2.8172 2.7196 2.6171 2.5089 2.4523 2.3937 2.3329 2.2696 2.2032 2.1333 20 2.7737 2.6758 2.5731 2.4645 2.4076 2.3486 2.2873 2.2234 2.1562 2.0853 21 2.7348 2.6368 2.5338 2.4247 2.3675 2.3082 2.2465 2.1819 2.1141 2.0422 22 2.6998 2.6017 2.4984 2.3890 2.3315 2.2718 2.2097 2.1446 2.0760 2.0032 23 2.6682 2.5699 2.4665 2.3567 2.2989 2.2389 2.1763 2.1107 2.0415 1.9677 24 2.6396 2.5411 2.4374 2.3273 2.2693 2.2090 2.1460 2.0799 2.0099 1.9353 25 2.6135 2.5149 2.4110 2.3005 2.2422 2.1816 2.1183 2.0516 1.9811 1.9055 26 2.5896 2.4908 2.3867 2.2759 2.2174 2.1565 2.0928 2.0257 1.9545 1.8781 27 2.5676 2.4688 2.3644 2.2533 2.1946 2.1334 2.0693 2.0018 1.9299 1.8527 28 2.5473 2.4484 2.3438 2.2324 2.1735 2.1121 2.0477 1.9797 1.9072 1.8291 29 2.5286 2.4295 2.3248 2.2131 2.1540 2.0923 2.0276 1.9591 1.8861 1.8072 30 2.5112 2.4120 2.3072 2.1952 2.1359 2.0739 2.0089 1.9400 1.8664 1.7867 40 2.3882 2.2882 2.1819 2.0677 2.0069 1.9429 1.8752 1.8028 1.7242 1.6371 60 2.2702 2.1692 2.0613 1.9445 1.8817 1.8152 1.7440 1.6668 1.5810 1.4821 120 2.1570 2.0548 1.9450 1.8249 1.7597 1.6899 1.6141 1.5299 1.4327 1.3104 ` 2.0483 1.9447 1.8326 1.7085 1.6402 1.5660 1.4835 1.3883 1.2684 1.0000 Con base en datos de Maxine Merrington y Catherine M. Thompson, “Tables of Percentage Points of the Inverted Beta (F) Distribution”, Biometrika 33 (1943): 80-84.

690 APÉNDICE A Tablas 0.05 F TABLA A-5 (continuación) Distribución F (a 5 0.05 en la cola derecha) Grados de libertad en el numerador (df1) 6 7 8 9 12345 233.99 236.77 238.88 240.54 1 161.45 199.50 215.71 224.58 230.16 19.330 19.353 19.371 19.385 8.9406 8.8867 8.8452 8.8123 2 18.513 19.000 19.164 19.247 19.296 6.1631 6.0942 6.0410 6.9988 4.9503 4.8759 4.8183 4.7725 3 10.128 9.5521 9.2766 9.1172 9.0135 4.2839 4.2067 4.1468 4.0990 3.8660 3.7870 3.7257 3.6767 4 7.7086 6.9443 6.5914 6.3882 6.2561 3.5806 3.5005 3.4381 3.3881 3.3738 3.2927 3.2296 3.1789 5 6.6079 5.7861 5.4095 5.1922 5.0503 3.2172 3.1355 3.0717 3.0204 3.0946 3.0123 2.9480 2.8962 6 5.9874 5.1433 4.7571 4.5337 4.3874 2.9961 2.9134 2.8486 2.7964 2.9153 2.8321 2.7669 2.7144 7 5.5914 4.7374 4.3468 4.1203 3.9715 2.8477 2.7642 2.6987 2.6458 2.7905 2.7066 2.6408 2.5876 8 5.3177 4.4590 4.0662 3.8379 3.6875 2.7413 2.6572 2.5911 2.5377 2.6987 2.6143 2.5480 2.4943 9 5.1174 4.2565 3.8625 3.6331 3.4817 2.6613 2.5767 2.5102 2.4563 2.6283 2.5435 2.4768 2.4227 10 4.9646 4.1028 3.7083 3.4780 3.3258 2.5990 2.5140 2.4471 2.3928 2.5727 2.4876 2.4205 2.3660 11 4.8443 3.9823 3.5874 3.3567 3.2039 2.5491 2.4638 2.3965 2.3419 2.5277 2.4422 2.3748 2.3201 12 4.7472 3.8853 3.4903 3.2592 3.1059 2.5082 2.4226 2.3551 2.3002 2.4904 2.4047 2.3371 2.2821 Grados de libertad en el denominador (df2) 13 4.6672 3.8056 3.4105 3.1791 3.0254 2.4741 2.3883 2.3205 2.2655 2.4591 2.3732 2.3053 2.2501 14 4.6001 3.7389 3.3439 3.1122 2.9582 2.4453 2.3593 2.2913 2.2360 2.4324 2.3463 2.2783 2.2229 15 4.5431 3.6823 3.2874 3.0556 2.9013 2.4205 2.3343 2.2662 2.2107 2.3359 2.2490 2.1802 2.1240 16 4.4940 3.6337 3.2389 3.0069 2.8524 2.2541 2.1665 2.0970 2.0401 2.1750 2.0868 2.0164 1.9588 17 4.4513 3.5915 3.1968 2.9647 2.8100 2.0986 2.0096 1.9384 1.8799 18 4.4139 3.5546 3.1599 2.9277 2.7729 (continúa ) 19 4.3807 3.5219 3.1274 2.8951 2.7401 20 4.3512 3.4928 3.0984 2.8661 2.7109 21 4.3248 3.4668 3.0725 2.8401 2.6848 22 4.3009 3.4434 3.0491 2.8167 2.6613 23 4.2793 3.4221 3.0280 2.7955 2.6400 24 4.2597 3.4028 3.0088 2.7763 2.6207 25 4.2417 3.3852 2.9912 2.7587 2.6030 26 4.2252 3.3690 2.9752 2.7426 2.5868 27 4.2100 3.3541 2.9604 2.7278 2.5719 28 4.1960 3.3404 2.9467 2.7141 2.5581 29 4.1830 3.3277 2.9340 2.7014 2.5454 30 4.1709 3.3158 2.9223 2.6896 2.5336 40 4.0847 3.2317 2.8387 2.6060 2.4495 60 4.0012 3.1504 2.7581 2.5252 2.3683 120 3.9201 3.0718 2.6802 2.4472 2.2899 3.8415 2.9957 2.6049 2.3719 2.2141

APÉNDICE A Tablas 691 TABLA A-5 (continuación) Distribución F (a 5 0.05 en la cola derecha) Grados de libertad en el numerador (df1) 10 12 15 20 24 30 40 60 120 ` 1 241.88 243.91 245.95 248.01 249.05 250.10 251.14 252.20 253.25 254.31 2 19.396 19.413 19.429 19.446 19.454 19.462 19.471 19.479 19.487 19.496 3 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944 8.5720 8.5494 8.5264 4 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459 5.7170 5.6877 5.6581 5.6281 5 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985 4.3650 6 4.0600 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6689 7 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298 8 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276 9 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7067 10 2.9782 2.9130 2.8450 2.7740 2.7372 2.6996 2.6609 2.6211 2.5801 2.5379 11 2.8536 2.7876 2.7186 2.6464 2.6090 2.5705 2.5309 2.4901 2.4480 2.4045 12 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 2.3410 2.2962 Grados de libertad en el denominador (df2) 13 2.6710 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064 14 2.6022 2.5342 2.4630 2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1307 15 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0658 16 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096 17 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.1040 2.0584 2.0107 1.9604 18 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168 19 2.3779 2.3080 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302 1.8780 20 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432 21 2.3210 2.2504 2.1757 2.0960 2.0540 2.0102 1.9645 1.9165 1.8657 1.8117 22 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 1.9380 1.8894 1.8380 1.7831 23 2.2747 2.2036 2.1282 2.0476 2.0050 1.9605 1.9139 1.8648 1.8128 1.7570 24 2.2547 2.1834 2.1077 2.0267 1.9838 1.9390 1.8920 1.8424 1.7896 1.7330 25 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.7110 26 2.2197 2.1479 2.0716 1.9898 1.9464 1.9010 1.8533 1.8027 1.7488 1.6906 27 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6717 28 2.1900 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541 29 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6376 30 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223 40 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089 60 1.9926 1.9174 1.8364 1.7480 1.7001 1.6491 1.5943 1.5343 1.4673 1.3893 120 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 1.4290 1.3519 1.2539 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591 1.3940 1.3180 1.2214 1.0000 Con base en datos de Maxine Merrington y Catherine M. Thompson, “Tables of Percentage Points of the Inverted Beta (F) Distribution”, Biometrika 33 (1943): 80-84.

692 APÉNDICE A Tablas TABLA A-6 Valores críticos del coeficiente de correlación de Pearson r n a 5 .05 a 5 .01 4 .950 .990 5 .878 .959 6 .811 .917 7 .754 .875 8 .707 .834 9 .666 .798 10 .632 .765 11 .602 .735 12 .576 .708 13 .553 .684 14 .532 .661 15 .514 .641 16 .497 .623 17 .482 .606 18 .468 .590 19 .456 .575 20 .444 .561 25 .396 .505 30 .361 .463 35 .335 .430 40 .312 .402 45 .294 .378 50 .279 .361 60 .254 .330 70 .236 .305 80 .220 .286 90 .207 .269 100 .196 .256 NOTA: Para probar H0: r 5 0 (sin correlación) contra H1: r Þ 0 (correlación), rechace H0 si el valor absoluto de r es mayor o igual que el valor crítico en la tabla.

APÉNDICE A Tablas 693 TABLA A-7 Valores críticos para la prueba del signo .005 a .025 .05 (una cola) (una cola) (una cola) .01 (una cola) .01 .02 .05 .10 n (dos colas) (dos colas) (dos colas) (dos colas) 1* * * * 2* * * * 3* * * * 4* * * * 5* * * 0 6* * 0 0 7* 0 0 0 80 0 0 1 90 0 1 1 10 0 0 1 1 11 0 1 1 2 12 1 1 2 2 13 1 1 2 3 14 1 2 2 3 15 2 2 3 3 16 2 2 3 4 17 2 3 4 4 18 3 3 4 5 19 3 4 4 5 20 3 4 5 5 21 4 4 5 6 22 4 5 5 6 23 4 5 6 7 24 5 5 6 7 25 5 6 7 7 NOTAS: 1. *indica que no es posible obtener un valor en la región crítica, por lo que no se rechaza la hipótesis nula. 2. Rechace la hipótesis nula si el número de signos del tipo menos frecuente (x ) es menor o igual que el valor de la tabla. 3. Para valores de n mayores que 25, se usa una aproximación normal con 1x + 0.52 - a n b 2 z= 1n 2

694 APÉNDICE A Tablas TABLA A-8 Valores críticos de T para la prueba de rangos con signo de Wilcoxon .005 a .025 .05 (una cola) (una cola) (una cola) .01 (una cola) .01 .02 .05 .10 n (dos colas) (dos colas) (dos colas) (dos colas) 5* ** 1 6* * 1 2 7* 024 80246 92368 10 3 5 8 11 11 5 7 11 14 12 7 10 14 17 13 10 13 17 21 14 13 16 21 26 15 16 20 25 30 16 19 24 30 36 17 23 28 35 41 18 28 33 40 47 19 32 38 46 54 20 37 43 52 60 21 43 49 59 68 22 49 56 66 75 23 55 62 73 83 24 61 69 81 92 25 68 77 90 101 26 76 85 98 110 27 84 93 107 120 28 92 102 117 130 29 100 111 127 141 30 109 120 137 152 NOTAS: 1. *indica que no es posible obtener un valor en la región crítica, por lo que no se rechaza la hipótesis nula. 2. Conclusiones: Rechace la hipótesis nula si el estadístico de prueba T es menor o igual que el valor crítico encontrado en esta tabla. No rechace la hipótesis nula si el estadístico de prueba T es mayor que el valor crítico encontrado en la tabla. Con base en datos de Some Rapid Approximate Statistical Procedures, Copyright © 1949, 1964 Lederle Laboratories Division of American Cyanamid Company.

APÉNDICE A Tablas 695 a∙2 a∙2 21 2rs rs 1 TABLA A-9 Valores críticos del coeficiente de correlación de rangos de Spearman rs n a 5 0.10 a 5 0.05 a 5 0.02 a 5 0.01 5 .900 — — — 6 .829 .886 .943 — 7 .714 .786 .893 .929 8 .643 .738 .833 .881 9 .600 .700 .783 .833 10 .564 .648 .745 .794 11 .536 .618 .709 .755 12 .503 .587 .678 .727 13 .484 .560 .648 .703 14 .464 .538 .626 .679 15 .446 .521 .604 .654 16 .429 .503 .582 .635 17 .414 .485 .566 .615 18 .401 .472 .550 .600 19 .391 .460 .535 .584 20 .380 .447 .520 .570 21 .370 .435 .508 .556 22 .361 .425 .496 .544 23 .353 .415 .486 .532 24 .344 .406 .476 .521 25 .337 .398 .466 .511 26 .331 .390 .457 .501 27 .324 .382 .448 .491 28 .317 .375 .440 .483 29 .312 .368 .433 .475 30 .306 .362 .425 .467 NOTAS: 1. Para n > 30 use rs { z> 1n - 1, donde z corresponde al nivel de significancia. Por ejemplo, si a 5 0.05, entonces z 5 1.96. 2. Si el valor absoluto del estadístico de prueba rs es mayor o igual que el valor crítico positivo, entonces rechace H0: rs 5 0 y concluya que hay suficiente evidencia para respaldar la afirmación de una correlación. Con base en datos de Biostatistical Analysis, 4a. edición © 1999, de Jerrold Zar, Prentice Hall, Inc., Upper Saddle River, Nueva Jersey, y “Distribution of Sums of Squares of Rank Differences to Small Numbers with Individuals”, The Annals of Mathematical Statistics, vol. 9, núm. 2.

696 APÉNDICE A Tablas TABLA A-10 Prueba de rachas para aleatoriedad: valores críticos para el número G de rachas Valor de n1 2 Valor de n2 1 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 1 11111111222222222 6 6 66666666666666666 1 1 11222222222333333 3 8 88888888888888888 6 1 12223333333344444 1 8 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10 4 1 22333334444444555 6 8 9 10 10 11 11 12 12 12 12 12 12 12 12 12 12 12 12 1 2 23333444455555566 5 8 9 10 11 12 12 13 13 13 13 14 14 14 14 14 14 14 14 6 2 23334455555666666 1 8 10 11 12 13 13 14 14 14 14 15 15 15 16 16 16 16 16 6 2 33344555666667777 6 8 10 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 17 1 2 33445556667777888 7 8 10 12 13 14 14 15 16 16 16 17 17 18 18 18 18 18 18 6 2 33455566777788889 1 8 10 12 13 14 15 16 16 17 17 18 18 18 19 19 19 20 20 8 2 34455667778889999 6 8 10 12 13 14 15 16 17 17 18 19 19 19 20 20 20 21 21 1 2 3 4 4 5 6 6 7 7 7 8 8 8 9 9 9 10 10 9 8 10 12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 22 6 2 3 4 5 5 6 6 7 7 8 8 9 9 9 10 10 10 10 1 8 10 12 14 15 16 17 18 19 19 20 20 21 21 22 22 23 23 10 2 3 4 5 5 6 7 7 8 8 9 9 9 10 10 10 11 11 6 8 10 12 14 15 16 17 18 19 20 20 21 22 22 23 23 23 24 1 3 3 4 5 6 6 7 7 8 8 9 9 10 10 11 11 11 12 11 8 10 12 14 15 16 18 18 19 20 21 22 22 23 23 24 24 25 6 3 4 4 5 6 6 7 8 8 9 9 10 10 11 11 11 12 12 2 8 10 12 14 16 17 18 19 20 21 21 22 23 23 24 25 25 25 12 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 12 12 13 6 8 10 12 14 16 17 18 19 20 21 22 23 23 24 25 25 26 26 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 13 13 13 8 10 12 14 16 17 18 19 20 21 22 23 24 25 25 26 26 27 6 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 13 2 8 10 12 14 16 17 18 20 21 22 23 23 24 25 26 26 27 27 14 3 4 5 6 6 7 8 9 9 10 10 11 12 12 13 13 13 14 6 8 10 12 14 16 17 18 20 21 22 23 24 25 25 26 27 27 28 2 15 6 2 16 6 2 17 6 2 18 6 2 19 6 2 20 6 NOTAS: 1. Las entradas en esta tabla son los valores G críticos, suponiendo una prueba de dos colas con un nivel de significancia de a 5 0.05. 2. Rechace la hipótesis nula de aleatoriedad si se cumple alguna de las siguientes condiciones: • El número G de rachas es menor o igual que la entrada más pequeña en la tabla. • El número G de rachas es mayor o igual que la entrada más grande en la tabla. Tomado de “Tables for Testing Randomness of Groupings in a Sequence of Alternatives”, The Annals of Mathematical Statistics, vol. 14, núm. 1. Reproducido con autorización del Institute of Mathematical Statistics.

APÉNDICE B Conjuntos de datos Los conjuntos completos de datos están disponibles en www.pearsonenespañol.com/triola En este apéndice se listan sólo las primeras cinco filas de cada conjunto de datos (como referencia se anota el título en español aunque los datos y su descripción están en inglés). Los conjuntos de datos completos pueden descargarse en www.pearsonenespañol.com/triola para uso en varias tecnologías, entre las que se incluyen Excel, calculadoras TI-83/84 Plus y Minitab. Estos conjuntos de datos se incluyen con Statdisk, que está disponible de forma gratuita para los usuarios de este libro y se puede descargar en www.pearsonenespañol.com/triola. Conjunto de datos 1: Datos corporales Conjunto de datos 2: Pie y estatura Conjunto de datos 3: Temperaturas corporales Conjunto de datos 4: Nacimientos Conjunto de datos 5: Estaturas familiares Conjunto de datos 6: Estudiantes de primer año 15 Conjunto de datos 7: IQ y plomo Conjunto de datos 8: IQ y tamaño del cerebro Conjunto de datos 9: Mediciones de osos Conjunto de datos 10: Muertes de manatíes Conjunto de datos 11: Alcohol y tabaco en las películas Conjunto de datos 12: Fumadores pasivos y activos Conjunto de datos 13: Contenido de cigarrillos Conjunto de datos 14: Edades de ganadores del Oscar Conjunto de datos 15: Presidentes Conjunto de datos 16: Premios Nobel y chocolate Conjunto de datos 17: Evaluaciones de cursos Conjunto de datos 18: Citas rápidas Conjunto de datos 19: Pruebas de choques automovilísticos Conjunto de datos 20: Mediciones de automóviles Conjunto de datos 21: Terremotos Conjunto de datos 22: Tornados Conjunto de datos 23: Old Faithful Conjunto de datos 24: Las palabras cuentan Conjunto de datos 25: Comida rápida Conjunto de datos 26: Pesos y volúmenes de bebidas de cola Conjunto de datos 27: Pesos de M&Ms Conjunto de datos 28: Galletas con chispas de chocolate Conjunto de datos 29: Pesos de monedas Conjunto de datos 30: Latas de aluminio Conjunto de datos 31: Peso de la basura Conjunto de datos 32: Velocidades de datos en aeropuertos 697

698 APÉNDICE B Conjuntos de datos Conjunto de datos 1: Datos corporales de plaquetas (1000 células/mL), PESO es el peso (kg), ESTATURA es la altura (cm), CINTURA es la circunferencia de la cintura (cm), CIRC Las mediciones y exámenes corporales son de 300 sujetos (las primeras BRAZO es la circunferencia del brazo (cm), e IMC es el índice de masa cinco filas se muestran aquí). EDAD se da en años, para GÉNERO 1 5 corporal (kg/m2). Los datos provienen del Centro Nacional de Estadísticas masculino y 0 5 femenino, PULSO es la frecuencia cardíaca (latidos por de la Salud. minuto), SISTÓLICA es la presión arterial sistólica (mm Hg), DIAS- TÓLICA es la presión arterial diastólica (mm Hg), HDL es el colesterol Lista de nombres para AGE, GENDR, PULSE, SYS, DIAS, HDL (mg/dL), LDL es el colesterol LDL (mg/dL), BLANCOS es el conteo de glóbulos blancos (1000 células/ml), ROJOS es el conteo de TI-83/84 (BODY): HDL, LDL, WHITE, REDBC, PLATE, WT, glóbulos rojos (millones de células/mL), PLAQUETAS es el conteo HT, WAIST, ARMC, BMI EDAD GÉNERO (1 5 M) PULSO SISTÓLICA DIASTÓLICA HDL LDL BLANCOS PLAQUETAS ROJOS PESO ESTATURA CINTURA CIRC BRAZO IMC 43 57 0 80 100 70 73 68 8.7 4.80 319 98.6 172.0 120.4 40.7 33.3 38 80 1 84 112 70 35 116 4.9 4.73 187 96.9 186.0 107.8 37.0 28.0 34 0 94 134 94 36 223 6.9 4.47 297 108.2 154.4 120.3 44.3 45.4 1 74 126 64 37 83 7.5 4.32 170 73.1 160.5 97.2 30.3 28.4 1 50 114 68 50 104 6.1 4.95 140 83.1 179.0 95.1 34.0 25.9 Conjunto de datos 2: Pie y estatura Datos de Rohren, Brenda, “Estimation of Stature from Foot and Shoe Length: Applications in Forensic Science”. Copyright © 2006. Reproducido con auto- Las medidas del pie y la estatura son de 40 sujetos (las primeras cinco rización de la autora. Brenda Rohren (MA, MFS, LIMHP, LADC, MAC) era filas se muestran aquí). SEXO es el sexo del sujeto, EDAD es la edad en una estudiante de posgrado en la Universidad Wesleyan de Nebraska cuando años, LONGITUD PIE es la longitud del pie (cm), HUELLA ZAPATO realizó la investigación y escribió el informe. es la longitud del zapato (cm), TAMAÑO ZAPATO es el tamaño reportado del zapato, y ESTATURA es altura (cm) del sujeto. Lista de nombres para FTSEX (1 5 masculino), FTAGE, FTLN, TI-83/84 (FOOTHT): SHOPT, SHOSZ, FHT SEXO EDAD LONGITUD PIE HUELLA ZAPATO TAMAÑO ZAPATO ESTATURA M 67 27.8 31.3 11.0 180.3 M 47 25.7 29.7 9.0 175.3 M 41 26.7 31.3 11.0 184.8 M 42 25.9 31.8 10.0 177.8 M 48 26.4 31.4 10.0 182.3 Conjunto de datos 3: Temperaturas man, el Dr. Philip Mackowiak, y el Dr. Myron Levine de la Universidad corporales de Maryland. Las temperaturas corporales (en °F) son de 107 sujetos, tomadas en dos Lista de nombres para D1T8, D1T12, D2T8, D2T12 (sin lista días consecutivos a las 8 AM y 12 AM (las primeras cinco filas se mues- TI-83/84 (BODYTEMP): para SEX y SMOKE). Los valores de datos tran aquí). SEXO es el género del sujeto, y FUMA indica si el sujeto fuma (Y) o no fuma (N). Datos proporcionados por el Dr. Steven Wasser- faltantes se representan con 9999. SEXO FUMA DÍA 1-8 AM DÍA 1-12 AM DÍA 2-8 AM DÍA 2-12 AM M Y 98.0 98.0 98.0 98.6 M Y 97.0 97.6 97.4 — M Y 98.6 98.8 97.8 98.6 M N 97.4 98.0 97.0 98.0 M N 98.2 98.8 97.0 98.0 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE B Conjuntos de datos 699 Conjunto de datos 4: Nacimientos Lista de nombres para FLOS, MLOS, FBWT, MBWT, FCHRG, TI-83/84 (BIRTHS): MCHRG [Se proporcionan listas separadas Los datos son de 400 nacimientos (las primeras cinco filas se muestran para niñas (F) y niños (M). Sin lista para aquí). Para GÉNERO, 1 5 masculino y 0 5 femenino. DURACIÓN DE FACILIT, INSURANCE ADMITTED y ESTANCIA es en días, el PESO AL NACER está en gramos y los CAR- DISCHARGED] GOS TOTALES son en dólares. INSTALACIÓN SEGURO GÉNERO (1 5 M) DURACIÓN DE ESTANCIA ADMISIÓN SALIDA PESO AL NACER CARGOS TOTALES Albany Medical Center Hospital Compañía de seguros 0 2 VIE DOM 3500 13986 Albany Medical Center Hospital Blue Cross 1 2 VIE DOM 3900 3633 Albany Medical Center Hospital Blue Cross 0 36 MIE JUE 800 359091 Albany Medical Center Hospital Compañía de seguros 1 5 LUN SAB 2800 8537 Albany Medical Center Hospital Compañía de seguros 1 2 VIE DOM 3700 3633 Conjunto de datos 5: Estaturas familiares Francis Galton (1822-1911), quien desarrolló los conceptos de desviación estándar, línea de regresión y correlación entre dos variables. Los datos de estatura son de 134 familias (las primeras cinco filas se muestran aquí). Las estaturas se dan en pulgadas. Sólo se incluyen fami- Lista de nombres para DAD, MOM, SON1, DGHT1 lias con al menos un hijo de cada sexo, y se consideran las estaturas del TI-83/84 (FAMHT): primer hijo y la primera hija. Los datos provienen de una publicación de PADRE MADRE PRIMER HIJO PRIMERA HIJA 70.0 64.0 68.0 65.0 71.0 65.5 72.0 66.0 69.0 63.5 70.5 65.0 69.5 66.0 71.0 66.5 70.0 58.0 72.0 66.0 Conjunto de datos 6: Estudiantes Los resultados se publican en Hoffman, D. J., Policastro, P., Quick, V. y de primer año 15 Lee, S. K.: “Changes in Body Weight and Fat Mass of Men and Women in the First Year of College: A Study of the ‘Freshman 15.’” Journal of Ame- Se proporcionan pesos de 67 estudiantes universitarios (las primeras rican College Health, 1o. de julio, 2006, vol. 55, núm. 1, p. 41. Copyright cinco filas se muestran aquí). SEXO es el sexo del sujeto, PESO es el © 2006. Reproducido con autorización. peso en kilogramos, y el IMC es el índice de masa corporal medido. Las mediciones se realizaron en septiembre del primer año y luego en abril Lista de nombres para WTSP, WTAPR, BMISP, BMIAP, (sin lista del primer año. TI-83/84 (FRESH15): para SEX) SEXO PESO SEPT PESO ABRIL IMC SEPT IMC ABRIL M 72 59 22.02 18.14 M 97 86 19.70 17.44 M 74 69 24.09 22.43 M 93 88 26.97 25.57 F 68 64 21.51 20.10 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

700 APÉNDICE B Conjuntos de datos Conjunto de datos 7: IQ y plomo sangre en el primer año y AÑO2 es el nivel de plomo en sangre en el se- gundo año. IQ VERB se mide con la puntuación del IQ verbal. IQ DESE Los datos son de 121 sujetos (las primeras cinco filas se muestran aquí). se mide con la puntuación del IQ de desempeño. IQ COMP se mide con Los datos se midieron en niños en dos años consecutivos, y los niños la puntuación del IQ completo. vivían cerca de una fundición de plomo. PLOMO es el grupo de plomo en la sangre [1 5 nivel bajo de plomo (niveles de plomo en la sangre < 40 Los datos provienen de “Neuropsychological Dysfunction in Chil- microgramos/100 ml en ambos años), 2 5 nivel de plomo medio (niveles dren with Chronic Low-Level Lead Absorption”, de P. J. Landrigan, R. de plomo en sangre ≥ 40 microgramos/100 ml en exactamente uno de dos H. Whitworth, R. W. Baloh, N. W. Staehling, W. F Barthel, y B. F. Rosen- años), 3 5 nivel alto de plomo (nivel de plomo en la sangre ≥ 40 micro- blum, Lancet, vol. 1, núm. 7909. gramos/100 ml en ambos años)]. EDAD es la edad en años, SEXO es el sexo del sujeto (1 5 hombre, 2 5 mujer). AÑO1 es el nivel de plomo en Lista de nombres para LEAD, IQAGE, IQSEX, YEAR1, YEAR2, TI-83/84 (IQLEAD): IQV, IQP, IQF PLOMO EDAD SEXO AÑO1 AÑO2 IQ VERB IQ DESE IQ COMP 1 11 1 25 18 61 85 70 1 9 1 31 28 82 90 85 1 11 1 30 29 70 107 86 1 6 1 29 30 72 85 76 1 11 1 2 34 72 100 84 Conjunto de datos 8: IQ y tamaño del cerebro los hemisferios cerebrales izquierdo y derecho), CIRC es la circunferencia de la cabeza (cm) y PESO es el peso corporal (kg). Los datos son de 20 gemelos monocigóticos (idénticos) (las primeras cinco filas se muestran aquí). PAR identifica el conjunto de gemelos, SEXO es Datos proporcionados por M. J. Tramo, W. C. Loftus, T. A. Stukel, J. el género del sujeto (1 5 masculino, 2 5 femenino), ORDEN es el orden B. Weaver, M. S. Gazziniga. Consulte “Brain Size, Head Size, and IQ in de nacimiento, IQ se mide con la puntuación del IQ completo, VOL es el Monozygotic Twins”, Neurology, vol. 50. volumen cerebral total (cm3), ÁREA es el área total superficial del cerebro (cm2), CCSA es el área superficial (cm2) del cuerpo calloso (que conecta Lista de nombres para PAIR, SEX, ORDER, IQ, VOL, AREA, TI-83/84 (IQBRAIN): CCSA, CIRC, BWT PAR SEXO(1 5 M) ORDEN IQ VOL ÁREA CCSA CIRC PESO 96 54.7 57.607 121 89 1005 1913.88 6.08 54.2 58.968 87 53.0 64.184 122 87 963 1684.89 5.73 52.9 58.514 101 57.8 63.958 221 1035 1902.36 6.22 222 1027 1860.24 5.80 321 1281 2264.25 7.99 Conjunto de datos 9: Mediciones de osos pulgadas), LONGITUD es la longitud del cuerpo (pulgadas), PECHO es la distancia alrededor del pecho (pulgadas) y PESO se mide en libras. Los Los datos provienen de 54 osos salvajes anestesiados (las primeras cinco datos son de Gary Alt y Minitab, Inc. filas se muestran aquí). EDAD se da en meses, MES es el mes de me- dición 1 5 enero, SEXO está codificado con 0 5 mujer y 1 5 hombre, Lista de nombres para BAGE, BSEX, BHDLN, BHDWD, BNECK, LONGCAB es la longitud de la cabeza (pulgadas), ANCCAB es el ancho TI-83/84 (BEARS): BLEN, BCHST, BWGHT (sin lista para de la cabeza (pulgadas), CUELLO es distancia alrededor del cuello (en MONTH) EDAD MES SEXO(1 5 M) LONGCAB ANCCAB CUELLO LONGITUD PECHO PESO 19 80 55 7 1 11.0 5.5 16.0 53.0 26.0 344 81 416 115 7 1 16.5 9.0 28.0 67.5 45.0 348 104 166 9 1 15.5 8.0 31.0 72.0 54.0 7 1 17.0 10.0 31.5 72.0 49.0 8 0 15.5 6.5 22.0 62.0 35.0 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE B Conjuntos de datos 701 Conjunto de datos 10: Muertes de manatíes de Florida (millones) y TEMP AGUA es la temperatura media anual del agua (en °F). Se proporcionan datos anuales para Florida durante 24 años (las primeras cinco filas se muestran aquí). MUERTES es el número anual de muertes Lista de nombres para DEATH, BOATS, POP, WTEMP (sin lista para de manatíes causadas por embarcaciones, BARCOS es el número de em- TI-83/84 (MANATEE): YEAR) barcaciones de recreo registradas (decenas de miles), POB es la población AÑO MUERTES BARCOS POB TEMP AGUA 1991 53 68 13.3 71.9 1992 38 68 13.5 70.4 1993 35 67 13.7 70.5 1994 49 70 14.0 71.7 1995 42 71 14.3 70.9 Conjunto de datos 11: Alcohol y tabaco se basan en Goldstein, Adam O., Sobel, Rachel A., Newman, Glen R., en las películas “Tobacco and Alcohol Use in G-Rated Children’s Animated Films”. Journal of the American Medical Association, 24-31 de marzo, 1999, vol. 281, Los datos provienen de 50 películas animadas para niños (las primeras núm. 12, p. 1132. Copyright © 1999. Todos los derechos reservados. cinco filas se muestran aquí). DURACIÓN es la duración de la película en minutos, TABACO es el tiempo de uso de tabaco en segundos y Lista de nombres CHLEN, CHTOB, CHALC (sin lista para ALCOHOL es el tiempo de consumo de alcohol en segundos. Los datos TI-83/84 (CHMOVIE): MOVIE y STUDIO) PELÍCULA ESTUDIO DURACIÓN (MIN) TABACO (SEG) ALCOHOL (SEG) Blanca Nieves Disney 83 0 0 Pinocho Disney 88 80 Fantasía Disney 120 223 0 Dumbo Disney 64 0 88 Bambi Disney 69 0 176 0 Conjunto de datos 12: Fumadores pasivos nicotina. (Cuando el cuerpo absorbe nicotina, se produce la cotinina). y activos Los datos provienen del Departamento de Salud y Servicios Humanos de Estados Unidos, tomados del National Center for Health Statistics, Third Los datos son de 120 sujetos (las primeras cinco filas se muestran aquí) National Health and Nutrition Examination Survey. en tres grupos: FUMADOR incluye a los sujetos que fuman, ETS incluye no fumadores expuestos al humo de tabaco ambiental, NOETS incluye no Lista de nombres para SMKR, ETS, NOETS fumadores no expuestos al humo de tabaco ambiental. Todos los valores TI-83/84 (SMOKE): son niveles medidos de cotinina sérica (en ng/ml), un metabolito de la FUMADOR ETS NOETS 1 384 0 0 0 0 0 131 69 0 173 19 0 265 1 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

702 APÉNDICE B Conjuntos de datos Conjunto de datos 13: Contenido de cigarrillos por cigarrillo (miligramos), NICOTINA es la cantidad de nicotina por cigarrillo (miligramos) y CO es la cantidad de monóxido de carbono por ci- Los datos son de 75 cigarrillos (las primeras cinco filas se muestran aquí) garrillo (miligramos). Los datos son de la Comisión Federal de Comercio. en tres categorías: KING incluye cigarrillos tamaño king sin filtro, no mentolados y no light; MENT incluye cigarrillos mentolados de 100 mm Lista de nombres para KGTAR, KGNIC, KGCO, MNTAR, MNNIC, de largo, filtrados y no light; y 100 incluye cigarrillos de 100 mm de lon- TI-83/84 (CIGARET): MNCO, FLTAR, FLNIC, FLCO gitud con filtro, no mentolados y no light. ALQ es la cantidad de alquitrán ALQ KING NICOTINA KING CO KING ALQ MENT NICOTINA MENT CO MENT ALQ 100 NICOTINA 100 CO 100 20 1.1 16 16 1.1 15 5 0.4 4 27 1.7 16 13 0.8 17 16 1.0 19 27 1.7 16 16 1.0 19 17 1.2 17 20 1.1 16 9 0.9 9 13 0.8 18 20 1.1 16 14 0.8 17 13 0.8 18 Conjunto de datos 14: Edades de ganadores del Estos datos son sugeridos por el artículo “Ages of Oscar-Winning Óscar Best Actors and Actresses”, de Richard Brown y Gretchen Davis, Ma- thematics Teacher Magazine. En ese artículo, el año de nacimiento del Los datos son de 87 años (las primeras cinco filas se muestran aquí). Los va- ganador del premio se restó del año de la ceremonia de premiación, pero lores de datos son edades (años) de actrices y actores en el momento en que las edades que figuran aquí se calculan a partir de la fecha de nacimiento ganaron el Óscar en las categorías de Mejor Actriz y Mejor Actor. Las eda- del ganador y la fecha de la ceremonia de premiación. des se listan en orden cronológico por fila, por lo que cada fila tiene edades pareadas del mismo año. (Nota: En 1968 hubo un empate en la categoría de Lista de nombres para OSCRF, OSCRM Mejor Actriz, y se usa la media de las dos edades; en 1932 hubo un empate TI-83/84 (OSCARS): en la categoría de Mejor Actor, y se usa la media de las dos edades). ACTRICES ACTORES 22 44 37 41 28 62 63 52 32 41 Conjunto de datos 15: Presidentes vividos después de la primera investidura. ESTATURA es la altura (cm) del presidente. ESTATURA OPO es la altura (cm) del principal oponente Los datos provienen de 38 presidentes de Estados Unidos (las primeras para la presidencia. cinco filas se muestran aquí). Los presidentes que asumieron el cargo como resultado de un asesinato o renuncia no están incluidos. EDAD es Lista de nombres para PRAGE, DAYS, YEARS, PRHT, HTOPP la edad en años en el momento de la investidura. DÍAS es la cantidad de TI-83/84 (POTUS): (no hay lista para PRESIDENT). Los valores de días que el sujeto sirvió como presidente. AÑOS es el número de años los datos faltantes se representan por 9999. PRESIDENTE EDAD DÍAS AÑOS ESTATURA ESTATURA OPO Washington 57 2864 10 188 J. Adams 61 1460 29 170 189 Jefferson 57 2921 26 189 170 Madison 57 2921 28 163 Monroe 58 2921 15 183 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE B Conjuntos de datos 703 Conjunto de datos 16: Premios Nobel y chocolate Los datos son de “The Real Secret to Genius? Reading Between the Lines”, de McClintock, Stangle y Cetinkaya-Rundel, Chance, vol. 27, núm. Los datos provienen de 23 países (las primeras cinco filas se muestran 1; y “Chocolate Consumption, Cognitive Function, and Nobel Laureates”, aquí). CHOCOLATE incluye el consumo de chocolate (kg per cápita), de Franz Messerli, New England Journal of Medicine, vol. 367, núm. 16. NOBEL incluye el número de Premios Nobel (por cada 10 millones de personas), POBLACIÓN incluye la población (en millones) e INTER- Lista de nombres para CHOC, NOBEL, POPUL, INTNT NET incluye la cantidad de usuarios de Internet por cada 100 personas. TI-83/84 (NOBEL): (sin lista para COUNTRY) PAÍS CHOCOLATE NOBEL POBLACIÓN INTERNET Australia 4.5 5.5 22 79.5 Austria 10.2 24.3 8 79.8 Bélgica 4.4 8.6 11 78.0 Brasil 2.9 0.1 197 45.0 Canadá 3.9 6.1 34 83.0 Conjunto de datos 17: Evaluaciones de cursos basada en la foto del profesor. Según los datos de Andrew Gelman y Jen- nifer Hill, 2007, “Replication Data for Data Analysis Using Regression Los datos provienen de 93 evaluaciones de cursos realizadas por estu- Multilevel Hierarchical Models”, http://hdl.handle.net/1902.1/10285. diantes universitarios (las primeras cinco filas se muestran aquí). EVAL CURSO incluye la calificación media del curso, EVAL PROF incluye la Lista de nombres para CEVAL, PEVAL, PAGE, SIZE, PBTY (sin calificación media del profesor, EDAD PROF incluye la edad del profe- TI-83/84 (EVALS): lista para PROF, PROF GENDER, PROF sor en años, TAMAÑO incluye el número de evaluaciones registradas en cada curso, BELLEZA PROF incluye la calificación media de la belleza PHOTO y CLASS LEVEL) PROF EVAL CURSO EVAL PROF GÉNERO PROF EDAD PROF TAMAÑO BELLEZA PROF FOTO PROF NIVEL CLASE 1 4.3 4.7 mujer 36 24 5.000 color superior 2 4.5 4.6 hombre 59 17 3.000 color superior 3 3.7 4.1 hombre 51 55 3.333 color superior 4 4.3 4.5 mujer 40 40 3.167 color superior 5 4.4 4.8 mujer 31 42 7.333 color superior Conjunto de datos 18: Citas rápidas ción, intereses compartidos) dadas por la mujer al hombre. Los datos para hombres usan los descriptores correspondientes. Las clasificaciones de Los datos son de 199 citas (las primeras cinco filas se muestran aquí). escala más alta corresponden a impresiones más positivas. DEC DE MUJ es la decisión (1 5 sí) de la mujer sobre tener una nueva cita, EDAD MUJ es la edad de la mujer, ME GUSTA POR MUJ es la Datos replicados de Data Analysis Using Regression and Multilevel/ calificación de cuánto “le gusta” el varón a la mujer (escala del 1 al 10), Hierarchical Models, de Andrew Gelman y Jennifer Hill, Cambridge Uni- ATRACT POR MUJ es la calificación de “atractivo” dada por la mujer versity Press. acerca del hombre (escala de 1 al 10), ATRIB POR MUJ es la suma de calificaciones de cinco atributos (sinceridad, inteligencia, diversión, ambi- Lista de nombres para DBYF, DBYM, AGEF, AGEM, LBYF, LBYM, TI-83/84 (DATE): ABYF, ABYM, ATBYF, ATBYM DEC DE MUJ DEC DE HOM EDAD MUJ EDAD HOM ME GUSTA POR MUJ ME GUSTA POR HOM ATRACT POR MUJ ATRACT POR HOM ATRIB POR MUJ ATRIB POR HOM 0 1 27 28 7 7 5 8 38 36 0 0 24 26 7 7 7 6 36 38 1 0 26 28 6 3 7 8 29 35 1 0 34 27 8 6 8 6 38 28 1 0 22 25 5 5 7 5 33 34 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

704 APÉNDICE B Conjuntos de datos Conjunto de datos 19: Pruebas de choques (en g, donde g es la fuerza de la gravedad), FEMUR I es la carga medida automovilísticos en el fémur izquierdo (en lb), FEMUR D es la carga medida en el fémur derecho (en lb), TTI es una medición del índice de trauma torácico lateral Los datos provienen de 21 autos usados en pruebas de choque (las prime- y PELVIS es la desaceleración de la pelvis (en g, donde g es la fuerza de ras cinco filas se muestran aquí). Los mismos automóviles se utilizan en la gravedad). Los datos provienen de la Oficina Nacional de Seguridad del el conjunto de datos 20. Los datos son mediciones de automóviles que se Tráfico en Carreteras. impactaron contra una barrera fija a 35 mi/h con un maniquí de pruebas de choque en el asiento del conductor. HIC es una medida de un criterio Lista de nombres para HIC, CHEST, FEML, FEMR, TTI, PLVS estándar de “lesión en la cabeza”, PECHO es la desaceleración del pecho TI-83/84 (CRASH): (sin lista para CAR y SIZE) AUTO TAMAÑO HIC PECHO FEMUR I FEMUR D TTI PELVIS Chev Aveo Pequeño 371 44 1188 1261 62 71 Honda Civic Pequeño 356 39 289 324 63 71 Mitsubishi Lancer Pequeño 275 37 329 446 35 45 VW Jetta Pequeño 544 54 707 1048 44 66 Hyundai Elantra Pequeño 326 39 602 1474 58 71 Conjunto de datos 20: Mediciones el consumo de combustible (mi/gal) para condiciones de conducción en de automóviles la ciudad, CARRETERA es el consumo de combustible (mi/gal) para las condiciones de conducción en carretera y GEI es una medida de las Los datos provienen de 21 autos (las primeras cinco filas se muestran emisiones de gases de efecto invernadero (en toneladas/año, expresadas aquí). Se utilizan los mismos automóviles que en el conjunto de datos como equivalentes de CO2). Los datos provienen de la Oficina Nacional 19. Los datos son mediciones de automóviles que tienen transmisiones de Seguridad del Tráfico en Carreteras. automáticas. PESO es el peso del automóvil (lb), LONGITUD es la longitud del automóvil (pulgadas), FRENADO es distancia de frenado Lista de nombres para CWT, CLN, CBRK, CCYL, CDISP, CCITY, (pies) desde 60 mi/h, CILINDROS es el número de cilindros, DES- PLAZAMIENTO es el desplazamiento del motor (litros), CIUDAD es TI-83/84 (CARS): CHWY, CGHG (sin lista para CAR y SIZE) AUTO TAMAÑO PESO LONGITUD FRENADO CILINDROS DESPLAZAMIENTO CIUDAD CARRETERA GEI Chev Aveo Pequeño 2560 154 133 4 1.6 25 34 6.6 Honda Civic Pequeño 2740 177 136 4 1.8 25 36 6.3 Mitsubishi Lancer Pequeño 3610 177 126 4 2.0 22 28 7.7 VW Jetta Pequeño 3225 179 137 4 2.0 29 40 6.4 Hyundai Elantra Pequeño 2895 177 138 4 2.0 25 33 6.6 Conjunto de datos 21: Terremotos MAGNITUD es la magnitud medida en la escala de Richter y PROFUN- DIDAD es la profundidad en km. La magnitud y la profundidad describen Los datos son de 600 datos pareados (las primeras cinco filas se muestran la fuente del terremoto. Los datos provienen del Centro de Datos de Terre- aquí) de mediciones de magnitud/profundidad seleccionadas aleatoriamente motos del Sur de California. de 10,594 terremotos registrados en un año en una ubicación en el sur de California. Sólo se usan terremotos con una magnitud de al menos 1.00. Lista de nombres para MAG, DEPTH TI-83/84 (QUAKE): MAGNITUD PROFUNDIDAD 2.45 0.7 3.62 6.0 3.06 7.0 3.30 5.4 1.09 0.5 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE B Conjuntos de datos 705 Conjunto de datos 22: Tornados del tornado en yardas. Los datos provienen del Servicio Meteorológico Nacional. Los datos son de 500 tornados (las primeras cinco filas se muestran aquí) ordenados cronológicamente. MES es el mes del tornado (1 5 enero), Lista de nombres para FSCAL, FATAL, TLEN, TWDTH (sin lista ESCALA F es la escala Fujita de la intensidad del tornado, MUERTES TI-83/84 (TORNADO): para YEAR y MONTH). Los 10 valores fal- es el número de muertes causadas por el tornado, LONGITUD (MI) es tantes de la escala F están representados la distancia que el tornado recorrió en millas y ANCHO (YD) es el ancho por 9999. AÑO MES ESCALA F MUERTES LONGITUD (MI) ANCHO (YD) 1950 5 2 0 3.60 100 1950 5 4 0 34.30 150 1950 6 1 0 0.20 10 1950 8 1 0 0.10 10 1951 6 − 0 0.10 10 Conjunto de datos 23: Old Faithful erupción y ERROR PRED es el error (min) del tiempo predicho para la erupción. De acuerdo con datos de la Asociación de Observación y Los datos son de 250 erupciones (las primeras cinco filas se muestran Estudio de Géiseres. aquí) del géiser Old Faithful en el Parque Nacional Yellowstone. INT ANTES es el intervalo de tiempo (min) anterior a la erupción, DURACIÓN Lista de nombres para INTBF, DUR, INTAF, OFHT, PRED es el tiempo (seg) de la erupción, INT DESPUÉS es el intervalo de TI-83/84 (OLDFAITH): tiempo (min) después de la erupción, ALTURA (ft) es la altura de la INT ANTES (MIN) DURACIÓN (SEG) INT DESPUÉS (MIN) ALTURA (FT) ERROR PRED (MIN) 82 251 83 130 4 99 243 76 125 88 250 86 120 213 92 240 82 120 22 86 243 87 130 26 20 Conjunto de datos 24: Las palabras cuentan Muestra 4: Estudiantes reclutados en clases introductorias de psicología, de 17 a 22 años Los datos provienen de conteos de las palabras habladas en un día por 396 sujetos masculinos (M) y femeninos (F) en seis grupos de muestras dife- Muestra 5: Estudiantes reclutados en clases introductorias de psicología, rentes (las primeras cinco filas se muestran aquí). La columna M1 expresa de 18 a 26 años el conteo de palabras para los hombres en la muestra 1, F1 es el conteo de las mujeres en la muestra 1, y así sucesivamente. Muestra 6: Estudiantes reclutados en clases introductorias de psicología, de 17 a 23 años Muestra 1: Parejas reclutadas con edades comprendidas entre los 18 y los 29 años Los resultados se publicaron en “Are Women Really More Talkative Than Men?” de Mehl, Vazire, Ramírez-Esparza, Slatcher, Pennebaker, Science, Muestra 2: Estudiantes reclutados en clases introductorias de psicología, vol. 317, núm. 5834. de 17 a 23 años Lista de nombres para M1, F1, M2, F2, M3, F3, M4, F4, M5, F5, TI-83/84 (WORDS): M6, F6. M1 F1 M2 F2 M3 F3 M4 F4 M5 F5 M6 F6 27531 20737 23871 16109 21143 6705 47016 11849 39207 15962 28408 15357 15684 24625 5180 10592 17791 21613 27308 25317 20868 16610 10084 13618 5638 5198 9951 24608 36571 11935 42709 40055 18857 22497 15931 9783 27997 18712 12460 13739 6724 15790 20565 18797 17271 5004 21688 26451 25433 12002 17155 22376 15430 17865 21034 20104 10171 37786 12151 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

706 APÉNDICE B Conjuntos de datos la ventanilla de entrega. Los tiempos de la comida se midieron entre las 11:00 AM y las 2:00 PM y los horarios de las cenas se midieron entre Conjunto de datos 25: Comida rápida las 4:00 PM y las 7:00 PM. Datos recopilados por el autor. Los datos son de 400 observaciones (las primeras cinco filas se muestran Lista de nombre para MCDL, MCDD, BKL, BKD, WL, WD, aquí) de los tiempos de servicio en automóvil (seg) en diferentes restau- TI-83/84 (FASTFOOD): DDL, DDD rantes de comida rápida. Los tiempos comienzan cuando un vehículo se detiene en la ventanilla de pedido y finaliza cuando el vehículo sale de COMIDA CENA COMIDA CENA COMIDA CENA COMIDA CENA MCDONALDS MCDONALDS BURGER KING BURGER KING WENDYS WENDYS DUNKIN DONUTS DUNKIN DONUTS 107 84 116 101 466 56 86 181 139 121 131 126 387 82 201 50 197 119 147 153 368 120 179 177 209 146 120 116 219 116 131 107 281 266 126 175 177 121 126 68 Conjunto de datos 26: Pesos y volúmenes Lista de nombres para CRGWT, CRGVL, CDTWT, CDTVL, de bebidas de cola TI-83/84 (COLA): PRGWT, PRGVL, PDTWT, PDTVL Los datos son de 144 latas de bebidas cola (las primeras cinco filas se mues- tran aquí). PESO es el peso en libras y VOL es el volumen en onzas. PESO COCA REG VOL COCA REG PESO DIET COKE VOL DIET COKE PESO PEPSI REG VOL PEPSI REG PESO DIET PEPSI VOL PEPSI DIET 0.8192 12.3 0.7773 12.1 0.8258 12.4 0.7925 12.3 0.8150 12.1 0.7758 12.1 0.8156 12.2 0.7868 12.2 0.8163 12.2 0.7896 12.3 0.8211 12.2 0.7846 12.2 0.8211 12.3 0.7868 12.3 0.8170 12.2 0.7938 12.3 0.8181 12.2 0.7844 12.2 0.8216 12.2 0.7861 12.2 Conjunto de datos 27: Pesos de M&Ms Lista de datos RED, ORNG, YLLW, BROWN, BLUE, GREEN TI-83/84 (MM): Los datos son de 100 pesos (gramos) de caramelos simples M&M (las pri- meras cinco filas se muestran aquí). Datos recopilados por el autor. ROJO NARANJA AMARILLO CAFÉ AZUL VERDE 0.751 0.735 0.883 0.696 0.881 0.925 0.841 0.895 0.769 0.876 0.863 0.914 0.856 0.865 0.859 0.855 0.775 0.881 0.799 0.864 0.784 0.806 0.854 0.865 0.966 0.852 0.824 0.840 0.810 0.865 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE B Conjuntos de datos 707 Conjunto de datos 28: Galletas con chispas Los valores son conteos de cantidades de chispas de chocolate en cada de chocolate galleta. Datos recopilados por el autor. Los datos provienen de 170 galletas con chispas de chocolate (las pri- Lista de nombres CAREG, CACHW, CARF, KEEB, HANNA. meras cinco filas se muestran aquí). Las marcas son Chips Ahoy regular, TI-83/84 (CHIPS): Chips Ahoy Chewy, Chips Ahoy reducidas en grasa, Keebler y Hannaford. CHIPS AHOY REG CHIPS AHOY CHEWY CHIPS AHOY RED GRASA KEEBLER HANNAFORD 22 21 13 29 13 22 20 24 31 15 26 16 18 25 16 24 17 16 32 21 23 16 21 27 15 Conjunto de datos 29: Pesos de monedas 3% de cobre y 97% de zinc. Las “monedas de ¢25 de plata anteriores a 1964” son 90% de plata y 10% de cobre. Las “monedas de ¢25 posterio- Los datos son de 222 monedas (las primeras cinco filas se muestran aquí) res a 1964” están hechas con una aleación de cobre y níquel. que consisten en los pesos de las monedas (gramos). Los “centavos ante- riores a 1983” se fabricaron después de los peniques indios y de trigo, y Lista de nombres para CPIND, CPWHT, CPPRE, CPPST, CPCAN, son 97% de cobre y 3% de zinc. Los “centavos posteriores a 1983” son TI-83/84(MONEDAS): CQPRE, CQPST, CDOL PENIQUES PENIQUES PENIQUES PENIQUES PENIQUES CUARTOS CUARTOS MONEDAS DEL INDIO DE TRIGO ANTERIORES A 1983 POSTERIORES A 1983 CANADIENSES ANTERIORES A 1964 POSTERIORES A 1964 DE DÓLAR 3.0630 3.1366 3.1582 2.5113 3.2214 6.2771 5.7027 8.1008 3.0487 3.0755 3.0406 2.4907 3.2326 6.2371 5.7495 8.1072 2.9149 3.1692 3.0762 2.5024 2.4662 6.1501 5.7050 8.0271 3.1358 3.0476 3.0398 2.5298 2.8357 6.0002 5.5941 8.0813 2.9753 3.1029 3.1043 2.4950 3.3189 6.1275 5.7247 8.0241 Conjunto de datos 30: Latas de aluminio presionadas en su sitio. LATAS 109 incluye latas que tienen un espesor de 0.0109 pulgadas, y LATAS 111 incluye latas que tienen un espesor de Los datos provienen de 350 latas (las primeras cinco filas se muestran 0.0111 pulgadas. aquí) que consisten en las cargas axiales máximas (libras) medidas. Las cargas axiales se aplican cuando las partes superiores de las latas son Lista de nombres TI-83/84 (CANS): CN109, CN111 LATAS 109 LATAS 111 270 287 273 216 258 260 204 291 254 210 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

708 APÉNDICE B Conjuntos de datos Conjunto de datos 31: Peso de la basura Lista de nombres HHSIZ, METAL, PAPER, PLAS, GLASS, Los datos provienen de 62 hogares (las primeras cinco filas se muestran TI-83/84 (GARBAGE): FOOD, YARD, TEXT, OTHER, TOTAL aquí) que consisten en los pesos (libras) de basura dispuesta en diferentes categorías. TAMAÑO CASA es el tamaño del hogar. Datos proporciona- dos por Masakuza Tani, del Proyecto de Basura, Universidad de Arizona. TAMAÑO CASA METAL PAPEL PLÁSTICO VIDRIO COMIDA PATIO TEXTIL OTRO TOTAL 2 1.09 2.41 0.27 0.86 1.04 0.38 0.05 4.66 10.76 3 1.04 7.57 1.41 3.46 3.68 0.00 0.46 2.34 19.96 3 2.57 9.55 2.19 4.52 4.43 0.24 0.50 3.60 27.60 6 3.02 8.82 2.83 4.92 2.98 0.63 2.26 12.65 38.11 4 1.50 8.72 2.19 6.31 6.30 0.15 0.55 2.18 27.90 Conjunto de datos 32: Velocidades de datos (Mbps) de cuatro operadores de telefonía celular. Con base en datos transmisión de datos en aeropuertos de CNN. Los datos provienen de 50 aeropuertos (las primeras cinco filas se Nombres de lista VRZN, SPRNT, ATT, TMOBL (sin lista para muestran aquí) que consisten en las velocidades de transmisión de TI-83/84 (DATASPED): AIRPORT CODE) CÓDIGO AEROPUERTO VERIZON SRINT ATT T-MOBILE RSW 38.5 13.0 9.7 8.6 ORD 55.6 30.4 8.2 7.0 SNA 22.4 15.2 7.1 18.5 MEM 14.1 2.4 14.4 16.7 MKE 23.1 2.7 13.4 5.6 (Los conjuntos de datos completos están disponibles en www.pearsonenespañol.com/triola)

APÉNDICE C Sitios web y bibliografía de libros Sitios web *Huff, D. 1993. How to Lie with Statistics. Nueva York: W. W. Norton & Company. Triola Stats: www.TriolaStats.com Acceda a recursos digitales continuamente actualizados para la serie *Jaffe, A. y H. Spirer. 1998. Misused Statistics. New York: Marcel Dekker. de estadística de Triola, incluidos los conjuntos de datos descargables, Kaplan, M. 2007. Chances Are. Nueva York: Penguin Group. complementos de los libros de texto, videos instructivos en línea, el Kotz, S. y D. Stroup. 1983. Educated Guessing—How to Cope in an Un- Blog de Triola y más. certain World. Nueva York: Marcel Dekker. Statdisk: www.Statdisk.org Lapp, James. 2018. Student Solutions Manual to Accompany Elementary Descargue el software estadístico gratuito Statdisk que está diseñado específicamente para este libro y contiene todos los conjuntos de datos Statistics. 13a. ed. Boston: Pearson. del apéndice B. En la página de ayuda del sitio se proporciona informa- Mlodinow, L. 2009. The Drunkard’s Walk. Nueva York: Vintage Books. ción detallada sobre el uso de Statdisk. *Moore, D. y W. Notz. 2012. Statistics: Concepts and Controversies. 8a. StatCrunch: www.statcrunch.com ed. San Francisco: Freeman. *Paulos, J. 2001. Innumeracy: Mathematical Illiteracy and Its Consequences. Libros Nueva York: Hill and Wang. *Un asterisco denota un libro recomendado para su lectura. Los de- *Reichmann, W. 1981. Use and Abuse of Statistics. Nueva York: Penguin. más libros se recomiendan como textos de referencia. *Rossman, A. y B. Chance. 2011. Workshop Statistics: Discovery with Bennett, D. 1998. Randomness. Cambridge, Mass.: Harvard University Press. Data. 4a. ed. Emeryville, Calif.: Key Curriculum Press. *Best, J. 2012. Damned Lies and Statistics. Berkeley, Calif.: University of *Salsburg, D. 2001. The Lady Tasting Tea: How Statistics Revolutionized California Press. the Twentieth Century. Nueva York: W. H. Freeman. *Best, J. 2004. More Damned Lies and Statistics. Berkeley, Calif.: Univer- Sheskin, D. 2011. Handbook of Parametric and Nonparametric Statistical sity of California Press. Procedures. 5a. ed. Boca Raton, Fla.: CRC Press. *Campbell, S. 2004. Flaws and Fallacies in Statistical Thinking. Mineola, Simon, J. 1997. Resampling: The New Statistics. 2a. ed. Arlington, Va.: N.Y.: Dover Publications. Resampling Stats. *Crossen, C. 1996. Tainted Truth: The Manipulation of Fact in America. *Stigler, S. 1986. The History of Statistics. Cambridge, Mass.: Harvard Nueva York: Simon & Schuster. University Press. *Freedman, D., R. Pisani, R. Purves y A. Adhikari. 2007. Statistics. 4a. ed. Taleb, N. 2010. The Black Swan. 2a. ed. Nueva York: Random House. Triola, M. 2018. Minitab Student Laboratory Manual and Workbook. 13a. Nueva York: W. W. Norton & Company. *Gonick, L. y W. Smith. 1993. The Cartoon Guide to Statistics. Nueva ed. Boston: Pearson. Triola, M. 2018. Statdisk 13 Student Laboratory Manual and Workbook. York: Harper Collins. *Heyde, C. y E. Seneta, eds. 2001. Statisticians of the Centuries. Nueva 13a. ed. Boston: Pearson. Triola, M. y L. Franklin. 1994. Business Statistics. Boston: Addison-Wesley. York: Springer-Verlag. Triola, M., M. Triola y J. Roy. 2018. Biostatistics for the Biological and *Hollander, M. y F. Proschan. 1984. The Statistical Exorcist: Dispelling Health Sciences. 2a. ed. Boston: Pearson. Statistics Anxiety. Nueva York: Marcel Dekker. *Tufte, E. 2001. The Visual Display of Quantitative Information. 2a. ed. *Holmes, C. 1990. The Honest Truth About Lying with Statistics. Spring- Cheshire, Conn.: Graphics Press. field, Ill.: Charles C. Thomas. Tukey, J. 1977. Exploratory Data Analysis. Boston: Pearson. *Hooke, R. 1983. How to Tell the Liars from the Statisticians. Nueva York: Vickers, A. 2009. What Is a P-Value Anyway? Boston: Pearson. Whelan, C. 2013. Naked Statistics. Nueva York: W. W. Norton & Company. Marcel Dekker. Zwillinger, D. y S. Kokoska. 2000. CRC Standard Probability and Statis- tics Tables and Formulae. Boca Raton, Fla.: CRC Press. 709

APÉNDICE D Respuestas a ejercicios de sección con número impar, respuestas a todos los exámenes rápidos, ejercicios de repaso y ejercicios de repaso acumulado de los capítulos. Respuestas del capítulo 1 b. No. Debido a que el resultado es un conteo de encuestados entre Sección 1-1 las 1165 mujeres casadas o comprometidas que fueron encuesta- 1. Los encuestados son una muestra de respuesta voluntaria o una mues- das, el resultado debe ser un número entero. tra autoseleccionada. Debido a que las personas con fuertes intereses en el tema tienen más probabilidades de responder, es muy posible c. 559 encuestados d. 8% que sus respuestas no reflejen las opiniones o el comportamiento de la población en general. 33. Como una reducción del 100% eliminaría todo el tamaño, no es posi- 3. La significancia estadística se indica al utilizar métodos estadísticos ble reducir el tamaño en un 100% o más. para llegar a la conclusión de que un tratamiento es efectivo, pero el sentido común podría sugerir que el tratamiento no implica una 35. Debido a que una reducción del 100% eliminaría toda la placa, no es diferencia suficiente para justificar su uso o para ser práctico. Sí, es posible que un estudio tenga significancia estadística, pero no signifi- posible reducirla en más del 100%. cancia práctica. 37. La redacción de la pregunta es parcial y tiende a alentar respuestas 5. Sí, parece haber un potencial para crear un sesgo. 7. No, no parece haber un potencial para crear un sesgo. negativas. El tamaño de muestra de 20 es demasiado pequeño. Los en- 9. La muestra es una muestra de respuesta voluntaria y tiene un gran cuestados son autoseleccionados en lugar de ser seleccionados al azar potencial para ser defectuosa. 11. El método de muestreo parece ser correcto. por el periódico. Si 20 lectores responden, los porcentajes deben ser 13. Con sólo 1% de posibilidades de obtener dichos resultados con un múltiplos de 5, por lo que el 87% y el 13% no son resultados posibles. programa que no tiene ningún efecto, el programa parece tener signi- ficancia estadística. Además, debido a que la pérdida promedio de 22 Sección 1-2 libras parece sustancial, el programa también parece tener significan- cia práctica. 1. La población está compuesta por todos los adultos en Estados Uni- 15. Debido a que hay 19% de posibilidades de obtener esa cantidad de niñas por casualidad, el método parece carecer de significancia es- dos, y la muestra son los 2276 adultos encuestados. Debido a que el tadística. El resultado de 1020 niñas en 2000 nacimientos (51% de niñas) es superior a la tasa de aproximadamente 50% que se espera valor del 33% se refiere a la muestra, es un dato estadístico. por casualidad, pero no parece ser lo suficientemente alta como para tener una significancia práctica. No muchas parejas se molestarían en 3. Sólo el inciso (a) describe datos discretos. adoptar un procedimiento que aumenta la probabilidad de tener una niña de 50% a 51%. 5. Estadístico 7. Parámetro 9. Estadístico 17. Sí. Cada columna de temperaturas de 8 AM y 12 AM se registra para el mismo sujeto, por lo que cada par es correspondiente. 11. Parámetro 13. Continuo 15. Discreto 19. Los datos se pueden usar para abordar la cuestión de si existe una correlación entre las temperaturas corporales a las 8 AM y 17. Discreto 19. Continuo 21. Ordinal a las 12 AM. Además, los datos pueden usarse para determinar si existen diferencias entre las temperaturas corporales a las 8 AM 23. Nominal 25. De intervalo 27. Ordinal y a las 12 AM. 21. No. Los recuentos de glóbulos blancos miden una cantidad diferente 29. Los números no son conteos o medidas de nada. Están en el nivel no- a los recuentos de glóbulos rojos, por lo que sus diferencias no tienen sentido. minal de medición, y no tiene sentido calcular su promedio (media). 23. No. El Centro Nacional de Estadísticas de la Salud no tiene ninguna razón para recopilar o presentar los datos de una manera parcial. 31. Las temperaturas están en el nivel de medición de intervalo. Debido 25. Es cuestionable que el patrocinador sea la Comisión de la Papa de Idaho y el vegetal favorito sea la papa. a que no hay un punto de inicio natural con 0°F que represente “sin 27. La correlación o asociación entre dos variables no significa que una de las variables sea la causa de la otra. La correlación no implica cau- calor”, las razones como “dos veces” no tienen sentido, por lo que es salidad. Claramente, el consumo de crema agria no está directamente relacionado de ninguna manera con las muertes en motocicletas. incorrecto decir que el lugar de residencia del autor es dos veces más 29. a. 700 adultos b. 55% 31. a. 559.2 encuestados cálido que Auckland, Nueva Zelanda. 710 33. a. Continuo, porque el número de valores posibles es infinito y no contable b. Discreto, porque el número de valores posibles es finito c. Discreto, porque el número de valores posibles es finito d. Discreto, porque el número de valores posibles es infinito y contable Sección 1-3 1. El estudio es un experimento porque los sujetos recibieron tratamientos. 3. Los tamaños de muestra grupales de 547, 550 y 546 son todos gran- des para que los investigadores puedan ver los efectos del tratamiento con paracetamol. 5. La muestra parece ser una muestra de conveniencia. Al enviar por correo electrónico la encuesta a un grupo de usuarios de Internet fácilmente disponible, fue fácil obtener resultados. Aunque existe un potencial real para obtener un grupo de muestra que no es represen- tativo de la población, las indicaciones de qué oído se utiliza para las llamadas de teléfono celular y qué mano es dominante no parecen ser factores que se distorsionarían mucho por un sesgo muestral. 7. Con 717 respuestas, la tasa de respuesta es del 14%, que parece ser bastante baja. En general, una tasa de respuesta muy baja crea un serio potencial para obtener una muestra sesgada que consiste en aquellos con un interés especial en el tema.

APÉNDICE D 711 9. Sistemático 11. Aleatorio 13. Por conglomerados 7. a. Discreto b. De razón 15. Estratificado 17. Aleatorio 19. De conveniencia c. Las respuestas enviadas por correo serían una muestra de res- 21. Estudio observacional. La muestra es una muestra de conveniencia puesta voluntaria, por lo que aquellos con opiniones fuertes o un que consiste en sujetos que decidieron responder. Tales muestras de mayor interés en los temas tienen más probabilidades de respon- respuesta voluntaria tienen una alta probabilidad de no ser represen- der. Es muy posible que los resultados no reflejen las opiniones tativas de la población total, por lo que la muestra puede ser parcial. verdaderas de la población de todos los estudiantes universitarios La pregunta fue publicada en una edición electrónica de un periódico, a tiempo completo. por lo que la muestra está sesgada desde el principio. d. Estratificado e. Por conglomerados 23. Experimento. Este experimento crearía una situación extremada- 8. a. Si no tienen grasa, tienen un 100% menos que cualquier otra can- mente peligrosa e ilegal que tiene un potencial real de causar lesiones tidad con grasa, por lo que la cifra del 125% no puede ser correcta. o la muerte. Ya es bastante difícil conducir en la ciudad de Nueva b. 686 c. 28% York estando completamente sobrio. 9. a. Datos de intervalo; muestra sistemática 25. Experimento. La muestra sesgada creada mediante el uso de conduc- b. Datos nominales; muestra estratificada tores de la ciudad de Nueva York no puede arreglarse con una mues- c. Datos ordinales; muestra de conveniencia tra más grande. La muestra más grande seguirá siendo una muestra 10. Debido a que hay un 15% de posibilidades de obtener los resultados sesgada que no es representativa de los conductores en Estados por casualidad, esos resultados podrían ocurrir fácilmente de esa ma- Unidos. nera, por lo que el método no parece tener significancia estadística. 27. Estudio observacional. Los encuestados que han sido condenados por El resultado de 236 niñas en 450 nacimientos es una tasa del 52.4%, delitos mayores no responderán honestamente a la segunda pregunta. por lo que está por encima del 50% esperado por azar, pero no parece La encuesta sufriría un “sesgo de deseabilidad social” porque los su- ser lo suficientemente alto como para tener una significancia práctica. jetos tenderían a responder de manera que los encuestados los vieran El procedimiento no parece tener significancia estadística o signifi- de manera favorable. cancia práctica. 29. Estudio prospectivo 31. Estudio transversal Capítulo 1: Ejercicios de repaso acumulado 33. Diseño de pares combinados 35. Diseño completamente aleatorizado 1. 3162.5 gramos. Todos los pesos terminan con 00, lo que sugiere que 37. a. No es una muestra aleatoria simple, pero es una muestra aleatoria. fueron redondeados de modo que los últimos dígitos tuvieran esa ca- b. Muestra aleatoria simple y también muestra aleatoria. racterística. c. No es una muestra aleatoria simple ni tampoco una muestra 2. 0.015625 3. 16.00 es un valor significativamente alto. aleatoria. 4. 26.64 5. 1067 6. 575 gramos 7. 27343.75 gramos2 Capítulo 1: Examen rápido 8. 0.20 9. 0.00065536 1. No. Los números no miden ni cuentan nada. 10. 31,381,059,609 (o aproximadamente 31,381,060,000) 2. Nominal 3. Continuo 4. Datos cuantitativos 11. 78,364,164,096 (o alrededor de 78,364,164,000) 5. De razón 6. Estadístico 7. No 12. 0.000000531441 8. Estudio observacional Respuestas del capítulo 2 9. Los sujetos no sabían si estaban tomando aspirina o el placebo. 10. Muestra aleatoria simple Sección 2-1 Capítulo 1: Ejercicios de repaso 1. La tabla resume 50 tiempos de servicio. No es posible identificar los valores exactos de todos los tiempos originales. 1. El patrocinador de la encuesta tiene el potencial de beneficiarse de los resultados, lo que genera dudas sobre la objetividad de los 3. resultados. Tiempo (seg) Frecuencia relativa 2. a. La muestra es una muestra de respuesta voluntaria, por lo que los 60-119 14% resultados son cuestionables. b. Estadístico c. Estudio observacional 120-179 44% 3. Aleatorizado: los sujetos fueron asignados a los diferentes grupos a 180-239 28% través de un proceso de selección aleatoria, por lo que tuvieron las mismas posibilidades de pertenecer a cada grupo. Doble ciego: los 240-299 4% sujetos no sabían en cuál de los tres grupos se encontraban y las per- sonas que evaluaron los resultados tampoco lo sabían. 300-359 10% 4. No. La correlación no implica causalidad. 5. Ancho de clase: 10. Puntos medios de clase: 24.5, 34.5, 44.5, 54.5, 5. Sólo el inciso (c) es una muestra aleatoria simple. 64.5, 74.5, 84.5. Límites de clase: 19.5, 29.5, 39.5, 49.5, 59.5, 69.5, 6. Sí. Las dos preguntas dan la falsa impresión de que abordan cues- 79.5, 89.5. Número: 87. tiones muy diferentes. La mayoría de las personas estaría a favor de 7. Ancho de clase: 100. Puntos medios de clase: 49.5, 149.5, 249.5, defender el matrimonio, por lo que es probable que la primera pre- 349.5, 449.5, 549.5, 649.5. Límites de clase: 20.5, 99.5, 199.5, gunta reciba una cantidad sustancial de respuestas “sí”. La segunda 299.5, 399.5, 499.5, 599.5, 699.5. Número: 153. pregunta describe mejor el problema y es mucho más probable que los sujetos tengan respuestas variadas. 9. No. La frecuencia máxima está en la segunda clase en lugar de estar cerca del medio, por lo que las frecuencias por debajo del máximo no reflejan las que están por encima de éste.

712 APÉNDICE D 11. Duración (seg) Frecuencia 21. Edad (años) de la mejor Frecuencia 125-149 1 actriz cuando ganó el acumulada 150-174 0 Oscar 175-199 0 Menos de 30 29 200-224 3 Menos de 40 63 225-249 34 Menos de 50 77 250-274 12 Menos de 60 80 Menos de 70 85 13. Tiempos de servicio Frecuencia Menos de 80 86 (seg) para la comida en Menos de 90 87 Burger King 11 23 23. No. La frecuencia relativa más alta de 24.8% no es mucho más alta 70-109 7 que las demás. 6 110-149 3 Reacción adversa Frecuencia relativa Dolor de cabeza 23.6% 150-189 Hipertensión 8.7% Resp. Sup. infección del tracto 24.8% 190-229 Nasofaringitis 21.1% Diarrea 21.9% 230-269 15. La distribución no parece ser una distribución normal. Tiempos de servicio Frecuencia 25. Sí, la distribución de frecuencia parece ser una distribución normal. (seg) para la comida en 25 Presión arterial sistólica Frecuencia Wendy’s 15 (mm Hg) 6 80-99 11 70-149 3 100-119 116 1 120-139 131 150-229 140-159 34 160-179 230-309 180-199 7 1 310-389 390-469 17. Debido a que hay desproporcionadamente más 0 y 5, parece que las estaturas se reportaron en lugar de medirse. Es probable que los re- sultados no sean muy precisos. Último dígito Frecuencia 27. Sí, la distribución de frecuencias parece ser una distribución normal. 0 9 1 2 Magnitud Frecuencia 2 1 1.00-1.49 19 3 3 1.50-1.99 97 4 1 2.00-2.49 187 5 15 2.50-2.99 147 6 2 3.00-3.49 100 7 0 3.50-3.99 38 8 3 4.00-4.49 8 9 1 4.50-4.99 4 19. Las actrices parecen ser generalmente más jóvenes que los actores. Edad (años) Actrices Actores 20-29 33.3% 1.1% 30-39 39.1% 32.2% 40-49 16.1% 41.4% 50-59 3.4% 17.2% 60-69 5.7% 6.9% 70-79 1.1% 1.1% 80-89 1.1%

APÉNDICE D 713 29. Un valor atípico puede aumentar drásticamente el número de clases. 13. El histograma parece ser asimétrico a la derecha (o positivamente asimétrico). Peso (lb) Con valor atípico Sin valor atípico Frecuencia 200-219 6 6 Tiempo de servicio en la comida en Wendy’s (segundos) 220-239 5 5 15. Los dígitos 0 y 5 parecen surgir más a menudo que los otros dígi- 240-259 12 12 260-279 36 36 tos, por lo que puede indicar que las estaturas se reportaron y no se 280-299 87 87 midieron realmente. Esto sugiere que los datos pueden no ser muy 300-319 28 28 útiles. 320-339 0 340-359 0 360-379 0 380-399 0 400-419 0 420-439 0 440-459 0 460-479 0 480-499 0 500-519 1 Sección 2-2 Frecuencia 1. El histograma debe tener forma de campana. Último dígito 3. Con un conjunto de datos tan pequeño, la verdadera naturaleza de la 17. Las edades de las actrices son más bajas que las edades de los distribución no se puede ver con un histograma. actores. 5. 40 7. La forma de la gráfica no cambiaría. La escala vertical sería diferente, pero las alturas relativas de las barras serían las mismas. 9. Debido a que está lejos de tener una forma de campana, el histo- grama no parece representar datos de una población con distribución normal. Edad Frecuencia 89.5 79.5 69.5 59.5 49.5 39.5 29.5 19.5 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% Duración (segundos) Actrices Actores 11. El histograma parece ser asimétrico a la derecha (o positivamente Sección 2-3 asimétrico). 1. El conjunto de datos es demasiado pequeño para que una gráfica re- Frecuencia vele características importantes de los datos. Con un conjunto de da- tos tan pequeño, sería mejor simplemente listar los datos o colocarlos en una tabla. 3. No. Las gráficas deben trazarse de una manera que sea justa y obje- tiva. Se debe permitir que los lectores hagan sus propios juicios, en lugar de ser manipulados por gráficos engañosos. 5. El pulso de 36 latidos por minuto parece ser un valor atípico. Tiempo de servicio en la comida en Burger King (segundos)

714 APÉNDICE D 15. La distribución parece ser asimétrica a la izquierda (o negativamente asimétrica). 7. Los datos están ordenados de menor a mayor, como en 36, 56, 56, etcétera. 9. Hay una tendencia gradual al alza que parece estar estabilizándose Frecuencia en los últimos años. Una tendencia ascendente sería útil para que las ganancias de las mujeres fuesen iguales a las de los hombres.Ganancias de las mujeres Duración (segundos) (% de las de los hombres) 11. La mala conducta incluye fraude, duplicación y plagio, por lo que 17. Debido a que la escala vertical comienza con una frecuencia de 200 parece ser un factor importante. en lugar de 0, la diferencia entre las respuestas “no” y “sí” es muy exagerada. La gráfica hace que parezca que alrededor de cinco veces más respondieron “no”, cuando la proporción es un poco menos de 2.5 a 1. 19. Los dos costos son de naturaleza unidimensional, pero los biberones son objetos tridimensionales. El costo de $4500 no es ni el doble del costo de $2600, pero los biberones hacen que parezca que el costo mayor es aproximadamente cinco veces el costo más bajo. 21. Número de rectificaciones Sección 2-4 Fraude 1. El término lineal se refiere a una línea recta, y r mide qué tan bien se Error ajusta un diagrama de dispersión de la muestra de datos pareados a Duplicación un patrón de línea recta. Otro 3. Un diagrama de dispersión es una gráfica de datos cuantitativos pa- Plagio reados (x, y). Proporciona una imagen visual de los datos graficados como puntos, y dicha imagen es útil para permitirnos ver patrones 13. Otro Error en los datos y para reconocer si existe una correlación entre las dos Duplicación Plagio variables. 5. No parece haber una correlación lineal entre el volumen cerebral y la puntuación de IQ. Fraude Volumen cerebral

APÉNDICE D 715 7. Parece que hay una correlación lineal entre el peso y el consumo de 2. Sí, los datos parecen ser de una población con una distribución nor- combustible en carretera mal porque las barras comienzan bajas y alcanzan un máximo, luego disminuyen, y la mitad izquierda del histograma es aproximadamente una imagen especular de la mitad derecha. Carretera (mpg) Frecuencia Peso 9. Con n 5 5 pares de datos, los valores críticos son 60.878. Debido Temperatura corporal (Farenheit) a que r 5 0.127 está entre 20.878 y 0.878, la evidencia no es sufi- 3. Al utilizar menos clases, el histograma ilustra de mejor manera la ciente para concluir que existe una correlación lineal. distribución. 11. Con n 5 7 pares de datos, los valores críticos son 60.754. Como r 5 20.987 está en la región de la cola izquierda debajo de 20.754, 4. No hay valores atípicos. hay datos suficientes para concluir que hay una correlación lineal. 5. No. No hay un patrón que sugiera que haya una relación. 13. Debido a que el valor P no es pequeño (0.05 o menos), hay una alta probabilidad (83.9%) de obtener los resultados de la muestra cuando Temperatura corporal a las 12 AM no hay correlación, por lo que la evidencia no es suficiente para con- cluir que hay correlación lineal. 15. Debido a que el valor P es pequeño (0.05 o menos), hay una pequeña posibilidad de obtener los resultados de la muestra cuando no hay co- rrelación, por lo que hay suficiente evidencia para concluir que existe una correlación lineal. Capítulo 2: Examen rápido 1. Ancho de clase: 3. No es posible identificar los valores de datos ori- ginales. 2. Límites de clase: 17.5 y 20.5. Límites de clase: 18 y 20. 3. 40 4. 19 y 19 5. Diagrama de Pareto 6. Histograma 7. Gráfica de dispersión 8. No, el término “distribución normal” tiene un significado diferente al del término “normal” que se usa en el habla común. Una distribución Temperatura corporal a las 8 AM normal tiene forma de campana, pero los dígitos de la lotería selec- 6. a. Gráfica de series de tiempo b. Gráfica de dispersión cionados al azar tendrán una forma uniforme o plana. c. Diagrama de Pareto 9. Variación 7. Una gráfica circular desperdicia tinta en componentes que no son 10. Las barras del histograma comienzan relativamente bajas, aumentan datos; las gráficas circulares carecen de una escala apropiada; las hasta un máximo y luego disminuyen. Además, el histograma es gráficas circulares no muestran los tamaños relativos de los diferentes simétrico, y la mitad izquierda es aproximadamente una imagen es- componentes, así como algunas otras gráficas, por ejemplo un dia- pecular de la mitad derecha. grama de Pareto. Capítulo 2: Ejercicios de repaso Obviamente 1. Es como Temperatura Frecuencia Como sea (°F) 2 4 Nada más digo 97.0-97.4 7 97.5-97.9 5 Ya sabes 98.0-98.4 2 98.5-98.9 99.0-99.4

716 APÉNDICE D 8. El diagrama de Pareto hace un mejor trabajo. Llama la atención sobre Capítulo 3 Respuestas las palabras o frases más molestas y muestra los tamaños relativos de las diferentes categorías. Sección 3-1 Frecuencia 1. El término promedio no se usa en estadística. Se debe emplear el tér- mino media para el resultado obtenido al sumar todos los valores de Como sea Es como Ya sabes Nada más digo Obviamente la muestra y dividir el total por el número de valores muestrales. Capítulo 2: Ejercicios de repaso acumulado 3. Usan diferentes métodos para proporcionar un valor (o valores) del 1. centro o la mitad de la lista ordenada de datos. Horas totales Frecuencia 5. x 5 57.1; mediana 5 60.0; moda 5 ninguna; rango medio 5 53.0. 235-239 4 Los números de jersey son datos nominales que sólo reemplazan 240-244 3 nombres, y no miden ni cuentan nada, por lo que los estadísticos 245-249 9 resultantes no tienen sentido. 250-254 8 255-259 3 7. x 5 $172.0 millones; mediana 5 $160.0 millones; moda 5 $150 260-264 3 millones; rango medio 5 $200.0 millones. Además del hecho de que todas las demás celebridades tienen patrimonios netos inferiores a 2. a. 235 horas y 239 horas b. 234.5 horas y 239.5 horas los dados, no se puede conocer nada significativo sobre la población c. 237 horas de patrimonios netos de todas las celebridades. Todos los números terminan en 0 o 5, y parecen ser estimaciones redondeadas. 3. La distribución está más cerca de ser una distribución normal que las otras. 9. x 5 7.7 huracanes; mediana 5 8.0 huracanes; moda 5 8 huracanes; rango medio 5 8.5 huracanes. Los datos son datos de series de Frecuencia tiempo, pero las medidas de tendencia central no revelan nada sobre una tendencia que consista en un patrón de cambio a lo largo del Número total de horas jugadas tiempo. 4. Comience la escala vertical a una frecuencia de 2 en vez de a una 11. x 5 $1454.2; mediana 5 $1500.0; moda 5 $1500; rango medio 5 frecuencia de 0. $1375.0. La muestra consiste en las “mejores compras” de televisores, 5. Al observar las dimensiones del diagrama de tallo y hojas, podemos por lo que no es una muestra aleatoria y no es probable que sea repre- sentativa de la población. El precio más bajo es un dato estadístico ver que la distribución se aproxima a una distribución normal. relevante para alguien que planea comprar uno de los televisores. 6. a. Continuo b. Cuantitativo c. De razón 13. x 5 32.6 mg; mediana 5 39.5 mg; moda 5 0 mg; rango medio 5 d. Muestra de conveniencia e. Muestra 27.5 mg. Los estadounidenses consumen algunas marcas con mucha más frecuencia que otras, pero las 20 marcas se ponderan por igual en los cálculos, por lo que los estadísticos no son necesariamente representativos de la población de todas las latas de las mismas 20 marcas consumidas por los estadounidenses. 15. x 5 9.45 pulg.; mediana 5 9.30 pulg.; moda 5 9.1 pulg.; rango me- dio 5 9.50 pulg. Debido a que las mediciones se realizaron en 1988, no son necesariamente representativas de la población actual de todas las mujeres del ejército. 17. x 5 $365.3; mediana 5 $200.0; moda 5 $500; rango medio 5 $1269.5. Las cantidades de $1500 y $2500 parecen ser valores atípicos. 19. x 5 2.8 cigarrillos; mediana 5 0.0 cigarrillos; moda 5 0 cigarrillos; rango medio 5 25.0 cigarrillos. Debido a que los sujetos selecciona- dos informan la cantidad de cigarrillos fumados, es muy posible que los datos no sean del todo precisos. ¿Y qué hay de esa persona que fuma 50 cigarrillos (o 2.5 paquetes) al día? ¿Qué está pensando? 21. Sistólica: x 5 127.6 mm Hg; mediana 5 124.0 mm Hg. Diastólica: x 5 73.6 mm Hg; mediana 5 75.0 mm Hg. Dado que las presiones arteriales sistólica y diastólica miden diferentes características, una comparación de las medidas de tendencia central no tiene sentido. Debido a que los datos coinciden, tendría más sentido investigar si existe una asociación o correlación entre las medidas de presión arte- rial sistólica y las medidas de presión arterial diastólica.

APÉNDICE D 717 23. Hombres: x 5 69.5 latidos por minuto; mediana 5 66.0 latidos por 17. Rango 5 $2461.0; s2 5 290,400.4 (dólares)2; s 5 $538.9. Las can- minuto. Mujeres: x 5 82.1 latidos por minuto; mediana 5 84.0 lati- tidades de $1500 y $2500 parecen ser valores atípicos, y es probable dos por minuto. Los pulsos de los hombres parecen ser más bajos que que tengan un gran efecto en las medidas de variación. los de las mujeres. 19. Rango 5 50.0 cigarrillos; s2 5 89.7 cigarrillos2; s 5 9.5 cigarrillos. 25. x 5 0.8 y mediana 5 1.0. Diez de los tornados carecen de medicio- Debido a que los sujetos seleccionados informan la cantidad de nes en la escala F. cigarrillos fumados, es muy posible que los datos no sean del todo precisos, por lo que los resultados podrían no reflejar los hábitos de 27. x 5 98.20°F; mediana 5 98.40°F. Estos resultados sugieren que la tabaquismo entre los adultos de California. media es inferior a 98.6°F. 21. Sistólica: 14.6%. Diastólica: 16.9%. La variación es aproximada- 29. x 5 36.2 años, que es igual a la media de 36.2 años obtenida al usar mente la misma. la lista original de valores. 23. Hombres: 16.2%. Mujeres: 11.2%. Los pulsos de los hombres pare- 31. x 5 224.0 (1000 células/mL). La media de la distribución de fre- cen variar más que los pulsos de las mujeres. cuencias es bastante cercana a la media de 224.3 (1000 células/mL) obtenida al usar la lista original de valores. 25. Rango 5 4.0, s2 5 0.9 y s 5 0.9 27. Rango 5 3.10°F; s2 5 0.39(°F)2; s 5 0.62°F 33. 3.14; sí 29. 1.0, que está muy cerca de la s 5 0.9 encontrada al usar todos los 35. a. 90 latidos por minuto b. n 2 1 37. 504 lb es un valor atípico. Mediana: 285.5 lb; media: 294.4 lb; 10% datos. 31. 0.78°F, que no es sustancialmente diferente de s 5 0.62°F. de la media recortada: 285.4 lb; 20% de la media recortada: 285.8 lb. 33. Los valores significativamente bajos son menores o iguales a 49.0 la- Mediana, el 10% de la media recortada y el 20% de la media recor- tada son bastante similares, pero la media no recortada de 294.4 lb tidos por minuto, y los valores significativamente altos son mayores o difiere de estas porque se ve fuertemente afectada por la inclusión del iguales a 99.0 latidos por minuto. Un pulso de 44 latidos por minuto valor atípico. es significativamente bajo. 39. 1.5290% 35. Los valores significativamente bajos son menores o iguales a 24.74 41. La mediana encontrada usando la expresión dada es 153.125 segun- cm, y los valores significativamente altos son mayores o iguales a dos, que se redondea a 153.1 segundos. Este valor difiere en 2.6 se- 29.90 cm. Una longitud de pie de 30 cm es significativamente alta. gundos de la mediana de 150.5 segundos encontrados al usar la lista 37. s 5 12.7 años difiere del valor exacto de 11.5 años por una cantidad original de tiempos de servicio. algo grande. 39. s 5 68.4 está algo lejos del valor exacto de 59.5. Sección 3-2 41. a. 95% b. 68% 43. Al menos 89% de las mujeres tienen conteos de plaquetas dentro de 1. 119.0 cm3 es bastante cercano al valor exacto de la desviación están- 3 desviaciones estándar de la media. El mínimo es 58.9 y el máximo dar de 124.9 cm3. es 451.3. 45. a. 24.7 cigarrillos2 b. 24.7 cigarrillos2 c. 12.3 cigarrillos2 3. 401.6577 kg2 d. El inciso (b), porque las muestras repetidas producen variaciones 5. Rango 5 92.0; s2 5 1149.5; s 5 33.9. Los números de jersey son da- que apuntan al mismo valor (24.7 cigarrillos2) del mismo modo que tos nominales que sólo reemplazan nombres, y no miden ni cuentan la varianza poblacional. Use la división por n 2 1. nada, por lo que los estadísticos resultantes no tienen sentido. e. No. La media de las varianzas muestrales (24.7 cigarrillos2) es 7. Rango 5 $100.0 millones; s2 5 1034.4 (millones de dólares)2; igual a la varianza poblacional (24.7 cigarrillos2), pero la media de s 5 $32.2 millones. Debido a que los datos son de las celebridades las desviaciones estándar muestrales (3.5 cigarrillos) no es igual a con el valor neto más alto, las medidas de variación no son típicas la desviación estándar poblacional (5.0 cigarrillos). para todas las celebridades. 9. Rango 5 13.0 huracanes; s2 5 10.2 huracanes2; s 5 3.2 huracanes. Sección 3-3 Los datos pertenecen a una serie de tiempo, pero las medidas de va- riación no revelan nada sobre una tendencia que constituya un patrón 1. La estatura de James está 4.07 desviaciones estándar por encima de de cambio a través del tiempo. la media. 11. Rango 5 $850.0; s2 5 61,117.4 (dólares)2; s 5 $247.2. La muestra consiste en las “mejores compras” de televisores, por lo que no es 3. El diagrama de caja y bigotes inferior representa el peso de las muje- una muestra aleatoria y no es probable que sea representativa de la res, dado que muestra pesos que generalmente son más bajos. población. Las medidas de variación probablemente no sean típicas de todos los televisores de 60 pulgadas o más. 5. a. 60.20 Mbps b. 3.76 desviaciones estándar 13. Rango 5 55.0 mg; s2 5 413.4 mg2; s 5 20.3 mg. Los estadouniden- c. z 5 3.76 ses consumen algunas marcas con mucha más frecuencia que otras, d. La velocidad de datos de 77.8 Mbps es significativamente alta. pero las 20 marcas se ponderan por igual en los cálculos, por lo que los estadísticos no son necesariamente representativos de la pobla- 7. a. 38 latidos por minuto b. 3.04 desviaciones estándar ción de todas las latas de las mismas 20 marcas consumidas por los c. z 5 23.04 estadounidenses. d. El pulso de 36 latidos por minuto es significativamente bajo. 15. Rango 5 1.80 pulg.; s2 5 0.27 pulg2; s 5 0.52 pulg. Debido a que las mediciones se realizaron en 1988, no son necesariamente representa- 9. Los valores significativamente bajos son menores o iguales a 10.9; tivas de la población actual de todas las mujeres del ejército. los valores significativamente altos son mayores o iguales a 31.3. 11. Los pesos significativamente bajos son menores o iguales a 5.51542 g, y los pesos significativamente altos son mayores o iguales a 5.76318 g.

718 APÉNDICE D 13. Con puntuaciones z de 10.83 y 216.83, la puntuación z de 216.83 Capítulo 3: Examen rápido está más alejada de la media, por lo que el hombre más bajo tiene una 1. 6.8 horas 2. 7.0 horas estatura más extrema. 3. Dos modas: 7 horas, 8 horas 4. 1.7 horas2 15. Hombre: puntuación z 5 22.69; mujer: puntuación z 5 22.18. El 5. Sí, porque 0 horas es sustancialmente menor que todos los otros valo- hombre tiene el peso más extremo. res de datos. 17. Percentil 58 19. percentil 34 6. 20.93 7. 75% o 60 horas de sueño 21. 2.45 Mbps (Tecnología: Excel: 2.44 Mbps). 8. Mínimo, primer cuartil Q1, segundo cuartil Q2 (o mediana), tercer 23. 3.8 Mbps (Tecnología: Minitab: 3.85 Mbps; Excel: 3.75 Mbps) cuartil Q3, máximo 9. 1.5 horas (a partir del rango/4) 10. x, m, s, σ, s2, σ2 25. 1.6 Mbps 27. 0.5 Mbps 29. Resumen de 5 números: 2, 6.0, 7.0, 8.0, 10. Capítulo 3: Ejercicios de repaso 1. a. 1.0 min; b. 0.5 min; c. 1 min; d. 7.5 min; e. 29.0 min; f. 7.9 min; g. 61.8 min2; h. 24.5 min; 31. Resumen de 5 números: 128 mBq, 140.0 mBq, 150.0 mBq, 158.5 i. 2.5 min. (Tecnología: Minitab produce Q1 5 24.75 min y Q3 5 3.25 min. Excel produce Q1 5 24.25 min y Q3 5 1.75 min). mBq, 172 mBq (Tecnología: Minitab produce Q1 5 139.0 mBq y Q3 5 159.75 mBq. Excel produce Q1 5 141.0 mBq y Q3 5 157.25 2. z 5 20.13. El error de predicción de 0 min no es significativo porque mBq). su puntuación z está entre 2 y 22, por lo que está dentro de 2 desvia- ciones estándar de la media. 3. Resumen de 5 números: 27 min, 24.5 min, 0.5 min, 2.5 min, 22 min. (Tecnología: Minitab produce Q1 5 24.75 min y Q3 5 3.25 min. Excel produce Q1 5 24.25 min y Q3 5 1.75 min). 33. El diagrama de caja y bigotes superior representa a los hombres. Los hombres parecen tener pulsos ligeramente más bajos que las mujeres. 35. El diagrama de caja y bigotes superior representa los valores del IMC 4. 23.0. Los números no miden ni cuentan nada. Se usan como reem- para los hombres. Los dos diagramas de caja no parecen ser muy plazos de los nombres de las categorías, por lo que los números se diferentes, por lo que los valores del IMC de hombres y mujeres pa- encuentran en el nivel nominal de medición. En este caso, la media es recen ser aproximadamente los mismos, excepto por algunos valores un estadístico sin sentido. de IMC muy altos para mujeres que hicieron que el diagrama de caja se extendiera más hacia la derecha. 5. La mujer tiene el mayor peso relativo al nacer porque su puntuación z de 0.23 es mayor que la puntuación z de 0.19 para el hombre. 37. El diagrama de caja y bigotes superior representa a los hombres. Los hombres parecen tener pulsos ligeramente más bajos que las mujeres. 6. El valor atípico es 646. La media y la desviación estándar con el Valores atípicos para hombres: 40 latidos por minuto, 102 latidos por valor atípico incluido son x 5 267.8 y s 5 131.6. Los estadísticos minuto, 104 latidos por minuto. Valores atípicos para las mujeres: 36 con el valor atípico excluido son x 5 230.0 y s 5 42.0. Ambos es- latidos por minuto. tadísticos cambiaron en una cantidad sustancial, por lo que aquí el valor atípico tiene un efecto muy fuerte en la media y la desviación estándar. 7. El mínimo es 119 mm, el primer cuartil Q1 es 128 mm, el segundo cuartil Q2 (o mediana) es 131 mm, el tercer cuartil Q3 es 135 mm y el máximo es 141 mm. 8. Con un mínimo de 117 segundos y un máximo de 256 segundos, s ≈ 34.8 segundos, que es muy cercano a la desviación estándar de 33.7 segundos que se encuentra en la muestra más grande. Capítulo 3: Ejercicios de repaso acumulado 1. Arsénico (mg) Frecuencia 0.0-1.9 1 2.0-3.9 0 4.0-5.9 3 6.0-7.9 7 8.0-9.9 1

APÉNDICE D 719 2. 41. a. 9999: 1 b. 4999: 1 c. La descripción no es precisa. Las posibilidades en contra de ganar son Frecuencia 9999:1 y las posibilidades a favor de ganar son 1:9999, no 1:10,000. 43. a. $5 b. 5:2 c. 772:228 o 193:57 o aproximadamente 3.39:1 (o aproximada- mente 17:5) d. Aproximadamente $8.80 (en lugar del pago real de $7.00) Sección 4-2 Cantidad de arsénico (microgramos/ración) 1. P(A) representa la probabilidad de seleccionar un adulto con ojos 3. azules, y P(A) representa la probabilidad de seleccionar un adulto que no tenga ojos azules. 3. Dado que las selecciones se realizan sin reemplazo, los eventos son dependientes. Debido a que el tamaño de la muestra de 1068 es me- nor al 5% del tamaño de la población de 15,524,971, las selecciones se pueden tratar como independientes (según la guía del 5% para cálculos engorrosos). 5. 0.74 4. a. 6.09 mg b. 6.45 mg c. 1.75 mg 7. P(N) 5 0.670, donde P(N) es la probabilidad de seleccionar al azar a d. 3.06 (m)2 e. 6.70 mg alguien con una respuesta distinta de “nunca”. 5. La escala vertical no comienza en 0, por lo que las diferencias entre 9. 756/1118 o 0.676 los distintos resultados son exageradas. 11. 1020/1118 o 0.912; no disjuntos 6. No. Una distribución normal aparecería en un histograma como en 13. a. 0.0200. Sí, los eventos son independientes. forma de campana, pero el histograma no tiene forma de campana. b. 0.0199. Los eventos son dependientes, no independientes. Respuestas del capítulo 4 15. a. 0.779. Sí, los eventos son independientes. b. 0.779. Los eventos son dependientes, no independientes. Sección 4-1 17. 709/1118 o 0.634 19. 0.0156 1. P(A) 5 1/1000, o 0.001.P(A) 5 999/1000 o 0.999. 21. a. 300 b. 154 c. 0.513 3. Inciso (c). 5. 0, 3/5, 1, 0.135 23. 0.990 7. 1/9 o 0.111 9. Significativamente alto 25. a. 0.03 b. 0.0009 c. 0.000027 11. Ni significativamente bajo ni significativamente alto d. Al usar una unidad sin una copia de seguridad, la probabilidad de 13. 1/2 o 0.5 15. 0.43 una falla total es 0.03, y con tres unidades de disco independien- 17. 1/10 o 0.1 19. 0 tes, la probabilidad cae a 0.000027. Al cambiar de una unidad a 21. 5/555 o 0.00901. El empleador sufriría porque estaría en riesgo al tres, la probabilidad de falla total disminuye de 0.03 a 0.000027, y contratar a alguien que use drogas. esa es una mejora sustancial en la confiabilidad. ¡Haga una copia 23. 50/555 o 0.0901. Este resultado parece ser una estimación razonable de seguridad de sus datos! de la tasa de prevalencia. 27. 0.838. La probabilidad de 0.838 es alta, por lo que es factible que se 25. 879/945 o 0.930. Sí, la técnica parece ser efectiva. acepte todo el lote, incluso si incluye muchos defectos. 27. 428/580 o 0.738; sí 29. a. 0.299 29. 0.270. No, no es improbable que alguien no use los sitios de redes b. Usando la guía del 5% para cálculos engorrosos: 0.00239 [usando el sociales. resultado redondeado del inciso (a)] o 0.00238 31. a. café/café, café/azul, azul/café, azul/azul 31. a. 0.999775 b. 0.970225 b. 1/4 c. 3/4 c. La disposición en serie proporciona una mejor protección. 33. 3/8 o 0.375 35. 4/16 o 1/4 o 0.25. 33. a. P(A o B) 5 P(A) 1 P(B) 2 2P(A y B) 37. La alta probabilidad de 0.327 muestra que los resultados de la mues- b. 691/1118 o 0.618 tra pudieron haber ocurrido fácilmente por casualidad. Parece que no hay pruebas suficientes para concluir que las mujeres embarazadas Sección 4-3 puedan predecir correctamente el sexo de su bebé. 1. El evento de no tener al menos 1 defecto entre los 3 iPhones, lo que 39. a. Al comparar el grupo de tratamiento de 200 mg con el grupo significa que los 3 iPhones son buenos. placebo, la baja probabilidad de menos de 0.049 indica que los 3. La probabilidad de que la persona seleccionada sea un compañero de resultados de la muestra no pudieron haber ocurrido fácilmente clase de la escuela secundaria, dado que la persona seleccionada es por casualidad. Parece que 200 mg de cafeína tiene un efecto en la mujer. memoria. 5. 7/8 o 0.875 7. 0.982 9. 0.344 b. Al comparar el grupo de 300 mg con el grupo de 200 mg, la alta 11. 0.965. La probabilidad es suficientemente alta como para que pueda probabilidad de 0.75 indica que los resultados de la muestra po- estar razonablemente segura de obtener un defecto por su trabajo. drían haber ocurrido fácilmente por casualidad. No hay pruebas 13. a. 27/43 o 0.628 b. 16/43 o 0.372 suficientes para concluir que hay diferentes efectos del grupo de c. Parece que cuando los estudiantes tienen cuatro monedas de ¢25, es tratamiento de 300 mg y el grupo de tratamiento de 200 mg. más probable que gasten el dinero que lo conserven.

720 APÉNDICE D 15. a. 27/43 o 0.628 b. 12/46 o 0.261 8. A es el evento de seleccionar un conductor y obtener a alguien que no c. Parece que los estudiantes son más propensos a gastar el dinero estaba usando el cinturón de seguridad. P(A) 5 0.411 cuando se les dan cuatro monedas de ¢25 que cuando se les da un 9. A es el evento de seleccionar un conductor y obtener a alguien que billete de $1. fue asesinado. P(A) 5 0.445. 17. 2/1155 o 0.00173. Esta es la probabilidad de que la prueba haga pare- 10. 0.171 cer que el sujeto tiene hepatitis C cuando el sujeto no la tiene, por lo 11. La respuesta varía, pero Forbes informa que aproximadamente 19% que es probable que el sujeto experimente estrés innecesario y prue- de los automóviles son negros, por lo que cualquier estimación entre bas adicionales. 0.10 y 0.30 sería buena. 19. 335/337 o 0.994. El resultado muy alto hace que la prueba parezca 12. a. 0.25 b. 0.316 efectiva para identificar la hepatitis C. c. No, no es improbable porque la probabilidad de 0.316 muestra que 21. a. 0.9991 el evento ocurre con bastante frecuencia. b. 0.999973. La regla de redondeo habitual para las probabilidades 13. a. 1/365 b. 31/365 daría como resultado una probabilidad de 1.00, lo que indicaría c. La respuesta varía, pero probablemente es bastante pequeña, por incorrectamente que estamos seguros de tener al menos un disco ejemplo 0.01 o menos. duro en funcionamiento. d. Sí 23. 0.490. La probabilidad no es baja, por lo que será necesario realizar 14. 0.0335. No. más pruebas de las muestras individuales en 49% de las muestras 15. a. 1/237,336 b. 1/4 c. 1/4 d. 1/3,797,376 combinadas. 16. 1/962,598 25. 0.569 17. a. 999/1000 o 0.999 Sección 4-4 b. 999,999/1,000,000 o 0.999999 18. 1/342 1. El símbolo ! es el símbolo factorial que representa el producto descen- dente de los números enteros, como en 6! 5 6 ∙ 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 5 720. Capítulo 4: Ejercicios de repaso acumulativos Seis personas pueden pararse en una fila de 720 maneras diferentes. 1. a. 0.168 g/dL b. 0.160 g/dL c. 0.220 g/dL d. 0.260 g/dL e. 0.069 g/dL f. 0.005 (g/dL)2 3. Debido a que se permite la repetición, los números se seleccionan con 2. a. 0.09, 0.120, 0.160, 0.180, 0.35 (todo en unidades de g/dL). Valor reemplazo, por lo que la regla de las combinaciones y las dos reglas de atípico: 0.35 g/dL. la permutación no se aplican. La regla del conteo por multiplicación b. puede usarse para mostrar que la cantidad de posibles resultados es 10 ∙ 10 ∙ 10 ∙ 10 5 10,000. 5. 1/10,000 7. 1/171 9. 1/40,320 11. 1/254,251,200 c. 13. 1/100,000,000. No, hay demasiadas posibilidades diferentes. 15. 1/1820 o 0.000549 17. 1/292,201,338 19. 1/100,000 21. Códigos de área: 800. Números de teléfono: 6,400,000,000. Sí. 3. a. 46% b. 0.460 c. Muestra estratificada (Con una población total de aproximadamente 400,000,000, habría 4. a. Muestra de conveniencia aproximadamente 16 números de teléfono por cada adulto y niño). b. Si los estudiantes de la universidad son en su mayoría de una 23. a. 5040 b. 210 c. 1/210 región circundante que incluye una gran proporción de un grupo 25. 40,320; 1/40,320 27. 653,837,184,000 étnico, los resultados pueden no reflejar la población general de 29. 1/258,890,850. Hay muchas más posibilidades de ser alcanzado por Estados Unidos. un rayo. c. 0.75 d. 0.64 31. Hay 62 diferentes caracteres posibles. El alfabeto requiere 26 carac- 5. La falta de un patrón de los puntos en el diagrama de dispersión teres y hay 10 dígitos, por lo que el sistema de código Morse es más sugiere que no parece haber una asociación entre la presión arterial que adecuado. sistólica y el recuento de plaquetas en la sangre. 33. 128/2652 o 32/663 o 0.0483; 4.83% o aproximadamente 5% 35. 12 37. 2,095,681,645,538 (alrededor de 2 billones) Capítulo 4: Examen rápido Conteo de plaquetas 1. 4/5 o 0.8 2. 0.8 3. 4/12 o 1/3 4. 0.548 5. La respuesta varía, pero la probabilidad debe ser baja, por ejemplo 0.001. 6. 0.0680 7. 0.727 8. 0.00874 9. 0.00459 10. 0.0131 Capítulo 4: Ejercicios de repaso Presión sanguínea sistólica 6. a. 1/2,598,960 b. 1/28 c. 1/72,770,880 1. 0.589 2. 0.657 3. 0.592 4. 0.832 5. 0.798 6. 0.347 7. 0.198

APÉNDICE D 721 Capítulo 5 Respuestas cálculos engorrosos, las 30 selecciones se pueden tratar como Sección 5-1 independientes. (Las 30 selecciones constituyen el 3% de la pobla- ción de 1009 respuestas, y 3% no es más del 5% de la población). 1. La variable aleatoria es x, que es el número de niñas en cuatro naci- La probabilidad se puede encontrar usando la fórmula de proba- mientos. Los valores posibles de x son 0, 1, 2, 3 y 4. Los valores de la bilidad binomial, pero requeriría la aplicación de esa fórmula variable aleatoria x son numéricos. 21 veces (o 10 veces si somos inteligentes), entonces sería mejor 3. ΣP(x) 5 0.063 1 0.250 1 0.375 1 0.250 1 0.063 5 1.001. La suma usar tecnología. no es exactamente 1 debido a un error de redondeo. La suma está su- 5. No es binomial. Cada uno de los pesos tiene más de dos resultados ficientemente cerca de 1 para satisfacer el requisito. Además, la varia- posibles. ble x es una variable aleatoria numérica y sus valores están asociados 7. Binomial. con probabilidades, y cada una de las probabilidades está entre 0 y 1 9. No es binomial. Debido a que los senadores son seleccionados sin re- inclusive, según sea necesario. La tabla describe una distribución de emplazo, las selecciones no son independientes. (La directriz del 5% probabilidad. para cálculos engorrosos no debe utilizarse porque los 40 senadores 5. a. Variable aleatoria continua b. No es una variable aleatoria seleccionados constituyen el 40% de la población de 100 senadores, c. Variable aleatoria discreta d. Variable aleatoria continua y 40% supera a 5%). e. Variable aleatoria discreta 11. Binomial. Aunque los eventos no son independientes, pueden tratarse 7. Distribución de probabilidad con m 5 2.5, s 5 1.1. como independientes mediante la aplicación de la directriz del 5%. 9. No es una distribución de probabilidad porque la suma de las proba- El tamaño de muestra de 1019 no es más del 5% de la población de bilidades es 0.100, que no es 1 como se requiere. Las probabilidades todos los adultos. muestran que Ted necesita trabajo. 13. a. 0.128 b. IIC, ICI, CII; 0.128 para cada una 11. Distribución de probabilidad con m 5 1.6, s 5 0.9. (La suma de las c. 0.384 probabilidades es 0.999, pero eso se debe a errores de redondeo). 15. 0.0000819 (Tabla: 01) 17. 0.797 (Tabla: 0.798) 13. No es una distribución de probabilidad porque las respuestas no son 19. 0.168 21. 0.147 23. 0.0889 valores de una variable aleatoria numérica. 25. 0.00000451. El resultado de 7 minorías es significativamente bajo. 15. m 5 4.0 niñas, s 5 1.4 niñas. La probabilidad muestra que es muy poco probable que un proceso 17. Un número significativamente alto de niñas son mayores o iguales a de selección aleatoria resulte en 7 o menos minorías. (El Tribunal m 1 2s, y m 1 2s 5 4.0 1 2(1.4) 5 6.8 niñas. Debido a que 6 niñas Supremo rechazó la hipótesis de que el proceso fue aleatorio). no es mayor o igual a 6.8 niñas, no es un número significativamente 27. a. 0.00154 (Tabla: 0.002) b. 0.000064 (Tabla: 01) alto de niñas. c. 0.00160 (Tabla: 0.002) 19. a. 0.109 b. 0.144 c. Inciso (b) d. Sí, la pequeña probabilidad del inciso (c) sugiere que 5 es un nú- d. No, porque la probabilidad de 0.144 no es muy baja (menor o igual a mero significativamente alto. 0.05). 29. a. m 5 18.0 niñas; s 5 3.0 niñas 21. m 5 1.5 sonámbulos, s 5 1.0 sonámbulos b. Los valores de 12.0 niñas o menos son significativamente bajos, 23. Un número significativamente alto de sonámbulos son mayores o los valores de 24.0 niñas o más son significativamente altos, y los iguales a m 1 2s, y m 1 2s 5 1.5 1 2(1.0) 5 3.5 sonámbulos. De- valores entre 12.0 niñas y 24.0 niñas no son significativos. bido a que 3 sonámbulos no son mayores o iguales a 3.5, 3 sonámbu- c. Sí, porque el resultado de 26 niñas es mayor o igual a 24.0 niñas. los no son un número significativamente alto. Un resultado de 26 niñas sugeriría que el método XSORT es 25. a. 0.363 b. 0.535 efectivo. c. La probabilidad del inciso (b). 31. a. m 5 7.5 chícharos; s 5 1.4 chícharos d. No, porque la probabilidad de 1 o menos sonámbulos es 0.535, b. Los valores de 4.7 o menos son significativamente bajos, los valo- que no es baja (no es menor o igual que 0.05). res de 10.3 o más son significativamente altos, y los valores entre 27. a. 1000 b. 1/1000 c. $ 499 d. 250¢ 4.7 y 10.3 no son significativos. e. Debido a que ambas apuestas tienen el mismo valor esperado de c. No, porque el resultado de 9 chícharos con vainas verdes no es 250¢, ninguna apuesta es mejor que la otra. mayor o igual a 10.3. 29. a. 2$161 y $99,839 b. 2$21 33. 0.304; no. c. Sí. El valor esperado para la compañía de seguros es de $21, lo 35. 0.662. La probabilidad muestra que se aceptarán aproximadamente que indica que la compañía puede esperar hacer un promedio de 2/3 de todos los envíos. Con aproximadamente 1/3 de los envíos re- $21 por cada una de esas políticas. chazados, el proveedor haría bien en mejorar la calidad. 37. a. 8.7 y 23.3 (o 8.6 y 23.4 si usa la s redondeada). Debido a que 19 Sección 5-2 se encuentra entre esos límites, no es significativamente bajo ni 1. El cálculo dado asume que los dos primeros consumidores se sienten significativamente alto. cómodos con los drones y los últimos tres consumidores no se sien- ten cómodos con los drones, pero hay otros arreglos que consisten b. 0.0736 en dos consumidores que se sienten cómodos y tres que no. Las pro- babilidades correspondientes a esos otros arreglos también deberían c. La probabilidad de 19 o más M&M verdes es 0.242. incluirse en el resultado. d. La probabilidad del inciso (c) es relevante. El resultado de 19 3. Debido a que las 30 selecciones se realizan sin reemplazo, son de- pendientes, no independientes. Con base en la directriz del 5% para M&M verdes no es significativamente alto. e. Los resultados no proporcionan evidencia sólida contra la hipó- tesis de 16% para M&M verdes.

722 APÉNDICE D 39. a. 238.3 y 287.2 (o 287.1 si usa la s redondeada). Como 308 es ma- 6. Sí. (La suma de las probabilidades es 0.999 y se puede considerar que yor que 287.2, el valor de 308 es significativamente alto. es 1 debido a errores de redondeo). b. 0.0000369 7. 4.0 vuelos 8. 0.8 vuelo2 c. La probabilidad de 308 o más es 0.000136. 9. 01 indica que la probabilidad es un número positivo muy pequeño. d. La probabilidad del inciso (c) es relevante. El resultado de 308 No indica que es imposible que ninguno de los cinco vuelos llegue a votantes que votaron por el ganador es significativamente alto. tiempo. e. Los resultados sugieren que los votantes encuestados mintieron o 10. 0.057 tenían un recuerdo defectuoso de cómo votaron. Capítulo 5: Ejercicios de repaso 41. 0.0468 43. 0.132 1. 0.274 Sección 5-3 2. 0.999. No. Los cinco amigos no se seleccionan al azar de la pobla- 1. m 5 535/576 5 0.929, que es el número promedio de visitas por ción de adultos. Además, el hecho de que estén de vacaciones juntos región. x 5 2, porque queremos la probabilidad de que una región seleccionada aleatoriamente tenga exactamente 2 éxitos, y e ≈ 2.71828, sugiere que es más probable que su situación financiera incluya tarje- que es una constante utilizada en todas las aplicaciones de la fórmula 5-9. tas de crédito. 3. Valores posibles de x: 0, 1, 2,... (sin límite superior). No es posible 3. m 5 3.7 adultos y s 5 1.0 adulto. tener x 5 2.3 llamadas en un día. x es una variable aleatoria discreta. 4. Si se usa m 5 3.7 adultos y s 5 1.0 adulto, los valores son significa- 5. a. P(5) 5 0.158 b. En 55 años, el número esperado de años con 5 huracanes es 8.7. tivamente altos si son iguales o mayores que m 1 2s 5 5.7 adultos. c. El valor esperado de 8.7 años es cercano al valor real de 8 años, por lo que la distribución de Poisson funciona bien aquí. El resultado de cinco adultos con tarjetas de crédito no es significa- 7. a. P(7) 5 0.140 tivamente alto porque no es igual o mayor a 5.7 adultos. Además, la b. En 55 años, el número esperado de años con 7 huracanes es 7.7. c. El valor esperado de 7.7 años es cercano al valor real de 7 años, probabilidad de que los cinco adultos tengan tarjetas de crédito es por lo que la distribución de Poisson funciona bien aquí. 0.222, que no es baja (menor o igual a 0.05). 9. 11.6 nacimientos; 0.0643 (0.0649 usando la media redondeada). Hay menos de un 7% de probabilidad de obtener exactamente 15 naci- 5. Si se usa m 5 3.7 adultos y s 5 1.0 adulto, los valores son significa- mientos en un día determinado. tivamente bajos si son iguales o menores que m 2 2s 5 1.7 adultos. 11. a. 62.2 b. 0.0155 (0.0156 usando la media redondeada) El resultado de 1 adulto con tarjeta de crédito es significativamente 13. a. 0.170 bajo porque es menor o igual a 1.7 adultos. Además, la probabilidad b. El número esperado está entre 97.9 y 98.2, dependiendo del redondeo. de que 1 o menos adultos tengan tarjetas de crédito es 0.0181, que es c. El número esperado de regiones con 2 visitas está cerca de 93, que es el número real de regiones con 2 éxitos. baja (menor o igual a 0.05). 15. 0.9999876 o 0.9999877 (usando la media no redondeada). Muy alta 6. No. Las respuestas no son numéricas. posibilidad, o “casi seguro”, de que ocurra al menos una muerte. 7. No, porque ΣP(x) 5 0.9686, pero la suma debe ser 1. (Hay un pe- 17. 0.0000178. No, es muy poco probable que se produzca al menos un premio mayor en 50 años. queño margen permitido para errores de redondeo, pero la suma de 0.9686 está demasiado lejos de 1). 8. Sí, distribución de probabilidad con m 5 4.6 personas, s 5 1.0 per- sonas. (La suma de las probabilidades es 0.999, pero eso se debe a errores de redondeo). 9. a. 236.0 cheques b. m 5 236.0 cheques y s 5 12.8 cheques c. 210.4 cheques (o 210.3 cheques si se usa la s no redondeada) d. Sí, porque 0 es menor o igual a 210.4 cheques (o 210.3 cheques). 10 a. 7/365 o 0.0192 b. 0.981 c. 0.000182 Capítulo 5: Examen rápido d. No, porque el evento es muy raro. (Pero es posible que ocurra 1. No, la suma de las probabilidades es 4/3 o 1.333, que es mayor que 1. más de una muerte en un accidente automovilístico u otro evento 2. m 5 16.0; s 5 3.6 3. Los valores son parámetros porque representan la media y la desvia- similar, por lo que podría ser conveniente considerar un plan de ción estándar para la población de todos los que hacen suposiciones contingencia). aleatorias para las 80 preguntas, no una muestra de resultados reales. 4. No. (Usando la regla práctica del rango, el límite que separa los va- Capítulo 5: Ejercicios de repaso acumulado lores significativamente altos es 23.2, pero 20 no es mayor o igual a 23.2. Si se usan probabilidades, la probabilidad de 20 o más respues- 1. a. 9.6 lunas b. 5.0 lunas c. 0 lunas tas correctas es 0.163, que no es baja). 5. Sí. (Usando la regla práctica del rango, el límite que separa los valo- d. 28.0 lunas e. 11.0 lunas f. 120.3 lunas2 res significativamente bajos es 8.8, y 8 es menor que 8.8. Si se usan probabilidades, la probabilidad de 8 o menos respuestas correctas es g. 212.4 lunas, 31.6 lunas 0.0131, que es baja). h. No, porque ninguno de los planetas tiene un número de lunas me- nor o igual a 212.4 lunas (lo cual es imposible, de todos modos) y ninguno de los planetas tiene un número de lunas igual o superior a 31.6 lunas. i. De razón j. Discreto

APÉNDICE D 723 2. a. 1/1000 o 0.001 b. 0.365 25. 0.2015 (Tabla: 0.2005). No, no es probable que la proporción de es- quizofrénicos sea tan alta como 0.2005, o alrededor de 20%. c. 0.254 d. 250¢ 27. 55.67% (Tabla: 55.64%). Sí, alrededor del 44% de las mujeres quedan 3. a. 0.263 b. 0.342 c. 0.0688 d. 0.732 e. 0.658 excluidas. 4. a. 253 29. a. 0.1717 (Tabla: 0.1711) b. 2011.5 g (Tabla: 2011.4 g) c. Los pesos al nacer son significativamente bajos si son de 2011.4 g b. Muestra: Los 347 profesionales de recursos humanos encuestados. o menos, y poseen un “bajo peso al nacer” si tienen 2495 g o me- nos. Los pesos al nacer entre 2011.4 g y 2495 g tienen “bajo peso Población: todos los profesionales de recursos humanos. al nacer”, pero no son significativamente bajos. c. El 73% es un dato estadístico porque es una medida basada en una 31. a. 0.0038; o se produjo un evento muy raro o el marido no es el padre. b. 240 días muestra, no en toda la población. 33. a. La media es de 69.5817 (69.6 redondeados) latidos por minuto y 5. No se muestra una escala vertical, pero una comparación de los la desviación estándar es de 11.3315 (11.3 redondeados) latidos por minuto. Un histograma confirma que la distribución es más o números muestra que 7,066,000 es aproximadamente 1.2 veces el nú- menos normal. mero de 6,000,000; sin embargo, la gráfica hace parecer que la meta b. 47.4 latidos por minuto; 91.8 latidos por minuto 35. a. 75; 12 de 7,066,000 personas es aproximadamente 3 veces el número de b. No, la conversión también debe explicar la variación. personas inscritas. La gráfica es engañosa en el sentido de que crea la c. Calificación B: de 66.3 a 75.4 (Tabla: 66.2 a 75.4) d. Use un esquema como el que se proporciona en el inciso (c), por- falsa impresión de que las inscripciones reales están muy por debajo que la variación se incluye en el proceso de curvatura. de la meta, que no es el caso. Fox News se disculpó por su gráfica y proporcionó una gráfica corregida. 6. a. 0.254 b. 0.255 (Tabla: 0.256) c. m 5 5.6 adultos, s 5 1.3 adultos d. Sí. Usando la regla práctica del rango, 1 es menor que m 2 2 s 5 3.0; si se usan probabilidades, la probabilidad de 1 o menos es 0.00129 (Tabla: 0.001), que es baja, menor que 0.05. Respuestas del capítulo 6 Sección 6-3 1. a. A largo plazo, las proporciones muestrales tendrán una media de Sección 6-1 0.512. 1. La palabra “normal” tiene un significado especial en las estadísticas. b. Las proporciones muestrales tenderán a tener una distribución que Se refiere a una distribución específica en forma de campana que se es aproximadamente normal. puede describir mediante la fórmula 6-1. Los dígitos de la lotería no 3. Media muestral; varianza muestral; proporción muestral tienen una distribución normal. 5. No. La muestra no es una muestra aleatoria simple de la población 3. La media es m 5 0 y la desviación estándar es s 5 1. de todos los nacimientos en todo el mundo. La proporción de niños 5. 0.4 7. 0.2 9. 0.6700 11. 0.6993 (Tabla: 0.6992) nacidos en China es sustancialmente más alta que en otros países. 13. 1.23 15. 21.45 17. 0.1093 19. 0.8997 21. 0.4013 7. a. 4.7 23. 0.9772 25. 0.0214 (Tabla: 0.0215) b. Varianza 27. 0.0174 29. 0.9545 (Tabla: 0.9544) muestral s2 Probabilidad 31. 0.8413 (Tabla: 0.8412) 33. 0.999997 (Tabla: 0.9999) 0.0 3/9 35. 0.5000 37. 2.33 39. 22.05, 2.05 0.5 2/9 41. 1.28 43. 1.75 45. 68.27% (Tabla: 68.26%) 8.0 2/9 47. 99.73% (Tabla: 99.74%) 49. a. 2.28% b. 2.28% c. 95.45% (Tabla: 95.44%) 12.5 2/9 Sección 6-2 c. 4.7 d. Sí. La media de la distribución muestral de las varianzas muestra- 1. a. m 5 0; s 5 1 b. Las puntuaciones z son números sin unidades de medida. les (4.7) es igual al valor de la varianza poblacional (4.7), por lo que las varianzas muestrales tienden al valor de la varianza 3. La distribución normal estándar tiene una media de 0 y una desvia- poblacional. ción estándar de 1, pero una distribución normal no estándar tiene un 9. a. 5 valor diferente para uno o ambos parámetros. b. 5. 0.8849 7. 0.9053 9. 136 11. 69 Mediana muestral Probabilidad 13. 0.0115 (Tabla: 0.0116) 15. 0.6612 17. 24.9 pulg. 19. 20.9 pulg. y 26.1 pulg. No, 26 pulg. No son significativamente altos. 4.0 1/9 21. a. 72.11% (Tabla: 72.23%). Sí, alrededor de 28% de las mujeres no 4.5 2/9 califican debido a su estatura. b. De 58.2 pulg. a 69.2 pulg. 5.0 1/9 23. a. 0.92% (Tabla: 0.90%). Debido a que pocos hombres pueden cum- 6.5 2/9 plir con el requisito de estatura, es probable que la mayoría de los personajes de Mickey Mouse sean mujeres. 7.0 2/9 b. 64.0 pulg. a 68.6 pulg. 9.0 1/9 c. 6.0

724 APÉNDICE D d. No. La media de la distribución muestral de las medianas muestra- c. Sí. La distribución muestral de las proporciones de las muestras les es 6.0, y no es igual al valor de la mediana poblacional (5.0), tiene una media de 0.2 y la proporción poblacional también es 0.2 por lo que las medianas de las muestras no tienden al valor de la (porque hay 1 respuesta correcta entre 5 elecciones). Sí, la media mediana poblacional. de la distribución muestral de las proporciones muestrales siempre es igual a la proporción poblacional. 11. a. x Probabilidad 19. La fórmula produce P(0) 5 0.25, P(0.5) 5 0.5 y P(1) 5 0.25, que sí 34 1/16 describe la distribución muestral de las proporciones muestrales. La 35 2/16 fórmula es sólo una forma diferente de presentar la misma informa- 36 1/16 ción en la tabla que describe la distribución muestral. 37.5 2/16 38.5 2/16 Sección 6-4 41 1/16 42.5 2/16 1. La muestra debe tener más de 30 valores, o debe haber evidencia de 43.5 2/16 que la población de los promedios de las calificaciones de los estu- 46 2/16 diantes de estadística tiene una distribución normal. 51 1/16 3. mx– representa la media de todas las medias muestrales, y sx– representa b. La media de la población es 40.5 y la media de la muestra también la desviación estándar de todas las medias muestrales. Para las mues- es 40.5. tras de 64 puntuaciones de IQ, mx– 5 100 y sx– 5 15/ 164 5 1.875. c. Las medias muestrales tienden a la media poblacional. Las medias 5. a. 0.6844 muestrales son buenas estimaciones de las medias poblacionales b. 0.9726 porque se centran en el valor de la media de la población en lugar c. Debido a que la población original tiene una distribución normal, de subestimarla o sobreestimarla sistemáticamente. la distribución de las medias muestrales es una distribución nor- mal para cualquier tamaño de muestra. 13. a. Rango Probabilidad 0 4/16 7. a. 0.1271 (Tabla: 0.1272) b. 0.2510 2 2/16 c. Debido a que la población original tiene una distribución normal, la distribución de las medias muestrales es normal para cualquier 5 2/16 tamaño de muestra. 7 2/16 9. 0.7030 (Tabla: 0.7019). El elevador no parece estar seguro porque hay un 70% de posibilidades de que se sobrecargue cuando lleva 27 10 2/16 hombres adultos. 15 2/16 11. a. 131 b. 0.0000179 (Tabla: 0.0001) 17 2/16 c. No. Es posible que los 4 sujetos tengan una media de 132, mien- tras que algunos de ellos tienen puntuaciones por debajo del requisito b. El rango de la población es 17, pero la media de los rangos mues- de Mensa de 131. trales es 7. Estos valores no son iguales. 13. a. 140 libras c. Los rangos muestrales no se dirigen al rango poblacional de 17, b. 0.9999999998 (Tabla: 0.9999) por lo que los rangos muestrales no son buenos estimadores de los c. 0.9458 (Tabla: 0.9463) rangos poblacionales. d. La nueva capacidad de 20 pasajeros no parece ser suficientemente segura porque la probabilidad de sobrecarga es demasiado alta. 15. Proporción de niñas Probabilidad 15. a. 0.0047 0 0.25 b. 0.0000 (Tabla: 0.0001) c. El resultado del inciso (a) es relevante porque los asientos están 0.5 0.50 ocupados por individuos. 1 0.25 17. a. 0.5575 (Tabla: 0.5564) b. 0.9996 (Tabla: 0.9995) Sí. La proporción de niñas en 2 nacimientos es 0.5, y la media de c. Inciso (a) porque los asientos de eyección serán ocupados por mu- las proporciones muestrales es 0.5. El resultado sugiere que una jeres individuales, no por grupos de mujeres. proporción muestral es un estimador insesgado de una proporción poblacional. 19. a. 0.8877 (Tabla 0.8869) b. 1.0000 cuando se redondea a cuatro lugares decimales (Tabla: 0.9999) 17. a. Proporción correcta Probabilidad c. La probabilidad del inciso (a) es más relevante porque muestra que 0 16/25 89% de los pasajeros varones no necesitarán doblarse. El resultado 0.5 8/25 de la parte (b) nos da información sobre la media para un grupo de 1 1/25 100 hombres, pero no nos proporciona información útil sobre la co- modidad y la seguridad de pasajeros varones individuales. b. 0.2 d. Como los hombres generalmente son más altos que las mujeres, un diseño que se adapte a una proporción adecuada de hombres necesariamente incluirá una mayor proporción de mujeres.

APÉNDICE D 725 21. a. Sí. El muestreo es sin reemplazo y el tamaño de muestra de 19. No normal. Los puntos tienen coordenadas (963, 21.53), (1027, n 5 50 es mayor que 5% del tamaño de población finita de 275. 20.89), (1029, 20.49), (1034, 20.16), (1070, 0.16), (1079, 0.49), sx 5 2.0504584. (1079, 0.89), (1439, 1.53) b. 0.5963 (Tabla: 0.5947) Sección 6-5 1. El histograma debe tener aproximadamente una forma de campana, y Puntuación z la gráfica cuantilar normal debe tener puntos que se aproximen a un patrón en línea recta. 3. Debemos verificar que la muestra proviene de una población que tiene una distribución normal. Podemos verificar la normalidad usando un histograma, identificando el número de valores atípicos y elaborando una gráfica cuantilar normal. Valores x 5. Normal. Los puntos están razonablemente cerca de un patrón en línea 21. a. Sí b. Sí c. No recta, y no hay otro patrón que no sea un patrón en línea recta. Sección 6-6 7. No es normal. Los puntos no están razonablemente cerca de un pa- 1. a. El área debajo (a la izquierda) de 502.5 b. El área entre 501.5 y 502.5 trón en línea recta, y parece que hay un patrón que no es un patrón en c. El área arriba (a la derecha) de 502.5 línea recta. 3. p 5 0.2; q 5 0.8; m 5 20; s 5 4. El valor de m 5 20 muestra que para las personas que hacen conjeturas al azar en las 100 preguntas, 9. Normal 11. No normal el número medio de respuestas correctas es 20. Para las personas que hacen 100 conjeturas al azar, la desviación estándar de s 5 4 es una 13. Normal medida de cuánto varían los números de respuestas correctas. Puntuación z 5. 0.1102 (Tabla: 0.1093) 7. La aproximación normal no debe ser utilizada. Valores x 9. Si se usa la aproximación normal: 0.2028 (Tabla: 0.2033); Tecnología 15. No normal que usa binomial: 0.2047. No, 20 no es un número significativamente bajo de autos blancos. Puntuación z 11. Si se usa la aproximación normal: 0.0549 (Tabla: 0.0542); Tecnología que usa binomial: 0.0513. La determinación de si 14 autos rojos es Valores x significativamente alto debe basarse en la probabilidad de 14 o más autos rojos, no la probabilidad de exactamente 14 autos rojos. 17. Normal. Los puntos tienen coordenadas (32.5, 21.28), (34.2, 20.52), 13. a. Si se usa la aproximación normal: 0.0212 (Tabla: 0.0217); Tecno- (38.5, 0), (40.7, 0.52), (44.3, 1.28). logía que usa binomial: 0.0209. Puntuación z b. Si se usa la aproximación normal: 0.2012 (Tabla: 0.2005); Tec- Valores x nología que usa binomial: 0.2006). El resultado de 231 decisiones revocadas no es significativamente alto. 15. a. Si se usa la aproximación normal: 0.0114 (Tabla: 0.0113); Tecno- logía que usa binomial: 0.0113. b. El resultado de 109 es significativamente bajo. 17. a. Si se usa la aproximación normal: 0.2785 (Tabla: 0.2776); Tecno- logía que usa binomial: 0.2799. b. El resultado de 705 chícharos con flores rojas no es significativa- mente alto. c. El resultado de 705 chícharos con flores rojas no es una evidencia sólida contra el supuesto de Mendel de que 3/4 de los chícharos tendrán flores rojas. 19. a. Si se usa la aproximación normal: 0.0000 (Tabla: 0.0001); Tecno- logía que usa binomial: 0.0000. b. Los resultados sugieren que las personas encuestadas no respon- dieron con precisión. 21. (1) 0.1723; (2) 0.1704; (3) 0.1726. No, las aproximaciones no están muy alejadas.

726 APÉNDICE D Capítulo 6: Ejercicios de repaso acumulados Capítulo 6: Examen rápido 1. a. $6.02 millones o $6,020,000 b. $2.80 millones o $ 2,800,000 1. c. $7.47 millones o $7,470,000 d. 55.73 (millones de dólares)2 e. z 5 2.33 f. De razón g. Discreto 2. a. $1.30 millones, $2.80 millones, $7.10 millones b. 2. z 5 21.34 3. 0.9983 4. 0.1546 (Tabla: 0.1547) c. La muestra no parece ser de una población que tiene una distribu- ción normal. 5. a. m 5 0 y s 5 1 3. No, la distribución no parece ser una distribución normal. b. mx representa la media de todas las medias muestrales, y sx repre- senta la desviación estándar de todas las medias muestrales. 6. 0.8092 (Tabla: 0.8106) 7. 0.6280 (Tabla: 0.6292) 8. 84.6 mm Hg (Tabla: 84.5 mm Hg) 4. a. B es el evento de seleccionar a alguien que no tiene ojos azules. 9. 0.9568 (Tabla: 0.9564) b. 0.65 c. 0.0429 10. La gráfica cuantilar normal sugiere que los niveles de presión arterial d. Si se usa la aproximación normal: 0.1727 (Tabla: 0.1736); Tecno- diastólica de las mujeres se distribuyen normalmente. logía que usa binomial: 0.1724. Capítulo 6: Ejercicios de repaso e. No 5. a. 0.7881 b. 0.9968 (Tabla: 0.9967) c. 10.4 pulg. d. 0.0228 1. a. 0.9382 b. 0.9382 c. 0.8983 d. 20.67 e. 0.0668 Capítulo 7 Respuestas 2. a. 1.13% b. 63.8 pulg. Sección 7-1 3. a. 1.42% (Tabla: 1.43%) b. 59.0 pulg. 4. a. Normal b. 100 c. 15 / 264 5 1.875 1. El nivel de confianza, como el 95%, no se proporcionó. 5. a. Un estimador no sesgado es un dato estadístico que se dirige al valor 3. pˆ 5 0.14 es la proporción muestral; qˆ 5 0.86 (encontrada a partir de del parámetro poblacional en el sentido de que la distribución la evaluación de 1 2 pˆ); n 5 1000 es el tamaño de muestra; E 5 0.04 muestral del estadístico tiene una media que es igual al parámetro es el margen de error; p es la proporción poblacional, que se desco- correspondiente. noce. El valor de a es 0.05. b. Media; diferencia; proporción c. Verdadero 5. 1.645 7. 2.81 6. a. 88.77% (Tabla: 88.69%). Con alrededor del 11% de todos los hom- 9. 0.130 6 0.087 11. 0.0169 < p < 0.143 bres que necesitan agacharse, el diseño no parece ser adecuado, pero 13. a. pˆ 5 0.0912 b. E 5 0.0297 el monorriel Mark VI parece funcionar bastante bien en la práctica. c. 0.0615 < p < 0.121 b. 75.1 pulg. d. Tenemos una confianza del 95% de que el intervalo de 0.0615 a 7. a. Debido a que las mujeres son generalmente un poco más bajas 0.121 realmente contiene el verdadero valor de la proporción po- que los hombres, una altura de entrada que se ajuste a los hombres blacional de los pedidos de McDonald’s que no son precisos. también servirá para las mujeres. 15. a. pˆ 5 0.143 b. 1, pero en realidad una cantidad muy pequeña menor que 1 b. E 5 0.00815 (Tabla: 0.9999) c. 0.135 < p < 0.152 c. Debido a que la altura media de 60 hombres es inferior a 72 pul- d. Tenemos un 90% de confianza de que el intervalo de 0.135 a gadas, no se sigue que los 60 hombres individuales tengan alturas 0.152 realmente contiene el valor verdadero de la proporción po- inferiores a 72 pulgadas. Al determinar la idoneidad de la altura de blacional de las encuestas devueltas. la puerta para los hombres, la media de 60 alturas es irrelevante, 17. 0.462 < p < 0.529. Debido a que 0.512 está contenido dentro del pero las alturas de los hombres individuales son relevantes. intervalo de confianza, no hay pruebas sólidas contra 0.512 como el 8. a. No. Un histograma está lejos de tener forma de campana. Una grá- valor de la proporción de niños en todos los nacimientos. fica cuantilar normal revela un patrón de puntos que está lejos de 19. a. 11.6% < p < 22.4% ser un patrón en línea recta. b. Debido a que los dos intervalos de confianza se superponen, b. No. El tamaño de muestra de n 5 13 no satisface la condición de es posible que Burger King y Wendy’s tengan el mismo índice n > 30, y los valores no parecen ser de una población que tiene de pedidos que no son precisos. Ninguno de los restaurantes pa- una distribución normal. rece tener una tasa de precisión significativamente mejor en los 9. Si se usa la aproximación normal: 0.2286 (Tabla: 0.2296). Tecnología pedidos. que usa binomial: 0.2278. La ocurrencia de 787 plantas descendientes 21. a. 0.5 b. 0.439 c. 0.363 < p < 0.516 con tallos largos no es significativamente baja porque la probabilidad d. Si los terapeutas táctiles realmente tienen la capacidad de seleccio- de 787 o menos plantas con tallos largos no es pequeña. Los resultados nar la mano correcta detectando un campo de energía, su índice de son consistentes con la proporción declarada por Mendel de 3/4. éxito sería significativamente mayor que 0.5, pero la tasa de éxito 10. a. 1.49% (Tabla: 1.50%) b. 69.4 pulg. de la muestra de 0.439 y el intervalo de confianza sugieren que no

APÉNDICE D 727 tienen la capacidad de seleccionar la mano correcta detectando un ni cuentan nada, y se encuentran en el nivel nominal de medición. El campo de energía. intervalo de confianza no tiene uso práctico. 23. a. 0.0276% < p < 0.0366% 17. 5.0 < m < 9.0. Los resultados no nos dicen nada sobre la población (si se usa x 5 135: 0.0276% < p < 0.0367%). de mujeres adultas. b. No, porque 0.0340% está incluido en el intervalo de confianza. 19. 0.284 ppm < m < 1.153 ppm. Si se usa la guía de la FDA, el intervalo 25. Grupo placebo: 0.697% < p < 4.49%. Grupo de tratamiento: de confianza sugiere que podría haber demasiado mercurio en los pe- 0.288% < p < 1.57%. Debido a que los dos intervalos de confianza ces porque es posible que la media sea mayor a 1 ppm. Además, uno se superponen, no parece haber una diferencia significativa entre las de los valores muestrales excede la directriz de la FDA de 1 ppm, por tasas de reacciones alérgicas. Las reacciones alérgicas no parecen ser lo que al menos algunos de los peces tienen demasiado mercurio. una preocupación para los usuarios de Lipitor. 21. 143.3 millones de dólares < m < 200.7 millones de dólares. Debido 27. Cuidado sostenido: 77.6% < p < 88.1% (si se usa x 5 164). Aten- a que las cantidades son de las diez celebridades más ricas, el inter- ción estándar: 56.1% < p < 69.5% (si se usa x 5 125). Los dos in- valo de confianza no nos dice nada acerca de la población de todas tervalos de confianza no se superponen. Parece que la tasa de éxito es las celebridades. Los datos no parecen ser de una población distri- mayor con la atención sostenida. buida normalmente, por lo que el intervalo de confianza puede no ser 29. pˆ 5 18/34, o 0.529. IC: 36.2% < p < 69.7%. Una mayor estatura una buena estimación de la media poblacional. no parece ser una ventaja para los candidatos presidenciales. Si una 23. 3.67 < m < 4.17. Debido a que todos los estudiantes estaban en la mayor estatura fuera una ventaja, los candidatos más altos deberían Universidad de Texas en Austin, el intervalo de confianza no nos dice ganar sustancialmente más del 50% de las elecciones, pero el inter- nada acerca de la población de estudiantes universitarios en Texas. valo de confianza muestra que el porcentaje de elecciones ganadas 25. Mujeres: 72.0 lpm < m < 76.1 lpm. Hombres: 67.8 lpm < m < 71.4 lpm. por candidatos más altos es probable que esté entre 36.2% y 69.7%. Las mujeres adultas parecen tener una frecuencia media de pulso que 31. a. 1844 (Tabla: 1842) b. 664 c. No cambian es más alta que la frecuencia media del pulso de los hombres adultos. 33. a. 385 b. 369 Es bueno saberlo. c. No, el tamaño de muestra no cambia mucho. 27. McDonald’s: 161.4 seg < m < 197.2 seg. Burger King: 139.1 seg < 35. a. 1537 b. 1449 m < 167.5 seg (Tabla: 139.2 seg < m < 167.4 seg). No parece haber 37. a. 752 b. 405 una diferencia significativa entre los tiempos medios del servicio de c. No. Una muestra de las personas que usted conoce es una muestra la cena en McDonald’s y Burger King. de conveniencia, no una muestra aleatoria simple, por lo que es 29. El tamaño de muestra es 94, y parece ser muy práctico. muy posible que los resultados no sean representativos de la po- 31. El tamaño de muestra requerido es 38,415 (Tabla: 38,416). La mues- blación. tra parece ser demasiado grande para ser práctica. 39. 1238 (Tabla: 1237) 33. 4814 (Tabla: 4815). Sí, el supuesto parece razonable. 41. a. El requisito de al menos 5 éxitos y al menos 5 fallas no se cumple, 35. a. 425 b. 212 por lo que no se puede usar la distribución normal. c. El resultado del inciso (a) es sustancialmente mayor que el re- b. 0.075 sultado del inciso (b). Es probable que el resultado del inciso (b) Sección 7-2 sea mejor porque usa s en lugar de la s estimada que se obtuvo a 1. a. 13.05 Mbps < m < 22.15 Mbps partir de la regla práctica del rango. b. La mejor estimación puntual de m es 17.60 Mbps. El margen de error es E 5 4.55 Mbps. 37. 29.4 hg < m < 31.4 hg c. Debido a que el tamaño de muestra de 50 es mayor que 30, pode- mos considerar que la media de la muestra proviene de una pobla- 39. 0.8462 g < m < 0.8668 g; 0.8474 g < m < 0.8656 g; el segundo in- ción con una distribución normal. tervalo de confianza es más estrecho, lo que indica que tenemos una 3. Tenemos un 95% de confianza en que los límites de 13.05 Mbps y 22.15 Mbps contienen el valor real de la media de la población de estimación más precisa cuando se selecciona la muestra relativamente todas las velocidades de datos de Verizon en los aeropuertos. grande sin reemplazo de una población finita relativamente pequeña. 5. No se aplica la distribución normal ni la t. 7. za/2 5 2.576 (Tabla: 2.575) Sección 7-3 9. 29.4 hg < m < 31.4 hg. No, los resultados no difieren mucho. 11. 98.08°F < m < 98.32°F. Debido a que el intervalo de confianza no 1. 95.0 cm3 < s < 182.5 cm3. Tenemos un 95% de confianza de que contiene 98.6°F, parece que la temperatura corporal media no es los límites de 95.0 cm3 y 182.5 cm3 contienen el verdadero valor de 98.6°F, como se cree comúnmente. 13. 71.4 min < m < 126.4 min. El intervalo de confianza incluye la la desviación estándar de los volúmenes cerebrales. media de 102.8 minutos que se midió antes del tratamiento, por lo que la media podría ser la misma después del tratamiento. Este 3. La gráfica de puntos no parece representar datos muestrales de una resultado sugiere que el tratamiento con zopiclona no tiene un efecto significativo. población normalmente distribuida. El tamaño de muestra grande no 15. 1.8 < m < 3.4. Los números dados son simplemente sustitutos de los cuatro nombres básicos de ADN, por lo que los números no miden justifica el tratamiento de los valores como de una población con dis- tribución normal. Debido a que el requisito de normalidad no se cum- ple, la estimación del intervalo de confianza de s no se debe elaborar utilizando los métodos de esta sección. 5. gl 5 24. x2 5 12.401 y x2 5 39.364. L R IC: 0.19 mg < s < 0.33 mg. 7. gl 5 146. x2 5 105.741 (Tabla: 67.328) y x2 5 193.761 (Tabla: L R 140.169). IC: 56.8 < s < 76.8 (Tabla: 66.7 < s < 96.3). 9. 0.55°F < s < 0.72°F (Tabla: 0.56°F < s < 0.74°F)

728 APÉNDICE D 11. 29.6 min < s < 71.6 min. No, el intervalo de confianza no indica si 23. Las respuestas varían, pero a continuación se presenta un resultado típico usando 10,000 muestras bootstrap: 2.5 < s < 3.3. Este re- el tratamiento es efectivo. sultado está muy cerca del intervalo de confianza de 2.4 < s < 3.3 encontrado usando 1000 muestras bootstrap. En este caso, aumentar 13. 1.6 < s < 3.8 el número de muestras bootstrap de 1000 a 10,000 no tiene mucho efecto en el intervalo de confianza. 15. 2.9 mi/h < s < 6.9 mi/h. Debido a que las condiciones del tránsito varían considerablemente en diferentes momentos durante el día, el intervalo de confianza es una estimación de la desviación estándar de la población de velocidades a las 3:30 en un día laborable, no en otras. Capítulo 7: Examen rápido 17. a. Evaluaciones de cursos: 0.46 < s < 0.62 (Tabla: 0.47 < s < 0.62) 1. 0.720 b. Evaluaciones de profesores: 0.49 < s < 0.66 2. Tenemos un 95% de confianza de que los límites de 0.692 y 0.748 c. Las cantidades de variación son casi iguales. contienen el verdadero valor de la proporción de adultos en la pobla- 19. 19,205 es demasiado grande. No hay 19,205 profesores de estadística ción que dicen que la ley se inclina por las celebridades. en la población, e incluso si los hubiera, el tamaño de muestra es de- 3. z 5 2.576 (Tabla: 2.575) masiado grande para ser práctico. 4. 36.9% < p < 43.1% 21. El tamaño de muestra es 48. No, con muchos ingresos muy bajos y 5. 601 6. 136 algunos ingresos altos, es probable que la distribución se desvíe hacia 7. Existe un requisito poco estricto de que los valores muestrales pro- la derecha y no satisfaga el requisito de una distribución normal. vengan de una población distribuida normalmente. 23. Si se usa za/2 5 2.575829303: x2 5 109.980 y x2 5 199.655 (Tabla: 8. Los grados de libertad son el número de valores muestrales que pueden x2 x2 L R L 5 109.993 y R 5 199.638). Los valores de la aproximación dada variar después de que se hayan impuesto restricciones en todos los va- son bastante cercanos a los valores críticos reales. lores. Para los datos muestrales descritos en el ejercicio 7, gl 5 11. Sección 7-4 9. t 5 2.201 10. No, el uso de la distribución x2 tiene un requisito bastante estricto 1. Sin reemplazo, cada muestra sería idéntica a la muestra original, por de que los datos deben ser de una distribución normal. El método lo que las proporciones o medias, o desviaciones estándar, o varian- bootstrap podría usarse para encontrar una estimación del intervalo zas serían todas iguales, y no habría un “intervalo” de confianza. de confianza del 95% de s. 3. Los incisos b, d, e no son posibles muestras bootstrap. 5. 0.000 < p < 0.500 Capítulo 7: Ejercicios de repaso 7. a. 0.1 kg < m < 8.6 kg b. 1.9 kg < s < 6.3 kg 1. 37.9% < p < 42.1%. Debido a que tenemos un 95% de confianza de que los límites del 37.9% y del 42.1% contienen el porcentaje verda- 9. Las respuestas varían, pero a continuación se muestran respuestas típicas. dero para la población de adultos, podemos decir con seguridad que menos del 50% de los adultos prefieren recibir sus noticias en línea. a. 20.8 kg < m < 7.8 kg 2. 423 b. 1.2 kg < s < 7.0 kg 3. a. 2.926 11. Las respuestas varían, pero a continuación se muestran respuestas típicas. b. 2.749 < m < 3.102 c. Tenemos un 95% de confianza de que los límites de 2.749 y 3.102 a. 5.3 < m < 8.5. Esto no es dramáticamente diferente de 5.0 < m < 9.0. contienen el valor de la media poblacional m. b. 1.2 < s < 2.9. Esto no es dramáticamente diferente de 1.6 < s < 3.8. 4. 94 5. a. Distribución t de Student 13. Las respuestas varían, pero a continuación se presenta un resultado típico: b. Distribución normal 0.0608 < p < 0.123. Esto es bastante cercano al intervalo de confianza c. Ninguna de las tres distribuciones es apropiada, pero se puede elabo- de 0.0615 < p < 0.121 encontrado en el ejercicio 13 de la sección 7-1. rar un intervalo de confianza mediante el uso de métodos bootstrap. d. x2 (distribución ji cuadrada) 15. Las respuestas varían, pero a continuación se presenta un resultado e. Distribución normal 6. a. 1068 típico: 0.135 < p < 0.152. El resultado es esencialmente el mismo b. 340 c. 1068 que el intervalo de confianza de 0.135 < p < 0.152 encontrado en el 7. 222.1 seg < m < 308.1 seg 8. 184.0 seg < m < 441.1 seg ejercicio 15 de la sección 7-1. 9. Las respuestas varían, pero a continuación se presenta un resultado típico: 7.1 seg < m < 293.7 seg. 17. Las respuestas varían, pero a continuación se presenta un resultado 10 a. 0.0113 < p < 0.0287 b. Las respuestas varían, pero a continuación se presenta un resul- típico: 3.69 < m < 4.15. Este resultado está muy cerca del intervalo tado típico: 0.0120 < p < 0.0290. de confianza 3.67 < m < 4.17 encontrado en el ejercicio 23 de la c. Los intervalos de confianza son bastante cercanos. sección 7-2. 19. a. Las respuestas varían, pero a continuación se presenta un resul- tado típico: 233.6 seg < m < 245.1 seg. b. 234.4 seg < m < 246.0 seg c. El resultado del método bootstrap es razonablemente cercano al resultado encontrado usando los métodos de la sección 7-2. 21. a. Las respuestas varían, pero a continuación se presenta un resultado típico: 2.5 < s < 3.3. b. 2.4 < s < 3.7 c. El intervalo de confianza del método bootstrap no es muy dife- rente del intervalo de confianza encontrado usando los métodos de la sección 7-3. Debido a que un histograma o una gráfica cuantilar Capítulo 7: Ejercicios de repaso acumulado normal indica que la muestra parece provenir de una población 1. x 5 23.6 min, mediana 5 220.0 min, s 5 39.9 min, rango 5 149.0 min. Estos resultados son estadísticos. que no tiene una distribución normal, el intervalo de confianza bootstrap de 2.5 < s < 3.3 sería una mejor estimación de s.


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook